Forum für Wissenschaft, Industrie und Wirtschaft

Hauptsponsoren:     3M 
Datenbankrecherche:

 

IT versus Babylon – verbesserte Spracherkennung im Rampenlicht der Technik

09.10.2008
Verbesserte Technologien der Spracherkennung und Sprachausgabe sind in allen Bereichen modernen Kommunikationstechnik geschätzte Trumpfkarten.

Die aktuellen Entwicklungen und Trends auf diesen hochdynamischen Markt standen im Fokus einer internationalen Tagung, zu der die Informationstechnische Gesellschaft im VDE (ITG) zahlreiche Experten nach Aachen eingeladen hatte.

Im Automobil sind die Anwendungsmöglichkeiten für Sprachausgaben in den letzten Jahren stetig gewachsen. Ein Ende dieses Trends zeichnet sich nicht ab, denn die Anwendungsmöglichkeiten sind vielfältig. Die Palette reicht vom Reiseführer, der für sämtliche Sehenswürdigkeiten Beschreibungen im Audio-Format bereit hält bis hin zu Stauinformationen, die dem Fahrer erst vorgelesen werden, bevor die Navigation eine neue Route berechnet.

„Eine neue Anforderung an die Sprachausgabe im Kfz stellt die multilinguale Ausgabe dar“, resümiert Bärbel Jeschke von der Harman/Becker Automotive Systems in Ulm. Diese benötige man vor allem für das Navigieren zu ausländischen Zielen oder für die Auswahl von MP3 Titeln. Eine besondere Herausforderung sei der Sprachenwechsel mitten im Satz. Als technische Lösung werde derzeit ein Phonemmapping verwendet, da das Umschalten zwischen verschiedenen Sprachen und Stimmen aus Gründen der Ladezeit technisch nicht möglich sei.

Signalrekonstruktionen verbessern Sprachsignale

Mit einem Verfahren zur Sprachsignalverbesserung hat sich Jeschkes Kollege Mohamed Krini, bei Harman/Becker Automotive Systems für den Bereich Acoustic Speech Enhancement zuständig, beschäftigt. „Werden Telefonate über eine Freisprechanlage aus dem Fahrzeug geführt, so überlagern sich der Sprache des lokalen Gesprächspartners störende Hintergrundgeräusche“, erläutert der Experte. Um die Sprachqualität zu verbessern, setze man Geräuschreduktionsverfahren ein, die in der Regel auf dem Prinzip einer zeitvarianten, spektralen Gewichtung basierten. Bei guten bis mittleren Signal-zu-Geräusch-Abstand könne man auf diese Weise gute Ergebnisse erzielen.

„In lauten Geräuschszenarien funktionieren die zurzeit verwendeten Standardalgorithmen jedoch nicht mehr zufrieden stellend und sollten daher verbessert werden“, ergänzt Krini. Zu diesem Zweck habe Harman/Becker Automotive Systems ein neues Verfahren zur Verbesserung von stark gestörten Sprachsignalen entwickelt, das im Wesentlichen aus zwei Algorithmenteilen bestehe: einer Geräuschreduktion und einer partiellen Sprachrekonstruktion. Das Prinzip der partiellen Rekonstruktion basiere darauf, jene Zeit-Frequenz-Bereiche, in welchen das Signal-zu-Geräusch-Verhältnis gering ist, zunächst zu detektieren und dort das Sprachsignal zu synthetisieren. Durch das neue Verfahren sei es möglich, die stark gestörten Nutzsignalanteile wiederherzustellen und die Sprachqualität merklich zu verbessern.

Visualisierung spektraler Merkmale

Mit einem neuen Verfahren zur Spracherkennung sorgte Hans-Günter Hirsch vom Fachbereich Elektrotechnik und Informatik der Hochschule Niederrhein in Krefeld für ein viel beachtetes Thema der Tagung. Zur Modellierung sprachlicher Einheiten wie Wörtern oder Lauten wird bei den meisten heutzutage eingesetzten Systemen zur automatischen Spracherkennung der mathematische Ansatz des so genannten Hidden Markov Modells (HMM) verwendet. Bei diesem Verfahren wird die jeweilige sprachliche Einheit als eine zeitliche Folge kurzer sprachlicher Abschnitte modelliert.

„Es ist uns nunmehr gelungen, die in einem HMM enthaltenen spektralen Merkmale zu bestimmen und zu visualisieren“, erläutert Hirsch. Mit den daraus gewonnenen Ergebnissen könnten neue Verfahren zur Spracherkennung bei gleichzeitigem Vorhandensein bestimmter Störeinflüsse abgeleitet werden.

Rolf Froböse | Rolf Froböse
Weitere Informationen:
http://www.vde.com

Weitere Nachrichten aus der Kategorie Kommunikation Medien:

nachricht Design Thinking für Nachhaltigkeitsinnovationen – Toolbox zum Einsatz in Unternehmen jetzt online
15.06.2018 | Alanus Hochschule für Kunst und Gesellschaft

nachricht Messewand PIXLIP GO LED
13.06.2018 | NORD DISPLAY GmbH

Alle Nachrichten aus der Kategorie: Kommunikation Medien >>>

Die aktuellsten Pressemeldungen zum Suchbegriff Innovation >>>

Die letzten 5 Focus-News des innovations-reports im Überblick:

Im Focus: Temperaturgesteuerte Faser-Lichtquelle mit flüssigem Kern

Die moderne medizinische Bildgebung und neue spektroskopische Verfahren benötigen faserbasierte Lichtquellen, die breitbandiges Laserlicht im nahen und mittleren Infrarotbereich erzeugen. Wissenschaftlerinnen und Wissenschaftler des Leibniz-Instituts für Photonische Technologien Jena (Leibniz-IPHT) zeigen in einer aktuellen Veröffentlichung im renommierten Fachblatt Optica, dass sie die optischen Eigenschaften flüssigkeitsgefüllter Fasern und damit die Bandbreite des Laserlichts gezielt über die Umgebungstemperatur steuern können.

Das Besondere an den untersuchten Fasern ist ihr Kern. Er ist mit Kohlenstoffdisulfid gefüllt - einer flüssigen chemischen Verbindung mit hoher optischer...

Im Focus: Temperature-controlled fiber-optic light source with liquid core

In a recent publication in the renowned journal Optica, scientists of Leibniz-Institute of Photonic Technology (Leibniz IPHT) in Jena showed that they can accurately control the optical properties of liquid-core fiber lasers and therefore their spectral band width by temperature and pressure tuning.

Already last year, the researchers provided experimental proof of a new dynamic of hybrid solitons– temporally and spectrally stationary light waves resulting...

Im Focus: Revolution der Rohre

Forscher*innen des Instituts für Sensor- und Aktortechnik (ISAT) der Hochschule Coburg lassen Rohrleitungen, Schläuchen oder Behältern in Zukunft regelrecht Ohren wachsen. Sie entwickelten ein innovatives akustisches Messverfahren, um Ablagerungen in Rohren frühzeitig zu erkennen.

Rückstände in Abflussleitungen führen meist zu unerfreulichen Folgen. Ein besonderes Gefährdungspotential birgt der Biofilm – eine Schleimschicht, in der...

Im Focus: Überdosis Calcium

Nanokristalle beeinflussen die Differenzierung von Stammzellen während der Knochenbildung

Wissenschaftlerinnen und Wissenschaftler der Universitäten Freiburg und Basel haben einen Hauptschalter für die Regeneration von Knochengewebe identifiziert....

Im Focus: Overdosing on Calcium

Nano crystals impact stem cell fate during bone formation

Scientists from the University of Freiburg and the University of Basel identified a master regulator for bone regeneration. Prasad Shastri, Professor of...

Alle Focus-News des Innovations-reports >>>

Anzeige

Anzeige

VideoLinks
Industrie & Wirtschaft
Veranstaltungen

Hengstberger-Symposium zur Sternentstehung

19.06.2018 | Veranstaltungen

LymphomKompetenz KOMPAKT: Neues vom EHA2018

19.06.2018 | Veranstaltungen

Simulierter Eingriff am virtuellen Herzen

18.06.2018 | Veranstaltungen

VideoLinks
Wissenschaft & Forschung
Weitere VideoLinks im Überblick >>>
 
Aktuelle Beiträge

Vorhersage von Kristallisationsprozessen soll bessere Kunststoff-Bauteile möglich machen

20.06.2018 | Materialwissenschaften

Agrophotovoltaik goes global: von Chile bis Vietnam

20.06.2018 | Energie und Elektrotechnik

Temperaturgesteuerte Faser-Lichtquelle mit flüssigem Kern

20.06.2018 | Physik Astronomie

Weitere B2B-VideoLinks
IHR
JOB & KARRIERE
SERVICE
im innovations-report
in Kooperation mit academics