Forum für Wissenschaft, Industrie und Wirtschaft

Hauptsponsoren:     3M 
Datenbankrecherche:

 

IT versus Babylon – verbesserte Spracherkennung im Rampenlicht der Technik

09.10.2008
Verbesserte Technologien der Spracherkennung und Sprachausgabe sind in allen Bereichen modernen Kommunikationstechnik geschätzte Trumpfkarten.

Die aktuellen Entwicklungen und Trends auf diesen hochdynamischen Markt standen im Fokus einer internationalen Tagung, zu der die Informationstechnische Gesellschaft im VDE (ITG) zahlreiche Experten nach Aachen eingeladen hatte.

Im Automobil sind die Anwendungsmöglichkeiten für Sprachausgaben in den letzten Jahren stetig gewachsen. Ein Ende dieses Trends zeichnet sich nicht ab, denn die Anwendungsmöglichkeiten sind vielfältig. Die Palette reicht vom Reiseführer, der für sämtliche Sehenswürdigkeiten Beschreibungen im Audio-Format bereit hält bis hin zu Stauinformationen, die dem Fahrer erst vorgelesen werden, bevor die Navigation eine neue Route berechnet.

„Eine neue Anforderung an die Sprachausgabe im Kfz stellt die multilinguale Ausgabe dar“, resümiert Bärbel Jeschke von der Harman/Becker Automotive Systems in Ulm. Diese benötige man vor allem für das Navigieren zu ausländischen Zielen oder für die Auswahl von MP3 Titeln. Eine besondere Herausforderung sei der Sprachenwechsel mitten im Satz. Als technische Lösung werde derzeit ein Phonemmapping verwendet, da das Umschalten zwischen verschiedenen Sprachen und Stimmen aus Gründen der Ladezeit technisch nicht möglich sei.

Signalrekonstruktionen verbessern Sprachsignale

Mit einem Verfahren zur Sprachsignalverbesserung hat sich Jeschkes Kollege Mohamed Krini, bei Harman/Becker Automotive Systems für den Bereich Acoustic Speech Enhancement zuständig, beschäftigt. „Werden Telefonate über eine Freisprechanlage aus dem Fahrzeug geführt, so überlagern sich der Sprache des lokalen Gesprächspartners störende Hintergrundgeräusche“, erläutert der Experte. Um die Sprachqualität zu verbessern, setze man Geräuschreduktionsverfahren ein, die in der Regel auf dem Prinzip einer zeitvarianten, spektralen Gewichtung basierten. Bei guten bis mittleren Signal-zu-Geräusch-Abstand könne man auf diese Weise gute Ergebnisse erzielen.

„In lauten Geräuschszenarien funktionieren die zurzeit verwendeten Standardalgorithmen jedoch nicht mehr zufrieden stellend und sollten daher verbessert werden“, ergänzt Krini. Zu diesem Zweck habe Harman/Becker Automotive Systems ein neues Verfahren zur Verbesserung von stark gestörten Sprachsignalen entwickelt, das im Wesentlichen aus zwei Algorithmenteilen bestehe: einer Geräuschreduktion und einer partiellen Sprachrekonstruktion. Das Prinzip der partiellen Rekonstruktion basiere darauf, jene Zeit-Frequenz-Bereiche, in welchen das Signal-zu-Geräusch-Verhältnis gering ist, zunächst zu detektieren und dort das Sprachsignal zu synthetisieren. Durch das neue Verfahren sei es möglich, die stark gestörten Nutzsignalanteile wiederherzustellen und die Sprachqualität merklich zu verbessern.

Visualisierung spektraler Merkmale

Mit einem neuen Verfahren zur Spracherkennung sorgte Hans-Günter Hirsch vom Fachbereich Elektrotechnik und Informatik der Hochschule Niederrhein in Krefeld für ein viel beachtetes Thema der Tagung. Zur Modellierung sprachlicher Einheiten wie Wörtern oder Lauten wird bei den meisten heutzutage eingesetzten Systemen zur automatischen Spracherkennung der mathematische Ansatz des so genannten Hidden Markov Modells (HMM) verwendet. Bei diesem Verfahren wird die jeweilige sprachliche Einheit als eine zeitliche Folge kurzer sprachlicher Abschnitte modelliert.

„Es ist uns nunmehr gelungen, die in einem HMM enthaltenen spektralen Merkmale zu bestimmen und zu visualisieren“, erläutert Hirsch. Mit den daraus gewonnenen Ergebnissen könnten neue Verfahren zur Spracherkennung bei gleichzeitigem Vorhandensein bestimmter Störeinflüsse abgeleitet werden.

Rolf Froböse | Rolf Froböse
Weitere Informationen:
http://www.vde.com

Weitere Nachrichten aus der Kategorie Kommunikation Medien:

nachricht Zwischen Filterblasen, ungleicher Sichtbarkeit und Transnationalität
06.12.2017 | Schweizerischer Nationalfonds SNF

nachricht Soundbar reduziert Höranstrengung
25.10.2017 | Fraunhofer-Institut für Digitale Medientechnologie IDMT

Alle Nachrichten aus der Kategorie: Kommunikation Medien >>>

Die aktuellsten Pressemeldungen zum Suchbegriff Innovation >>>

Die letzten 5 Focus-News des innovations-reports im Überblick:

Im Focus: Long-lived storage of a photonic qubit for worldwide teleportation

MPQ scientists achieve long storage times for photonic quantum bits which break the lower bound for direct teleportation in a global quantum network.

Concerning the development of quantum memories for the realization of global quantum networks, scientists of the Quantum Dynamics Division led by Professor...

Im Focus: Electromagnetic water cloak eliminates drag and wake

Detailed calculations show water cloaks are feasible with today's technology

Researchers have developed a water cloaking concept based on electromagnetic forces that could eliminate an object's wake, greatly reducing its drag while...

Im Focus: Neue Einblicke in die Materie: Hochdruckforschung in Kombination mit NMR-Spektroskopie

Forschern der Universität Bayreuth und des Karlsruhe Institute of Technology (KIT) ist es erstmals gelungen, die magnetische Kernresonanzspektroskopie (NMR) in Experimenten anzuwenden, bei denen Materialproben unter sehr hohen Drücken – ähnlich denen im unteren Erdmantel – analysiert werden. Das in der Zeitschrift Science Advances vorgestellte Verfahren verspricht neue Erkenntnisse über Elementarteilchen, die sich unter hohen Drücken oft anders verhalten als unter Normalbedingungen. Es wird voraussichtlich technologische Innovationen fördern, aber auch neue Einblicke in das Erdinnere und die Erdgeschichte, insbesondere die Bedingungen für die Entstehung von Leben, ermöglichen.

Diamanten setzen Materie unter Hochdruck

Im Focus: Scientists channel graphene to understand filtration and ion transport into cells

Tiny pores at a cell's entryway act as miniature bouncers, letting in some electrically charged atoms--ions--but blocking others. Operating as exquisitely sensitive filters, these "ion channels" play a critical role in biological functions such as muscle contraction and the firing of brain cells.

To rapidly transport the right ions through the cell membrane, the tiny channels rely on a complex interplay between the ions and surrounding molecules,...

Im Focus: Stabile Quantenbits

Physiker aus Konstanz, Princeton und Maryland schaffen ein stabiles Quantengatter als Grundelement für den Quantencomputer

Meilenstein auf dem Weg zum Quantencomputer: Wissenschaftler der Universität Konstanz, der Princeton University sowie der University of Maryland entwickeln ein...

Alle Focus-News des Innovations-reports >>>

Anzeige

Anzeige

IHR
JOB & KARRIERE
SERVICE
im innovations-report
in Kooperation mit academics
Veranstaltungen

Innovative Strategien zur Bekämpfung von parasitären Würmern

08.12.2017 | Veranstaltungen

Hohe Heilungschancen bei Lymphomen im Kindesalter

07.12.2017 | Veranstaltungen

Der Roboter im Pflegeheim – bald Wirklichkeit?

05.12.2017 | Veranstaltungen

 
VideoLinks
B2B-VideoLinks
Weitere VideoLinks >>>
Aktuelle Beiträge

Mit Quantenmechanik zu neuen Solarzellen: Forschungspreis für Bayreuther Physikerin

12.12.2017 | Förderungen Preise

Stottern: Stoppsignale im Gehirn verhindern flüssiges Sprechen

12.12.2017 | Biowissenschaften Chemie

E-Mobilität: Neues Hybridspeicherkonzept soll Reichweite und Leistung erhöhen

12.12.2017 | Energie und Elektrotechnik