Forum für Wissenschaft, Industrie und Wirtschaft

Hauptsponsoren:     3M 
Datenbankrecherche:

 

IT versus Babylon – verbesserte Spracherkennung im Rampenlicht der Technik

09.10.2008
Verbesserte Technologien der Spracherkennung und Sprachausgabe sind in allen Bereichen modernen Kommunikationstechnik geschätzte Trumpfkarten.

Die aktuellen Entwicklungen und Trends auf diesen hochdynamischen Markt standen im Fokus einer internationalen Tagung, zu der die Informationstechnische Gesellschaft im VDE (ITG) zahlreiche Experten nach Aachen eingeladen hatte.

Im Automobil sind die Anwendungsmöglichkeiten für Sprachausgaben in den letzten Jahren stetig gewachsen. Ein Ende dieses Trends zeichnet sich nicht ab, denn die Anwendungsmöglichkeiten sind vielfältig. Die Palette reicht vom Reiseführer, der für sämtliche Sehenswürdigkeiten Beschreibungen im Audio-Format bereit hält bis hin zu Stauinformationen, die dem Fahrer erst vorgelesen werden, bevor die Navigation eine neue Route berechnet.

„Eine neue Anforderung an die Sprachausgabe im Kfz stellt die multilinguale Ausgabe dar“, resümiert Bärbel Jeschke von der Harman/Becker Automotive Systems in Ulm. Diese benötige man vor allem für das Navigieren zu ausländischen Zielen oder für die Auswahl von MP3 Titeln. Eine besondere Herausforderung sei der Sprachenwechsel mitten im Satz. Als technische Lösung werde derzeit ein Phonemmapping verwendet, da das Umschalten zwischen verschiedenen Sprachen und Stimmen aus Gründen der Ladezeit technisch nicht möglich sei.

Signalrekonstruktionen verbessern Sprachsignale

Mit einem Verfahren zur Sprachsignalverbesserung hat sich Jeschkes Kollege Mohamed Krini, bei Harman/Becker Automotive Systems für den Bereich Acoustic Speech Enhancement zuständig, beschäftigt. „Werden Telefonate über eine Freisprechanlage aus dem Fahrzeug geführt, so überlagern sich der Sprache des lokalen Gesprächspartners störende Hintergrundgeräusche“, erläutert der Experte. Um die Sprachqualität zu verbessern, setze man Geräuschreduktionsverfahren ein, die in der Regel auf dem Prinzip einer zeitvarianten, spektralen Gewichtung basierten. Bei guten bis mittleren Signal-zu-Geräusch-Abstand könne man auf diese Weise gute Ergebnisse erzielen.

„In lauten Geräuschszenarien funktionieren die zurzeit verwendeten Standardalgorithmen jedoch nicht mehr zufrieden stellend und sollten daher verbessert werden“, ergänzt Krini. Zu diesem Zweck habe Harman/Becker Automotive Systems ein neues Verfahren zur Verbesserung von stark gestörten Sprachsignalen entwickelt, das im Wesentlichen aus zwei Algorithmenteilen bestehe: einer Geräuschreduktion und einer partiellen Sprachrekonstruktion. Das Prinzip der partiellen Rekonstruktion basiere darauf, jene Zeit-Frequenz-Bereiche, in welchen das Signal-zu-Geräusch-Verhältnis gering ist, zunächst zu detektieren und dort das Sprachsignal zu synthetisieren. Durch das neue Verfahren sei es möglich, die stark gestörten Nutzsignalanteile wiederherzustellen und die Sprachqualität merklich zu verbessern.

Visualisierung spektraler Merkmale

Mit einem neuen Verfahren zur Spracherkennung sorgte Hans-Günter Hirsch vom Fachbereich Elektrotechnik und Informatik der Hochschule Niederrhein in Krefeld für ein viel beachtetes Thema der Tagung. Zur Modellierung sprachlicher Einheiten wie Wörtern oder Lauten wird bei den meisten heutzutage eingesetzten Systemen zur automatischen Spracherkennung der mathematische Ansatz des so genannten Hidden Markov Modells (HMM) verwendet. Bei diesem Verfahren wird die jeweilige sprachliche Einheit als eine zeitliche Folge kurzer sprachlicher Abschnitte modelliert.

„Es ist uns nunmehr gelungen, die in einem HMM enthaltenen spektralen Merkmale zu bestimmen und zu visualisieren“, erläutert Hirsch. Mit den daraus gewonnenen Ergebnissen könnten neue Verfahren zur Spracherkennung bei gleichzeitigem Vorhandensein bestimmter Störeinflüsse abgeleitet werden.

Rolf Froböse | Rolf Froböse
Weitere Informationen:
http://www.vde.com

Weitere Nachrichten aus der Kategorie Kommunikation Medien:

nachricht Auf Videokacheln basierendes DASH Streaming für Virtuelle Realität mit HEVC vom Fraunhofer HHI
03.01.2017 | Fraunhofer-Institut für Nachrichtentechnik Heinrich-Hertz-Institut

nachricht Virtuell und 360°: die Zukunft bewegter Bilder
04.10.2016 | Fachhochschule St. Pölten

Alle Nachrichten aus der Kategorie: Kommunikation Medien >>>

Die aktuellsten Pressemeldungen zum Suchbegriff Innovation >>>

Die letzten 5 Focus-News des innovations-reports im Überblick:

Im Focus: Innovatives Hochleistungsmaterial: Biofasern aus Florfliegenseide

Neuartige Biofasern aus einem Seidenprotein der Florfliege werden am Fraunhofer-Institut für Angewandte Polymerforschung IAP gemeinsam mit der Firma AMSilk GmbH entwickelt. Die Forscher arbeiten daran, das Protein in großen Mengen biotechnologisch herzustellen. Als hochgradig biegesteife Faser soll das Material künftig zum Beispiel in Leichtbaukunststoffen für die Verkehrstechnik eingesetzt werden. Im Bereich Medizintechnik sind beispielsweise biokompatible Seidenbeschichtungen von Implantaten denkbar. Ein erstes Materialmuster präsentiert das Fraunhofer IAP auf der Internationalen Grünen Woche in Berlin vom 20.1. bis 29.1.2017 in Halle 4.2 am Stand 212.

Zum Schutz des Nachwuchses vor bodennahen Fressfeinden lagern Florfliegen ihre Eier auf der Unterseite von Blättern ab – auf der Spitze von stabilen seidenen...

Im Focus: Verkehrsstau im Nichts

Konstanzer Physiker verbuchen neue Erfolge bei der Vermessung des Quanten-Vakuums

An der Universität Konstanz ist ein weiterer bedeutender Schritt hin zu einem völlig neuen experimentellen Zugang zur Quantenphysik gelungen. Das Team um Prof....

Im Focus: Traffic jam in empty space

New success for Konstanz physicists in studying the quantum vacuum

An important step towards a completely new experimental access to quantum physics has been made at University of Konstanz. The team of scientists headed by...

Im Focus: Textiler Hochwasserschutz erhöht Sicherheit

Wissenschaftler der TU Chemnitz präsentieren im Februar und März 2017 ein neues temporäres System zum Schutz gegen Hochwasser auf Baumessen in Chemnitz und Dresden

Auch die jüngsten Hochwasserereignisse zeigen, dass vielerorts das natürliche Rückhaltepotential von Uferbereichen schnell erschöpft ist und angrenzende...

Im Focus: Wie Darmbakterien krank machen

HZI-Forscher entschlüsseln Infektionsmechanismen von Yersinien und Immunantworten des Wirts

Yersinien verursachen schwere Darminfektionen. Um ihre Infektionsmechanismen besser zu verstehen, werden Studien mit dem Modellorganismus Yersinia...

Alle Focus-News des Innovations-reports >>>

Anzeige

Anzeige

IHR
JOB & KARRIERE
SERVICE
im innovations-report
in Kooperation mit academics
Veranstaltungen

Mittelstand 4.0 – Mehrwerte durch Digitalisierung: Hintergründe, Beispiele, Lösungen

20.01.2017 | Veranstaltungen

Nachhaltige Wassernutzung in der Landwirtschaft Osteuropas und Zentralasiens

19.01.2017 | Veranstaltungen

Künftige Rohstoffexperten aus aller Welt in Freiberg zur Winterschule

18.01.2017 | Veranstaltungen

 
VideoLinks
B2B-VideoLinks
Weitere VideoLinks >>>
Aktuelle Beiträge

21.500 Euro für eine grüne Zukunft – Unserer Umwelt zuliebe

20.01.2017 | Unternehmensmeldung

innovations-report im Interview mit Rolf-Dieter Lafrenz, Gründer und Geschäftsführer der Hamburger Start ups Cargonexx

20.01.2017 | Unternehmensmeldung

Niederlande: Intelligente Lösungen für Bahn und Stahlindustrie werden gefördert

20.01.2017 | Förderungen Preise