Forum für Wissenschaft, Industrie und Wirtschaft

Hauptsponsoren:     3M 
Datenbankrecherche:

 

IT versus Babylon – verbesserte Spracherkennung im Rampenlicht der Technik

09.10.2008
Verbesserte Technologien der Spracherkennung und Sprachausgabe sind in allen Bereichen modernen Kommunikationstechnik geschätzte Trumpfkarten.

Die aktuellen Entwicklungen und Trends auf diesen hochdynamischen Markt standen im Fokus einer internationalen Tagung, zu der die Informationstechnische Gesellschaft im VDE (ITG) zahlreiche Experten nach Aachen eingeladen hatte.

Im Automobil sind die Anwendungsmöglichkeiten für Sprachausgaben in den letzten Jahren stetig gewachsen. Ein Ende dieses Trends zeichnet sich nicht ab, denn die Anwendungsmöglichkeiten sind vielfältig. Die Palette reicht vom Reiseführer, der für sämtliche Sehenswürdigkeiten Beschreibungen im Audio-Format bereit hält bis hin zu Stauinformationen, die dem Fahrer erst vorgelesen werden, bevor die Navigation eine neue Route berechnet.

„Eine neue Anforderung an die Sprachausgabe im Kfz stellt die multilinguale Ausgabe dar“, resümiert Bärbel Jeschke von der Harman/Becker Automotive Systems in Ulm. Diese benötige man vor allem für das Navigieren zu ausländischen Zielen oder für die Auswahl von MP3 Titeln. Eine besondere Herausforderung sei der Sprachenwechsel mitten im Satz. Als technische Lösung werde derzeit ein Phonemmapping verwendet, da das Umschalten zwischen verschiedenen Sprachen und Stimmen aus Gründen der Ladezeit technisch nicht möglich sei.

Signalrekonstruktionen verbessern Sprachsignale

Mit einem Verfahren zur Sprachsignalverbesserung hat sich Jeschkes Kollege Mohamed Krini, bei Harman/Becker Automotive Systems für den Bereich Acoustic Speech Enhancement zuständig, beschäftigt. „Werden Telefonate über eine Freisprechanlage aus dem Fahrzeug geführt, so überlagern sich der Sprache des lokalen Gesprächspartners störende Hintergrundgeräusche“, erläutert der Experte. Um die Sprachqualität zu verbessern, setze man Geräuschreduktionsverfahren ein, die in der Regel auf dem Prinzip einer zeitvarianten, spektralen Gewichtung basierten. Bei guten bis mittleren Signal-zu-Geräusch-Abstand könne man auf diese Weise gute Ergebnisse erzielen.

„In lauten Geräuschszenarien funktionieren die zurzeit verwendeten Standardalgorithmen jedoch nicht mehr zufrieden stellend und sollten daher verbessert werden“, ergänzt Krini. Zu diesem Zweck habe Harman/Becker Automotive Systems ein neues Verfahren zur Verbesserung von stark gestörten Sprachsignalen entwickelt, das im Wesentlichen aus zwei Algorithmenteilen bestehe: einer Geräuschreduktion und einer partiellen Sprachrekonstruktion. Das Prinzip der partiellen Rekonstruktion basiere darauf, jene Zeit-Frequenz-Bereiche, in welchen das Signal-zu-Geräusch-Verhältnis gering ist, zunächst zu detektieren und dort das Sprachsignal zu synthetisieren. Durch das neue Verfahren sei es möglich, die stark gestörten Nutzsignalanteile wiederherzustellen und die Sprachqualität merklich zu verbessern.

Visualisierung spektraler Merkmale

Mit einem neuen Verfahren zur Spracherkennung sorgte Hans-Günter Hirsch vom Fachbereich Elektrotechnik und Informatik der Hochschule Niederrhein in Krefeld für ein viel beachtetes Thema der Tagung. Zur Modellierung sprachlicher Einheiten wie Wörtern oder Lauten wird bei den meisten heutzutage eingesetzten Systemen zur automatischen Spracherkennung der mathematische Ansatz des so genannten Hidden Markov Modells (HMM) verwendet. Bei diesem Verfahren wird die jeweilige sprachliche Einheit als eine zeitliche Folge kurzer sprachlicher Abschnitte modelliert.

„Es ist uns nunmehr gelungen, die in einem HMM enthaltenen spektralen Merkmale zu bestimmen und zu visualisieren“, erläutert Hirsch. Mit den daraus gewonnenen Ergebnissen könnten neue Verfahren zur Spracherkennung bei gleichzeitigem Vorhandensein bestimmter Störeinflüsse abgeleitet werden.

Rolf Froböse | Rolf Froböse
Weitere Informationen:
http://www.vde.com

Weitere Nachrichten aus der Kategorie Kommunikation Medien:

nachricht Mehr Wissenschafts-Enthusiasten als Desinteressierte in der Schweiz
05.02.2018 | Universität Zürich

nachricht Zwischen Filterblasen, ungleicher Sichtbarkeit und Transnationalität
06.12.2017 | Schweizerischer Nationalfonds SNF

Alle Nachrichten aus der Kategorie: Kommunikation Medien >>>

Die aktuellsten Pressemeldungen zum Suchbegriff Innovation >>>

Die letzten 5 Focus-News des innovations-reports im Überblick:

Im Focus: Verlässliche Quantencomputer entwickeln

Internationalem Forschungsteam gelingt wichtiger Schritt auf dem Weg zur Lösung von Zertifizierungsproblemen

Quantencomputer sollen künftig algorithmische Probleme lösen, die selbst die größten klassischen Superrechner überfordern. Doch wie lässt sich prüfen, dass der...

Im Focus: Developing reliable quantum computers

International research team makes important step on the path to solving certification problems

Quantum computers may one day solve algorithmic problems which even the biggest supercomputers today can’t manage. But how do you test a quantum computer to...

Im Focus: Innovation im Leichtbaubereich: Belastbares Sandwich aus Aramid und Carbon

Die Entwicklung von Leichtbaustrukturen ist eines der zentralen Zukunftsthemen unserer Gesellschaft. Besonders in der Luftfahrtindustrie und in anderen Transportbereichen sind Leichtbaustrukturen gefragt. Sie ermöglichen Energieeinsparungen und reduzieren den Ressourcenverbrauch bei Treibstoffen und Material. Zum Einsatz kommen dabei Verbundmaterialien in der so genannten Sandwich-Bauweise. Diese bestehen aus zwei dünnen, steifen und hochfesten Deckschichten mit einer dazwischen liegenden dicken, vergleichsweise leichten und weichen Mittelschicht, dem Sandwich-Kern.

Aramidpapier ist ein etabliertes Material für solche Sandwichkerne. Sein mechanisches Strukturversagen ist jedoch noch unzureichend erforscht: Bislang fehlten...

Im Focus: Die Brücke, die sich dehnen kann

Brücken verformen sich, daher baut man normalerweise Dehnfugen ein. An der TU Wien wurde eine Technik entwickelt, die ohne Fugen auskommt und dadurch viel Geld und Aufwand spart.

Wer im Auto mit flottem Tempo über eine Brücke fährt, spürt es sofort: Meist rumpelt man am Anfang und am Ende der Brücke über eine Dehnfuge, die dort...

Im Focus: Eine Frage der Dynamik

Die meisten Ionenkanäle lassen nur eine ganz bestimmte Sorte von Ionen passieren, zum Beispiel Natrium- oder Kaliumionen. Daneben gibt es jedoch eine Reihe von Kanälen, die für beide Ionensorten durchlässig sind. Wie den Eiweißmolekülen das gelingt, hat jetzt ein Team um die Wissenschaftlerin Han Sun (FMP) und die Arbeitsgruppe von Adam Lange (FMP) herausgefunden. Solche nicht-selektiven Kanäle besäßen anders als die selektiven eine dynamische Struktur ihres Selektivitätsfilters, berichten die FMP-Forscher im Fachblatt Nature Communications. Dieser Filter könne zwei unterschiedliche Formen ausbilden, die jeweils nur eine der beiden Ionensorten passieren lassen.

Ionenkanäle sind für den Organismus von herausragender Bedeutung. Wenn zum Beispiel Sinnesreize wahrgenommen, ans Gehirn weitergeleitet und dort verarbeitet...

Alle Focus-News des Innovations-reports >>>

Anzeige

Anzeige

VideoLinks
Industrie & Wirtschaft
Veranstaltungen

DFG unterstützt Kongresse und Tagungen - April 2018

21.02.2018 | Veranstaltungen

Tag der Seltenen Erkrankungen – Deutsche Leberstiftung informiert über seltene Lebererkrankungen

21.02.2018 | Veranstaltungen

Digitalisierung auf dem Prüfstand: Hochkarätige Konferenz zu Empowerment in der agilen Arbeitswelt

20.02.2018 | Veranstaltungen

VideoLinks
Wissenschaft & Forschung
Weitere VideoLinks im Überblick >>>
 
Aktuelle Beiträge

Die Entschlüsselung der Struktur des Huntingtin Proteins

22.02.2018 | Biowissenschaften Chemie

Wirbelstürme im Herzen

22.02.2018 | Biowissenschaften Chemie

Biomasseforscher nehmen Versuchsanlage zur Weiterentwicklung der Biomassevergasung in Betrieb

22.02.2018 | Energie und Elektrotechnik

Weitere B2B-VideoLinks
IHR
JOB & KARRIERE
SERVICE
im innovations-report
in Kooperation mit academics