Zuverlässige Worterkennung, neue sprachgesteuerte Dienste

Der erfolgreiche Einsatz der neuen sprachgesteuerten Directory Assistance (DA) Dienste und anderer Anwendungen ist abhängig von der Genauigkeit und Zuverlässigkeit der Erkennungsergebnisse. Die Ergebnisse von Zuverlässigkeitsmessungen spielen deshalb eine wichtige Rolle und sind notwendig für alle praktischen Anwendungen, bei denen die Entscheidung getroffen werden muss, ob ein erkanntes Wort angenommen oder zurückgewiesen werden soll.

Die automatische Spracherkennung (Automatic Speech Recognition – ASR) arbeitet mit dem sprachlichen Input des Nutzers und erstellt daraus eine Transkription des Gesagten, die ein gewisses Fehlerpotenzial aufweist. Gute Spracherkennungsanwendungen brauchen zuverlässige Systeme, die in verschiedenen Umgebungen und bei verschiedenen Aufgabenstellungen gleichbleibend korrekte Ergebnisse hervorbringen. Die aktuellen Spracherkennungssysteme sind jedoch noch lange nicht perfekt. Besonders die Identifizierung von Fehlern während der Spracherkennung bleibt von Bedeutung. Die Erkennung der zahlreichen Eigennamen bereitet dabei besonders große Schwierigkeiten.

Zuverlässigkeitsmessungen sind eine Möglichkeit, die Unsicherheit in Bezug auf die Ergebnisgenauigkeit der Spracherkennungssysteme in den Griff zu bekommen. Akustische Zuverlässigkeitsmessungen erweisen sich daher für viele Aspekte der Spracherkennung als nützlich, z.B. für die Ablehnung falscher Wörter, zur Erkennung von Wörtern, die nicht im Vokabular enthalten sind, sowie zum Entdecken von Schlüsselwörtern.

Das EU-Förderprojekt SMADA hat Untersuchungen zu den Auswirkungen zweier Fehlerursachen bei der automatischen Spracherkennung durchgeführt: Die Verwechslung von akustisch ähnlichen Namen und Wörtern sowie Probleme aufgrund von Hintergrundgeräuschen oder undeutlicher Aussprache.

Das Projekt zeigte, dass Zuverlässigkeitsmessungen auf Grundlage einfacher akustischer Wahrscheinlichkeiten bei der Korrektur von Wortverwechslungen aufgrund akustischer Ähnlichkeiten die besten Ergebnisse bringen. Bei Problemen aufgrund von Geräuschen oder undeutlicher Aussprache müssen die Zuverlässigkeitsmessungen auf einen komplexeren Algorithmus zurückgreifen. Dieser Algorithmus sollte in der Lage sein, die Wahrscheinlichkeit der erstbesten Hypothese in Bezug zu alternativen Hypothesen zu setzen.

Bei diesem Projekt entstanden Möglichkeiten zur Zuverlässigkeitsmessung, die eine genügende Verlässlichkeit gewährleisten. So kann der Dialogmanager eines automatischen Directory Assistance (DA) entscheiden, was der Nutzer erreichen möchte und wie die Zweideutigkeiten aufgelöst werden können. Dadurch kann sichergestellt werden, dass die Wort-Fehler-Quote (Word Error Rate – WER) bei allen Entscheidungen so niedrig ist, dass sie im akzeptablen Bereich liegt.

Diese Messungen ermöglichen eine geringere Anzahl notwendiger Rückfragen und verkürzen so die Dauer der Interaktion. Außerdem kann dadurch der Anteil falscher Vorschläge durch den automatischen Sprachdienst reduziert werden. Die Ergebnisse dieses Projektes können auch für autonomes Lernen und Adaptionen eingesetzt werden.

Media Contact

Prof. Renato de Mori ctm

Weitere Informationen:

http://www.lia.univ-avignon.fr

Alle Nachrichten aus der Kategorie: Informationstechnologie

Neuerungen und Entwicklungen auf den Gebieten der Informations- und Datenverarbeitung sowie der dafür benötigten Hardware finden Sie hier zusammengefasst.

Unter anderem erhalten Sie Informationen aus den Teilbereichen: IT-Dienstleistungen, IT-Architektur, IT-Management und Telekommunikation.

Zurück zur Startseite

Kommentare (0)

Schreiben Sie einen Kommentar

Neueste Beiträge

FDmiX: Schnelle und robuste Serienproduktion von Nanopartikeln

Verkapselungstechnologie der nächsten Generation… Nukleinsäure-basierte Medikamente wie mRNA-Impfstoffe bieten ein enormes Potenzial für die Medizin und eröffnen neue Therapieansätze. Damit diese Wirkstoffe gezielt in die Körperzellen transportiert werden können, müssen…

Sensor misst Sauerstoffgehalt in der Atemluft

Eine zu geringe oder zu hohe Sauerstoffsättigung im Blut kann bleibende körperliche Schäden bewirken und sogar zum Tod führen. In der Intensiv- und Unfallmedizin wird die Sauerstoffkonzentration der Patientinnen und…

Neue MRT-Technik erkennt Schlaganfälle in kürzester Zeit

Tag gegen den Schlaganfall: Forschende der Universitätsmedizin Mainz haben im Rahmen einer Studie erstmals eine KI-gestützte Magnetresonanz-Tomographie (MRT)-Methode untersucht, um akute ischämische Schlaganfälle effizienter detektieren zu können. Dabei setzten sie…

Partner & Förderer