KI übertrifft Mensch bei Spracherkennung

Der „Lecture Translator“ des KIT liefert dank überlegenem Spracherkennungssystem zukünftig bessere Ergebnisse mit minimaler Verzögerung. (Foto: KIT)

Ein alltägliches Gespräch zu verfolgen und genau wiederzugeben ist eine der größten Herausforderungen in der Forschung an Künstlicher Intelligenz (KI). Forscherinnen und Forschern des Karlsruher Instituts für Technologie (KIT) ist es nun erstmals gelungen, mit einem Computersystem die Erkennungsgenauigkeit des Menschen beim Erkennen solcher spontan gesprochener Sprache zu übertreffen – und dies mit nur minimaler Verzögerung zum Sprechen. Darüber berichten sie auf der Internet-Plattform http://www.ArXiv.org.

Ein alltägliches Gespräch zu verfolgen und genau wiederzugeben ist eine der größten Herausforderungen in der Forschung an Künstlicher Intelligenz (KI). Forscherinnen und Forschern des Karlsruher Instituts für Technologie (KIT) ist es nun erstmals gelungen, mit einem Computersystem die Erkennungsgenauigkeit des Menschen beim Erkennen solcher spontan gesprochener Sprache zu übertreffen – und dies mit nur minimaler Verzögerung zum Sprechen. Darüber berichten sie auf der Internet-Plattform http://www.ArXiv.org.

„Wenn Menschen miteinander sprechen, gibt es Abbrüche, Stotterer, Hesitationen wie ‚äh‘ oder ‚hm‘, Lacher und Huster“, sagt Alex Waibel, Professor für Informatik am KIT. „Oft werden Worte zudem noch undeutlich ausgesprochen.“ So sei es schon für Menschen schwierig, einen akkuraten Mitschrieb eines informellen Dialogs anzufertigen. „Einer KI fiel dies bislang noch schwerer“, so der Spracherkennungs-Experte. Ein Team aus KIT-Wissenschaftlern und Mitarbeitern der Firma KITES, einer Ausgründung aus dem KIT, hat nun weltweit erstmals ein Computersystem programmiert, das diese Aufgabe besser erledigt als Menschen und schneller als andere Systeme.

Waibel hat bereits einen automatischen Live-Übersetzer entwickelt, der Universitätsvorlesungen aus dem Deutschen oder Englischen schritthaltend mit der Vorlesung in die Sprachen ausländischer Studierender überträgt. Der „Lecture Translator“ ist seit 2012 in den Hörsälen des KIT im Einsatz. „Die Erkennung spontaner Sprache ist die wichtigste Komponente in diesem System“, erläutert Waibel, „da Fehler und Verzögerungen bei der Erkennung die Übersetzung unverständlich machen. Die menschliche Fehlerrate liegt hier bei um die 5,5 Prozent. Unser System erreicht nun 5,0 Prozent.“ Allerdings sei nicht nur die Genauigkeit ausschlaggebend, sondern auch, wie rasch das System das Ergebnis ausgibt, damit Studierende der Vorlesung live folgen können. Diese Verzögerung konnten die Forscher erstmalig auf eine Sekunde reduzieren. Das sei der niedrigste Wert in der sogenannten Latenz, den je ein Spracherkennungssystem dieser Qualität erreicht habe, betont Waibel.

Gemessen werden Fehlerrate und Verzögerung mit dem standardisierten und wissenschaftlich international anerkannten „Switchboard-Benchmark“-Test. Dieser gilt als bislang unerreichte Messlatte im Wettbewerb der internationalen KI-Forscher-Gemeinde, eine Maschine zu bauen, die an die menschliche Fähigkeit Spontansprache zu erkennen herankommt oder diese übertrifft.

Inhalte oder Zusammenhänge verstehen könne ein Erkennungs-System alleine aber noch nicht, so Waibel. „Es geht hier ausschließlich um die akustische Erkennung unter wissenschaftlich vergleichbaren Bedingungen.“ Dialog-, Übersetzungs- und weitere KI Module können nun aber schneller und mit größerer Genauigkeit sprachliche Interaktion ermöglichen.

Details zum KIT-Zentrum Information · Systeme · Technologien (in englischer Sprache): http://www.kcist.kit.edu

Weitere Materialien: Link zum Paper: https://arxiv.org/abs/2010.03449

Weiterer Kontakt:

Dr. Felix Mescoli, Redakteur/Pressereferent, Tel.: +49 721 608-41171, E-Mail: felix.mescoli@kit.edu

Als „Die Forschungsuniversität in der Helmholtz-Gemeinschaft“ schafft und vermittelt das KIT Wissen für Gesellschaft und Umwelt. Ziel ist es, zu den globalen Herausforderungen maßgebliche Beiträge in den Feldern Energie, Mobilität und Information zu leisten. Dazu arbeiten rund 9.300 Mitarbeiterinnen und Mitarbeiter auf einer breiten disziplinären Basis in Natur-, Ingenieur-, Wirtschafts- sowie Geistes- und Sozialwissenschaften zusammen. Seine 24.400 Studierenden bereitet das KIT durch ein forschungsorientiertes universitäres Studium auf verantwortungsvolle Aufgaben in Gesellschaft, Wirtschaft und Wissenschaft vor. Die Innovationstätigkeit am KIT schlägt die Brücke zwischen Erkenntnis und Anwendung zum gesellschaftlichen Nutzen, wirtschaftlichen Wohlstand und Erhalt unserer natürlichen Lebensgrundlagen. Das KIT ist eine der deutschen Exzellenzuniversitäten.

Diese Presseinformation ist im Internet abrufbar unter: https://www.kit.edu/kit/presseinformationen.php

Originalpublikation:

www.ArXiv.org

Media Contact

Monika Landgraf Strategische Entwicklung und Kommunikation - Gesamtkommunikation
Karlsruher Institut für Technologie

Alle Nachrichten aus der Kategorie: Informationstechnologie

Neuerungen und Entwicklungen auf den Gebieten der Informations- und Datenverarbeitung sowie der dafür benötigten Hardware finden Sie hier zusammengefasst.

Unter anderem erhalten Sie Informationen aus den Teilbereichen: IT-Dienstleistungen, IT-Architektur, IT-Management und Telekommunikation.

Zurück zur Startseite

Kommentare (0)

Schreiben Sie einen Kommentar

Neueste Beiträge

Forschende enthüllen neue Funktion von Onkoproteinen

Forschende der Uni Würzburg haben herausgefunden: Das Onkoprotein MYCN lässt Krebszellen nicht nur stärker wachsen, sondern macht sie auch resistenter gegen Medikamente. Für die Entwicklung neuer Therapien ist das ein…

Mit Kleinsatelliten den Asteroiden Apophis erforschen

In fünf Jahren fliegt ein größerer Asteroid sehr nah an der Erde vorbei – eine einmalige Chance, ihn zu erforschen. An der Uni Würzburg werden Konzepte für eine nationale Kleinsatellitenmission…

Zellskelett-Gene regulieren Vernetzung im Säugerhirn

Marburger Forschungsteam beleuchtet, wie Nervenzellen Netzwerke bilden. Ein Molekülpaar zu trennen, hat Auswirkungen auf das Networking im Hirn: So lässt sich zusammenfassen, was eine Marburger Forschungsgruppe jetzt über die Vernetzung…

Partner & Förderer