Forum für Wissenschaft, Industrie und Wirtschaft

Hauptsponsoren:     3M 
Datenbankrecherche:

 

IT versus Babylon – verbesserte Spracherkennung im Rampenlicht der Technik

09.10.2008
Verbesserte Technologien der Spracherkennung und Sprachausgabe sind in allen Bereichen modernen Kommunikationstechnik geschätzte Trumpfkarten.

Die aktuellen Entwicklungen und Trends auf diesen hochdynamischen Markt standen im Fokus einer internationalen Tagung, zu der die Informationstechnische Gesellschaft im VDE (ITG) zahlreiche Experten nach Aachen eingeladen hatte.

Im Automobil sind die Anwendungsmöglichkeiten für Sprachausgaben in den letzten Jahren stetig gewachsen. Ein Ende dieses Trends zeichnet sich nicht ab, denn die Anwendungsmöglichkeiten sind vielfältig. Die Palette reicht vom Reiseführer, der für sämtliche Sehenswürdigkeiten Beschreibungen im Audio-Format bereit hält bis hin zu Stauinformationen, die dem Fahrer erst vorgelesen werden, bevor die Navigation eine neue Route berechnet.

„Eine neue Anforderung an die Sprachausgabe im Kfz stellt die multilinguale Ausgabe dar“, resümiert Bärbel Jeschke von der Harman/Becker Automotive Systems in Ulm. Diese benötige man vor allem für das Navigieren zu ausländischen Zielen oder für die Auswahl von MP3 Titeln. Eine besondere Herausforderung sei der Sprachenwechsel mitten im Satz. Als technische Lösung werde derzeit ein Phonemmapping verwendet, da das Umschalten zwischen verschiedenen Sprachen und Stimmen aus Gründen der Ladezeit technisch nicht möglich sei.

Signalrekonstruktionen verbessern Sprachsignale

Mit einem Verfahren zur Sprachsignalverbesserung hat sich Jeschkes Kollege Mohamed Krini, bei Harman/Becker Automotive Systems für den Bereich Acoustic Speech Enhancement zuständig, beschäftigt. „Werden Telefonate über eine Freisprechanlage aus dem Fahrzeug geführt, so überlagern sich der Sprache des lokalen Gesprächspartners störende Hintergrundgeräusche“, erläutert der Experte. Um die Sprachqualität zu verbessern, setze man Geräuschreduktionsverfahren ein, die in der Regel auf dem Prinzip einer zeitvarianten, spektralen Gewichtung basierten. Bei guten bis mittleren Signal-zu-Geräusch-Abstand könne man auf diese Weise gute Ergebnisse erzielen.

„In lauten Geräuschszenarien funktionieren die zurzeit verwendeten Standardalgorithmen jedoch nicht mehr zufrieden stellend und sollten daher verbessert werden“, ergänzt Krini. Zu diesem Zweck habe Harman/Becker Automotive Systems ein neues Verfahren zur Verbesserung von stark gestörten Sprachsignalen entwickelt, das im Wesentlichen aus zwei Algorithmenteilen bestehe: einer Geräuschreduktion und einer partiellen Sprachrekonstruktion. Das Prinzip der partiellen Rekonstruktion basiere darauf, jene Zeit-Frequenz-Bereiche, in welchen das Signal-zu-Geräusch-Verhältnis gering ist, zunächst zu detektieren und dort das Sprachsignal zu synthetisieren. Durch das neue Verfahren sei es möglich, die stark gestörten Nutzsignalanteile wiederherzustellen und die Sprachqualität merklich zu verbessern.

Visualisierung spektraler Merkmale

Mit einem neuen Verfahren zur Spracherkennung sorgte Hans-Günter Hirsch vom Fachbereich Elektrotechnik und Informatik der Hochschule Niederrhein in Krefeld für ein viel beachtetes Thema der Tagung. Zur Modellierung sprachlicher Einheiten wie Wörtern oder Lauten wird bei den meisten heutzutage eingesetzten Systemen zur automatischen Spracherkennung der mathematische Ansatz des so genannten Hidden Markov Modells (HMM) verwendet. Bei diesem Verfahren wird die jeweilige sprachliche Einheit als eine zeitliche Folge kurzer sprachlicher Abschnitte modelliert.

„Es ist uns nunmehr gelungen, die in einem HMM enthaltenen spektralen Merkmale zu bestimmen und zu visualisieren“, erläutert Hirsch. Mit den daraus gewonnenen Ergebnissen könnten neue Verfahren zur Spracherkennung bei gleichzeitigem Vorhandensein bestimmter Störeinflüsse abgeleitet werden.

Rolf Froböse | Rolf Froböse
Weitere Informationen:
http://www.vde.com

Weitere Nachrichten aus der Kategorie Kommunikation Medien:

nachricht mce mediacomeurope schließt Kooperationsvertrag mit Anixe TV
13.04.2018 | mce mediacomeurope GmbH

nachricht Gebärdensprache neu gedacht
14.03.2018 | Universität Siegen

Alle Nachrichten aus der Kategorie: Kommunikation Medien >>>

Die aktuellsten Pressemeldungen zum Suchbegriff Innovation >>>

Die letzten 5 Focus-News des innovations-reports im Überblick:

Im Focus: BAM@Hannover Messe: Innovatives 3D-Druckverfahren für die Raumfahrt

Auf der Hannover Messe 2018 präsentiert die Bundesanstalt für Materialforschung und -prüfung (BAM), wie Astronauten in Zukunft Werkzeug oder Ersatzteile per 3D-Druck in der Schwerelosigkeit selbst herstellen können. So können Gewicht und damit auch Transportkosten für Weltraummissionen deutlich reduziert werden. Besucherinnen und Besucher können das innovative additive Fertigungsverfahren auf der Messe live erleben.

Pulverbasierte additive Fertigung unter Schwerelosigkeit heißt das Projekt, bei dem ein Bauteil durch Aufbringen von Pulverschichten und selektivem...

Im Focus: BAM@Hannover Messe: innovative 3D printing method for space flight

At the Hannover Messe 2018, the Bundesanstalt für Materialforschung und-prüfung (BAM) will show how, in the future, astronauts could produce their own tools or spare parts in zero gravity using 3D printing. This will reduce, weight and transport costs for space missions. Visitors can experience the innovative additive manufacturing process live at the fair.

Powder-based additive manufacturing in zero gravity is the name of the project in which a component is produced by applying metallic powder layers and then...

Im Focus: IWS-Ingenieure formen moderne Alu-Bauteile für zukünftige Flugzeuge

Mit Unterdruck zum Leichtbau-Flugzeug

Ingenieure des Fraunhofer-Instituts für Werkstoff- und Strahltechnik (IWS) in Dresden haben in Kooperation mit Industriepartnern ein innovatives Verfahren...

Im Focus: Moleküle brillant beleuchtet

Physiker des Labors für Attosekundenphysik, der Ludwig-Maximilians-Universität und des Max-Planck-Instituts für Quantenoptik haben eine leistungsstarke Lichtquelle entwickelt, die ultrakurze Pulse über einen Großteil des mittleren Infrarot-Wellenlängenbereichs generiert. Die Wissenschaftler versprechen sich von dieser Technologie eine Vielzahl von Anwendungen, unter anderem im Bereich der Krebsfrüherkennung.

Moleküle sind die Grundelemente des Lebens. Auch wir Menschen bestehen aus ihnen. Sie steuern unseren Biorhythmus, zeigen aber auch an, wenn dieser erkrankt...

Im Focus: Molecules Brilliantly Illuminated

Physicists at the Laboratory for Attosecond Physics, which is jointly run by Ludwig-Maximilians-Universität and the Max Planck Institute of Quantum Optics, have developed a high-power laser system that generates ultrashort pulses of light covering a large share of the mid-infrared spectrum. The researchers envisage a wide range of applications for the technology – in the early diagnosis of cancer, for instance.

Molecules are the building blocks of life. Like all other organisms, we are made of them. They control our biorhythm, and they can also reflect our state of...

Alle Focus-News des Innovations-reports >>>

Anzeige

Anzeige

VideoLinks
Industrie & Wirtschaft
Veranstaltungen

infernum-Tag 2018: Digitalisierung und Nachhaltigkeit

24.04.2018 | Veranstaltungen

Fraunhofer eröffnet Community zur Entwicklung von Anwendungen und Technologien für die Industrie 4.0

23.04.2018 | Veranstaltungen

Mars Sample Return – Wann kommen die ersten Gesteinsproben vom Roten Planeten?

23.04.2018 | Veranstaltungen

VideoLinks
Wissenschaft & Forschung
Weitere VideoLinks im Überblick >>>
 
Aktuelle Beiträge

Silizium als neues Speichermaterial für die Akkus der Zukunft

25.04.2018 | HANNOVER MESSE

IAB-Arbeitsmarktbarometer: Trotz Dämpfer auf gutem Niveau

25.04.2018 | Wirtschaft Finanzen

AWI-Forscher messen Rekordkonzentration von Mikroplastik im arktischen Meereis

25.04.2018 | Geowissenschaften

Weitere B2B-VideoLinks
IHR
JOB & KARRIERE
SERVICE
im innovations-report
in Kooperation mit academics