Forum für Wissenschaft, Industrie und Wirtschaft

Hauptsponsoren:     3M 
Datenbankrecherche:

 

Sprachcomputer sollen Gefühle erkennen - Emotionserkennung aus Sprachsignalen

16.02.2009
Wenn zwei Menschen miteinander sprechen, nehmen sie zweierlei wahr: Den Inhalt des Gesagten, aber auch Emotionen, die dadurch zum Ausdruck kommen, wie etwas gesagt wird.

Diese so genannten paralinguistischen Eigenschaften des Gesprochenen können von Systemen zur automatischen Spracherkennung wie beispielsweise in einer Telefonanlage bisher nicht erkannt werden. Wissenschaftler des Lehrstuhls für Systemtheorie und Signalverarbeitung der Uni Stuttgart suchen nach Wegen, damit Sprachcomputer auch Gemütsbewegungen verstehen können.

Die Sprachkommunikation besteht aus zwei Ebenen: dem linguistischen (oder expliziten) sowie dem paralinguistischen (oder impliziten) Kommunikationskanal. Über den ersten Kanal wird der Inhalt der Sprachkonversation ausgetauscht: Was wurde gesprochen? Über den zweiten Kanal werden alle darüber hinausgehenden Informationen, also der paralinguistische Anteil der Sprachäußerung, kommuniziert: Wie wurde es gesprochen? Solche paralinguistischen Eigenschaften sind beispielsweise das Alter und das Geschlecht der Sprecher, die in einer Sprachäußerung gespiegelte Emotion (normal, Wut, Glück, Trauer, ...), die so genannte Stimmqualität (modal, hauchend, rau, knarrig, ...), medizinische Auffälligkeiten in der Stimmgebung oder auch Stress und Nervosität. Auch Informationen über die regionale (Dialekt) beziehungsweise soziale Herkunft gehören zu den paralinguistischen Eigenschaften.

Ein Mensch kann aus einer Sprachkonversation den inhaltlichen wie auch den paralinguistischen Informationsstrom gleichzeitig extrahieren und gemeinsam auswerten. Beim "Gespräch" zwischen Mensch und Computer - oder wissenschaftlich gesprochen an der akustischen Mensch-Computer-Schnittstelle - hat man sich allerdings bis heute fast ausschließlich auf den ersten Kommunikationskanal konzentriert. Diese automatische Erkennung des gesprochenen Textes aus den Sprachsignalen ist bekannt als Spracherkennung.

Mehrstufiges Vorgehen
Dagegen ist die automatische Erkennung der paralinguistischen Eigenschaften aus Sprachsignalen ein noch junges Forschungsfeld, das zunehmendes Interesse erweckt. Die mathematischen Methoden und Algorithmen, die dies ermöglichen sollen, stammen aus dem Gebiet der Mustererkennung, eines Zweiges der statistischen Signalverarbeitung. Wie die Spracherkennung besteht auch die Emotionserkennung aus mehreren Schritten: So werden zunächst emotional bewertete Sprachdatenbanken erstellt, anhand derer das Erkennungssystem trainiert werden kann. Dann werden Merkmale aus den Sprachsignalen berechnet, die sich bezüglich verschiedener Emotionen besonders gut unterscheiden lassen. Es folgen eine Auswahl der sinnvollsten Merkmale sowie der Entwurf und die Optimierung eines lernfähigen Erkennungssystems, das aus den Daten die Entscheidungsregel für die Emotionserkennung selbst extrahiert. Schließlich wird der "Erkenner" trainiert und mit unbekannten Testdaten validiert.

Bei der Berechnung der Merkmale stellte sich allerdings heraus, dass die in der Spracherkennung etablierten Merkmale für die Emotionserkennung nur bedingt nützlich sind, weil sich die linguistischen und paralinguistischen Informationen an unterschiedlichen Stellen der Sprachsignale verstecken. Bis die automatische Emotionserkennung für einen praktischen Einsatz ausgereift ist, sind deshalb noch viele Forschungsarbeiten nötig.

Doch der Aufwand lohnt sich, denn die Anwendungen für die Emotionserkennung aus Sprachsignalen sind vielfältig. Interessenten finden sich in Callcentern ebenso wie im medizinischen Bereich. In Fahrerassistenzsystemen könnte die Technologie detektieren, ob der Fahrer gerade im Stress ist. Zudem könnte die konventionelle Spracherkennung verbessert werden, weil die emotionale Färbung einer Sprachäußerung oft mit dem Inhalt des Gesagten verbunden ist: Das Schimpfwort "Mist" und das Grußwort "Herzlichen Glückwunsch" sind immer mit unterschiedlichen Emotionen verbunden. In der umgekehrten Richtung sollen die Erkenntnisse aus der Emotionserkennung auch dazu beitragen, die synthetisierte Sprache des Sprachcomputers emotionaler zu gestalten.

Weitere Informationen bei: Prof. Bin Yang, Lehrstuhl für Systemtheorie und Signalverarbeitung, Tel. 0711/685-67330, e-mail: bin.yang@LSS.uni-stuttgart.de

Ursula Zitzler | idw
Weitere Informationen:
http://www.uni-stuttgart.de/

Weitere Nachrichten aus der Kategorie Informationstechnologie:

nachricht CrowdWater: eine App für die Hochwasser-Forschung
18.05.2018 | Universität Zürich

nachricht Hochautomatisiertes Sehen auf dem Prüfstand
17.05.2018 | FOKUS - Fraunhofer-Institut für Offene Kommunikationssysteme

Alle Nachrichten aus der Kategorie: Informationstechnologie >>>

Die aktuellsten Pressemeldungen zum Suchbegriff Innovation >>>

Die letzten 5 Focus-News des innovations-reports im Überblick:

Im Focus: Bose-Einstein-Kondensat im Riesenatom - Universität Stuttgart untersucht exotisches Quantenobjekt

Passt eine ultrakalte Wolke aus zehntausenden Rubidium-Atomen in ein einzelnes Riesenatom? Forscherinnen und Forschern am 5. Physikalischen Institut der Universität Stuttgart ist dies erstmals gelungen. Sie zeigten einen ganz neuen Ansatz, die Wechselwirkung von geladenen Kernen mit neutralen Atomen bei weitaus niedrigeren Temperaturen zu untersuchen, als es bisher möglich war. Dies könnte einen wichtigen Schritt darstellen, um in Zukunft quantenmechanische Effekte in der Atom-Ion Wechselwirkung zu studieren. Das renommierte Fachjournal Physical Review Letters und das populärwissenschaftliche Begleitjournal Physics berichteten darüber.*)

In dem Experiment regten die Forscherinnen und Forscher ein Elektron eines einzelnen Atoms in einem Bose-Einstein-Kondensat mit Laserstrahlen in einen riesigen...

Im Focus: Algorithmen für die Leberchirurgie – weltweit sicherer operieren

Die Leber durchlaufen vier komplex verwobene Gefäßsysteme. Die chirurgische Entfernung von Tumoren ist daher oft eine schwierige Aufgabe. Das Fraunhofer-Institut für Bildgestützte Medizin MEVIS hat Algorithmen entwickelt, die die Bilddaten von Patienten analysieren und chirurgische Risiken berechnen. Leberkrebsoperationen werden damit besser planbar und sicherer.

Jährlich erkranken weltweit 750.000 Menschen neu an Leberkrebs, viele weitere entwickeln Lebermetastasen aufgrund anderer Krebserkrankungen. Ein chirurgischer...

Im Focus: Positronen leuchten besser

Leuchtstoffe werden schon lange benutzt, im Alltag zum Beispiel im Bildschirm von Fernsehgeräten oder in PC-Monitoren, in der Wissenschaft zum Untersuchen von Plasmen, Teilchen- oder Antiteilchenstrahlen. Gleich ob Teilchen oder Antiteilchen – treffen sie auf einen Leuchtstoff auf, regen sie ihn zum Lumineszieren an. Unbekannt war jedoch bisher, dass die Lichtausbeute mit Elektronen wesentlich niedriger ist als mit Positronen, ihren Antiteilchen. Dies hat Dr. Eve Stenson im Max-Planck-Institut für Plasmaphysik (IPP) in Garching und Greifswald jetzt beim Vorbereiten von Experimenten mit Materie-Antimaterie-Plasmen entdeckt.

„Wäre Antimaterie nicht so schwierig herzustellen, könnte man auf eine Ära hochleuchtender Niederspannungs-Displays hoffen, in der die Leuchtschirme nicht von...

Im Focus: Erklärung für rätselhafte Quantenoszillationen gefunden

Sogenannte Quanten-Vielteilchen-„Scars“ lassen Quantensysteme länger außerhalb des Gleichgewichtszustandes verweilen. Studie wurde in Nature Physics veröffentlicht

Forschern der Harvard Universität und des MIT war es vor kurzem gelungen, eine Rekordzahl von 53 Atomen einzufangen und ihren Quantenzustand einzeln zu...

Im Focus: Explanation for puzzling quantum oscillations has been found

So-called quantum many-body scars allow quantum systems to stay out of equilibrium much longer, explaining experiment | Study published in Nature Physics

Recently, researchers from Harvard and MIT succeeded in trapping a record 53 atoms and individually controlling their quantum state, realizing what is called a...

Alle Focus-News des Innovations-reports >>>

Anzeige

Anzeige

VideoLinks
Industrie & Wirtschaft
Veranstaltungen

48V im Fokus!

21.05.2018 | Veranstaltungen

„Data Science“ – Theorie und Anwendung: Internationale Tagung unter Leitung der Uni Paderborn

18.05.2018 | Veranstaltungen

Visual-Computing an Bord der MS Wissenschaft

17.05.2018 | Veranstaltungen

VideoLinks
Wissenschaft & Forschung
Weitere VideoLinks im Überblick >>>
 
Aktuelle Beiträge

48V im Fokus!

21.05.2018 | Veranstaltungsnachrichten

Bose-Einstein-Kondensat im Riesenatom - Universität Stuttgart untersucht exotisches Quantenobjekt

18.05.2018 | Physik Astronomie

Countdown für Kilogramm, Kelvin und Co.

18.05.2018 | Physik Astronomie

Weitere B2B-VideoLinks
IHR
JOB & KARRIERE
SERVICE
im innovations-report
in Kooperation mit academics