Forum für Wissenschaft, Industrie und Wirtschaft

Hauptsponsoren:     3M 
Datenbankrecherche:

 

Berechenbare Sprache – Wie künstliche Stimmen menschlicher klingen

13.12.2012
Was macht eine menschliche Stimme aus? Bernd Möbius entschlüsselt die gesprochene Sprache, um herauszufinden, wie künstliche Stimmen mehr Charakter, mehr „menschlichen Touch“ bekommen.

Hierzu übersetzt der Saarbrücker Professor für Phonetik und Phonologie Laute in Zahlen und sucht und glättet Störstellen mit einem Rechenverfahren. Ziel ist ein selbstlernendes mathematisches Modell der menschlichen Sprache, das es möglich macht, jedem beliebigen Gegenstand jede beliebige Stimme zu verleihen – ohne künstlich zu klingen.

„Den habe ich mir ganz anders vorgestellt“ - das Phänomen tritt zu Tage bei Radiomoderatoren oder Leuten, die bisher nur am Telefon miteinander zu tun hatten: Wer Menschen ausschließlich von ihrer Stimme her kennt, macht sich ein bestimmtes Bild. Da kann eine junge Frau älter wirken, ein kräftiger Mann dünner oder ein blonder Haarträger eher dunkelhaarig. Menschliche Stimmen wecken die Phantasie. „Betrachtet man die Hirntätigkeit beim Hören, ruft eine natürliche Stimme Aktivität in Arealen hervor, die für Gefühle und Assoziationen verantwortlich sind. Bei der klassischen Computerstimme ist das anders. Hört der Mensch eine künstliche Stimme bleiben diese Areale stumm“, erläutert Professor Bernd Möbius, Saarbrücker Experte für Sprachproduktion.

Zwar sind moderne Computerstimmen in Auskunfts- oder Dialogsystemen vom blechernen Klang der abgehackten Wörter ohne Betonung bereits weit entfernt. Trotzdem hört das verwöhnte und seit jeher auf Stimmen spezialisierte menschliche Ohr die feinen Unterschiede, ob Mensch oder Maschine spricht. Werden Sätze aus Laut- und Wortschnipseln zusammengesetzt, entlarvt es selbst feinste Sprünge sofort. Fließende Sprachmelodien und sonstige Eigenheiten machen den besonderen Charakter natürlicher Stimmen aus. Fehlen sie, klingt die Stimme künstlich – und sie weckt auch keinerlei Gefühl.

Bernd Möbius forscht daran, diese Charakteristika der menschlichen Stimme herauszufinden, um sie in künstliche Stimmen hineinzurechnen und Sprungstellen und Störfaktoren aus ihnen herauszuholen. „Der Hörer soll sich eine Person hinter der Stimme vorstellen“, sagt er.

Hierzu begibt sich der Forscher mit seinem Team gewissermaßen auf die mikroskopische Ebene und betrachtet die Sprache in ihren kleinsten Einzelteilen. Zugrunde liegt ein digitalisierter Textkorpus, den ein Sprecher im Tonstudio eingesprochen hat. Die Phonetiker verwenden unter anderem die so genannte „Diphonsynthese“. Ein Diphon ist ein kurzer Sprach-Abschnitt, der in der Mitte eines Lautsegments beginnt und in der Mitte des folgenden Lautsegments endet. „Unsere Sprache kennt 45 Laute und etwa 2000 Diphone, jedes davon ist etwa 100 Millisekunden lang. Mit diesem Instrumentarium können wir auf lautlicher Ebene die gesamte Sprache abdecken“, erläutert Möbius.

In den Diphonen liegen die größten Probleme der künstlichen Stimmen verborgen: Sie enthalten etwa den Übergang zwischen den Lauten – winzige Schallsegmente, die bei der Verknüpfung der Sprachbausteine die verräterischen Sprünge hinterlassen. Diese Übergänge verkettet Möbius neu und glättet sie auf diese Weise, wodurch unstete Holperer und Sprungstellen aus der Computersprache verschwinden. „Anzahl und Häufigkeit der Übergänge lassen sich außerdem verringern, wenn es gelingt, längere Bausteine wie Silben oder ganze Wörter, die in den Sprachaufnahmen bereits verfügbar sind, wieder zu verwenden“, erklärt er. Die optimierten Sprachbausteine lassen sich in allen erdenklichen Kombinationsmöglichkeiten völlig neu zusammensetzen. Mit dieser künstlichen, aber natürlich klingenden Sprache lassen sich beliebige Äußerungen mit unbeschränktem Wortschatz erzeugen.

Das mathematische Sprachsynthese-Modell ist unabhängig von der Stimme des ursprünglichen Sprechers – dadurch ist es auf jede beliebige Stimme übertragbar. Hieraus ergeben sich in Zukunft neben den üblichen Anwendungen in Dialog- oder Auskunftssystemen auch neue Möglichkeiten in der Medizin: „Menschen, die ihre Stimme etwa durch eine Kehlkopfoperation verlieren, könnten so in nicht ferner Zukunft mit einer künstlich erzeugten Stimme sprechen, die wie ihre eigene, natürliche klingt“, stellt Möbius in Aussicht. Die Betroffenen müssten hierfür lediglich ihre Stimme im Tonstudio konservieren, wobei bereits relativ wenig „Sprach-Material“ ausreichen würde – das System könnte den Rest berechnen.

Bei seiner Forschung arbeitet Möbius an der Universität des Saarlandes unter anderem mit Computer- und Psycholinguisten sowie mit Informatikern im Exzellenzcluster „Multimodal Computing and Interaction“ und am Deutschen Forschungszentrum für Künstliche Intelligenz (DFKI) zusammen.

Prof. Dr. Bernd Möbius: Tel.: 0681 / 302-4500;
E-Mail: moebius@coli.uni-saarland.de
http://www.coli.uni-saarland.de/~moebius/
Hinweis für Hörfunk-Journalisten: Sie können Telefoninterviews in Studioqualität mit Wissenschaftlern führen, über Rundfunk-Codec (IP-Verbindung). Interviewwünsche bitte an die Pressestelle (0681/302-2601) richten.

Claudia Ehrlich |
Weitere Informationen:
http://www.coli.uni-saarland.de/~moebius/
http://www.uni-saarland.de

Weitere Nachrichten aus der Kategorie Informationstechnologie:

nachricht Weg zu einer intelligenten vernetzten Produktion
22.07.2016 | Fraunhofer-Institut für Produktionstechnik und Automatisierung IPA

nachricht Soziale Roboter – programmierbar für jedermann
20.07.2016 | Universität Luxemburg - Université du Luxembourg

Alle Nachrichten aus der Kategorie: Informationstechnologie >>>

Die aktuellsten Pressemeldungen zum Suchbegriff Innovation >>>

Die letzten 5 Focus-News des innovations-reports im Überblick:

Im Focus: Forschen in 15 Kilometern Höhe - Einsatz des Flugzeuges HALO wird weiter gefördert

Das moderne Höhen-Forschungsflugzeug HALO (High Altitude and Long Range Research Aircraft) wird auch in Zukunft für Projekte zur Atmosphären- und Erdsystemforschung eingesetzt werden können: Die Deutsche Forschungsgemeinschaft (DFG) bewilligte jetzt Fördergelder von mehr als 11 Millionen Euro für die nächste Phase des HALO Schwerpunktprogramms (SPP 1294) in den kommenden drei Jahren. Die Universität Leipzig ist neben der Goethe-Universität Frankfurt am Main und der Technischen Universität Dresden federführend bei diesem DFG-Schwerpunktprogramm.

Die Universität Leipzig wird von der Fördersumme knapp 6 Millionen Euro zur Durchführung von zwei Forschungsprojekten mit HALO sowie zur Deckung der hohen...

Im Focus: Mapping electromagnetic waveforms

Munich Physicists have developed a novel electron microscope that can visualize electromagnetic fields oscillating at frequencies of billions of cycles per second.

Temporally varying electromagnetic fields are the driving force behind the whole of electronics. Their polarities can change at mind-bogglingly fast rates, and...

Im Focus: Rekord in der Hochdruckforschung: 1 Terapascal erstmals erreicht und überschritten

Einem internationalen Forschungsteam um Prof. Dr. Natalia Dubrovinskaia und Prof. Dr. Leonid Dubrovinsky von der Universität Bayreuth ist es erstmals gelungen, im Labor einen Druck von 1 Terapascal (= 1.000.000.000.000 Pascal) zu erzeugen. Dieser Druck ist dreimal höher als der Druck, der im Zentrum der Erde herrscht. Die in 'Science Advances' veröffentlichte Studie eröffnet neue Forschungsmöglichkeiten für die Physik und Chemie der Festkörper, die Materialwissenschaft, die Geophysik und die Astrophysik.

Extreme Drücke und Temperaturen, die im Labor mit hoher Präzision erzeugt und kontrolliert werden, sind ideale Voraussetzungen für die Physik, Chemie und...

Im Focus: Graphen von der Rolle: Serienfertigung von Elektronik aus 2D-Nanomaterialien

Graphen, Kohlenstoff in zweidimensionaler Struktur, wird seit seiner Entdeckung im Jahr 2004 als ein möglicher Werkstoff der Zukunft gehandelt: Sein geringes Gewicht, die extreme Festigkeit, vor allem aber seine hohe thermische und elektrische Leitfähigkeit wecken Hoffnungen, Graphen bald für vollkommen neue Geräte und Technologien einsetzen zu können. Einen ersten Schritt gehen jetzt die Forscher im EU-Forschungsprojekt »HEA2D«: Ziel ist es, das 2D-Nanomaterial von einer Kupferfolie durch ein Rolle-zu-Rolle-Verfahren auf Kunststofffolien und -bauteile zu übertragen. Auf diese Weise soll eine Serienfertigung elektronischer und opto-elektronischer Komponenten auf Graphenbasis möglich werden.

Besonders interessiert an hochleistungsfähiger Elektronik aus 2D-Materialien ist die Automobilindustrie, die diese in Schaltern mit transparenten Leiterbahnen,...

Im Focus: Menschen können einzelnes Photon sehen

Forscher am Wiener Institut für Molekulare Pathologie (IMP) und an der Rockefeller University in New York wiesen erstmals nach, dass Menschen ein einzelnes Photon wahrnehmen können. Für ihre Experimente verwendeten sie eine Quanten-Lichtquelle und kombinierten sie mit einem ausgeklügelten psycho-physikalischen Ansatz. Das Wissenschaftsjournal “Nature Communications” veröffentlicht die Ergebnisse in seiner aktuellen Ausgabe.

Trotz zahreicher Studien, die seit über siebig Jahren zu diesem Thema durchgeführt wurden, konnte die absolute Untergrenze der menschlichen Sehfähigkeit bisher...

Alle Focus-News des Innovations-reports >>>

Anzeige

Anzeige

IHR
JOB & KARRIERE
SERVICE
im innovations-report
in Kooperation mit academics
Veranstaltungen

Kongress für Molekulare Medizin: Krankheiten interdisziplinär verstehen und behandeln

20.07.2016 | Veranstaltungen

Ultraschnelle Kalorimetrie: Gesellschaft für thermische Analyse GEFTA lädt zur Jahrestagung

19.07.2016 | Veranstaltungen

Das neue Präventionsgesetz aktiv gestalten

19.07.2016 | Veranstaltungen

 
B2B-VideoLinks
Weitere VideoLinks >>>
Aktuelle Beiträge

Eine Kamera für unsichtbare Felder

22.07.2016 | Physik Astronomie

3-D-Analyse von Materialien: Saarbrücker Forscher erhält renommierten US-Preis für sein Lebenswerk

22.07.2016 | Förderungen Preise

Signale der Hirnflüssigkeit steuern das Verhalten von Stammzellen im Gehirn

22.07.2016 | Biowissenschaften Chemie