Forum für Wissenschaft, Industrie und Wirtschaft

Hauptsponsoren:     3M 
Datenbankrecherche:

 

Berechenbare Sprache – Wie künstliche Stimmen menschlicher klingen

13.12.2012
Was macht eine menschliche Stimme aus? Bernd Möbius entschlüsselt die gesprochene Sprache, um herauszufinden, wie künstliche Stimmen mehr Charakter, mehr „menschlichen Touch“ bekommen.

Hierzu übersetzt der Saarbrücker Professor für Phonetik und Phonologie Laute in Zahlen und sucht und glättet Störstellen mit einem Rechenverfahren. Ziel ist ein selbstlernendes mathematisches Modell der menschlichen Sprache, das es möglich macht, jedem beliebigen Gegenstand jede beliebige Stimme zu verleihen – ohne künstlich zu klingen.

„Den habe ich mir ganz anders vorgestellt“ - das Phänomen tritt zu Tage bei Radiomoderatoren oder Leuten, die bisher nur am Telefon miteinander zu tun hatten: Wer Menschen ausschließlich von ihrer Stimme her kennt, macht sich ein bestimmtes Bild. Da kann eine junge Frau älter wirken, ein kräftiger Mann dünner oder ein blonder Haarträger eher dunkelhaarig. Menschliche Stimmen wecken die Phantasie. „Betrachtet man die Hirntätigkeit beim Hören, ruft eine natürliche Stimme Aktivität in Arealen hervor, die für Gefühle und Assoziationen verantwortlich sind. Bei der klassischen Computerstimme ist das anders. Hört der Mensch eine künstliche Stimme bleiben diese Areale stumm“, erläutert Professor Bernd Möbius, Saarbrücker Experte für Sprachproduktion.

Zwar sind moderne Computerstimmen in Auskunfts- oder Dialogsystemen vom blechernen Klang der abgehackten Wörter ohne Betonung bereits weit entfernt. Trotzdem hört das verwöhnte und seit jeher auf Stimmen spezialisierte menschliche Ohr die feinen Unterschiede, ob Mensch oder Maschine spricht. Werden Sätze aus Laut- und Wortschnipseln zusammengesetzt, entlarvt es selbst feinste Sprünge sofort. Fließende Sprachmelodien und sonstige Eigenheiten machen den besonderen Charakter natürlicher Stimmen aus. Fehlen sie, klingt die Stimme künstlich – und sie weckt auch keinerlei Gefühl.

Bernd Möbius forscht daran, diese Charakteristika der menschlichen Stimme herauszufinden, um sie in künstliche Stimmen hineinzurechnen und Sprungstellen und Störfaktoren aus ihnen herauszuholen. „Der Hörer soll sich eine Person hinter der Stimme vorstellen“, sagt er.

Hierzu begibt sich der Forscher mit seinem Team gewissermaßen auf die mikroskopische Ebene und betrachtet die Sprache in ihren kleinsten Einzelteilen. Zugrunde liegt ein digitalisierter Textkorpus, den ein Sprecher im Tonstudio eingesprochen hat. Die Phonetiker verwenden unter anderem die so genannte „Diphonsynthese“. Ein Diphon ist ein kurzer Sprach-Abschnitt, der in der Mitte eines Lautsegments beginnt und in der Mitte des folgenden Lautsegments endet. „Unsere Sprache kennt 45 Laute und etwa 2000 Diphone, jedes davon ist etwa 100 Millisekunden lang. Mit diesem Instrumentarium können wir auf lautlicher Ebene die gesamte Sprache abdecken“, erläutert Möbius.

In den Diphonen liegen die größten Probleme der künstlichen Stimmen verborgen: Sie enthalten etwa den Übergang zwischen den Lauten – winzige Schallsegmente, die bei der Verknüpfung der Sprachbausteine die verräterischen Sprünge hinterlassen. Diese Übergänge verkettet Möbius neu und glättet sie auf diese Weise, wodurch unstete Holperer und Sprungstellen aus der Computersprache verschwinden. „Anzahl und Häufigkeit der Übergänge lassen sich außerdem verringern, wenn es gelingt, längere Bausteine wie Silben oder ganze Wörter, die in den Sprachaufnahmen bereits verfügbar sind, wieder zu verwenden“, erklärt er. Die optimierten Sprachbausteine lassen sich in allen erdenklichen Kombinationsmöglichkeiten völlig neu zusammensetzen. Mit dieser künstlichen, aber natürlich klingenden Sprache lassen sich beliebige Äußerungen mit unbeschränktem Wortschatz erzeugen.

Das mathematische Sprachsynthese-Modell ist unabhängig von der Stimme des ursprünglichen Sprechers – dadurch ist es auf jede beliebige Stimme übertragbar. Hieraus ergeben sich in Zukunft neben den üblichen Anwendungen in Dialog- oder Auskunftssystemen auch neue Möglichkeiten in der Medizin: „Menschen, die ihre Stimme etwa durch eine Kehlkopfoperation verlieren, könnten so in nicht ferner Zukunft mit einer künstlich erzeugten Stimme sprechen, die wie ihre eigene, natürliche klingt“, stellt Möbius in Aussicht. Die Betroffenen müssten hierfür lediglich ihre Stimme im Tonstudio konservieren, wobei bereits relativ wenig „Sprach-Material“ ausreichen würde – das System könnte den Rest berechnen.

Bei seiner Forschung arbeitet Möbius an der Universität des Saarlandes unter anderem mit Computer- und Psycholinguisten sowie mit Informatikern im Exzellenzcluster „Multimodal Computing and Interaction“ und am Deutschen Forschungszentrum für Künstliche Intelligenz (DFKI) zusammen.

Prof. Dr. Bernd Möbius: Tel.: 0681 / 302-4500;
E-Mail: moebius@coli.uni-saarland.de
http://www.coli.uni-saarland.de/~moebius/
Hinweis für Hörfunk-Journalisten: Sie können Telefoninterviews in Studioqualität mit Wissenschaftlern führen, über Rundfunk-Codec (IP-Verbindung). Interviewwünsche bitte an die Pressestelle (0681/302-2601) richten.

Claudia Ehrlich |
Weitere Informationen:
http://www.coli.uni-saarland.de/~moebius/
http://www.uni-saarland.de

Weitere Nachrichten aus der Kategorie Informationstechnologie:

nachricht Maschinenmängel schnell und vollständig kommunizieren
23.05.2016 | Fraunhofer-Institut für Produktionstechnik und Automatisierung IPA

nachricht Staus auf den Datenautobahnen des Internets: Lässt sich das verhindern?
11.05.2016 | Universität Bremen

Alle Nachrichten aus der Kategorie: Informationstechnologie >>>

Die aktuellsten Pressemeldungen zum Suchbegriff Innovation >>>

Die letzten 5 Focus-News des innovations-reports im Überblick:

Im Focus: Computational High-Throughput-Screening findet neue Hartmagnete die weniger Seltene Erden enthalten

Für Zukunftstechnologien wie Elektromobilität und erneuerbare Energien ist der Einsatz von starken Dauermagneten von großer Bedeutung. Für deren Herstellung werden Seltene Erden benötigt. Dem Fraunhofer-Institut für Werkstoffmechanik IWM in Freiburg ist es nun gelungen, mit einem selbst entwickelten Simulationsverfahren auf Basis eines High-Throughput-Screening (HTS) vielversprechende Materialansätze für neue Dauermagnete zu identifizieren. Das Team verbesserte damit die magnetischen Eigenschaften und ersetzte gleichzeitig Seltene Erden durch Elemente, die weniger teuer und zuverlässig verfügbar sind. Die Ergebnisse wurden im Online-Fachmagazin »Scientific Reports« publiziert.

Ausgangspunkt des Projekts der IWM-Forscher Wolfgang Körner, Georg Krugel und Christian Elsässer war eine Neodym-Eisen-Stickstoff-Verbindung, die auf einem...

Im Focus: University of Queensland: In weniger als 2 Stunden ans andere Ende der Welt reisen

Ein internationales Forschungsteam, darunter Wissenschaftler der University of Queensland, hat im Süden Australiens einen erfolgreichen Hyperschallgeschwindigkeitstestflug absolviert und damit futuristische Reisemöglichkeiten greifbarer gemacht.

Flugreisen von London nach Sydney in unter zwei Stunden werden, dank des HiFiRE Programms, immer realistischer. Im Rahmen dieses Projekts werden in den...

Im Focus: Computational high-throughput screening finds hard magnets containing less rare earth elements

Permanent magnets are very important for technologies of the future like electromobility and renewable energy, and rare earth elements (REE) are necessary for their manufacture. The Fraunhofer Institute for Mechanics of Materials IWM in Freiburg, Germany, has now succeeded in identifying promising approaches and materials for new permanent magnets through use of an in-house simulation process based on high-throughput screening (HTS). The team was able to improve magnetic properties this way and at the same time replaced REE with elements that are less expensive and readily available. The results were published in the online technical journal “Scientific Reports”.

The starting point for IWM researchers Wolfgang Körner, Georg Krugel, and Christian Elsässer was a neodymium-iron-nitrogen compound based on a type of...

Im Focus: Mit atomarer Präzision: Technologien für die übernächste Chipgeneration

Im Projekt »Beyond EUV« entwickeln die Fraunhofer-Institute für Lasertechnik ILT in Aachen und für angewandte Optik und Feinmechanik IOF in Jena wesentliche Technologien zur Fertigung einer neuen Generation von Mikrochips mit EUV-Strahlung bei 6,7 nm. Die Strukturen sind dann kaum noch dicker als einzelne Atome und ermöglichen besonders hoch integrierte Schaltkreise zum Beispiel für Wearables oder gedankengesteuerte Prothesen.

Gordon Moore formulierte 1965 das später nach ihm benannte Gesetz, wonach sich alle ein bis zwei Jahre die Komplexität integrierter Schaltungen verdoppelt. Er...

Im Focus: Ein negatives Enzym liefert positive Resultate

In den letzten zwanzig Jahren hat die Chemie viele wichtige Instrumente und Verfahren für die Biologie hervorgebracht. Heute können wir Proteine herstellen, die in der Natur bisher nicht vorkommen. Es lassen sich Bilder von Ausschnitten lebender Zellen aufnehmen und sogar einzelne Zellen in lebendigen Tieren beobachten. Diese Woche haben zwei Forschungsgruppen der Universitäten Basel und Genf, die beide dem Nationalen Forschungsschwerpunkt Molecular Systems Engineering angehören, im Forschungsmagazin «ACS Central Science» präsentiert, wie man ein nicht-natürliches Protein designt, das völlig neue Fähigkeiten aufweist.

Proteine sind die Arbeitspferde jeder Zelle. Sie bestehen aus Aminosäurebausteinen, die als Kette verbunden sind, welche sich zu funktionalen Maschinen...

Alle Focus-News des Innovations-reports >>>

Anzeige

Anzeige

IHR
JOB & KARRIERE
SERVICE
im innovations-report
in Kooperation mit academics
Veranstaltungen

DFG unterstützt Kongresse und Tagungen - Juli 2016

25.05.2016 | Veranstaltungen

"European Conference on Modelling and Simulation" an der OTH Regensburg

25.05.2016 | Veranstaltungen

Fachtagung »Magnetwerkstoffe und Seltene Erden«

25.05.2016 | Veranstaltungen

 
B2B-VideoLinks
Weitere VideoLinks >>>
Aktuelle Beiträge

ILA 2016: Additive Produktion ­einsatzfähiger Bauteile durch effiziente Prozessketten

25.05.2016 | Messenachrichten

Reliable in-line inspections of high-strength automotive body parts within seconds

25.05.2016 | Messenachrichten

Wie Zellen Barrieren überwinden

25.05.2016 | Förderungen Preise