Bonner Forscher wollen automatische Sprachsynthese verbessern

Sanft, nüchtern, perfekt und gerade deshalb umso gruseliger: So sprach der Bordcomputer „HAL“ im Stanley Kubricks Film „2001 Space Odyssee“ zur todgeweihten Crew des von ihm gesteuerten Raumschiffs. Doch in der Realität sind selbst die heutigen Supercomputer noch sprachliche Stümper. Am Institut für Kommunikation und Phonetik (IKP) der Universität Bonn versuchen Ingenieure, Informatiker und Sprachwissenschaftler, Rechnern das Reden beizubringen.

„Grüß Gott, Frau Brenner“, sagt Michael, „schön, dass wir uns treffen.“ Sympathische Stimme, ein leichter Dialekt, aber schwer einzuordnen – vielleicht ein gebürtiger Hesse? „Wir wollten doch noch einen Termin für unsere Geschäftsreise nach Hannover vereinbaren.“ Jetzt hört er sich an, als habe er ein Gläschen Kölsch zuviel gehabt – die Betonung mitunter an die falsche Stelle gerutscht, die Silben ein wenig verschliffen. „Stimmt“, bestätigt Karlheinz Stöber (korrekte Betonung, kein Dialekt), „der Michael klingt immer, als würde man mit ihm beim Bier zusammensitzen.“

„Der Michael“ aus Fleisch und Blut redet nämlich sehr begeistert und emotional. Ein paar Stunden hat Michael dem Computer auf Stöbers Schreibtisch vorgelesen. Dann hat der Rechner die Sprachdaten analysiert und automatisch in kleine Laut-Atome zerhackt. Und wenn er die zu neuen Worten und Sätzen aneinanderreiht, dann klingt das, nun ja, ein wenig angeheitert. Entsprechend nüchtern klingt Stöbers Analyse: „Die automatische Sprachverarbeitung befindet sich trotz großer Fortschritte immer noch am Anfang ihrer Entwicklung.“ Das Institut für Kommunikation und Phonetik an der Universität Bonn, vor 81 Jahren als „phonetisches Kabinett“ gegründet, will künstliche Sprecher künftig ein wenig natürlicher klingen lassen.

Bereits 1988 hat der japanische Wissenschaftler Yoshinori Sagisaka mit der non uniform unit selection einen Ansatz vorgeschlagen, den auch die Bonner Forscher verfolgen. Sie katalogisieren sämtliche Laute in einem Satz und kleben ihnen ein Etikett auf, auf dem Zusatzinformationen wie die Länge oder die Position im Satzgefüge vermerkt sind. Die Datenbank umfasst dann beispielsweise hundert Variationen des Lautes „au“, jeweils in unterschiedlicher Länge oder verschieden betont. Bei der Sprachsynthese sucht der Computer dann anhand des Etiketts das am besten passenden „au“ aus – im Satz „Wie siehst du denn aus?“ beispielsweise das „au“ mit dem Etikett „Satzende, Frage“.

Derzeit sind die Forscher noch auf der Suche nach dem theoretischen Fundament dieser relativ neuen Technik. Da so mancher Laut bis zu 14.000 mal in der Datenbank auftaucht und jeder Satz aus Dutzenden bis Hunderten von Lauten besteht, ist diese Synthesemethode zudem ziemlich zeitaufwendig. „Wir schauen daher zuerst einmal nach, ob vielleicht das komplette Wort in der passenden Betonung in unserem Datenbestand abgespeichert ist“, erklärt Stöber.

Die non uniform unit selection ist noch nicht der Weisheit letzter Schluss. Wie soll zum Beispiel ein Computerprogramm erkennen, dass in dem Satz „Ich liebe dich“ das „dich“ ganz anders betont wird, wenn sich die Sprecherin mit diesem Satz für einen von zwei Rivalen entscheidet? „Als Nahziel würde es uns schon reichen, einen Vorleseautomaten zu konstruieren, der sich so emotionslos anhört wie ein Nachrichtensprecher“, erklärt Karlheinz Stöber. Er und seine Kollegen haben mit dem automatischen Übersetzer „Verbmobil“ bereits gezeigt, dass das keine Utopie sein muss – Verbmobil-Koordinator Professor Dr. Wolfgang Wahlster aus Saarbrücken wurde dafür im letzten Jahr sogar mit dem Innovationspreis des Bundespräsidenten ausgezeichnet. „Wer allerdings will, dass der Wetterbericht so munter klingt wie von Jörg Kachelmann, muss halt zu Kachelmann umschalten.“

Ansprechpartner: Professor Dr. Wolfgang Hess, Tel.: 0228/73-5638, Fax: 0228/73-5639, E-Mail: wgh@ikp.uni-bonn.de

Detailliertere Informationen zur Sprachforschung in Bonn finden sich in der aktuellen Ausgabe der Bonner Universitätsnachrichten „forsch“, die ab dem 26. April an der Universität ausliegt oder über die Pressestelle zu beziehen ist. Weitere Themen: Ende der Lehrerausbildung in Bonn, Liebesleben der Bienen, Boomfach Medienwissenschaften, Radiomacher an der Uni Bonn – und dazu jede Menge Tipps und Termine rund um den Bonner Uni-Sommer

Media Contact

Frank Luerweg idw

Alle Nachrichten aus der Kategorie: Informationstechnologie

Neuerungen und Entwicklungen auf den Gebieten der Informations- und Datenverarbeitung sowie der dafür benötigten Hardware finden Sie hier zusammengefasst.

Unter anderem erhalten Sie Informationen aus den Teilbereichen: IT-Dienstleistungen, IT-Architektur, IT-Management und Telekommunikation.

Zurück zur Startseite

Kommentare (0)

Schreib Kommentar

Neueste Beiträge

Nanowirbel mit besonderer Eigenschaft

In manchen magnetischen Materialien lassen sich wirbelförmige Nano-Strukturen erzeugen: sogenannte Skyrmionen. Forschende am PSI haben nun erstmals antiferromagnetische Skyrmionen erschaffen und nachgewiesen. Ihre Besonderheit: In ihnen sind entscheidende Bausteine gegenläufig…

Meeresspiegelanstieg: Stabilitäts-Check der Antarktis offenbart enorme Risiken

Je wärmer es wird, desto rascher verliert die Antarktis an Eis – und viel davon wohl für immer. Dies hat ein Team des Potsdam-Instituts für Klimafolgenforschung, der Columbia University und…

In Wäldern nicht aufräumen

Bitte nicht stören: Nach Waldbränden, Borkenkäferbefall oder anderen Schädigungen sollte in den betroffenen Wäldern nicht aufgeräumt werden. Das schreibt ein Forschungsteam in „Nature Communications“. Stürme, Brände, Borkenkäfer: Weltweit sind viele…

By continuing to use the site, you agree to the use of cookies. more information

The cookie settings on this website are set to "allow cookies" to give you the best browsing experience possible. If you continue to use this website without changing your cookie settings or you click "Accept" below then you are consenting to this.

Close