Bonner Forscher wollen automatische Sprachsynthese verbessern

Sanft, nüchtern, perfekt und gerade deshalb umso gruseliger: So sprach der Bordcomputer „HAL“ im Stanley Kubricks Film „2001 Space Odyssee“ zur todgeweihten Crew des von ihm gesteuerten Raumschiffs. Doch in der Realität sind selbst die heutigen Supercomputer noch sprachliche Stümper. Am Institut für Kommunikation und Phonetik (IKP) der Universität Bonn versuchen Ingenieure, Informatiker und Sprachwissenschaftler, Rechnern das Reden beizubringen.

„Grüß Gott, Frau Brenner“, sagt Michael, „schön, dass wir uns treffen.“ Sympathische Stimme, ein leichter Dialekt, aber schwer einzuordnen – vielleicht ein gebürtiger Hesse? „Wir wollten doch noch einen Termin für unsere Geschäftsreise nach Hannover vereinbaren.“ Jetzt hört er sich an, als habe er ein Gläschen Kölsch zuviel gehabt – die Betonung mitunter an die falsche Stelle gerutscht, die Silben ein wenig verschliffen. „Stimmt“, bestätigt Karlheinz Stöber (korrekte Betonung, kein Dialekt), „der Michael klingt immer, als würde man mit ihm beim Bier zusammensitzen.“

„Der Michael“ aus Fleisch und Blut redet nämlich sehr begeistert und emotional. Ein paar Stunden hat Michael dem Computer auf Stöbers Schreibtisch vorgelesen. Dann hat der Rechner die Sprachdaten analysiert und automatisch in kleine Laut-Atome zerhackt. Und wenn er die zu neuen Worten und Sätzen aneinanderreiht, dann klingt das, nun ja, ein wenig angeheitert. Entsprechend nüchtern klingt Stöbers Analyse: „Die automatische Sprachverarbeitung befindet sich trotz großer Fortschritte immer noch am Anfang ihrer Entwicklung.“ Das Institut für Kommunikation und Phonetik an der Universität Bonn, vor 81 Jahren als „phonetisches Kabinett“ gegründet, will künstliche Sprecher künftig ein wenig natürlicher klingen lassen.

Bereits 1988 hat der japanische Wissenschaftler Yoshinori Sagisaka mit der non uniform unit selection einen Ansatz vorgeschlagen, den auch die Bonner Forscher verfolgen. Sie katalogisieren sämtliche Laute in einem Satz und kleben ihnen ein Etikett auf, auf dem Zusatzinformationen wie die Länge oder die Position im Satzgefüge vermerkt sind. Die Datenbank umfasst dann beispielsweise hundert Variationen des Lautes „au“, jeweils in unterschiedlicher Länge oder verschieden betont. Bei der Sprachsynthese sucht der Computer dann anhand des Etiketts das am besten passenden „au“ aus – im Satz „Wie siehst du denn aus?“ beispielsweise das „au“ mit dem Etikett „Satzende, Frage“.

Derzeit sind die Forscher noch auf der Suche nach dem theoretischen Fundament dieser relativ neuen Technik. Da so mancher Laut bis zu 14.000 mal in der Datenbank auftaucht und jeder Satz aus Dutzenden bis Hunderten von Lauten besteht, ist diese Synthesemethode zudem ziemlich zeitaufwendig. „Wir schauen daher zuerst einmal nach, ob vielleicht das komplette Wort in der passenden Betonung in unserem Datenbestand abgespeichert ist“, erklärt Stöber.

Die non uniform unit selection ist noch nicht der Weisheit letzter Schluss. Wie soll zum Beispiel ein Computerprogramm erkennen, dass in dem Satz „Ich liebe dich“ das „dich“ ganz anders betont wird, wenn sich die Sprecherin mit diesem Satz für einen von zwei Rivalen entscheidet? „Als Nahziel würde es uns schon reichen, einen Vorleseautomaten zu konstruieren, der sich so emotionslos anhört wie ein Nachrichtensprecher“, erklärt Karlheinz Stöber. Er und seine Kollegen haben mit dem automatischen Übersetzer „Verbmobil“ bereits gezeigt, dass das keine Utopie sein muss – Verbmobil-Koordinator Professor Dr. Wolfgang Wahlster aus Saarbrücken wurde dafür im letzten Jahr sogar mit dem Innovationspreis des Bundespräsidenten ausgezeichnet. „Wer allerdings will, dass der Wetterbericht so munter klingt wie von Jörg Kachelmann, muss halt zu Kachelmann umschalten.“

Ansprechpartner: Professor Dr. Wolfgang Hess, Tel.: 0228/73-5638, Fax: 0228/73-5639, E-Mail: wgh@ikp.uni-bonn.de

Detailliertere Informationen zur Sprachforschung in Bonn finden sich in der aktuellen Ausgabe der Bonner Universitätsnachrichten „forsch“, die ab dem 26. April an der Universität ausliegt oder über die Pressestelle zu beziehen ist. Weitere Themen: Ende der Lehrerausbildung in Bonn, Liebesleben der Bienen, Boomfach Medienwissenschaften, Radiomacher an der Uni Bonn – und dazu jede Menge Tipps und Termine rund um den Bonner Uni-Sommer

Ansprechpartner für Medien

Frank Luerweg idw

Alle Nachrichten aus der Kategorie: Informationstechnologie

Neuerungen und Entwicklungen auf den Gebieten der Informations- und Datenverarbeitung sowie der dafür benötigten Hardware finden Sie hier zusammengefasst.

Unter anderem erhalten Sie Informationen aus den Teilbereichen: IT-Dienstleistungen, IT-Architektur, IT-Management und Telekommunikation.

Zurück zur Startseite

Kommentare (0)

Schreib Kommentar

Neueste Beiträge

Kampf gegen Mikroplastik

Neues Verfahren zur Herstellung von Dämmstoff aus Kunststoffabfällen. Ein Schaumstoff zur akustischen und thermischen Dämmung von Gebäuden, der aus Mikroplastik im Meer gewonnen werden kann: Mit dieser Innovation will der…

Molekulare „Matrjoschka“ löst chemisches Problem

Dreischaliger Nano-Reaktor für die Funktionaisierung von Fulleren. Einem deutsch-katalanischen Forschungsteam ist es erstmals gelungen, eine mehrschalige „Matrjoschka“-Architektur für die chemische Synthese zu verwenden. Die Chemikerinnen und Chemiker aus Ulm und…

Große Moleküle in lebende Zellen transportiert

Forscher erzielen Durchbruch ins Zellinnere … Es ist eine der großen pharmakologischen Fragen: Wie bringt man große funktionale Biomoleküle wie Proteine oder Antikörper in eine Körperzelle? Die Verknüpfung mit zellpenetrierenden…

Partner & Förderer