Computer als Dolmetscher

Manche Technik findet man durch Zufall. Stößt man bei einer Internetsuche auf fremdsprachige Webseiten, so erhält man gelegentlich das Angebot „Diese Seite übersetzen“. Mit ein wenig Phantasie lässt sich aus der häufig nicht perfekten Übersetzung erahnen, was da wohl in fremder Sprache gestanden hat. So kann man sich schon heute mit maschineller Übersetzung schnell und billig einen Überblick verschaffen. Maschinelle Übersetzung bringt also Vorteile für die Wirtschaft, insbesondere für den Mittelstand, aber auch für das politische und kulturelle Zusammenwachsen Europas.

Im vereinigten Europa, in dem es mittlerweile 23 Amtssprachen gibt, aber nur etwa jeder zweite Einwohner eine Fremdsprache hinreichend gut spricht, gäbe es viele Einsatzmöglichkeiten für einen künstlichen Simultanübersetzer. Dazu müsste allerdings nicht Geschriebenes in Geschriebenes übersetzt werden, sondern Gesprochenes in Gesprochenes – eine noch höhere Herausforderung, da sich zur Schwierigkeit der Übersetzung nun noch die Unsicherheit bei der Umsetzung von Sprache in Text (der Spracherkennung) gesellt. Das europäische Forschungsprojekt TC-STAR (Technology and Corpora for Speech to Speech Translation), in dem zwölf internationale Partner kooperieren, arbeitet seit nun fast drei Jahren an diesem Thema.

TC-STAR forscht am Thema des maschinellen Simultandolmetschers, der das gesprochene Wort in eine andere Sprache übersetzt. Als Beispielaufgabe übersetzt der Computer Debatten im Europäischen Parlament vom Englischen ins Spanische und vom Spanischen ins Englische. Das Besondere dabei ist, so Professor Hermann Ney, Inhaber des Lehrstuhls für Informatik 6 der RWTH Aachen, „TC-STAR ist das erste Verbundprojekt, das sich mit der Übersetzung gesprochener Sprache nicht in einer künstlichen kleinen Domäne beschäftigt, sondern in einer unbeschränkten Domäne.“ So reichen die Themen nicht nur von Fischereifragen zu Frauenrechten, sondern sie können sich auch aus aktuellem Anlass verschieben – etwa aus Anlass der Klimadebatte. Die Wissenschaftler bringen dem Computer dabei nur bei, wie er aus gegebenen Daten – Sprachaufnahmen, Aussprachewörterbüchern, vorliegenden übersetzten Texten – Wissen über die Sprache erwirbt, also lernt; aber was er lernt, das ergibt sich aus den vorliegenden Sprachdaten. So ist es denn auch möglich, ein System für die Übersetzung vom Englischen ins Spanische mit geringen Anpassungen und natürlich den geeigneten Daten für die Übersetzung vom Arabischen ins Englische fit zu machen.

Zum Abschluss des Projektes treffen sich die Experten vom 28.-30. März noch einmal zu einem Workshop an der RWTH Aachen und besprechen unter Beteiligung externer Forschungsgruppen unter anderem aus USA, Japan und China die Ergebnisse der alljährlichen Evaluierung. Dabei werden die beteiligten Systeme und Verfahren systematisch und objektiv bewertet, Fehler gezählt und ausgewertet. Ein bisschen Wettkampfstimmung liegt auch in der Luft, aber das wesentliche Ziel der Evaluierung liegt darin, unter den vielen Ansätzen die erfolgreichsten zu identifizieren – die werden dann nämlich von den anderen Forschungsgruppen übernommen, um das Innovationstempo zu steigern. Die objektive Bewertung hat auch Vorteile für die Geldgeber des Projekts, an dem sich mit etwa 11 Millionen Euro die Europäische Union und mit etwa 7 Millionen Euro international führende Technologieunternehmen wie IBM, Siemens, Nokia und Sony beteiligt haben. Unter den wissenschaftlichen Institute und Universitäten sind in Deutschland die RWTH Aachen und die Universität Karlsruhe beteiligt. Der Gastgeber des Workshops, der Lehrstuhl für Informatik 6 der RWTH unter Leitung von Professor Hermann Ney, hat sich vor allem auf die Themenfelder Spracherkennung und maschinelle Übersetzung spezialisiert.

Trotz der deutlichen Fortschritte in der Sprachtechnologie brauchen professionelle Übersetzer übrigens keine Konkurrenz zu fürchten, zumindest für die nächsten ein bis zwei Jahrzehnte. Sie arbeiten in Bereichen, in denen es auf genaues Übersetzen und auf sprachliche Feinheiten ankommt, eine Grobübersetzung also nicht ausreicht. Im Gegenzug werden sich maschinelle Übersetzungen in Bereichen etablieren, in denen man bislang auf eine Übersetzung aus Zeit- und Kostengründen schlicht verzichten musste.

Wer sich für diese Thematik interessiert, sei auf den über das Portal der Europäischen Union erhältlichen Report „Sprachtechnologien für Europa“ hingewiesen, der die Fragestellung kurzweilig und kompetent abhandelt.

Weitere Informationen über das TC-STAR-Projekt gibt es unter www-i6.informatik.rwth-aachen.de und www.tc-star.org sowie bei Volker Steinbiß unter der Telefonnummer 0179-6679918 oder per E-Mail an steinbiss@informatik.rwth-aachen.de . Über ihn kann auch die Druckausgabe des Reports „Human Language Technologies for Europe“ bestellt werden. Den Report gibt es im Internet unter http://europa.eu/languages/de/document/88.

Ansprechpartner für Medien

Thomas von Salzen idw

Alle Nachrichten aus der Kategorie: Seminare Workshops

Zurück zur Startseite

Kommentare (0)

Schreib Kommentar

Neueste Beiträge

Optisch aktive Defekte verbessern Kohlenstoffnanoröhrchen

Heidelberger Wissenschaftlern gelingt Defekt-Kontrolle durch neuen Reaktionsweg. Mit bewusst erzeugten strukturellen „Fehlstellen“ oder Defekten lassen sich die Eigenschaften von kohlenstoffbasierten Nanomaterialien verändern und verbessern. Dabei stellt es jedoch eine besondere…

Spritzguss von Glas

Freiburger Forschenden gelingt schnelle, kostengünstige und umweltfreundliche Materialfertigung. Von Hightech-Produkten im Bereich Optik, Telekommunikation, Chemie und Medizin bis hin zu alltäglichen Gegenständen wie Flaschen und Fenstern – Glas ist allgegenwärtig….

Radikalischer Angriff auf lebende Zellen

Durch Mikrofluidik gezielt die Oberfläche von Zellen mit freien Radikalen stimulieren. Lassen sich kleine, abgegrenzte Bereiche auf der Zellmembran chemisch manipulieren? Mit einer raffinierten mikrofluidischen Sonde haben Wissenschaftler:innen Zellen gezielt…

Partner & Förderer