Für das Europa der 23 Sprachen: Der Computer lernt das Übersetzen

Im Forschungsprojekt EuroMatrix, das im sechsten Rahmenprogramm der Europäischen Union mit 2,5 Millionen Euro gefördert wird, sollen technologische Durchbrüche in der automatischen Übersetzung erzielt werden: Neue Kombinationen der besten bestehenden Übersetzungsverfahren sollen hierfür getestet und optimiert werden. Das auf 30 Monate angelegte Vorhaben wird Systeme für Übersetzungen zwischen den 23 Amtssprachen der EU-Länder entwickeln. Es wird von Prof. Hans Uszkoreit koordiniert, der an der Saar-Uni Computerlinguistik lehrt.

Von Jahr zu Jahr wachsen Zahl und Umfang der Übersetzungen in Wirtschaft, Verwaltung, Politik und Kultur. Hauptauftraggeber sind exportorientierte Wirtschaftszweige, internationale Organisationen einschließlich der Europäischen Union und der Vereinten Nationen sowie multinationale Unternehmen. Der explodierende Bedarf an Textübersetzungen gehört zu den direkten Folgen von Handelsfreiheit, Globalisierung, europäischer Integration und internationaler Zusammenarbeit. Das Heer der Übersetzer wächst. Mit dem allgemeinen Trend zur Spezialisierung wachsen aber auch die Anforderungen an die Fähigkeiten der Fachübersetzer. So steigen denn auch die Kosten für qualitativ akzeptable Übersetzungen. Technische und juristische Übersetzungen zwischen den Sprachen der EU zum Beispiel kann die Europäische Kommission nicht nach Indien, in die Philippinen oder andere Billiglohnländer auslagern.

Eine Lösung erwartet man von der automatischen Übersetzung, welche nach Meinung vieler Experten langfristig die einzige realistische Lösung zur Bewältigung der Kommunikationsprobleme einer multilingualen Weltgesellschaft darstellt. Sie wird auch von immer mehr Experten als eine notwendige Voraussetzung für die nachhaltige Bewahrung der mannigfaltigen Sprachen und Kulturen unseres Planeten gesehen. Alle Analysten sind sich über den immensen Bedarf an automatischer Übersetzung einig, jedoch gehen die Meinungen über die Möglichkeiten der automatisierten Übertragung von anspruchsvollen Texten stark auseinander. Während viele Experten noch bezweifeln, dass Maschinen brauchbare Übersetzungen liefern können, erzielen einige Unternehmen durch den Einsatz des Computers bereits erhebliche Kosteneinsparungen.

„Die Wahrheit liegt zwar nicht ganz in der Mitte und doch haben beide Seiten auf ihre Weise recht“, so Professor Hans Uszkoreit. Der Saarbrücker Computerlinguistik-Professor und Wissenschaftliche Direktor am Deutschen Forschungszentrum für Künstliche Intelligenz (DFKI) ist Koordinator des EuroMatrix-Projekts. Er betont: „Selbst die völlig veralteten und qualitativ unzureichenden Übersetzungssysteme, die heute sehr begrenzt in Wirtschaft und Verwaltung eingesetzt werden, ermöglichen bereits in großem Umfang Kosten zu sparen.

Der eigentliche Durchbruch der maschinellen Übersetzung steht aber noch bevor.“ Einen Grund für Optimismus liefern nach längerem Stillstand in der Forschung die beeindruckenden Fortschritte der statistischen Übersetzungsverfahren. Diese Verfahren lernen die Übersetzungsmuster aus großen Mengen übersetzter Texte. „Sie sind zwar auch noch weit von der benötigten Perfektion entfernt, werden aber von Jahr zu Jahr besser. Sie machen jedoch andere Fehler als die traditionellen Übersetzungsverfahren, welche mit Regeln arbeiten, die von Linguisten programmiert wurden“, erklärt Uszkoreit.

Eine Lösung sieht der Saarbrücker Sprachtechnologe daher in der geschickten Verbindung der Methoden. Eben hier setzt das internationale Forschungsprojekt EuroMatrix an: Die besten bestehenden Verfahren für regelbasierte und für statistische Übersetzung sollen kombiniert, getestet und optimiert werden. Die Wissenschaftler werden außerdem untersuchen, wie sich statistische Übersetzungsverfahren durch linguistische Methoden verbessern lassen.

Ein wesentlicher Bestandteil des Vorhabens ist auch die Organisation von Wettbewerben zwischen den besten Übersetzungssystemen, zu denen alle Forschungszentren und Firmen aus Europa aber auch aus anderen Teilen der Welt eingeladen sind. „Natürlich wird es nicht möglich sein, alle Sprachpaare gleich gut zu bearbeiten“, so Uszkoreit. „Aber ein praktisches Ergebnis des Projekts wird auch eine ständig fortgeschriebene Bestandsaufnahme des Technologiestandes für die europäischen Sprachen sein.“ Dieser Überblick in Form einer großen tabellarischen Matrix hat dem Projekt den Namen gegeben.

Die Führung des EuroMatrix-Konsortiums liegt bei der Universität des Saarlandes. Sie wird unterstützt durch Dr. Philipp Koehn von der Universität Edinburgh, dem technisch-wissenschaftlichen Koordinator des Projekts. Weitere Partner sind Forschungsgruppen an der Prager Karlsuniversität und dem Zentrum CELCT in Trento. Aus der Industrie beteiligt ist die deutsche Firma GroupWare AG, die ihr LOGOS System ins Projekt einbringt, eines der großen und meistgenutzten kommerziellen Übersetzungssysteme, das im vorletzten Jahr in einer Open-Source Version verfügbar gemacht wurde. Außerdem die Firma Morphologic in Budapest, die digitale Wörterbücher für viele europäische Sprachen hergestellt hat und über ihre eigene Übersetzungstechnologie verfügt.

Hintergrund

Prof. Dr. Hans Uszkoreit zählt zu den führenden deutschen Sprachtechnologen. Der Saarbrücker Computerlinguistik-Professor und Wissenschaftliche Direktor am Deutschen Forschungszentrum für Künstliche Intelligenz (DFKI) arbeitet daran, die Maschinen das Sprache-Verstehen zu lehren. Sein Feld ist die tiefen linguistischen Verarbeitung, also das Eindringen des Sprachverarbeitungsverfahrens in die wirkliche Erkennung von Grammatik und Semantik der Sätze. Auf diesem Gebiet ist Saarbrücken weltweit führend durch Kombination so genannter flacher und tiefer Sprachverarbeitungsverfahren. In zahlreichen Projekten arbeitet Prof. Uszkoreit mit internationalen Partnern aus Wissenschaft und Wirtschaft zusammen, unter anderem mit Universitäten wie Stanford, Tokio, Edinburgh und Cambridge. 2005 eröffnete er in Schanghai ein gemeinsames Forschungslabor der Universität des Saarlandes und der Schanghai Jiao Tong Universität.

Saarbrücken ist neben Edinburgh und Stanford eine der drei Hochburgen auf dem Gebiet der Sprachtechnologie. Die Fäden vieler internationaler Projekte laufen hier zusammen. Auf dem Campus der Universität des Saarlandes ist in einzigartiger Weise fachübergreifendes Know-how konzentriert. Weit über hundert Wissenschaftler aus Sprachwissenschaft und Phonetik, Computerlinguistik und Informatik, Psychologie und Neurowissenschaften arbeiten zusammen: im Sonderforschungsbereich Ressourcenadaptive kognitive Prozesse, im europäischen Graduiertenkolleg Sprachtechnologie und kognitive Systeme, am Deutschen Forschungszentrum für Künstliche Intelligenz, am Max-Planck-Institut für Informatik und auch in mehreren sprachtechnologischen Spin off-Firmen.

Im Zentrum der Projekte stehen die Erforschung der Sprachverarbeitung beim Menschen, die sprachliche Informationsverarbeitung mit dem Computer, der Mensch-Maschine-Dialog und Fragen der Mehrsprachigkeit.

Fragen beantwortet:
Prof. Dr. Hans Uszkoreit
Tel. 0681/302-5282
E-Mail: uszkoreit@coli.uni-saarland.de
Kompetenzzentrum Informatik
Friederike Meyer zu Tittingdorf
Tel. 0681/302-58099
E-Mail: meyer@cs.uni-sb.de

Media Contact

Saar - Uni - Presseteam idw

Weitere Informationen:

http://www.uni-saarland.de

Alle Nachrichten aus der Kategorie: Informationstechnologie

Neuerungen und Entwicklungen auf den Gebieten der Informations- und Datenverarbeitung sowie der dafür benötigten Hardware finden Sie hier zusammengefasst.

Unter anderem erhalten Sie Informationen aus den Teilbereichen: IT-Dienstleistungen, IT-Architektur, IT-Management und Telekommunikation.

Zurück zur Startseite

Kommentare (0)

Schreiben Sie einen Kommentar

Neueste Beiträge

Neues topologisches Metamaterial

… verstärkt Schallwellen exponentiell. Wissenschaftlerinnen und Wissenschaftler am niederländischen Forschungsinstitut AMOLF haben in einer internationalen Kollaboration ein neuartiges Metamaterial entwickelt, durch das sich Schallwellen auf völlig neue Art und Weise…

Astronomen entdecken starke Magnetfelder

… am Rand des zentralen schwarzen Lochs der Milchstraße. Ein neues Bild des Event Horizon Telescope (EHT) hat starke und geordnete Magnetfelder aufgespürt, die vom Rand des supermassereichen schwarzen Lochs…

Faktor für die Gehirnexpansion beim Menschen

Was unterscheidet uns Menschen von anderen Lebewesen? Der Schlüssel liegt im Neokortex, der äußeren Schicht des Gehirns. Diese Gehirnregion ermöglicht uns abstraktes Denken, Kunst und komplexe Sprache. Ein internationales Forschungsteam…

Partner & Förderer