Forum für Wissenschaft, Industrie und Wirtschaft

Hauptsponsoren:     3M 
Datenbankrecherche:

 

Wie der Computer Texte besser verstehen lernt

26.10.2004


Computerlinguisten bei EML Research stellen nutzerfreundliches digitales Werkzeug MMAX zur Annotation von Texten vor - Anwendungsfelder: Dokumentensuche und Wissensextraktion


Der Computer leistet heutzutage viel. Aber die Bedeutung eines Textes kann er nicht verstehen, denn sonst könnte er uns mit einem Mausklick die Zusammenfassung eines Zeitungsartikels liefern. Computerlinguisten arbeiten daran, dass der Rechner das lernt. Sie trainieren ihn mit Texten, die von Hand mit linguistischer und anderer Information angereichert sind. Diese Anreicherung nennt man Annotation. Der Computer kann dann aus den annotierten Texten die Strukturen selbst nachbilden, indem er Regeln automatisch lernt.
Um das mühsame Geschäft der Annotation zu erleichtern und besser reproduzierbar zu machen, haben Wissenschaftler am Forschungsinstitut EML Research in Heidelberg eine spezielle Software entwickelt. Das digitale Werkzeug mit dem Namen "MMAX" wurde kürzlich auf einer internationalen Konferenz in Barcelona dem Fachpublikum vorgestellt. Bislang arbeiten schon fünfzehn Forschungsteams in Europa und den USA mit dem Annotationstool aus Heidelberg.

MMAX ist plattformunabhängig, speichersparend und nutzerfreundlich. Im Gegensatz zu bisherigen Annotationstools kann der Wissenschaftler das Aussehen und die Art der zu vergebenden Kennzeichnungen anpassen, ohne das Programm selbst ändern zu müssen. MMAX integriert aber auch bereits annotierte Texte. Außerdem unterstützt die Software die Annotation bei der Lösung verschiedener linguistischer Probleme, so bei der Analyse eines Zweiergesprächs oder bei der Darstellung von Bezügen innerhalb eines Textes. Ein Beispiel: In den ersten beiden Sätzen dieses Textes wird der Begriff "der Computer" in einer anderen Form, nämlich als "er", wieder aufgenommen. Solche Verweise, sogenannte Anaphern, stellen die maschinelle Sprachverarbeitung bislang vor große Probleme.

"MMAX unterstützt sowohl die sprachwissenschaftliche Forschung als auch die maschinelle Sprachverarbeitung", fasst Dr. Michael Strube, Leiter der Forschungsgruppe Natural Language Processing bei EML Research, zusammen.

Anwendungsgebiete, in denen mit MMAX annotierte Daten verwendet werden können, schließen auch die Extraktion von Wissen aus biologischen Texten und Datenbanken sowie das Aufspüren von Dokumenten (document retrieval) ein.

Die EML Research gGmbH ist ein privates Forschungsinstitut für Grundlagenforschung in der angewandten Informatik. Ein Schwerpunkt der Forschung liegt in der Computerlinguistik. Die Forscher arbeiten eng mit Universitäten im In- und Ausland zusammen zusammen. Die EML Research gGmbH bearbeitet hauptsächlich Forschungsprojekte der Klaus Tschira Stiftung gGmbH (KTS). KTS und EML Research haben ihren Sitz in der Heidelberger Villa Bosch, dem ehemaligen Wohnsitz des Nobelpreisträgers Carl Bosch.

Wissenschaftliche Ansprechpartner:
Dr. Michael Strube
Leiter der Forschungsgruppe Natural Language Processing
EML Research gGmbH
Tel: +49-6221-533-243
Fax: +49-6221-533-298

Christoph Müller
Natural Language Processing
EML Research gGmbH
Tel: +49-6221-533-238
Fax: +49-6221-533-298

Dr. Peter Saueressig | idw
Weitere Informationen:
http://www.eml-research.de
http://mmax.eml-research.de
http://www.kts.villa-bosch.de

Weitere Berichte zu: Annotation Annotationstool Language MMAX

Weitere Nachrichten aus der Kategorie Informationstechnologie:

nachricht Plattformübergreifende Symbiose von intelligenten Objekten im »Internet of Things« (IoT)
09.12.2016 | Fraunhofer-Institut für Optronik, Systemtechnik und Bildauswertung IOSB

nachricht Von Fußgängern und Fahrzeugen: Uni Ulm und DLR sammeln gemeinsam Daten für das automatisierte Fahren
09.12.2016 | Universität Ulm

Alle Nachrichten aus der Kategorie: Informationstechnologie >>>

Die aktuellsten Pressemeldungen zum Suchbegriff Innovation >>>

Die letzten 5 Focus-News des innovations-reports im Überblick:

Im Focus: Elektronenautobahn im Kristall

Physiker der Universität Würzburg haben an einer bestimmten Form topologischer Isolatoren eine überraschende Entdeckung gemacht. Die Erklärung für den Effekt findet sich in der Struktur der verwendeten Materialien. Ihre Arbeit haben die Forscher jetzt in Science veröffentlicht.

Sie sind das derzeit „heißeste Eisen“ der Physik, wie die Neue Zürcher Zeitung schreibt: topologische Isolatoren. Ihre Bedeutung wurde erst vor wenigen Wochen...

Im Focus: Electron highway inside crystal

Physicists of the University of Würzburg have made an astonishing discovery in a specific type of topological insulators. The effect is due to the structure of the materials used. The researchers have now published their work in the journal Science.

Topological insulators are currently the hot topic in physics according to the newspaper Neue Zürcher Zeitung. Only a few weeks ago, their importance was...

Im Focus: Rätsel um Mott-Isolatoren gelöst

Universelles Verhalten am Mott-Metall-Isolator-Übergang aufgedeckt

Die Ursache für den 1937 von Sir Nevill Francis Mott vorhergesagten Metall-Isolator-Übergang basiert auf der gegenseitigen Abstoßung der gleichnamig geladenen...

Im Focus: Poröse kristalline Materialien: TU Graz-Forscher zeigt Methode zum gezielten Wachstum

Mikroporöse Kristalle (MOFs) bergen große Potentiale für die funktionalen Materialien der Zukunft. Paolo Falcaro von der TU Graz et al zeigen in Nature Materials, wie man MOFs gezielt im großen Maßstab wachsen lässt.

„Metal-organic frameworks“ (MOFs) genannte poröse Kristalle bestehen aus metallischen Knotenpunkten mit organischen Molekülen als Verbindungselemente. Dank...

Im Focus: Gravitationswellen als Sensor für Dunkle Materie

Die mit der Entdeckung von Gravitationswellen entstandene neue Disziplin der Gravitationswellen-Astronomie bekommt eine weitere Aufgabe: die Suche nach Dunkler Materie. Diese könnte aus einem Bose-Einstein-Kondensat sehr leichter Teilchen bestehen. Wie Rechnungen zeigen, würden Gravitationswellen gebremst, wenn sie durch derartige Dunkle Materie laufen. Dies führt zu einer Verspätung von Gravitationswellen relativ zu Licht, die bereits mit den heutigen Detektoren messbar sein sollte.

Im Universum muss es gut fünfmal mehr unsichtbare als sichtbare Materie geben. Woraus diese Dunkle Materie besteht, ist immer noch unbekannt. Die...

Alle Focus-News des Innovations-reports >>>

Anzeige

Anzeige

IHR
JOB & KARRIERE
SERVICE
im innovations-report
in Kooperation mit academics
Veranstaltungen

Firmen- und Forschungsnetzwerk Munitect tagt am IOW

08.12.2016 | Veranstaltungen

NRW Nano-Konferenz in Münster

07.12.2016 | Veranstaltungen

Wie aus reinen Daten ein verständliches Bild entsteht

05.12.2016 | Veranstaltungen

 
VideoLinks
B2B-VideoLinks
Weitere VideoLinks >>>
Aktuelle Beiträge

Hochgenaue Versuchsstände für dynamisch belastete Komponenten – Workshop zeigt Potenzial auf

09.12.2016 | Seminare Workshops

Ein Nano-Kreisverkehr für Licht

09.12.2016 | Physik Astronomie

Pflanzlicher Wirkstoff lässt Wimpern wachsen

09.12.2016 | Biowissenschaften Chemie