Forum für Wissenschaft, Industrie und Wirtschaft

Hauptsponsoren:     3M 
Datenbankrecherche:

 

Wie der Computer Texte besser verstehen lernt

26.10.2004


Computerlinguisten bei EML Research stellen nutzerfreundliches digitales Werkzeug MMAX zur Annotation von Texten vor - Anwendungsfelder: Dokumentensuche und Wissensextraktion


Der Computer leistet heutzutage viel. Aber die Bedeutung eines Textes kann er nicht verstehen, denn sonst könnte er uns mit einem Mausklick die Zusammenfassung eines Zeitungsartikels liefern. Computerlinguisten arbeiten daran, dass der Rechner das lernt. Sie trainieren ihn mit Texten, die von Hand mit linguistischer und anderer Information angereichert sind. Diese Anreicherung nennt man Annotation. Der Computer kann dann aus den annotierten Texten die Strukturen selbst nachbilden, indem er Regeln automatisch lernt.
Um das mühsame Geschäft der Annotation zu erleichtern und besser reproduzierbar zu machen, haben Wissenschaftler am Forschungsinstitut EML Research in Heidelberg eine spezielle Software entwickelt. Das digitale Werkzeug mit dem Namen "MMAX" wurde kürzlich auf einer internationalen Konferenz in Barcelona dem Fachpublikum vorgestellt. Bislang arbeiten schon fünfzehn Forschungsteams in Europa und den USA mit dem Annotationstool aus Heidelberg.

MMAX ist plattformunabhängig, speichersparend und nutzerfreundlich. Im Gegensatz zu bisherigen Annotationstools kann der Wissenschaftler das Aussehen und die Art der zu vergebenden Kennzeichnungen anpassen, ohne das Programm selbst ändern zu müssen. MMAX integriert aber auch bereits annotierte Texte. Außerdem unterstützt die Software die Annotation bei der Lösung verschiedener linguistischer Probleme, so bei der Analyse eines Zweiergesprächs oder bei der Darstellung von Bezügen innerhalb eines Textes. Ein Beispiel: In den ersten beiden Sätzen dieses Textes wird der Begriff "der Computer" in einer anderen Form, nämlich als "er", wieder aufgenommen. Solche Verweise, sogenannte Anaphern, stellen die maschinelle Sprachverarbeitung bislang vor große Probleme.

"MMAX unterstützt sowohl die sprachwissenschaftliche Forschung als auch die maschinelle Sprachverarbeitung", fasst Dr. Michael Strube, Leiter der Forschungsgruppe Natural Language Processing bei EML Research, zusammen.

Anwendungsgebiete, in denen mit MMAX annotierte Daten verwendet werden können, schließen auch die Extraktion von Wissen aus biologischen Texten und Datenbanken sowie das Aufspüren von Dokumenten (document retrieval) ein.

Die EML Research gGmbH ist ein privates Forschungsinstitut für Grundlagenforschung in der angewandten Informatik. Ein Schwerpunkt der Forschung liegt in der Computerlinguistik. Die Forscher arbeiten eng mit Universitäten im In- und Ausland zusammen zusammen. Die EML Research gGmbH bearbeitet hauptsächlich Forschungsprojekte der Klaus Tschira Stiftung gGmbH (KTS). KTS und EML Research haben ihren Sitz in der Heidelberger Villa Bosch, dem ehemaligen Wohnsitz des Nobelpreisträgers Carl Bosch.

Wissenschaftliche Ansprechpartner:
Dr. Michael Strube
Leiter der Forschungsgruppe Natural Language Processing
EML Research gGmbH
Tel: +49-6221-533-243
Fax: +49-6221-533-298

Christoph Müller
Natural Language Processing
EML Research gGmbH
Tel: +49-6221-533-238
Fax: +49-6221-533-298

Dr. Peter Saueressig | idw
Weitere Informationen:
http://www.eml-research.de
http://mmax.eml-research.de
http://www.kts.villa-bosch.de

Weitere Berichte zu: Annotation Annotationstool Language MMAX

Weitere Nachrichten aus der Kategorie Informationstechnologie:

nachricht Ein stabiles magnetisches Bit aus drei Atomen
21.09.2017 | Sonderforschungsbereich 668

nachricht Drohnen sehen auch im Dunkeln
20.09.2017 | Universität Zürich

Alle Nachrichten aus der Kategorie: Informationstechnologie >>>

Die aktuellsten Pressemeldungen zum Suchbegriff Innovation >>>

Die letzten 5 Focus-News des innovations-reports im Überblick:

Im Focus: The pyrenoid is a carbon-fixing liquid droplet

Plants and algae use the enzyme Rubisco to fix carbon dioxide, removing it from the atmosphere and converting it into biomass. Algae have figured out a way to increase the efficiency of carbon fixation. They gather most of their Rubisco into a ball-shaped microcompartment called the pyrenoid, which they flood with a high local concentration of carbon dioxide. A team of scientists at Princeton University, the Carnegie Institution for Science, Stanford University and the Max Plank Institute of Biochemistry have unravelled the mysteries of how the pyrenoid is assembled. These insights can help to engineer crops that remove more carbon dioxide from the atmosphere while producing more food.

A warming planet

Im Focus: Hochpräzise Verschaltung in der Hirnrinde

Es ist noch immer weitgehend unbekannt, wie die komplexen neuronalen Netzwerke im Gehirn aufgebaut sind. Insbesondere in der Hirnrinde der Säugetiere, wo Sehen, Denken und Orientierung berechnet werden, sind die Regeln, nach denen die Nervenzellen miteinander verschaltet sind, nur unzureichend erforscht. Wissenschaftler um Moritz Helmstaedter vom Max-Planck-Institut für Hirnforschung in Frankfurt am Main und Helene Schmidt vom Bernstein-Zentrum der Humboldt-Universität in Berlin haben nun in dem Teil der Großhirnrinde, der für die räumliche Orientierung zuständig ist, ein überraschend präzises Verschaltungsmuster der Nervenzellen entdeckt.

Wie die Forscher in Nature berichten (Schmidt et al., 2017. Axonal synapse sorting in medial entorhinal cortex, DOI: 10.1038/nature24005), haben die...

Im Focus: Highly precise wiring in the Cerebral Cortex

Our brains house extremely complex neuronal circuits, whose detailed structures are still largely unknown. This is especially true for the so-called cerebral cortex of mammals, where among other things vision, thoughts or spatial orientation are being computed. Here the rules by which nerve cells are connected to each other are only partly understood. A team of scientists around Moritz Helmstaedter at the Frankfiurt Max Planck Institute for Brain Research and Helene Schmidt (Humboldt University in Berlin) have now discovered a surprisingly precise nerve cell connectivity pattern in the part of the cerebral cortex that is responsible for orienting the individual animal or human in space.

The researchers report online in Nature (Schmidt et al., 2017. Axonal synapse sorting in medial entorhinal cortex, DOI: 10.1038/nature24005) that synapses in...

Im Focus: Tiny lasers from a gallery of whispers

New technique promises tunable laser devices

Whispering gallery mode (WGM) resonators are used to make tiny micro-lasers, sensors, switches, routers and other devices. These tiny structures rely on a...

Im Focus: Wundermaterial Graphen: Gewölbt wie das Polster eines Chesterfield-Sofas

Graphen besitzt extreme Eigenschaften und ist vielseitig verwendbar. Mit einem Trick lassen sich sogar die Spins im Graphen kontrollieren. Dies gelang einem HZB-Team schon vor einiger Zeit: Die Physiker haben dafür eine Lage Graphen auf einem Nickelsubstrat aufgebracht und Goldatome dazwischen eingeschleust. Im Fachblatt 2D Materials zeigen sie nun, warum dies sich derartig stark auf die Spins auswirkt. Graphen kommt so auch als Material für künftige Informationstechnologien infrage, die auf der Verarbeitung von Spins als Informationseinheiten basieren.

Graphen ist wohl die exotischste Form von Kohlenstoff: Alle Atome sind untereinander nur in der Ebene verbunden und bilden ein Netz mit sechseckigen Maschen,...

Alle Focus-News des Innovations-reports >>>

Anzeige

Anzeige

IHR
JOB & KARRIERE
SERVICE
im innovations-report
in Kooperation mit academics
Veranstaltungen

11. BusinessForum21-Kongress „Aktives Schadenmanagement"

22.09.2017 | Veranstaltungen

Internationale Konferenz zum Biomining ab Sonntag in Freiberg

22.09.2017 | Veranstaltungen

Die Erde und ihre Bestandteile im Fokus

21.09.2017 | Veranstaltungen

 
VideoLinks
B2B-VideoLinks
Weitere VideoLinks >>>
Aktuelle Beiträge

11. BusinessForum21-Kongress „Aktives Schadenmanagement"

22.09.2017 | Veranstaltungsnachrichten

DFG bewilligt drei neue Forschergruppen und eine neue Klinische Forschergruppe

22.09.2017 | Förderungen Preise

Lebendiges Gewebe aus dem Drucker

22.09.2017 | Biowissenschaften Chemie