Forum für Wissenschaft, Industrie und Wirtschaft

Hauptsponsoren:     3M 
Datenbankrecherche:

 

Wie der Computer Texte besser verstehen lernt

26.10.2004


Computerlinguisten bei EML Research stellen nutzerfreundliches digitales Werkzeug MMAX zur Annotation von Texten vor - Anwendungsfelder: Dokumentensuche und Wissensextraktion


Der Computer leistet heutzutage viel. Aber die Bedeutung eines Textes kann er nicht verstehen, denn sonst könnte er uns mit einem Mausklick die Zusammenfassung eines Zeitungsartikels liefern. Computerlinguisten arbeiten daran, dass der Rechner das lernt. Sie trainieren ihn mit Texten, die von Hand mit linguistischer und anderer Information angereichert sind. Diese Anreicherung nennt man Annotation. Der Computer kann dann aus den annotierten Texten die Strukturen selbst nachbilden, indem er Regeln automatisch lernt.
Um das mühsame Geschäft der Annotation zu erleichtern und besser reproduzierbar zu machen, haben Wissenschaftler am Forschungsinstitut EML Research in Heidelberg eine spezielle Software entwickelt. Das digitale Werkzeug mit dem Namen "MMAX" wurde kürzlich auf einer internationalen Konferenz in Barcelona dem Fachpublikum vorgestellt. Bislang arbeiten schon fünfzehn Forschungsteams in Europa und den USA mit dem Annotationstool aus Heidelberg.

MMAX ist plattformunabhängig, speichersparend und nutzerfreundlich. Im Gegensatz zu bisherigen Annotationstools kann der Wissenschaftler das Aussehen und die Art der zu vergebenden Kennzeichnungen anpassen, ohne das Programm selbst ändern zu müssen. MMAX integriert aber auch bereits annotierte Texte. Außerdem unterstützt die Software die Annotation bei der Lösung verschiedener linguistischer Probleme, so bei der Analyse eines Zweiergesprächs oder bei der Darstellung von Bezügen innerhalb eines Textes. Ein Beispiel: In den ersten beiden Sätzen dieses Textes wird der Begriff "der Computer" in einer anderen Form, nämlich als "er", wieder aufgenommen. Solche Verweise, sogenannte Anaphern, stellen die maschinelle Sprachverarbeitung bislang vor große Probleme.

"MMAX unterstützt sowohl die sprachwissenschaftliche Forschung als auch die maschinelle Sprachverarbeitung", fasst Dr. Michael Strube, Leiter der Forschungsgruppe Natural Language Processing bei EML Research, zusammen.

Anwendungsgebiete, in denen mit MMAX annotierte Daten verwendet werden können, schließen auch die Extraktion von Wissen aus biologischen Texten und Datenbanken sowie das Aufspüren von Dokumenten (document retrieval) ein.

Die EML Research gGmbH ist ein privates Forschungsinstitut für Grundlagenforschung in der angewandten Informatik. Ein Schwerpunkt der Forschung liegt in der Computerlinguistik. Die Forscher arbeiten eng mit Universitäten im In- und Ausland zusammen zusammen. Die EML Research gGmbH bearbeitet hauptsächlich Forschungsprojekte der Klaus Tschira Stiftung gGmbH (KTS). KTS und EML Research haben ihren Sitz in der Heidelberger Villa Bosch, dem ehemaligen Wohnsitz des Nobelpreisträgers Carl Bosch.

Wissenschaftliche Ansprechpartner:
Dr. Michael Strube
Leiter der Forschungsgruppe Natural Language Processing
EML Research gGmbH
Tel: +49-6221-533-243
Fax: +49-6221-533-298

Christoph Müller
Natural Language Processing
EML Research gGmbH
Tel: +49-6221-533-238
Fax: +49-6221-533-298

Dr. Peter Saueressig | idw
Weitere Informationen:
http://www.eml-research.de
http://mmax.eml-research.de
http://www.kts.villa-bosch.de

Weitere Berichte zu: Annotation Annotationstool Language MMAX

Weitere Nachrichten aus der Kategorie Informationstechnologie:

nachricht TU Ilmenau entwickelt intelligente Sensorik zur Verarbeitung von Big Data
21.10.2019 | Technische Universität Ilmenau

nachricht Innovative Datenanalyse von Fraunhofer Austria
18.10.2019 | Fraunhofer Austria Research GmbH

Alle Nachrichten aus der Kategorie: Informationstechnologie >>>

Die aktuellsten Pressemeldungen zum Suchbegriff Innovation >>>

Die letzten 5 Focus-News des innovations-reports im Überblick:

Im Focus: Freiburger Forschenden gelingt die erste Synthese eines kationischen Tetraederclusters in Lösung

Hauptgruppenatome kommen oft in kleinen Clustern vor, die neutral, negativ oder positiv geladen sein können. Das bekannteste neutrale sogenannte Tetraedercluster ist der weiße Phosphor (P4), aber darüber hinaus sind weitere Tetraeder als Substanz isolierbar. Es handelt sich um Moleküle aus vier Atomen, deren räumliche Anordnung einem Tetraeder aus gleichseitigen Dreiecken entspricht. Bisher waren neben mindestens sechs neutralen Versionen wie As4 oder AsP3 eine Vielzahl von negativ geladenen Tetraedern wie In2Sb22– bekannt, jedoch keine kationischen, also positiv geladenen Varianten.

Ein Team um Prof. Dr. Ingo Krossing vom Institut für Anorganische und Analytische Chemie der Universität Freiburg ist es gelungen, diese positiv geladenen...

Im Focus: Die schnellste Ameise der Welt - Wüstenflitzer haben kurze Beine, aber eine perfekte Koordination

Silberameisen gelten als schnellste Ameisen der Welt - obwohl ihre Beine verhältnismäßig kurz sind. Daher haben Forschende der Universität Ulm den besonderen Laufstil dieses "Wüstenflitzers" auf einer Ameisen-Rennstrecke ergründet. Veröffentlicht wurde diese Entdeckung jüngst im „Journal of Experimental Biology“.

Sie geht auf Nahrungssuche, wenn andere Siesta halten: Die saharische Silberameise macht vor allem in der Mittagshitze der Sahara und in den Wüsten der...

Im Focus: Fraunhofer FHR zeigt kontaktlose, zerstörungsfreie Qualitätskontrolle von Kunststoffprodukten auf der K 2019

Auf der K 2019, der Weltleitmesse für die Kunststoff- und Kautschukindustrie vom 16.-23. Oktober in Düsseldorf, demonstriert das Fraunhofer-Institut für Hochfrequenzphysik und Radartechnik FHR das breite Anwendungsspektrum des von ihm entwickelten Millimeterwellen-Scanners SAMMI® im Kunststoffbereich. Im Rahmen des Messeauftritts führen die Wissenschaftler die vielseitigen Möglichkeiten der Millimeterwellentechnologie zur kontaktlosen, zerstörungsfreien Prüfung von Kunststoffprodukten vor.

Millimeterwellen sind in der Lage, nicht leitende, sogenannte dielektrische Materialien zu durchdringen. Damit eigen sie sich in besonderem Maße zum Einsatz in...

Im Focus: Solving the mystery of quantum light in thin layers

A very special kind of light is emitted by tungsten diselenide layers. The reason for this has been unclear. Now an explanation has been found at TU Wien (Vienna)

It is an exotic phenomenon that nobody was able to explain for years: when energy is supplied to a thin layer of the material tungsten diselenide, it begins to...

Im Focus: Rätsel gelöst: Das Quantenleuchten dünner Schichten

Eine ganz spezielle Art von Licht wird von Wolfram-Diselenid-Schichten ausgesandt. Warum das so ist, war bisher unklar. An der TU Wien wurde nun eine Erklärung gefunden.

Es ist ein merkwürdiges Phänomen, das jahrelang niemand erklären konnte: Wenn man einer dünnen Schicht des Materials Wolfram-Diselenid Energie zuführt, dann...

Alle Focus-News des Innovations-reports >>>

Anzeige

Anzeige

VideoLinks
Industrie & Wirtschaft
Veranstaltungen

Digitales-Krankenhaus – wo bleibt der Mensch?

21.10.2019 | Veranstaltungen

VR-/AR-Technologien aus der Nische holen

18.10.2019 | Veranstaltungen

Ein Marktplatz zur digitalen Transformation

18.10.2019 | Veranstaltungen

VideoLinks
Wissenschaft & Forschung
Weitere VideoLinks im Überblick >>>
 
Aktuelle Beiträge

Digitales-Krankenhaus – wo bleibt der Mensch?

21.10.2019 | Veranstaltungsnachrichten

Das Stromnetz fit für E-Mobilität machen

21.10.2019 | Förderungen Preise

Kompakt, effizient, robust und zuverlässig: FBH-Entwicklungen für den Weltraum

21.10.2019 | Physik Astronomie

Weitere B2B-VideoLinks
IHR
JOB & KARRIERE
SERVICE
im innovations-report
in Kooperation mit academics