Forum für Wissenschaft, Industrie und Wirtschaft

Hauptsponsoren:     3M 
Datenbankrecherche:

 

Wie der Computer Texte besser verstehen lernt

26.10.2004


Computerlinguisten bei EML Research stellen nutzerfreundliches digitales Werkzeug MMAX zur Annotation von Texten vor - Anwendungsfelder: Dokumentensuche und Wissensextraktion


Der Computer leistet heutzutage viel. Aber die Bedeutung eines Textes kann er nicht verstehen, denn sonst könnte er uns mit einem Mausklick die Zusammenfassung eines Zeitungsartikels liefern. Computerlinguisten arbeiten daran, dass der Rechner das lernt. Sie trainieren ihn mit Texten, die von Hand mit linguistischer und anderer Information angereichert sind. Diese Anreicherung nennt man Annotation. Der Computer kann dann aus den annotierten Texten die Strukturen selbst nachbilden, indem er Regeln automatisch lernt.
Um das mühsame Geschäft der Annotation zu erleichtern und besser reproduzierbar zu machen, haben Wissenschaftler am Forschungsinstitut EML Research in Heidelberg eine spezielle Software entwickelt. Das digitale Werkzeug mit dem Namen "MMAX" wurde kürzlich auf einer internationalen Konferenz in Barcelona dem Fachpublikum vorgestellt. Bislang arbeiten schon fünfzehn Forschungsteams in Europa und den USA mit dem Annotationstool aus Heidelberg.

MMAX ist plattformunabhängig, speichersparend und nutzerfreundlich. Im Gegensatz zu bisherigen Annotationstools kann der Wissenschaftler das Aussehen und die Art der zu vergebenden Kennzeichnungen anpassen, ohne das Programm selbst ändern zu müssen. MMAX integriert aber auch bereits annotierte Texte. Außerdem unterstützt die Software die Annotation bei der Lösung verschiedener linguistischer Probleme, so bei der Analyse eines Zweiergesprächs oder bei der Darstellung von Bezügen innerhalb eines Textes. Ein Beispiel: In den ersten beiden Sätzen dieses Textes wird der Begriff "der Computer" in einer anderen Form, nämlich als "er", wieder aufgenommen. Solche Verweise, sogenannte Anaphern, stellen die maschinelle Sprachverarbeitung bislang vor große Probleme.

"MMAX unterstützt sowohl die sprachwissenschaftliche Forschung als auch die maschinelle Sprachverarbeitung", fasst Dr. Michael Strube, Leiter der Forschungsgruppe Natural Language Processing bei EML Research, zusammen.

Anwendungsgebiete, in denen mit MMAX annotierte Daten verwendet werden können, schließen auch die Extraktion von Wissen aus biologischen Texten und Datenbanken sowie das Aufspüren von Dokumenten (document retrieval) ein.

Die EML Research gGmbH ist ein privates Forschungsinstitut für Grundlagenforschung in der angewandten Informatik. Ein Schwerpunkt der Forschung liegt in der Computerlinguistik. Die Forscher arbeiten eng mit Universitäten im In- und Ausland zusammen zusammen. Die EML Research gGmbH bearbeitet hauptsächlich Forschungsprojekte der Klaus Tschira Stiftung gGmbH (KTS). KTS und EML Research haben ihren Sitz in der Heidelberger Villa Bosch, dem ehemaligen Wohnsitz des Nobelpreisträgers Carl Bosch.

Wissenschaftliche Ansprechpartner:
Dr. Michael Strube
Leiter der Forschungsgruppe Natural Language Processing
EML Research gGmbH
Tel: +49-6221-533-243
Fax: +49-6221-533-298

Christoph Müller
Natural Language Processing
EML Research gGmbH
Tel: +49-6221-533-238
Fax: +49-6221-533-298

Dr. Peter Saueressig | idw
Weitere Informationen:
http://www.eml-research.de
http://mmax.eml-research.de
http://www.kts.villa-bosch.de

Weitere Berichte zu: Annotation Annotationstool Language MMAX

Weitere Nachrichten aus der Kategorie Informationstechnologie:

nachricht Das kleine 1x1 des Plätzchenbackens mit der Software AutoNester
17.12.2018 | Fraunhofer-Institut für Algorithmen und Wissenschaftliches Rechnen SCAI

nachricht Rittal: Das sind die IT- und Datacenter-Trends 2019
17.12.2018 | Rittal GmbH & Co. KG

Alle Nachrichten aus der Kategorie: Informationstechnologie >>>

Die aktuellsten Pressemeldungen zum Suchbegriff Innovation >>>

Die letzten 5 Focus-News des innovations-reports im Überblick:

Im Focus: Wenn sich Atome zu nahe kommen

„Dass ich erkenne, was die Welt im Innersten zusammenhält“ - dieses Faust’sche Streben ist durch die Rasterkraftmikroskopie möglich geworden. Bei dieser Mikroskopiemethode wird eine Oberfläche durch mechanisches Abtasten abgebildet. Der Abtastsensor besteht aus einem Federbalken mit einer atomar scharfen Spitze. Der Federbalken wird in eine Schwingung mit konstanter Amplitude versetzt und Frequenzänderungen der Schwingung erlauben es, kleinste Kräfte im Piko-Newtonbereich zu messen. Ein Newton beträgt zum Beispiel die Gewichtskraft einer Tafel Schokolade, und ein Piko-Newton ist ein Millionstel eines Millionstels eines Newtons.

Da die Kräfte nicht direkt gemessen werden können, sondern durch die sogenannte Kraftspektroskopie über den Umweg einer Frequenzverschiebung bestimmt werden,...

Im Focus: Datenspeicherung mit einzelnen Molekülen

Forschende der Universität Basel berichten von einer neuen Methode, bei der sich der Aggregatzustand weniger Atome oder Moleküle innerhalb eines Netzwerks gezielt steuern lässt. Sie basiert auf der spontanen Selbstorganisation von Molekülen zu ausgedehnten Netzwerken mit Poren von etwa einem Nanometer Grösse. Im Wissenschaftsmagazin «small» berichten die Physikerinnen und Physiker von den Untersuchungen, die für die Entwicklung neuer Speichermedien von besonderer Bedeutung sein können.

Weltweit laufen Bestrebungen, Datenspeicher immer weiter zu verkleinern, um so auf kleinstem Raum eine möglichst hohe Speicherkapazität zu erreichen. Bei fast...

Im Focus: Data storage using individual molecules

Researchers from the University of Basel have reported a new method that allows the physical state of just a few atoms or molecules within a network to be controlled. It is based on the spontaneous self-organization of molecules into extensive networks with pores about one nanometer in size. In the journal ‘small’, the physicists reported on their investigations, which could be of particular importance for the development of new storage devices.

Around the world, researchers are attempting to shrink data storage devices to achieve as large a storage capacity in as small a space as possible. In almost...

Im Focus: Data use draining your battery? Tiny device to speed up memory while also saving power

The more objects we make "smart," from watches to entire buildings, the greater the need for these devices to store and retrieve massive amounts of data quickly without consuming too much power.

Millions of new memory cells could be part of a computer chip and provide that speed and energy savings, thanks to the discovery of a previously unobserved...

Im Focus: Quantenkryptographie ist bereit für das Netz

Wiener Quantenforscher der ÖAW realisierten in Zusammenarbeit mit dem AIT erstmals ein quantenphysikalisch verschlüsseltes Netzwerk zwischen vier aktiven Teilnehmern. Diesen wissenschaftlichen Durchbruch würdigt das Fachjournal „Nature“ nun mit einer Cover-Story.

Alice und Bob bekommen Gesellschaft: Bisher fand quantenkryptographisch verschlüsselte Kommunikation primär zwischen zwei aktiven Teilnehmern, zumeist Alice...

Alle Focus-News des Innovations-reports >>>

Anzeige

Anzeige

VideoLinks
Industrie & Wirtschaft
Veranstaltungen

Tagung 2019 in Essen: LED Produktentwicklung – Leuchten mit aktuellem Wissen

14.12.2018 | Veranstaltungen

Pro und Contra in der urologischen Onkologie

14.12.2018 | Veranstaltungen

Konferenz zu Usability und künstlicher Intelligenz an der Universität Mannheim

13.12.2018 | Veranstaltungen

VideoLinks
Wissenschaft & Forschung
Weitere VideoLinks im Überblick >>>
 
Aktuelle Beiträge

Kommunikation zwischen neuronalen Netzwerken

17.12.2018 | Biowissenschaften Chemie

Beim Phasenübergang benutzen die Elektronen den Zebrastreifen

17.12.2018 | Physik Astronomie

Pharmazeuten erzielen Durchbruch bei Suche nach magensaftbeständigen Zusätzen für Medikamente

17.12.2018 | Biowissenschaften Chemie

Weitere B2B-VideoLinks
IHR
JOB & KARRIERE
SERVICE
im innovations-report
in Kooperation mit academics