Forum für Wissenschaft, Industrie und Wirtschaft

Hauptsponsoren:     3M 
Datenbankrecherche:

 

Wie der Computer Texte besser verstehen lernt

26.10.2004


Computerlinguisten bei EML Research stellen nutzerfreundliches digitales Werkzeug MMAX zur Annotation von Texten vor - Anwendungsfelder: Dokumentensuche und Wissensextraktion


Der Computer leistet heutzutage viel. Aber die Bedeutung eines Textes kann er nicht verstehen, denn sonst könnte er uns mit einem Mausklick die Zusammenfassung eines Zeitungsartikels liefern. Computerlinguisten arbeiten daran, dass der Rechner das lernt. Sie trainieren ihn mit Texten, die von Hand mit linguistischer und anderer Information angereichert sind. Diese Anreicherung nennt man Annotation. Der Computer kann dann aus den annotierten Texten die Strukturen selbst nachbilden, indem er Regeln automatisch lernt.
Um das mühsame Geschäft der Annotation zu erleichtern und besser reproduzierbar zu machen, haben Wissenschaftler am Forschungsinstitut EML Research in Heidelberg eine spezielle Software entwickelt. Das digitale Werkzeug mit dem Namen "MMAX" wurde kürzlich auf einer internationalen Konferenz in Barcelona dem Fachpublikum vorgestellt. Bislang arbeiten schon fünfzehn Forschungsteams in Europa und den USA mit dem Annotationstool aus Heidelberg.

MMAX ist plattformunabhängig, speichersparend und nutzerfreundlich. Im Gegensatz zu bisherigen Annotationstools kann der Wissenschaftler das Aussehen und die Art der zu vergebenden Kennzeichnungen anpassen, ohne das Programm selbst ändern zu müssen. MMAX integriert aber auch bereits annotierte Texte. Außerdem unterstützt die Software die Annotation bei der Lösung verschiedener linguistischer Probleme, so bei der Analyse eines Zweiergesprächs oder bei der Darstellung von Bezügen innerhalb eines Textes. Ein Beispiel: In den ersten beiden Sätzen dieses Textes wird der Begriff "der Computer" in einer anderen Form, nämlich als "er", wieder aufgenommen. Solche Verweise, sogenannte Anaphern, stellen die maschinelle Sprachverarbeitung bislang vor große Probleme.

"MMAX unterstützt sowohl die sprachwissenschaftliche Forschung als auch die maschinelle Sprachverarbeitung", fasst Dr. Michael Strube, Leiter der Forschungsgruppe Natural Language Processing bei EML Research, zusammen.

Anwendungsgebiete, in denen mit MMAX annotierte Daten verwendet werden können, schließen auch die Extraktion von Wissen aus biologischen Texten und Datenbanken sowie das Aufspüren von Dokumenten (document retrieval) ein.

Die EML Research gGmbH ist ein privates Forschungsinstitut für Grundlagenforschung in der angewandten Informatik. Ein Schwerpunkt der Forschung liegt in der Computerlinguistik. Die Forscher arbeiten eng mit Universitäten im In- und Ausland zusammen zusammen. Die EML Research gGmbH bearbeitet hauptsächlich Forschungsprojekte der Klaus Tschira Stiftung gGmbH (KTS). KTS und EML Research haben ihren Sitz in der Heidelberger Villa Bosch, dem ehemaligen Wohnsitz des Nobelpreisträgers Carl Bosch.

Wissenschaftliche Ansprechpartner:
Dr. Michael Strube
Leiter der Forschungsgruppe Natural Language Processing
EML Research gGmbH
Tel: +49-6221-533-243
Fax: +49-6221-533-298

Christoph Müller
Natural Language Processing
EML Research gGmbH
Tel: +49-6221-533-238
Fax: +49-6221-533-298

Dr. Peter Saueressig | idw
Weitere Informationen:
http://www.eml-research.de
http://mmax.eml-research.de
http://www.kts.villa-bosch.de

Weitere Berichte zu: Annotation Annotationstool Language MMAX

Weitere Nachrichten aus der Kategorie Informationstechnologie:

nachricht Layouterfassung im Flug: Drohne unterstützt bei der Fabrikplanung
19.05.2017 | IPH - Institut für Integrierte Produktion Hannover gGmbH

nachricht Intelligente Industrialisierung von Rechenzentren
15.05.2017 | Rittal GmbH & Co. KG

Alle Nachrichten aus der Kategorie: Informationstechnologie >>>

Die aktuellsten Pressemeldungen zum Suchbegriff Innovation >>>

Die letzten 5 Focus-News des innovations-reports im Überblick:

Im Focus: Lässt sich mit Boten-RNA das Immunsystem gegen Staphylococcus aureus scharf schalten?

Staphylococcus aureus ist aufgrund häufiger Resistenzen gegenüber vielen Antibiotika ein gefürchteter Erreger (MRSA) insbesondere bei Krankenhaus-Infektionen. Forscher des Paul-Ehrlich-Instituts haben immunologische Prozesse identifiziert, die eine erfolgreiche körpereigene, gegen den Erreger gerichtete Abwehr verhindern. Die Forscher konnten zeigen, dass sich durch Übertragung von Protein oder Boten-RNA (mRNA, messenger RNA) des Erregers auf Immunzellen die Immunantwort in Richtung einer aktiven Erregerabwehr verschieben lässt. Dies könnte für die Entwicklung eines wirksamen Impfstoffs bedeutsam sein. Darüber berichtet PLOS Pathogens in seiner Online-Ausgabe vom 25.05.2017.

Staphylococcus aureus (S. aureus) ist ein Bakterium, das bei weit über der Hälfte der Erwachsenen Haut und Schleimhäute besiedelt und dabei normalerweise keine...

Im Focus: Can the immune system be boosted against Staphylococcus aureus by delivery of messenger RNA?

Staphylococcus aureus is a feared pathogen (MRSA, multi-resistant S. aureus) due to frequent resistances against many antibiotics, especially in hospital infections. Researchers at the Paul-Ehrlich-Institut have identified immunological processes that prevent a successful immune response directed against the pathogenic agent. The delivery of bacterial proteins with RNA adjuvant or messenger RNA (mRNA) into immune cells allows the re-direction of the immune response towards an active defense against S. aureus. This could be of significant importance for the development of an effective vaccine. PLOS Pathogens has published these research results online on 25 May 2017.

Staphylococcus aureus (S. aureus) is a bacterium that colonizes by far more than half of the skin and the mucosa of adults, usually without causing infections....

Im Focus: Orientierungslauf im Mikrokosmos

Physiker der Universität Würzburg können auf Knopfdruck einzelne Lichtteilchen erzeugen, die einander ähneln wie ein Ei dem anderen. Zwei neue Studien zeigen nun, welches Potenzial diese Methode hat.

Der Quantencomputer beflügelt seit Jahrzehnten die Phantasie der Wissenschaftler: Er beruht auf grundlegend anderen Phänomenen als ein herkömmlicher Rechner....

Im Focus: A quantum walk of photons

Physicists from the University of Würzburg are capable of generating identical looking single light particles at the push of a button. Two new studies now demonstrate the potential this method holds.

The quantum computer has fuelled the imagination of scientists for decades: It is based on fundamentally different phenomena than a conventional computer....

Im Focus: Tumult im trägen Elektronen-Dasein

Ein internationales Team von Physikern hat erstmals das Streuverhalten von Elektronen in einem nichtleitenden Material direkt beobachtet. Ihre Erkenntnisse könnten der Strahlungsmedizin zu Gute kommen.

Elektronen in nichtleitenden Materialien könnte man Trägheit nachsagen. In der Regel bleiben sie an ihren Plätzen, tief im Inneren eines solchen Atomverbunds....

Alle Focus-News des Innovations-reports >>>

Anzeige

Anzeige

IHR
JOB & KARRIERE
SERVICE
im innovations-report
in Kooperation mit academics
Veranstaltungen

Meeresschutz im Fokus: Das IASS auf der UN-Ozean-Konferenz in New York vom 5.-9. Juni

24.05.2017 | Veranstaltungen

Diabetes Kongress in Hamburg beginnt heute: Rund 6000 Teilnehmer werden erwartet

24.05.2017 | Veranstaltungen

Wissensbuffet: „All you can eat – and learn”

24.05.2017 | Veranstaltungen

 
VideoLinks
B2B-VideoLinks
Weitere VideoLinks >>>
Aktuelle Beiträge

DFG fördert 15 neue Sonderforschungsbereiche (SFB)

26.05.2017 | Förderungen Preise

Lässt sich mit Boten-RNA das Immunsystem gegen Staphylococcus aureus scharf schalten?

26.05.2017 | Biowissenschaften Chemie

Unglaublich formbar: Lesen lernen krempelt Gehirn selbst bei Erwachsenen tiefgreifend um

26.05.2017 | Gesellschaftswissenschaften