Forum für Wissenschaft, Industrie und Wirtschaft

Hauptsponsoren:     3M 
Datenbankrecherche:

 

Software der TU Darmstadt erkennt Texte, die mit anderen Worten etwas Ähnliches aussagen

20.06.2012
Eine an der TU Darmstadt entwickelte Software kann die Bedeutungen von Texten verstehen und erkennt zuverlässig ähnliche Aussagen – auch, wenn sie in anderen Worten ausgedrückt werden.

Für Computer sind freie Texte im Regelfall nicht mehr als eine Sequenz bestimmter Zeichen. Die Bedeutung dieser Zeichenketten, deren „Semantik“, bleibt dem Computer zunächst verborgen. Daher können Computer bislang auch nicht erkennen, wenn zwei Texte den gleichen Sachverhalt mit anderen Worten beschreiben.

Um Rechnern beizubringen, dass etwa bei einem Hochwasser ein »sinkender Wasserstand« die gleiche Bedeutung hat wie die Aussage, der Pegel habe »seinen Scheitelpunkt überschritten«, haben Informatiker des Ubiquitous Knowledge Processing (UKP) Lab an der TU Darmstadt eine Software entwickelt und diese mit Hilfe eines maschinellen Lernverfahrens trainiert.

Anhand konkreter Texteigenschaften erschließt die Software die Bedeutung eines Textes und bestimmt aus einer Fülle von möglichen Indikatoren automatisch semantisch ähnliche Texte – auch wenn diese sich auf der Ebene der Zeichenketten, also der konkreten Worte, stark unterscheiden.
Dazu nutzen die Wissenschaftler unter anderem maschinenlesbare Wörterbücher, sogenannte „Wortnetze“ sowie komplexe Modelle, die Texte in einem hochdimensionalen mathematischen Vektorraum repräsentieren und vergleichen. „Unser System funktioniert nicht nur auf bestimmten Daten, sondern ist mittlerweile auch auf vorab unbekannten Daten sehr solide einsetzbar“, sagt die Leiterin des UKP Lab, Prof. Dr. Iryna Gurevych. Beim internationalen Wettbewerb Semantic Evaluation 2012 erzielte die Software bei der Aufgabe „Bestimmung semantischer Ähnlichkeit von Texten“ unter 35 konkurrierenden Teams die beste Leistung.

Die Software, die von Daniel Bär, Prof. Dr. Chris Biemann, Prof. Dr. Iryna Gurevych und Dr. Torsten Zesch entwickelt wurde, bietet zahlreiche Anwendungsmöglichkeiten: Unter anderem könnten Leser Empfehlungen für thematisch verwandte Dokumente erhalten und die Freitextantworten in groß angelegten Umfragen oder internationalen Kompetenzmessungen wie der PISA-Studie mit deutlich geringerem Aufwand ausgewertet werden.

Das UKP Lab ist in die internationale Forschung zu intelligenten Sprachtechnologien und Text-Mining eingebunden. Es arbeitet im Rahmen der seit 2012 begonnenen institutionellen Kooperation zwischen der TU Darmstadt und dem Deutschen Institut für Internationale Pädagogische Forschung (DIPF) in Frankfurt sowohl an anwendungsbezogener Theorie und Grundlagenforschung an der TU Darmstadt als auch an theoretisch fundierten Anwendungen der Sprachtechnologie in bildungsbezogenen Kontexten.

Pressekontakt
Prof. Dr. Iryna Gurevych
Tel. 06151/16-5411
gurevych@ukp.informatik.tu-darmstadt.de

Jörg Feuck | idw
Weitere Informationen:
http://www.tu-darmstadt.de

Weitere Nachrichten aus der Kategorie Informationstechnologie:

nachricht TU Ilmenau entwickelt Chiptechnologie von morgen
20.04.2017 | Technische Universität Ilmenau

nachricht Datenschutzwächter sichert Smart Homes
20.04.2017 | FZI Forschungszentrum Informatik am Karlsruher Institut für Technologie

Alle Nachrichten aus der Kategorie: Informationstechnologie >>>

Die aktuellsten Pressemeldungen zum Suchbegriff Innovation >>>

Die letzten 5 Focus-News des innovations-reports im Überblick:

Im Focus: Immunzellen helfen bei elektrischer Reizleitung im Herzen

Erstmals elektrische Kopplung von Muskelzellen und Makrophagen im Herzen nachgewiesen / Erkenntnisse könnten neue Therapieansätze bei Herzinfarkt und Herzrhythmus-Störungen ermöglichen / Publikation am 20. April 2017 in Cell

Makrophagen, auch Fresszellen genannt, sind Teil des Immunsystems und spielen eine wesentliche Rolle in der Abwehr von Krankheitserregern und bei der...

Im Focus: Tief im Inneren von M87

Die Galaxie M87 enthält ein supermassereiches Schwarzes Loch von sechs Milliarden Sonnenmassen im Zentrum. Ihr leuchtkräftiger Jet dominiert das beobachtete Spektrum über einen Frequenzbereich von 10 Größenordnungen. Aufgrund ihrer Nähe, des ausgeprägten Jets und des sehr massereichen Schwarzen Lochs stellt M87 ein ideales Laboratorium dar, um die Entstehung, Beschleunigung und Bündelung der Materie in relativistischen Jets zu erforschen. Ein Forscherteam unter der Leitung von Silke Britzen vom MPIfR Bonn liefert Hinweise für die Verbindung von Akkretionsscheibe und Jet von M87 durch turbulente Prozesse und damit neue Erkenntnisse für das Problem des Ursprungs von astrophysikalischen Jets.

Supermassereiche Schwarze Löcher in den Zentren von Galaxien sind eines der rätselhaftesten Phänomene in der modernen Astrophysik. Ihr gewaltiger...

Im Focus: Deep inside Galaxy M87

The nearby, giant radio galaxy M87 hosts a supermassive black hole (BH) and is well-known for its bright jet dominating the spectrum over ten orders of magnitude in frequency. Due to its proximity, jet prominence, and the large black hole mass, M87 is the best laboratory for investigating the formation, acceleration, and collimation of relativistic jets. A research team led by Silke Britzen from the Max Planck Institute for Radio Astronomy in Bonn, Germany, has found strong indication for turbulent processes connecting the accretion disk and the jet of that galaxy providing insights into the longstanding problem of the origin of astrophysical jets.

Supermassive black holes form some of the most enigmatic phenomena in astrophysics. Their enormous energy output is supposed to be generated by the...

Im Focus: Neu entdeckter Exoplanet könnte bester Kandidat für die Suche nach Leben sein

Supererde in bewohnbarer Zone um aktivitätsschwachen roten Zwergstern gefunden

Ein Exoplanet, der 40 Lichtjahre von der Erde entfernt einen roten Zwergstern umkreist, könnte in naher Zukunft der beste Ort sein, um außerhalb des...

Im Focus: Resistiver Schaltmechanismus aufgeklärt

Sie erlauben energiesparendes Schalten innerhalb von Nanosekunden, und die gespeicherten Informationen bleiben auf Dauer erhalten: ReRAM-Speicher gelten als Hoffnungsträger für die Datenspeicher der Zukunft.

Wie ReRAM-Zellen genau funktionieren, ist jedoch bisher nicht vollständig verstanden. Insbesondere die Details der ablaufenden chemischen Reaktionen geben den...

Alle Focus-News des Innovations-reports >>>

Anzeige

Anzeige

IHR
JOB & KARRIERE
SERVICE
im innovations-report
in Kooperation mit academics
Veranstaltungen

Smart-Data-Forschung auf dem Weg in die wirtschaftliche Praxis

21.04.2017 | Veranstaltungen

Baukultur: Mehr Qualität durch Gestaltungsbeiräte

21.04.2017 | Veranstaltungen

Licht - ein Werkzeug für die Laborbranche

20.04.2017 | Veranstaltungen

 
VideoLinks
B2B-VideoLinks
Weitere VideoLinks >>>
Aktuelle Beiträge

Intelligenter Werkstattwagen unterstützt Mensch in der Produktion

21.04.2017 | HANNOVER MESSE

Forschungszentrum Jülich auf der Hannover Messe 2017

21.04.2017 | HANNOVER MESSE

Smart-Data-Forschung auf dem Weg in die wirtschaftliche Praxis

21.04.2017 | Veranstaltungsnachrichten