Software der TU Darmstadt erkennt Texte, die mit anderen Worten etwas Ähnliches aussagen

Für Computer sind freie Texte im Regelfall nicht mehr als eine Sequenz bestimmter Zeichen. Die Bedeutung dieser Zeichenketten, deren „Semantik“, bleibt dem Computer zunächst verborgen. Daher können Computer bislang auch nicht erkennen, wenn zwei Texte den gleichen Sachverhalt mit anderen Worten beschreiben.

Um Rechnern beizubringen, dass etwa bei einem Hochwasser ein »sinkender Wasserstand« die gleiche Bedeutung hat wie die Aussage, der Pegel habe »seinen Scheitelpunkt überschritten«, haben Informatiker des Ubiquitous Knowledge Processing (UKP) Lab an der TU Darmstadt eine Software entwickelt und diese mit Hilfe eines maschinellen Lernverfahrens trainiert.

Anhand konkreter Texteigenschaften erschließt die Software die Bedeutung eines Textes und bestimmt aus einer Fülle von möglichen Indikatoren automatisch semantisch ähnliche Texte – auch wenn diese sich auf der Ebene der Zeichenketten, also der konkreten Worte, stark unterscheiden.
Dazu nutzen die Wissenschaftler unter anderem maschinenlesbare Wörterbücher, sogenannte „Wortnetze“ sowie komplexe Modelle, die Texte in einem hochdimensionalen mathematischen Vektorraum repräsentieren und vergleichen. „Unser System funktioniert nicht nur auf bestimmten Daten, sondern ist mittlerweile auch auf vorab unbekannten Daten sehr solide einsetzbar“, sagt die Leiterin des UKP Lab, Prof. Dr. Iryna Gurevych. Beim internationalen Wettbewerb Semantic Evaluation 2012 erzielte die Software bei der Aufgabe „Bestimmung semantischer Ähnlichkeit von Texten“ unter 35 konkurrierenden Teams die beste Leistung.

Die Software, die von Daniel Bär, Prof. Dr. Chris Biemann, Prof. Dr. Iryna Gurevych und Dr. Torsten Zesch entwickelt wurde, bietet zahlreiche Anwendungsmöglichkeiten: Unter anderem könnten Leser Empfehlungen für thematisch verwandte Dokumente erhalten und die Freitextantworten in groß angelegten Umfragen oder internationalen Kompetenzmessungen wie der PISA-Studie mit deutlich geringerem Aufwand ausgewertet werden.

Das UKP Lab ist in die internationale Forschung zu intelligenten Sprachtechnologien und Text-Mining eingebunden. Es arbeitet im Rahmen der seit 2012 begonnenen institutionellen Kooperation zwischen der TU Darmstadt und dem Deutschen Institut für Internationale Pädagogische Forschung (DIPF) in Frankfurt sowohl an anwendungsbezogener Theorie und Grundlagenforschung an der TU Darmstadt als auch an theoretisch fundierten Anwendungen der Sprachtechnologie in bildungsbezogenen Kontexten.

Pressekontakt
Prof. Dr. Iryna Gurevych
Tel. 06151/16-5411
gurevych@ukp.informatik.tu-darmstadt.de

Media Contact

Jörg Feuck idw

Weitere Informationen:

http://www.tu-darmstadt.de

Alle Nachrichten aus der Kategorie: Informationstechnologie

Neuerungen und Entwicklungen auf den Gebieten der Informations- und Datenverarbeitung sowie der dafür benötigten Hardware finden Sie hier zusammengefasst.

Unter anderem erhalten Sie Informationen aus den Teilbereichen: IT-Dienstleistungen, IT-Architektur, IT-Management und Telekommunikation.

Zurück zur Startseite

Kommentare (0)

Schreiben Sie einen Kommentar

Neueste Beiträge

Anlagenkonzepte für die Fertigung von Bipolarplatten, MEAs und Drucktanks

Grüner Wasserstoff zählt zu den Energieträgern der Zukunft. Um ihn in großen Mengen zu erzeugen, zu speichern und wieder in elektrische Energie zu wandeln, bedarf es effizienter und skalierbarer Fertigungsprozesse…

Ausfallsichere Dehnungssensoren ohne Stromverbrauch

Um die Sicherheit von Brücken, Kränen, Pipelines, Windrädern und vielem mehr zu überwachen, werden Dehnungssensoren benötigt. Eine grundlegend neue Technologie dafür haben Wissenschaftlerinnen und Wissenschaftler aus Bochum und Paderborn entwickelt….

Dauerlastfähige Wechselrichter

… ermöglichen deutliche Leistungssteigerung elektrischer Antriebe. Überhitzende Komponenten limitieren die Leistungsfähigkeit von Antriebssträngen bei Elektrofahrzeugen erheblich. Wechselrichtern fällt dabei eine große thermische Last zu, weshalb sie unter hohem Energieaufwand aktiv…

Partner & Förderer