Forum für Wissenschaft, Industrie und Wirtschaft

Hauptsponsoren:     3M 
Datenbankrecherche:

 

Software der TU Darmstadt erkennt Texte, die mit anderen Worten etwas Ähnliches aussagen

20.06.2012
Eine an der TU Darmstadt entwickelte Software kann die Bedeutungen von Texten verstehen und erkennt zuverlässig ähnliche Aussagen – auch, wenn sie in anderen Worten ausgedrückt werden.

Für Computer sind freie Texte im Regelfall nicht mehr als eine Sequenz bestimmter Zeichen. Die Bedeutung dieser Zeichenketten, deren „Semantik“, bleibt dem Computer zunächst verborgen. Daher können Computer bislang auch nicht erkennen, wenn zwei Texte den gleichen Sachverhalt mit anderen Worten beschreiben.

Um Rechnern beizubringen, dass etwa bei einem Hochwasser ein »sinkender Wasserstand« die gleiche Bedeutung hat wie die Aussage, der Pegel habe »seinen Scheitelpunkt überschritten«, haben Informatiker des Ubiquitous Knowledge Processing (UKP) Lab an der TU Darmstadt eine Software entwickelt und diese mit Hilfe eines maschinellen Lernverfahrens trainiert.

Anhand konkreter Texteigenschaften erschließt die Software die Bedeutung eines Textes und bestimmt aus einer Fülle von möglichen Indikatoren automatisch semantisch ähnliche Texte – auch wenn diese sich auf der Ebene der Zeichenketten, also der konkreten Worte, stark unterscheiden.
Dazu nutzen die Wissenschaftler unter anderem maschinenlesbare Wörterbücher, sogenannte „Wortnetze“ sowie komplexe Modelle, die Texte in einem hochdimensionalen mathematischen Vektorraum repräsentieren und vergleichen. „Unser System funktioniert nicht nur auf bestimmten Daten, sondern ist mittlerweile auch auf vorab unbekannten Daten sehr solide einsetzbar“, sagt die Leiterin des UKP Lab, Prof. Dr. Iryna Gurevych. Beim internationalen Wettbewerb Semantic Evaluation 2012 erzielte die Software bei der Aufgabe „Bestimmung semantischer Ähnlichkeit von Texten“ unter 35 konkurrierenden Teams die beste Leistung.

Die Software, die von Daniel Bär, Prof. Dr. Chris Biemann, Prof. Dr. Iryna Gurevych und Dr. Torsten Zesch entwickelt wurde, bietet zahlreiche Anwendungsmöglichkeiten: Unter anderem könnten Leser Empfehlungen für thematisch verwandte Dokumente erhalten und die Freitextantworten in groß angelegten Umfragen oder internationalen Kompetenzmessungen wie der PISA-Studie mit deutlich geringerem Aufwand ausgewertet werden.

Das UKP Lab ist in die internationale Forschung zu intelligenten Sprachtechnologien und Text-Mining eingebunden. Es arbeitet im Rahmen der seit 2012 begonnenen institutionellen Kooperation zwischen der TU Darmstadt und dem Deutschen Institut für Internationale Pädagogische Forschung (DIPF) in Frankfurt sowohl an anwendungsbezogener Theorie und Grundlagenforschung an der TU Darmstadt als auch an theoretisch fundierten Anwendungen der Sprachtechnologie in bildungsbezogenen Kontexten.

Pressekontakt
Prof. Dr. Iryna Gurevych
Tel. 06151/16-5411
gurevych@ukp.informatik.tu-darmstadt.de

Jörg Feuck | idw
Weitere Informationen:
http://www.tu-darmstadt.de

Weitere Nachrichten aus der Kategorie Informationstechnologie:

nachricht Lemgoer Forscher entwickeln Intelligente Assistenzsysteme für mobile Anwendungen in der Industrie
25.07.2017 | Hochschule Ostwestfalen-Lippe

nachricht Neue Anwendungsszenarien für Industrie 4.0 entwickelt
25.07.2017 | Fraunhofer-Institut für Produktionstechnik und Automatisierung IPA

Alle Nachrichten aus der Kategorie: Informationstechnologie >>>

Die aktuellsten Pressemeldungen zum Suchbegriff Innovation >>>

Die letzten 5 Focus-News des innovations-reports im Überblick:

Im Focus: Physiker designen ultrascharfe Pulse

Quantenphysiker um Oriol Romero-Isart haben einen einfachen Aufbau entworfen, mit dem theoretisch beliebig stark fokussierte elektromagnetische Felder erzeugt werden können. Anwendung finden könnte das neue Verfahren zum Beispiel in der Mikroskopie oder für besonders empfindliche Sensoren.

Mikrowellen, Wärmestrahlung, Licht und Röntgenstrahlung sind Beispiele für elektromagnetische Wellen. Für viele Anwendungen ist es notwendig, diese Strahlung...

Im Focus: Physicists Design Ultrafocused Pulses

Physicists working with researcher Oriol Romero-Isart devised a new simple scheme to theoretically generate arbitrarily short and focused electromagnetic fields. This new tool could be used for precise sensing and in microscopy.

Microwaves, heat radiation, light and X-radiation are examples for electromagnetic waves. Many applications require to focus the electromagnetic fields to...

Im Focus: Navigationssystem der Hirnzellen entschlüsselt

Das menschliche Gehirn besteht aus etwa hundert Milliarden Nervenzellen. Informationen zwischen ihnen werden über ein komplexes Netzwerk aus Nervenfasern übermittelt. Verdrahtet werden die meisten dieser Verbindungen vor der Geburt nach einem genetischen Bauplan, also ohne dass äußere Einflüsse eine Rolle spielen. Mehr darüber, wie das Navigationssystem funktioniert, das die Axone beim Wachstum leitet, haben jetzt Forscher des Karlsruher Instituts für Technologie (KIT) herausgefunden. Das berichten sie im Fachmagazin eLife.

Die Gesamtlänge des Nervenfasernetzes im Gehirn beträgt etwa 500.000 Kilometer, mehr als die Entfernung zwischen Erde und Mond. Damit es beim Verdrahten der...

Im Focus: Kohlenstoff-Nanoröhrchen verwandeln Strom in leuchtende Quasiteilchen

Starke Licht-Materie-Kopplung in diesen halbleitenden Röhrchen könnte zu elektrisch gepumpten Lasern führen

Auch durch Anregung mit Strom ist die Erzeugung von leuchtenden Quasiteilchen aus Licht und Materie in halbleitenden Kohlenstoff-Nanoröhrchen möglich....

Im Focus: Carbon Nanotubes Turn Electrical Current into Light-emitting Quasi-particles

Strong light-matter coupling in these semiconducting tubes may hold the key to electrically pumped lasers

Light-matter quasi-particles can be generated electrically in semiconducting carbon nanotubes. Material scientists and physicists from Heidelberg University...

Alle Focus-News des Innovations-reports >>>

Anzeige

Anzeige

IHR
JOB & KARRIERE
SERVICE
im innovations-report
in Kooperation mit academics
Veranstaltungen

10. Uelzener Forum: Demografischer Wandel und Digitalisierung

26.07.2017 | Veranstaltungen

Clash of Realities 2017: Anmeldung jetzt möglich. Internationale Konferenz an der TH Köln

26.07.2017 | Veranstaltungen

2. Spitzentreffen »Industrie 4.0 live«

25.07.2017 | Veranstaltungen

 
VideoLinks
B2B-VideoLinks
Weitere VideoLinks >>>
Aktuelle Beiträge

Basis für neue medikamentöse Therapie bei Demenz

27.07.2017 | Biowissenschaften Chemie

Aus Potenzial Erfolge machen: 30 Rittaler schließen Nachqualifizierung erfolgreich ab

27.07.2017 | Unternehmensmeldung

Biochemiker entschlüsseln Zusammenspiel von Enzym-Domänen während der Katalyse

27.07.2017 | Biowissenschaften Chemie