Forum für Wissenschaft, Industrie und Wirtschaft

Hauptsponsoren:     3M 
Datenbankrecherche:

 

Software der TU Darmstadt erkennt Texte, die mit anderen Worten etwas Ähnliches aussagen

20.06.2012
Eine an der TU Darmstadt entwickelte Software kann die Bedeutungen von Texten verstehen und erkennt zuverlässig ähnliche Aussagen – auch, wenn sie in anderen Worten ausgedrückt werden.

Für Computer sind freie Texte im Regelfall nicht mehr als eine Sequenz bestimmter Zeichen. Die Bedeutung dieser Zeichenketten, deren „Semantik“, bleibt dem Computer zunächst verborgen. Daher können Computer bislang auch nicht erkennen, wenn zwei Texte den gleichen Sachverhalt mit anderen Worten beschreiben.

Um Rechnern beizubringen, dass etwa bei einem Hochwasser ein »sinkender Wasserstand« die gleiche Bedeutung hat wie die Aussage, der Pegel habe »seinen Scheitelpunkt überschritten«, haben Informatiker des Ubiquitous Knowledge Processing (UKP) Lab an der TU Darmstadt eine Software entwickelt und diese mit Hilfe eines maschinellen Lernverfahrens trainiert.

Anhand konkreter Texteigenschaften erschließt die Software die Bedeutung eines Textes und bestimmt aus einer Fülle von möglichen Indikatoren automatisch semantisch ähnliche Texte – auch wenn diese sich auf der Ebene der Zeichenketten, also der konkreten Worte, stark unterscheiden.
Dazu nutzen die Wissenschaftler unter anderem maschinenlesbare Wörterbücher, sogenannte „Wortnetze“ sowie komplexe Modelle, die Texte in einem hochdimensionalen mathematischen Vektorraum repräsentieren und vergleichen. „Unser System funktioniert nicht nur auf bestimmten Daten, sondern ist mittlerweile auch auf vorab unbekannten Daten sehr solide einsetzbar“, sagt die Leiterin des UKP Lab, Prof. Dr. Iryna Gurevych. Beim internationalen Wettbewerb Semantic Evaluation 2012 erzielte die Software bei der Aufgabe „Bestimmung semantischer Ähnlichkeit von Texten“ unter 35 konkurrierenden Teams die beste Leistung.

Die Software, die von Daniel Bär, Prof. Dr. Chris Biemann, Prof. Dr. Iryna Gurevych und Dr. Torsten Zesch entwickelt wurde, bietet zahlreiche Anwendungsmöglichkeiten: Unter anderem könnten Leser Empfehlungen für thematisch verwandte Dokumente erhalten und die Freitextantworten in groß angelegten Umfragen oder internationalen Kompetenzmessungen wie der PISA-Studie mit deutlich geringerem Aufwand ausgewertet werden.

Das UKP Lab ist in die internationale Forschung zu intelligenten Sprachtechnologien und Text-Mining eingebunden. Es arbeitet im Rahmen der seit 2012 begonnenen institutionellen Kooperation zwischen der TU Darmstadt und dem Deutschen Institut für Internationale Pädagogische Forschung (DIPF) in Frankfurt sowohl an anwendungsbezogener Theorie und Grundlagenforschung an der TU Darmstadt als auch an theoretisch fundierten Anwendungen der Sprachtechnologie in bildungsbezogenen Kontexten.

Pressekontakt
Prof. Dr. Iryna Gurevych
Tel. 06151/16-5411
gurevych@ukp.informatik.tu-darmstadt.de

Jörg Feuck | idw
Weitere Informationen:
http://www.tu-darmstadt.de

Weitere Nachrichten aus der Kategorie Informationstechnologie:

nachricht »Lernlabor Cybersicherheit« startet in Weiden i. d. Oberpfalz
12.01.2017 | Fraunhofer-Gesellschaft

nachricht Klick-Tagebuch: App-Projekt der HdM erlaubt neuen Ansatz in Entwicklungsforschung
11.01.2017 | Hochschule der Medien Stuttgart

Alle Nachrichten aus der Kategorie: Informationstechnologie >>>

Die aktuellsten Pressemeldungen zum Suchbegriff Innovation >>>

Die letzten 5 Focus-News des innovations-reports im Überblick:

Im Focus: Mit solaren Gebäudehüllen Architektur gestalten

Solarthermie ist in der breiten Öffentlichkeit derzeit durch dunkelblaue, rechteckige Kollektoren auf Hausdächern besetzt. Für ästhetisch hochwertige Architektur werden Technologien benötigt, die dem Architekten mehr Gestaltungsspielraum für Niedrigst- und Plusenergiegebäude geben. Im Projekt »ArKol« entwickeln Forscher des Fraunhofer ISE gemeinsam mit Partnern aktuell zwei Fassadenkollektoren für solare Wärmeerzeugung, die ein hohes Maß an Designflexibilität erlauben: einen Streifenkollektor für opake sowie eine solarthermische Jalousie für transparente Fassadenanteile. Der aktuelle Stand der beiden Entwicklungen wird auf der BAU 2017 vorgestellt.

Im Projekt »ArKol – Entwicklung von architektonisch hoch integrierten Fassadekollektoren mit Heat Pipes« entwickelt das Fraunhofer ISE gemeinsam mit Partnern...

Im Focus: Designing Architecture with Solar Building Envelopes

Among the general public, solar thermal energy is currently associated with dark blue, rectangular collectors on building roofs. Technologies are needed for aesthetically high quality architecture which offer the architect more room for manoeuvre when it comes to low- and plus-energy buildings. With the “ArKol” project, researchers at Fraunhofer ISE together with partners are currently developing two façade collectors for solar thermal energy generation, which permit a high degree of design flexibility: a strip collector for opaque façade sections and a solar thermal blind for transparent sections. The current state of the two developments will be presented at the BAU 2017 trade fair.

As part of the “ArKol – development of architecturally highly integrated façade collectors with heat pipes” project, Fraunhofer ISE together with its partners...

Im Focus: Mit Bindfaden und Schere - die Chromosomenverteilung in der Meiose

Was einmal fest verbunden war sollte nicht getrennt werden? Nicht so in der Meiose, der Zellteilung in der Gameten, Spermien und Eizellen entstehen. Am Anfang der Meiose hält der ringförmige Proteinkomplex Kohäsin die Chromosomenstränge, auf denen die Bauanleitung des Körpers gespeichert ist, zusammen wie ein Bindfaden. Damit am Ende jede Eizelle und jedes Spermium nur einen Chromosomensatz erhält, müssen die Bindfäden aufgeschnitten werden. Forscher vom Max-Planck-Institut für Biochemie zeigen in der Bäckerhefe wie ein auch im Menschen vorkommendes Kinase-Enzym das Aufschneiden der Kohäsinringe kontrolliert und mit dem Austritt aus der Meiose und der Gametenbildung koordiniert.

Warum sehen Kinder eigentlich ihren Eltern ähnlich? Die meisten Zellen unseres Körpers sind diploid, d.h. sie besitzen zwei Kopien von jedem Chromosom – eine...

Im Focus: Der Klang des Ozeans

Umfassende Langzeitstudie zur Geräuschkulisse im Südpolarmeer veröffentlicht

Fast drei Jahre lang haben AWI-Wissenschaftler mit Unterwasser-Mikrofonen in das Südpolarmeer hineingehorcht und einen „Chor“ aus Walen und Robben vernommen....

Im Focus: Wie man eine 80t schwere Betonschale aufbläst

An der TU Wien wurde eine Alternative zu teuren und aufwendigen Schalungen für Kuppelbauten entwickelt, die nun in einem Testbauwerk für die ÖBB-Infrastruktur umgesetzt wird.

Die Schalung für Kuppelbauten aus Beton ist normalerweise aufwändig und teuer. Eine mögliche kostengünstige und ressourcenschonende Alternative bietet die an...

Alle Focus-News des Innovations-reports >>>

Anzeige

Anzeige

IHR
JOB & KARRIERE
SERVICE
im innovations-report
in Kooperation mit academics
Veranstaltungen

Aquakulturen und Fangquoten – was hilft gegen Überfischung?

16.01.2017 | Veranstaltungen

14. BF21-Jahrestagung „Mobilität & Kfz-Versicherung im Fokus“

12.01.2017 | Veranstaltungen

Leipziger Biogas-Fachgespräch lädt zum "Branchengespräch Biogas2020+" nach Nossen

11.01.2017 | Veranstaltungen

 
VideoLinks
B2B-VideoLinks
Weitere VideoLinks >>>
Aktuelle Beiträge

Weltweit erste Solarstraße in Frankreich eingeweiht

16.01.2017 | Energie und Elektrotechnik

Proteinforschung: Der Computer als Mikroskop

16.01.2017 | Biowissenschaften Chemie

Vermeintlich junger Stern entpuppt sich als galaktischer Greis

16.01.2017 | Physik Astronomie