Forum für Wissenschaft, Industrie und Wirtschaft

Hauptsponsoren:     3M 
Datenbankrecherche:

 

Software der TU Darmstadt erkennt Texte, die mit anderen Worten etwas Ähnliches aussagen

20.06.2012
Eine an der TU Darmstadt entwickelte Software kann die Bedeutungen von Texten verstehen und erkennt zuverlässig ähnliche Aussagen – auch, wenn sie in anderen Worten ausgedrückt werden.

Für Computer sind freie Texte im Regelfall nicht mehr als eine Sequenz bestimmter Zeichen. Die Bedeutung dieser Zeichenketten, deren „Semantik“, bleibt dem Computer zunächst verborgen. Daher können Computer bislang auch nicht erkennen, wenn zwei Texte den gleichen Sachverhalt mit anderen Worten beschreiben.

Um Rechnern beizubringen, dass etwa bei einem Hochwasser ein »sinkender Wasserstand« die gleiche Bedeutung hat wie die Aussage, der Pegel habe »seinen Scheitelpunkt überschritten«, haben Informatiker des Ubiquitous Knowledge Processing (UKP) Lab an der TU Darmstadt eine Software entwickelt und diese mit Hilfe eines maschinellen Lernverfahrens trainiert.

Anhand konkreter Texteigenschaften erschließt die Software die Bedeutung eines Textes und bestimmt aus einer Fülle von möglichen Indikatoren automatisch semantisch ähnliche Texte – auch wenn diese sich auf der Ebene der Zeichenketten, also der konkreten Worte, stark unterscheiden.
Dazu nutzen die Wissenschaftler unter anderem maschinenlesbare Wörterbücher, sogenannte „Wortnetze“ sowie komplexe Modelle, die Texte in einem hochdimensionalen mathematischen Vektorraum repräsentieren und vergleichen. „Unser System funktioniert nicht nur auf bestimmten Daten, sondern ist mittlerweile auch auf vorab unbekannten Daten sehr solide einsetzbar“, sagt die Leiterin des UKP Lab, Prof. Dr. Iryna Gurevych. Beim internationalen Wettbewerb Semantic Evaluation 2012 erzielte die Software bei der Aufgabe „Bestimmung semantischer Ähnlichkeit von Texten“ unter 35 konkurrierenden Teams die beste Leistung.

Die Software, die von Daniel Bär, Prof. Dr. Chris Biemann, Prof. Dr. Iryna Gurevych und Dr. Torsten Zesch entwickelt wurde, bietet zahlreiche Anwendungsmöglichkeiten: Unter anderem könnten Leser Empfehlungen für thematisch verwandte Dokumente erhalten und die Freitextantworten in groß angelegten Umfragen oder internationalen Kompetenzmessungen wie der PISA-Studie mit deutlich geringerem Aufwand ausgewertet werden.

Das UKP Lab ist in die internationale Forschung zu intelligenten Sprachtechnologien und Text-Mining eingebunden. Es arbeitet im Rahmen der seit 2012 begonnenen institutionellen Kooperation zwischen der TU Darmstadt und dem Deutschen Institut für Internationale Pädagogische Forschung (DIPF) in Frankfurt sowohl an anwendungsbezogener Theorie und Grundlagenforschung an der TU Darmstadt als auch an theoretisch fundierten Anwendungen der Sprachtechnologie in bildungsbezogenen Kontexten.

Pressekontakt
Prof. Dr. Iryna Gurevych
Tel. 06151/16-5411
gurevych@ukp.informatik.tu-darmstadt.de

Jörg Feuck | idw
Weitere Informationen:
http://www.tu-darmstadt.de

Weitere Nachrichten aus der Kategorie Informationstechnologie:

nachricht Vom Gehirn zur Robotik: Algorithmen verarbeiten Sensordaten wie das Gehirn
25.09.2017 | Universität Ulm

nachricht Ein stabiles magnetisches Bit aus drei Atomen
21.09.2017 | Sonderforschungsbereich 668

Alle Nachrichten aus der Kategorie: Informationstechnologie >>>

Die aktuellsten Pressemeldungen zum Suchbegriff Innovation >>>

Die letzten 5 Focus-News des innovations-reports im Überblick:

Im Focus: Die schnellste lichtgetriebene Stromquelle der Welt

Die Stromregelung ist eine der wichtigsten Komponenten moderner Elektronik, denn über schnell angesteuerte Elektronenströme werden Daten und Signale übertragen. Die Ansprüche an die Schnelligkeit der Datenübertragung wachsen dabei beständig. In eine ganz neue Dimension der schnellen Stromregelung sind nun Wissenschaftler der Lehrstühle für Laserphysik und Angewandte Physik an der Friedrich-Alexander-Universität Erlangen-Nürnberg (FAU) vorgedrungen. Ihnen ist es gelungen, im „Wundermaterial“ Graphen Elektronenströme innerhalb von einer Femtosekunde in die gewünschte Richtung zu lenken – eine Femtosekunde entspricht dabei dem millionsten Teil einer milliardstel Sekunde.

Der Trick: die Elektronen werden von einer einzigen Schwingung eines Lichtpulses angetrieben. Damit können sie den Vorgang um mehr als das Tausendfache im...

Im Focus: The fastest light-driven current source

Controlling electronic current is essential to modern electronics, as data and signals are transferred by streams of electrons which are controlled at high speed. Demands on transmission speeds are also increasing as technology develops. Scientists from the Chair of Laser Physics and the Chair of Applied Physics at Friedrich-Alexander-Universität Erlangen-Nürnberg (FAU) have succeeded in switching on a current with a desired direction in graphene using a single laser pulse within a femtosecond ¬¬ – a femtosecond corresponds to the millionth part of a billionth of a second. This is more than a thousand times faster compared to the most efficient transistors today.

Graphene is up to the job

Im Focus: LaserTAB: Effizientere und präzisere Kontakte dank Roboter-Kollaboration

Auf der diesjährigen productronica in München stellt das Fraunhofer-Institut für Lasertechnik ILT das Laser-Based Tape-Automated Bonding, kurz LaserTAB, vor: Die Aachener Experten zeigen, wie sich dank neuer Optik und Roboter-Unterstützung Batteriezellen und Leistungselektronik effizienter und präziser als bisher lasermikroschweißen lassen.

Auf eine geschickte Kombination von Roboter-Einsatz, Laserscanner mit selbstentwickelter neuer Optik und Prozessüberwachung setzt das Fraunhofer ILT aus Aachen.

Im Focus: LaserTAB: More efficient and precise contacts thanks to human-robot collaboration

At the productronica trade fair in Munich this November, the Fraunhofer Institute for Laser Technology ILT will be presenting Laser-Based Tape-Automated Bonding, LaserTAB for short. The experts from Aachen will be demonstrating how new battery cells and power electronics can be micro-welded more efficiently and precisely than ever before thanks to new optics and robot support.

Fraunhofer ILT from Aachen relies on a clever combination of robotics and a laser scanner with new optics as well as process monitoring, which it has developed...

Im Focus: The pyrenoid is a carbon-fixing liquid droplet

Plants and algae use the enzyme Rubisco to fix carbon dioxide, removing it from the atmosphere and converting it into biomass. Algae have figured out a way to increase the efficiency of carbon fixation. They gather most of their Rubisco into a ball-shaped microcompartment called the pyrenoid, which they flood with a high local concentration of carbon dioxide. A team of scientists at Princeton University, the Carnegie Institution for Science, Stanford University and the Max Plank Institute of Biochemistry have unravelled the mysteries of how the pyrenoid is assembled. These insights can help to engineer crops that remove more carbon dioxide from the atmosphere while producing more food.

A warming planet

Alle Focus-News des Innovations-reports >>>

Anzeige

Anzeige

IHR
JOB & KARRIERE
SERVICE
im innovations-report
in Kooperation mit academics
Veranstaltungen

Im Spannungsfeld von Biologie und Modellierung

26.09.2017 | Veranstaltungen

Archaeopteryx, Klimawandel und Zugvögel: Deutsche Ornithologen-Gesellschaft tagt an der Uni Halle

26.09.2017 | Veranstaltungen

Unsere Arbeitswelt von morgen – Polarisierendes Thema beim 7. Unternehmertag der HNEE

26.09.2017 | Veranstaltungen

 
VideoLinks
B2B-VideoLinks
Weitere VideoLinks >>>
Aktuelle Beiträge

Mit künstlicher Intelligenz zum chemischen Fingerabdruck

26.09.2017 | Biowissenschaften Chemie

Eine detaillierte Waldkarte des blauen Planeten

26.09.2017 | Geowissenschaften

RWI/ISL-Containerumschlag-Index steigt weiter

26.09.2017 | Wirtschaft Finanzen