Forum für Wissenschaft, Industrie und Wirtschaft

Hauptsponsoren:     3M 
Datenbankrecherche:

 

Computer 'lernen' vom Menschen: Software analysiert das Wissen in Wiktionary und Wikipedia

30.01.2009
Informatiker der TU Darmstadt haben eine Software entwickelt, die es dem Computer ermöglicht, auf das eigentlich für menschliche Leser bestimmte Wissen in Online-Werken wie Wikipedia oder Wiktionary zuzugreifen. Diese Software bringt nicht nur den Traum des automatischen Sprachverstehens der Realisierung näher, sondern sie birgt dabei auch ein nicht zu unterschätzendes Potential etwa für Wörterbuchverlage.

Um Computern in bescheidenem Umfang Sprachverstehen und intelligentes Verhalten einzuhauchen, waren bislang oft sogenannte "regelbasierte Systeme" im Einsatz, wie sie etwa von Telefonauskunftssystemen oder Hilfefunktionen bei Software bekannt sind. Obwohl diese Systeme meistens sehr komplex aufgebaut sind und von Experten in mühsamer Handarbeit erstellt und optimiert werden, sind ihre Resultate für den Benutzer oft unbefriedigend.

Auf der anderen Seite träumte man schon seit der Geburtsstunde der Künstlichen Intelligenz in den 1960er Jahren davon, für Computer selbstständige Sprachfähigkeiten und vielleicht sogar eine Art Intelligenz zu entwickeln. Eine zentrale Idee war, dass Computer sich durch Bibliotheken lesen könnten und sich dabei jede Menge nützliches Wissen aneignen würden. In der Wirklichkeit war dieser Traum jedoch nicht umsetzbar. Zum einen fehlte schlicht die nötige Rechenleistung. Zweitens konnte nie zufriedenstellend geklärt werden, wie der Lernprozess eigentlich genau implementiert werden kann und schließlich mangelte es auch an geeigneten digitalisierten Inhalten.

Heute befindet sich die Forschung dabei in einer erheblich besseren Ausgangssituation: Die Rechenleistung moderner Rechnerverbünde ist gigantisch, und die Erfolge in der Entwicklung hocheffizienter statistischer Lernverfahren, wie sie beispielsweise bei der Informationssuche mit Google eingesetzt werden, haben Lösungen für viele Implementierungs-Fragen parat. Doch wie steht es mit digitalen Inhalten?

Online-Nachschlagewerke wie Wikipedia und das dazugehörige Wörterbuch Wiktionary erfreuen sich bei Internetbenutzern einer bisher nicht da gewesenen Beliebtheit. Diese "von Benutzern für Benutzer" geschaffenen Werke haben innerhalb kürzester Zeit eine beeindruckende Größe und Qualität erreicht. Sie sind bereits jetzt in vielen Hinsichten den klassischen Nachschlagewerken überlegen.

Computer haben es jedoch nicht leicht, auf das Wissen in Online-Werken zuzugreifen. Denn schließlich wurden diese Werke für Menschen und nicht für Computer geschaffen. Wissenschaftler des UKP Labs im Fachbereich Informatik der TU Darmstadt um Prof. Dr. Iryna Gurevych haben deshalb eine spezielle Software entwickelt, die das menschliche Wissen in Wikipedia und Wiktionary für Computerprogramme analysiert, bereinigt und aufbereitet.

"Während für Wikipedia mittlerweile eine Reihe von verschiedenen Zugriffsmöglichkeiten existieren, ist die Software für Wiktionary eine Neuheit. Sie verwandelt das Online-Werk in ein von Computern verarbeitbares multilinguales Netz, das Wörter verschiedener Sprachen miteinander verknüpft und zusätzlich ein große Menge an lexikographischer Information auf Knopfdruck bereitstellt", sagt der Informatiker Christof Müller.

Aljoscha Burchardt vom Center of Research Excellence "E-Learning" an der TU Darmstadt fügt hinzu: "Die Möglichkeit, vom Wissen der Internet-Gemeinschaft mit Hilfe dieser Software zu profitieren, kann die Herstellung von herkömmlichen Wörterbüchern im Verlagswesen revolutionieren. Nicht nur durch Kosteneinsparung, sondern auch durch viel größere Aktualität und thematische Breite, welche im Hinblick auf die ständig neuen Anforderungen in unserer Wissensgesellschaft ganz wichtige Faktoren sind".

Die Informatiker an der TU Darmstadt wollen die Ergebnisse ihrer Arbeit den Forschern weltweit nicht vorenthalten. Sowohl die Wikipedia- als auch die Wiktionary-Analyse-Software ist für nicht-kommerzielle Forschungszwecke frei verfügbar. Dies erklärt Prof. Dr. Iryna Gurevych so: "Zum einen liegt uns sehr viel dran, die akademische Forschung im Bereich Sprachverstehen international voranzubringen und Synergie-Effekte zu schaffen. Zum anderen wollen wir den Standort TU Darmstadt weltweit im Bereich der semantischen Sprachverarbeitung profilieren."

Teilweise ist dies bereits Wirklichkeit. Denn die Darmstädter Software für Wikipedia ist für alle Sprachen verfügbar, für die es spezifische Wikipedia-Editionen gibt. Und für Wiktionary haben die Wissenschaftler zunächst die englische und die deutsche Sprache angegangen. Der große Vorteil der Online-Werke, nämlich die Verknüpfungen zwischen den Wikipedia-Artikeln und den Wiktionary-Einträgen sowie unter den sprachenspezifischen Editionen werden dabei ausgenutzt, um verschiedene Sprachen automatisch übersetzen zu können. Ein Programm für die Informationssuche in einer Sprache, wo der Umfang der Online-Werke noch relativ klein ist, profitiert so vom Wissen der englischsprachigen Wikipedia-Gemeinschaft, die ungleich größer ist. So kann die Software des UKP Lab noch ein Vielfaches an Wissenspotenzial bereitstellen.

"Wir sind überzeugt, dass die von uns entwickelte Software der Wissensgewinnung zu qualitativen Sprüngen im Bereich des automatischen Sprachverstehens führen wird. Teilweise haben wir das automatisch gewonnene Wissen in eigenen Experimenten bei der Informationsrecherche, der Erkennung von Meinungen in freien Texten und der Beantwortung von natürlichsprachlichen Fragen bereits eingesetzt und überzeugende Verbesserungen festgestellt. Nachdem wir die grundlegenden Mechanismen für die Wissensgewinnung geschaffen haben, wird der Ausbau und die Verwertung ihres Potenzials in laufenden Forschungs- und Transferprojekten am UKP Lab unser Fokus sein", so die Fachgebietsleiterin Prof. Iryna Gurevych.

Hintergrund
Die im Beitrag beschriebene Software wurde im Rahmen eines DFG-finanzierten Projekts zum Thema "Semantisches Information Retrieval" am UKP Lab geschaffen. Das UKP Lab wurde am Center of Research Excellence "E-Learning" an der TU Darmstadt vor etwa zwei Jahren gegründet. Seit April 2008 trägt die Arbeitsgruppe im Fachbereich Informatik der TU Darmstadt den Namen Lichtenberg-Professur "Ubiquitäre Wissensverarbeitung". Diese Professur wird von der Volkswagen-Stiftung im Rahmen des nach dem Darmstädter Wissenschaftler Georg Christoph Lichtenberg genannten Exzellenzprogramms gefördert.
Kontakt:
Prof. Dr. Iryna Gurevych, Fachbereich Informatik, TU Darmstadt,
Tel. 06151/16-5411, gurevych@tk.informatik.tu-darmstadt.de

Jörg Feuck | idw
Weitere Informationen:
http://www.ukp.tu-darmstadt.de

Weitere Nachrichten aus der Kategorie Informationstechnologie:

nachricht Erster Modularer Supercomputer weltweit geht am Forschungszentrum Jülich in Betrieb
14.11.2017 | Forschungszentrum Jülich GmbH

nachricht Online-Computerspiele verändern das Gehirn
09.11.2017 | Universität Ulm

Alle Nachrichten aus der Kategorie: Informationstechnologie >>>

Die aktuellsten Pressemeldungen zum Suchbegriff Innovation >>>

Die letzten 5 Focus-News des innovations-reports im Überblick:

Im Focus: Ultrakalte chemische Prozesse: Physikern gelingt beispiellose Vermessung auf Quantenniveau

Wissenschaftler um den Ulmer Physikprofessor Johannes Hecker Denschlag haben chemische Prozesse mit einer beispiellosen Auflösung auf Quantenniveau vermessen. Bei ihrer wissenschaftlichen Arbeit kombinierten die Forscher Theorie und Experiment und können so erstmals die Produktzustandsverteilung über alle Quantenzustände hinweg - unmittelbar nach der Molekülbildung - nachvollziehen. Die Forscher haben ihre Erkenntnisse in der renommierten Fachzeitschrift "Science" publiziert. Durch die Ergebnisse wird ein tieferes Verständnis zunehmend komplexer chemischer Reaktionen möglich, das zukünftig genutzt werden kann, um Reaktionsprozesse auf Quantenniveau zu steuern.

Einer deutsch-amerikanischen Forschergruppe ist es gelungen, chemische Prozesse mit einer nie dagewesenen Auflösung auf Quantenniveau zu vermessen. Dadurch...

Im Focus: Leoniden 2017: Sternschnuppen im Anflug?

Gemeinsame Pressemitteilung der Vereinigung der Sternfreunde und des Hauses der Astronomie in Heidelberg

Die Sternschnuppen der Leoniden sind in diesem Jahr gut zu beobachten, da kein Mondlicht stört. Experten sagen für die Nächte vom 16. auf den 17. und vom 17....

Im Focus: «Kosmische Schlange» lässt die Struktur von fernen Galaxien erkennen

Die Entstehung von Sternen in fernen Galaxien ist noch weitgehend unerforscht. Astronomen der Universität Genf konnten nun erstmals ein sechs Milliarden Lichtjahre entferntes Sternensystem genauer beobachten – und damit frühere Simulationen der Universität Zürich stützen. Ein spezieller Effekt ermöglicht mehrfach reflektierte Bilder, die sich wie eine Schlange durch den Kosmos ziehen.

Heute wissen Astronomen ziemlich genau, wie sich Sterne in der jüngsten kosmischen Vergangenheit gebildet haben. Aber gelten diese Gesetzmässigkeiten auch für...

Im Focus: A “cosmic snake” reveals the structure of remote galaxies

The formation of stars in distant galaxies is still largely unexplored. For the first time, astron-omers at the University of Geneva have now been able to closely observe a star system six billion light-years away. In doing so, they are confirming earlier simulations made by the University of Zurich. One special effect is made possible by the multiple reflections of images that run through the cosmos like a snake.

Today, astronomers have a pretty accurate idea of how stars were formed in the recent cosmic past. But do these laws also apply to older galaxies? For around a...

Im Focus: Pflanzenvielfalt von Wäldern aus der Luft abbilden

Produktivität und Stabilität von Waldökosystemen hängen stark von der funktionalen Vielfalt der Pflanzengemeinschaften ab. UZH-Forschenden gelang es, die Pflanzenvielfalt von Wäldern durch Fernerkundung mit Flugzeugen in verschiedenen Massstäben zu messen und zu kartieren – von einzelnen Bäumen bis hin zu ganzen Artengemeinschaften. Die neue Methode ebnet den Weg, um zukünftig die globale Pflanzendiversität aus der Luft und aus dem All zu überwachen.

Ökologische Studien zeigen, dass die Pflanzenvielfalt zentral ist für das Funktionieren von Ökosys-temen. Wälder mit einer höheren funktionalen Vielfalt –...

Alle Focus-News des Innovations-reports >>>

Anzeige

Anzeige

IHR
JOB & KARRIERE
SERVICE
im innovations-report
in Kooperation mit academics
Veranstaltungen

Technologievorsprung durch Textiltechnik

17.11.2017 | Veranstaltungen

Roboter für ein gesundes Altern: „European Robotics Week 2017“ an der Frankfurt UAS

17.11.2017 | Veranstaltungen

Börse für Zukunftstechnologien – Leichtbautag Stade bringt Unternehmen branchenübergreifend zusammen

17.11.2017 | Veranstaltungen

 
VideoLinks
B2B-VideoLinks
Weitere VideoLinks >>>
Aktuelle Beiträge

Technologievorsprung durch Textiltechnik

17.11.2017 | Veranstaltungsnachrichten

IHP präsentiert sich auf der productronica 2017

17.11.2017 | Messenachrichten

Roboter schafft den Salto rückwärts

17.11.2017 | Innovative Produkte