Forum für Wissenschaft, Industrie und Wirtschaft

Hauptsponsoren:     3M 
Datenbankrecherche:

 

Wie Computer lernen, den Sinn von Texten zu erfassen

06.09.2010
Suchmaschinen suchen im Internet und in Textdatenbanken üblicherweise nach Stichwörtern.

Bisher stoßen Computer aber noch an ihre Grenzen, wenn sie die Bedeutung von Wörtern in einem Textzusammenhang erfassen sollen oder wenn man Querbezüge zwischen einzelnen Sachverhalten in großen Textmengen herstellen möchte. Auf einer Tagung in Saarbrücken diskutieren Computerlinguisten daher, wie man die maschinelle Sprachverarbeitung verbessern kann. Rund hundert Wissenschaftler aus verschiedenen europäischen Ländern, Japan und den USA werden bei der Konferenz zur Verarbeitung Natürlicher Sprache (Konvens) erwartet, die vom 6. bis 8. September auf dem Universitätscampus stattfindet.

Seitdem man durch das Internet und leistungsfähigere Rechner schnell auf riesige Mengen von Textdaten zugreifen kann, versuchen Forscher, noch mehr Intelligenz in die Suche einzubauen. Eine zentrale Herausforderung ist dabei die Flexibilität der Sprache: Ein Sachverhalt kann auf sehr unterschiedliche Weise ausgedrückt werden. Ein Wort oder auch ein Satz kann viele verschiedene Informationen ausdrücken und bekommt seinen genauen Sinn erst im Kontext. „Die Wissenschaftler gingen anfangs davon aus, dass man die Computer mit sehr viel Wissen füttern muss, um sie dann in die Lage zu versetzen, Sachverhalte aus Texten zu erschließen und logische Verbindungen zwischen verschiedenen Sachverhalten zu knüpfen“, erläutert Manfred Pinkal, Professor für Computerlinguistik der Universität des Saarlandes und Organisator der diesjährigen Konferenz. „Wenn man zum Beispiel im Internet herausfinden will, ob Firma A von Firma B übernommen wurde, und ein Textdokument findet, in dem von der Veräußerung von Firma B an Firma A durch eine dritte Firma die Rede ist, dann muss der Computer dafür die Sprache genau analysieren. Er muss richtig interpretieren, wer im jeweiligen Kontext Verkäufer, Käufer oder Kaufinteressent ist“, erklärt Pinkal. Der Mensch könne solche Texte mit seinem Hintergrundwissen schnell und problemlos deuten, der Computer jedoch nicht.

Vor einigen Jahren mussten sich die Forscher eingestehen, dass die Zusammenhänge zu komplex sind und man riesige Wissensmengen benötigt. Es wurde deutlich, dass das Verstehen von Texten auf der Grundlage von Wissen praktisch unmöglich ist. Seit einigen Jahren versuchen Forscher daher, über andere Wege zum gleichen Ziel zu kommen, nämlich Sprache in ihrer Komplexität automatisch zu erfassen. „Mit Hilfe von statistischen Lernverfahren gelingt es Computerlinguisten heute immer besser, die Bedeutung einer großen Textmenge sinnvoll zu erfassen. Der Rechner vergleicht dabei verschiedene Muster, setzt einzelne Wörter in Zusammenhang und lernt eigenständig dazu, wenn Informationen auf ähnliche Weise immer wiederkehren“, erläutert der Saarbrücker Forscher.

Dieses Thema wird der renommierte Computerlinguistiker Ed Hovy vom Information Sciences Institute (ISI) in Marina del Rey (Kalifornien) auf der Saarbrücker Tagung vorstellen. Die Wissenschaftler wollen dann darüber diskutieren, wie die unterschiedlichen Forschungsansätze miteinander verknüpft werden können. Die Konferenz befasst sich auch mit weiteren Themen, zum Beispiel, wie man Dialekte oder kleinere Sprachen wie das Schweizerdeutsch besser maschinell verarbeiten kann. „Viele Sprachdialogsysteme funktionieren heute nur mit weit verbreiteten Sprachen, weil man dort über die erforderliche Software und große aufbereitete Textmengen verfügt, mit denen man die Computer trainieren kann“, sagt Manfred Pinkal. Für die selteneren Sprachen, aber auch für historische Texte sei es daher wichtig, neue Analysewerkzeuge zu entwickeln. Damit hätten in Zukunft auch Kulturwissenschaftler vielfältige Möglichkeiten, um mit Hilfe des Computers große und heterogene Datenbestände zu analysieren und sinnvoll zu interpretieren.

Die Konferenz zur Verarbeitung Natürlicher Sprache wird alle zwei Jahre von drei wissenschaftlichen Fachgesellschaften, nämlich der Deutschen Gesellschaft für Sprachwissenschaft (Sektion Computerlinguistik), der Gesellschaft für Sprachtechnologie und Computerlinguistik und der Österreichischen Gesellschaft für Artificial Intelligence organisiert.

Tagungsprogramm und weitere Informationen unter:
www.konvens.de
Fragen beantwortet:
Prof. Dr. Manfred Pinkal
Tel. 0681/302-4344
Mail: pinkal@coli.uni-saarland.de
Hinweis für Hörfunk-Journalisten: Sie können Telefoninterviews in Studioqualität mit Wissenschaftlern der Universität des Saarlandes führen, über Rundfunk-ISDN-Codec. Interviewwünsche bitte an die Pressestelle (0681/302-3610) richten.

Friederike Meyer zu Tittingdorf | idw
Weitere Informationen:
http://www.konvens.de
http://www.uni-saarland.de

Weitere Nachrichten aus der Kategorie Informationstechnologie:

nachricht Smart Living: VDE-Institut entwickelt Cloud-basierte interoperable Testplattform
15.02.2017 | VDE Verband der Elektrotechnik Elektronik Informationstechnik e.V.

nachricht Saarbrücker Informatiker machen „Augmented Reality“ fotorealistisch
15.02.2017 | Universität des Saarlandes

Alle Nachrichten aus der Kategorie: Informationstechnologie >>>

Die aktuellsten Pressemeldungen zum Suchbegriff Innovation >>>

Die letzten 5 Focus-News des innovations-reports im Überblick:

Im Focus: „Vernetzte Autonome Systeme“ von acatech und DFKI auf der CeBIT

Auf der IT-Messe CeBIT vom 20. bis 24. März präsentieren acatech – Deutsche Akademie der Technikwissenschaften und das Deutsche Forschungszentrum für Künstliche Intelligenz (DFKI) in Kooperation mit der Deutschen Messe AG vernetzte Autonome Systeme. In Halle 12 am Stand B 63 erwarten die Besucherinnen und Besucher unter anderem Roboter, die Hand in Hand mit Menschen zusammenarbeiten oder die selbstständig gefährliche Umgebungen erkunden.

Auf der IT-Messe CeBIT vom 20. bis 24. März präsentieren acatech – Deutsche Akademie der Technikwissenschaften und das Deutsche Forschungszentrum für...

Im Focus: Kühler Zwerg und die sieben Planeten

Erdgroße Planeten mit gemäßigtem Klima in System mit ungewöhnlich vielen Planeten entdeckt

In einer Entfernung von nur 40 Lichtjahren haben Astronomen ein System aus sieben erdgroßen Planeten entdeckt. Alle Planeten wurden unter Verwendung von boden-...

Im Focus: Mehr Sicherheit für Flugzeuge

Zwei Entwicklungen am Lehrgebiet Rechnerarchitektur der FernUniversität in Hagen können das Fliegen sicherer machen: ein Flugassistenzsystem, das bei einem totalen Triebwerksausfall zum Einsatz kommt, um den Piloten ein sicheres Gleiten zu einem Notlandeplatz zu ermöglichen, und ein Assistenzsystem für Segelflieger, das ihnen das Erreichen größerer Höhen erleichtert. Präsentiert werden sie von Prof. Dr.-Ing. Wolfram Schiffmann auf der Internationalen Fachmesse für Allgemeine Luftfahrt AERO vom 5. bis 8. April in Friedrichshafen.

Zwei Entwicklungen am Lehrgebiet Rechnerarchitektur der FernUniversität in Hagen können das Fliegen sicherer machen: ein Flugassistenzsystem, das bei einem...

Im Focus: HIGH-TOOL unterstützt Verkehrsplanung in Europa

Forschung am Karlsruher Institut für Technologie (KIT) unterstützt die Europäische Kommission bei der Verkehrsplanung: Anhand des neuen Modells HIGH-TOOL lässt sich bewerten, wie verkehrspolitische Maßnahmen langfristig auf Wirtschaft, Gesellschaft und Umwelt wirken. HIGH-TOOL ist ein frei zugängliches Modell mit Modulen für Demografie, Wirtschaft und Ressourcen, Fahrzeugbestand, Nachfrage im Personen- und Güterverkehr sowie Umwelt und Sicherheit. An dem nun erfolgreich abgeschlossenen EU-Projekt unter der Koordination des KIT waren acht Partner aus fünf Ländern beteiligt.

Forschung am Karlsruher Institut für Technologie (KIT) unterstützt die Europäische Kommission bei der Verkehrsplanung: Anhand des neuen Modells HIGH-TOOL lässt...

Im Focus: Zinn in der Photodiode: nächster Schritt zur optischen On-Chip-Datenübertragung

Schon lange suchen Wissenschaftler nach einer geeigneten Lösung, um optische Komponenten auf einem Computerchip zu integrieren. Doch Silizium und Germanium allein – die stoffliche Basis der Chip-Produktion – sind als Lichtquelle kaum geeignet. Jülicher Physiker haben nun gemeinsam mit internationalen Partnern eine Diode vorgestellt, die neben Silizium und Germanium zusätzlich Zinn enthält, um die optischen Eigenschaften zu verbessern. Das Besondere daran: Da alle Elemente der vierten Hauptgruppe angehören, sind sie mit der bestehenden Silizium-Technologie voll kompatibel.

Schon lange suchen Wissenschaftler nach einer geeigneten Lösung, um optische Komponenten auf einem Computerchip zu integrieren. Doch Silizium und Germanium...

Alle Focus-News des Innovations-reports >>>

Anzeige

Anzeige

IHR
JOB & KARRIERE
SERVICE
im innovations-report
in Kooperation mit academics
Veranstaltungen

Big Data Centrum Ostbayern-Südböhmen startet Veranstaltungsreihe

23.02.2017 | Veranstaltungen

DFG unterstützt Kongresse und Tagungen - April 2017

23.02.2017 | Veranstaltungen

Wie werden wir gesund alt? - Alternsforscher tagen auf interdisziplinärem Symposium in Magdeburg

23.02.2017 | Veranstaltungen

 
VideoLinks
B2B-VideoLinks
Weitere VideoLinks >>>
Aktuelle Beiträge

Sechs Bundesländer erproben Online-Schultests der Uni Jena

24.02.2017 | Bildung Wissenschaft

Stachellose Bienen lassen Nester von Soldatinnen verteidigen

24.02.2017 | Biowissenschaften Chemie

Ifremer entwickelt autonomes Unterwasserfahrzeug zur Untersuchung der Tiefsee

24.02.2017 | Maschinenbau