Forum für Wissenschaft, Industrie und Wirtschaft

Hauptsponsoren:     3M 
Datenbankrecherche:

 

Wie Computer lernen, den Sinn von Texten zu erfassen

06.09.2010
Suchmaschinen suchen im Internet und in Textdatenbanken üblicherweise nach Stichwörtern.

Bisher stoßen Computer aber noch an ihre Grenzen, wenn sie die Bedeutung von Wörtern in einem Textzusammenhang erfassen sollen oder wenn man Querbezüge zwischen einzelnen Sachverhalten in großen Textmengen herstellen möchte. Auf einer Tagung in Saarbrücken diskutieren Computerlinguisten daher, wie man die maschinelle Sprachverarbeitung verbessern kann. Rund hundert Wissenschaftler aus verschiedenen europäischen Ländern, Japan und den USA werden bei der Konferenz zur Verarbeitung Natürlicher Sprache (Konvens) erwartet, die vom 6. bis 8. September auf dem Universitätscampus stattfindet.

Seitdem man durch das Internet und leistungsfähigere Rechner schnell auf riesige Mengen von Textdaten zugreifen kann, versuchen Forscher, noch mehr Intelligenz in die Suche einzubauen. Eine zentrale Herausforderung ist dabei die Flexibilität der Sprache: Ein Sachverhalt kann auf sehr unterschiedliche Weise ausgedrückt werden. Ein Wort oder auch ein Satz kann viele verschiedene Informationen ausdrücken und bekommt seinen genauen Sinn erst im Kontext. „Die Wissenschaftler gingen anfangs davon aus, dass man die Computer mit sehr viel Wissen füttern muss, um sie dann in die Lage zu versetzen, Sachverhalte aus Texten zu erschließen und logische Verbindungen zwischen verschiedenen Sachverhalten zu knüpfen“, erläutert Manfred Pinkal, Professor für Computerlinguistik der Universität des Saarlandes und Organisator der diesjährigen Konferenz. „Wenn man zum Beispiel im Internet herausfinden will, ob Firma A von Firma B übernommen wurde, und ein Textdokument findet, in dem von der Veräußerung von Firma B an Firma A durch eine dritte Firma die Rede ist, dann muss der Computer dafür die Sprache genau analysieren. Er muss richtig interpretieren, wer im jeweiligen Kontext Verkäufer, Käufer oder Kaufinteressent ist“, erklärt Pinkal. Der Mensch könne solche Texte mit seinem Hintergrundwissen schnell und problemlos deuten, der Computer jedoch nicht.

Vor einigen Jahren mussten sich die Forscher eingestehen, dass die Zusammenhänge zu komplex sind und man riesige Wissensmengen benötigt. Es wurde deutlich, dass das Verstehen von Texten auf der Grundlage von Wissen praktisch unmöglich ist. Seit einigen Jahren versuchen Forscher daher, über andere Wege zum gleichen Ziel zu kommen, nämlich Sprache in ihrer Komplexität automatisch zu erfassen. „Mit Hilfe von statistischen Lernverfahren gelingt es Computerlinguisten heute immer besser, die Bedeutung einer großen Textmenge sinnvoll zu erfassen. Der Rechner vergleicht dabei verschiedene Muster, setzt einzelne Wörter in Zusammenhang und lernt eigenständig dazu, wenn Informationen auf ähnliche Weise immer wiederkehren“, erläutert der Saarbrücker Forscher.

Dieses Thema wird der renommierte Computerlinguistiker Ed Hovy vom Information Sciences Institute (ISI) in Marina del Rey (Kalifornien) auf der Saarbrücker Tagung vorstellen. Die Wissenschaftler wollen dann darüber diskutieren, wie die unterschiedlichen Forschungsansätze miteinander verknüpft werden können. Die Konferenz befasst sich auch mit weiteren Themen, zum Beispiel, wie man Dialekte oder kleinere Sprachen wie das Schweizerdeutsch besser maschinell verarbeiten kann. „Viele Sprachdialogsysteme funktionieren heute nur mit weit verbreiteten Sprachen, weil man dort über die erforderliche Software und große aufbereitete Textmengen verfügt, mit denen man die Computer trainieren kann“, sagt Manfred Pinkal. Für die selteneren Sprachen, aber auch für historische Texte sei es daher wichtig, neue Analysewerkzeuge zu entwickeln. Damit hätten in Zukunft auch Kulturwissenschaftler vielfältige Möglichkeiten, um mit Hilfe des Computers große und heterogene Datenbestände zu analysieren und sinnvoll zu interpretieren.

Die Konferenz zur Verarbeitung Natürlicher Sprache wird alle zwei Jahre von drei wissenschaftlichen Fachgesellschaften, nämlich der Deutschen Gesellschaft für Sprachwissenschaft (Sektion Computerlinguistik), der Gesellschaft für Sprachtechnologie und Computerlinguistik und der Österreichischen Gesellschaft für Artificial Intelligence organisiert.

Tagungsprogramm und weitere Informationen unter:
www.konvens.de
Fragen beantwortet:
Prof. Dr. Manfred Pinkal
Tel. 0681/302-4344
Mail: pinkal@coli.uni-saarland.de
Hinweis für Hörfunk-Journalisten: Sie können Telefoninterviews in Studioqualität mit Wissenschaftlern der Universität des Saarlandes führen, über Rundfunk-ISDN-Codec. Interviewwünsche bitte an die Pressestelle (0681/302-3610) richten.

Friederike Meyer zu Tittingdorf | idw
Weitere Informationen:
http://www.konvens.de
http://www.uni-saarland.de

Weitere Nachrichten aus der Kategorie Informationstechnologie:

nachricht Smart Wireless Solutions: EU-Großprojekt „DEWI“ liefert Innovationen für eine drahtlose Zukunft
27.04.2017 | Kompetenzzentrum - Das virtuelle Fahrzeug Forschungsgesellschaft mbH

nachricht Ergonomie am Arbeitsplatz: Kamera erkennt ungesunde Bewegungen
24.04.2017 | IPH - Institut für Integrierte Produktion Hannover gGmbH

Alle Nachrichten aus der Kategorie: Informationstechnologie >>>

Die aktuellsten Pressemeldungen zum Suchbegriff Innovation >>>

Die letzten 5 Focus-News des innovations-reports im Überblick:

Im Focus: TU Chemnitz präsentiert weltweit einzigartige Pilotanlage für nachhaltigen Leichtbau

Wickelprinzip umgekehrt: Orbitalwickeltechnologie soll neue Maßstäbe in der großserientauglichen Fertigung komplexer Strukturbauteile setzen

Mitarbeiterinnen und Mitarbeiter des Bundesexzellenzclusters „Technologiefusion für multifunktionale Leichtbaustrukturen" (MERGE) und des Instituts für...

Im Focus: Smart Wireless Solutions: EU-Großprojekt „DEWI“ liefert Innovationen für eine drahtlose Zukunft

58 europäische Industrie- und Forschungspartner aus 11 Ländern forschten unter der Leitung des VIRTUAL VEHICLE drei Jahre lang, um Europas führende Position im Bereich Embedded Systems und dem Internet of Things zu stärken. Die Ergebnisse von DEWI (Dependable Embedded Wireless Infrastructure) wurden heute in Graz präsentiert. Zu sehen war eine Fülle verschiedenster Anwendungen drahtloser Sensornetzwerke und drahtloser Kommunikation – von einer Forschungsrakete über Demonstratoren zur Gebäude-, Fahrzeug- oder Eisenbahntechnik bis hin zu einem voll vernetzten LKW.

Was vor wenigen Jahren noch nach Science-Fiction geklungen hätte, ist in seinem Ansatz bereits Wirklichkeit und wird in Zukunft selbstverständlicher Teil...

Im Focus: Weltweit einzigartiger Windkanal im Leipziger Wolkenlabor hat Betrieb aufgenommen

Am Leibniz-Institut für Troposphärenforschung (TROPOS) ist am Dienstag eine weltweit einzigartige Anlage in Betrieb genommen worden, mit der die Einflüsse von Turbulenzen auf Wolkenprozesse unter präzise einstellbaren Versuchsbedingungen untersucht werden können. Der neue Windkanal ist Teil des Leipziger Wolkenlabors, in dem seit 2006 verschiedenste Wolkenprozesse simuliert werden. Unter Laborbedingungen wurden z.B. das Entstehen und Gefrieren von Wolken nachgestellt. Wie stark Luftverwirbelungen diese Prozesse beeinflussen, konnte bisher noch nicht untersucht werden. Deshalb entstand in den letzten Jahren eine ergänzende Anlage für rund eine Million Euro.

Die von dieser Anlage zu erwarteten neuen Erkenntnisse sind wichtig für das Verständnis von Wetter und Klima, wie etwa die Bildung von Niederschlag und die...

Im Focus: Nanoskopie auf dem Chip: Mikroskopie in HD-Qualität

Neue Erfindung der Universitäten Bielefeld und Tromsø (Norwegen)

Physiker der Universität Bielefeld und der norwegischen Universität Tromsø haben einen Chip entwickelt, der super-auflösende Lichtmikroskopie, auch...

Im Focus: Löschbare Tinte für den 3-D-Druck

Im 3-D-Druckverfahren durch Direktes Laserschreiben können Mikrometer-große Strukturen mit genau definierten Eigenschaften geschrieben werden. Forscher des Karlsruher Institus für Technologie (KIT) haben ein Verfahren entwickelt, durch das sich die 3-D-Tinte für die Drucker wieder ‚wegwischen‘ lässt. Die bis zu hundert Nanometer kleinen Strukturen lassen sich dadurch wiederholt auflösen und neu schreiben - ein Nanometer entspricht einem millionstel Millimeter. Die Entwicklung eröffnet der 3-D-Fertigungstechnik vielfältige neue Anwendungen, zum Beispiel in der Biologie oder Materialentwicklung.

Beim Direkten Laserschreiben erzeugt ein computergesteuerter, fokussierter Laserstrahl in einem Fotolack wie ein Stift die Struktur. „Eine Tinte zu entwickeln,...

Alle Focus-News des Innovations-reports >>>

Anzeige

Anzeige

IHR
JOB & KARRIERE
SERVICE
im innovations-report
in Kooperation mit academics
Veranstaltungen

Internationaler Tag der Immunologie - 29. April 2017

28.04.2017 | Veranstaltungen

Kampf gegen multiresistente Tuberkulose – InfectoGnostics trifft MYCO-NET²-Partner in Peru

28.04.2017 | Veranstaltungen

123. Internistenkongress: Traumata, Sprachbarrieren, Infektionen und Bürokratie – Herausforderungen

27.04.2017 | Veranstaltungen

 
VideoLinks
B2B-VideoLinks
Weitere VideoLinks >>>
Aktuelle Beiträge

Über zwei Millionen für bessere Bordnetze

28.04.2017 | Förderungen Preise

Symbiose-Bakterien: Vom blinden Passagier zum Leibwächter des Wollkäfers

28.04.2017 | Biowissenschaften Chemie

Wie Pflanzen ihre Zucker leitenden Gewebe bilden

28.04.2017 | Biowissenschaften Chemie