Forum für Wissenschaft, Industrie und Wirtschaft

Hauptsponsoren:     3M 
Datenbankrecherche:

 

Gesprächsprotokolle auf Knopfdruck?

11.04.2005


Heidelberger Forschungsinstitut EML Research arbeitet an System zur automatischen Zusammenfassung gesprochener Dialoge - Ziel: Protokolle auf Knopfdruck - Weitere Anwendung: verbesserte Archivierung von Hörfunksendungen



Täglich finden unzählige Besprechungen, Verhandlungen und Diskussionen statt. Oft schreibt einer der Teilnehmer fleißig Notizen, um später ein Protokoll anzufertigen - eine meist ungeliebte Aufgabe. Wie schön wäre es, ein prägnantes und aussagekräftiges Protokoll auf Knopfdruck zu erhalten! Computerlinguisten des Heidelberger Forschungsinstituts EML Research arbeiten daran, diese Vorstellung in die Tat umzusetzen: Sie wollen mit intelligenter Software gesprochene Dialoge automatisch zusammenfassen. Ziel des neuen Projekts "DIANA-Summ" (DIalog ANAphors and Summarization) ist es, die automatische Erzeugung von Gesprächsprotokollen zu ermöglichen. Denkbare zukünftige Anwendungen wären zum Beispiel Ergebnisprotokolle von Sitzungen oder auch Zusammenfassungen von Hörfunkbeiträgen, die helfen können, Sendungen aus den Archiven schnell wiederzufinden. Die Deutsche Forschungsgemeinschaft (DFG) fördert "DIANA-Summ" für zwei Jahre. Die Projektleitung hat der Sprachwissenschaftler Dr. Michael Strube, Leiter der Forschungsgruppe Natural Language Processing bei EML Research.



Die automatische Zusammenfassung von Texten wird schon seit fast fünfzig Jahren erforscht. Die vorherrschende Methode basiert auf einfachen statistischen Verfahren: Sie berechnet die Summe der Wichtigkeit aller Wörter in einem Satz, zieht die Sätze mit der höchsten Summe heraus und fasst den Text dadurch zusammen. Die computerlinguistische Forschung hat diese Methode mittlerweile verfeinert, nicht aber grundsätzlich geändert.

Gesprochene Sprache hat jedoch ihre eigenen Gesetze. Wir sprechen ohne Punkt und Komma. Wenn wir die Aufzeichnung eines unserer eigenen Gespräche hören, stellen wir schnell fest, dass wir uns häufig selbst und gegenseitig unterbrechen, dass wir Sätze nicht vollständig aussprechen, dass wir uns selbst korrigieren, Wiederholungen einfügen oder Denkpausen mit "Ähs" füllen. Um Gespräche mit computerlinguistischen Methoden sinnvoll weiterzuverarbeiten, müssen all diese Störphänomene zunächst erkannt und gegebenenfalls entfernt werden. Erst dann können herkömmliche Verfahren zur automatischen Textzusammenfassung auch auf Gespräche angewendet werden.

Außerdem werden in Dialogen Verweiswörter, sogenannte Anaphern, viel häufiger als in Texten verwendet, zum Beispiel Personalpronomen wie "es", "sie" und "er", oder Demonstrativpronomen wie "diese" und "das". Während solche Ausdrücke in Texten vorwiegend dazu verwendet werden, um auf konkrete Dinge zu verweisen, gibt es in Dialogen viele Pronomen, die sich auf abstrakte Dinge beziehen, etwa auf Tatsachen ("Das glaube ich nicht.") oder auf Äußerungen im Dialog selbst ("Können Sie das noch einmal wiederholen?"). Ohne die verschiedenen Arten von Pronomen voneinander zu unterscheiden und aufzulösen, können Gespräche nicht sinnvoll zusammengefasst werden, so die These der Wissenschaftler von EML Research. Mit Pronomen tun sich sprachverstehende Computersysteme aber sehr schwer, weil ihnen das Wissen um den Gesamtzusammenhang fehlt, in dem die Aussage steht. Ein Ziel der Forschung ist es deshalb, dass der Computer lernt, die Pronomen in den Kontext einzuordnen. Wie auch bei der automatischen Zusammenfassung wenden die EML Research-Wissenschaftler hierfür quantitative oder statistische Verfahren an, die Muster in der Sprache erkennen. Der Vorteil dieser Methode liegt darin, dass sie unabhängig von einem eng begrenzten Thema auf ganz unterschiedliche Gespräche angewendet werden kann. Der Computer muss nur mit möglichst vielen Gesprächen "gefüttert" und so "trainiert" werden.

Gegenwärtige Spracherkennungssysteme sind indes noch nicht so weit entwickelt, dass der Computer mit spontanen Äußerungen zu beliebigen Themen "gefüttert" werden kann, die in alltäglichen Diskussionen vorkommen. Deshalb arbeiten die EML Research-Wissenschaftler mit einer Aufzeichnung von 72 Stunden gesprochener Dialoge, die das International Computer Science Institute (ICSI) in Berkeley, USA, aufgebaut hat. Die Gespräche sind bereits verschriftlicht. Damit der Computer aus ihnen lernen kann, müssen sie von Hand mit linguistischen und anderen Informationen angereichert, das heißt annotiert werden. Die annotierten Texte fließen wieder zurück in das ICSI Meeting-Corpus und stehen damit auch anderen Computerlinguisten zur Verfügung. Mit den annotierten Texten wird der Computer dann "trainiert". Als Abschluss des Projekts "DIANA-Summ" ist die Entwicklung einer Komponente geplant, die mit Hilfe eines Spracherkenners die Verschriftlichung der Gespräche selbst durchführt.

Dadurch könnte das System vollständig automatisch Protokolle erstellen. Beim gegenwärtigen Stand der Technik wird es aber wohl noch einige Jahre dauern, bis ein solches System reibungslos arbeiten kann.

Die EML Research gGmbH (www.eml-research.de) ist ein gemeinnütziges Forschungsinstitut für Grundlagenforschung in der angewandten Informatik. Ein Hauptschwerpunkt der Forschung liegt in der Computerlinguistik. Die Forscher arbeiten eng mit Universitäten zusammen. Die EML Research gGmbH wird von der Klaus Tschira Stiftung gGmbH (KTS) (www.kts.villa-bosch.de) gefördert. Forschungsprojekte des Instituts werden auch durch die Europäische Union, die Deutschen Forschungsgemeinschaft (DFG) und das Bundesministerium für Bildung und Forschung (BMBF) unterstützt.

Für weitere Informationen wenden Sie sich bitte an:

Dr. Peter Saueressig
EML Research gGmbH
Presse- und Öffentlichkeitsarbeit
Tel: +49-6221-533-245
Fax: +49-6221-533-198
peter.saueressig@eml-research.de

Wissenschaftlicher Ansprechpartner:
Dr. Michael Strube
Leiter der Forschungsgruppe Natural Language Processing
EML Research gGmbH
Tel: +49-6221-533-243
Fax: +49-6221-533-298

Dr. Peter Saueressig | idw
Weitere Informationen:
http://www.eml-research.de/deutsch/presse/press_include_d.php?we_objectID=236

Weitere Berichte zu: Aufzeichnung Forschungsinstitut Language Zusammenfassung

Weitere Nachrichten aus der Kategorie Informationstechnologie:

nachricht Maschinelles Lernen: Neue Methode ermöglicht genaue Extrapolation
13.07.2018 | Institute of Science and Technology Austria

nachricht Gegen das Verblassen historischer Dokumente
11.07.2018 | Hochschule für Technik, Wirtschaft und Kultur Leipzig

Alle Nachrichten aus der Kategorie: Informationstechnologie >>>

Die aktuellsten Pressemeldungen zum Suchbegriff Innovation >>>

Die letzten 5 Focus-News des innovations-reports im Überblick:

Im Focus: Superscharfe Bilder von der neuen Adaptiven Optik des VLT

Das Very Large Telescope (VLT) der ESO hat das erste Licht mit einem neuen Modus Adaptiver Optik erreicht, die als Lasertomografie bezeichnet wird – und hat in diesem Rahmen bemerkenswert scharfe Testbilder vom Planeten Neptun, von Sternhaufen und anderen Objekten aufgenommen. Das bahnbrechende MUSE-Instrument kann ab sofort im sogenannten Narrow-Field-Modus mit dem adaptiven Optikmodul GALACSI diese neue Technik nutzen, um Turbulenzen in verschiedenen Höhen in der Erdatmosphäre zu korrigieren. Damit ist jetzt möglich, Bilder vom Erdboden im sichtbaren Licht aufzunehmen, die schärfer sind als die des NASA/ESA Hubble-Weltraumteleskops. Die Kombination aus exquisiter Bildschärfe und den spektroskopischen Fähigkeiten von MUSE wird es den Astronomen ermöglichen, die Eigenschaften astronomischer Objekte viel detaillierter als bisher zu untersuchen.

Das MUSE-Instrument (kurz für Multi Unit Spectroscopic Explorer) am Very Large Telescope (VLT) der ESO arbeitet mit einer adaptiven Optikeinheit namens GALACSI. Dabei kommt auch die Laser Guide Stars Facility, kurz ...

Im Focus: Diamant – ein unverzichtbarer Werkstoff der Fusionstechnologie

Forscher am KIT entwickeln Fenstereinheiten mit Diamantscheiben für Fusionsreaktoren – Neue Scheibe mit Rekorddurchmesser von 180 Millimetern

Klimafreundliche und fast unbegrenzte Energie aus dem Fusionskraftwerk – für dieses Ziel kooperieren Wissenschaftlerinnen und Wissenschaftler weltweit. Bislang...

Im Focus: Wiener Forscher finden vollkommen neues Konzept zur Messung von Quantenverschränkung

Quantenphysiker/innen der ÖAW entwickelten eine neuartige Methode für den Nachweis von hochdimensional verschränkten Quantensystemen. Diese ermöglicht mehr Effizienz, Sicherheit und eine weitaus geringere Fehleranfälligkeit gegenüber bisher gängigen Mess-Methoden, wie die Forscher/innen nun im Fachmagazin „Nature Physics“ berichten.

Die Vision einer vollständig abhörsicheren Übertragung von Information rückt dank der Verschränkung von Quantenteilchen immer mehr in Reichweite. Wird eine...

Im Focus: Was passiert, wenn wir das Atomgitter eines Magneten plötzlich aufheizen?

„Wir haben jetzt ein klares Bild davon, wie das heiße Atomgitter und die kalten magnetischen Spins eines ferrimagnetischen Nichtleiters miteinander ins Gleichgewicht gelangen“, sagt Ilie Radu, Wissenschaftler am Max-Born-Institut in Berlin. Das internationale Forscherteam fand heraus, dass eine Energieübertragung sehr schnell stattfindet und zu einem neuartigen Zustand der Materie führt, in dem die Spins zwar heiß sind, aber noch nicht ihr gesamtes magnetisches Moment verringert haben. Dieser „Spinüberdruck“ wird durch wesentlich langsamere Prozesse abgebaut, die eine Abgabe von Drehimpuls an das Gitter ermöglichen. Die Forschungsergebnisse sind jetzt in "Science Advances" erschienen.

Magnete faszinieren die Menschheit bereits seit mehreren tausend Jahren und sind im Zeitalter der digitalen Datenspeicherung von großer praktischer Bedeutung....

Im Focus: Erste Beweise für Quelle extragalaktischer Teilchen

Zum ersten Mal ist es gelungen, die kosmische Herkunft höchstenergetischer Neutrinos zu bestimmen. Eine Forschungsgruppe um IceCube-Wissenschaftlerin Elisa Resconi, Sprecherin des Sonderforschungsbereichs SFB1258 an der Technischen Universität München (TUM), liefert ein wichtiges Indiz in der Beweiskette, dass die vom Neutrino-Teleskop IceCube am Südpol detektierten Teilchen mit hoher Wahrscheinlichkeit von einer Galaxie in vier Milliarden Lichtjahren Entfernung stammen.

Um andere Ursprünge mit Gewissheit auszuschließen, untersuchte das Team um die Neutrino-Physikerin Elisa Resconi von der TU München und den Astronom und...

Alle Focus-News des Innovations-reports >>>

Anzeige

Anzeige

VideoLinks
Industrie & Wirtschaft
Veranstaltungen

Stadtklima verbessern, Energiemix optimieren, sauberes Trinkwasser bereitstellen

19.07.2018 | Veranstaltungen

Innovation – the name of the game

18.07.2018 | Veranstaltungen

Wie geht es unserer Ostsee? Ein aktueller Zustandsbericht

17.07.2018 | Veranstaltungen

VideoLinks
Wissenschaft & Forschung
Weitere VideoLinks im Überblick >>>
 
Aktuelle Beiträge

Europaweit erste Patientin mit neuem Hybridgerät zur Strahlentherapie behandelt

19.07.2018 | Medizintechnik

Waldrand oder mittendrin: Das Erbgut von Mausmakis unterscheidet sich je nach Lebensraum

19.07.2018 | Biowissenschaften Chemie

Automatisiertes Befüllen von Regalen im Einzelhandel

19.07.2018 | Verkehr Logistik

Weitere B2B-VideoLinks
IHR
JOB & KARRIERE
SERVICE
im innovations-report
in Kooperation mit academics