Forum für Wissenschaft, Industrie und Wirtschaft

Hauptsponsoren:     3M 
Datenbankrecherche:

 

Gesprächsprotokolle auf Knopfdruck?

11.04.2005


Heidelberger Forschungsinstitut EML Research arbeitet an System zur automatischen Zusammenfassung gesprochener Dialoge - Ziel: Protokolle auf Knopfdruck - Weitere Anwendung: verbesserte Archivierung von Hörfunksendungen



Täglich finden unzählige Besprechungen, Verhandlungen und Diskussionen statt. Oft schreibt einer der Teilnehmer fleißig Notizen, um später ein Protokoll anzufertigen - eine meist ungeliebte Aufgabe. Wie schön wäre es, ein prägnantes und aussagekräftiges Protokoll auf Knopfdruck zu erhalten! Computerlinguisten des Heidelberger Forschungsinstituts EML Research arbeiten daran, diese Vorstellung in die Tat umzusetzen: Sie wollen mit intelligenter Software gesprochene Dialoge automatisch zusammenfassen. Ziel des neuen Projekts "DIANA-Summ" (DIalog ANAphors and Summarization) ist es, die automatische Erzeugung von Gesprächsprotokollen zu ermöglichen. Denkbare zukünftige Anwendungen wären zum Beispiel Ergebnisprotokolle von Sitzungen oder auch Zusammenfassungen von Hörfunkbeiträgen, die helfen können, Sendungen aus den Archiven schnell wiederzufinden. Die Deutsche Forschungsgemeinschaft (DFG) fördert "DIANA-Summ" für zwei Jahre. Die Projektleitung hat der Sprachwissenschaftler Dr. Michael Strube, Leiter der Forschungsgruppe Natural Language Processing bei EML Research.



Die automatische Zusammenfassung von Texten wird schon seit fast fünfzig Jahren erforscht. Die vorherrschende Methode basiert auf einfachen statistischen Verfahren: Sie berechnet die Summe der Wichtigkeit aller Wörter in einem Satz, zieht die Sätze mit der höchsten Summe heraus und fasst den Text dadurch zusammen. Die computerlinguistische Forschung hat diese Methode mittlerweile verfeinert, nicht aber grundsätzlich geändert.

Gesprochene Sprache hat jedoch ihre eigenen Gesetze. Wir sprechen ohne Punkt und Komma. Wenn wir die Aufzeichnung eines unserer eigenen Gespräche hören, stellen wir schnell fest, dass wir uns häufig selbst und gegenseitig unterbrechen, dass wir Sätze nicht vollständig aussprechen, dass wir uns selbst korrigieren, Wiederholungen einfügen oder Denkpausen mit "Ähs" füllen. Um Gespräche mit computerlinguistischen Methoden sinnvoll weiterzuverarbeiten, müssen all diese Störphänomene zunächst erkannt und gegebenenfalls entfernt werden. Erst dann können herkömmliche Verfahren zur automatischen Textzusammenfassung auch auf Gespräche angewendet werden.

Außerdem werden in Dialogen Verweiswörter, sogenannte Anaphern, viel häufiger als in Texten verwendet, zum Beispiel Personalpronomen wie "es", "sie" und "er", oder Demonstrativpronomen wie "diese" und "das". Während solche Ausdrücke in Texten vorwiegend dazu verwendet werden, um auf konkrete Dinge zu verweisen, gibt es in Dialogen viele Pronomen, die sich auf abstrakte Dinge beziehen, etwa auf Tatsachen ("Das glaube ich nicht.") oder auf Äußerungen im Dialog selbst ("Können Sie das noch einmal wiederholen?"). Ohne die verschiedenen Arten von Pronomen voneinander zu unterscheiden und aufzulösen, können Gespräche nicht sinnvoll zusammengefasst werden, so die These der Wissenschaftler von EML Research. Mit Pronomen tun sich sprachverstehende Computersysteme aber sehr schwer, weil ihnen das Wissen um den Gesamtzusammenhang fehlt, in dem die Aussage steht. Ein Ziel der Forschung ist es deshalb, dass der Computer lernt, die Pronomen in den Kontext einzuordnen. Wie auch bei der automatischen Zusammenfassung wenden die EML Research-Wissenschaftler hierfür quantitative oder statistische Verfahren an, die Muster in der Sprache erkennen. Der Vorteil dieser Methode liegt darin, dass sie unabhängig von einem eng begrenzten Thema auf ganz unterschiedliche Gespräche angewendet werden kann. Der Computer muss nur mit möglichst vielen Gesprächen "gefüttert" und so "trainiert" werden.

Gegenwärtige Spracherkennungssysteme sind indes noch nicht so weit entwickelt, dass der Computer mit spontanen Äußerungen zu beliebigen Themen "gefüttert" werden kann, die in alltäglichen Diskussionen vorkommen. Deshalb arbeiten die EML Research-Wissenschaftler mit einer Aufzeichnung von 72 Stunden gesprochener Dialoge, die das International Computer Science Institute (ICSI) in Berkeley, USA, aufgebaut hat. Die Gespräche sind bereits verschriftlicht. Damit der Computer aus ihnen lernen kann, müssen sie von Hand mit linguistischen und anderen Informationen angereichert, das heißt annotiert werden. Die annotierten Texte fließen wieder zurück in das ICSI Meeting-Corpus und stehen damit auch anderen Computerlinguisten zur Verfügung. Mit den annotierten Texten wird der Computer dann "trainiert". Als Abschluss des Projekts "DIANA-Summ" ist die Entwicklung einer Komponente geplant, die mit Hilfe eines Spracherkenners die Verschriftlichung der Gespräche selbst durchführt.

Dadurch könnte das System vollständig automatisch Protokolle erstellen. Beim gegenwärtigen Stand der Technik wird es aber wohl noch einige Jahre dauern, bis ein solches System reibungslos arbeiten kann.

Die EML Research gGmbH (www.eml-research.de) ist ein gemeinnütziges Forschungsinstitut für Grundlagenforschung in der angewandten Informatik. Ein Hauptschwerpunkt der Forschung liegt in der Computerlinguistik. Die Forscher arbeiten eng mit Universitäten zusammen. Die EML Research gGmbH wird von der Klaus Tschira Stiftung gGmbH (KTS) (www.kts.villa-bosch.de) gefördert. Forschungsprojekte des Instituts werden auch durch die Europäische Union, die Deutschen Forschungsgemeinschaft (DFG) und das Bundesministerium für Bildung und Forschung (BMBF) unterstützt.

Für weitere Informationen wenden Sie sich bitte an:

Dr. Peter Saueressig
EML Research gGmbH
Presse- und Öffentlichkeitsarbeit
Tel: +49-6221-533-245
Fax: +49-6221-533-198
peter.saueressig@eml-research.de

Wissenschaftlicher Ansprechpartner:
Dr. Michael Strube
Leiter der Forschungsgruppe Natural Language Processing
EML Research gGmbH
Tel: +49-6221-533-243
Fax: +49-6221-533-298

Dr. Peter Saueressig | idw
Weitere Informationen:
http://www.eml-research.de/deutsch/presse/press_include_d.php?we_objectID=236

Weitere Berichte zu: Aufzeichnung Forschungsinstitut Language Zusammenfassung

Weitere Nachrichten aus der Kategorie Informationstechnologie:

nachricht Pepper, der neue Kollege im Altenheim
17.08.2017 | Universität Siegen

nachricht Komfortable Software für die Genomanalyse
16.08.2017 | Technische Hochschule Mittelhessen

Alle Nachrichten aus der Kategorie: Informationstechnologie >>>

Die aktuellsten Pressemeldungen zum Suchbegriff Innovation >>>

Die letzten 5 Focus-News des innovations-reports im Überblick:

Im Focus: Mit Barcodes der Zellentwicklung auf der Spur

Darüber, wie sich Blutzellen entwickeln, existieren verschiedene Auffassungen – sie basieren jedoch fast ausschließlich auf Experimenten, die lediglich Momentaufnahmen widerspiegeln. Wissenschaftler des Deutschen Krebsforschungszentrums stellen nun im Fachjournal Nature eine neue Technik vor, mit der sich das Geschehen dynamisch erfassen lässt: Mithilfe eines „Zufallsgenerators“ versehen sie Blutstammzellen mit genetischen Barcodes und können so verfolgen, welche Zelltypen aus der Stammzelle hervorgehen. Diese Technik erlaubt künftig völlig neue Einblicke in die Entwicklung unterschiedlicher Gewebe sowie in die Krebsentstehung.

Wie entsteht die Vielzahl verschiedener Zelltypen im Blut? Diese Frage beschäftigt Wissenschaftler schon lange. Nach der klassischen Vorstellung fächern sich...

Im Focus: Fizzy soda water could be key to clean manufacture of flat wonder material: Graphene

Whether you call it effervescent, fizzy, or sparkling, carbonated water is making a comeback as a beverage. Aside from quenching thirst, researchers at the University of Illinois at Urbana-Champaign have discovered a new use for these "bubbly" concoctions that will have major impact on the manufacturer of the world's thinnest, flattest, and one most useful materials -- graphene.

As graphene's popularity grows as an advanced "wonder" material, the speed and quality at which it can be manufactured will be paramount. With that in mind,...

Im Focus: Forscher entwickeln maisförmigen Arzneimittel-Transporter zum Inhalieren

Er sieht aus wie ein Maiskolben, ist winzig wie ein Bakterium und kann einen Wirkstoff direkt in die Lungenzellen liefern: Das zylinderförmige Vehikel für Arzneistoffe, das Pharmazeuten der Universität des Saarlandes entwickelt haben, kann inhaliert werden. Professor Marc Schneider und sein Team machen sich dabei die körpereigene Abwehr zunutze: Makrophagen, die Fresszellen des Immunsystems, fressen den gesundheitlich unbedenklichen „Nano-Mais“ und setzen dabei den in ihm enthaltenen Wirkstoff frei. Bei ihrer Forschung arbeiteten die Pharmazeuten mit Forschern der Medizinischen Fakultät der Saar-Uni, des Leibniz-Instituts für Neue Materialien und der Universität Marburg zusammen Ihre Forschungsergebnisse veröffentlichten die Wissenschaftler in der Fachzeitschrift Advanced Healthcare Materials. DOI: 10.1002/adhm.201700478

Ein Medikament wirkt nur, wenn es dort ankommt, wo es wirken soll. Wird ein Mittel inhaliert, muss der Wirkstoff in der Lunge zuerst die Hindernisse...

Im Focus: Exotische Quantenzustände: Physiker erzeugen erstmals optische „Töpfe" für ein Super-Photon

Physikern der Universität Bonn ist es gelungen, optische Mulden und komplexere Muster zu erzeugen, in die das Licht eines Bose-Einstein-Kondensates fließt. Die Herstellung solch sehr verlustarmer Strukturen für Licht ist eine Voraussetzung für komplexe Schaltkreise für Licht, beispielsweise für die Quanteninformationsverarbeitung einer neuen Computergeneration. Die Wissenschaftler stellen nun ihre Ergebnisse im Fachjournal „Nature Photonics“ vor.

Lichtteilchen (Photonen) kommen als winzige, unteilbare Portionen vor. Viele Tausend dieser Licht-Portionen lassen sich zu einem einzigen Super-Photon...

Im Focus: Exotic quantum states made from light: Physicists create optical “wells” for a super-photon

Physicists at the University of Bonn have managed to create optical hollows and more complex patterns into which the light of a Bose-Einstein condensate flows. The creation of such highly low-loss structures for light is a prerequisite for complex light circuits, such as for quantum information processing for a new generation of computers. The researchers are now presenting their results in the journal Nature Photonics.

Light particles (photons) occur as tiny, indivisible portions. Many thousands of these light portions can be merged to form a single super-photon if they are...

Alle Focus-News des Innovations-reports >>>

Anzeige

Anzeige

IHR
JOB & KARRIERE
SERVICE
im innovations-report
in Kooperation mit academics
Veranstaltungen

Einblicke ins menschliche Denken

17.08.2017 | Veranstaltungen

Eröffnung der INC.worX-Erlebniswelt während der Technologie- und Innovationsmanagement-Tagung 2017

16.08.2017 | Veranstaltungen

Sensibilisierungskampagne zu Pilzinfektionen

15.08.2017 | Veranstaltungen

 
VideoLinks
B2B-VideoLinks
Weitere VideoLinks >>>
Aktuelle Beiträge

Scharfe Röntgenblitze aus dem Atomkern

17.08.2017 | Physik Astronomie

Fake News finden und bekämpfen

17.08.2017 | Interdisziplinäre Forschung

Effizienz steigern, Kosten senken!

17.08.2017 | Messenachrichten