Forum für Wissenschaft, Industrie und Wirtschaft

Hauptsponsoren:     3M 
Datenbankrecherche:

 

Vorbild Gehirn - wie Computer hören lernen

14.08.2009
Neue Software soll Spracherkennung verbessern

Sehen, Hören, Fühlen - die Wahrnehmung der zahllosen verschiedenartigen und schnell wechselnden Reize unserer Umwelt scheint uns ganz selbstverständlich. Doch was das Gehirn scheinbar so mühelos bewältigt, stellt Computer bisher oft noch vor unlösbare Aufgaben.

Forscher des Leipziger Max-Planck-Instituts für Kognitions- und Neurowissenschaften und des Wellcome Trust Centre for Neuroimaging in London haben nun ein mathematisches Modell entwickelt, mit dem die maschinelle Wahrnehmung und Verarbeitung von gesprochener Sprache deutlich verbessert werden könnte. Diese oder ähnliche Algorithmen, die Mechanismen des Gehirns imitieren, könnten Computer in Zukunft helfen, die Welt wahrzunehmen. (PLoS Computational Biology, 12. August 2009)

Wie schwer es Computern fällt, mit gesprochener Sprache umzugehen, haben wahrscheinlich viele Menschen schon einmal erlebt. Starke Nerven braucht zum Beispiel, wer mit einem der Sprachautomaten kommuniziert, die von vielen Telefonhotlines eingesetzt werden. Wird nur ein wenig zu schnell oder zu langsam gesprochen, ist die Aussprache undeutlich oder gibt es ein Störgeräusch im Hintergrund, scheitert der Automat in der Regel. Grund dafür ist das sehr störungsanfällige Verfahren, mit dem Computerprogramme bisher Sprache verarbeiten. Der Computer versucht dabei vor allem, charakteristische Merkmale in den Frequenzen der Stimme zu erkennen, um Worte zu identifizieren.

Gehirn nutzt verschiedene zeitliche Ebenen zur Spracherkennung

"Das Gehirn nutzt wahrscheinlich ein anderes Verfahren", sagt Stefan Kiebel vom Leipziger Max Planck-Institut für Kognitions- und Neurowissenschaften. Der Forscher vermutet, dass dabei besonders die Analyse zeitlicher Abfolgen eine große Rolle spielt. "Viele Wahrnehmungsreize unserer Umwelt lassen sich als zeitliche Abfolgen beschreiben." So bestehen Musik und gesprochene Sprache aus hierarchisch aufeinander aufbauenden Abschnitten. Das Gehirn, so die Hypothese des Wissenschaftlers, unterteilt dabei die verschiedenen Signale von den kleinsten, schnell veränderlichen Elementen (z.B. einzelnen Sprachlauten wie "u" oder "e") bis hin zu den größeren, langsam veränderlichen Informationen (z.B. das Gesprächsthema). Die Bedeutung der Informationen auf verschiedenen zeitlichen Ebenen sei für die Verarbeitung von Wahrnehmungsreizen wahrscheinlich sehr viel größer als bisher angenommen. "Das Gehirn sucht permanent nach zeitlicher Struktur in der Umwelt, aus der es ableiten kann, was als nächstes passieren könnte", erklärt der Wissenschaftler. Auf diese Weise kann das Gehirn etwa, basierend auf den sich langsam verändernden Informationen, die nächsten Laute häufig bereits erahnen. So wird, wenn sich das Gesprächsthema z.B. um den heißen Sommer dreht, der Wortbeginn "So…" eher in "Sonne" als "Sofa" enden.

Um ihre Annahmen auf die Probe zu stellen, entwarfen die Forscher ein mathematisches Modell, das die neuronalen Abläufe bei der Sprachverarbeitung stark vereinfacht nachahmt. Neuronale Strukturen wurden dabei mit Algorithmen nachgebildet, die akustische Reize auf verschiedenen zeitlichen Ebenen verarbeiten sollten. Tatsächlich gelang es so, ein System zu entwerfen, das Sprache verarbeiten und einzelne Sprachlaute und Silben erkennen kann. Anders als bisherige Spracherkennungssysteme war es zudem in der Lage, auch schneller abgespielte Sprache zu verstehen. Das System besaß zudem die Fähigkeit des Gehirns, die nächsten Laute "vorherzusagen": Erwies sich eine Vorhersage dabei als falsch, weil die Forscher aus den bekannten Lauten eine unbekannte Silbe kombinierten, war das Modell fähig, den Fehler zu bemerken.

Modell eignet sich zur Spracherkennung

Die "Sprache", mit der das Modell getestet wurde, war vereinfacht - sie bestand aus den vier Vokalen a, e, i und o, die sich jeweils zu "Silben" aus vier Lauten zusammensetzten. "Zunächst ging es nur darum zu prüfen, ob die prinzipielle Annahme stimmt", erklärt Kiebel. Mit mehr Zeit und Mühe könne man aber auch die schwieriger voneinander abzugrenzenden Konsonanten einbeziehen und neben Lauten und Silben weitere Hierarchie-Ebenen für Wörter und Sätze einbauen. So ließe sich das Modell im Prinzip auch auf natürliche Sprachen übertragen.

"Interessant für die Neurowissenschaften ist, dass die Reaktionen des Modells dem ähnelten, was mit einem echten menschlichen Gehirn zu beobachten wäre", sagt Stefan Kiebel. Dies deutet darauf hin, dass das Modell der Forscher den tatsächlichen Abläufen im Gehirn entspricht. Zugleich liefert das Modell neue Ansätze für die Weiterentwicklung von maschineller Spracherkennung.

Originalveröffentlichung:

Stefan J. Kiebel, Katharina von Kriegstein, Jean Daunizeau, Karl J. Friston
Recognizing sequences of sequences
PLoS Computational Biology, 12. August 2009
Weitere Informationen erhalten Sie von:
Dr. Christina Schröder
Max-Planck-Institut für Kognitions- und Neurowissenschaften, Leipzig
Tel.: +49 (0)341 9940-132
E-Mail: cschroeder@cbs.mpg.de

Dr. Felicitas von Aretin | Max-Planck-Gesellschaft
Weitere Informationen:
http://www.mpg.de

Weitere Nachrichten aus der Kategorie Biowissenschaften Chemie:

nachricht Bakterieller Untermieter macht Blattnahrung für Käfer verdaulich
17.11.2017 | Max-Planck-Institut für chemische Ökologie

nachricht Neues Werkzeug für gezielten Proteinabbau
17.11.2017 | Max-Planck-Institut für biophysikalische Chemie

Alle Nachrichten aus der Kategorie: Biowissenschaften Chemie >>>

Die aktuellsten Pressemeldungen zum Suchbegriff Innovation >>>

Die letzten 5 Focus-News des innovations-reports im Überblick:

Im Focus: Ultrakalte chemische Prozesse: Physikern gelingt beispiellose Vermessung auf Quantenniveau

Wissenschaftler um den Ulmer Physikprofessor Johannes Hecker Denschlag haben chemische Prozesse mit einer beispiellosen Auflösung auf Quantenniveau vermessen. Bei ihrer wissenschaftlichen Arbeit kombinierten die Forscher Theorie und Experiment und können so erstmals die Produktzustandsverteilung über alle Quantenzustände hinweg - unmittelbar nach der Molekülbildung - nachvollziehen. Die Forscher haben ihre Erkenntnisse in der renommierten Fachzeitschrift "Science" publiziert. Durch die Ergebnisse wird ein tieferes Verständnis zunehmend komplexer chemischer Reaktionen möglich, das zukünftig genutzt werden kann, um Reaktionsprozesse auf Quantenniveau zu steuern.

Einer deutsch-amerikanischen Forschergruppe ist es gelungen, chemische Prozesse mit einer nie dagewesenen Auflösung auf Quantenniveau zu vermessen. Dadurch...

Im Focus: Leoniden 2017: Sternschnuppen im Anflug?

Gemeinsame Pressemitteilung der Vereinigung der Sternfreunde und des Hauses der Astronomie in Heidelberg

Die Sternschnuppen der Leoniden sind in diesem Jahr gut zu beobachten, da kein Mondlicht stört. Experten sagen für die Nächte vom 16. auf den 17. und vom 17....

Im Focus: «Kosmische Schlange» lässt die Struktur von fernen Galaxien erkennen

Die Entstehung von Sternen in fernen Galaxien ist noch weitgehend unerforscht. Astronomen der Universität Genf konnten nun erstmals ein sechs Milliarden Lichtjahre entferntes Sternensystem genauer beobachten – und damit frühere Simulationen der Universität Zürich stützen. Ein spezieller Effekt ermöglicht mehrfach reflektierte Bilder, die sich wie eine Schlange durch den Kosmos ziehen.

Heute wissen Astronomen ziemlich genau, wie sich Sterne in der jüngsten kosmischen Vergangenheit gebildet haben. Aber gelten diese Gesetzmässigkeiten auch für...

Im Focus: A “cosmic snake” reveals the structure of remote galaxies

The formation of stars in distant galaxies is still largely unexplored. For the first time, astron-omers at the University of Geneva have now been able to closely observe a star system six billion light-years away. In doing so, they are confirming earlier simulations made by the University of Zurich. One special effect is made possible by the multiple reflections of images that run through the cosmos like a snake.

Today, astronomers have a pretty accurate idea of how stars were formed in the recent cosmic past. But do these laws also apply to older galaxies? For around a...

Im Focus: Pflanzenvielfalt von Wäldern aus der Luft abbilden

Produktivität und Stabilität von Waldökosystemen hängen stark von der funktionalen Vielfalt der Pflanzengemeinschaften ab. UZH-Forschenden gelang es, die Pflanzenvielfalt von Wäldern durch Fernerkundung mit Flugzeugen in verschiedenen Massstäben zu messen und zu kartieren – von einzelnen Bäumen bis hin zu ganzen Artengemeinschaften. Die neue Methode ebnet den Weg, um zukünftig die globale Pflanzendiversität aus der Luft und aus dem All zu überwachen.

Ökologische Studien zeigen, dass die Pflanzenvielfalt zentral ist für das Funktionieren von Ökosys-temen. Wälder mit einer höheren funktionalen Vielfalt –...

Alle Focus-News des Innovations-reports >>>

Anzeige

Anzeige

IHR
JOB & KARRIERE
SERVICE
im innovations-report
in Kooperation mit academics
Veranstaltungen

Technologievorsprung durch Textiltechnik

17.11.2017 | Veranstaltungen

Roboter für ein gesundes Altern: „European Robotics Week 2017“ an der Frankfurt UAS

17.11.2017 | Veranstaltungen

Börse für Zukunftstechnologien – Leichtbautag Stade bringt Unternehmen branchenübergreifend zusammen

17.11.2017 | Veranstaltungen

 
VideoLinks
B2B-VideoLinks
Weitere VideoLinks >>>
Aktuelle Beiträge

Technologievorsprung durch Textiltechnik

17.11.2017 | Veranstaltungsnachrichten

IHP präsentiert sich auf der productronica 2017

17.11.2017 | Messenachrichten

Roboter schafft den Salto rückwärts

17.11.2017 | Innovative Produkte