Forum für Wissenschaft, Industrie und Wirtschaft

Hauptsponsoren:     3M 
Datenbankrecherche:

 

Computer erkennt Tierstimmen

15.03.2006


Einem jungen Informatiker der Technischen Universität (TU) Wien ist es gelungen, dass der Computer automatisch Tierstimmen erkennt. Während die Spracherkennung in der Audioverarbeitung zu einem sehr gut erforschten Gebiet gehört, zählt die Geräuscherkennung noch zu den eher weißen Flecken auf der Forschungslandschaft.



Das Hören ist nach dem Sehen der zweitwichtigste menschliche Sinn. Was die automatische Erkennung von Audiosignalen betrifft, so liegt der Schwerpunkt meist auf der Erkennung von Sprache und Musik. Die meisten Geräusche in unserer Umgebung sind jedoch Umgebungsgeräusche, d.h. weder Sprache noch Musik. Umgebungsgeräusche enthalten wichtige Informationen und werden ständig zur Orientierung verwendet. Der Informatik-Student Matthias Zeppelzauer an der Technischen Universität Wien hat sich nun intensiv mit dem Forschungsgebiet der Umgebungsgeräusche auseinandergesetzt und konnte beim Erkennen von Tierstimmen via Computer große Erfolge erzielen.



Warum sich Matthias Zeppelzauer gerade auf das Erkennen von Tierstimmen verlegt hat? "Zu Beginn meiner Diplomarbeit lag mein Interesse auf der Spracherkennung. Im Zuge meiner Nachforschungen stellte sich aber heraus, dass das Gebiet der Spracherkennung zu einem der meist erforschten Gebiete in der Audioverarbeitung zählt. Die mit der Spracherkennung eng verwandte Geräuscherkennung ist weit weniger erforscht und bot sich dadurch als Herausforderung für meine Diplomarbeit an."

Nachdem bisher nur wenige Techniken für die Erkennung von Umgebungsgeräuschen existieren, hat Zeppelzauer Methoden aus anderen Bereichen der Audioverarbeitung herangezogen: Merkmale, die ursprünglich für Spracherkennung verwendet wurden, und Methoden aus dem Music Information Retrieval. Beim Music Information Retrieval handelt es sich um ein interdisziplinäres Gebiet, das sich beispielsweise mit der Gewinnung von verwertbarer Information aus der Musik befasst. Matthias Zeppelzauer hat die Techniken so "umgemodelt", dass der Computer die unterschiedlichen Tierstimmen erkennen kann.

Zeppelzauers Methode im Detail

Der Ausgangspunkt für den Erkennungsprozess ist eine große Datenbank mit Tierstimmen. Die Datenbank enthält kurze Ausschnitte von Geräuschen verschiedener Tieren (z. B. Hundegebell und Vogelgesang). Aus diesen Geräuschsegmenten werden im ersten Schritt Merkmale extrahiert. Um möglichst viel Information über die Tierstimmen zu erhalten, werden im nächsten Schritt mehrere unabhängige Merkmale miteinander kombiniert. Die Auswahl geeigneter Merkmale erfolgt dabei einerseits empirisch und andererseits mittels statistischer Datenanalyse.

Im letzten Schritt kommt ein Klassifikator zum Einsatz, um die unterschiedlichen Tierstimmen zu unterscheiden. Zuerst muss der Klassifikator lernen, wie sich die Tierstimmen voneinander unterscheiden. Dazu werden ihm eine Reihe von Tierstimmen zusammen mit den Namen der zugehörigen Tiere präsentiert. Ausgehend von diesen Informationen baut der Klassifikator ein Modell der Tierstimmen auf. Mit diesem Modell können nun neue Tierstimmen, den bereits bekannten Tierstimmen zugeordnet werden. Der Klassifikator berechnet dabei für jede Tierstimme das wahrscheinlichste Tier.

Der TU-Informatiker entwickelte eine Gruppe neuer Unterscheidungsmerkmale, so genannte Amplituden Deskriptoren. Sie erlauben eine kompakte und aussagekräftige Beschreibung der ursprünglichen Geräusche. Amplituden Deskriptoren beschreiben Eigenschaften eines Audio-Signals, die auch für die menschliche Wahrnehmung maßgeblich sind. Mithilfe eines Algorithmus, der auf bekannten Geräuschen trainiert wird, wird die Erkennung neuer Tiergeräusche durch den Computer möglich.

In Zukunft sollen komplexere Klassifikatoren und andere Merkmale (z.B. MPEG-7 Deskriptoren) für die Geräuscherkennung zur Anwendung kommen, um eine große Herausforderung anzunehmen: das Tierverstehen, bei dem Tiergeräusche einer einzigen Spezies unterschieden werden müssen. Eine solche Technik könnte in Zukunft der computerunterstützten Analyse von Tierverhalten dienen.

Auszeichnung mit dem PRIP-Preis 2005 der TU Wien

Matthias Zeppelzauers wissenschaftliche Leistungen wurden auch innerhalb der Fakultät für Informatik an der TU Wien als hervorragend eingestuft und so wurde er mit dem PRIP-Preis 2005 ausgezeichnet.

Der PRIP Preis (PRIP=Pattern Recognition and Image Processing) wird jährlich von der Arbeitsgruppe für Mustererkennung und Bildverarbeitung des Instituts für Rechnergestützte Automation der TU Wien an Studierende vergeben, die auf diesem Gebiet hervorragende Leistungen erbracht haben. Der Preis ist mit insgesamt 2.700,- Euro dotiert und wird von österreichischen IT-Unternehmen gesponsert. Er wird in den Kategorien "Magisterstudium" und "Bakkalaureatsstudium" verliehen.

Die Jury unter der Leitung von Professor Walter Kropatsch (PRIP, TU Wien) setzt sich aus ForscherInnen der TU Wien und VertreterInnen der Sponsoren zusammen. Die GewinnerInnen werden in einem zweistufigen Verfahren ermittelt.

Rückfragehinweis:

Dipl.-Ing. Matthias Zeppelzauer
Technische Universität Wien
Institut für Softwaretechnik und Interaktive Systeme
E: zeppelzauer@ims.tuwien.ac.at
T: +43-(0)1-58801-18847

Mag. Karin Peter | idw
Weitere Informationen:
http://www.prip.tuwien.ac.at
http://www.prip.tuwien.ac.at/Teaching/PripPreis

Weitere Berichte zu: Erkennung Klassifikator Spracherkennung Tierstimme

Weitere Nachrichten aus der Kategorie Informationstechnologie:

nachricht Erster Modularer Supercomputer weltweit geht am Forschungszentrum Jülich in Betrieb
14.11.2017 | Forschungszentrum Jülich GmbH

nachricht Online-Computerspiele verändern das Gehirn
09.11.2017 | Universität Ulm

Alle Nachrichten aus der Kategorie: Informationstechnologie >>>

Die aktuellsten Pressemeldungen zum Suchbegriff Innovation >>>

Die letzten 5 Focus-News des innovations-reports im Überblick:

Im Focus: Ultrakalte chemische Prozesse: Physikern gelingt beispiellose Vermessung auf Quantenniveau

Wissenschaftler um den Ulmer Physikprofessor Johannes Hecker Denschlag haben chemische Prozesse mit einer beispiellosen Auflösung auf Quantenniveau vermessen. Bei ihrer wissenschaftlichen Arbeit kombinierten die Forscher Theorie und Experiment und können so erstmals die Produktzustandsverteilung über alle Quantenzustände hinweg - unmittelbar nach der Molekülbildung - nachvollziehen. Die Forscher haben ihre Erkenntnisse in der renommierten Fachzeitschrift "Science" publiziert. Durch die Ergebnisse wird ein tieferes Verständnis zunehmend komplexer chemischer Reaktionen möglich, das zukünftig genutzt werden kann, um Reaktionsprozesse auf Quantenniveau zu steuern.

Einer deutsch-amerikanischen Forschergruppe ist es gelungen, chemische Prozesse mit einer nie dagewesenen Auflösung auf Quantenniveau zu vermessen. Dadurch...

Im Focus: Leoniden 2017: Sternschnuppen im Anflug?

Gemeinsame Pressemitteilung der Vereinigung der Sternfreunde und des Hauses der Astronomie in Heidelberg

Die Sternschnuppen der Leoniden sind in diesem Jahr gut zu beobachten, da kein Mondlicht stört. Experten sagen für die Nächte vom 16. auf den 17. und vom 17....

Im Focus: «Kosmische Schlange» lässt die Struktur von fernen Galaxien erkennen

Die Entstehung von Sternen in fernen Galaxien ist noch weitgehend unerforscht. Astronomen der Universität Genf konnten nun erstmals ein sechs Milliarden Lichtjahre entferntes Sternensystem genauer beobachten – und damit frühere Simulationen der Universität Zürich stützen. Ein spezieller Effekt ermöglicht mehrfach reflektierte Bilder, die sich wie eine Schlange durch den Kosmos ziehen.

Heute wissen Astronomen ziemlich genau, wie sich Sterne in der jüngsten kosmischen Vergangenheit gebildet haben. Aber gelten diese Gesetzmässigkeiten auch für...

Im Focus: A “cosmic snake” reveals the structure of remote galaxies

The formation of stars in distant galaxies is still largely unexplored. For the first time, astron-omers at the University of Geneva have now been able to closely observe a star system six billion light-years away. In doing so, they are confirming earlier simulations made by the University of Zurich. One special effect is made possible by the multiple reflections of images that run through the cosmos like a snake.

Today, astronomers have a pretty accurate idea of how stars were formed in the recent cosmic past. But do these laws also apply to older galaxies? For around a...

Im Focus: Pflanzenvielfalt von Wäldern aus der Luft abbilden

Produktivität und Stabilität von Waldökosystemen hängen stark von der funktionalen Vielfalt der Pflanzengemeinschaften ab. UZH-Forschenden gelang es, die Pflanzenvielfalt von Wäldern durch Fernerkundung mit Flugzeugen in verschiedenen Massstäben zu messen und zu kartieren – von einzelnen Bäumen bis hin zu ganzen Artengemeinschaften. Die neue Methode ebnet den Weg, um zukünftig die globale Pflanzendiversität aus der Luft und aus dem All zu überwachen.

Ökologische Studien zeigen, dass die Pflanzenvielfalt zentral ist für das Funktionieren von Ökosys-temen. Wälder mit einer höheren funktionalen Vielfalt –...

Alle Focus-News des Innovations-reports >>>

Anzeige

Anzeige

IHR
JOB & KARRIERE
SERVICE
im innovations-report
in Kooperation mit academics
Veranstaltungen

Technologievorsprung durch Textiltechnik

17.11.2017 | Veranstaltungen

Roboter für ein gesundes Altern: „European Robotics Week 2017“ an der Frankfurt UAS

17.11.2017 | Veranstaltungen

Börse für Zukunftstechnologien – Leichtbautag Stade bringt Unternehmen branchenübergreifend zusammen

17.11.2017 | Veranstaltungen

 
VideoLinks
B2B-VideoLinks
Weitere VideoLinks >>>
Aktuelle Beiträge

Technologievorsprung durch Textiltechnik

17.11.2017 | Veranstaltungsnachrichten

IHP präsentiert sich auf der productronica 2017

17.11.2017 | Messenachrichten

Roboter schafft den Salto rückwärts

17.11.2017 | Innovative Produkte