Forum für Wissenschaft, Industrie und Wirtschaft

Hauptsponsoren:     3M 
Datenbankrecherche:

 

Computer erkennt Tierstimmen

15.03.2006


Einem jungen Informatiker der Technischen Universität (TU) Wien ist es gelungen, dass der Computer automatisch Tierstimmen erkennt. Während die Spracherkennung in der Audioverarbeitung zu einem sehr gut erforschten Gebiet gehört, zählt die Geräuscherkennung noch zu den eher weißen Flecken auf der Forschungslandschaft.



Das Hören ist nach dem Sehen der zweitwichtigste menschliche Sinn. Was die automatische Erkennung von Audiosignalen betrifft, so liegt der Schwerpunkt meist auf der Erkennung von Sprache und Musik. Die meisten Geräusche in unserer Umgebung sind jedoch Umgebungsgeräusche, d.h. weder Sprache noch Musik. Umgebungsgeräusche enthalten wichtige Informationen und werden ständig zur Orientierung verwendet. Der Informatik-Student Matthias Zeppelzauer an der Technischen Universität Wien hat sich nun intensiv mit dem Forschungsgebiet der Umgebungsgeräusche auseinandergesetzt und konnte beim Erkennen von Tierstimmen via Computer große Erfolge erzielen.



Warum sich Matthias Zeppelzauer gerade auf das Erkennen von Tierstimmen verlegt hat? "Zu Beginn meiner Diplomarbeit lag mein Interesse auf der Spracherkennung. Im Zuge meiner Nachforschungen stellte sich aber heraus, dass das Gebiet der Spracherkennung zu einem der meist erforschten Gebiete in der Audioverarbeitung zählt. Die mit der Spracherkennung eng verwandte Geräuscherkennung ist weit weniger erforscht und bot sich dadurch als Herausforderung für meine Diplomarbeit an."

Nachdem bisher nur wenige Techniken für die Erkennung von Umgebungsgeräuschen existieren, hat Zeppelzauer Methoden aus anderen Bereichen der Audioverarbeitung herangezogen: Merkmale, die ursprünglich für Spracherkennung verwendet wurden, und Methoden aus dem Music Information Retrieval. Beim Music Information Retrieval handelt es sich um ein interdisziplinäres Gebiet, das sich beispielsweise mit der Gewinnung von verwertbarer Information aus der Musik befasst. Matthias Zeppelzauer hat die Techniken so "umgemodelt", dass der Computer die unterschiedlichen Tierstimmen erkennen kann.

Zeppelzauers Methode im Detail

Der Ausgangspunkt für den Erkennungsprozess ist eine große Datenbank mit Tierstimmen. Die Datenbank enthält kurze Ausschnitte von Geräuschen verschiedener Tieren (z. B. Hundegebell und Vogelgesang). Aus diesen Geräuschsegmenten werden im ersten Schritt Merkmale extrahiert. Um möglichst viel Information über die Tierstimmen zu erhalten, werden im nächsten Schritt mehrere unabhängige Merkmale miteinander kombiniert. Die Auswahl geeigneter Merkmale erfolgt dabei einerseits empirisch und andererseits mittels statistischer Datenanalyse.

Im letzten Schritt kommt ein Klassifikator zum Einsatz, um die unterschiedlichen Tierstimmen zu unterscheiden. Zuerst muss der Klassifikator lernen, wie sich die Tierstimmen voneinander unterscheiden. Dazu werden ihm eine Reihe von Tierstimmen zusammen mit den Namen der zugehörigen Tiere präsentiert. Ausgehend von diesen Informationen baut der Klassifikator ein Modell der Tierstimmen auf. Mit diesem Modell können nun neue Tierstimmen, den bereits bekannten Tierstimmen zugeordnet werden. Der Klassifikator berechnet dabei für jede Tierstimme das wahrscheinlichste Tier.

Der TU-Informatiker entwickelte eine Gruppe neuer Unterscheidungsmerkmale, so genannte Amplituden Deskriptoren. Sie erlauben eine kompakte und aussagekräftige Beschreibung der ursprünglichen Geräusche. Amplituden Deskriptoren beschreiben Eigenschaften eines Audio-Signals, die auch für die menschliche Wahrnehmung maßgeblich sind. Mithilfe eines Algorithmus, der auf bekannten Geräuschen trainiert wird, wird die Erkennung neuer Tiergeräusche durch den Computer möglich.

In Zukunft sollen komplexere Klassifikatoren und andere Merkmale (z.B. MPEG-7 Deskriptoren) für die Geräuscherkennung zur Anwendung kommen, um eine große Herausforderung anzunehmen: das Tierverstehen, bei dem Tiergeräusche einer einzigen Spezies unterschieden werden müssen. Eine solche Technik könnte in Zukunft der computerunterstützten Analyse von Tierverhalten dienen.

Auszeichnung mit dem PRIP-Preis 2005 der TU Wien

Matthias Zeppelzauers wissenschaftliche Leistungen wurden auch innerhalb der Fakultät für Informatik an der TU Wien als hervorragend eingestuft und so wurde er mit dem PRIP-Preis 2005 ausgezeichnet.

Der PRIP Preis (PRIP=Pattern Recognition and Image Processing) wird jährlich von der Arbeitsgruppe für Mustererkennung und Bildverarbeitung des Instituts für Rechnergestützte Automation der TU Wien an Studierende vergeben, die auf diesem Gebiet hervorragende Leistungen erbracht haben. Der Preis ist mit insgesamt 2.700,- Euro dotiert und wird von österreichischen IT-Unternehmen gesponsert. Er wird in den Kategorien "Magisterstudium" und "Bakkalaureatsstudium" verliehen.

Die Jury unter der Leitung von Professor Walter Kropatsch (PRIP, TU Wien) setzt sich aus ForscherInnen der TU Wien und VertreterInnen der Sponsoren zusammen. Die GewinnerInnen werden in einem zweistufigen Verfahren ermittelt.

Rückfragehinweis:

Dipl.-Ing. Matthias Zeppelzauer
Technische Universität Wien
Institut für Softwaretechnik und Interaktive Systeme
E: zeppelzauer@ims.tuwien.ac.at
T: +43-(0)1-58801-18847

Mag. Karin Peter | idw
Weitere Informationen:
http://www.prip.tuwien.ac.at
http://www.prip.tuwien.ac.at/Teaching/PripPreis

Weitere Berichte zu: Erkennung Klassifikator Spracherkennung Tierstimme

Weitere Nachrichten aus der Kategorie Informationstechnologie:

nachricht Verbesserung des mobilen Internetzugangs der Zukunft
21.07.2017 | IHP - Leibniz-Institut für innovative Mikroelektronik

nachricht Affen aus dem Weltraum zählen? Neue Methoden helfen die Artenvielfalt zu erfassen
21.07.2017 | Forschungsverbund Berlin e.V.

Alle Nachrichten aus der Kategorie: Informationstechnologie >>>

Die aktuellsten Pressemeldungen zum Suchbegriff Innovation >>>

Die letzten 5 Focus-News des innovations-reports im Überblick:

Im Focus: 3-D scanning with water

3-D shape acquisition using water displacement as the shape sensor for the reconstruction of complex objects

A global team of computer scientists and engineers have developed an innovative technique that more completely reconstructs challenging 3D objects. An ancient...

Im Focus: Einblicke unter die Oberfläche des Mars

Die Region erstreckt sich über gut 1000 Kilometer entlang des Äquators des Mars. Sie heißt Medusae Fossae Formation und über ihren Ursprung ist bislang wenig bekannt. Der Geologe Prof. Dr. Angelo Pio Rossi von der Jacobs University hat gemeinsam mit Dr. Roberto Orosei vom Nationalen Italienischen Institut für Astrophysik in Bologna und weiteren Wissenschaftlern einen Teilbereich dieses Gebietes, genannt Lucus Planum, näher unter die Lupe genommen – mithilfe von Radarfernerkundung.

Wie bei einem Röntgenbild dringen die Strahlen einige Kilometer tief in die Oberfläche des Planeten ein und liefern Informationen über die Struktur, die...

Im Focus: Molekulares Lego

Sie können ihre Farbe wechseln, ihren Spin verändern oder von fest zu flüssig wechseln: Eine bestimmte Klasse von Polymeren besitzt faszinierende Eigenschaften. Wie sie das schaffen, haben Forscher der Uni Würzburg untersucht.

Bei dieser Arbeit handele es sich um ein „Hot Paper“, das interessante und wichtige Aspekte einer neuen Polymerklasse behandelt, die aufgrund ihrer Vielfalt an...

Im Focus: Das Universum in einem Kristall

Dresdener Forscher haben in Zusammenarbeit mit einem internationalen Forscherteam einen unerwarteten experimentellen Zugang zu einem Problem der Allgemeinen Realitätstheorie gefunden. Im Fachmagazin Nature berichten sie, dass es ihnen in neuartigen Materialien und mit Hilfe von thermoelektrischen Messungen gelungen ist, die Schwerkraft-Quantenanomalie nachzuweisen. Erstmals konnten so Quantenanomalien in simulierten Schwerfeldern an einem realen Kristall untersucht werden.

In der Physik spielen Messgrößen wie Energie, Impuls oder elektrische Ladung, welche ihre Erscheinungsform zwar ändern können, aber niemals verloren gehen oder...

Im Focus: Manipulation des Elektronenspins ohne Informationsverlust

Physiker haben eine neue Technik entwickelt, um auf einem Chip den Elektronenspin mit elektrischen Spannungen zu steuern. Mit der neu entwickelten Methode kann der Zerfall des Spins unterdrückt, die enthaltene Information erhalten und über vergleichsweise grosse Distanzen übermittelt werden. Das zeigt ein Team des Departement Physik der Universität Basel und des Swiss Nanoscience Instituts in einer Veröffentlichung in Physical Review X.

Seit einigen Jahren wird weltweit untersucht, wie sich der Spin des Elektrons zur Speicherung und Übertragung von Information nutzen lässt. Der Spin jedes...

Alle Focus-News des Innovations-reports >>>

Anzeige

Anzeige

IHR
JOB & KARRIERE
SERVICE
im innovations-report
in Kooperation mit academics
Veranstaltungen

Gipfeltreffen der String-Mathematik: Internationale Konferenz StringMath 2017

24.07.2017 | Veranstaltungen

Von atmosphärischen Teilchen bis hin zu Polymeren aus nachwachsenden Rohstoffen

24.07.2017 | Veranstaltungen

Recherche-Reise zum European XFEL und DESY nach Hamburg

24.07.2017 | Veranstaltungen

 
VideoLinks
B2B-VideoLinks
Weitere VideoLinks >>>
Aktuelle Beiträge

Gipfeltreffen der String-Mathematik: Internationale Konferenz StringMath 2017

24.07.2017 | Veranstaltungsnachrichten

Von atmosphärischen Teilchen bis hin zu Polymeren aus nachwachsenden Rohstoffen

24.07.2017 | Veranstaltungsnachrichten

Lupinen beim Trinken zugeschaut – erstmals 3D-Aufnahmen vom Wassertransport zu Wurzeln

24.07.2017 | Biowissenschaften Chemie