Forum für Wissenschaft, Industrie und Wirtschaft

Hauptsponsoren:     3M 
Datenbankrecherche:

 

Computer erkennt Tierstimmen

15.03.2006


Einem jungen Informatiker der Technischen Universität (TU) Wien ist es gelungen, dass der Computer automatisch Tierstimmen erkennt. Während die Spracherkennung in der Audioverarbeitung zu einem sehr gut erforschten Gebiet gehört, zählt die Geräuscherkennung noch zu den eher weißen Flecken auf der Forschungslandschaft.



Das Hören ist nach dem Sehen der zweitwichtigste menschliche Sinn. Was die automatische Erkennung von Audiosignalen betrifft, so liegt der Schwerpunkt meist auf der Erkennung von Sprache und Musik. Die meisten Geräusche in unserer Umgebung sind jedoch Umgebungsgeräusche, d.h. weder Sprache noch Musik. Umgebungsgeräusche enthalten wichtige Informationen und werden ständig zur Orientierung verwendet. Der Informatik-Student Matthias Zeppelzauer an der Technischen Universität Wien hat sich nun intensiv mit dem Forschungsgebiet der Umgebungsgeräusche auseinandergesetzt und konnte beim Erkennen von Tierstimmen via Computer große Erfolge erzielen.



Warum sich Matthias Zeppelzauer gerade auf das Erkennen von Tierstimmen verlegt hat? "Zu Beginn meiner Diplomarbeit lag mein Interesse auf der Spracherkennung. Im Zuge meiner Nachforschungen stellte sich aber heraus, dass das Gebiet der Spracherkennung zu einem der meist erforschten Gebiete in der Audioverarbeitung zählt. Die mit der Spracherkennung eng verwandte Geräuscherkennung ist weit weniger erforscht und bot sich dadurch als Herausforderung für meine Diplomarbeit an."

Nachdem bisher nur wenige Techniken für die Erkennung von Umgebungsgeräuschen existieren, hat Zeppelzauer Methoden aus anderen Bereichen der Audioverarbeitung herangezogen: Merkmale, die ursprünglich für Spracherkennung verwendet wurden, und Methoden aus dem Music Information Retrieval. Beim Music Information Retrieval handelt es sich um ein interdisziplinäres Gebiet, das sich beispielsweise mit der Gewinnung von verwertbarer Information aus der Musik befasst. Matthias Zeppelzauer hat die Techniken so "umgemodelt", dass der Computer die unterschiedlichen Tierstimmen erkennen kann.

Zeppelzauers Methode im Detail

Der Ausgangspunkt für den Erkennungsprozess ist eine große Datenbank mit Tierstimmen. Die Datenbank enthält kurze Ausschnitte von Geräuschen verschiedener Tieren (z. B. Hundegebell und Vogelgesang). Aus diesen Geräuschsegmenten werden im ersten Schritt Merkmale extrahiert. Um möglichst viel Information über die Tierstimmen zu erhalten, werden im nächsten Schritt mehrere unabhängige Merkmale miteinander kombiniert. Die Auswahl geeigneter Merkmale erfolgt dabei einerseits empirisch und andererseits mittels statistischer Datenanalyse.

Im letzten Schritt kommt ein Klassifikator zum Einsatz, um die unterschiedlichen Tierstimmen zu unterscheiden. Zuerst muss der Klassifikator lernen, wie sich die Tierstimmen voneinander unterscheiden. Dazu werden ihm eine Reihe von Tierstimmen zusammen mit den Namen der zugehörigen Tiere präsentiert. Ausgehend von diesen Informationen baut der Klassifikator ein Modell der Tierstimmen auf. Mit diesem Modell können nun neue Tierstimmen, den bereits bekannten Tierstimmen zugeordnet werden. Der Klassifikator berechnet dabei für jede Tierstimme das wahrscheinlichste Tier.

Der TU-Informatiker entwickelte eine Gruppe neuer Unterscheidungsmerkmale, so genannte Amplituden Deskriptoren. Sie erlauben eine kompakte und aussagekräftige Beschreibung der ursprünglichen Geräusche. Amplituden Deskriptoren beschreiben Eigenschaften eines Audio-Signals, die auch für die menschliche Wahrnehmung maßgeblich sind. Mithilfe eines Algorithmus, der auf bekannten Geräuschen trainiert wird, wird die Erkennung neuer Tiergeräusche durch den Computer möglich.

In Zukunft sollen komplexere Klassifikatoren und andere Merkmale (z.B. MPEG-7 Deskriptoren) für die Geräuscherkennung zur Anwendung kommen, um eine große Herausforderung anzunehmen: das Tierverstehen, bei dem Tiergeräusche einer einzigen Spezies unterschieden werden müssen. Eine solche Technik könnte in Zukunft der computerunterstützten Analyse von Tierverhalten dienen.

Auszeichnung mit dem PRIP-Preis 2005 der TU Wien

Matthias Zeppelzauers wissenschaftliche Leistungen wurden auch innerhalb der Fakultät für Informatik an der TU Wien als hervorragend eingestuft und so wurde er mit dem PRIP-Preis 2005 ausgezeichnet.

Der PRIP Preis (PRIP=Pattern Recognition and Image Processing) wird jährlich von der Arbeitsgruppe für Mustererkennung und Bildverarbeitung des Instituts für Rechnergestützte Automation der TU Wien an Studierende vergeben, die auf diesem Gebiet hervorragende Leistungen erbracht haben. Der Preis ist mit insgesamt 2.700,- Euro dotiert und wird von österreichischen IT-Unternehmen gesponsert. Er wird in den Kategorien "Magisterstudium" und "Bakkalaureatsstudium" verliehen.

Die Jury unter der Leitung von Professor Walter Kropatsch (PRIP, TU Wien) setzt sich aus ForscherInnen der TU Wien und VertreterInnen der Sponsoren zusammen. Die GewinnerInnen werden in einem zweistufigen Verfahren ermittelt.

Rückfragehinweis:

Dipl.-Ing. Matthias Zeppelzauer
Technische Universität Wien
Institut für Softwaretechnik und Interaktive Systeme
E: zeppelzauer@ims.tuwien.ac.at
T: +43-(0)1-58801-18847

Mag. Karin Peter | idw
Weitere Informationen:
http://www.prip.tuwien.ac.at
http://www.prip.tuwien.ac.at/Teaching/PripPreis

Weitere Berichte zu: Erkennung Klassifikator Spracherkennung Tierstimme

Weitere Nachrichten aus der Kategorie Informationstechnologie:

nachricht Datenschutz: Vom Stressfaktor zum Kinderspiel
19.03.2019 | Telekom/DataGuard

nachricht Der virtuelle Graue Star
18.03.2019 | Technische Universität Wien

Alle Nachrichten aus der Kategorie: Informationstechnologie >>>

Die aktuellsten Pressemeldungen zum Suchbegriff Innovation >>>

Die letzten 5 Focus-News des innovations-reports im Überblick:

Im Focus: Die Zähmung der Lichtschraube

Wissenschaftler vom DESY und MPSD erzeugen in Festkörpern hohe-Harmonische Lichtpulse mit geregeltem Polarisationszustand, indem sie sich die Kristallsymmetrie und attosekundenschnelle Elektronendynamik zunutze machen. Die neu etablierte Technik könnte faszinierende Anwendungen in der ultraschnellen Petahertz-Elektronik und in spektroskopischen Untersuchungen neuartiger Quantenmaterialien finden.

Der nichtlineare Prozess der Erzeugung hoher Harmonischer (HHG) in Gasen ist einer der Grundsteine der Attosekundenwissenschaft (eine Attosekunde ist ein...

Im Focus: The taming of the light screw

DESY and MPSD scientists create high-order harmonics from solids with controlled polarization states, taking advantage of both crystal symmetry and attosecond electronic dynamics. The newly demonstrated technique might find intriguing applications in petahertz electronics and for spectroscopic studies of novel quantum materials.

The nonlinear process of high-order harmonic generation (HHG) in gases is one of the cornerstones of attosecond science (an attosecond is a billionth of a...

Im Focus: Magnetische Mikroboote

Nano- und Mikrotechnologie sind nicht nur für medizinische Anwendungen wie in der Wirkstofffreisetzung vielversprechende Kandidaten, sondern auch für die Entwicklung kleiner Roboter oder flexibler integrierter Sensoren. Wissenschaftler des Max-Planck-Instituts für Polymerforschung (MPI-P) haben mit einer neu entwickelten Methode magnetische Mikropartikel hergestellt, die den Weg für den Bau von Mikromotoren oder die Zielführung von Medikamenten im menschlichen Körper, wie z.B. zu einem Tumor, ebnen könnten. Die Herstellung solcher Strukturen sowie deren Bewegung kann einfach durch Magnetfelder gesteuert werden und findet daher Anwendung in einer Vielzahl von Bereichen.

Die magnetischen Eigenschaften eines Materials bestimmen, wie dieses Material auf das Vorhandensein eines Magnetfeldes reagiert. Eisenoxid ist der...

Im Focus: Magnetic micro-boats

Nano- and microtechnology are promising candidates not only for medical applications such as drug delivery but also for the creation of little robots or flexible integrated sensors. Scientists from the Max Planck Institute for Polymer Research (MPI-P) have created magnetic microparticles, with a newly developed method, that could pave the way for building micro-motors or guiding drugs in the human body to a target, like a tumor. The preparation of such structures as well as their remote-control can be regulated using magnetic fields and therefore can find application in an array of domains.

The magnetic properties of a material control how this material responds to the presence of a magnetic field. Iron oxide is the main component of rust but also...

Im Focus: Goldkugel im goldenen Käfig

„Goldenes Fulleren“: Liganden-geschützter Nanocluster aus 32 Goldatomen

Forschern ist es gelungen, eine winzige Struktur aus 32 Goldatomen zu synthetisieren. Dieser Nanocluster hat einen Kern aus 12 Goldatomen, der von einer Schale...

Alle Focus-News des Innovations-reports >>>

Anzeige

Anzeige

VideoLinks
Industrie & Wirtschaft
Veranstaltungen

Größte nationale Tagung 2019 für Nuklearmedizin in Bremen

21.03.2019 | Veranstaltungen

6. Magdeburger Brand- und Explosionsschutztage vom 25. bis 26.3. 2019

21.03.2019 | Veranstaltungen

Teilchenphysik trifft Didaktik und künstliche Intelligenz in Aachen

20.03.2019 | Veranstaltungen

VideoLinks
Wissenschaft & Forschung
Weitere VideoLinks im Überblick >>>
 
Aktuelle Beiträge

Die Zähmung der Lichtschraube

22.03.2019 | Physik Astronomie

Saarbrücker Forscher erleichtern durch Open Source-Software den Durchblick bei Massen-Sensordaten

22.03.2019 | HANNOVER MESSE

Ketten aus Stickstoff direkt erzeugt

22.03.2019 | Biowissenschaften Chemie

Weitere B2B-VideoLinks
IHR
JOB & KARRIERE
SERVICE
im innovations-report
in Kooperation mit academics