Forum für Wissenschaft, Industrie und Wirtschaft

Hauptsponsoren:     3M 
Datenbankrecherche:

 

Computer erkennt Tierstimmen

15.03.2006


Einem jungen Informatiker der Technischen Universität (TU) Wien ist es gelungen, dass der Computer automatisch Tierstimmen erkennt. Während die Spracherkennung in der Audioverarbeitung zu einem sehr gut erforschten Gebiet gehört, zählt die Geräuscherkennung noch zu den eher weißen Flecken auf der Forschungslandschaft.



Das Hören ist nach dem Sehen der zweitwichtigste menschliche Sinn. Was die automatische Erkennung von Audiosignalen betrifft, so liegt der Schwerpunkt meist auf der Erkennung von Sprache und Musik. Die meisten Geräusche in unserer Umgebung sind jedoch Umgebungsgeräusche, d.h. weder Sprache noch Musik. Umgebungsgeräusche enthalten wichtige Informationen und werden ständig zur Orientierung verwendet. Der Informatik-Student Matthias Zeppelzauer an der Technischen Universität Wien hat sich nun intensiv mit dem Forschungsgebiet der Umgebungsgeräusche auseinandergesetzt und konnte beim Erkennen von Tierstimmen via Computer große Erfolge erzielen.



Warum sich Matthias Zeppelzauer gerade auf das Erkennen von Tierstimmen verlegt hat? "Zu Beginn meiner Diplomarbeit lag mein Interesse auf der Spracherkennung. Im Zuge meiner Nachforschungen stellte sich aber heraus, dass das Gebiet der Spracherkennung zu einem der meist erforschten Gebiete in der Audioverarbeitung zählt. Die mit der Spracherkennung eng verwandte Geräuscherkennung ist weit weniger erforscht und bot sich dadurch als Herausforderung für meine Diplomarbeit an."

Nachdem bisher nur wenige Techniken für die Erkennung von Umgebungsgeräuschen existieren, hat Zeppelzauer Methoden aus anderen Bereichen der Audioverarbeitung herangezogen: Merkmale, die ursprünglich für Spracherkennung verwendet wurden, und Methoden aus dem Music Information Retrieval. Beim Music Information Retrieval handelt es sich um ein interdisziplinäres Gebiet, das sich beispielsweise mit der Gewinnung von verwertbarer Information aus der Musik befasst. Matthias Zeppelzauer hat die Techniken so "umgemodelt", dass der Computer die unterschiedlichen Tierstimmen erkennen kann.

Zeppelzauers Methode im Detail

Der Ausgangspunkt für den Erkennungsprozess ist eine große Datenbank mit Tierstimmen. Die Datenbank enthält kurze Ausschnitte von Geräuschen verschiedener Tieren (z. B. Hundegebell und Vogelgesang). Aus diesen Geräuschsegmenten werden im ersten Schritt Merkmale extrahiert. Um möglichst viel Information über die Tierstimmen zu erhalten, werden im nächsten Schritt mehrere unabhängige Merkmale miteinander kombiniert. Die Auswahl geeigneter Merkmale erfolgt dabei einerseits empirisch und andererseits mittels statistischer Datenanalyse.

Im letzten Schritt kommt ein Klassifikator zum Einsatz, um die unterschiedlichen Tierstimmen zu unterscheiden. Zuerst muss der Klassifikator lernen, wie sich die Tierstimmen voneinander unterscheiden. Dazu werden ihm eine Reihe von Tierstimmen zusammen mit den Namen der zugehörigen Tiere präsentiert. Ausgehend von diesen Informationen baut der Klassifikator ein Modell der Tierstimmen auf. Mit diesem Modell können nun neue Tierstimmen, den bereits bekannten Tierstimmen zugeordnet werden. Der Klassifikator berechnet dabei für jede Tierstimme das wahrscheinlichste Tier.

Der TU-Informatiker entwickelte eine Gruppe neuer Unterscheidungsmerkmale, so genannte Amplituden Deskriptoren. Sie erlauben eine kompakte und aussagekräftige Beschreibung der ursprünglichen Geräusche. Amplituden Deskriptoren beschreiben Eigenschaften eines Audio-Signals, die auch für die menschliche Wahrnehmung maßgeblich sind. Mithilfe eines Algorithmus, der auf bekannten Geräuschen trainiert wird, wird die Erkennung neuer Tiergeräusche durch den Computer möglich.

In Zukunft sollen komplexere Klassifikatoren und andere Merkmale (z.B. MPEG-7 Deskriptoren) für die Geräuscherkennung zur Anwendung kommen, um eine große Herausforderung anzunehmen: das Tierverstehen, bei dem Tiergeräusche einer einzigen Spezies unterschieden werden müssen. Eine solche Technik könnte in Zukunft der computerunterstützten Analyse von Tierverhalten dienen.

Auszeichnung mit dem PRIP-Preis 2005 der TU Wien

Matthias Zeppelzauers wissenschaftliche Leistungen wurden auch innerhalb der Fakultät für Informatik an der TU Wien als hervorragend eingestuft und so wurde er mit dem PRIP-Preis 2005 ausgezeichnet.

Der PRIP Preis (PRIP=Pattern Recognition and Image Processing) wird jährlich von der Arbeitsgruppe für Mustererkennung und Bildverarbeitung des Instituts für Rechnergestützte Automation der TU Wien an Studierende vergeben, die auf diesem Gebiet hervorragende Leistungen erbracht haben. Der Preis ist mit insgesamt 2.700,- Euro dotiert und wird von österreichischen IT-Unternehmen gesponsert. Er wird in den Kategorien "Magisterstudium" und "Bakkalaureatsstudium" verliehen.

Die Jury unter der Leitung von Professor Walter Kropatsch (PRIP, TU Wien) setzt sich aus ForscherInnen der TU Wien und VertreterInnen der Sponsoren zusammen. Die GewinnerInnen werden in einem zweistufigen Verfahren ermittelt.

Rückfragehinweis:

Dipl.-Ing. Matthias Zeppelzauer
Technische Universität Wien
Institut für Softwaretechnik und Interaktive Systeme
E: zeppelzauer@ims.tuwien.ac.at
T: +43-(0)1-58801-18847

Mag. Karin Peter | idw
Weitere Informationen:
http://www.prip.tuwien.ac.at
http://www.prip.tuwien.ac.at/Teaching/PripPreis

Weitere Berichte zu: Erkennung Klassifikator Spracherkennung Tierstimme

Weitere Nachrichten aus der Kategorie Informationstechnologie:

nachricht Modellfabrik Industrie 4.0: Forschungs- und Trainingsplattform für Wissenschaft und Wirtschaft
28.03.2017 | Hochschule Konstanz

nachricht Cybersicherheit für die Bahn von morgen
24.03.2017 | Fraunhofer-Institut für Sichere Informationstechnologie SIT

Alle Nachrichten aus der Kategorie: Informationstechnologie >>>

Die aktuellsten Pressemeldungen zum Suchbegriff Innovation >>>

Die letzten 5 Focus-News des innovations-reports im Überblick:

Im Focus: Entwicklung miniaturisierter Lichtmikroskope - „ChipScope“ will ins Innere lebender Zellen blicken

Das Institut für Halbleitertechnik und das Institut für Physikalische und Theoretische Chemie, beide Mitglieder des Laboratory for Emerging Nanometrology (LENA), der Technischen Universität Braunschweig, sind Partner des kürzlich gestarteten EU-Forschungsprojektes ChipScope. Ziel ist es, ein neues, extrem kleines Lichtmikroskop zu entwickeln. Damit soll das Innere lebender Zellen in Echtzeit beobachtet werden können. Sieben Institute in fünf europäischen Ländern beteiligen sich über die nächsten vier Jahre an diesem technologisch anspruchsvollen Projekt.

Die zukünftigen Einsatzmöglichkeiten des neu zu entwickelnden und nur wenige Millimeter großen Mikroskops sind äußerst vielfältig. Die Projektpartner haben...

Im Focus: A Challenging European Research Project to Develop New Tiny Microscopes

The Institute of Semiconductor Technology and the Institute of Physical and Theoretical Chemistry, both members of the Laboratory for Emerging Nanometrology (LENA), at Technische Universität Braunschweig are partners in a new European research project entitled ChipScope, which aims to develop a completely new and extremely small optical microscope capable of observing the interior of living cells in real time. A consortium of 7 partners from 5 countries will tackle this issue with very ambitious objectives during a four-year research program.

To demonstrate the usefulness of this new scientific tool, at the end of the project the developed chip-sized microscope will be used to observe in real-time...

Im Focus: Das anwachsende Ende der Ordnung

Physiker aus Konstanz weisen sogenannte Mermin-Wagner-Fluktuationen experimentell nach

Ein Kristall besteht aus perfekt angeordneten Teilchen, aus einer lückenlos symmetrischen Atomstruktur – dies besagt die klassische Definition aus der Physik....

Im Focus: Wegweisende Erkenntnisse für die Biomedizin: NAD⁺ hilft bei Reparatur geschädigter Erbinformationen

Eine internationale Forschergruppe mit dem Bayreuther Biochemiker Prof. Dr. Clemens Steegborn präsentiert in 'Science' neue, für die Biomedizin wegweisende Forschungsergebnisse zur Rolle des Moleküls NAD⁺ bei der Korrektur von Schäden am Erbgut.

Die Zellen von Menschen und Tieren können Schäden an der DNA, dem Träger der Erbinformation, bis zu einem gewissen Umfang selbst reparieren. Diese Fähigkeit...

Im Focus: Designer-Proteine falten DNA

Florian Praetorius und Prof. Hendrik Dietz von der Technischen Universität München (TUM) haben eine neue Methode entwickelt, mit deren Hilfe sie definierte Hybrid-Strukturen aus DNA und Proteinen aufbauen können. Die Methode eröffnet Möglichkeiten für die zellbiologische Grundlagenforschung und für die Anwendung in Medizin und Biotechnologie.

Desoxyribonukleinsäure – besser bekannt unter der englischen Abkürzung DNA – ist die Trägerin unserer Erbinformation. Für Prof. Hendrik Dietz und Florian...

Alle Focus-News des Innovations-reports >>>

Anzeige

Anzeige

IHR
JOB & KARRIERE
SERVICE
im innovations-report
in Kooperation mit academics
Veranstaltungen

Neue Methoden für zuverlässige Mikroelektronik: Internationale Experten treffen sich in Halle

28.03.2017 | Veranstaltungen

Wie Menschen wachsen

27.03.2017 | Veranstaltungen

Zweites Symposium 4SMARTS zeigt Potenziale aktiver, intelligenter und adaptiver Systeme

27.03.2017 | Veranstaltungen

 
VideoLinks
B2B-VideoLinks
Weitere VideoLinks >>>
Aktuelle Beiträge

Warum der Brennstoffzelle die Luft wegbleibt

28.03.2017 | Biowissenschaften Chemie

Chlamydien: Wie Bakterien das Ruder übernehmen

28.03.2017 | Biowissenschaften Chemie

Sterngeburt in den Winden supermassereicher Schwarzer Löcher

28.03.2017 | Physik Astronomie