Forum für Wissenschaft, Industrie und Wirtschaft

Hauptsponsoren:     3M 
Datenbankrecherche:

 

Computer erkennt Tierstimmen

15.03.2006


Einem jungen Informatiker der Technischen Universität (TU) Wien ist es gelungen, dass der Computer automatisch Tierstimmen erkennt. Während die Spracherkennung in der Audioverarbeitung zu einem sehr gut erforschten Gebiet gehört, zählt die Geräuscherkennung noch zu den eher weißen Flecken auf der Forschungslandschaft.



Das Hören ist nach dem Sehen der zweitwichtigste menschliche Sinn. Was die automatische Erkennung von Audiosignalen betrifft, so liegt der Schwerpunkt meist auf der Erkennung von Sprache und Musik. Die meisten Geräusche in unserer Umgebung sind jedoch Umgebungsgeräusche, d.h. weder Sprache noch Musik. Umgebungsgeräusche enthalten wichtige Informationen und werden ständig zur Orientierung verwendet. Der Informatik-Student Matthias Zeppelzauer an der Technischen Universität Wien hat sich nun intensiv mit dem Forschungsgebiet der Umgebungsgeräusche auseinandergesetzt und konnte beim Erkennen von Tierstimmen via Computer große Erfolge erzielen.



Warum sich Matthias Zeppelzauer gerade auf das Erkennen von Tierstimmen verlegt hat? "Zu Beginn meiner Diplomarbeit lag mein Interesse auf der Spracherkennung. Im Zuge meiner Nachforschungen stellte sich aber heraus, dass das Gebiet der Spracherkennung zu einem der meist erforschten Gebiete in der Audioverarbeitung zählt. Die mit der Spracherkennung eng verwandte Geräuscherkennung ist weit weniger erforscht und bot sich dadurch als Herausforderung für meine Diplomarbeit an."

Nachdem bisher nur wenige Techniken für die Erkennung von Umgebungsgeräuschen existieren, hat Zeppelzauer Methoden aus anderen Bereichen der Audioverarbeitung herangezogen: Merkmale, die ursprünglich für Spracherkennung verwendet wurden, und Methoden aus dem Music Information Retrieval. Beim Music Information Retrieval handelt es sich um ein interdisziplinäres Gebiet, das sich beispielsweise mit der Gewinnung von verwertbarer Information aus der Musik befasst. Matthias Zeppelzauer hat die Techniken so "umgemodelt", dass der Computer die unterschiedlichen Tierstimmen erkennen kann.

Zeppelzauers Methode im Detail

Der Ausgangspunkt für den Erkennungsprozess ist eine große Datenbank mit Tierstimmen. Die Datenbank enthält kurze Ausschnitte von Geräuschen verschiedener Tieren (z. B. Hundegebell und Vogelgesang). Aus diesen Geräuschsegmenten werden im ersten Schritt Merkmale extrahiert. Um möglichst viel Information über die Tierstimmen zu erhalten, werden im nächsten Schritt mehrere unabhängige Merkmale miteinander kombiniert. Die Auswahl geeigneter Merkmale erfolgt dabei einerseits empirisch und andererseits mittels statistischer Datenanalyse.

Im letzten Schritt kommt ein Klassifikator zum Einsatz, um die unterschiedlichen Tierstimmen zu unterscheiden. Zuerst muss der Klassifikator lernen, wie sich die Tierstimmen voneinander unterscheiden. Dazu werden ihm eine Reihe von Tierstimmen zusammen mit den Namen der zugehörigen Tiere präsentiert. Ausgehend von diesen Informationen baut der Klassifikator ein Modell der Tierstimmen auf. Mit diesem Modell können nun neue Tierstimmen, den bereits bekannten Tierstimmen zugeordnet werden. Der Klassifikator berechnet dabei für jede Tierstimme das wahrscheinlichste Tier.

Der TU-Informatiker entwickelte eine Gruppe neuer Unterscheidungsmerkmale, so genannte Amplituden Deskriptoren. Sie erlauben eine kompakte und aussagekräftige Beschreibung der ursprünglichen Geräusche. Amplituden Deskriptoren beschreiben Eigenschaften eines Audio-Signals, die auch für die menschliche Wahrnehmung maßgeblich sind. Mithilfe eines Algorithmus, der auf bekannten Geräuschen trainiert wird, wird die Erkennung neuer Tiergeräusche durch den Computer möglich.

In Zukunft sollen komplexere Klassifikatoren und andere Merkmale (z.B. MPEG-7 Deskriptoren) für die Geräuscherkennung zur Anwendung kommen, um eine große Herausforderung anzunehmen: das Tierverstehen, bei dem Tiergeräusche einer einzigen Spezies unterschieden werden müssen. Eine solche Technik könnte in Zukunft der computerunterstützten Analyse von Tierverhalten dienen.

Auszeichnung mit dem PRIP-Preis 2005 der TU Wien

Matthias Zeppelzauers wissenschaftliche Leistungen wurden auch innerhalb der Fakultät für Informatik an der TU Wien als hervorragend eingestuft und so wurde er mit dem PRIP-Preis 2005 ausgezeichnet.

Der PRIP Preis (PRIP=Pattern Recognition and Image Processing) wird jährlich von der Arbeitsgruppe für Mustererkennung und Bildverarbeitung des Instituts für Rechnergestützte Automation der TU Wien an Studierende vergeben, die auf diesem Gebiet hervorragende Leistungen erbracht haben. Der Preis ist mit insgesamt 2.700,- Euro dotiert und wird von österreichischen IT-Unternehmen gesponsert. Er wird in den Kategorien "Magisterstudium" und "Bakkalaureatsstudium" verliehen.

Die Jury unter der Leitung von Professor Walter Kropatsch (PRIP, TU Wien) setzt sich aus ForscherInnen der TU Wien und VertreterInnen der Sponsoren zusammen. Die GewinnerInnen werden in einem zweistufigen Verfahren ermittelt.

Rückfragehinweis:

Dipl.-Ing. Matthias Zeppelzauer
Technische Universität Wien
Institut für Softwaretechnik und Interaktive Systeme
E: zeppelzauer@ims.tuwien.ac.at
T: +43-(0)1-58801-18847

Mag. Karin Peter | idw
Weitere Informationen:
http://www.prip.tuwien.ac.at
http://www.prip.tuwien.ac.at/Teaching/PripPreis

Weitere Berichte zu: Erkennung Klassifikator Spracherkennung Tierstimme

Weitere Nachrichten aus der Kategorie Informationstechnologie:

nachricht Industrie im Wandel
09.12.2019 | OPTIMUM datamanagement solutions GmbH

nachricht AIRPoRT: Mehr IT-Sicherheit in der Produktion
09.12.2019 | Fraunhofer-Institut für Arbeitswirtschaft und Organisation IAO

Alle Nachrichten aus der Kategorie: Informationstechnologie >>>

Die aktuellsten Pressemeldungen zum Suchbegriff Innovation >>>

Die letzten 5 Focus-News des innovations-reports im Überblick:

Im Focus: Geminiden - Die Wünsch-dir-was-Sternschnuppen vor Weihnachten

Gemeinsame Pressemitteilung der Vereinigung der Sternfreunde (VdS) und des Hauses der Astronomie in Heidelberg - Die Geminiden, die Mitte Dezember zu sehen sind, sind der "zuverlässigste" der großen Sternschnuppen-Ströme mit bis zu 120 Sternschnuppen pro Stunde. Leider stört in diesem Jahr der Mond zur besten Beobachtungszeit.

Sie wurden nach dem Sternbild Zwillinge benannt: Die „Geminiden“ sorgen Mitte Dezember immer für ein schönes Sternschnuppenschauspiel. In diesem Jahr sind die...

Im Focus: Electronic map reveals 'rules of the road' in superconductor

Band structure map exposes iron selenide's enigmatic electronic signature

Using a clever technique that causes unruly crystals of iron selenide to snap into alignment, Rice University physicists have drawn a detailed map that reveals...

Im Focus: Das 136 Millionen Atom-Modell: Wissenschaftler simulieren Photosynthese

Die Umwandlung von Sonnenlicht in chemische Energie ist für das Leben unerlässlich. In einer der größten Simulationen eines Biosystems weltweit haben Wissenschaftlerinnen und Wissenschaftler diesen komplexen Prozess an einem Bestandteil eines Bakteriums nachgeahmt – am Computer, Atom um Atom. Die Arbeit, die jetzt in der renommierten Fachzeitschrift „Cell“ veröffentlicht wurde, ist ein wichtiger Schritt zum besseren Verständnis der Photosynthese in einigen biologischen Strukturen. An der internationalen Forschungskooperation unter Leitung der University of Illinois war auch ein Team der Jacobs University Bremen beteiligt.

Das Projekt geht zurück auf eine Initiative des inzwischen verstorbenen, deutsch-US-amerikanischen Physikprofessors Klaus Schulten von der University of...

Im Focus: Developing a digital twin

University of Texas and MIT researchers create virtual UAVs that can predict vehicle health, enable autonomous decision-making

In the not too distant future, we can expect to see our skies filled with unmanned aerial vehicles (UAVs) delivering packages, maybe even people, from location...

Im Focus: Freiformflächen bis zu 80 Prozent schneller schlichten: Neue Werkzeuge und Algorithmen für die Fräsbearbeitung

Beim Schlichtfräsen komplexer Freiformflächen können Kreissegment- oder Tonnenfräswerkzeuge jetzt ihre Vorteile gegenüber herkömmlichen Werkzeugen mit Kugelkopf besser ausspielen: Das Fraunhofer-Institut für Produktionstechnologie IPT aus Aachen entwickelte im Forschungsprojekt »FlexiMILL« gemeinsam mit vier Industriepartnern passende flexible Bearbeitungsstrategien und implementierte diese in eine CAM-Software. Auf diese Weise lassen sich große frei geformte Oberflächen nun bis zu 80 Prozent schneller bearbeiten.

Ziel im Projekt »FlexiMILL« war es, für die Bearbeitung mit Tonnenfräswerkzeugen nicht nur neue, verbesserte Werkzeuggeometrien zu entwickeln, sondern auch...

Alle Focus-News des Innovations-reports >>>

Anzeige

Anzeige

VideoLinks
Industrie & Wirtschaft
Veranstaltungen

QURATOR 2020 – weltweit erste Konferenz für Kuratierungstechnologien

04.12.2019 | Veranstaltungen

Die Zukunft der Arbeit

03.12.2019 | Veranstaltungen

Intelligente Transportbehälter als Basis für neue Services der Intralogistik

03.12.2019 | Veranstaltungen

VideoLinks
Wissenschaft & Forschung
Weitere VideoLinks im Überblick >>>
 
Aktuelle Beiträge

Vulkan „F“ ist der Ursprung der schwimmenden Steine

09.12.2019 | Geowissenschaften

Magnetschwebetrennung in der Drogenfahndung - Analyse illegaler Substanzen in Pulver durch magnetische Levitation

09.12.2019 | Biowissenschaften Chemie

Luftverschmutzung: IASS legt erstes Emissionsinventar für Nepal vor

09.12.2019 | Ökologie Umwelt- Naturschutz

Weitere B2B-VideoLinks
IHR
JOB & KARRIERE
SERVICE
im innovations-report
in Kooperation mit academics