Informationstechnologie

15.03.2006

Computer erkennt Tierstimmen

Einem jungen Informatiker der Technischen Universität (TU) Wien ist es gelungen, dass der Computer automatisch Tierstimmen erkennt. Während die Spracherkennung in der Audioverarbeitung zu einem sehr gut erforschten Gebiet gehört, zählt die Geräuscherkennung noch zu den eher weißen Flecken auf der Forschungslandschaft.

Das Hören ist nach dem Sehen der zweitwichtigste menschliche Sinn. Was die automatische Erkennung von Audiosignalen betrifft, so liegt der Schwerpunkt meist auf der Erkennung von Sprache und Musik. Die meisten Geräusche in unserer Umgebung sind jedoch Umgebungsgeräusche, d.h. weder Sprache noch Musik. Umgebungsgeräusche enthalten wichtige Informationen und werden ständig zur Orientierung verwendet. Der Informatik-Student Matthias Zeppelzauer an der Technischen Universität Wien hat sich nun intensiv mit dem Forschungsgebiet der Umgebungsgeräusche auseinandergesetzt und konnte beim Erkennen von Tierstimmen via Computer große Erfolge erzielen.

Warum sich Matthias Zeppelzauer gerade auf das Erkennen von Tierstimmen verlegt hat? „Zu Beginn meiner Diplomarbeit lag mein Interesse auf der Spracherkennung. Im Zuge meiner Nachforschungen stellte sich aber heraus, dass das Gebiet der Spracherkennung zu einem der meist erforschten Gebiete in der Audioverarbeitung zählt. Die mit der Spracherkennung eng verwandte Geräuscherkennung ist weit weniger erforscht und bot sich dadurch als Herausforderung für meine Diplomarbeit an.“

Nachdem bisher nur wenige Techniken für die Erkennung von Umgebungsgeräuschen existieren, hat Zeppelzauer Methoden aus anderen Bereichen der Audioverarbeitung herangezogen: Merkmale, die ursprünglich für Spracherkennung verwendet wurden, und Methoden aus dem Music Information Retrieval. Beim Music Information Retrieval handelt es sich um ein interdisziplinäres Gebiet, das sich beispielsweise mit der Gewinnung von verwertbarer Information aus der Musik befasst. Matthias Zeppelzauer hat die Techniken so „umgemodelt“, dass der Computer die unterschiedlichen Tierstimmen erkennen kann.

Zeppelzauers Methode im Detail

Der Ausgangspunkt für den Erkennungsprozess ist eine große Datenbank mit Tierstimmen. Die Datenbank enthält kurze Ausschnitte von Geräuschen verschiedener Tieren (z. B. Hundegebell und Vogelgesang). Aus diesen Geräuschsegmenten werden im ersten Schritt Merkmale extrahiert. Um möglichst viel Information über die Tierstimmen zu erhalten, werden im nächsten Schritt mehrere unabhängige Merkmale miteinander kombiniert. Die Auswahl geeigneter Merkmale erfolgt dabei einerseits empirisch und andererseits mittels statistischer Datenanalyse.

Im letzten Schritt kommt ein Klassifikator zum Einsatz, um die unterschiedlichen Tierstimmen zu unterscheiden. Zuerst muss der Klassifikator lernen, wie sich die Tierstimmen voneinander unterscheiden. Dazu werden ihm eine Reihe von Tierstimmen zusammen mit den Namen der zugehörigen Tiere präsentiert. Ausgehend von diesen Informationen baut der Klassifikator ein Modell der Tierstimmen auf. Mit diesem Modell können nun neue Tierstimmen, den bereits bekannten Tierstimmen zugeordnet werden. Der Klassifikator berechnet dabei für jede Tierstimme das wahrscheinlichste Tier.

Der TU-Informatiker entwickelte eine Gruppe neuer Unterscheidungsmerkmale, so genannte Amplituden Deskriptoren. Sie erlauben eine kompakte und aussagekräftige Beschreibung der ursprünglichen Geräusche. Amplituden Deskriptoren beschreiben Eigenschaften eines Audio-Signals, die auch für die menschliche Wahrnehmung maßgeblich sind. Mithilfe eines Algorithmus, der auf bekannten Geräuschen trainiert wird, wird die Erkennung neuer Tiergeräusche durch den Computer möglich.

In Zukunft sollen komplexere Klassifikatoren und andere Merkmale (z.B. MPEG-7 Deskriptoren) für die Geräuscherkennung zur Anwendung kommen, um eine große Herausforderung anzunehmen: das Tierverstehen, bei dem Tiergeräusche einer einzigen Spezies unterschieden werden müssen. Eine solche Technik könnte in Zukunft der computerunterstützten Analyse von Tierverhalten dienen.

Auszeichnung mit dem PRIP-Preis 2005 der TU Wien

Matthias Zeppelzauers wissenschaftliche Leistungen wurden auch innerhalb der Fakultät für Informatik an der TU Wien als hervorragend eingestuft und so wurde er mit dem PRIP-Preis 2005 ausgezeichnet.

Der PRIP Preis (PRIP=Pattern Recognition and Image Processing) wird jährlich von der Arbeitsgruppe für Mustererkennung und Bildverarbeitung des Instituts für Rechnergestützte Automation der TU Wien an Studierende vergeben, die auf diesem Gebiet hervorragende Leistungen erbracht haben. Der Preis ist mit insgesamt 2.700,- Euro dotiert und wird von österreichischen IT-Unternehmen gesponsert. Er wird in den Kategorien „Magisterstudium“ und „Bakkalaureatsstudium“ verliehen.

Die Jury unter der Leitung von Professor Walter Kropatsch (PRIP, TU Wien) setzt sich aus ForscherInnen der TU Wien und VertreterInnen der Sponsoren zusammen. Die GewinnerInnen werden in einem zweistufigen Verfahren ermittelt.

Rückfragehinweis:

Dipl.-Ing. Matthias Zeppelzauer
Technische Universität Wien
Institut für Softwaretechnik und Interaktive Systeme
E: zeppelzauer@ims.tuwien.ac.at
T: +43-(0)1-58801-18847

Media Contact

Mag. Karin Peter idw

Weitere Informationen:

http://www.prip.tuwien.ac.at http://www.prip.tuwien.ac.at/Teaching/PripPreis

Alle Nachrichten aus der Kategorie: Informationstechnologie

Neuerungen und Entwicklungen auf den Gebieten der Informations- und Datenverarbeitung sowie der dafür benötigten Hardware finden Sie hier zusammengefasst.

Unter anderem erhalten Sie Informationen aus den Teilbereichen: IT-Dienstleistungen, IT-Architektur, IT-Management und Telekommunikation.

Erstmals 6G-Mobilfunk in Alpen getestet

17.04.2024 / Informationstechnologie

Neuromorphes Rechnen mit Sound

17.04.2024 / Informationstechnologie

Sicherheitslücke in Browser-Schnittstelle erlaubt Rechnerzugriff über Grafikkarte

15.04.2024 / Informationstechnologie

Mit KI die Internet-Geschwindigkeit verbessern

11.04.2024 / Informationstechnologie

Zurück zur Startseite

Kommentare (0) Antworten abbrechen

Neueste Beiträge

Energie und Elektrotechnik

Transparente emissive Mikrodisplays

… für ultraleichte und kompakte Augmented-Reality-Systeme. Im Rahmen des Projektes HOT („Hochperformante transparente und biegbare Mikro-Elektronik für photonische und optische Anwendungen“) haben Forschende des Fraunhofer-Instituts für Photonische Mikrosysteme IPMS ein…

23.04.2024

Ökologie Umwelt- Naturschutz

Mikroplastik im Meer: Neue Methode

Mikroplastik im Meer könnte größtenteils auch aus Beschichtungen sowie Farbanstrichen von Schiffen und Bauwerken im Meer stammen. Daten dazu gibt es allerdings kaum. Das Helmholtz-Zentrum Hereon und das Bundesamt für…

23.04.2024

Messenachrichten

Wie Produktionstechnik Leben retten kann

Auf der Hannover Messe präsentiert das Fraunhofer IPT vom 22. bis 26. April an gleich zwei Ständen die vielfältigen Einsatzmöglichkeiten von Lasertechnologien in der Produktion: Ein »tierisches« Exponat verdeutlicht am…

23.04.2024

NACHRICHTEN & BERICHTE

Aktuelle News

Transparente emissive Mikrodisplays

Mikroplastik im Meer: Neue Methode

Wie Produktionstechnik Leben retten kann

Waldbrandgefahr steigt wegen Klimawandel

Computer erkennt Tierstimmen

Media Contact

Weitere Informationen:

Erstmals 6G-Mobilfunk in Alpen getestet

Neuromorphes Rechnen mit Sound

Sicherheitslücke in Browser-Schnittstelle erlaubt Rechnerzugriff über Grafikkarte

Mit KI die Internet-Geschwindigkeit verbessern

Kommentare (0) Antworten abbrechen

Neueste Beiträge

Transparente emissive Mikrodisplays

Mikroplastik im Meer: Neue Methode

Wie Produktionstechnik Leben retten kann

Partner & Förderer