Forum für Wissenschaft, Industrie und Wirtschaft

Hauptsponsoren:     3M 
Datenbankrecherche:

 

Videoaufzeichnungen schnell auswerten

27.10.2011
Videos schauen in der Arbeitszeit? Das mag für viele reizvoll klingen. Für Sprachwissenschaftler, die tagelang Videoaufzeichnungen betrachten, um etwa Handbewegungen auszuwerten, kann es mühsam sein.

Eine neue Software, die Fraunhofer-Forscher mit Kollegen von Max-Planck entwickelt haben, erledigt diese Arbeit künftig automatisch. Teile dieser Technik finden sich seit 2010 in der ARD Mediathek. Auch Konferenzveranstalter und die Sicherheitsbranche profitieren von der automatischen Analyse.

Wie wird Sprache im Gehirn verarbeitet? Wie hängen etwa gestikulierende Handbewegungen mit dem gesprochenen Wort zusammen? Was passiert bei Versprechern – »verspricht« die Hand sich auch oder gleicht sie den Fehler aus? Um solche Fragen zu klären, sichten Wissenschaftler riesige Mengen von Videoaufzeichnungen und analysieren sie. Videomaterial steht genügend zur Verfügung – allein im Max-Planck-Institut für Psycholinguistik in Nimwegen, Niederlande, haben die Forscher über 50 000 Stunden Film zusammengetragen, um solche Fragen zu klären. Doch wenn es darum geht, aus diesen Aufzeichnungen wissenschaftliche Erkenntnisse zu gewinnen, ist es bisher mühselig: die Experten müssen jedes einzelne Video ansehen und annotieren: sie markieren beispielsweise, wo gesprochen wird, wer spricht oder wo der Sprecher die Hand hebt – eine zeitraubende Aufgabe.

Auch Mitarbeiter kommerzieller TV- und Radioarchive kennen diese Situation: Jedes Jahr strahlen allein die ARD-Fernsehanstalten über 100 000 Stunden aus. Diese Datenflut können die Angestellten nicht mehr manuell erfassen. Herkömmlichen Systemen zur automatischen Analyse solcher Daten macht dabei besonders die große Variabilität der Videos zu schaffen – von der Studioaufnahme des Nachrichtensprechers bis zur Außenaufnahme während eines Orkans. Sie helfen daher nur bedingt.

An einem neuen Lösungsansatz arbeiten Forscher der Fraunhofer-Institute für Nachrichtentechnik, Heinrich-Hertz-Institut HHI in Berlin und für Intelligente Analyse- und Informationssysteme IAIS in Sankt Augustin. Sie haben gemeinsam mit ihren Kollegen vom Max-Planck-Institut für Psycholinguistik nun ein Programm entwickelt, das die komplexen Video- und Audiomaterialien automatisch vor-annotiert. Das Projekt mit dem Namen AVATecH wird im Kooperationsprogramm von Max-Planck- und Fraunhofer-Gesellschaft mit 2,435 Millionen Euro gefördert.

»Das entwickelte System erkennt selbständig, an welchen Stellen des Videos beispielsweise gesprochen wird, und setzt die entsprechende Markierung«, sagtDr. Oliver Schreer, Projektleiter am HHI. »Auch Handbewegungen erkennt das System. Es sieht beispielsweise, ob sich die Hand des Sprechers nach oben oder unten bewegt, ob sie zum Kopf geführt wird oder bestimmte Gesten macht – und setzt auch hier die passende Markierung.« Die Wissenschaftler sparen also viel Zeit, sie können früher mit ihrer eigentlichen Arbeit, der psycho-linguistischen Analyse, beginnen. Ein einziger Mausklick reicht, um von einer Stelle, an der gesprochen wird, zur nächsten zu springen, oder von einer Handbewegung zur nächsten Geste.

Ausgangspunkt für diese Software sind Analysemethoden wie Gestenerkenner und Systeme zur automatischen Sprachanalyse, die die Forscher der beiden Fraunhofer Institute HHI und IAIS bereits in den vergangenen Jahren entwickelt haben. »Bisher konnten wir nur Videos analysieren, auf denen eine Person in hoher Auflösung gefilmt wurde, möglichst vor einem einfarbigen Hintergrund und mit wenig Hintergrundgeräuschen«, sagt Schreer. »Das vorliegende Material erfüllt diese Bedingungen jedoch größtenteils nicht. Das System muss auch Videos von mehreren Personen analysieren können, die etwa auf einer Parkbank sitzen und bei denen der Hintergrund aus Bäumen, Menschen und Häusern besteht. Für die Audioanalyse stellen Störgeräusche und mehrere Sprecher eine besondere Herausforderung dar.« Die Forscher haben die Algorithmen nun so angepasst, dass die Software ebendies leisten kann: Sie analysiert Videos verschiedener Qualität und markiert Sprache, Bewegungen der Hände und des Kopfes, etwa Kopfschütteln oder Nicken. »Das System so anzupassen, war eine große Herausforderung, 80 bis 90 Prozent der Software mussten wir neu schreiben«, sagt Schreer. Die Forscher vom HHI stellen Verfahren für die Videoanalyse bereit, ihre Kollegen vom IAIS die entsprechende Software für die Analyse von Audiodaten. Die Wissenschaftler des MPI in Nimwegen integrierten die neue Software in bestehende Tools und verbesserten Benutzeroberflächen und Web-Interfaces.

Im letzten der insgesamt drei Projektjahre konzentrieren sich die Forscher vom Max-Planck-Institut für Psycholinguistik nun auf die Anwenderfreundlichkeit. »Jeder Erkennungsalgorithmus produziert Fehler«, sagt Dr. Peter Wittenburg, technischer Leiter des Sprachenarchivs am MPI. »Jetzt geht es darum, diese schnell zu korrigieren, denn nur, wenn das System als Ganzes effizient funktioniert, werden die Forscher es auch nutzen.« Nicht nur die Max-Planck-Forscher sollen von der Software profitieren. Auch Wissenschaftler anderer Einrichtungen zeigen Interesse. »Die automatische Annotation hätte einen enormen Einfluss auf die Forschung«, ist sich Wittenburg sicher.

Überall dort, wo audiovisuelle Daten besonders robuste Analysealgorithmen erfor-dern, ermöglichen die entwickelten Analyseverfahren neue Anwendungen. Künftig soll die Software auch die politische Bühne für sich erobern: In einem EU-Projekt, das im November startet, werden die Fraunhofer-Forscher die Software so anpassen, dass Aufzeichnungen von Meetings, Konferenzen und Plenarsitzungen aufbereitet werden können. Dann lassen sich auch hier bestimmte Redner oder Inhalte auf den Videos leicht wiederfinden. Teile der robusten Audio-Strukturanalyse, die das IAIS 2010 für die ARD Mediathek umgesetzt hat, helfen dabei, komplexe Fernsehdaten automatisch zu erschließen.

Birgit Niesing | Fraunhofer-Gesellschaft
Weitere Informationen:
http://www.fraunhofer.de

Weitere Nachrichten aus der Kategorie Informationstechnologie:

nachricht Vom Edge- bis zum Cloud-Datacenter - Rittal zeigt in Monaco innovative Lösungen für Datacenter
29.05.2017 | Rittal GmbH & Co. KG

nachricht Layouterfassung im Flug: Drohne unterstützt bei der Fabrikplanung
19.05.2017 | IPH - Institut für Integrierte Produktion Hannover gGmbH

Alle Nachrichten aus der Kategorie: Informationstechnologie >>>

Die aktuellsten Pressemeldungen zum Suchbegriff Innovation >>>

Die letzten 5 Focus-News des innovations-reports im Überblick:

Im Focus: Neue Methode zur Charakterisierung von Graphen

Wissenschaftler haben eine neue Methode entwickelt, um die Eigenschaften von Graphen ohne das Anlegen störender elektrischer Kontakte zu charakterisieren. Damit lassen sich gleichzeitig der Widerstand und die Quantenkapazität von Graphen sowie von anderen zweidimensionalen Materialien untersuchen. Dies berichten Forscher vom Swiss Nanoscience Institute und Departement Physik der Universität Basel im Wissenschaftsjournal «Physical Review Applied».

Graphen besteht aus einer einzigen Lage von Kohlenstoffatomen. Es ist transparent, härter als Diamant, stärker als Stahl, dabei aber flexibel und ein deutlich...

Im Focus: New Method of Characterizing Graphene

Scientists have developed a new method of characterizing graphene’s properties without applying disruptive electrical contacts, allowing them to investigate both the resistance and quantum capacitance of graphene and other two-dimensional materials. Researchers from the Swiss Nanoscience Institute and the University of Basel’s Department of Physics reported their findings in the journal Physical Review Applied.

Graphene consists of a single layer of carbon atoms. It is transparent, harder than diamond and stronger than steel, yet flexible, and a significantly better...

Im Focus: Detaillierter Blick auf molekularen Gifttransporter

Transportproteine in unseren Körperzellen schützen uns vor gewissen Vergiftungen. Forschende der ETH Zürich und der Universität Basel haben nun die hochaufgelöste dreidimensionale Struktur eines bedeutenden menschlichen Transportproteins aufgeklärt. Langfristig könnte dies helfen, neue Medikamente zu entwickeln.

Fast alle Lebewesen haben im Lauf der Evolution Mechanismen entwickelt, um Giftstoffe, die ins Innere ihrer Zellen gelangt sind, wieder loszuwerden: In der...

Im Focus: Neue Methode für die Datenübertragung mit Licht

Der steigende Bedarf an schneller, leistungsfähiger Datenübertragung erfordert die Entwicklung neuer Verfahren zur verlustarmen und störungsfreien Übermittlung von optischen Informationssignalen. Wissenschaftler der Universität Johannesburg, des Instituts für Angewandte Optik der Friedrich-Schiller-Universität Jena und des Leibniz-Instituts für Photonische Technologien Jena (Leibniz-IPHT) präsentieren im Fachblatt „Journal of Optics“ eine neue Möglichkeit, glasfaserbasierte und kabellose optische Datenübertragung effizient miteinander zu verbinden.

Dank des Internets können wir in Sekundenbruchteilen mit Menschen rund um den Globus in Kontakt treten. Damit die Kommunikation reibungslos funktioniert,...

Im Focus: Strathclyde-led research develops world's highest gain high-power laser amplifier

The world's highest gain high power laser amplifier - by many orders of magnitude - has been developed in research led at the University of Strathclyde.

The researchers demonstrated the feasibility of using plasma to amplify short laser pulses of picojoule-level energy up to 100 millijoules, which is a 'gain'...

Alle Focus-News des Innovations-reports >>>

Anzeige

Anzeige

IHR
JOB & KARRIERE
SERVICE
im innovations-report
in Kooperation mit academics
Veranstaltungen

Wissenschaftsforum Chemie 2017

30.05.2017 | Veranstaltungen

Erfolgsfaktor Digitalisierung

30.05.2017 | Veranstaltungen

Lebensdauer alternder Brücken - prüfen und vorausschauen

29.05.2017 | Veranstaltungen

 
VideoLinks
B2B-VideoLinks
Weitere VideoLinks >>>
Aktuelle Beiträge

Neue Methode zur Charakterisierung von Graphen

30.05.2017 | Physik Astronomie

Riesenfresszellen steuern die Entwicklung von Nerven und Blutgefäßen im Gehirn

30.05.2017 | Biowissenschaften Chemie

Nano-U-Boot mit Selbstzerstörungs-Mechanismus

30.05.2017 | Biowissenschaften Chemie