Forum für Wissenschaft, Industrie und Wirtschaft

Hauptsponsoren:     3M 
Datenbankrecherche:

 

Computerprogramm schaut fünf Minuten in die Zukunft

13.06.2018

Informatiker der Universität Bonn haben eine Software entwickelt, die ein paar Minuten in die Zukunft blicken kann: Das Programm lernt zunächst aus Videosequenzen die typische Abfolge von Aktionen, etwa beim Kochen. Basierend auf diesem Wissen kann es dann auch in neuen Situationen treffsicher vorhersagen, wann der Küchenchef was machen wird. Die Forscher präsentieren ihre Ergebnisse auf der weltgrößten Konferenz für digitales Sehen und Mustererkennung, die vom 19. bis 21. Juni in Salt Lake City (USA) stattfindet.

Der perfekte Butler, das weiß jeder Fan britischer Gesellschaftsdramen, hat eine besondere Fähigkeit: Er ahnt die Wünsche seines Arbeitgebers, bevor dieser sie ausspricht. Die Arbeitsgruppe von Prof. Dr. Jürgen Gall möchte Computern Ähnliches beibringen: „Wir wollen Zeitpunkt und Dauer von Handlungen vorhersagen – und zwar Minuten oder sogar Stunden, bevor sie stattfinden“, erklärt er.


Was passiert als nächstes? Prof. Dr. Jürgen Gall (rechts) und Yazan Abu Farha vom Institut für Informatik der Universität Bonn.

© Foto: Barbara Frommann/Uni Bonn

Ein Küchenroboter könnte dann zum Beispiel die Zutaten reichen, sobald sie gebraucht werden, rechtzeitig den Backofen vorheizen – und zwischendurch den Küchenchef warnen, wenn der einen Zubereitungsschritt zu vergessen droht. Der automatische Staubsauger wüsste derweil, dass er zu dieser Zeit in der Küche nichts zu suchen hat, und kümmert sich stattdessen ums Wohnzimmer.

Wir Menschen sind sehr gut darin, Handlungen anderer zu antizipieren. Bei Computern steckt diese Disziplin jedoch noch in den Kinderschuhen. Die Forscher am Institut für Informatik der Universität Bonn können nun aber einen ersten Erfolg vermelden: Sie haben eine selbst lernende Software entwickelt, die Zeitpunkt und Dauer künftiger Aktionen erstaunlich genau abschätzen kann – und das immerhin über Zeiträume von mehreren Minuten.

Trainingsdaten: vier Stunden Salat-Videos

Als Trainingsdaten dienten den Wissenschaftlern unter anderem 40 Videos, in denen Darsteller unterschiedliche Salate zubereiteten. Jede der Aufzeichnungen war rund 6 Minuten lang und enthielt im Schnitt 20 verschiedene Aktionen. Die Videos enthielten zudem genaue Angaben, zu welcher Zeit welche Aktion startete und wie lang sie dauerte.

Der Rechner „schaute“ sich diese insgesamt rund vier Stunden Salat-Videos an. Der Algorithmus erlernte so, welche Aktionen bei dieser Aufgabe typischerweise aufeinander folgen und wie lange diese dauern. Das ist beileibe nicht trivial: Schließlich hat jeder Koch seine individuelle Vorgehensweise. Außerdem kann die Abfolge je nach Rezept variieren.

„Danach haben wir getestet, wie erfolgreich der Lernvorgang war“, erklärt Gall. „Dazu haben wir die Software mit Videos konfrontiert, die sie zuvor noch nicht gesehen hatte.“ Immerhin passten die neuen Kurzfilme in den Kontext: Auch sie zeigten die Zubereitung eines Salats. Für den Test wurde dem Computer mitgeteilt, was in den ersten 20 oder 30 Prozent eines dieser neuen Videos zu sehen war. Auf dieser Basis musste er dann vorhersagen, was im restlichen Film passieren würde.

Das klappte erstaunlich gut. Gall: „Die Genauigkeit lag für kurze Prognose-Zeiträume bei über 40 Prozent, sank dann aber umso mehr ab, je weiter der Algorithmus in die Zukunft blicken musste.“ Bei Handlungen, die mehr als drei Minuten in der Zukunft lagen, lag der Rechner noch in 15 Prozent der Fälle richtig. Allerdings galt die Prognose auch nur dann als korrekt, wenn sowohl die Aktion als auch ihr Zeitpunkt richtig vorhergesagt wurde.

Gall und seine Mitarbeiter wollen die Studie nur als einen ersten Schritt in das neue Gebiet der Handlungsvorhersage verstanden wissen. Zumal der Algorithmus spürbar schlechter abschneidet, wenn er selber erkennen muss, was sich im ersten Teil des Videos abspielt, und das nicht gesagt bekommt. Denn diese Analyse ist nie zu 100 Prozent korrekt – Gall spricht von „verrauschten“ Daten. „Unser Verfahren funktioniert damit zwar auch“, sagt er. „Aber leider noch längst nicht so gut.“

Die Studie ist im Rahmen einer Forschergruppe entstanden, die sich der Vorhersage menschlichen Verhaltens widmet und die von der Deutschen Forschungsgemeinschaft (DFG) finanziell unterstützt wird.

Publikation: Yazan Abu Farha, Alexander Richard und Jürgen Gall: When will you do what? - Anticipating Temporal Occurrences of Activities. IEEE Conference on Computer Vision and Pattern Recognition 2018; http://pages.iai.uni-bonn.de/gall_juergen/download/jgall_anticipation_cvpr18.pdf

Beispiele für Test-Videos und die daraus abgeleiteten Prognosen gibt es unter https://www.youtube.com/watch?v=xMNYRcVH_oI

Kontakt:

Prof. Dr. Jürgen Gall
Institut für Informatik
Universität Bonn
Tel. 0228/7369600
E-Mail: gall@informatik.uni-bonn.de

Johannes Seiler | idw - Informationsdienst Wissenschaft

Weitere Berichte zu: Computer Computer Vision Computerprogramm DFG IEEE Software Staubsauger Trainingsdaten

Weitere Nachrichten aus der Kategorie Informationstechnologie:

nachricht Gehirn-Schluckauf besser verstehen
11.06.2018 | Technische Universität Chemnitz

nachricht Ein Rezept gegen die Macht der Quantencomputer
11.06.2018 | Technische Universität Darmstadt

Alle Nachrichten aus der Kategorie: Informationstechnologie >>>

Die aktuellsten Pressemeldungen zum Suchbegriff Innovation >>>

Die letzten 5 Focus-News des innovations-reports im Überblick:

Im Focus: Robotik live auf der automatica – Fraunhofer IPK führt Automatisierungslösungen vor

Auf der diesjährigen automatica in München präsentiert das Fraunhofer IPK zwei Technologie-Innovationen aus dem Bereich Robotik „in Aktion“: Ein Agrar-Roboter für die Ernte von Einlegegurken sowie eine Oberkörper-Softorthese zur Unterstützung von Industrie-Arbeitskräften werden erstmals live auf einer Messe vorgeführt.

Roboter für die Gurkenernte

Im Focus: Neutrinos auf der genauesten Waage der Welt

Wie schwer sind Neutrinos? Diese unscheinbare Frage gehört zu den wichtigsten Fragestellungen in der modernen Teilchenphysik und Kosmologie. Der Antwort einen großen Schritt näher bringt uns das Karlsruher Tritium Neutrino Experiment KATRIN. Es wurde am Karlsruher Institut für Technologie von einer internationalen Kollaboration in 15-jähriger Bauzeit aufgebaut und beginnt am 11. Juni 2018 mit einer feierlichen Eröffnung seine mehrjährige Messphase.

Die Neutrinowaage KATRIN nimmt den Messbetrieb auf. Nach Hauptspektrometer und Detektoreinheit ist mit der Tritiumquelle auch die letzte der Großkomponenten...

Im Focus: Smarte Ideen für das „Festival der Innovationen“

Die Universität Jena ist vom 12. bis 15. Juni mit drei Exponaten auf der CeBIT in Hannover vertreten

Die Digital-Messe CeBIT in Hannover verändert ihre bisherige Ausrichtung. Künftig werde es in Hannover ein „Festival der Innovationen“ geben, versprechen die...

Im Focus: Karten aus Nervenzellen

Mäuse bewegen sich durch eine virtuelle Videospielwelt – und liefern Einsichten in Mechanismen der Gedächtnisbildung

Dr. Thomas Hainmüller und Prof. Dr. Marlene Bartos vom Institut für Physiologie der Universität Freiburg haben ein neues Erklärungsmodell aufgestellt, wie das...

Im Focus: Scharfe Bilder mit flexiblen Fasern

Ein internationales Wissenschaftler-Team hat eine neue Möglichkeit gefunden Bildinformationen nahezu ohne Verzerrung durch multimodale Fasern zu übertragen – selbst wenn sie die Fasern verbiegen. Die Ergebnisse der Untersuchungen, an denen Forscher des Leibniz-Instituts für Photonische Technologien Jena (Leibniz-IPHT) beteiligt sind, erschienen am 6. Juni in einem Artikel im vielzitierten Fachmagazin Physical Review Letters.

Endoskope erlauben Medizinern in das Körperinnere von Patienten wie durch ein Schlüsselloch zu blicken. Gewöhnlich werden die Bilder von ein Bündel aus...

Alle Focus-News des Innovations-reports >>>

Anzeige

Anzeige

VideoLinks
Industrie & Wirtschaft
Veranstaltungen

Meteoriteneinschläge und Spektralfarben: HITS bei Explore Science 2018

11.06.2018 | Veranstaltungen

Zweite International Baltic Earth Conference in Dänemark: “The Baltic Sea region in Transition”

08.06.2018 | Veranstaltungen

„Wer Chaos automatisiert, erhält Chaos.“ SEMANTiCS-Konferenz 2018, 10.-13.09.2018

07.06.2018 | Veranstaltungen

VideoLinks
Wissenschaft & Forschung
Weitere VideoLinks im Überblick >>>
 
Aktuelle Beiträge

Erster Cloud-Park Deutschlands für energieintensive Edge-Szenarien

13.06.2018 | CeBIT

Messewand PIXLIP GO LED

13.06.2018 | Kommunikation Medien

Internationaler Workshop zu Künstlicher Intelligenz in der Quantenphysik

13.06.2018 | Seminare Workshops

Weitere B2B-VideoLinks
IHR
JOB & KARRIERE
SERVICE
im innovations-report
in Kooperation mit academics