Bauklotz-Blick für besseres maschinelles Sehen

Bild und Nachbau: So sollen Computer Szenen besser verstehen (Foto: Carnegie Mellon University)

Forscher an der Carnegie Mellon University (CMU) setzen auf virtuelle Bauklötze, damit Computer ihre Umgebung besser erfassen können. Hintergrund ist, dass die Maschinen oft nicht in der Lage sind, Bilder von Freiluftumgebungen zu interpretieren.

Im Prinzip geht der Computer beim CMU-Ansatz daher vor wie ein Kind, das ein Gebäude mit Bausteinen nachbaut. „Wenn der Computer ein Bild Block für Block nachstellen kann, wird er die Szene besser verstehen“, sagt der CMU-Robotiker Abhinav Gupta. Das ist beispielsweise für Roboter wichtig, die selbst eine Bewegungsroute planen sollen.

Verständnis durch Nachbau

„Wenn Menschen ein Foto ansehen, verstehen sie, dass die Szene geometrischen Einschränkungen unterliegt“, sagt Gupta. Gebäude etwa haben eine Tiefe und Türme sind im Normalfall nicht schief. Dadurch können wir uns vorstellen, wie eine zweidimensional abgebildete Szene real aussieht. Vergleichbares wollen die Forscher für maschinelles Sehen durch ihren Bauklotz-Ansatz ermöglichen. Dazu nimmt der Computer für Objekte in der Szene wahrscheinliche Formen an, die ihm als Basis für den virtuellen Nachbau dienen.

Dann versucht der Computer, die Formen im Bild mithilfe virtueller Quader und anderer Bausteine zu rekonstruieren. Würde ein Block dabei über dem Boden schweben, ist das für die Software ein Zeichen, dass er entweder eine falsche Form angenommen hat oder aber ein Objekt im Bild teilweise verdeckt ist. Mit diesem Ansatz für die Szenenanalyse kann es auf die Dauer möglich werden, dass Computer sinnvolle Schlüsse über Bereiche zwischen und sogar hinter sichtbaren Objekten auf einem Bild ziehen, so Alexei Efros, Professor für Robotik und Informatik an der CMU.

Sinnvolle Interpretationen

Die Forscher sind davon überzeugt, dass künstliche Intelligenzen mit ihrem Ansatz gerade Freiluftszenen sinnvoller interpretieren können als bisher. Ein anderer Ansatz der CMU-Forscher, der eine ungefähre 3D-Rekonstruktion ähnlich einem Aufklapp-Buch liefert, hat sich nur bedingt bewährt. Denn die resultierenden Darstellungen sind fallweise schlichtweg absurd. Die Methode, einzelne Objekte zu erkennen, wiederum liefert keine Information darüber, wo sich beispielsweise begehbare Flächen befinden. Genau dieses Detail ist aber wichtig, wenn Roboter mithilfe eines Bildes einen Weg durch die Umgebung suchen sollen.

Media Contact

Thomas Pichler pressetext.austria

Weitere Informationen:

http://www.cmu.edu

Alle Nachrichten aus der Kategorie: Interdisziplinäre Forschung

Aktuelle Meldungen und Entwicklungen aus fächer- und disziplinenübergreifender Forschung.

Der innovations-report bietet Ihnen hierzu interessante Berichte und Artikel, unter anderem zu den Teilbereichen: Mikrosystemforschung, Emotionsforschung, Zukunftsforschung und Stratosphärenforschung.

Zurück zur Startseite

Kommentare (0)

Schreiben Sie einen Kommentar

Neueste Beiträge

Bakterien für klimaneutrale Chemikalien der Zukunft

For­schen­de an der ETH Zü­rich ha­ben Bak­te­ri­en im La­bor so her­an­ge­züch­tet, dass sie Me­tha­nol ef­fi­zi­ent ver­wer­ten kön­nen. Jetzt lässt sich der Stoff­wech­sel die­ser Bak­te­ri­en an­zap­fen, um wert­vol­le Pro­duk­te her­zu­stel­len, die…

Batterien: Heute die Materialien von morgen modellieren

Welche Faktoren bestimmen, wie schnell sich eine Batterie laden lässt? Dieser und weiteren Fragen gehen Forschende am Karlsruher Institut für Technologie (KIT) mit computergestützten Simulationen nach. Mikrostrukturmodelle tragen dazu bei,…

Porosität von Sedimentgestein mit Neutronen untersucht

Forschung am FRM II zu geologischen Lagerstätten. Dauerhafte unterirdische Lagerung von CO2 Poren so klein wie Bakterien Porenmessung mit Neutronen auf den Nanometer genau Ob Sedimentgesteine fossile Kohlenwasserstoffe speichern können…

Partner & Förderer