Bonner Algorithmen zur automatischen Bilderkennung weltweit führend

Computer schlagen heute die weltbesten menschlichen Spieler im Schach. Wenn es jedoch um die Interpretation von Bildinhalten geht, sind sie selbst Kleinkindern weit unterlegen. Denn in dieser Disziplin sind wir spitze: Wir erkennen auf Anhieb, dass das Ding auf dem Tisch ein Becher ist und keine Vase. Wir können die Zeitungsschlagzeile lesen, obwohl das Papier gerade an dieser Stelle gefaltet und deshalb nur die obere Hälfte sichtbar ist. Wir wissen: Das ist ein Geldstück, auch wenn wir die Währung noch nie gesehen haben.

„Seit frühester Kindheit werden wir mit visuellem Input gefüttert“, erklärt Professor Dr. Cristian Sminchisescu. „Das hilft uns natürlich, neue Inhalte zu interpretieren und einzuordnen.“ Der gebürtige Rumäne leitet am Bonner Institut für Numerische Simulation die Arbeitsgruppe „Computer Vision and Machine Learning“. Der Name ist Programm: Seine Mitarbeiter und er entwickeln lernfähige Algorithmen zur automatisierten Erkennung von Bildinhalten. Und das ziemlich erfolgreich: Gerade hat die Gruppe im so genannten PASCAL-Wettbewerb den ersten Platz im Teilgebiet „Bildsegmentierung“ belegt. Dieser gilt international als einer der anspruchsvollsten wissenschaftlichen Wettkämpfe zu diesem Thema.

Computer im Trainingslager

Bei der Bildsegmentierung geht es nicht nur darum, die Bildinhalte korrekt zu benennen. Der Algorithmus soll auch die Konturen der abgebildeten Gegenstände oder Personen finden. Also etwa: Das ist ein Stuhl, hier ist ein Kind, das darauf sitzt, und der Rest ist Hintergrund. Die Organisatoren des „Pascal Visual Object Challenge“ hatten den Teilnehmern dazu einen Satz von 2.000 Trainingsbildern zur Verfügung gestellt. Darin waren sowohl die abgebildeten Objekte als auch ihre Grenzen korrekt gekennzeichnet.

Sminchisescu und seine Mitarbeiter Dr. Fuxin Li und João Carreira haben ihren Rechner mit diesen Trainingsbildern gefüttert. „Unser Algorithmus konnte so lernen, die Inhalte korrekt zu identifizieren“, erklärt Li. Danach gaben die Ausrichter des Wettbewerbs einen neuen Satz Fotos frei, an dem die Algorithmen ihr Können beweisen mussten. Mit einer Trefferquote von 40 Prozent kam der Bonner Lösungsansatz auf Platz 1 – vor Berkeley (36 Prozent), Chicago (32 Prozent), Oxford-Brooks (31 Prozent) und Stanford (29 Prozent).

Jedes zweijährige Kleinkind kann das zwar besser. Es hat aber in seinem kurzen Leben bereits Milliarden von Bildeindrücken gesammelt – nicht lediglich 2.000. Zudem werden die Algorithmen immer besser: „Wir haben den Wettbewerb bereits im letzten Jahr für uns entscheiden können – damals aber noch mit einer Erfolgsquote von 36 Prozent“, sagt Cristian Sminchisescu.

Ordnung im Fotochaos

Doch wozu sollen Rechner überhaupt sehen lernen? Ein Anwendungsbeispiel sind intelligente Bilddatenbanken. Schon heute gibt es erste Programme für den Heimgebrauch, die auf Fotos automatisch die abgebildeten Personen erkennen. Sie können aus dem digitalen Fotochaos ruck-zuck diejenigen Bilder herausfiltern, die Oma und Opa mit ihrer süßen Enkelin zeigen. Perfekt funktioniert das allerdings noch nicht – und das, obwohl Gesichtserkennung ein vergleichsweise einfaches Problem ist.

Doch auch der Bonner Algorithmus kann sich irren. Mit ein paar Mausklicken holt Sminchisescu ein besonders gravierendes Beispiel auf den Bildschirm: Das Foto eines gedeckten Frühstückstischs. Der Computer hatte darin ein Motorrad erkannt.

Kontakt:
Professor Dr. Cristian Sminchisescu
Institut für Numerische Simulation der Universität Bonn
Telefon: 0228/73-3522
E-Mail: cristian.sminchisescu@ins.uni-bonn.de

Media Contact

Frank Luerweg idw

Weitere Informationen:

http://www.uni-bonn.de

Alle Nachrichten aus der Kategorie: Informationstechnologie

Neuerungen und Entwicklungen auf den Gebieten der Informations- und Datenverarbeitung sowie der dafür benötigten Hardware finden Sie hier zusammengefasst.

Unter anderem erhalten Sie Informationen aus den Teilbereichen: IT-Dienstleistungen, IT-Architektur, IT-Management und Telekommunikation.

Zurück zur Startseite

Kommentare (0)

Schreiben Sie einen Kommentar

Neueste Beiträge

Batterien: Heute die Materialien von morgen modellieren

Welche Faktoren bestimmen, wie schnell sich eine Batterie laden lässt? Dieser und weiteren Fragen gehen Forschende am Karlsruher Institut für Technologie (KIT) mit computergestützten Simulationen nach. Mikrostrukturmodelle tragen dazu bei,…

Porosität von Sedimentgestein mit Neutronen untersucht

Forschung am FRM II zu geologischen Lagerstätten. Dauerhafte unterirdische Lagerung von CO2 Poren so klein wie Bakterien Porenmessung mit Neutronen auf den Nanometer genau Ob Sedimentgesteine fossile Kohlenwasserstoffe speichern können…

Transparente emissive Mikrodisplays

… für ultraleichte und kompakte Augmented-Reality-Systeme. Im Rahmen des Projektes HOT („Hochperformante transparente und biegbare Mikro-Elektronik für photonische und optische Anwendungen“) haben Forschende des Fraunhofer-Instituts für Photonische Mikrosysteme IPMS ein…

Partner & Förderer