Bonner Algorithmen zur automatischen Bilderkennung weltweit führend

Computer schlagen heute die weltbesten menschlichen Spieler im Schach. Wenn es jedoch um die Interpretation von Bildinhalten geht, sind sie selbst Kleinkindern weit unterlegen. Denn in dieser Disziplin sind wir spitze: Wir erkennen auf Anhieb, dass das Ding auf dem Tisch ein Becher ist und keine Vase. Wir können die Zeitungsschlagzeile lesen, obwohl das Papier gerade an dieser Stelle gefaltet und deshalb nur die obere Hälfte sichtbar ist. Wir wissen: Das ist ein Geldstück, auch wenn wir die Währung noch nie gesehen haben.

„Seit frühester Kindheit werden wir mit visuellem Input gefüttert“, erklärt Professor Dr. Cristian Sminchisescu. „Das hilft uns natürlich, neue Inhalte zu interpretieren und einzuordnen.“ Der gebürtige Rumäne leitet am Bonner Institut für Numerische Simulation die Arbeitsgruppe „Computer Vision and Machine Learning“. Der Name ist Programm: Seine Mitarbeiter und er entwickeln lernfähige Algorithmen zur automatisierten Erkennung von Bildinhalten. Und das ziemlich erfolgreich: Gerade hat die Gruppe im so genannten PASCAL-Wettbewerb den ersten Platz im Teilgebiet „Bildsegmentierung“ belegt. Dieser gilt international als einer der anspruchsvollsten wissenschaftlichen Wettkämpfe zu diesem Thema.

Computer im Trainingslager

Bei der Bildsegmentierung geht es nicht nur darum, die Bildinhalte korrekt zu benennen. Der Algorithmus soll auch die Konturen der abgebildeten Gegenstände oder Personen finden. Also etwa: Das ist ein Stuhl, hier ist ein Kind, das darauf sitzt, und der Rest ist Hintergrund. Die Organisatoren des „Pascal Visual Object Challenge“ hatten den Teilnehmern dazu einen Satz von 2.000 Trainingsbildern zur Verfügung gestellt. Darin waren sowohl die abgebildeten Objekte als auch ihre Grenzen korrekt gekennzeichnet.

Sminchisescu und seine Mitarbeiter Dr. Fuxin Li und João Carreira haben ihren Rechner mit diesen Trainingsbildern gefüttert. „Unser Algorithmus konnte so lernen, die Inhalte korrekt zu identifizieren“, erklärt Li. Danach gaben die Ausrichter des Wettbewerbs einen neuen Satz Fotos frei, an dem die Algorithmen ihr Können beweisen mussten. Mit einer Trefferquote von 40 Prozent kam der Bonner Lösungsansatz auf Platz 1 – vor Berkeley (36 Prozent), Chicago (32 Prozent), Oxford-Brooks (31 Prozent) und Stanford (29 Prozent).

Jedes zweijährige Kleinkind kann das zwar besser. Es hat aber in seinem kurzen Leben bereits Milliarden von Bildeindrücken gesammelt – nicht lediglich 2.000. Zudem werden die Algorithmen immer besser: „Wir haben den Wettbewerb bereits im letzten Jahr für uns entscheiden können – damals aber noch mit einer Erfolgsquote von 36 Prozent“, sagt Cristian Sminchisescu.

Ordnung im Fotochaos

Doch wozu sollen Rechner überhaupt sehen lernen? Ein Anwendungsbeispiel sind intelligente Bilddatenbanken. Schon heute gibt es erste Programme für den Heimgebrauch, die auf Fotos automatisch die abgebildeten Personen erkennen. Sie können aus dem digitalen Fotochaos ruck-zuck diejenigen Bilder herausfiltern, die Oma und Opa mit ihrer süßen Enkelin zeigen. Perfekt funktioniert das allerdings noch nicht – und das, obwohl Gesichtserkennung ein vergleichsweise einfaches Problem ist.

Doch auch der Bonner Algorithmus kann sich irren. Mit ein paar Mausklicken holt Sminchisescu ein besonders gravierendes Beispiel auf den Bildschirm: Das Foto eines gedeckten Frühstückstischs. Der Computer hatte darin ein Motorrad erkannt.

Kontakt:
Professor Dr. Cristian Sminchisescu
Institut für Numerische Simulation der Universität Bonn
Telefon: 0228/73-3522
E-Mail: cristian.sminchisescu@ins.uni-bonn.de

Media Contact

Frank Luerweg idw

Weitere Informationen:

http://www.uni-bonn.de

Alle Nachrichten aus der Kategorie: Informationstechnologie

Neuerungen und Entwicklungen auf den Gebieten der Informations- und Datenverarbeitung sowie der dafür benötigten Hardware finden Sie hier zusammengefasst.

Unter anderem erhalten Sie Informationen aus den Teilbereichen: IT-Dienstleistungen, IT-Architektur, IT-Management und Telekommunikation.

Zurück zur Startseite

Kommentare (0)

Schreiben Sie einen Kommentar

Neueste Beiträge

Anlagenkonzepte für die Fertigung von Bipolarplatten, MEAs und Drucktanks

Grüner Wasserstoff zählt zu den Energieträgern der Zukunft. Um ihn in großen Mengen zu erzeugen, zu speichern und wieder in elektrische Energie zu wandeln, bedarf es effizienter und skalierbarer Fertigungsprozesse…

Ausfallsichere Dehnungssensoren ohne Stromverbrauch

Um die Sicherheit von Brücken, Kränen, Pipelines, Windrädern und vielem mehr zu überwachen, werden Dehnungssensoren benötigt. Eine grundlegend neue Technologie dafür haben Wissenschaftlerinnen und Wissenschaftler aus Bochum und Paderborn entwickelt….

Dauerlastfähige Wechselrichter

… ermöglichen deutliche Leistungssteigerung elektrischer Antriebe. Überhitzende Komponenten limitieren die Leistungsfähigkeit von Antriebssträngen bei Elektrofahrzeugen erheblich. Wechselrichtern fällt dabei eine große thermische Last zu, weshalb sie unter hohem Energieaufwand aktiv…

Partner & Förderer