Digitale Dokumentenanalyse profitiert von Künstlicher Intelligenz

Ziel ist es, die Fehlerraten beim Erkennen von Buchstaben, Wörtern, Texten oder Bildern deutlich zu verringern, um so an die Leistungsfähigkeit der menschlichen Interpretation heran zu reichen. Kern des Vorhabens ist die Entwicklung einer »OCR-Engine«, die auch bei der Auswertung von großen Informationsmengen keine oder möglichst wenige Fehler produziert.

Optical Character Recognition (OCR) wird unter anderem bei der Digitalisierung von Bibliotheksinhalten, Zeitungsarchiven oder Versicherungsdokumenten eingesetzt. In vielen Fällen reicht es aus, wenn die digitalisierten Dokumente bis zu 99 Prozent richtig erfasst werden – zum Beispiel, um Papierdokumente über Suchmaschinen zugänglich zu machen. Bei rechtlich und finanziell relevanten Dokumenten bedeutet aber selbst eine Erkennungsrate von 99,9 Prozent je Zeichen, dass jede Dokumentseite einen Fehler hat – hier leistet der Mensch erheblich mehr.

Selbstlernende Technologien erleichtern Verwaltungsprozesse

»Unser Ziel, Verwaltungsprozesse im privaten Bereich und in Großunternehmen zu automatisieren, kann durch diese neuartige OCR-Engine erheblich weiterentwickelt werden. Mit der Web-Anwendung CIB doXisafe können Privatanwender ihre Dokumente – in einer Vielzahl von Formaten – von überall ohne Installation ablegen, austauschen und im integrierten CIB doXiview ohne Download anzeigen lassen. In diesem Viewer lässt sich für einige Formate eine Texterkennung durchführen, das Ergebnis bearbeiten und als durchsuchbares PDF bereitstellen. Über diese Produkte kann der User aktiv die Qualität der OCR verbessern, indem er mit seinen Dokumenten die für das Deep Learning erforderliche Big Data erweitert«, sagt Ulrich Brandner, Geschäftsführer der CIB software GmbH.

Deep-Learning-Technologien für den deutschen Mittelstand

»Anwendungen in der Sprach- oder Gesichtserkennung – wie Siri oder Google Voice Search – profitieren bereits von Deep Learning. In Deutschland finden die technologischen Fortschritte der künstlichen Intelligenz jedoch eher im Forschungsbereich statt und werden noch viel zu selten in die Anwendung gebracht. Mit der Entwicklung einer OCR-Engine wollen wir Deep-Learning-Technologien auch für die Wirtschaft und insbesondere den Mittelstand nutzbar machen«, ergänzt Joachim Köhler, Abteilungsleiter am Fraunhofer IAIS. Er rechnet dabei mit großen Fortschritten für die OCR-Technologien, die in den letzten Jahren hinsichtlich der Leistungsfähigkeit stagniert haben. Hier existieren erst einige wenige kommerzielle Anwendungen und Open-Source-Lösungen.

Die OCR-Engine wird zunächst in das bestehende Produktportfolio der CIB software GmbH eingebaut und getestet. Darüber hinaus soll sie zunächst für den deutschen Markt anderen Unternehmen über ein Lizenzmodell zur Verfügung gestellt werden. Gefördert wird das Projekt DeepER vom Bundesministerium für Bildung und Forschung BMBF im Rahmen der Förderinitiative »KMU-Innovativ«. Diese unterstützt Spitzenforschung im deutschen Mittelstand. Projektstart war der 1. Juli 2016, die Laufzeit beträgt 27 Monate.

Ansprechpartner:

Pressekontakt Fraunhofer IAIS
Silke Loh
Presse und Öffentlichkeitsarbeit
Telefon 02241 14-2829
silke.loh@iais.fraunhofer.de

www.iais.fraunhofer.de  

Project Management Office CIB software GmbH
Carolin Wüst
Telefon +49 89 14360-50
Carolin.Wuest@cib.de

www.cib.de

Media Contact

Silke Loh Fraunhofer-Institut für Intelligente Analyse- und Informationssysteme IAIS

Alle Nachrichten aus der Kategorie: Informationstechnologie

Neuerungen und Entwicklungen auf den Gebieten der Informations- und Datenverarbeitung sowie der dafür benötigten Hardware finden Sie hier zusammengefasst.

Unter anderem erhalten Sie Informationen aus den Teilbereichen: IT-Dienstleistungen, IT-Architektur, IT-Management und Telekommunikation.

Zurück zur Startseite

Kommentare (0)

Schreib Kommentar

Neueste Beiträge

Botanische Fallensteller in Gefahr

Ein Viertel aller fleischfressenden Pflanzen weltweit bedroht Ein internationales Forscherteam um SNSB-Botaniker Andreas Fleischmann hat den Rote-Liste-Naturschutzstatus und die Bedrohungen für alle bekannten 860 Arten von fleischfressenden Pflanzen im 21….

Erstmals nachgewiesen: zugelassenes Cannabinoid lindert Symptome bei Parkinson

Erstmals wird in einer Studie die Wirksamkeit eines Cannabinoids bei nicht-motorischen Symptomen bei Parkinson untersucht Nachweisliche Besserung nichtmotorischer Symptome Potenzielle therapeutische Auswirkung auf Motorik An der Innsbrucker Universitätsklinik für Neurologie…

Wie Galaxien ihre Sterne produziert haben

Durchmusterung rekonstruiert Schlüsselkapitel der kosmischen Geschichte Astronom*innen haben das ALMA-Observatorium genutzt, um den Rohstoff für die Sternentstehung – molekulares Wasserstoffgas – im Hubble Ultra-Deep Field aufzuspüren, einer der am besten…

By continuing to use the site, you agree to the use of cookies. more information

The cookie settings on this website are set to "allow cookies" to give you the best browsing experience possible. If you continue to use this website without changing your cookie settings or you click "Accept" below then you are consenting to this.

Close