Software verschafft Überblick in großen Dokumenten

Experten der globalen Siemens-Forschung Corporate Technology entwickelten einerseits eine Suche, die es ermöglicht nach Schlüsselwörtern und Textpassagen in allen Dokumenten z.B. einer Ausschreibung gleichzeitig zu suchen, ohne die Dokumente selbst öffnen zu müssen.

Das macht die Suche sehr schnell. Im Millisekundenbereich kann der Nutzer sich die Ergebnisse in den Dokumenten selbst anschauen. Andererseits entwickelten sie eine Komponente, die die Veränderungen der Anforderungen gegenüber früheren Versionen prüft.

Wie die Zeitschrift Pictures of the Future in ihrer aktuellen Ausgabe berichtet, soll am Ende eine semantischen Software stehen, die Zusammenhänge erkennt und so relevante Informationen findet. Ursprünglich entwickelte Corporate Technology die Software im Rahmen einer Machbarkeitsstudie zur Digitalisierung aller Grundbücher in Deutschland.

Gesucht war eine Technik, um aus den Grundbüchern der vergangenen 50 Jahre – rund 500 Millionen pdf-Seiten – automatisiert Informationen wie Eigentümer, Grundstückgröße oder Hypothekenbelastungen zu erfassen.

Die Software musste in der Lage sein, unter Ausnutzung der  Dokumentstruktur die jeweiligen Informationen zu extrahieren. Dabei musste sie auch für Scans schlecht kopierter Schreibmaschinenseiten oder für mehrfach korrigierte Dokumente funktionieren.

ei der Weiterentwicklung der Software für industrielle Ausschreibungen arbeiten die CT-Forscher eng mit Kollegen aus den jeweiligen Siemens-Geschäften zusammen. Auf dieser Basis entwickeln die Forscher charakteristische Such-Algorithmen, um im Dokument alle Informationen zu bestimmten Themen, beispielsweise zu Sicherheit oder Emissionsschutz zu finden. 

Weil im Laufe eines Projekts Ausschreibungen wiederholt angepasst werden, identifiziert die Software in einem zweiten Schritt Änderungen gegenüber vorherigen Versionen und zeigt sie dem Nutzer an. In einem dritten Schritt werden Analogien zu früheren, ähnlichen Ausschreibungen gesucht, so dass die Nutzer sehen können, wie bestimmte Anforderungen damals bewertet wurden.

Insgesamt spart die automatisierte semantische Auswertung großer Ausschreibungs-Dokumente Zeit, vermeidet Fehler und macht es einfacher, kurzfristige Änderungen zu integrieren und zu analysieren. (2014.07.4)

Media Contact

Dr. Norbert Aschenbrenner Siemens InnovationNews

Weitere Informationen:

http://www.siemens.de/innovation

Alle Nachrichten aus der Kategorie: Informationstechnologie

Neuerungen und Entwicklungen auf den Gebieten der Informations- und Datenverarbeitung sowie der dafür benötigten Hardware finden Sie hier zusammengefasst.

Unter anderem erhalten Sie Informationen aus den Teilbereichen: IT-Dienstleistungen, IT-Architektur, IT-Management und Telekommunikation.

Zurück zur Startseite

Kommentare (0)

Schreiben Sie einen Kommentar

Neueste Beiträge

Bakterien für klimaneutrale Chemikalien der Zukunft

For­schen­de an der ETH Zü­rich ha­ben Bak­te­ri­en im La­bor so her­an­ge­züch­tet, dass sie Me­tha­nol ef­fi­zi­ent ver­wer­ten kön­nen. Jetzt lässt sich der Stoff­wech­sel die­ser Bak­te­ri­en an­zap­fen, um wert­vol­le Pro­duk­te her­zu­stel­len, die…

Batterien: Heute die Materialien von morgen modellieren

Welche Faktoren bestimmen, wie schnell sich eine Batterie laden lässt? Dieser und weiteren Fragen gehen Forschende am Karlsruher Institut für Technologie (KIT) mit computergestützten Simulationen nach. Mikrostrukturmodelle tragen dazu bei,…

Porosität von Sedimentgestein mit Neutronen untersucht

Forschung am FRM II zu geologischen Lagerstätten. Dauerhafte unterirdische Lagerung von CO2 Poren so klein wie Bakterien Porenmessung mit Neutronen auf den Nanometer genau Ob Sedimentgesteine fossile Kohlenwasserstoffe speichern können…

Partner & Förderer