Automatisierte Rekonstruktion von Stasiakten

Das Ergebnis: In 16 250 Säcken lagern bis heute schätzungsweise 45 Millionen der damals zerrissenen Dokumente. Im Auftrag der Bundesbehörde für die Unterlagen des Staatssicherheitsdienstes der ehemaligen DDR BStU soll das Fraunhofer-Institut für Produktionsanlagen und Konstruktionstechnik IPK in Berlin nun dieses gigantische Puzzle zusammensetzen. In einem Pilotprojekt wird in den nächsten zwei Jahren der Inhalt aus 400 Säcken automatisiert rekonstruiert.

Um die Geheimnisse des DDR-Regimes zu bewahren, wurden zwischen Herbst 1989 und Januar 1990 im ehemaligen Ministerium für Staatssicherheit systematisch Akten vorvernichtet. Die Menge der Dokumente war so enorm, dass die Reißwölfe ausfielen. Ein großer Teil der Unterlagen musste per Hand zerrissen werden. Geschätzte 45 Millionen DIN-A4 Seiten wurden in je 8 bis 30 Teile zerlegt.

Bisher gelang es nur einen geringen Teil dieser Dokumente zu rekonstruieren. Denn das manuelle Zusammensetzen ist sehr zeitintensiv. Um die etwa 600 Millionen Papierschnipsel von Hand zusammenzufügen, würden 30 Personen 600 bis 800 Jahre benötigen. Forscher des IPK können das weitaus schneller: Sie entwickelten ein computergestütztes Verfahren, um das Schnipselpuzzle zu automatisieren und somit eine zeitnahe Auswertung der Unterlagen zu ermöglichen. Bereits 2003 wurde die Machbarkeit dieses virtuellen Puzzelns demonstriert. Nun startet das Pilotprojekt für die rechnerbasierte Rekonstruktion.

Bevor das virtuelle Puzzeln losgehen kann, müssen die Schnipsel beidseitig digitalisiert werden. Diesen Scanprozess übernimmt die zur Bertelsmann AG gehörende arvato direct services GmbH. Seit 2005 arbeiten arvato direct services und das IPK zusammen an der Digitalisierung von unterschiedlichen Dokumenten, insbesondere für Anwendungen im Behördenmarkt und in der Finanzbranche. Während dieser Kooperation, die vom Land Berlin gefördert wird, entstanden neuartige Scankonzepte, die nun bei der Digitalisierung der Schnipsel zum Einsatz kommen.

„Das virtuelle Puzzeln folgt der Logik des manuellen Puzzelns“, erklärt Dr. Bertram Nickolay, Abteilungsleiter am IPK. Der Mensch verwendet für die Lösung dieses Geduldsspiels eine Vielzahl von Merkmalen, anhand derer er entscheidet, ob zwei Teile zueinander passen oder nicht – die Form der Teile oder welche Farbe oder Schrift auf den Puzzlestücken zu erkennen ist. Diese Vorauswahl macht das Suchen und Finden passender Puzzlestücke leichter. „Auch der virtuelle Puzzleprozess beginnt so“, sagt Nickolay. „Das System berechnet verschiedene beschreibende Merkmale wie Form oder Textur, um den Suchraum zu reduzieren. Innerhalb dieser kleineren Menge erfolgt die eigentliche Rekonstruktion.“ Dafür werden Schnipsel entlang ihrer Konturen auf Übereinstimmungen hin verglichen. Sind passende Teile gefunden, werden sie zu einem größeren Dokument zusammengefasst. Dann beginnt der Vorgang von vorn.

Schnipsel für Schnipsel entsteht so wieder Seite für Seite der Stasiakten.
Die Forscher am IPK sind schon einen Schritt weiter mit der Entwicklung ihrer Technologie als 2003: Ihre Algorithmen können inzwischen nicht nur von Hand zerrissene Unterlagen, sondern auch geschredderte Papiere wieder zusammensetzen. Das ist besonders kompliziert, da bei maschinell zerkleinerten Dokumenten ein wesentliches Merkmal des Puzzelns – die Form – nicht zur Verfügung steht. Stattdessen müssen Buchstabenteile als Merkmale herangezogen werden. So konnte beispielsweise für eine Steuerfahndungsbehörde ein Sack mit geschredderten Dokumenten vollständig rekonstruiert werden.
Ansprechpartner:
Dr.-Ing. Bertram Nickolay
Telefon: 0 30 / 3 90 06-2 01
Fax: 0 30 / 3 91 75 17
bertram.nickolay@ipk.fraunhofer.de
Fraunhofer-Institut für
Produktionsanlagen und
Konstruktionstechnik IPK
Pascalstraße 8-9
10587 Berlin

Media Contact

Dr.-Ing. Bertram Nickolay Fraunhofer-Gesellschaft

Alle Nachrichten aus der Kategorie: Informationstechnologie

Neuerungen und Entwicklungen auf den Gebieten der Informations- und Datenverarbeitung sowie der dafür benötigten Hardware finden Sie hier zusammengefasst.

Unter anderem erhalten Sie Informationen aus den Teilbereichen: IT-Dienstleistungen, IT-Architektur, IT-Management und Telekommunikation.

Zurück zur Startseite

Kommentare (0)

Schreiben Sie einen Kommentar

Neueste Beiträge

Ideen für die Zukunft

TU Berlin präsentiert sich vom 22. bis 26. April 2024 mit neun Projekten auf der Hannover Messe 2024. Die HANNOVER MESSE gilt als die Weltleitmesse der Industrie. Ihr diesjähriger Schwerpunkt…

Peptide auf interstellarem Eis

Dass einfache Peptide auf kosmischen Staubkörnern entstehen können, wurde vom Forschungsteam um Dr. Serge Krasnokutski vom Astrophysikalischen Labor des Max-Planck-Instituts für Astronomie an der Universität Jena bereits gezeigt. Bisher ging…

Wasserstoff-Produktion in der heimischen Garage

Forschungsteam der Frankfurt UAS entwickelt Prototyp für Privathaushalte: Förderzusage vom Land Hessen für 2. Projektphase. Wasserstoff als Energieträger der Zukunft ist nicht frei verfügbar, sondern muss aufwendig hergestellt werden. Das…

Partner & Förderer