Dokumente vielschichtig durchleuchten

Die Schlagwortsuche in Textbeständen ist heute Standard. Das Softwaretool SWAPit ermöglicht es zusätzlich, inhaltliche Zusammenhänge von Dokumenten auf verschiedenen Ebenen zu analysieren. So wird auf der CeBIT gezeigt, wie sich Fußballnachrichten auswerten lassen.


Spielt Ballack eigentlich besser, nachdem er einen lukrativen Werbevertrag unterzeichnet hat? Oder doch schlechter? Hat der Torwartstreit zwischen Kahn und Lehmann die Leistung der beiden gefördert oder halten sie nun tendenziell weniger Bälle? Und welche Auswirkungen hat das auf ihre Vereine? Wenn storyhungrige Reporter dies nicht nur aus dem Bauch heraus, sondern fundiert beurteilen wollen, müssen sie Nachrichten aus Sportzeitschriften mit aktuellen Statistiken, Vereinsmitteilungen und Artikeln der Regenbogenpresse abgleichen. Solche vielschichtigen Analysen lassen sich nun auch halbautomatisch erstellen: Forscher des Fraunhofer-Instituts für Angewandte Informationstechnik FIT in Sankt Augustin bei Bonn haben dafür das Softwaretool SWAPit entwickelt. Mit ihm ist es möglich, mit wenigen Blicken inhaltliche Beziehungen in Textdaten und damit zusammenhängende Zusatzinformationen festzustellen.

„Der Name SWAPit leitet sich vom englischen Verb to swap ab, was soviel wie ?wechseln? bedeutet“, sagt Andreas Becks vom FIT. „Das Programm fordert den Nutzer auf, Textinformationen unter wechselnden Blickwinkeln zu betrachten. So kann er auch Zusatzinformationen zu den Dokumenten miteinander vergleichen.“ Dazu präsentiert das Tool Textsammlungen als eine Art Landkarte, in der ähnliche Texte Cluster bilden. Klickt der Nutzer auf eine solche Anhäufung, so werden ihm auf dem Bildschirm direkt neben der Karte gemeinsame Merkmale angezeigt. „Durch diese zusätzlichen Sichtweisen können Anwender ihre Daten viel umfangreicher auswerten, Statistiken erstellen und vorher verborgene Muster erkennen“, betont Becks.

Presserecherche ist nur ein Anwendungsbeispiel für diese integriertes Text- und Data Mining genannte Methode. So lassen sich mit der Software zum Beispiel auch Patente zur Forschungsplanung analysieren, Dokumente über Marktsegmente untersuchen oder Anfragen in Service Centern auswerten. „Wir hatten aber auch schon ein interdisziplinäres, kulturwissenschaftliches Projekt, in dem SWAPit Kommunikationsschwierigkeiten löste“, berichtet Becks. „Hier hat es gezeigt, wie unterschiedlich verschiedene Disziplinen den gleichen Begriff definieren.“ Ihren Prototyp haben die Forscher bereits mit Industriepartnern aus verschiedensten Bereichen getestet. Er ist kompatibel mit Standardtextformaten wie doc, pdf und html, er sei bei einer konkreten Vermarktung aber problemlos auf weitere Formate ausdehnbar, wie Becks versichert. Weitere Details können Interessenten auch vom 9. bis 15. März auf der CeBIT in Hannover erfahren (Halle 9, Stand B36).

Ansprechpartner:
Dr. Andreas Becks
Telefon: 02 41 / 80-2 15 03, Fax: -2 23 21
andreas.becks@fit.fraunhofer.de

Dipl.-Inform. Christian Seeling
Telefon: 02 41 / 80-2 15 33
christian.seeling@fit.fraunhofer.de

Media Contact

Dr. Johannes Ehrlenspiel idw

Alle Nachrichten aus der Kategorie: Informationstechnologie

Neuerungen und Entwicklungen auf den Gebieten der Informations- und Datenverarbeitung sowie der dafür benötigten Hardware finden Sie hier zusammengefasst.

Unter anderem erhalten Sie Informationen aus den Teilbereichen: IT-Dienstleistungen, IT-Architektur, IT-Management und Telekommunikation.

Zurück zur Startseite

Kommentare (0)

Schreiben Sie einen Kommentar

Neueste Beiträge

Diamantstaub leuchtet hell in Magnetresonanztomographie

Mögliche Alternative zum weit verbreiteten Kontrastmittel Gadolinium. Eine unerwartete Entdeckung machte eine Wissenschaftlerin des Max-Planck-Instituts für Intelligente Systeme in Stuttgart: Nanometerkleine Diamantpartikel, die eigentlich für einen ganz anderen Zweck bestimmt…

Neue Spule für 7-Tesla MRT | Kopf und Hals gleichzeitig darstellen

Die Magnetresonanztomographie (MRT) ermöglicht detaillierte Einblicke in den Körper. Vor allem die Ultrahochfeld-Bildgebung mit Magnetfeldstärken von 7 Tesla und höher macht feinste anatomische Strukturen und funktionelle Prozesse sichtbar. Doch alleine…

Hybrid-Energiespeichersystem für moderne Energienetze

Projekt HyFlow: Leistungsfähiges, nachhaltiges und kostengünstiges Hybrid-Energiespeichersystem für moderne Energienetze. In drei Jahren Forschungsarbeit hat das Konsortium des EU-Projekts HyFlow ein extrem leistungsfähiges, nachhaltiges und kostengünstiges Hybrid-Energiespeichersystem entwickelt, das einen…

Partner & Förderer