Knowledge Computing – Eine neue Perspektive für das Wissenschaftliche Rechnen

Forscher des Fraunhofer-Instituts für Algorithmen und Wissenschaftliches Rechnen SCAI in Sankt Augustin und des Jülich Supercomputing Centre (JSC) haben ihre Supercomputer mit Grid-Technologie vernetzt, um biomedizinische sowie chemische Texte und Bilder in pharmazeutischen Patenten zu analysieren.

Damit haben die Forscher eine neue Anwendung im Wissenschaftlichen Rechnen geschaffen, die das leistungsstarke Durchsuchen von Patenten ermöglicht. Durch den Einsatz einer am Fraunhofer SCAI entwickelten Software ist die gleichzeitige Untersuchung von Texten und Bildern in chemischen Patenten möglich. Die Datenanalysen liefern neue Erkenntnisse über die Zusammenhänge von Biologie und Chemie.

Die Forscher durchsuchten mehr als 50 000 Patente aus der pharmazeutischen Chemie mit Hilfe von Grid-Infrastrukturen. Solche Infrastrukturen bestehen aus vernetzten Computern, die zusammen einen virtuellen Supercomputer bilden und so aufwendige Berechnungen erledigen können. Bei ihrem Experiment haben die Forscher die am Fraunhofer SCAI entwickelte grafische Analyse-Software chemoCR mit einer automatisierten Eigennamenerkennung kombiniert und so folgende Daten in den Patenten identifiziert und annotiert, das heißt computerlesbar gemacht:

o biologische Daten in Texten (z. B. Namen von Proteinen und Genen, Gen-Polymorphismen, Zelltypen)
o medizinische Daten in Texten (z. B. Namen von Krankheiten, pathologische Begriffe, Bezeichnungen von Risikofaktoren)
o chemische Informationen in Texten (z. B. Namen von Medikamenten, Termini aus den Benennungsnormen der International Union of Pure and Applied Chemistry (IUPAC))

o Bilder (Darstellungen chemischer Strukturen)

„Dieses groß angelegte Experiment eröffnet neue Perspektiven für das Wissenschaftliche Rechnen“, sagt Prof. Dr. Martin Hofmann-Apitius, Leiter der Abteilung Bioinformatik am Fraunhofer-Institut SCAI. Knowledge Computing, also die Datenverarbeitung von Wissensbeständen, ist ein neuer Weg, solche Bestände zu untersuchen. „Diese Art der Anwendung geht weit über die üblichen Simulationsanwendungen des Wissenschaftlichen Rechnens hinaus“, so Hofmann-Apitius.

Bisher wurden Textanalyse-Technologien nur auf bibliografischen Datenbanken betrieben, die Informationen aus den Lebenswissenschaften und der Biomedizin enthalten (z. B. MEDLINE). Die Erweiterung hin zu einer gleichzeitigen Untersuchung von text- und bildbasierten Informationen in ganzen Textdokumenten mit Grid-Computern wurde jedoch noch nie zuvor umgesetzt.

„Wir sind froh darüber, dass unser Institut seinen Beitrag zur Erschließung eines neuen Anwendungsbereichs für Supercomputer leistet. Das so genannte Knowledge Computing kann zu einer neuen, eigenen Teildisziplin des Wissenschaftlichen Rechnens werden“, betont Prof. Dr. Ulrich Trottenberg, Leiter des Fraunhofer-Instituts SCAI.

Eine zentrale Rolle in dem Experiment spielte die Grid-Middleware UNICORE (Uniform Interface to Computing Resources). Die Forscher benutzten dieses Werkzeug zur Steuerung der Annotationsprogramme, zur Kontrolle des Datenflusses zwischen Patent-Datenbank und Annotationsprogrammen sowie zur Überwachung des gesamten Prozesses.

„UNICORE hat es uns ermöglicht, dieses Experiment in solch großem Umfang auf der Grid-Infrastruktur zwischen SCAI und JSC durchzuführen,“ erklärt Dr. Achim Streit, Leiter der Abteilung „Verteilte Systeme und Grid Computing“ am Jülich Supercomputing Centre. „Durch die leistungsfähigen Workflow- und Datenmanagement-Funktionalitäten von UNICORE konnten wir die Patente problemlos und automatisch annotieren.“

„Dieses Projekt ist ein Beispiel dafür, wie leistungsstarke Supercomputer am JSC, die mit erstklassigen Grid-Technologien wie UNICORE ausgestattet sind, Synergien für die Entwicklung neuer Forschungsfelder schaffen können. Das JSC ist Mitglied der internationalen UNICORE Open Source Community und treibt die Entwicklung voran“, erläutert Prof. Dr. Dr. Thomas Lippert, Leiter des Jülich Supercomputing Centre.

Das Team am Fraunhofer-Institut SCAI analysiert derzeit die Daten, die im Zuge des Experiments angefallen sind. Mathilde Romberg, Leiterin der Forschergruppe am JSC, freut sich darüber, dass nach Wochen intensiver Workflow-Modellierung die ersten Durchläufe der Patentsuche abgeschlossen sind. Die beiden Teams wissen jedoch, dass noch weitere 18 Millionen Patente auf sie warten.

Ansprechpartner:
Prof. Dr. Martin Hofmann-Apitius
Leiter der Abteilung Bioinformatik
Fraunhofer-Institut für Algorithmen und Wissenschaftliches Rechnen SCAI
53754 Sankt Augustin
Tel 02241-14-2802
Fax 02241-14-2656
martin.hofmann-apitius@scai.fraunhofer.de
Dr. Achim Streit
Jülich Supercomputing Centre
Forschungszentrum Jülich GmbH
Tel 02461-61-6576
Fax 02461-61-6656
A.Streit@fz-juelich.de

Media Contact

Michael Krapp Fraunhofer Gesellschaft

Weitere Informationen:

http://www.scai.fraunhofer.de

Alle Nachrichten aus der Kategorie: Informationstechnologie

Neuerungen und Entwicklungen auf den Gebieten der Informations- und Datenverarbeitung sowie der dafür benötigten Hardware finden Sie hier zusammengefasst.

Unter anderem erhalten Sie Informationen aus den Teilbereichen: IT-Dienstleistungen, IT-Architektur, IT-Management und Telekommunikation.

Zurück zur Startseite

Kommentare (0)

Schreiben Sie einen Kommentar

Neueste Beiträge

Neues topologisches Metamaterial

… verstärkt Schallwellen exponentiell. Wissenschaftlerinnen und Wissenschaftler am niederländischen Forschungsinstitut AMOLF haben in einer internationalen Kollaboration ein neuartiges Metamaterial entwickelt, durch das sich Schallwellen auf völlig neue Art und Weise…

Astronomen entdecken starke Magnetfelder

… am Rand des zentralen schwarzen Lochs der Milchstraße. Ein neues Bild des Event Horizon Telescope (EHT) hat starke und geordnete Magnetfelder aufgespürt, die vom Rand des supermassereichen schwarzen Lochs…

Faktor für die Gehirnexpansion beim Menschen

Was unterscheidet uns Menschen von anderen Lebewesen? Der Schlüssel liegt im Neokortex, der äußeren Schicht des Gehirns. Diese Gehirnregion ermöglicht uns abstraktes Denken, Kunst und komplexe Sprache. Ein internationales Forschungsteam…

Partner & Förderer