Forum für Wissenschaft, Industrie und Wirtschaft

Hauptsponsoren:     3M 
Datenbankrecherche:

 

Knowledge Computing - Eine neue Perspektive für das Wissenschaftliche Rechnen

23.02.2010
Die Suche nach Informationen und Zusammenhängen in Zehntausenden pharmazeutischen Patenten war bislang extrem zeitaufwändig und damit nicht praktikabel. Durch den Einsatz einer neuen Software auf Grid-vernetzten Supercomputern erreichten Forscher jetzt eindrucksvolle Ergebnisse. High Performance Computing (HPC) eröffnet so neue Möglichkeiten für das Wissenschaftliche Rechnen.

Forscher des Fraunhofer-Instituts für Algorithmen und Wissenschaftliches Rechnen SCAI in Sankt Augustin und des Jülich Supercomputing Centre (JSC) haben ihre Supercomputer mit Grid-Technologie vernetzt, um biomedizinische sowie chemische Texte und Bilder in pharmazeutischen Patenten zu analysieren.

Damit haben die Forscher eine neue Anwendung im Wissenschaftlichen Rechnen geschaffen, die das leistungsstarke Durchsuchen von Patenten ermöglicht. Durch den Einsatz einer am Fraunhofer SCAI entwickelten Software ist die gleichzeitige Untersuchung von Texten und Bildern in chemischen Patenten möglich. Die Datenanalysen liefern neue Erkenntnisse über die Zusammenhänge von Biologie und Chemie.

Die Forscher durchsuchten mehr als 50 000 Patente aus der pharmazeutischen Chemie mit Hilfe von Grid-Infrastrukturen. Solche Infrastrukturen bestehen aus vernetzten Computern, die zusammen einen virtuellen Supercomputer bilden und so aufwendige Berechnungen erledigen können. Bei ihrem Experiment haben die Forscher die am Fraunhofer SCAI entwickelte grafische Analyse-Software chemoCR mit einer automatisierten Eigennamenerkennung kombiniert und so folgende Daten in den Patenten identifiziert und annotiert, das heißt computerlesbar gemacht:

o biologische Daten in Texten (z. B. Namen von Proteinen und Genen, Gen-Polymorphismen, Zelltypen)
o medizinische Daten in Texten (z. B. Namen von Krankheiten, pathologische Begriffe, Bezeichnungen von Risikofaktoren)
o chemische Informationen in Texten (z. B. Namen von Medikamenten, Termini aus den Benennungsnormen der International Union of Pure and Applied Chemistry (IUPAC))

o Bilder (Darstellungen chemischer Strukturen)

"Dieses groß angelegte Experiment eröffnet neue Perspektiven für das Wissenschaftliche Rechnen", sagt Prof. Dr. Martin Hofmann-Apitius, Leiter der Abteilung Bioinformatik am Fraunhofer-Institut SCAI. Knowledge Computing, also die Datenverarbeitung von Wissensbeständen, ist ein neuer Weg, solche Bestände zu untersuchen. "Diese Art der Anwendung geht weit über die üblichen Simulationsanwendungen des Wissenschaftlichen Rechnens hinaus", so Hofmann-Apitius.

Bisher wurden Textanalyse-Technologien nur auf bibliografischen Datenbanken betrieben, die Informationen aus den Lebenswissenschaften und der Biomedizin enthalten (z. B. MEDLINE). Die Erweiterung hin zu einer gleichzeitigen Untersuchung von text- und bildbasierten Informationen in ganzen Textdokumenten mit Grid-Computern wurde jedoch noch nie zuvor umgesetzt.

"Wir sind froh darüber, dass unser Institut seinen Beitrag zur Erschließung eines neuen Anwendungsbereichs für Supercomputer leistet. Das so genannte Knowledge Computing kann zu einer neuen, eigenen Teildisziplin des Wissenschaftlichen Rechnens werden", betont Prof. Dr. Ulrich Trottenberg, Leiter des Fraunhofer-Instituts SCAI.

Eine zentrale Rolle in dem Experiment spielte die Grid-Middleware UNICORE (Uniform Interface to Computing Resources). Die Forscher benutzten dieses Werkzeug zur Steuerung der Annotationsprogramme, zur Kontrolle des Datenflusses zwischen Patent-Datenbank und Annotationsprogrammen sowie zur Überwachung des gesamten Prozesses.

"UNICORE hat es uns ermöglicht, dieses Experiment in solch großem Umfang auf der Grid-Infrastruktur zwischen SCAI und JSC durchzuführen," erklärt Dr. Achim Streit, Leiter der Abteilung "Verteilte Systeme und Grid Computing" am Jülich Supercomputing Centre. "Durch die leistungsfähigen Workflow- und Datenmanagement-Funktionalitäten von UNICORE konnten wir die Patente problemlos und automatisch annotieren."

"Dieses Projekt ist ein Beispiel dafür, wie leistungsstarke Supercomputer am JSC, die mit erstklassigen Grid-Technologien wie UNICORE ausgestattet sind, Synergien für die Entwicklung neuer Forschungsfelder schaffen können. Das JSC ist Mitglied der internationalen UNICORE Open Source Community und treibt die Entwicklung voran", erläutert Prof. Dr. Dr. Thomas Lippert, Leiter des Jülich Supercomputing Centre.

Das Team am Fraunhofer-Institut SCAI analysiert derzeit die Daten, die im Zuge des Experiments angefallen sind. Mathilde Romberg, Leiterin der Forschergruppe am JSC, freut sich darüber, dass nach Wochen intensiver Workflow-Modellierung die ersten Durchläufe der Patentsuche abgeschlossen sind. Die beiden Teams wissen jedoch, dass noch weitere 18 Millionen Patente auf sie warten.

Ansprechpartner:
Prof. Dr. Martin Hofmann-Apitius
Leiter der Abteilung Bioinformatik
Fraunhofer-Institut für Algorithmen und Wissenschaftliches Rechnen SCAI
53754 Sankt Augustin
Tel 02241-14-2802
Fax 02241-14-2656
martin.hofmann-apitius@scai.fraunhofer.de
Dr. Achim Streit
Jülich Supercomputing Centre
Forschungszentrum Jülich GmbH
Tel 02461-61-6576
Fax 02461-61-6656
A.Streit@fz-juelich.de

Michael Krapp | Fraunhofer Gesellschaft
Weitere Informationen:
http://www.scai.fraunhofer.de

Weitere Nachrichten aus der Kategorie Informationstechnologie:

nachricht Cybersicherheit für die Bahn von morgen
24.03.2017 | Fraunhofer-Institut für Sichere Informationstechnologie SIT

nachricht Schutz vor Angriffen dank flexibler Programmierung
22.03.2017 | FZI Forschungszentrum Informatik am Karlsruher Institut für Technologie

Alle Nachrichten aus der Kategorie: Informationstechnologie >>>

Die aktuellsten Pressemeldungen zum Suchbegriff Innovation >>>

Die letzten 5 Focus-News des innovations-reports im Überblick:

Im Focus: Wegweisende Erkenntnisse für die Biomedizin: NAD⁺ hilft bei Reparatur geschädigter Erbinformationen

Eine internationale Forschergruppe mit dem Bayreuther Biochemiker Prof. Dr. Clemens Steegborn präsentiert in 'Science' neue, für die Biomedizin wegweisende Forschungsergebnisse zur Rolle des Moleküls NAD⁺ bei der Korrektur von Schäden am Erbgut.

Die Zellen von Menschen und Tieren können Schäden an der DNA, dem Träger der Erbinformation, bis zu einem gewissen Umfang selbst reparieren. Diese Fähigkeit...

Im Focus: Designer-Proteine falten DNA

Florian Praetorius und Prof. Hendrik Dietz von der Technischen Universität München (TUM) haben eine neue Methode entwickelt, mit deren Hilfe sie definierte Hybrid-Strukturen aus DNA und Proteinen aufbauen können. Die Methode eröffnet Möglichkeiten für die zellbiologische Grundlagenforschung und für die Anwendung in Medizin und Biotechnologie.

Desoxyribonukleinsäure – besser bekannt unter der englischen Abkürzung DNA – ist die Trägerin unserer Erbinformation. Für Prof. Hendrik Dietz und Florian...

Im Focus: Fliegende Intensivstationen: Ultraschallgeräte in Rettungshubschraubern können Leben retten

Etwa 21 Millionen Menschen treffen jährlich in deutschen Notaufnahmen ein. Im Kampf zwischen Leben und Tod zählt für diese Patienten jede Minute. Wenn sie schon kurz nach dem Unfall zielgerichtet behandelt werden können, verbessern sich ihre Überlebenschancen erheblich. Damit Notfallmediziner in solchen Fällen schnell die richtige Diagnose stellen können, kommen in den Rettungshubschraubern der DRF Luftrettung und zunehmend auch in Notarzteinsatzfahrzeugen mobile Ultraschallgeräte zum Einsatz. Experten der Deutschen Gesellschaft für Ultraschall in der Medizin e.V. (DEGUM) schulen die Notärzte und Rettungsassistenten.

Mit mobilen Ultraschallgeräten können Notärzte beispielsweise innere Blutungen direkt am Unfallort identifizieren und sie bei Bedarf auch für Untersuchungen im...

Im Focus: Gigantische Magnetfelder im Universum

Astronomen aus Bonn und Tautenburg in Thüringen beobachteten mit dem 100-m-Radioteleskop Effelsberg Galaxienhaufen, das sind Ansammlungen von Sternsystemen, heißem Gas und geladenen Teilchen. An den Rändern dieser Galaxienhaufen fanden sie außergewöhnlich geordnete Magnetfelder, die sich über viele Millionen Lichtjahre erstrecken. Sie stellen die größten bekannten Magnetfelder im Universum dar.

Die Ergebnisse werden am 22. März in der Fachzeitschrift „Astronomy & Astrophysics“ veröffentlicht.

Galaxienhaufen sind die größten gravitativ gebundenen Strukturen im Universum, mit einer Ausdehnung von etwa zehn Millionen Lichtjahren. Im Vergleich dazu ist...

Im Focus: Giant Magnetic Fields in the Universe

Astronomers from Bonn and Tautenburg in Thuringia (Germany) used the 100-m radio telescope at Effelsberg to observe several galaxy clusters. At the edges of these large accumulations of dark matter, stellar systems (galaxies), hot gas, and charged particles, they found magnetic fields that are exceptionally ordered over distances of many million light years. This makes them the most extended magnetic fields in the universe known so far.

The results will be published on March 22 in the journal „Astronomy & Astrophysics“.

Galaxy clusters are the largest gravitationally bound structures in the universe. With a typical extent of about 10 million light years, i.e. 100 times the...

Alle Focus-News des Innovations-reports >>>

Anzeige

Anzeige

IHR
JOB & KARRIERE
SERVICE
im innovations-report
in Kooperation mit academics
Veranstaltungen

Rund 500 Fachleute aus Wissenschaft und Wirtschaft diskutierten über technologische Zukunftsthemen

24.03.2017 | Veranstaltungen

Lebenswichtige Lebensmittelchemie

23.03.2017 | Veranstaltungen

Die „Panama Papers“ aus Programmierersicht

22.03.2017 | Veranstaltungen

 
VideoLinks
B2B-VideoLinks
Weitere VideoLinks >>>
Aktuelle Beiträge

Rund 500 Fachleute aus Wissenschaft und Wirtschaft diskutierten über technologische Zukunftsthemen

24.03.2017 | Veranstaltungsnachrichten

Förderung des Instituts für Lasertechnik und Messtechnik in Ulm mit rund 1,63 Millionen Euro

24.03.2017 | Förderungen Preise

TU-Bauingenieure koordinieren EU-Projekt zu Recycling-Beton von über sieben Millionen Euro

24.03.2017 | Förderungen Preise