Forum für Wissenschaft, Industrie und Wirtschaft

Hauptsponsoren:     3M 
Datenbankrecherche:

 

Computer schürfen nach den "Goldnuggets" im Textuniversum

24.01.2006


EU fördert internationales Forschungsprojekt von Computerlinguisten der Universität Jena



In den Forschungslabors der Welt werden heute in jeder Minute eine neue chemische Formel gewonnen, alle drei Minuten ein neuer physikalischer Zusammenhang aufgedeckt und im Fünf-Minuten-Rhythmus neue medizinische Erkenntnisse gewonnen - und publiziert. Forscher der Max-Planck-Gesellschaft haben ermittelt, dass jährlich rund vier Millionen Fachbeiträge veröffentlicht werden, also 20.000 pro Arbeitstag. Selbst wenn nur ein Bruchteil davon den Bereich der Biologie betrifft, dann ist "kein Biologe mehr in der Lage, alle für sein Fachgebiet relevanten Arbeiten zu lesen", ist Prof. Dr. Udo Hahn von der Universität Jena überzeugt. Die Fülle an immer neuen Erkenntnissen, die die eigene Forschungstätigkeit betreffen, sei jedoch nur ein Problem für jeden Wissenschaftler. "Will er über den Tellerrand des eigenen Spezialgebietes schauen, dann versteht er manche Texte vielleicht nicht richtig, weil in den einzelnen Disziplinen häufig dem Leser unbekannte Spezialtermini gebraucht werden", erklärt der Computerlinguist vom Institut für Germanistische Sprachwissenschaft. Es könne sogar vorkommen, dass Biologen an denselben Proteinen forschen, ohne voneinander zu wissen, weil die Proteine in verschiedenen Labors unterschiedliche Namen haben. Doch hier wollen Prof. Hahn und sein Forscherteam Abhilfe schaffen.

... mehr zu:
»Biologe »Biologie »Computerlinguist


Sie wollen ein Computerprogramm entwickeln, das biologische Fachtexte nach bestimmten Kriterien analysiert, Wichtiges von Unwichtigem trennt und Forscher wie industrielle Entwickler - etwa aus der Biotech- oder Pharmaindustrie - mit automatisch gewonnenem, hochaktuellem Wissen versorgt. "Wir reden dabei auch vom biologischen Text-Mining", erläutert Hahn. De facto lassen die Jenaer Computerlinguisten ihre intelligenten Rechenmaschinen in den Texten nach den "Goldnuggets" schürfen und programmieren die Computer so, dass sie die gesuchten Informationen automatisch finden.

Die Computerlinguisten nutzen dafür ihr Fachwissen und sprachwissenschaftliche Methoden, um die natürliche Sprache - bei den Biologen ist dies fast ausschließlich Englisch - mit dem Computer zu bearbeiten. "Als Sprachwissenschaftler haben wir einerseits das Wissen, wie man Texte formuliert und inhaltlich strukturiert", sagt Prof. Hahn. Andererseits sei Sprache ein berechenbarer Prozess. Mit Hilfe von Methoden aus der Informatik könnten ihre Regeln und Konzepte formal und mathematisch präzise analysiert werden. Dann ist selbst das "Fachchinesisch" einer Wissenschaftsdisziplin für den Computer durchschaubar.

"Allerdings verstehen reine Computerlinguisten nur wenig von den biologischen Inhalten der analysierten Texte, dafür brauchen sie einen Vermittler", räumt Prof. Hahn ein. Deshalb gehören auch Biologen zu seinem Team, die den Sprachwissenschaftlern und Informatikern auch erklären sollen, "wie Biologen was verstehen". Unterstützung erhoffe er sich zudem von der in Jena sehr gut entwickelten Biotechnologie-Szene, sagt er. Mit der Medizin gebe es ebenfalls viele Berührungspunkte, da diese heute immer mehr in die Biologie hinein reiche.

Mediziner profitieren im Übrigen bereits von den Arbeiten der Computerlinguisten. An der Freiburger Universität, von der Prof. Hahn 2004 auf den Lehrstuhl für Germanistische Sprachwissenschaft/Computerlinguistik nach Jena wechselte, hat er schon gemeinsam mit Medizininformatikern ein System für die automatische Bearbeitung von elektronischen Patientenakten entwickelt.

Für sein neues Jenaer Forschungsprojekt "BOOTStrep" (Bootstrapping of Ontologies and Terminologies Strategic Research Project) hat die Europäische Union (EU) jetzt für vorerst drei Jahre eine Unterstützung von 3,6 Millionen Euro bewilligt. An dem anspruchsvollen Vorhaben, das am 1. April offiziell starten wird, sind Wissenschaftler aus England, Italien, Frankreich, Singapur und Deutschland beteiligt. Auch Biologen aus diesen Ländern sollen von dem mehrsprachig angelegten Programm profitieren.

Kontakt:
Prof. Dr. Udo Hahn
Institut für Germanistische Sprachwissenschaft der Universität Jena
Fürstengraben 30, 07743 Jena
Tel.: 03641 / 944320
Fax: 03641 / 944321
E-Mail: udo.hahn[at]uni-jena.de

Axel Burchardt | idw
Weitere Informationen:
http://www.uni-jena.de/

Weitere Berichte zu: Biologe Biologie Computerlinguist

Weitere Nachrichten aus der Kategorie Informationstechnologie:

nachricht CrowdWater: eine App für die Hochwasser-Forschung
18.05.2018 | Universität Zürich

nachricht Hochautomatisiertes Sehen auf dem Prüfstand
17.05.2018 | FOKUS - Fraunhofer-Institut für Offene Kommunikationssysteme

Alle Nachrichten aus der Kategorie: Informationstechnologie >>>

Die aktuellsten Pressemeldungen zum Suchbegriff Innovation >>>

Die letzten 5 Focus-News des innovations-reports im Überblick:

Im Focus: Bose-Einstein-Kondensat im Riesenatom - Universität Stuttgart untersucht exotisches Quantenobjekt

Passt eine ultrakalte Wolke aus zehntausenden Rubidium-Atomen in ein einzelnes Riesenatom? Forscherinnen und Forschern am 5. Physikalischen Institut der Universität Stuttgart ist dies erstmals gelungen. Sie zeigten einen ganz neuen Ansatz, die Wechselwirkung von geladenen Kernen mit neutralen Atomen bei weitaus niedrigeren Temperaturen zu untersuchen, als es bisher möglich war. Dies könnte einen wichtigen Schritt darstellen, um in Zukunft quantenmechanische Effekte in der Atom-Ion Wechselwirkung zu studieren. Das renommierte Fachjournal Physical Review Letters und das populärwissenschaftliche Begleitjournal Physics berichteten darüber.*)

In dem Experiment regten die Forscherinnen und Forscher ein Elektron eines einzelnen Atoms in einem Bose-Einstein-Kondensat mit Laserstrahlen in einen riesigen...

Im Focus: Algorithmen für die Leberchirurgie – weltweit sicherer operieren

Die Leber durchlaufen vier komplex verwobene Gefäßsysteme. Die chirurgische Entfernung von Tumoren ist daher oft eine schwierige Aufgabe. Das Fraunhofer-Institut für Bildgestützte Medizin MEVIS hat Algorithmen entwickelt, die die Bilddaten von Patienten analysieren und chirurgische Risiken berechnen. Leberkrebsoperationen werden damit besser planbar und sicherer.

Jährlich erkranken weltweit 750.000 Menschen neu an Leberkrebs, viele weitere entwickeln Lebermetastasen aufgrund anderer Krebserkrankungen. Ein chirurgischer...

Im Focus: Positronen leuchten besser

Leuchtstoffe werden schon lange benutzt, im Alltag zum Beispiel im Bildschirm von Fernsehgeräten oder in PC-Monitoren, in der Wissenschaft zum Untersuchen von Plasmen, Teilchen- oder Antiteilchenstrahlen. Gleich ob Teilchen oder Antiteilchen – treffen sie auf einen Leuchtstoff auf, regen sie ihn zum Lumineszieren an. Unbekannt war jedoch bisher, dass die Lichtausbeute mit Elektronen wesentlich niedriger ist als mit Positronen, ihren Antiteilchen. Dies hat Dr. Eve Stenson im Max-Planck-Institut für Plasmaphysik (IPP) in Garching und Greifswald jetzt beim Vorbereiten von Experimenten mit Materie-Antimaterie-Plasmen entdeckt.

„Wäre Antimaterie nicht so schwierig herzustellen, könnte man auf eine Ära hochleuchtender Niederspannungs-Displays hoffen, in der die Leuchtschirme nicht von...

Im Focus: Erklärung für rätselhafte Quantenoszillationen gefunden

Sogenannte Quanten-Vielteilchen-„Scars“ lassen Quantensysteme länger außerhalb des Gleichgewichtszustandes verweilen. Studie wurde in Nature Physics veröffentlicht

Forschern der Harvard Universität und des MIT war es vor kurzem gelungen, eine Rekordzahl von 53 Atomen einzufangen und ihren Quantenzustand einzeln zu...

Im Focus: Explanation for puzzling quantum oscillations has been found

So-called quantum many-body scars allow quantum systems to stay out of equilibrium much longer, explaining experiment | Study published in Nature Physics

Recently, researchers from Harvard and MIT succeeded in trapping a record 53 atoms and individually controlling their quantum state, realizing what is called a...

Alle Focus-News des Innovations-reports >>>

Anzeige

Anzeige

VideoLinks
Industrie & Wirtschaft
Veranstaltungen

48V im Fokus!

21.05.2018 | Veranstaltungen

„Data Science“ – Theorie und Anwendung: Internationale Tagung unter Leitung der Uni Paderborn

18.05.2018 | Veranstaltungen

Visual-Computing an Bord der MS Wissenschaft

17.05.2018 | Veranstaltungen

VideoLinks
Wissenschaft & Forschung
Weitere VideoLinks im Überblick >>>
 
Aktuelle Beiträge

48V im Fokus!

21.05.2018 | Veranstaltungsnachrichten

Bose-Einstein-Kondensat im Riesenatom - Universität Stuttgart untersucht exotisches Quantenobjekt

18.05.2018 | Physik Astronomie

Countdown für Kilogramm, Kelvin und Co.

18.05.2018 | Physik Astronomie

Weitere B2B-VideoLinks
IHR
JOB & KARRIERE
SERVICE
im innovations-report
in Kooperation mit academics