Forum für Wissenschaft, Industrie und Wirtschaft

Hauptsponsoren:     3M 
Datenbankrecherche:

 

Computer schürfen nach den "Goldnuggets" im Textuniversum

24.01.2006


EU fördert internationales Forschungsprojekt von Computerlinguisten der Universität Jena



In den Forschungslabors der Welt werden heute in jeder Minute eine neue chemische Formel gewonnen, alle drei Minuten ein neuer physikalischer Zusammenhang aufgedeckt und im Fünf-Minuten-Rhythmus neue medizinische Erkenntnisse gewonnen - und publiziert. Forscher der Max-Planck-Gesellschaft haben ermittelt, dass jährlich rund vier Millionen Fachbeiträge veröffentlicht werden, also 20.000 pro Arbeitstag. Selbst wenn nur ein Bruchteil davon den Bereich der Biologie betrifft, dann ist "kein Biologe mehr in der Lage, alle für sein Fachgebiet relevanten Arbeiten zu lesen", ist Prof. Dr. Udo Hahn von der Universität Jena überzeugt. Die Fülle an immer neuen Erkenntnissen, die die eigene Forschungstätigkeit betreffen, sei jedoch nur ein Problem für jeden Wissenschaftler. "Will er über den Tellerrand des eigenen Spezialgebietes schauen, dann versteht er manche Texte vielleicht nicht richtig, weil in den einzelnen Disziplinen häufig dem Leser unbekannte Spezialtermini gebraucht werden", erklärt der Computerlinguist vom Institut für Germanistische Sprachwissenschaft. Es könne sogar vorkommen, dass Biologen an denselben Proteinen forschen, ohne voneinander zu wissen, weil die Proteine in verschiedenen Labors unterschiedliche Namen haben. Doch hier wollen Prof. Hahn und sein Forscherteam Abhilfe schaffen.

... mehr zu:
»Biologe »Biologie »Computerlinguist


Sie wollen ein Computerprogramm entwickeln, das biologische Fachtexte nach bestimmten Kriterien analysiert, Wichtiges von Unwichtigem trennt und Forscher wie industrielle Entwickler - etwa aus der Biotech- oder Pharmaindustrie - mit automatisch gewonnenem, hochaktuellem Wissen versorgt. "Wir reden dabei auch vom biologischen Text-Mining", erläutert Hahn. De facto lassen die Jenaer Computerlinguisten ihre intelligenten Rechenmaschinen in den Texten nach den "Goldnuggets" schürfen und programmieren die Computer so, dass sie die gesuchten Informationen automatisch finden.

Die Computerlinguisten nutzen dafür ihr Fachwissen und sprachwissenschaftliche Methoden, um die natürliche Sprache - bei den Biologen ist dies fast ausschließlich Englisch - mit dem Computer zu bearbeiten. "Als Sprachwissenschaftler haben wir einerseits das Wissen, wie man Texte formuliert und inhaltlich strukturiert", sagt Prof. Hahn. Andererseits sei Sprache ein berechenbarer Prozess. Mit Hilfe von Methoden aus der Informatik könnten ihre Regeln und Konzepte formal und mathematisch präzise analysiert werden. Dann ist selbst das "Fachchinesisch" einer Wissenschaftsdisziplin für den Computer durchschaubar.

"Allerdings verstehen reine Computerlinguisten nur wenig von den biologischen Inhalten der analysierten Texte, dafür brauchen sie einen Vermittler", räumt Prof. Hahn ein. Deshalb gehören auch Biologen zu seinem Team, die den Sprachwissenschaftlern und Informatikern auch erklären sollen, "wie Biologen was verstehen". Unterstützung erhoffe er sich zudem von der in Jena sehr gut entwickelten Biotechnologie-Szene, sagt er. Mit der Medizin gebe es ebenfalls viele Berührungspunkte, da diese heute immer mehr in die Biologie hinein reiche.

Mediziner profitieren im Übrigen bereits von den Arbeiten der Computerlinguisten. An der Freiburger Universität, von der Prof. Hahn 2004 auf den Lehrstuhl für Germanistische Sprachwissenschaft/Computerlinguistik nach Jena wechselte, hat er schon gemeinsam mit Medizininformatikern ein System für die automatische Bearbeitung von elektronischen Patientenakten entwickelt.

Für sein neues Jenaer Forschungsprojekt "BOOTStrep" (Bootstrapping of Ontologies and Terminologies Strategic Research Project) hat die Europäische Union (EU) jetzt für vorerst drei Jahre eine Unterstützung von 3,6 Millionen Euro bewilligt. An dem anspruchsvollen Vorhaben, das am 1. April offiziell starten wird, sind Wissenschaftler aus England, Italien, Frankreich, Singapur und Deutschland beteiligt. Auch Biologen aus diesen Ländern sollen von dem mehrsprachig angelegten Programm profitieren.

Kontakt:
Prof. Dr. Udo Hahn
Institut für Germanistische Sprachwissenschaft der Universität Jena
Fürstengraben 30, 07743 Jena
Tel.: 03641 / 944320
Fax: 03641 / 944321
E-Mail: udo.hahn[at]uni-jena.de

Axel Burchardt | idw
Weitere Informationen:
http://www.uni-jena.de/

Weitere Berichte zu: Biologe Biologie Computerlinguist

Weitere Nachrichten aus der Kategorie Informationstechnologie:

nachricht Neuer 3D Portrayal Service Standard veröffentlicht
20.02.2018 | Fraunhofer-Institut für Graphische Datenverarbeitung IGD

nachricht KIT baut European Open Science Cloud mit auf
19.02.2018 | Karlsruher Institut für Technologie

Alle Nachrichten aus der Kategorie: Informationstechnologie >>>

Die aktuellsten Pressemeldungen zum Suchbegriff Innovation >>>

Die letzten 5 Focus-News des innovations-reports im Überblick:

Im Focus: Die Brücke, die sich dehnen kann

Brücken verformen sich, daher baut man normalerweise Dehnfugen ein. An der TU Wien wurde eine Technik entwickelt, die ohne Fugen auskommt und dadurch viel Geld und Aufwand spart.

Wer im Auto mit flottem Tempo über eine Brücke fährt, spürt es sofort: Meist rumpelt man am Anfang und am Ende der Brücke über eine Dehnfuge, die dort...

Im Focus: Eine Frage der Dynamik

Die meisten Ionenkanäle lassen nur eine ganz bestimmte Sorte von Ionen passieren, zum Beispiel Natrium- oder Kaliumionen. Daneben gibt es jedoch eine Reihe von Kanälen, die für beide Ionensorten durchlässig sind. Wie den Eiweißmolekülen das gelingt, hat jetzt ein Team um die Wissenschaftlerin Han Sun (FMP) und die Arbeitsgruppe von Adam Lange (FMP) herausgefunden. Solche nicht-selektiven Kanäle besäßen anders als die selektiven eine dynamische Struktur ihres Selektivitätsfilters, berichten die FMP-Forscher im Fachblatt Nature Communications. Dieser Filter könne zwei unterschiedliche Formen ausbilden, die jeweils nur eine der beiden Ionensorten passieren lassen.

Ionenkanäle sind für den Organismus von herausragender Bedeutung. Wenn zum Beispiel Sinnesreize wahrgenommen, ans Gehirn weitergeleitet und dort verarbeitet...

Im Focus: In best circles: First integrated circuit from self-assembled polymer

For the first time, a team of researchers at the Max-Planck Institute (MPI) for Polymer Research in Mainz, Germany, has succeeded in making an integrated circuit (IC) from just a monolayer of a semiconducting polymer via a bottom-up, self-assembly approach.

In the self-assembly process, the semiconducting polymer arranges itself into an ordered monolayer in a transistor. The transistors are binary switches used...

Im Focus: Erste integrierte Schaltkreise (IC) aus Plastik

Erstmals ist es einem Forscherteam am Max-Planck-Institut (MPI) für Polymerforschung in Mainz gelungen, einen integrierten Schaltkreis (IC) aus einer monomolekularen Schicht eines Halbleiterpolymers herzustellen. Dies erfolgte in einem sogenannten Bottom-Up-Ansatz durch einen selbstanordnenden Aufbau.

In diesem selbstanordnenden Aufbauprozess ordnen sich die Halbleiterpolymere als geordnete monomolekulare Schicht in einem Transistor an. Transistoren sind...

Im Focus: Quantenbits per Licht übertragen

Physiker aus Princeton, Konstanz und Maryland koppeln Quantenbits und Licht

Der Quantencomputer rückt näher: Neue Forschungsergebnisse zeigen das Potenzial von Licht als Medium, um Informationen zwischen sogenannten Quantenbits...

Alle Focus-News des Innovations-reports >>>

Anzeige

Anzeige

VideoLinks
Industrie & Wirtschaft
Veranstaltungen

Digitalisierung auf dem Prüfstand: Hochkarätige Konferenz zu Empowerment in der agilen Arbeitswelt

20.02.2018 | Veranstaltungen

Aachener Optiktage: Expertenwissen in zwei Konferenzen für die Glas- und Kunststoffoptikfertigung

19.02.2018 | Veranstaltungen

Konferenz "Die Mobilität von morgen gestalten"

19.02.2018 | Veranstaltungen

VideoLinks
Wissenschaft & Forschung
Weitere VideoLinks im Überblick >>>
 
Aktuelle Beiträge

Highlight der Halbleiter-Forschung

20.02.2018 | Physik Astronomie

Wie verbessert man die Nahtqualität lasergeschweißter Textilien?

20.02.2018 | Materialwissenschaften

Der Bluthochdruckschalter in der Nebenniere

20.02.2018 | Biowissenschaften Chemie

Weitere B2B-VideoLinks
IHR
JOB & KARRIERE
SERVICE
im innovations-report
in Kooperation mit academics