Forum für Wissenschaft, Industrie und Wirtschaft

Hauptsponsoren:     3M 
Datenbankrecherche:

 

Computer schürfen nach den "Goldnuggets" im Textuniversum

24.01.2006


EU fördert internationales Forschungsprojekt von Computerlinguisten der Universität Jena



In den Forschungslabors der Welt werden heute in jeder Minute eine neue chemische Formel gewonnen, alle drei Minuten ein neuer physikalischer Zusammenhang aufgedeckt und im Fünf-Minuten-Rhythmus neue medizinische Erkenntnisse gewonnen - und publiziert. Forscher der Max-Planck-Gesellschaft haben ermittelt, dass jährlich rund vier Millionen Fachbeiträge veröffentlicht werden, also 20.000 pro Arbeitstag. Selbst wenn nur ein Bruchteil davon den Bereich der Biologie betrifft, dann ist "kein Biologe mehr in der Lage, alle für sein Fachgebiet relevanten Arbeiten zu lesen", ist Prof. Dr. Udo Hahn von der Universität Jena überzeugt. Die Fülle an immer neuen Erkenntnissen, die die eigene Forschungstätigkeit betreffen, sei jedoch nur ein Problem für jeden Wissenschaftler. "Will er über den Tellerrand des eigenen Spezialgebietes schauen, dann versteht er manche Texte vielleicht nicht richtig, weil in den einzelnen Disziplinen häufig dem Leser unbekannte Spezialtermini gebraucht werden", erklärt der Computerlinguist vom Institut für Germanistische Sprachwissenschaft. Es könne sogar vorkommen, dass Biologen an denselben Proteinen forschen, ohne voneinander zu wissen, weil die Proteine in verschiedenen Labors unterschiedliche Namen haben. Doch hier wollen Prof. Hahn und sein Forscherteam Abhilfe schaffen.

... mehr zu:
»Biologe »Biologie »Computerlinguist


Sie wollen ein Computerprogramm entwickeln, das biologische Fachtexte nach bestimmten Kriterien analysiert, Wichtiges von Unwichtigem trennt und Forscher wie industrielle Entwickler - etwa aus der Biotech- oder Pharmaindustrie - mit automatisch gewonnenem, hochaktuellem Wissen versorgt. "Wir reden dabei auch vom biologischen Text-Mining", erläutert Hahn. De facto lassen die Jenaer Computerlinguisten ihre intelligenten Rechenmaschinen in den Texten nach den "Goldnuggets" schürfen und programmieren die Computer so, dass sie die gesuchten Informationen automatisch finden.

Die Computerlinguisten nutzen dafür ihr Fachwissen und sprachwissenschaftliche Methoden, um die natürliche Sprache - bei den Biologen ist dies fast ausschließlich Englisch - mit dem Computer zu bearbeiten. "Als Sprachwissenschaftler haben wir einerseits das Wissen, wie man Texte formuliert und inhaltlich strukturiert", sagt Prof. Hahn. Andererseits sei Sprache ein berechenbarer Prozess. Mit Hilfe von Methoden aus der Informatik könnten ihre Regeln und Konzepte formal und mathematisch präzise analysiert werden. Dann ist selbst das "Fachchinesisch" einer Wissenschaftsdisziplin für den Computer durchschaubar.

"Allerdings verstehen reine Computerlinguisten nur wenig von den biologischen Inhalten der analysierten Texte, dafür brauchen sie einen Vermittler", räumt Prof. Hahn ein. Deshalb gehören auch Biologen zu seinem Team, die den Sprachwissenschaftlern und Informatikern auch erklären sollen, "wie Biologen was verstehen". Unterstützung erhoffe er sich zudem von der in Jena sehr gut entwickelten Biotechnologie-Szene, sagt er. Mit der Medizin gebe es ebenfalls viele Berührungspunkte, da diese heute immer mehr in die Biologie hinein reiche.

Mediziner profitieren im Übrigen bereits von den Arbeiten der Computerlinguisten. An der Freiburger Universität, von der Prof. Hahn 2004 auf den Lehrstuhl für Germanistische Sprachwissenschaft/Computerlinguistik nach Jena wechselte, hat er schon gemeinsam mit Medizininformatikern ein System für die automatische Bearbeitung von elektronischen Patientenakten entwickelt.

Für sein neues Jenaer Forschungsprojekt "BOOTStrep" (Bootstrapping of Ontologies and Terminologies Strategic Research Project) hat die Europäische Union (EU) jetzt für vorerst drei Jahre eine Unterstützung von 3,6 Millionen Euro bewilligt. An dem anspruchsvollen Vorhaben, das am 1. April offiziell starten wird, sind Wissenschaftler aus England, Italien, Frankreich, Singapur und Deutschland beteiligt. Auch Biologen aus diesen Ländern sollen von dem mehrsprachig angelegten Programm profitieren.

Kontakt:
Prof. Dr. Udo Hahn
Institut für Germanistische Sprachwissenschaft der Universität Jena
Fürstengraben 30, 07743 Jena
Tel.: 03641 / 944320
Fax: 03641 / 944321
E-Mail: udo.hahn[at]uni-jena.de

Axel Burchardt | idw
Weitere Informationen:
http://www.uni-jena.de/

Weitere Berichte zu: Biologe Biologie Computerlinguist

Weitere Nachrichten aus der Kategorie Informationstechnologie:

nachricht Lemgoer Forscher entwickeln Intelligente Assistenzsysteme für mobile Anwendungen in der Industrie
25.07.2017 | Hochschule Ostwestfalen-Lippe

nachricht Neue Anwendungsszenarien für Industrie 4.0 entwickelt
25.07.2017 | Fraunhofer-Institut für Produktionstechnik und Automatisierung IPA

Alle Nachrichten aus der Kategorie: Informationstechnologie >>>

Die aktuellsten Pressemeldungen zum Suchbegriff Innovation >>>

Die letzten 5 Focus-News des innovations-reports im Überblick:

Im Focus: Navigationssystem der Hirnzellen entschlüsselt

Das menschliche Gehirn besteht aus etwa hundert Milliarden Nervenzellen. Informationen zwischen ihnen werden über ein komplexes Netzwerk aus Nervenfasern übermittelt. Verdrahtet werden die meisten dieser Verbindungen vor der Geburt nach einem genetischen Bauplan, also ohne dass äußere Einflüsse eine Rolle spielen. Mehr darüber, wie das Navigationssystem funktioniert, das die Axone beim Wachstum leitet, haben jetzt Forscher des Karlsruher Instituts für Technologie (KIT) herausgefunden. Das berichten sie im Fachmagazin eLife.

Die Gesamtlänge des Nervenfasernetzes im Gehirn beträgt etwa 500.000 Kilometer, mehr als die Entfernung zwischen Erde und Mond. Damit es beim Verdrahten der...

Im Focus: Kohlenstoff-Nanoröhrchen verwandeln Strom in leuchtende Quasiteilchen

Starke Licht-Materie-Kopplung in diesen halbleitenden Röhrchen könnte zu elektrisch gepumpten Lasern führen

Auch durch Anregung mit Strom ist die Erzeugung von leuchtenden Quasiteilchen aus Licht und Materie in halbleitenden Kohlenstoff-Nanoröhrchen möglich....

Im Focus: Carbon Nanotubes Turn Electrical Current into Light-emitting Quasi-particles

Strong light-matter coupling in these semiconducting tubes may hold the key to electrically pumped lasers

Light-matter quasi-particles can be generated electrically in semiconducting carbon nanotubes. Material scientists and physicists from Heidelberg University...

Im Focus: Breitbandlichtquellen mit flüssigem Kern

Jenaer Forschern ist es gelungen breitbandiges Laserlicht im mittleren Infrarotbereich mit Hilfe von flüssigkeitsgefüllten optischen Fasern zu erzeugen. Mit den Fasern lieferten sie zudem experimentelle Beweise für eine neue Dynamik von Solitonen – zeitlich und spektral stabile Lichtwellen – die aufgrund der besonderen Eigenschaften des Flüssigkerns entsteht. Die Ergebnisse der Arbeiten publizierte das Jenaer Wissenschaftler-Team vom Leibniz-Instituts für Photonische Technologien (Leibniz-IPHT), dem Fraunhofer-Insitut für Angewandte Optik und Feinmechanik, der Friedrich-Schiller-Universität Jena und des Helmholtz-Insituts im renommierten Fachblatt Nature Communications.

Aus einem ultraschnellen intensiven Laserpuls, den sie in die Faser einkoppeln, erzeugen die Wissenschaftler ein, für das menschliche Auge nicht sichtbares,...

Im Focus: Flexible proximity sensor creates smart surfaces

Fraunhofer IPA has developed a proximity sensor made from silicone and carbon nanotubes (CNT) which detects objects and determines their position. The materials and printing process used mean that the sensor is extremely flexible, economical and can be used for large surfaces. Industry and research partners can use and further develop this innovation straight away.

At first glance, the proximity sensor appears to be nothing special: a thin, elastic layer of silicone onto which black square surfaces are printed, but these...

Alle Focus-News des Innovations-reports >>>

Anzeige

Anzeige

IHR
JOB & KARRIERE
SERVICE
im innovations-report
in Kooperation mit academics
Veranstaltungen

10. Uelzener Forum: Demografischer Wandel und Digitalisierung

26.07.2017 | Veranstaltungen

Clash of Realities 2017: Anmeldung jetzt möglich. Internationale Konferenz an der TH Köln

26.07.2017 | Veranstaltungen

2. Spitzentreffen »Industrie 4.0 live«

25.07.2017 | Veranstaltungen

 
VideoLinks
B2B-VideoLinks
Weitere VideoLinks >>>
Aktuelle Beiträge

Robuste Computer für's Auto

26.07.2017 | Seminare Workshops

Läuft wie am Schnürchen!

26.07.2017 | Seminare Workshops

Leicht ist manchmal ganz schön schwer!

26.07.2017 | Seminare Workshops