Forum für Wissenschaft, Industrie und Wirtschaft

Hauptsponsoren:     3M 
Datenbankrecherche:

 

Computer schürfen nach den "Goldnuggets" im Textuniversum

24.01.2006


EU fördert internationales Forschungsprojekt von Computerlinguisten der Universität Jena



In den Forschungslabors der Welt werden heute in jeder Minute eine neue chemische Formel gewonnen, alle drei Minuten ein neuer physikalischer Zusammenhang aufgedeckt und im Fünf-Minuten-Rhythmus neue medizinische Erkenntnisse gewonnen - und publiziert. Forscher der Max-Planck-Gesellschaft haben ermittelt, dass jährlich rund vier Millionen Fachbeiträge veröffentlicht werden, also 20.000 pro Arbeitstag. Selbst wenn nur ein Bruchteil davon den Bereich der Biologie betrifft, dann ist "kein Biologe mehr in der Lage, alle für sein Fachgebiet relevanten Arbeiten zu lesen", ist Prof. Dr. Udo Hahn von der Universität Jena überzeugt. Die Fülle an immer neuen Erkenntnissen, die die eigene Forschungstätigkeit betreffen, sei jedoch nur ein Problem für jeden Wissenschaftler. "Will er über den Tellerrand des eigenen Spezialgebietes schauen, dann versteht er manche Texte vielleicht nicht richtig, weil in den einzelnen Disziplinen häufig dem Leser unbekannte Spezialtermini gebraucht werden", erklärt der Computerlinguist vom Institut für Germanistische Sprachwissenschaft. Es könne sogar vorkommen, dass Biologen an denselben Proteinen forschen, ohne voneinander zu wissen, weil die Proteine in verschiedenen Labors unterschiedliche Namen haben. Doch hier wollen Prof. Hahn und sein Forscherteam Abhilfe schaffen.

... mehr zu:
»Biologe »Biologie »Computerlinguist


Sie wollen ein Computerprogramm entwickeln, das biologische Fachtexte nach bestimmten Kriterien analysiert, Wichtiges von Unwichtigem trennt und Forscher wie industrielle Entwickler - etwa aus der Biotech- oder Pharmaindustrie - mit automatisch gewonnenem, hochaktuellem Wissen versorgt. "Wir reden dabei auch vom biologischen Text-Mining", erläutert Hahn. De facto lassen die Jenaer Computerlinguisten ihre intelligenten Rechenmaschinen in den Texten nach den "Goldnuggets" schürfen und programmieren die Computer so, dass sie die gesuchten Informationen automatisch finden.

Die Computerlinguisten nutzen dafür ihr Fachwissen und sprachwissenschaftliche Methoden, um die natürliche Sprache - bei den Biologen ist dies fast ausschließlich Englisch - mit dem Computer zu bearbeiten. "Als Sprachwissenschaftler haben wir einerseits das Wissen, wie man Texte formuliert und inhaltlich strukturiert", sagt Prof. Hahn. Andererseits sei Sprache ein berechenbarer Prozess. Mit Hilfe von Methoden aus der Informatik könnten ihre Regeln und Konzepte formal und mathematisch präzise analysiert werden. Dann ist selbst das "Fachchinesisch" einer Wissenschaftsdisziplin für den Computer durchschaubar.

"Allerdings verstehen reine Computerlinguisten nur wenig von den biologischen Inhalten der analysierten Texte, dafür brauchen sie einen Vermittler", räumt Prof. Hahn ein. Deshalb gehören auch Biologen zu seinem Team, die den Sprachwissenschaftlern und Informatikern auch erklären sollen, "wie Biologen was verstehen". Unterstützung erhoffe er sich zudem von der in Jena sehr gut entwickelten Biotechnologie-Szene, sagt er. Mit der Medizin gebe es ebenfalls viele Berührungspunkte, da diese heute immer mehr in die Biologie hinein reiche.

Mediziner profitieren im Übrigen bereits von den Arbeiten der Computerlinguisten. An der Freiburger Universität, von der Prof. Hahn 2004 auf den Lehrstuhl für Germanistische Sprachwissenschaft/Computerlinguistik nach Jena wechselte, hat er schon gemeinsam mit Medizininformatikern ein System für die automatische Bearbeitung von elektronischen Patientenakten entwickelt.

Für sein neues Jenaer Forschungsprojekt "BOOTStrep" (Bootstrapping of Ontologies and Terminologies Strategic Research Project) hat die Europäische Union (EU) jetzt für vorerst drei Jahre eine Unterstützung von 3,6 Millionen Euro bewilligt. An dem anspruchsvollen Vorhaben, das am 1. April offiziell starten wird, sind Wissenschaftler aus England, Italien, Frankreich, Singapur und Deutschland beteiligt. Auch Biologen aus diesen Ländern sollen von dem mehrsprachig angelegten Programm profitieren.

Kontakt:
Prof. Dr. Udo Hahn
Institut für Germanistische Sprachwissenschaft der Universität Jena
Fürstengraben 30, 07743 Jena
Tel.: 03641 / 944320
Fax: 03641 / 944321
E-Mail: udo.hahn[at]uni-jena.de

Axel Burchardt | idw
Weitere Informationen:
http://www.uni-jena.de/

Weitere Berichte zu: Biologe Biologie Computerlinguist

Weitere Nachrichten aus der Kategorie Informationstechnologie:

nachricht Hochautomatisiertes Fahren bei Schnee und Regen: Robuste Warnehmung dank intelligentem Sensormix
18.09.2017 | FOKUS - Fraunhofer-Institut für Offene Kommunikationssysteme

nachricht KATWARN warnt auch in Fremdsprachen
14.09.2017 | FOKUS - Fraunhofer-Institut für Offene Kommunikationssysteme

Alle Nachrichten aus der Kategorie: Informationstechnologie >>>

Die aktuellsten Pressemeldungen zum Suchbegriff Innovation >>>

Die letzten 5 Focus-News des innovations-reports im Überblick:

Im Focus: Wundermaterial Graphen: Gewölbt wie das Polster eines Chesterfield-Sofas

Graphen besitzt extreme Eigenschaften und ist vielseitig verwendbar. Mit einem Trick lassen sich sogar die Spins im Graphen kontrollieren. Dies gelang einem HZB-Team schon vor einiger Zeit: Die Physiker haben dafür eine Lage Graphen auf einem Nickelsubstrat aufgebracht und Goldatome dazwischen eingeschleust. Im Fachblatt 2D Materials zeigen sie nun, warum dies sich derartig stark auf die Spins auswirkt. Graphen kommt so auch als Material für künftige Informationstechnologien infrage, die auf der Verarbeitung von Spins als Informationseinheiten basieren.

Graphen ist wohl die exotischste Form von Kohlenstoff: Alle Atome sind untereinander nur in der Ebene verbunden und bilden ein Netz mit sechseckigen Maschen,...

Im Focus: Hochautomatisiertes Fahren bei Schnee und Regen: Robuste Warnehmung dank intelligentem Sensormix

Schlechte Sichtverhältnisse bei Regen oder Schnellfall sind für Menschen und hochautomatisierte Fahrzeuge eine große Herausforderung. Im europäischen Projekt RobustSENSE haben die Forscher von Fraunhofer FOKUS mit 14 Partnern, darunter die Daimler AG und die Robert Bosch GmbH, in den vergangenen zwei Jahren eine Softwareplattform entwickelt, auf der verschiedene Sensordaten von Kamera, Laser, Radar und weitere Informationen wie Wetterdaten kombiniert werden. Ziel ist, eine robuste und zuverlässige Wahrnehmung der Straßensituation unabhängig von der Komplexität und der Sichtverhältnisse zu gewährleisten. Nach der virtuellen Erprobung des Systems erfolgt nun der Praxistest, unter anderem auf dem Berliner Testfeld für hochautomatisiertes Fahren.

Starker Schneefall, ein Ball rollt auf die Fahrbahn: Selbst ein Mensch kann mitunter nicht schnell genug erkennen, ob dies ein gefährlicher Gegenstand oder...

Im Focus: Ultrakurze Momentaufnahmen der Dynamik von Elektronen in Festkörpern

Mit Hilfe ultrakurzer Laser- und Röntgenblitze haben Wissenschaftler am Max-Planck-Institut für Quantenoptik (Garching bei München) Schnappschüsse der bislang kürzesten Bewegung von Elektronen in Festkörpern gemacht. Die Bewegung hielt 750 Attosekunden lang an, bevor sie abklang. Damit stellten die Wissenschaftler einen neuen Rekord auf, ultrakurze Prozesse innerhalb von Festkörpern aufzuzeichnen.

Wenn Röntgenstrahlen auf Festkörpermaterialien oder große Moleküle treffen, wird ein Elektron von seinem angestammten Platz in der Nähe des Atomkerns...

Im Focus: Ultrafast snapshots of relaxing electrons in solids

Using ultrafast flashes of laser and x-ray radiation, scientists at the Max Planck Institute of Quantum Optics (Garching, Germany) took snapshots of the briefest electron motion inside a solid material to date. The electron motion lasted only 750 billionths of the billionth of a second before it fainted, setting a new record of human capability to capture ultrafast processes inside solids!

When x-rays shine onto solid materials or large molecules, an electron is pushed away from its original place near the nucleus of the atom, leaving a hole...

Im Focus: Quantensensoren entschlüsseln magnetische Ordnung in neuartigem Halbleitermaterial

Physiker konnte erstmals eine spiralförmige magnetische Ordnung in einem multiferroischen Material abbilden. Diese gelten als vielversprechende Kandidaten für zukünftige Datenspeicher. Der Nachweis gelang den Forschern mit selbst entwickelten Quantensensoren, die elektromagnetische Felder im Nanometerbereich analysieren können und an der Universität Basel entwickelt wurden. Die Ergebnisse von Wissenschaftlern des Departements Physik und des Swiss Nanoscience Institute der Universität Basel sowie der Universität Montpellier und Forschern der Universität Paris-Saclay wurden in der Zeitschrift «Nature» veröffentlicht.

Multiferroika sind Materialien, die gleichzeitig auf elektrische wie auch auf magnetische Felder reagieren. Die beiden Eigenschaften kommen für gewöhnlich...

Alle Focus-News des Innovations-reports >>>

Anzeige

Anzeige

IHR
JOB & KARRIERE
SERVICE
im innovations-report
in Kooperation mit academics
Veranstaltungen

»Laser in Composites Symposium« in Aachen – von der Wissenschaft in die Anwendung

19.09.2017 | Veranstaltungen

Biowissenschaftler tauschen neue Erkenntnisse über molekulare Gen-Schalter aus

19.09.2017 | Veranstaltungen

Zwei Grad wärmer – und dann?

19.09.2017 | Veranstaltungen

 
VideoLinks
B2B-VideoLinks
Weitere VideoLinks >>>
Aktuelle Beiträge

»Laser in Composites Symposium« in Aachen – von der Wissenschaft in die Anwendung

19.09.2017 | Veranstaltungsnachrichten

Zentraler Schalter der Immunabwehr gefunden

19.09.2017 | Biowissenschaften Chemie

Neue Materialchemie für Hochleistungsbatterien

19.09.2017 | Biowissenschaften Chemie