Anzeige
Noch ist es eine Vision: Aus den rund drei Milliarden Buchstaben des menschlichen Genoms auf Knopfdruck exakt diejenigen Abschnitte herauszufiltern, die für den Bau von Proteinen zuständig sind. Was für das menschliche Genom noch in der Zukunft liegt, ist Wissenschaftlern der Fraunhofer- und der Max-Planck-Gesellschaft für das Genom des Fadenwurms Caenorhabditis elegans nun gelungen: Sie können mit hoher Genauigkeit Exons und Introns, d. h. proteincodierende und nicht codierende Abschnitte erkennen. Die Ergebnisse des Kooperationsprojekts werden am 23. Februar 2007 in der Zeitschrift PLoS Computational Biology publiziert: http://dx.doi.org/10.1371/journal.pcbi.0030020.eor
Der einen Millimeter lange Caenorhabditis elegans gehört zu den bestuntersuchten Organismen der Welt. Sein Genom ist seit 1998 vollständig sequenziert. Dennoch ist die Annotation des Genoms, d. h. die Lokalisierung seiner Gene und die Bestimmung der entsprechenden Proteine, bei weitem noch nicht vollständig. Sie wird fortlaufend überarbeitet und vervollständigt (http://www.wormbase.org). Ziel des Forschungsprojekts ist es, die bestehende, aber noch nicht komplett durch Experimente belegte Annotation des Fadenwurms zu verbessern. Dazu wählten die Forscher moderne Verfahren des maschinellen Lernens. Mit ihrer Hilfe sollten Exons und Introns in der genetischen Information des Fadenwurms identifiziert werden. Die Ergebnisse der Forschungsarbeiten zeigen, dass Verfahren des maschinellen Lernens um 40% exaktere Ergebnisse liefern als herkömmliche Methoden und insbesondere als die zur Zeit der Experimente gültige Annotation (Wormbase WS120). Verfahren des maschinellen Lernens können somit wesentlich zu einer Verbesserung bestehender Annotationen nicht nur bei C. elegans, sondern auch bei anderen Organismen beitragen und die korrekte Entschlüsselung genetischer Informationen erheblich beschleunigen.
Methode und Verfahren
Um ihre Ergebnisse zu belegen, gingen die Wissenschaftler in mehreren Schritten vor: Zunächst wurden die eingesetzten Algorithmen anhand bereits entschlüsselter mRNA-Sequenzen trainiert. mRNA-Moleküle (mRNA = Messenger-Ribonukleinsäure) transportieren die genetische Information der DNA und codieren die ihr entsprechenden Proteine. Während des Trainings lernen die Algorithmen die Muster für die Übersetzung von DNA in mRNA. Diese Muster helfen, die verschiedenen Teile der Gensequenz voneinander zu unterscheiden. Dabei spielt die Erkennung der Grenzen zwischen Exons und Introns, den sogenannten Spleißstellen, eine entscheidende Rolle.
Nach einer Trainingsphase wurden die Algorithmen zur Vorhersage von fertiger mRNA aus DNA eingesetzt und die Er-gebnisse mit bestehenden Datenbanken verglichen. Mit einer Genauigkeit von bis zu 95% konnte mSplicer alle Exons und Introns korrekt vorhersagen.
Auffällig war, dass die Ergebnisse nur in bis zu 50% mit der bestehenden Annotation des Genoms von C. elegans übereinstimmten. Eine Evaluation der Wormbase Annotation Version WS 120 mithilfe von später verfügbaren Informationen (basierend auf Wormbase Version WS 150) bestätigte, dass WS 120 in 18% der untersuchten Fälle ungenau war, während von mSplicer nur 10-13% der Fälle nicht exakt übersetzt wurden. Darüber hinaus belegen biologische Laborex-perimente mit 20 Genen, bei denen WS 120 und mSplicer in hohem Maße voneinander abwichen, die Überlegenheit des algorithmischen Verfahrens. Es lieferte in 75% aller Fälle richtige Vorhersagen, während die bestehende Annotation in keinem der untersuchten Fälle korrekt war.
Auf Grundlage der Ergebnisse wurde eine neue Annotation von C. elegans entwickelt. Sie ist im WWW
unter http://www.msplicer.org zum Download verfügbar.
In einem weiteren Schritt wurde mSplicer mit zwei weiteren State-of-the-art Verfahren zur Vorhersage von Exons und Introns verglichen: SNAP und ExonHunter. Diese Verfahren basieren auf sogenannten generativen Modellen, die versuchen, die Struktur der untersuchten Daten zu modellieren. mSplicer hingegen beruht auf diskriminativen Methoden: Der Algorithmus lernt "den Unterschied" zwischen richtigen und falschen Vorhersagen und unterscheidet sie anhand einer Trennfunktion. Je nach Auswahl der zugrundeliegenden Sequenzen erreichten SNAP und ExonHunter eine Genauigkeit bei der Vorhersage von Exons und Introns von nur 82,6 bzw. 90,2%. Die neu entwickelte Methode mSplicer kann eine Genauigkeit von 95.2% erzielen.
mSplicer wird seit 2003 im Rahmen eines Kooperationsprojekts zwischen der Fraunhofer- und der Max-Planck-Gesellschaft entwickelt. Der Schwerpunkt liegt auf einer engeren Verzahnung von Grundlagen- und angewandter Forschung.
Weitere Informationen erteilen Ihnen gern die zuständigen Projektleiter von Fraunhofer FIRST, Prof. Dr. Klaus-Robert Müller, vom Max-Planck-Institut für Biologische Kybernetik, Prof. Dr. Bernhard Schölkopf, und vom Friedrich-Miescher-Laboratorium, Dr. Gunnar Rätsch.
Pressekontakt:
Mirjam Kaplow, Leiterin Institutskommunikation Fraunhofer FIRST;
Tel.: 030/6392-1808; -1823
E-Mail: mirjam.kaplow@first.fraunhofer.de
Gunnar Rätsch, Leiter der Arbeitsgruppe "Machinelles Lernen in der Biologie"; Tel.: 07071/601 -820; -801
E-mail: Gunnar.Raetsch@tuebingen.mpg.de
Mirjam Kaplow | Quelle: Informationsdienst Wissenschaft
Weitere Informationen: www.msplicer.org
www.wormbase.org
www.first.fhg.de
Weitere Berichte zu: Algorithmus > Annotation > Exon > Fadenwurm > Genom > Introns > Vorhersage
Mütterliche Antikörper behindern Impfschutz bei jungen Katzen
22.05.2012 | Paul-Ehrlich-Institut - Bundesinstitut für Impfstoffe und biomedizinische Arzneimittel
Der nukleare GAU ist wahrscheinlicher als gedacht
22.05.2012 | Max-Planck-Institut für Chemie
Unter Federführung der Empa erscheint ein neues Standardwerk, das die europäische Forschung an Nanopartikeln vereinheitlichen soll.
Exakte Laborvorschriften zur Herstellung definierter Nanopartikel und zu deren Analytik stellen die Arbeiten auf diesem Gebiet auf eine neue Grundlage und machen sie erstmals vergleichbar. Herausgeber ist Harald Krug, Leiter des Empa-Departements «Materials meet Life».
Das neue Standardwerk soll Schluss machen mit dem «babylonischen Sprachgewirr», das derzeit noch in der Nanoforschung ...
Bei rheumatischen Erkrankungen erlauben moderne bildgebende Verfahren weit mehr als nur die Darstellung der knöchernen Gelenkstrukturen.
Mit funktionellen Untersuchungsmethoden wie der hochauflösenden Einzelphotonen-Emissions-Computertomographie (SPECT) können pathologische Knochenumbauvorgänge bereits sehr früh nachgewiesen werden, mitunter schon zu einem Zeitpunkt, zu dem selbst die MRT-Diagnostik noch unauffällig ist. Eine Studie der Universitätsradiologie Düsseldorf, die jetzt auf dem 93. Deutschen Röntgenkongress vorgestellt wurde.
In der Rheumatologie hat sich in den letzten ...
Wirkmechanismus eines der ältesten Arzneimittel der Menschheit aufgeklärt
Rizinusöl ist vor allem als effektives Abführmittel bekannt, wurde aber auch bereits in der Antike bei Schwangeren zur Förderung der Wehentätigkeit eingesetzt.
Erst jetzt ist es Wissenschaftlern vom Max-Planck-Institut für Herz- und Lungenforschung gelungen, die entscheidenden Details des Wirkmechanismus zu entschlüsseln. Verantwortlich ist demnach ein Rezeptor mit dem Namen EP3 auf ...
Pünktlich zum morgigen Weltschildkrötentag wird die Artenliste der Panzerträger um zwei Namen reicher.
Wissenschaftler des Senckenberg Forschungsinstitutes in Dresden haben gemeinsam mit einem internationalen Forscherteam zwei neue Arten der afrikanischen Gelenkschildkröte identifiziert. Die zugehörige Studie ist kürzlich im Fachjournal „Journal of Zoological Systematics and Evolutionary Research“ erschienen.
Gelenkschildkröten sind die Bewegungskünstler unter den landlebenden Schildkröten. Aufgrund eines Scharniers im Rückenpanzer können die in Afrika ...
Eine Forschungsgruppe der Universität Ulm hat einen neuartigen molekularen Schalter im Gehirn identifiziert, der eine wichtige Rolle bei der Steuerung der postnatalen Neurogenese im Gyrus dentatus spielt, der Unterregion im Hippocampus, in der lebenslang Nervenzellen aus neuralen Stammzellen gebildet werden.
„Unsere Untersuchungen beschreiben erstmals einen neuen und letztlich unerwarteten Signalweg bei der Regulation der Neurogenese im Hippocampus“, sagt Professor Stefan Britsch, Direktor des Instituts für Molekulare und Zelluläre Anatomie, der die Arbeit dieser Tage gemeinsam mit Dr. Ruth Simon im international renommierten Fachblatt EMBO-Journal veröffentlicht. An dem von der Deutschen ...
Anzeige
Anzeige

Mütterliche Antikörper behindern Impfschutz bei jungen Katzen
22.05.2012 | Biowissenschaften Chemie
Researchers Improve Fast-Moving Mobile Networks
22.05.2012 | Kommunikation Medien
New microscope uses rainbow of light to image the flow of individual blood cells
22.05.2012 | Medizintechnik
Bericht zum Lachsmanagement: Die BLE auf der NASCO-Jahrestagung
22.05.2012 | Veranstaltungsnachrichten
Plagiate und wissenschaftliches Fehlverhalten
22.05.2012 | Veranstaltungsnachrichten
Der IdeenPark weckt Begeisterung für Technik
22.05.2012 | Veranstaltungsnachrichten