Klarheit in der genetischen Buchstabensuppe

Bioinformatik findet vorwiegend im Computer statt. Auch Preisträger Sören Sonnenburg nutzt ihn, um Spleißstellen genannte Übergänge im Erbgut aufzufinden. Auf dem Monitor ist die Übersetzung bis zum Protein dargestellt. © Fraunhofer FIRST

… AGTTAGCTCATCT… Haben Sie etwas Sinnvolles entdeckt? Wer jetzt nur TAG sagt, hat die englische Katze CAT übersehen. Natürlich suchen Genetiker und Bioinformatiker im Erbgut nicht nach bekannten Begriffen. Doch verraten sich interessante Stellen im ACGT-Alphabet des Lebens durch bestimmte Abfolgen der Buchstaben, die für die vier im DNA-Strang vorkommenden Basen stehen. Besonders interessant sind Spleißstellen, denn sie markieren Anfänge und Enden von Genabschnitten – genauer: die Grenze zwischen Exons und Introns. Exons sind kodierte Bauanleitungen für Proteine. Introns dagegen sind dies nicht und sie werden beim Übergang von Information in strukturierte Materie schließlich enzymatisch herausgeschnitten. Die Zahl der Gene wird allein beim Menschen auf 20 000 bis 180 000 geschätzt, wovon jedes meist 100 bis 4 000 kodierende »Buchstaben« enthält. Eine derart umfangreiche Buchstabensuppe ohne Computerhilfe mit möglichst wenigen Fehlern durchforsten und verstehen zu wollen, wäre ein Unding.

Mathematische Methoden, mit deren Hilfe Spleißstellen aufgefunden werden können, hat Sören Sonnenburg in seiner mit dem 1. Hugo-Geiger-Preis ausgezeichneten Diplomarbeit untersucht. Bedeutender jedoch ist, dass er besonders verlässliche neue entwickelt hat. »Genauigkeit ist in diesem Bereich entscheidender als Rechenzeit«, weiß der gelernte Informatiker. »Dennoch ist die computergestützte Erkennung bedeutend schneller als traditionelle Verfahren. Die Fehlerrate der Algorithmen ist wesentlich, weil die Berechnungen als Grundlage für genetische Laborexperimente dienen. Erst hier entsteht der Löwenanteil der Kosten.« Für den Laien mögen vier bis sechs Prozent Fehler der von Sonnenburg erarbeiteten vier Methoden hoch erscheinen. Doch ist dies gering gegenüber den heute weltweit sonst eingesetzten Verfahren. Sie finden Spleißstellen in standardisierten Datensätzen des Menschen oder des Fadenwurms Caenorhabditis elegans nur mit deutlich höheren Fehlern zwischen zehn und dreißig Prozent.

»Sören Sonnenburg hat damit einen wichtigen wissenschaftlichen Beitrag in den überaus aktiven Gebieten statistische Lerntheorie und Bioinformatik geleistet«, betont Professor Klaus-Robert Müller, Leiter des Bereichs Intelligente Datenanalyse IDA am Fraunhofer-Institut für Rechnerarchitektur und Softwaretechnik FIRST in Berlin. »Seine selbstlernenden Programme sind ein zentraler Baustein im laufenden Projekt IDA.GEN, dessen Ziel ein Software-Paket zum Auffinden von Genen ist.«

Media Contact

Dipl.-Inform. Sören Sonnenburg Fraunhofer-Gesellschaft

Weitere Informationen:

http://www.fraunhofer.de

Alle Nachrichten aus der Kategorie: Förderungen Preise

Zurück zur Startseite

Kommentare (0)

Schreiben Sie einen Kommentar

Neueste Beiträge

Diamantstaub leuchtet hell in Magnetresonanztomographie

Mögliche Alternative zum weit verbreiteten Kontrastmittel Gadolinium. Eine unerwartete Entdeckung machte eine Wissenschaftlerin des Max-Planck-Instituts für Intelligente Systeme in Stuttgart: Nanometerkleine Diamantpartikel, die eigentlich für einen ganz anderen Zweck bestimmt…

Neue Spule für 7-Tesla MRT | Kopf und Hals gleichzeitig darstellen

Die Magnetresonanztomographie (MRT) ermöglicht detaillierte Einblicke in den Körper. Vor allem die Ultrahochfeld-Bildgebung mit Magnetfeldstärken von 7 Tesla und höher macht feinste anatomische Strukturen und funktionelle Prozesse sichtbar. Doch alleine…

Hybrid-Energiespeichersystem für moderne Energienetze

Projekt HyFlow: Leistungsfähiges, nachhaltiges und kostengünstiges Hybrid-Energiespeichersystem für moderne Energienetze. In drei Jahren Forschungsarbeit hat das Konsortium des EU-Projekts HyFlow ein extrem leistungsfähiges, nachhaltiges und kostengünstiges Hybrid-Energiespeichersystem entwickelt, das einen…

Partner & Förderer