Klarheit in der genetischen Buchstabensuppe

Bioinformatik findet vorwiegend im Computer statt. Auch Preisträger Sören Sonnenburg nutzt ihn, um Spleißstellen genannte Übergänge im Erbgut aufzufinden. Auf dem Monitor ist die Übersetzung bis zum Protein dargestellt. © Fraunhofer FIRST

… AGTTAGCTCATCT… Haben Sie etwas Sinnvolles entdeckt? Wer jetzt nur TAG sagt, hat die englische Katze CAT übersehen. Natürlich suchen Genetiker und Bioinformatiker im Erbgut nicht nach bekannten Begriffen. Doch verraten sich interessante Stellen im ACGT-Alphabet des Lebens durch bestimmte Abfolgen der Buchstaben, die für die vier im DNA-Strang vorkommenden Basen stehen. Besonders interessant sind Spleißstellen, denn sie markieren Anfänge und Enden von Genabschnitten – genauer: die Grenze zwischen Exons und Introns. Exons sind kodierte Bauanleitungen für Proteine. Introns dagegen sind dies nicht und sie werden beim Übergang von Information in strukturierte Materie schließlich enzymatisch herausgeschnitten. Die Zahl der Gene wird allein beim Menschen auf 20 000 bis 180 000 geschätzt, wovon jedes meist 100 bis 4 000 kodierende »Buchstaben« enthält. Eine derart umfangreiche Buchstabensuppe ohne Computerhilfe mit möglichst wenigen Fehlern durchforsten und verstehen zu wollen, wäre ein Unding.

Mathematische Methoden, mit deren Hilfe Spleißstellen aufgefunden werden können, hat Sören Sonnenburg in seiner mit dem 1. Hugo-Geiger-Preis ausgezeichneten Diplomarbeit untersucht. Bedeutender jedoch ist, dass er besonders verlässliche neue entwickelt hat. »Genauigkeit ist in diesem Bereich entscheidender als Rechenzeit«, weiß der gelernte Informatiker. »Dennoch ist die computergestützte Erkennung bedeutend schneller als traditionelle Verfahren. Die Fehlerrate der Algorithmen ist wesentlich, weil die Berechnungen als Grundlage für genetische Laborexperimente dienen. Erst hier entsteht der Löwenanteil der Kosten.« Für den Laien mögen vier bis sechs Prozent Fehler der von Sonnenburg erarbeiteten vier Methoden hoch erscheinen. Doch ist dies gering gegenüber den heute weltweit sonst eingesetzten Verfahren. Sie finden Spleißstellen in standardisierten Datensätzen des Menschen oder des Fadenwurms Caenorhabditis elegans nur mit deutlich höheren Fehlern zwischen zehn und dreißig Prozent.

»Sören Sonnenburg hat damit einen wichtigen wissenschaftlichen Beitrag in den überaus aktiven Gebieten statistische Lerntheorie und Bioinformatik geleistet«, betont Professor Klaus-Robert Müller, Leiter des Bereichs Intelligente Datenanalyse IDA am Fraunhofer-Institut für Rechnerarchitektur und Softwaretechnik FIRST in Berlin. »Seine selbstlernenden Programme sind ein zentraler Baustein im laufenden Projekt IDA.GEN, dessen Ziel ein Software-Paket zum Auffinden von Genen ist.«

Media Contact

Dipl.-Inform. Sören Sonnenburg Fraunhofer-Gesellschaft

Weitere Informationen:

http://www.fraunhofer.de

Alle Nachrichten aus der Kategorie: Förderungen Preise

Zurück zur Startseite

Kommentare (0)

Schreiben Sie einen Kommentar

Neueste Beiträge

Bakterien für klimaneutrale Chemikalien der Zukunft

For­schen­de an der ETH Zü­rich ha­ben Bak­te­ri­en im La­bor so her­an­ge­züch­tet, dass sie Me­tha­nol ef­fi­zi­ent ver­wer­ten kön­nen. Jetzt lässt sich der Stoff­wech­sel die­ser Bak­te­ri­en an­zap­fen, um wert­vol­le Pro­duk­te her­zu­stel­len, die…

Batterien: Heute die Materialien von morgen modellieren

Welche Faktoren bestimmen, wie schnell sich eine Batterie laden lässt? Dieser und weiteren Fragen gehen Forschende am Karlsruher Institut für Technologie (KIT) mit computergestützten Simulationen nach. Mikrostrukturmodelle tragen dazu bei,…

Porosität von Sedimentgestein mit Neutronen untersucht

Forschung am FRM II zu geologischen Lagerstätten. Dauerhafte unterirdische Lagerung von CO2 Poren so klein wie Bakterien Porenmessung mit Neutronen auf den Nanometer genau Ob Sedimentgesteine fossile Kohlenwasserstoffe speichern können…

Partner & Förderer