Klarheit in der genetischen Buchstabensuppe

Bioinformatik findet vorwiegend im Computer statt. Auch Preisträger Sören Sonnenburg nutzt ihn, um Spleißstellen genannte Übergänge im Erbgut aufzufinden. Auf dem Monitor ist die Übersetzung bis zum Protein dargestellt. © Fraunhofer FIRST

… AGTTAGCTCATCT… Haben Sie etwas Sinnvolles entdeckt? Wer jetzt nur TAG sagt, hat die englische Katze CAT übersehen. Natürlich suchen Genetiker und Bioinformatiker im Erbgut nicht nach bekannten Begriffen. Doch verraten sich interessante Stellen im ACGT-Alphabet des Lebens durch bestimmte Abfolgen der Buchstaben, die für die vier im DNA-Strang vorkommenden Basen stehen. Besonders interessant sind Spleißstellen, denn sie markieren Anfänge und Enden von Genabschnitten – genauer: die Grenze zwischen Exons und Introns. Exons sind kodierte Bauanleitungen für Proteine. Introns dagegen sind dies nicht und sie werden beim Übergang von Information in strukturierte Materie schließlich enzymatisch herausgeschnitten. Die Zahl der Gene wird allein beim Menschen auf 20 000 bis 180 000 geschätzt, wovon jedes meist 100 bis 4 000 kodierende »Buchstaben« enthält. Eine derart umfangreiche Buchstabensuppe ohne Computerhilfe mit möglichst wenigen Fehlern durchforsten und verstehen zu wollen, wäre ein Unding.

Mathematische Methoden, mit deren Hilfe Spleißstellen aufgefunden werden können, hat Sören Sonnenburg in seiner mit dem 1. Hugo-Geiger-Preis ausgezeichneten Diplomarbeit untersucht. Bedeutender jedoch ist, dass er besonders verlässliche neue entwickelt hat. »Genauigkeit ist in diesem Bereich entscheidender als Rechenzeit«, weiß der gelernte Informatiker. »Dennoch ist die computergestützte Erkennung bedeutend schneller als traditionelle Verfahren. Die Fehlerrate der Algorithmen ist wesentlich, weil die Berechnungen als Grundlage für genetische Laborexperimente dienen. Erst hier entsteht der Löwenanteil der Kosten.« Für den Laien mögen vier bis sechs Prozent Fehler der von Sonnenburg erarbeiteten vier Methoden hoch erscheinen. Doch ist dies gering gegenüber den heute weltweit sonst eingesetzten Verfahren. Sie finden Spleißstellen in standardisierten Datensätzen des Menschen oder des Fadenwurms Caenorhabditis elegans nur mit deutlich höheren Fehlern zwischen zehn und dreißig Prozent.

»Sören Sonnenburg hat damit einen wichtigen wissenschaftlichen Beitrag in den überaus aktiven Gebieten statistische Lerntheorie und Bioinformatik geleistet«, betont Professor Klaus-Robert Müller, Leiter des Bereichs Intelligente Datenanalyse IDA am Fraunhofer-Institut für Rechnerarchitektur und Softwaretechnik FIRST in Berlin. »Seine selbstlernenden Programme sind ein zentraler Baustein im laufenden Projekt IDA.GEN, dessen Ziel ein Software-Paket zum Auffinden von Genen ist.«

Media Contact

Dipl.-Inform. Sören Sonnenburg Fraunhofer-Gesellschaft

Weitere Informationen:

http://www.fraunhofer.de

Alle Nachrichten aus der Kategorie: Förderungen Preise

Zurück zur Startseite

Kommentare (0)

Schreiben Sie einen Kommentar

Neueste Beiträge

Neues topologisches Metamaterial

… verstärkt Schallwellen exponentiell. Wissenschaftlerinnen und Wissenschaftler am niederländischen Forschungsinstitut AMOLF haben in einer internationalen Kollaboration ein neuartiges Metamaterial entwickelt, durch das sich Schallwellen auf völlig neue Art und Weise…

Astronomen entdecken starke Magnetfelder

… am Rand des zentralen schwarzen Lochs der Milchstraße. Ein neues Bild des Event Horizon Telescope (EHT) hat starke und geordnete Magnetfelder aufgespürt, die vom Rand des supermassereichen schwarzen Lochs…

Faktor für die Gehirnexpansion beim Menschen

Was unterscheidet uns Menschen von anderen Lebewesen? Der Schlüssel liegt im Neokortex, der äußeren Schicht des Gehirns. Diese Gehirnregion ermöglicht uns abstraktes Denken, Kunst und komplexe Sprache. Ein internationales Forschungsteam…

Partner & Förderer