Klarheit in der genetischen Buchstabensuppe

Bioinformatik findet vorwiegend im Computer statt. Auch Preisträger Sören Sonnenburg nutzt ihn, um Spleißstellen genannte Übergänge im Erbgut aufzufinden. Auf dem Monitor ist die Übersetzung bis zum Protein dargestellt. © Fraunhofer FIRST

… AGTTAGCTCATCT… Haben Sie etwas Sinnvolles entdeckt? Wer jetzt nur TAG sagt, hat die englische Katze CAT übersehen. Natürlich suchen Genetiker und Bioinformatiker im Erbgut nicht nach bekannten Begriffen. Doch verraten sich interessante Stellen im ACGT-Alphabet des Lebens durch bestimmte Abfolgen der Buchstaben, die für die vier im DNA-Strang vorkommenden Basen stehen. Besonders interessant sind Spleißstellen, denn sie markieren Anfänge und Enden von Genabschnitten – genauer: die Grenze zwischen Exons und Introns. Exons sind kodierte Bauanleitungen für Proteine. Introns dagegen sind dies nicht und sie werden beim Übergang von Information in strukturierte Materie schließlich enzymatisch herausgeschnitten. Die Zahl der Gene wird allein beim Menschen auf 20 000 bis 180 000 geschätzt, wovon jedes meist 100 bis 4 000 kodierende »Buchstaben« enthält. Eine derart umfangreiche Buchstabensuppe ohne Computerhilfe mit möglichst wenigen Fehlern durchforsten und verstehen zu wollen, wäre ein Unding.

Mathematische Methoden, mit deren Hilfe Spleißstellen aufgefunden werden können, hat Sören Sonnenburg in seiner mit dem 1. Hugo-Geiger-Preis ausgezeichneten Diplomarbeit untersucht. Bedeutender jedoch ist, dass er besonders verlässliche neue entwickelt hat. »Genauigkeit ist in diesem Bereich entscheidender als Rechenzeit«, weiß der gelernte Informatiker. »Dennoch ist die computergestützte Erkennung bedeutend schneller als traditionelle Verfahren. Die Fehlerrate der Algorithmen ist wesentlich, weil die Berechnungen als Grundlage für genetische Laborexperimente dienen. Erst hier entsteht der Löwenanteil der Kosten.« Für den Laien mögen vier bis sechs Prozent Fehler der von Sonnenburg erarbeiteten vier Methoden hoch erscheinen. Doch ist dies gering gegenüber den heute weltweit sonst eingesetzten Verfahren. Sie finden Spleißstellen in standardisierten Datensätzen des Menschen oder des Fadenwurms Caenorhabditis elegans nur mit deutlich höheren Fehlern zwischen zehn und dreißig Prozent.

»Sören Sonnenburg hat damit einen wichtigen wissenschaftlichen Beitrag in den überaus aktiven Gebieten statistische Lerntheorie und Bioinformatik geleistet«, betont Professor Klaus-Robert Müller, Leiter des Bereichs Intelligente Datenanalyse IDA am Fraunhofer-Institut für Rechnerarchitektur und Softwaretechnik FIRST in Berlin. »Seine selbstlernenden Programme sind ein zentraler Baustein im laufenden Projekt IDA.GEN, dessen Ziel ein Software-Paket zum Auffinden von Genen ist.«

Media Contact

Dipl.-Inform. Sören Sonnenburg Fraunhofer-Gesellschaft

Weitere Informationen:

http://www.fraunhofer.de

Alle Nachrichten aus der Kategorie: Förderungen Preise

Zurück zur Startseite

Kommentare (0)

Schreiben Sie einen Kommentar

Neueste Beiträge

Wolken bedecken die Nachtseite des heißen Exoplaneten WASP-43b

Ein Forschungsteam, darunter Forschende des MPIA, hat mit Hilfe des Weltraumteleskops James Webb eine Temperaturkarte des heißen Gasriesen-Exoplaneten WASP-43b erstellt. Der nahe gelegene Mutterstern beleuchtet ständig eine Hälfte des Planeten…

Neuer Regulator des Essverhaltens identifiziert

Möglicher Ansatz zur Behandlung von Übergewicht… Die rapide ansteigende Zahl von Personen mit Übergewicht oder Adipositas stellt weltweit ein gravierendes medizinisches Problem dar. Neben dem sich verändernden Lebensstil der Menschen…

Maschinelles Lernen optimiert Experimente mit dem Hochleistungslaser

Ein Team von internationalen Wissenschaftlerinnen und Wissenschaftlern des Lawrence Livermore National Laboratory (LLNL), des Fraunhofer-Instituts für Lasertechnik ILT und der Extreme Light Infrastructure (ELI) hat gemeinsam ein Experiment zur Optimierung…

Partner & Förderer