Die Software Scanpy verarbeitet riesige Mengen an Einzelzelldaten

Visualisierung von Genexpressionsmustern muriner Gehirnzellen mit Scanpy Quelle: Helmholtz Zentrum München

„Es geht um die Analyse von Genexpressionsdaten* zahlreicher einzelner Zellen“, erklärt Erstautor Alex Wolf vom Institute of Computational Biology (ICB) des Helmholtz Zentrums München. Er hat Scanpy entwickelt, gemeinsam mit seinem Kollegen Philipp Angerer in der Machine Learning Gruppe von Institutsdirektor Prof. Dr. Dr. Fabian Theis, der neben seiner Position am Helmholtz Zentrum auch Professor für Mathematische Modelle biologischer Systeme an der TU München ist.

„Die neue technische Möglichkeiten generieren um Größenordnungen mehr Daten mit dementsprechend höherer Information“, schildert Theis. „Allerdings war die historisch gewachsene Software-Infrastruktur zur Genexpressionsanalyse nicht auf die neuen Herausforderungen ausgelegt.“ Entsprechend groß sei hier der Bedarf nach neuen Analysemethoden.

Im Rennen für den Human Cell Atlas

Auch ein großes internationales Forschungsvorhaben könnte Theis zufolge von der Software profitieren. Unter dem Namen ‚Human Cell Atlas‘ tragen zahlreiche internationale Wissenschaftler eine Referenzdatenbank zusammen, in der die Genaktivität aller menschlichen Zelltypen erfasst ist.

„Für dieses Projekt oder auch bei der immer häufiger werdenden Zusammenlegung von bestehenden Datensätzen ist es wichtig, eine skalierbare Software zu haben“, so Theis. Entsprechend sei Scanpy aktuell in der Auswahl für die Analysesoftware des Human Cell Atlas (https://www.humancellatlas.org).

„Mit Scanpy publizieren wir die erste Software, die eine umfängliche Analyse großer Genexpressionsdatensätze mit einem breiten Spektrum aus Methoden des maschinellen Lernens und Statistik erlaubt“, beschreibt Alex Wolf den Fortschritt. „Bereits jetzt wird die Software in diversen Gruppen weltweit eingesetzt, insbesondere auch am Broad Institute von Harvard und dem Massachusetts Institute of Technology.“

Technologisch beschreitet die Anwendung neue Wege: Während entsprechende Biostatistik-Software traditionell in der Programmiersprache R geschrieben wurde, basiert Scanpy auf der Sprache Python, die die Machine Learning Community dominiert. Neu ist zudem, dass Graph-basierte Algorithmen das Herz von Scanpy bilden.

Anstatt Zellen wie bisher üblich als Punkte im Koordinatensystem des Genexpressionsraums zu betrachten, verwenden die Algorithmen ein graphartiges Koordinatensystem. Das heißt, anstatt eine Zelle mit dem Expressionswert einiger Tausend Gene zu charakterisieren, wird sie einfach durch die Angabe ihrer nächsten Nachbarn charakterisiert – vergleichbar mit Verbindungen in sozialen Netzwerken. Wenn es zum Beispiel um die Identifikation von Zelltypen geht, verwendet Scanpy also die gleichen Algorithmen wie Facebook zur Identifikation von Communities.

Weitere Informationen

* Die Expression beschreibt, wie häufig ein Gen abgelesen wird, gibt also Aufschluss über die Aktivität des Gens.

Hintergrund:
Das Team und Alex Wolf konnte erst kürzlich einen der vorderen Plätze beim Data Science Bowl belegen, einem der weltweit höchstdotierten Wettbewerbe zum Thema Big Data. In ihrem Beitrag hatte das Team einen Algorithmus programmiert, der binnen weniger Millisekunden Lungenkrebs auf Basis von 300 Schichten eines dreidimensionalen Computertomographie (CT)-Scans erkennt – ein Vorgang für den ein Radiologe im schlechtesten Fall mehrere Stunden benötigen würde. Des Weiteren publizierte das Team kürzlich einen Artikel in Nature Communications zur Rekonstruktion von Zellentwicklung aus Einzelzellbildern: Malen nach Zahlen: Algorithmus rekonstruiert Prozesse aus Einzelbildern. https://www.helmholtz-muenchen.de/presse-medien/pressemitteilungen/alle-pressemi…

Original-Publikation:
Wolf, A. et al. (2018): Scanpy: large-scale single-cell gene expression data analysis. Genome Biology, DOI: 10.1186/s13059-017-1382-0

Das Helmholtz Zentrum München verfolgt als Deutsches Forschungszentrum für Gesundheit und Umwelt das Ziel, personalisierte Medizin für die Diagnose, Therapie und Prävention weit verbreiteter Volkskrankheiten wie Diabetes mellitus und Lungenerkrankungen zu entwickeln. Dafür untersucht es das Zusammenwirken von Genetik, Umweltfaktoren und Lebensstil. Der Hauptsitz des Zentrums liegt in Neuherberg im Norden Münchens. Das Helmholtz Zentrum München beschäftigt rund 2.300 Mitarbeiter und ist Mitglied der Helmholtz-Gemeinschaft, der 18 naturwissenschaftlich-technische und medizinisch-biologische Forschungszentren mit rund 37.000 Beschäftigten angehören. http://www.helmholtz-muenchen.de

Das Institut für Computational Biology (ICB) führt datenbasierte Analysen biologischer Systeme durch. Durch die Entwicklung und Anwendung bioinformatischer Methoden werden Modelle zur Beschreibung molekularer Prozesse in biologischen Systemen erarbeitet. Ziel ist es, innovative Konzepte bereitzustellen, um das Verständnis und die Behandlung von Volkskrankheiten zu verbessern. http://www.helmholtz-muenchen.de/icb

Ansprechpartner für die Medien:
Abteilung Kommunikation, Helmholtz Zentrum München – Deutsches Forschungszentrum für Gesundheit und Umwelt (GmbH), Ingolstädter Landstr. 1, 85764 Neuherberg – Tel. +49 89 3187 2238 – Fax: +49 89 3187 3324 – E-Mail: [email protected]

Fachlicher Ansprechpartner:
Dr. Dr. Alexander Wolf, Helmholtz Zentrum München – Deutsches Forschungszentrum für Gesundheit und Umwelt (GmbH), Institute of Computational Biology, Ingolstädter Landstr. 1, 85764 Neuherberg – Tel. +49 89 3187 4217 – E-Mail: [email protected]

Media Contact

Sonja Opitz Helmholtz Zentrum München - Deutsches Forschungszentrum für Gesundheit und Umwelt

Alle Nachrichten aus der Kategorie: Medizintechnik

Kennzeichnend für die Entwicklung medizintechnischer Geräte, Produkte und technischer Verfahren ist ein hoher Forschungsaufwand innerhalb einer Vielzahl von medizinischen Fachrichtungen aus dem Bereich der Humanmedizin.

Der innovations-report bietet Ihnen interessante Berichte und Artikel, unter anderem zu den Teilbereichen: Bildgebende Verfahren, Zell- und Gewebetechnik, Optische Techniken in der Medizin, Implantate, Orthopädische Hilfen, Geräte für Kliniken und Praxen, Dialysegeräte, Röntgen- und Strahlentherapiegeräte, Endoskopie, Ultraschall, Chirurgische Technik, und zahnärztliche Materialien.

Zurück zur Startseite

Kommentare (0)

Schreib Kommentar

Neueste Beiträge

Stand-up-Paddleboard aus nachwachsenden Leichtbau-Materialien

Plastikfreier Wassersport… Stand-up-Paddling hat sich zum Trendsport entwickelt. Herkömmliche Surfbretter bestehen jedoch aus erdölbasierten Materialien wie Epoxidharz und Polyurethan. Forschende am Fraunhofer-Institut für Holzforschung, Wilhelm-Klauditz-Institut, WKI wollen die Kunststoff-Boards durch…

CO2 als Rohstoff für Kunststoffe und Co.

Kohlenstoffdioxid ist einer der Haupttreiber des Klimawandels – die Emissionen müssen daher künftig sinken. Einen möglichen Weg zur Kohlendioxid-Reduktion zeigen Fraunhofer-Forschende auf: Sie nutzen das Klimagas als Rohstoff, etwa für…

EnaBle-Projekt: Wasserstoffelektrische Antriebe für die Luftfahrt

Uni Ulm erhält 1,8 Mio. Euro… Das hybridelektrische Fliegen effizienter, sicherer und damit kommerziell nutzbar machen: So lautet das Ziel des Forschungsverbunds EnaBle, der vom Bundesministerium für Wirtschaft und Energie…

Partner & Förderer