Forum für Wissenschaft, Industrie und Wirtschaft

Hauptsponsoren:     3M 
Datenbankrecherche:

 

Wissenschaftler entwickeln Hashtags für Massenspektren

16.11.2016

Datenbankexperten aus Japan, Amerika und ganz Europa haben gemeinsam einen Code entwickelt, mit dem es möglich ist, die Informationen von Massenspektren zu vereinheitlichen. Der SPectraL-Hash oder SPLASH genannte Code soll jetzt die Suche nach Spektren im Internet erleichtern. Die Erfindung des SPLASH-Codes wurde jetzt in der Fachzeitschrift Nature Biotechnology veröffentlicht. Auch die Bioinformatiker des Leibniz-Instituts für Pflanzenbiochemie in Halle, allen voran Dr. Steffen Neumann, haben als Mitglieder des SPLASH-Konsortiums die Entwicklung des Hashtags maßgeblich vorangetrieben.

Datenbankexperten aus Japan, Amerika und ganz Europa haben gemeinsam einen Code entwickelt, mit dem es möglich ist, die Informationen von Massenspektren zu vereinheitlichen. Der SPectraL-Hash oder SPLASH genannte Code soll jetzt die Suche nach Spektren im Internet erleichtern. Alle verfügbaren Informationen zu einem bestimmten Spektrum können mit diesem Spektren-Hashtag gezielt aus allen Datenbanken zusammengetragen und miteinander verglichen werden.


Ein typisches Massenspektrum von Koffein. Der zugehörige SPLASH-Code lautet: splash10-000i-3900000000-73043667076aaf483c6e

Steffen Neumann, IPB


Koffein in Codes und Nomenklaturen

IPB

Die Erfindung des SPLASH-Codes wurde jetzt in der Fachzeitschrift Nature Biotechnology veröffentlicht. Auch die Bioinformatiker des Leibniz-Instituts für Pflanzenbiochemie in Halle, allen voran Dr. Steffen Neumann, haben als Mitglieder des SPLASH-Konsortiums die Entwicklung des Hashtags maßgeblich vorangetrieben.

Die Massenspektrometrie ist ein hochsensitives Analyseverfahren, mit dem es möglich ist, geringste Substanzmengen – auch in Stoffgemischen - nachzuweisen. Die Technologie ist so leistungsfähig, dass man mit ihr ein Stück Würfelzucker in einem Schwimmbecken detektieren kann. Neben dem Nachweis von bereits bekannten Substanzen, wird die Massenspektrometrie auch zur Strukturaufklärung von neu entdeckten Verbindungen genutzt.

Seit der Entwicklung der ersten kommerziellen Massenspektrometer in den 50-er Jahren, wurden Analysegeräte und Methoden ständig optimiert, sodass die Massenspektrometrie zu einem unentbehrlichen Werkzeug für die chemisch-biologische Grundlagenforschung, für Umwelt- und Klimaforschung, Medizin und Forensik geworden ist.

Weltweit tragen die Experten täglich Gigabytes an Massendaten zusammen. Millionen Spektren sind zurzeit in ca. 20 größeren Datenbanken gespeichert – das entspricht einer Datenmenge von mehreren Petabyte, also mehreren Millionen Gigabyte. Unter diesen Spektren sind mehrere tausend Referenzspektren von bekannten Substanzen, auf die man bei Bedarf zum Vergleich der eigenen Messergebnisse zugreifen kann.

Darüber hinaus werden die Datenbanken jedoch auch mit den Spektren noch unbekannter Substanzen gespeist, die man in jüngster Zeit vermehrt aus Pflanzen, Pilzen und marinen Organismen gewinnt. Die Speicherung der Spektren erfolgt dabei immer in dem jeweils datenbankspezifischen Format, sodass z.B. bei einer unbekannten noch namenlosen Substanz X nicht festgestellt werden kann, ob diese Substanz nicht schon an anderer Stelle beschrieben und als Spektrum gespeichert worden ist.

Ein Informationsaustausch unter Wissenschaftlern, beispielsweise über wichtige Eigenschaften der Substanz X, wird dadurch erschwert. Diesem historisch gewachsenen Wildwuchs an Massendaten will man mit dem SPLASH-Code jetzt entgegenwirken.

Die von den Wissenschaftlern des internationalen SPLASH-Konsortiums entwickelten Programme können zu jedem vorhandenen Spektrum einen Code generieren, der ebenso wie ein Hashtag funktioniert. Dadurch werden Spektren im Internet nicht nur auffindbar, man kann zudem alle verfügbaren Substanzinformationen aus verschiedenen Datenbanken zusammentragen.

Spektren von noch unbekannten Substanzen erhalten mit dem SPLASH-Code ihren ersten Namen, was die Kommunikation über diese Stoffe extrem erleichtert. Am Leibniz-Institut für Pflanzenbiochemie (IPB) hat die Massenspektrometrie eine lange Tradition. Bereits 1969 besaß das Institut eines der begehrten und in der DDR nur in vier Exemplaren hergestellten Elektronenanlagerungsmassenspektrographen von Manfred von Ardenne. Heute werden am IPB mit modernen Massenspektrometern etwa 10.000 Proben im Jahr analysiert.

Originalpublikation:
Gert Wohlgemuth, Sajjan S. Mehta, Ramon F. Mejia, Steffen Neumann, Diego Pedrosa, Tomáš Pluskal, Emma L. Schymanski, Egon L. Willighagen, Michael Wilson, David S. Wishart, Masanori Arita, Pieter C. Dorrestein, Nuno Bandeira, Mingxun Wang, Tobias Schulze, Reza M. Salek, Christoph Steinbeck, Venkata Chandrasekhar Nainala, Robert Mistrik, Takaaki Nishioka & Oliver Fiehn. SPLASH, a hashed identifier for mass spectra. Nature Biotechnology 34, 1099–1101 (2016) doi:10.1038/nbt.3689,

Ansprechpartner:
Dr. Steffen Neumann
Tel.: 0345 5582 1470
sneumann(at)ipb-halle.de

Hintergrund:
IUPAC, InChI und SPLASH – warum die Entwicklung von Codes unerlässlich ist
In der Geschichte der Wissenschaft standen Chemiker immer wieder vor Kommunikationsproblemen, denn gleiche Substanzen waren – je nach Entdeckungs- oder Erforschungsort – unter verschiedenen Namen bekannt. Koffein beispielsweise erhielt seinen Namen zunächst aus der Kaffeepflanze, Coffea arabica, aus der die Substanz zuerst isoliert wurde. Darüber hinaus ist Koffein unter einigen weiteren Namen wie 1,3,7-Trimethylxanthin, Methyltheobromin oder Thein bekannt.

Bereits im frühen 20. Jahrhundert sorgte die Internationale Union für reine und angewandte Chemie (International Union of Pure and Applied Chemistry, IUPAC) für einheitliche Regeln für die Erstellung von chemischen Nomenklaturen, Symbolen und Terminologien, die bis heute weltweit angewendet werden. Demnach ist die offizielle international gültige chemische Bezeichnung von Koffein: 1,3,7-Trimethyl-3,7-dihydro-1H-purin-2,6-dion. Besonders bei der Benennung noch unbekannter Substanzen ist diese einheitliche Namensgebung hilfreich, obgleich sich immer auch zusätzliche Trivialnamen für den täglichen Umgang im Forschungsalltag etablieren.

Der IUPAC-Code ist allgemeingültig und wird von Chemikern weltweit verstanden; er hat aber den Nachteil, dass er besonders bei komplexen Verbindungen zu lang ist, um sich ein Bild über die räumliche Ausrichtung der Atome im Molekül zu machen. Chemiker bevorzugen daher immer die grafische Darstellung von Molekülen, die Strukturformel, da diese wichtige Informationen zum Aufbau der Verbindung enthält. Diese grafische Darstellung wird vom Menschen gut verstanden, von Computern hingegen nur bedingt.

Um Strukturformeln mit dem Computer sichtbar und im Internet suchbar zu machen, wurden von 2005-2008 auf Initiative der IUPAC zwei verschiedene Codes entwickelt, die Strukturinformationen von chemischen Verbindungen in maschinenlesbare Zeichenketten umwandeln. Diese Codes, der InChI-String und der InChI-Key (von International Chemical Identifyer) funktionieren wie Hashtags, mit denen die jeweilige Substanz im Internet wiederauffindbar ist. Beide Codes können für alle existierenden Verbindungen mit einer frei verfügbaren Software generiert werden. Öffentliche Datenbanken und Chemieportale, wie Pubchem oder Chemspider, aber auch Wikipedia haben ihre Substanzinformationen um den InChI/InChI-Key erweitert. Gibt man den Code für Koffein oder Teile davon in die Suchmaschinen ein, so findet man alle relevanten Seiten zu Koffein, inklusive Strukturformel und vielen weiteren für Wissenschaftler interessanten Informationen.

Da jede Substanz nicht nur eine eindeutige Strukturformel, sondern auch ihr ganz spezifisches Massenspektrum aufweist, ist die Entwicklung des SPLASH-Codes die logische Fortführung des InChIs, die sich in der Konsequenz von wachsenden Massendatenmengen in verschiedenen Formaten ergibt.

Weitere Informationen:

http://www.nature.com/nbt/journal/v34/n11/full/nbt.3689.html
http://www.ipb-halle.de/oeffentlichkeit/aktuelles/artikel-detail/wissenschaftler...

Dipl.Biol. Sylvia Pieplow | idw - Informationsdienst Wissenschaft

Weitere Nachrichten aus der Kategorie Informationstechnologie:

nachricht Deep Learning und KI in der Motorenentwicklung – IAV und DFKI eröffnen gemeinsames Forschungslabor
23.01.2018 | Deutsches Forschungszentrum für Künstliche Intelligenz GmbH, DFKI

nachricht Original bleibt Original - Neues Produktschutzverfahren für KFZ-Kennzeichenschilder
19.01.2018 | Fraunhofer-Institut für Werkstoff- und Strahltechnik IWS

Alle Nachrichten aus der Kategorie: Informationstechnologie >>>

Die aktuellsten Pressemeldungen zum Suchbegriff Innovation >>>

Die letzten 5 Focus-News des innovations-reports im Überblick:

Im Focus: Optisches Nanoskop ermöglicht Abbildung von Quantenpunkten

Physiker haben eine lichtmikroskopische Technik entwickelt, mit der sich Atome auf der Nanoskala abbilden lassen. Das neue Verfahren ermöglicht insbesondere, Quantenpunkte in einem Halbleiter-Chip bildlich darzustellen. Dies berichten die Wissenschaftler des Departements Physik und des Swiss Nanoscience Institute der Universität Basel zusammen mit Kollegen der Universität Bochum in «Nature Photonics».

Mikroskope machen Strukturen sichtbar, die dem menschlichen Auge sonst verborgen blieben. Einzelne Moleküle und Atome, die nur Bruchteile eines Nanometers...

Im Focus: Optical Nanoscope Allows Imaging of Quantum Dots

Physicists have developed a technique based on optical microscopy that can be used to create images of atoms on the nanoscale. In particular, the new method allows the imaging of quantum dots in a semiconductor chip. Together with colleagues from the University of Bochum, scientists from the University of Basel’s Department of Physics and the Swiss Nanoscience Institute reported the findings in the journal Nature Photonics.

Microscopes allow us to see structures that are otherwise invisible to the human eye. However, conventional optical microscopes cannot be used to image...

Im Focus: Vollmond-Dreierlei am 31. Januar 2018

Am 31. Januar 2018 fallen zum ersten Mal seit dem 30. Dezember 1982 "Supermond" (ein Vollmond in Erdnähe), "Blutmond" (eine totale Mondfinsternis) und "Blue Moon" (ein zweiter Vollmond im Kalendermonat) zusammen - Beobachter im deutschen Sprachraum verpassen allerdings die sichtbaren Phasen der Mondfinsternis.

Nach den letzten drei Vollmonden am 4. November 2017, 3. Dezember 2017 und 2. Januar 2018 ist auch der bevorstehende Vollmond am 31. Januar 2018 ein...

Im Focus: Maschinelles Lernen im Quantenlabor

Auf dem Weg zum intelligenten Labor präsentieren Physiker der Universitäten Innsbruck und Wien ein lernfähiges Programm, das eigenständig Quantenexperimente entwirft. In ersten Versuchen hat das System selbständig experimentelle Techniken (wieder)entdeckt, die heute in modernen quantenoptischen Labors Standard sind. Dies zeigt, dass Maschinen in Zukunft auch eine kreativ unterstützende Rolle in der Forschung einnehmen könnten.

In unseren Taschen stecken Smartphones, auf den Straßen fahren intelligente Autos, Experimente im Forschungslabor aber werden immer noch ausschließlich von...

Im Focus: Artificial agent designs quantum experiments

On the way to an intelligent laboratory, physicists from Innsbruck and Vienna present an artificial agent that autonomously designs quantum experiments. In initial experiments, the system has independently (re)discovered experimental techniques that are nowadays standard in modern quantum optical laboratories. This shows how machines could play a more creative role in research in the future.

We carry smartphones in our pockets, the streets are dotted with semi-autonomous cars, but in the research laboratory experiments are still being designed by...

Alle Focus-News des Innovations-reports >>>

Anzeige

Anzeige

Veranstaltungen

15. BF21-Jahrestagung „Mobilität & Kfz-Versicherung im Fokus“

23.01.2018 | Veranstaltungen

Gemeinsam innovativ werden

23.01.2018 | Veranstaltungen

Leichtbau zu Ende gedacht – Herausforderung Recycling

23.01.2018 | Veranstaltungen

VideoLinks Wissenschaft & Forschung
Weitere VideoLinks im Überblick >>>
 
Aktuelle Beiträge

Lebensrettende Mikrobläschen

23.01.2018 | Biowissenschaften Chemie

3D-Druck von Metallen: Neue Legierung ermöglicht Druck von sicheren Stahl-Produkten

23.01.2018 | Maschinenbau

CHP1-Mutation verursacht zerebelläre Ataxie

23.01.2018 | Biowissenschaften Chemie

Weitere B2B-VideoLinks
IHR
JOB & KARRIERE
SERVICE
im innovations-report
in Kooperation mit academics