Forum für Wissenschaft, Industrie und Wirtschaft

Hauptsponsoren:     3M 
Datenbankrecherche:

 

Was machen eigentlich Statistiker?

18.06.2013
Erklärungen mithilfe einer hochkarätig besetzten Tagung an der Universität Bamberg und anhand eines fiktiven Beispiels

Conference on Applications of Missing-Data Procedures: Hinter diesem sperrigen Titel verbirgt sich eine Tagung, bei der einige der bedeutendsten Statistiker unserer Zeit referieren werden. Allen voran der meistzitierte Statistiker der Welt, Donald B. Rubin, seit 25 Jahren Professor an der renommierten Harvard University – und Ehrendoktor der Universität Bamberg.

Rubin ist Ideengeber und Entwickler zahlreicher weltweit anerkannter Verfahren und Algorithmen zum Umgang mit und zur Ergänzung von fehlenden Daten, dem übergeordneten Thema der Tagung. Rubin wird im Dezember 70 Jahre alt und ist nicht nur Ehrengast, sondern auch Anlass der Zusammenkunft, zu der seine akademische Tochter Prof. Dr. Susanne Rässler, Inhaberin des Lehrstuhls für Statistik und Ökonometrie an der Universität Bamberg, geladen hat. Susanne Rässler ist Expertin für Umfragen und Stichprobenziehungen, Mitglied der Zensus-Kommission und eine von drei Trägern des deutschlandweit einzigen Masterstudiengangs zu diesem Forschungsfeld.

Neben Rubin kann die Organisatorin noch mit vielen weiteren „Hochkarätern“ aufwarten, doch jetzt erst einmal zu den Inhalten: Rässler und ihre „Familie“, wie sie ihre Referenten liebevoll nennt, treffen sich am 19. Juni zwischen 9 und 16 Uhr und am 20. Juni zwischen 10 und 17 Uhr in der Kasernstr. 4 in Bamberg, um sich über fünf Problemfelder innerhalb des statistischen Forschungsgebiets „Umgang mit und Ergänzung von fehlenden Daten“ auszutauschen: Messfehler, kausale Schlussfolgerungen, Anonymisierung von vertraulich zu behandelnden Daten, Umgang mit großen Mengen fehlender Daten sowie Datenfusion. Was zunächst völlig abstrakt und weltfremd klingt, ist die Basis für viele wichtige Erkenntnisse, die unser Leben direkt oder indirekt betreffen.

Was das praktisch bedeutet, zeigt folgendes fiktives Beispiel: Ein frischgebackener Schulleiter möchte sich mit einigen Phänomenen an seiner neuen Schule vertraut machen. Zum Beispiel ist ihm aufgefallen, dass in einigen Klassen mit erhöhtem Ausländeranteil die Leistungen in den Kernfächern Mathematik, Deutsch und Englisch im Vergleich zu anderen homogener zusammengesetzten Klassen derselben Klassenstufe deutlich geringer ist. Zur Ursachenforschung möchte er gerne eine Umfrage machen. Und schon kommen die Statistiker ins Spiel. Ihre Aufgabe ist die Konzeption, Durchführung und Auswertung solcher Umfragen, wobei Durchführung in diesem Fall weniger die Arbeit vor Ort, also beispielsweise das Verteilen von Fragebögen meint, als vielmehr die Methode, mit der sichergestellt wird, dass am Ende der Umfrage auch ein korrekter Datensatz zur Auswertung vorliegt.
Gemeinsam mit unserem Schulleiter würden die Statistiker beispielsweise eine Umfrage für die Eltern konzipieren, in der sie Fragen zur Berufstätigkeit, zu Bildung und Ausbildung, zur Nationalität und zu Familienzusammenhängen, sprich, zu grundlegenden Informationen zum Leben der Schüler stellen und bei auftretenden Problemen wie Folgendem methodisch eingreifen: Gerade bei Fragen, die das Privatleben und die Persönlichkeit betreffen, werden oft aus Gründen wie Scham oder Unsicherheit falsche Angaben gemacht. So wird aus einem Hauptschulabschluss ein Abitur oder aus einem 60-jährigen Vater ein 45-jähriger. Je mehr fehlerhafte Angaben, desto verfälschter der Datensatz.

Datenlücken schließen

Je verfälschter der Datensatz, desto unzuverlässiger das Ergebnis der Umfrage. Statistiker erkennen solche unplausiblen Werte und stellen fest, ob es zufällige oder systematische Fehler sind. Auf diesem Wissen aufbauend können sie die durch die fehlerhaften Angaben entstandenen Datenlücken zu einem kompletten Datensatz ergänzen, so dass die Umfrage möglichst vollständig und mit möglichst korrekten Daten ausgewertet werden kann. Der Umgang mit solchen sogenannten „Messfehlern“ bildet den ersten Teil der Tagung, zu dem unter anderem Prof. Dr. Roderick J.A. Little und Dr. Nathaniel Schenker, der Präsident der Amerikanischen Statistischen Gesellschaft sprechen werden. Roderick J. A. Little ist ein Freund und Partner Rubins, der gemeinsam mit ihm DAS Standardwerk zum Umgang mit fehlenden Daten geschrieben hat.

Schlussfolgerungen ziehen

Das zweite Thema der Tagung, „kausale Schlussfolgerungen“, wozu unter anderem Susanne Rässler referiert, könnte bei unserem Beispiel folgendermaßen aussehen: Neben den Leistungsunterschieden bei bestimmten Klassen interessiert sich der Schulleiter außerdem für die Effizienz bestimmter Lernmethoden, speziell in Bezug auf Gruppenarbeit und Frontalunterricht. Die Statistiker raten ihm zu einem Experiment, in dem er zwei homogene Gruppen bildet, bei denen bis auf das zu untersuchende Element alle Voraussetzungen und Eigenschaften gleich sind (Klassenstufe, Aufgabenstellung, Lernziel etc.). Bei einer anschließenden Klausur, die beide Gruppen parallel schrieben, wurde das Lernziel kontrolliert und die Gruppe „Gruppenarbeit“ erzielte eindeutig bessere Ergebnisse.

Aus diesem Experiment kausale Schlussfolgerungen zu ziehen, also nachweisbar festzulegen, dass das Ergebnis kein Zufall war, ist hier die nächste Aufgabe der Statistiker. Denn aus einem starken Zusammenhang folgt nicht automatisch, dass es auch eine eindeutige Ursache-Wirkungs-Beziehung gibt. Oder auf unser Beispiel bezogen: Die Tatsache, dass Schüler bei der Gruppenarbeit mehr miteinander kommuniziert haben als die Schüler beim Frontalunterricht, heißt noch nicht automatisch, dass eine solche Kommunikation Gruppenarbeit effizienter macht.

Daten anonymisieren

Kommen wir von der Gruppenarbeit zurück zur Umfrage über die Leistungen in den Kernfächern und zu den Angaben, die Persönlichkeit und Privatleben betreffen – und damit zu einem weiteren Problemfeld: Ein Kollege ist sehr interessiert an der Umfrage und bittet den Schulleiter, ihm die Rohdaten, also die ausgefüllten Umfragebögen für eigene Nachforschungen zur Verfügung zu stellen. Einige Angaben, die in der Umfrage abgefragt wurden, sind allerdings vertraulich und nicht zur Weitergabe bestimmt. Würde der Schulleiter allerdings nur die Daten weitergeben, für die er eine ausdrückliche Erlaubnis hat, wäre der Datensatz unvollständig und sein Kollege hätte keine Möglichkeit, mit ihm verlässliche Auswertungen vorzunehmen.

Aber auch hierfür hat die Statistik eine Lösung, wie zum Beispiel Dr. Jörg Drechsler, ehemaliger Doktorand Susanne Rässlers und jetziger Mitarbeiter am Institut für Arbeitsmarkt und Berufsforschung, zu berichten weiß. Er hat 2009 in seiner Doktorarbeit einen teilsynthetischen Datensatz erzeugt, also nicht die Daten selbst, sondern deren Struktur gespiegelt, womit er eine Anonymisierung der Daten erreicht hat und damit eine Weitergabe von vertraulichen Daten ermöglicht. Deutschlandweit ein Novum, denn bis dato kannte man solche Verfahren nur von Donald B. Rubin ausgehend in den USA. Die neuesten Entwicklungen im Bereich der Datenanonymisierung sind das dritte Thema der Statistik Tagung, zu dem auch Jörg Drechsler sprechen wird.

Daten ergänzen

Beim vierten Thema geht es um den Umgang mit großen Mengen fehlender Daten. Für den Schulleiter wird das zum Beispiel dann relevant, wenn er Synergieeffekte zwischen einzelnen Fächern feststellen, also beispielsweise sehen möchte, ob es zwischen einem musikalischen und einem mathematischen Verständnis Beziehungen gibt und man über die Vermittlung bestimmter Lerninhalte in Musik ein größeres Verständnis bestimmter Lerninhalte in Mathematik erreichen könnte. Die Lösung ist auch hier ein Experiment, allerdings gibt es dabei folgendes Problem, das es statistisch zu lösen gilt: Um diese Fragestellung beantworten zu können, müsste es jeweils eine Schülergruppe geben, die nur Musik- bzw. nur Matheunterricht bekommt, damit sie nur für sich betrachtet werden kann.
Andererseits müssen aber beide Gruppen auch zueinander in Beziehung gesetzt werden, was eigentlich voraussetzen würde, das beide Gruppen auch beide Fächer unterrichtet bekommen. Voraussetzung eins schließt aber Voraussetzung zwei aus, so dass bei beiden Gruppen große Mengen an Daten fehlen, nämlich der Mathematikteil bei den Musikschülern und der Musikteil bei den Mathematikschülern. Über Problemstellungen dieser Art referiert auf der Tagung unter anderem Dr. Florian Meinfelder, wissenschaftlicher Mitarbeiter am Lehrstuhl für Statistik und Ökonometrie an der Universität Bamberg. Ihm gelang es bereits mehrfach, stabile Algorithmen zu entwickeln, mit denen man solche großen Mengen an fehlenden Daten ergänzen kann.

Datensätze zusammenführen

Das fünfte Tagungsthema hängt eng mit dem vierten zusammen, oder um beim Beispiel zu bleiben: Der Schulleiter stellt fest, dass die üblichen ein oder maximal zwei Schulstunden am Stück zu wenig sind, um die Musik- und Mathematikgruppen aussagekräftig zu testen. Damit wird er gezwungen, das Experiment in verschiedenen Blöcken mit mehreren Musik- und Mathematikgruppen durchzuführen. So entstehen viele Datensätze, die alle unterschiedliche Quellen haben. Spezialist für die Zusammenführung solcher Datensätze ist unter anderem Dr. Christian Aßmann, operativer Leiter und Koordinator der Methodengruppe im Nationalen Bildungspanel, der dort entsprechende Verfahren bereits implementiert hat. Er setzt mit seinem Vortrag den inhaltlichen Schlusspunkt der Tagung, bevor Donald B. Rubin die vorgestellten Ergebnisse und Problemstellungen bewerten und diskutieren wird.

Doch ein wenig Lust auf Statistik bekommen? Die Tagungsreferenten stehen gerne für Interviews und Gespräche rund um die obengenannten Problemstellungen zur Verfügung und geben Auskunft über statistische Fragestellungen in Gesellschaft, Wissenschaft, Wirtschaft oder Politik.

Geeignete Ansprechpartner zu Ihren individuellen Themen vermittelt Ihnen
Prof. Dr. Susanne Rässler
Lehrstuhl für Statistik und Ökonometrie an der Universität Bamberg
Tel. 0951/863 2530 bzw. -2531 (Sekretariat)
E-Mail: susanne.raessler@uni-bamberg.de

Tanja Eisenach | idw
Weitere Informationen:
http://www.uni-bamberg.de

Weitere Nachrichten aus der Kategorie Veranstaltungsnachrichten:

nachricht Future Security Conference 2017 in Nürnberg - Call for Papers bis 31. Juli
26.06.2017 | Fraunhofer-Institut für Integrierte Schaltungen IIS

nachricht Von Batterieforschung bis Optoelektronik
23.06.2017 | Justus-Liebig-Universität Gießen

Alle Nachrichten aus der Kategorie: Veranstaltungsnachrichten >>>

Die aktuellsten Pressemeldungen zum Suchbegriff Innovation >>>

Die letzten 5 Focus-News des innovations-reports im Überblick:

Im Focus: Can we see monkeys from space? Emerging technologies to map biodiversity

An international team of scientists has proposed a new multi-disciplinary approach in which an array of new technologies will allow us to map biodiversity and the risks that wildlife is facing at the scale of whole landscapes. The findings are published in Nature Ecology and Evolution. This international research is led by the Kunming Institute of Zoology from China, University of East Anglia, University of Leicester and the Leibniz Institute for Zoo and Wildlife Research.

Using a combination of satellite and ground data, the team proposes that it is now possible to map biodiversity with an accuracy that has not been previously...

Im Focus: Klima-Satellit: Mit robuster Lasertechnik Methan auf der Spur

Hitzewellen in der Arktis, längere Vegetationsperioden in Europa, schwere Überschwemmungen in Westafrika – mit Hilfe des deutsch-französischen Satelliten MERLIN wollen Wissenschaftler ab 2021 die Emissionen des Treibhausgases Methan auf der Erde erforschen. Möglich macht das ein neues robustes Lasersystem des Fraunhofer-Instituts für Lasertechnologie ILT in Aachen, das eine bisher unerreichte Messgenauigkeit erzielt.

Methan entsteht unter anderem bei Fäulnisprozessen. Es ist 25-mal wirksamer als das klimaschädliche Kohlendioxid, kommt in der Erdatmosphäre aber lange nicht...

Im Focus: Climate satellite: Tracking methane with robust laser technology

Heatwaves in the Arctic, longer periods of vegetation in Europe, severe floods in West Africa – starting in 2021, scientists want to explore the emissions of the greenhouse gas methane with the German-French satellite MERLIN. This is made possible by a new robust laser system of the Fraunhofer Institute for Laser Technology ILT in Aachen, which achieves unprecedented measurement accuracy.

Methane is primarily the result of the decomposition of organic matter. The gas has a 25 times greater warming potential than carbon dioxide, but is not as...

Im Focus: How protons move through a fuel cell

Hydrogen is regarded as the energy source of the future: It is produced with solar power and can be used to generate heat and electricity in fuel cells. Empa researchers have now succeeded in decoding the movement of hydrogen ions in crystals – a key step towards more efficient energy conversion in the hydrogen industry of tomorrow.

As charge carriers, electrons and ions play the leading role in electrochemical energy storage devices and converters such as batteries and fuel cells. Proton...

Im Focus: Die Schweiz in Pole-Position in der neuen ESA-Mission

Die Europäische Weltraumagentur ESA gab heute grünes Licht für die industrielle Produktion von PLATO, der grössten europäischen wissenschaftlichen Mission zu Exoplaneten. Partner dieser Mission sind die Universitäten Bern und Genf.

Die Europäische Weltraumagentur ESA lanciert heute PLATO (PLAnetary Transits and Oscillation of stars), die grösste europäische wissenschaftliche Mission zur...

Alle Focus-News des Innovations-reports >>>

Anzeige

Anzeige

IHR
JOB & KARRIERE
SERVICE
im innovations-report
in Kooperation mit academics
Veranstaltungen

Von Batterieforschung bis Optoelektronik

23.06.2017 | Veranstaltungen

10. HDT-Tagung: Elektrische Antriebstechnologie für Hybrid- und Elektrofahrzeuge

22.06.2017 | Veranstaltungen

„Fit für die Industrie 4.0“ – Tagung von Hochschule Darmstadt und Schader-Stiftung am 27. Juni

22.06.2017 | Veranstaltungen

 
VideoLinks
B2B-VideoLinks
Weitere VideoLinks >>>
Aktuelle Beiträge

Radioaktive Elemente in Cassiopeia A liefern Hinweise auf Neutrinos als Ursache der Supernova-Explosion

23.06.2017 | Physik Astronomie

Dünenökosysteme modellieren

23.06.2017 | Ökologie Umwelt- Naturschutz

Makro-Mikrowelle macht Leichtbau für Luft- und Raumfahrt effizienter

23.06.2017 | Materialwissenschaften