KLIMT: Software zur Visualisierung von Bäumen von ASA ausgezeichnet

KLIMT steht für "Klassification - Interactive Methods for Trees", Gustav Klimts Bäume hat Urbanek sich als Logo für seine Software gewählt.

Mit Simon Urbanek ist kürzlich erneut ein Mitarbeiter des Augsburger Lehrstuhls für Rechnerorientierte Statistik und Datenanalyse (Prof. Antony Unwin, Ph. D.) von der American Statistical Association (ASA) ausgezeichnet worden. Urbanek erhält den diesjährigen Chambers Software Award für das von ihm entwickelte Programm KLIMT. Es dient der Visualisierung von Bäumen, wie sie in vielen Gebieten – etwa in der Biologie, der Botanik oder der Medizin – als Modelle verwendet werden.

Das Ziel solcher Baum-Modell ist es, Vorhersagen zu machen oder einen Sachverhalt zu erklären. Ein Regressions- oder Klassifikationsbaum besteht aus Knoten, die Entscheidungsregeln beinhalten, und aus Blättern, die einen Vorhersagewert tragen. So kann zum Beispiel ein Klassifikationsbaum aufgebaut werden, um aufgrund von Patientendaten zu entscheiden, ob eine Krankheit vorliegt. Dabei wird in jedem Knoten ein Merkmal betrachtet (z. B. Fieber, Blutwerte etc.) und entsprechend der Regeln in den Knoten (z. B. „ist Fieber > 40°C ?“) wird der jeweilige Ast ausgewählt, bis ein Endknoten (Blatt) und somit eine Klassifizierung (z. B. „Patient ist nicht krank“) erreicht ist.

DURCH VISUALISIERUNG UND INTERAKTIVITÄT ZUM MODELLVERSTÄNDNIS

Das Problem bei der Erstellung von Baummodellen ist, dass es nahezu unendlich viele mögliche Bäume gibt. Um aus dieser Vielzahl ein möglichst gutes Modell herauszufinden, muss man sowohl die Daten als auch das Modell verstehen und beurteilen können. Das ermöglicht die Software KLIMT durch Visualisierung und Interaktivität. Verschiedene Visualisierungsmerkmale helfen dabei, den Baum unter verschiedenen Gesichtspunkten zu sehen – relative Proportionen von Klassen, absolute Größen, Abweichungen in den Knoten usw. Andere Diagramme für Daten – wie Streudiagramme, Histogramme, Boxplots, Balkendiagramme oder Fluktuationsdiagramme – ermöglichen auch die Analyse der Grunddaten. Zusammen mit der verknüpften Selektion, die es erlaubt, einzelne Fälle in allen Diagrammen inklusive der Bäume zu markieren, machen die genannten Merkmale KLIMT zu einem vollwertigen interaktiven Werkzeug zur Analyse von Baummodellen. Ein vergleichbares Programm dieser Art für Baumanalyse ist derzeit nicht verfügbar.

KLIMT ist flexibel, da es über eine nahtlose Schnittstelle zu zahlreichen statistischen Umgebungen verfügt, die für Analysen verwendet werden, ist das Programm KLIMT zudem sehr flexibel. Dadurch, dass es in Java geschrieben ist, ist seines Verfügbarkeit auf allen gängigen Plattformen garantiert. Ein speziell für KLIMT entwickeltes Grafiksubsystem erlaubt darüber hinaus die Verwendung aller Grafiken in hochwertiger Form für Druck und Veröffentlichungen.

DER DRITTE ASA-PREISTRÄGER AUS AUGSBURG

Nach Silvia Winkler und Heike Hofmann im Jahr 2000 ist Simon Urbanek in kurzer Folge bereits der dritte Mitarbeiter am Lehrstuhl Unwin, dessen Entwicklung von der American Statistical Association ausgezeichnet wird. Silvia Winkler zählte vor zwei Jahren mit ihrer Software CASSATT zu den ersten Gewinnerinnen des John Chambers Statistical Software Award. Im selben Jahr wurde ihre Kollegin und MANET-Entwicklerin Heike Hoffmann mit einem Preis bei der ASA Student Paper Competition ausgezeichnet (siehe UniPresseDienst 40/00).

Simon Urbanek, 1976 in Brünn (Tschechische Republik) geboren, hat 1997 am Augsburger Holbein-Gymnasium sein Abitur gemacht und vier Jahre später an der Universität Augsburg sein Studium abgeschlossen. Partiell ist KLIMT aus seiner Diplomarbeit über „Visualization and Analysis of Statistical Trees“ hervorgegangen. Derzeit ist Urbanek Doktorand bei Professor Unwin und forscht über „Interaktive Modellvergleiche“, wobei es im Prinzip um die Weiterentwicklung seiner Methoden für mehrere Modelle und deren Analyse geht.

Im Sommer wird Simon Urbanek jetzt allerdings erst einmal zu den „Joint Statistical Meetings“ (JSM) in die USA reisen, um dort den Preis überreicht zu bekommen. Die Einladung zu der Jahrestagung aller amerikanischen Statistischen Gesellschaften (inklusive einer Übernahme der Reise- und Aufenthaltskosten) ist Bestandteil des mit 1000 Dollar dotierten Chambers Software Award.

KONTAKT UND WEITERE INFORMATIONEN:

Simon Urbanek, c/o Lehrstuhl für Rechnerorientierte Statistik und Datenanalyse, Universität Augsburg, 86135 Augsburg, Telefon 0821/598-2236, e-mail: simon.urbanek@math.uni-augsburg.de

Alle Nachrichten aus der Kategorie: Förderungen Preise

Zurück zur Startseite

Kommentare (0)

Schreiben Sie einen Kommentar

Neueste Beiträge

Erstmals 6G-Mobilfunk in Alpen getestet

Forschende der Universität Stuttgart erzielen leistungsstärkste Verbindung. Notrufe selbst in entlegenen Gegenden absetzen und dabei hohe Datenmengen in Echtzeit übertragen? Das soll möglich werden mit der sechsten Mobilfunkgeneration – kurz…

Neues Sensornetzwerk registriert ungewöhnliches Schwarmbeben im Vogtland

Das soeben fertig installierte Überwachungsnetz aus seismischen Sensoren in Bohrlöchern zeichnete Tausende Erdbebensignale auf – ein einzigartiger Datensatz zur Erforschung der Ursache von Schwarmbeben. Seit dem 20. März registriert ein…

Bestandsmanagement optimieren

Crateflow ermöglicht präzise KI-basierte Nachfrageprognosen. Eine zentrale Herausforderung für Unternehmen liegt darin, Über- und Unterbestände zu kontrollieren und Lieferketten störungsresistent zu gestalten. Dabei helfen Nachfrage-Prognosen, die Faktoren wie Lagerbestände, Bestellmengen,…

Partner & Förderer