Anzeige
Being able to recognise and make use of such patterns is lucrative business for companies. Edgar de Graaf discovered that interesting patterns often contain a time aspect. Jeroen De Knijf developed methods to detect relevant patterns quicker.
In subject jargon it is called data mining: looking for interesting relationships within large quantities of data. Many data-mining programs produce a flood of potentially interesting patterns: as a user, how can you then find what you are looking for? Furthermore, the files are not always set up for such search actions, as is the case on the Internet or for instance in bioinformatics. It usually concerns semi-structured files: they often contain, for example, hyperlinks to other files, and contain (partial) information in a range of formats, such as text, images and sound.
MISTA project
Edgar de Graaf and Jeroen De Knijf both worked within the NWO-funded MISTA project (Mining in Semi-Structured Data) on methods to find patterns more quickly and effectively within large quantities of semi-structured data. De Graaf discovered that some patterns are interesting because they occur in quick succession. Other patterns are striking because, for example, they occur weekly. According to De Graaf, this time aspect merits further investigation.
The patterns can best be presented visually so that the user can find the information sought at a single glance. To realise this De Graaf described various ways of presenting different types of information.
Wikipedia compressed
De Knijf demonstrated that the number of patterns can be drastically reduced by allowing the user to indicate in advance the minimum requirements that a pattern must satisfy. This allows the data-mining program to find the interesting patterns much faster.
A second method De Knijf devised to reduce the number of results is the compression of the entire collection of documents (for example, Wikipedia pages) into a single document. By building accurate models that only make use of the compressed document, De Knijf was able to demonstrate that this summary does indeed contain the essential information from the entire collection.
The research was funded from the Open Competition 2003 of NWO Physical Sciences.
Kim van den Wijngaard | Quelle: alphagalileo
Weitere Informationen: www.nwo.nl/nwohome.nsf/pages/NWOA_7KTJEC_Eng
Weitere Berichte zu: data-mining programs > large quantities of data > semi-structured data > websurfer > Wikipedia
Robotics: Gesturing for control
24.05.2012 | The Agency for Science, Technology and Research (A*STAR)
Researchers take virus-tracking software worldwide
23.05.2012 | Ohio Supercomputer Center
Krankheiten wie Parkinson, Alzheimer und bestimmte Krebsformen gehen auf eine fehlerhafte Faltung und Aggregation von Eiweißen im Körper zurück.
Wissenschaftlern des Instituts für Photonische Technologien (IPHT) in Jena ist es erstmals gelungen, Proteinstrukturen auf sub-molekularer Ebene nachzuweisen und spektroskopisch zu analysieren. Ein wichtiger Schritt zum Verständnis der Krankheitsursachen.
„Bis heute hat man nicht genau verstanden, was die fehlerhafte Faltung und Aggregation von Eiweißen, zum Beispiel im Zusammenhang mit Alzheimer, ...
Die Quantenphysik beschreibt physikalische Vorgänge in Festkörpern und anderen Vielteilchensystemen auch mit Hilfe von Quasiteilchen.
Innsbrucker Physikern um Rudolf Grimm ist es nun erstmals gelungen, ein neues Quasiteilchen - ein repulsives Polaron - in einem Quantengas experimentell zu erzeugen. Die Forscher berichten darüber in der Online-Ausgabe der Fachzeitschrift Nature.
Ultrakalte Quantengase sind ein ideales Experimentierfeld, um physikalische Phänomene in Festkörpern zu simulieren. Unter streng kontrollierten Bedingungen ...
Licht lässt die Partikel in der Atmosphäre wachsen. In einem Experiment hat ein internationales Forscherteam erstmals einen neuen Mechanismus nachweisen können, bei dem Partikel durch Licht größer werden und der damit Einfluss auf die Wolkenbildung und das Klima hat.
Photokatalytische Reaktionen können zu einer schnellen Bindung von nicht kondensierenden flüchtigen organischen Kohlenwasserstoffen (VOCs) auf der Oberfläche der Partikel führen. Unter solchen Bedingungen nehme die Größe und Masse der Partikel schnell zu, schreiben die Wissenschaftler im renommierten Fachblatt PNAS.
Die Ergebnisse des Laborexperimentes könnten Effekte erklären, die bisher schon bei Feldkampagnen ...
Ähnlich wie blutsaugende Insekten prüfen Pflanzenschädlinge ihren Wirt auf Abwehrsignale, bevor sie anfangen zu fressen
Pflanzen bilden wenige Minuten nach Angriff eines Fraßfeindes Jasmonsäure, ein Hormon, das die Verteidigung gegen Insekten in Gange setzt mit der Folge, dass giftige Stoffe wie Nikotin oder Verdauungshemmer in den Blättern akkumulieren.
Wissenschaftler des Max-Planck-Instituts für chemische Ökologie, Jena, haben jetzt herausgefunden, dass Zwergzikaden die Verteidigungsbereitschaft von Tabakpflanzen aufspüren können. ...
Wissenschaftlern vom Institut für Physikalische und Theoretische Chemie der Universität Bonn ist es erstmals gelungen, den Transport eines wichtigen Informationsträgers in biologischen Zellen praktisch unmodifiziert in Echtzeit zu filmen.
Die Studie zeigt, wie die so genannte Boten-RNA die Zellkernhülle überwindet und vom Zellkern in das Zytoplasma gelangt. Diese Arbeit ist nun in dem renommierten Journal „Proceedings of the National Academy of Sciences of the USA“ (PNAS) publiziert.
Der Bauplan aller Lebewesen ist in ihrem Erbgut gespeichert. Dieses lagert bei höheren ...
Anzeige
Anzeige

Energieversorger vor dem Umbruch
24.05.2012 | Studien Analysen
Stem-cell-growing surface enables bone repair
24.05.2012 | Biowissenschaften Chemie
Im wahrsten Sinne „Spitzenforschung“: IPHT-Forscher untersuchen Eiweißfasern mit größter Genauigkeit
24.05.2012 | Biowissenschaften Chemie
NieKE Themenforum: Ökonomie - Tierschutz - Lebensmittelsicherheit
24.05.2012 | Veranstaltungsnachrichten
Nachhaltigkeit in der Schifffahrt: Werte vs. Wertschöpfung
24.05.2012 | Veranstaltungsnachrichten
Wissenschaft und Öffentlichkeit
24.05.2012 | Veranstaltungsnachrichten