Forum für Wissenschaft, Industrie und Wirtschaft

Hauptsponsoren:     3M 
Datenbankrecherche:

 

Damit die Suche im World Wide Web schneller und präziser wird

13.06.2012
Bayreuther Informatiker erhöhen die Effizienz der Abfragesprache SPARQL

Die meisten Internet-Nutzer erleben das World Wide Web als unerschöpfliche Fundgrube für Informationen und Unterhaltung. Was aber dabei nur wenigen bewusst ist: Hinter allen Texten, Bildern und Musikstücken steht ein hochkomplexes System von Dateiformaten, Programmen und Abfragesprachen.

Weltweit arbeiten Mathematiker und Informatiker daran, diese formalen Grundlagen im Interesse der Internet-Nutzer weiterzuentwickeln. Zu ihnen gehören auch Prof. Dr. Wim Martens, Professor für Theoretische Informatik an der Universität Bayreuth, und seine Doktorandin Dipl.-Inf. Katja Losemann. In der noch jungen Abfragesprache SPARQL haben sie Schwachstellen entdeckt, die den Umgang mit großen Datenmengen verlangsamen und die schnelle, zielgenaue Suche im Internet behindern.

Dem World Wide Web Consortium (W3C) haben sie bereits einen Vorschlag unterbreitet, wie dieses Problem beseitigt werden sollte. Eine Konferenz in Arizona/USA bot den Informatikern aus Bayreuth kürzlich die Gelegenheit, ihre Ideen zur Web-Optimie-rung der internationalen Fachwelt vorzustellen.

SPARQL ist seit 2008 eine vom W3C empfohlene Abfragesprache. Sie ermöglicht die Verarbeitung spezieller Daten, die das World Wide Web besser strukturieren: und zwar dadurch, dass sie Informationsquellen aller Art unter formalen Aspekten kenntlich machen. Dies geschieht mithilfe des Resource Description Framework (RDF), eines Regelwerks, das für die formale Beschreibung von Informationsquellen die einzuhaltenden Standards definiert. Es verhält sich wie mit den Büchern in einer großen Bibliothek. Diese werden viel leichter auffindbar, wenn Informationen über Autoren, Titel und Erscheinungsdatum sowie weitere Schlagworte auf standardisierte Weise in einer Kartei erfasst werden. In ähnlicher Weise – nur auf einem viel höheren Abstraktionsgrad – helfen die mithilfe des RDF erzeugten Daten, Informationsquellen im World Wide Web zugänglich zu machen. Um diese Daten verarbeiten zu können, wurde SPARQL entwickelt. Die neue Sprache kommt heute bei vielen Web-Recherchen zum Einsatz, ohne dass die Nutzer etwas davon bemerken.

Prof. Dr. Wim Martens und Katja Losemann haben nun herausgefunden, dass SPARQL in mancher Hinsicht kontraintuitiv ist. Die Sprache ist anders konstruiert, als mathematisch geschulte Anwender es erwarten würden. Zudem konnten sie nachweisen, dass SPARQL teilweise ineffizient arbeitet. Es dauert in einigen Fällen ungewöhnlich lange, um mittels einfacher, in SPARQL verfasster Programme eine geringe Anzahl von Bytes zu verarbeiten. Und sobald es um Datenmengen im Terabyte-Bereich geht, was bei großen Datenbanken durchaus üblich ist, entstehen sogar mit Hochleistungsrechnern extrem lange Wartezeiten von mehreren Jahren.

„Mit theoretischen Analysen und empirischen Tests ist uns der Beweis gelungen, dass diese Ineffizienz nicht durch eine falsche oder ungeschickte Programmierung zustande kommt“, erklärt Martens. „Die Ursache liegt vielmehr in der Abfragesprache SPARQL selbst, genauer gesagt: in einem Feature, das erst 2010 eingeführt wurde. Das W3C hat dieses Feature bisher nicht als Standard eingeführt. Und so bestand für uns die Chance, mit einem Optimierungsvorschlag noch rechtzeitig in die weitere Entwicklung einzugreifen.“ Die Zusammenarbeit mit Katja Losemann führte in kurzer Zeit zu einem Vorschlag, der die entdeckten Schwachstellen beseitigt. „Wir sind optimistisch, dass das W3C auf unsere Anregungen aufgeschlossen reagieren wird“, meint die Bayreuther Doktorandin. „Denn der normale Internet-Nutzer, der schnelle und präzise Antworten auf seine Suchanfragen erwartet, wird mit hoher Wahrscheinlichkeit davon profitieren – insbesondere dann, wenn SPARQL und die durch RDF definierten Standards sich im Web weiter durchsetzen.“

Ihren Optimierungsvorschlag haben die Bayreuther Informatiker mit Kollegen an der Universität von Chile und der Päpstlichen Katholischen Universität von Chile – beide in der Hauptstadt Santiago – abgestimmt. Dort hatten sich drei Forscher ebenfalls intensiv mit SPARQL befasst und waren dabei auf die gleichen Probleme gestoßen. „Dass zwei voneinander unabhängige Forschungsteams denselben Optimierungsvorschlag einbringen, wird die Erfolgsaussichten beim World Wide Web Consortium erhöhen“, glaubt Martens, der sich auch in seinen künftigen Forschungsarbeiten für Verbesserungen im World Wide Web engagieren will.

Veröffentlichung:
Katja Losemann, Wim Martens: The complexity of evaluating path expressions in SPARQL,
in: PODS '12 Proceedings of the 31st Symposium on Principles of Database Systems, Association for Computing Machinery (ACM), New York 2012, pp. 101-112

DOI (Link): 10.1145/2213556.2213573

Kontaktadresse:
Prof. Dr. Wim Martens
Theoretische Informatik
Universität Bayreuth
D-95540 Bayreuth
Tel.: +49 (0)921 55 7750
E-Mail: wim.martens@uni-bayreuth.de
Text und Redaktion:
Christian Wißler M.A.
Stabsstelle Presse, Marketing und Kommunikation Universität Bayreuth
D-95440 Bayreuth
Tel.: 0921 / 55-5356 / Fax: 0921 / 55-5325
E-Mail: mediendienst-forschung@uni-bayreuth.de

Christian Wißler | Universität Bayreuth
Weitere Informationen:
http://www.uni-bayreuth.de

Weitere Nachrichten aus der Kategorie Informationstechnologie:

nachricht Der Form eine Funktion verleihen
23.06.2017 | Institute of Science and Technology Austria

nachricht Zukunftstechnologie 3D-Druck: Raubkopien mit sicherem Lizenzmanagement verhindern
23.06.2017 | Universität Ulm

Alle Nachrichten aus der Kategorie: Informationstechnologie >>>

Die aktuellsten Pressemeldungen zum Suchbegriff Innovation >>>

Die letzten 5 Focus-News des innovations-reports im Überblick:

Im Focus: Can we see monkeys from space? Emerging technologies to map biodiversity

An international team of scientists has proposed a new multi-disciplinary approach in which an array of new technologies will allow us to map biodiversity and the risks that wildlife is facing at the scale of whole landscapes. The findings are published in Nature Ecology and Evolution. This international research is led by the Kunming Institute of Zoology from China, University of East Anglia, University of Leicester and the Leibniz Institute for Zoo and Wildlife Research.

Using a combination of satellite and ground data, the team proposes that it is now possible to map biodiversity with an accuracy that has not been previously...

Im Focus: Klima-Satellit: Mit robuster Lasertechnik Methan auf der Spur

Hitzewellen in der Arktis, längere Vegetationsperioden in Europa, schwere Überschwemmungen in Westafrika – mit Hilfe des deutsch-französischen Satelliten MERLIN wollen Wissenschaftler ab 2021 die Emissionen des Treibhausgases Methan auf der Erde erforschen. Möglich macht das ein neues robustes Lasersystem des Fraunhofer-Instituts für Lasertechnologie ILT in Aachen, das eine bisher unerreichte Messgenauigkeit erzielt.

Methan entsteht unter anderem bei Fäulnisprozessen. Es ist 25-mal wirksamer als das klimaschädliche Kohlendioxid, kommt in der Erdatmosphäre aber lange nicht...

Im Focus: Climate satellite: Tracking methane with robust laser technology

Heatwaves in the Arctic, longer periods of vegetation in Europe, severe floods in West Africa – starting in 2021, scientists want to explore the emissions of the greenhouse gas methane with the German-French satellite MERLIN. This is made possible by a new robust laser system of the Fraunhofer Institute for Laser Technology ILT in Aachen, which achieves unprecedented measurement accuracy.

Methane is primarily the result of the decomposition of organic matter. The gas has a 25 times greater warming potential than carbon dioxide, but is not as...

Im Focus: How protons move through a fuel cell

Hydrogen is regarded as the energy source of the future: It is produced with solar power and can be used to generate heat and electricity in fuel cells. Empa researchers have now succeeded in decoding the movement of hydrogen ions in crystals – a key step towards more efficient energy conversion in the hydrogen industry of tomorrow.

As charge carriers, electrons and ions play the leading role in electrochemical energy storage devices and converters such as batteries and fuel cells. Proton...

Im Focus: Die Schweiz in Pole-Position in der neuen ESA-Mission

Die Europäische Weltraumagentur ESA gab heute grünes Licht für die industrielle Produktion von PLATO, der grössten europäischen wissenschaftlichen Mission zu Exoplaneten. Partner dieser Mission sind die Universitäten Bern und Genf.

Die Europäische Weltraumagentur ESA lanciert heute PLATO (PLAnetary Transits and Oscillation of stars), die grösste europäische wissenschaftliche Mission zur...

Alle Focus-News des Innovations-reports >>>

Anzeige

Anzeige

IHR
JOB & KARRIERE
SERVICE
im innovations-report
in Kooperation mit academics
Veranstaltungen

Von Batterieforschung bis Optoelektronik

23.06.2017 | Veranstaltungen

10. HDT-Tagung: Elektrische Antriebstechnologie für Hybrid- und Elektrofahrzeuge

22.06.2017 | Veranstaltungen

„Fit für die Industrie 4.0“ – Tagung von Hochschule Darmstadt und Schader-Stiftung am 27. Juni

22.06.2017 | Veranstaltungen

 
VideoLinks
B2B-VideoLinks
Weitere VideoLinks >>>
Aktuelle Beiträge

Radioaktive Elemente in Cassiopeia A liefern Hinweise auf Neutrinos als Ursache der Supernova-Explosion

23.06.2017 | Physik Astronomie

Dünenökosysteme modellieren

23.06.2017 | Ökologie Umwelt- Naturschutz

Makro-Mikrowelle macht Leichtbau für Luft- und Raumfahrt effizienter

23.06.2017 | Materialwissenschaften