Forum für Wissenschaft, Industrie und Wirtschaft

Hauptsponsoren:     3M 
Datenbankrecherche:

 

Damit die Suche im World Wide Web schneller und präziser wird

13.06.2012
Bayreuther Informatiker erhöhen die Effizienz der Abfragesprache SPARQL

Die meisten Internet-Nutzer erleben das World Wide Web als unerschöpfliche Fundgrube für Informationen und Unterhaltung. Was aber dabei nur wenigen bewusst ist: Hinter allen Texten, Bildern und Musikstücken steht ein hochkomplexes System von Dateiformaten, Programmen und Abfragesprachen.

Weltweit arbeiten Mathematiker und Informatiker daran, diese formalen Grundlagen im Interesse der Internet-Nutzer weiterzuentwickeln. Zu ihnen gehören auch Prof. Dr. Wim Martens, Professor für Theoretische Informatik an der Universität Bayreuth, und seine Doktorandin Dipl.-Inf. Katja Losemann. In der noch jungen Abfragesprache SPARQL haben sie Schwachstellen entdeckt, die den Umgang mit großen Datenmengen verlangsamen und die schnelle, zielgenaue Suche im Internet behindern.

Dem World Wide Web Consortium (W3C) haben sie bereits einen Vorschlag unterbreitet, wie dieses Problem beseitigt werden sollte. Eine Konferenz in Arizona/USA bot den Informatikern aus Bayreuth kürzlich die Gelegenheit, ihre Ideen zur Web-Optimie-rung der internationalen Fachwelt vorzustellen.

SPARQL ist seit 2008 eine vom W3C empfohlene Abfragesprache. Sie ermöglicht die Verarbeitung spezieller Daten, die das World Wide Web besser strukturieren: und zwar dadurch, dass sie Informationsquellen aller Art unter formalen Aspekten kenntlich machen. Dies geschieht mithilfe des Resource Description Framework (RDF), eines Regelwerks, das für die formale Beschreibung von Informationsquellen die einzuhaltenden Standards definiert. Es verhält sich wie mit den Büchern in einer großen Bibliothek. Diese werden viel leichter auffindbar, wenn Informationen über Autoren, Titel und Erscheinungsdatum sowie weitere Schlagworte auf standardisierte Weise in einer Kartei erfasst werden. In ähnlicher Weise – nur auf einem viel höheren Abstraktionsgrad – helfen die mithilfe des RDF erzeugten Daten, Informationsquellen im World Wide Web zugänglich zu machen. Um diese Daten verarbeiten zu können, wurde SPARQL entwickelt. Die neue Sprache kommt heute bei vielen Web-Recherchen zum Einsatz, ohne dass die Nutzer etwas davon bemerken.

Prof. Dr. Wim Martens und Katja Losemann haben nun herausgefunden, dass SPARQL in mancher Hinsicht kontraintuitiv ist. Die Sprache ist anders konstruiert, als mathematisch geschulte Anwender es erwarten würden. Zudem konnten sie nachweisen, dass SPARQL teilweise ineffizient arbeitet. Es dauert in einigen Fällen ungewöhnlich lange, um mittels einfacher, in SPARQL verfasster Programme eine geringe Anzahl von Bytes zu verarbeiten. Und sobald es um Datenmengen im Terabyte-Bereich geht, was bei großen Datenbanken durchaus üblich ist, entstehen sogar mit Hochleistungsrechnern extrem lange Wartezeiten von mehreren Jahren.

„Mit theoretischen Analysen und empirischen Tests ist uns der Beweis gelungen, dass diese Ineffizienz nicht durch eine falsche oder ungeschickte Programmierung zustande kommt“, erklärt Martens. „Die Ursache liegt vielmehr in der Abfragesprache SPARQL selbst, genauer gesagt: in einem Feature, das erst 2010 eingeführt wurde. Das W3C hat dieses Feature bisher nicht als Standard eingeführt. Und so bestand für uns die Chance, mit einem Optimierungsvorschlag noch rechtzeitig in die weitere Entwicklung einzugreifen.“ Die Zusammenarbeit mit Katja Losemann führte in kurzer Zeit zu einem Vorschlag, der die entdeckten Schwachstellen beseitigt. „Wir sind optimistisch, dass das W3C auf unsere Anregungen aufgeschlossen reagieren wird“, meint die Bayreuther Doktorandin. „Denn der normale Internet-Nutzer, der schnelle und präzise Antworten auf seine Suchanfragen erwartet, wird mit hoher Wahrscheinlichkeit davon profitieren – insbesondere dann, wenn SPARQL und die durch RDF definierten Standards sich im Web weiter durchsetzen.“

Ihren Optimierungsvorschlag haben die Bayreuther Informatiker mit Kollegen an der Universität von Chile und der Päpstlichen Katholischen Universität von Chile – beide in der Hauptstadt Santiago – abgestimmt. Dort hatten sich drei Forscher ebenfalls intensiv mit SPARQL befasst und waren dabei auf die gleichen Probleme gestoßen. „Dass zwei voneinander unabhängige Forschungsteams denselben Optimierungsvorschlag einbringen, wird die Erfolgsaussichten beim World Wide Web Consortium erhöhen“, glaubt Martens, der sich auch in seinen künftigen Forschungsarbeiten für Verbesserungen im World Wide Web engagieren will.

Veröffentlichung:
Katja Losemann, Wim Martens: The complexity of evaluating path expressions in SPARQL,
in: PODS '12 Proceedings of the 31st Symposium on Principles of Database Systems, Association for Computing Machinery (ACM), New York 2012, pp. 101-112

DOI (Link): 10.1145/2213556.2213573

Kontaktadresse:
Prof. Dr. Wim Martens
Theoretische Informatik
Universität Bayreuth
D-95540 Bayreuth
Tel.: +49 (0)921 55 7750
E-Mail: wim.martens@uni-bayreuth.de
Text und Redaktion:
Christian Wißler M.A.
Stabsstelle Presse, Marketing und Kommunikation Universität Bayreuth
D-95440 Bayreuth
Tel.: 0921 / 55-5356 / Fax: 0921 / 55-5325
E-Mail: mediendienst-forschung@uni-bayreuth.de

Christian Wißler | Universität Bayreuth
Weitere Informationen:
http://www.uni-bayreuth.de

Weitere Nachrichten aus der Kategorie Informationstechnologie:

nachricht Wissenschaftler beleuchten aktuellen Stand der Anwendung des Maschinenlernens bei Forschung an aktiven Materialien
27.02.2020 | Universität Leipzig

nachricht Plasmonen im atomaren Flachland
25.02.2020 | Max-Planck-Institut für Struktur und Dynamik der Materie

Alle Nachrichten aus der Kategorie: Informationstechnologie >>>

Die aktuellsten Pressemeldungen zum Suchbegriff Innovation >>>

Die letzten 5 Focus-News des innovations-reports im Überblick:

Im Focus: Wiegende Halme auf der Handwerksmesse München

Talente-Sonderschau: Architekturstudenten der HTWK Leipzig zeigen filigrane Skulptur aus Strohhalmen – dahinter steckt eine Konstruktionsidee für organisch gekrümmte Fassaden

Swaying Straws (Wiegende Halme) heißt die Skulptur, die die zwei Architekturstudenten Fabian Eidner und Theodor Reinhardt von der Hochschule für Technik,...

Im Focus: Wissenschaftler beleuchten aktuellen Stand der Anwendung des Maschinenlernens bei Forschung an aktiven Materialien

Verfahren des Maschinenlernens haben durch die Verfügbarkeit von enormen Datenmengen in den vergangenen Jahren einen großen Zuwachs an Anwendungen in vielen Gebieten erfahren: vom Klassifizieren von Objekten, über die Analyse von Zeitreihen bis hin zur Kontrolle von Computerspielen und Fahrzeugen. In einem aktuellen Review in der Zeitschrift „Nature Machine Intelligence“ beleuchten Autoren der Universitäten Leipzig und Göteborg den aktuellen Stand der Anwendung und Anwendungsmöglichkeiten des Maschinenlernens im Bereich der Forschung an aktiven Materialien.

Als aktive Materialien bezeichnet man Systeme, die durch die Umwandlung von Energie angetrieben werden. Bestes Beispiel für aktive Materialien sind biologische...

Im Focus: Computersimulationen stellen bildlich dar, wie DNA erkannt wird, um Zellen in Stammzellen umzuwandeln

Forscher des Hubrecht-Instituts (KNAW - Niederlande) und des Max-Planck-Instituts in Münster haben entdeckt, wie ein essentielles Protein bei der Umwandlung von normalen adulten humanen Zellen in Stammzellen zur Aktivierung der genomischen DNA beiträgt. Ihre Ergebnisse werden im „Biophysical Journal“ veröffentlicht.

Die Identität einer Zelle wird dadurch bestimmt, ob die DNA zu einem beliebigen Zeitpunkt „gelesen“ oder „nicht gelesen“ wird. Die Signalisierung in der Zelle,...

Im Focus: Bayreuther Hochdruck-Forscher entdecken vielversprechendes Material für Informationstechnologien

Forscher der Universität Bayreuth haben ein ungewöhnliches Material entdeckt: Bei einer Abkühlung auf zwei Grad Celsius ändern sich seine Kristallstruktur und seine elektronischen Eigenschaften abrupt und signifikant. In diesem neuen Zustand lassen sich die Abstände zwischen Eisenatomen mithilfe von Lichtstrahlen gezielt verändern. Daraus ergeben sich hochinteressante Anwendungsmöglichkeiten im Bereich der Informationstechnologien. In der Zeitschrift „Angewandte Chemie – International Edition“ stellen die Wissenschaftler ihre Entdeckung vor. Die neuen Erkenntnisse sind aus einer engen Zusammenarbeit mit Partnereinrichtungen in Augsburg, Dresden, Hamburg und Moskau hervorgegangen.

Bei dem ungewöhnlichen Material handelt es sich um ein Eisenoxid mit der Zusammensetzung Fe₅O₆. In einem Hochdrucklabor des Bayerischen Geoinstituts (BGI),...

Im Focus: Von China an den Südpol: Mit vereinten Kräften dem Rätsel der Neutrinomassen auf der Spur

Studie von Mainzer Physikern zeigt: Experimente der nächsten Generation versprechen Antworten auf eine der aktuellsten Fragen der Neutrinophysik

Eine der spannendsten Herausforderungen der modernen Physik ist die Ordnung oder Hierarchie der Neutrinomassen. Eine aktuelle Studie, an der Physiker des...

Alle Focus-News des Innovations-reports >>>

Anzeige

Anzeige

VideoLinks
Industrie & Wirtschaft
Veranstaltungen

Hate Speech bis KI: Online-Forscher_innen aus aller Welt treffen sich zur General Online Research an der HTW Berlin

28.02.2020 | Veranstaltungen

CLIMATE2020 – Weltweite Online-Klimakonferenz vom 23. bis 30. März 2020

26.02.2020 | Veranstaltungen

Automatisierung im Dienst des Menschen

25.02.2020 | Veranstaltungen

VideoLinks
Wissenschaft & Forschung
Weitere VideoLinks im Überblick >>>
 
Aktuelle Beiträge

Asteroid in eiserner Rüstung

28.02.2020 | Geowissenschaften

Hate Speech bis KI: Online-Forscher_innen aus aller Welt treffen sich zur General Online Research an der HTW Berlin

28.02.2020 | Veranstaltungsnachrichten

UV-Licht gegen störenden Unterwasserbewuchs – Innovatives Antifouling-System des IOW jetzt reif für Serienproduktion

28.02.2020 | Energie und Elektrotechnik

Weitere B2B-VideoLinks
IHR
JOB & KARRIERE
SERVICE
im innovations-report
in Kooperation mit academics