Forum für Wissenschaft, Industrie und Wirtschaft

Hauptsponsoren:     3M 
Datenbankrecherche:

 

Die Zukunft des Semantic Web

09.11.2004


Die Klasse, nicht die Masse von Informationen ist heute für das Erlangen von Wettbewerbsvorteilen erfolgskritisch. Immer schwerer gestaltet sich jedoch angesichts von mittlerweile über 10 Milliarden Web-Sites der Zugang zu den meist unstrukturierten Inhalten des World Wide Web. Suchmaschinen reagieren auf eine Anfrage oft genug mit Tausenden von „Treffern“. Der Zenit klassischer Volltextsuche à la Google, Altavista oder Lycos ist überschritten. Mit dem „Semantic Web“ malt die Vision des WWW-Architekten Tim Berners-Lee deswegen die Zukunft eines nahezu Datenbank-ähnlichen Zuganges zu den Informationsräumen des weltweiten Netzwerkes. Durch das Hinzufügen semantisch aussagekräftiger Informationen sollen sämtliche WWW-Inhalte für den komfortablen Datenzugriff bereit stehen. Hierfür wurden bereits eine Reihe von Web-Standards vorgeschlagen. Mit ihnen soll die Bedeutung von Informationen auf eine standardisierte Weise beschrieben werden. Diese durch Metadaten hoher Qualität angereicherten Internet-Inhalte sollen so maschinell auswertbar werden.

... mehr zu:
»MAP »Metadaten »Semantic »Topic

Dublin Core beispielsweise ist eine Initiative zur Definition standardisierter Basis-Metadaten wie beispielsweise „Autor“. Damit ähnelt das Internet sozusagen einem klassifizierten Dokumentenbestand in einem Dokumentenmanagement-System. Beim Resource Description Framework (RDF) handelt es sich hingegen um eine allgemeine XML-Notation, die das Definieren von Metadaten erlaubt. Somit ist es möglich, eigene Metadatentypen zu erstellen und in einer einheitlichen Syntax zu beschreiben. Mit Topic Maps können nicht nur Metadaten, sondern ganze Zusammenhänge und Modelle dargestellt werden. Kennt man beispielsweise nur die Sowjetunion, kann man dennoch auch Dokumente aus Russland finden, da die Beziehung in den Daten vermittelt wird. Die Web Ontology Language (OWL) schließlich erlaubt dem Anwender nicht nur dieses Schlussfolgern, also den Schluß, dass Russland und die Sowjetunion in Beziehung stehen, sondern ermöglicht auch den Einsatz von Schlußfolgerungssystemen.

Produkte und Technologien auf Basis von Topic Maps


Erst kürzlich verabschiedete das World Wide Web Consortium (W3C) RDF und OWL als Standards. Für eine Prognose über ihren zukünftigen Praxisnutzen erscheint es sinnvoll, die inzwischen 5jährigen Erfahrungen mit dem Topic Map-Standard zu betrachten. Es zeigt sich, dass die Fortschritte trotz aller Bemühungen bis heute recht verhalten sind. Für einen Erklärungsversuch ist es hilfreich, auch den Micro-Kosmos von Unternehmen zu beleuchten. In betrieblichen Intranets stellen sich nämlich ganz ähnliche Aufgaben. Auch hier geht es um den Zugriff auf Dokumenteninhalte.

In Deutschland gibt es derzeit etwa 100 Installationen von Systemen, welche die Topic Map Technologie adaptieren. Im deutschsprachigen Raum sind dies u.a. Empolis, Moresophy, Intelligent Views, USU oder auch Ontopia. Sieht man genauer hin, wird man feststellen, dass kaum einer der Hersteller sich in seinen Funktionen an den vorgegebenen Standard hält. Die meisten Produkte haben Semantic Web-Komponenten sozusagen versteckt unter der Haube. Einige Hersteller entwickelten ihre Produkte auf der Basis bestehender Anforderungen und glichen die Funktionen dann mit dem Standard ab. Die Folge war eine unterschiedliche Spezialisierung. So stellt beispielsweise K-Infinity von Intelligent Views eine Art Objektorientierte Datenbank dar. Dabei sind die Dokumente Objekte, die in viele Beziehungen gebracht werden können. Auf dieses Beziehungsnetz kann man grafisch zugreifen. Einsatz findet ein derartiges System dann, wenn man rasch in Dokumentenbeständen navigieren will und transitive Abhängigkeiten verwertet werden sollen. Lautet die Frage z.B., in welchem Kundenprojekt ein spezielles Produkt zum Einsatz kam, so findet das System entsprechende Inhalte, auch wenn in der Projekt-Dokumentation lediglich ein Modul dieses Produktes angeführt wird.

Der USU KnowledgeMiner nutzt Topic Maps hingegen vor allem zur Suche in Dokumenten. Statt der Dokumente werden Konzepte vernetzt, mit deren Hilfe ein Suchstring generiert wird, den das System wiederum an eine Metasuchmaschine sendet. Die Erstellung des Wissensnetzes ist für die Kunden ein Zusatzaufwand. Folgerichtig geht der Hersteller den Weg, Wissensnetze automatisch zu erstellen und selbstlernende Mechanismen zu integrieren. Zudem werden nicht nur erfolgreich beantwortete Fragen abgelegt, sondern auch Personen oder Rollen aufgeführt, die sich für spezifische Themen interessieren. Praktische Anwendung findet ein solches Werkzeug schwerpunktmäßig in HelpDesks oder CallCentern. Durch die Möglichkeit, auch auf operative Datenbanken zuzugreifen, kommt es auch in Entwicklungs- und Qualitätssicherungsabteilungen zum Einsatz. Als drittes Beispiel sei noch auf Ontoprise verwiesen. Abhängigkeiten, Beziehungen, aber auch Regeln und Bedingungen spiegeln sich in den Ontoprise-Wissensnetzen. Die Technologie wertet die entsprechend komplexen Netzwerkinhalte aus. Beispielprojekte finden sich in der Prototypenentwicklung. Hier können Abhängigkeiten von sich häufig ändernden Bauteilen dynamisch abgebildet und verwertet werden. Andere Anbieter starteten zwar nach der Veröffentlichung des Standards, verfolgen jedoch ebenfalls sehr ausgeprägt eigene Ideen und Anforderungen. Interessanterweise sind Praxisprojekte mit Topic Map-Produkten, sie sich strikt am Standard ausrichten, in nennenswerter Zahl nicht auszumachen.

Die Praxis-Hürden

Aus den erfolgreichen Projekten in diesem Umfeld stammen die Erfahrungen für einige zentrale Herausforderungen, denen sich Organisationen, Hersteller, Berater und Kunden stellen müssen. Dies gilt parallel auch für das Semantic Web. Einige Aspekte seien genannt.

Die semantische Unschärfe

Alle semantischen Techniken formulieren so genannte Konzepte, also begrifflich adressierbare Einheiten der Erlebens- oder Vorstellungswelt. Entsprechend versuchen alle Modelle, diese Konzepte in Beziehung und Zusammenhang zu setzen, um damit Ausschnitte der Welt zu beschreiben. Die Schwierigkeit besteht darin, dass Klassen und Begriffe, ja jede sprachliche Beschreibung per se unscharf ist. Sind nun DDR und BRD zeitliche Nachfolger Deutschlands? Ist eine solche Nachfolge analog jener der Tschechischen und Slowakischen Republik im Falle der Tschechoslowakei? Man sieht, jede sprachliche oder formale Beschreibung vereinfacht und ist dadurch nicht präzise. Das aber macht es sehr schwierig, gemeinsam genutzte Metadaten zu formulieren.

Die Unvollständigkeit

Bringt man die Konzepte und ihre Zusammenhänge zum Ausdruck, beschreibt beispielsweise die Beziehungen zwischen den Ländern, so bleibt immer unklar, welche Bedeutung eine fehlende Beziehung oder ein fehlendes Konzept hat. Ist die Existenz nicht bekannt, gleichgültig oder nicht gegeben?

Es bleibt für den Anwender deswegen nicht nachvollziehbar, ob das Modell vollständig ist oder nicht. Innerbetrieblich sind semantische Modelle meist nur dann erfolgreich, wenn sie zwar nur einen sehr begrenzten Abschnitt repräsentieren, diesen aber klar und vollständig.

Die Subjektivität

Ob nun Russland ein Nachfolger der Sowjetunion ist oder ob diese Rolle besser der GUS zugebilligt werden sollte, ist nicht nur wahr oder falsch sondern hängt auch vom Blickwinkel und Fragekontext ab. Auch hier zeigt die innerbetriebliche Erfahrung, dass Metadaten stets aus einem einheitlichen, klaren Blickwinkel für eine klare Aufgabe und Zielgruppe erstellt werden müssen.

Das fehlenden Businessmodell

Unbestritten profitieren viele Anwender von der Existenz von Metadaten. In aller Regel sind sie jedoch nicht bereit, für deren Nutzung zu zahlen. Dadurch entsteht das Problem, dass sich niemand findet, der die Fülle aussagekräftiger Metadaten pflegt, da niemand bereit ist, diesen Aufwand zu bezahlen. Lohnenswert erscheinen also Überlegungen, wie ein Geschäftsmodell für die Erstellung und den Betrieb von Metadaten aussehen könnte.

Selbstlernen als Lösung?

Einen Lösungsansatz der für das Intranet skizzierten Herausforderungen stellt nach den Erfahrungen der letzten Jahre der Einsatz selbstlernender Verfahren dar. Entscheidend ist, dass diese keinen manuellen Aufwand verursachen. Damit fallen für die Erstellung der für das Semantic Web notwendigen Metadaten auch keine Kosten an. Und somit ist auch ein entsprechendes Businessmodell nicht notwendig. Durch das automatische Entwickeln von Metadaten können diese viel reichhaltiger sein und damit mehr als nur eine Perspektive repräsentieren - wichtige Voraussetzungen, um die Praxisschwierigkeiten mit der Unschärfe und der subjektiven Blickwinkel umgehen zu können. Bereits heute zeichnet sich ab, dass die Entwicklung in diese Richtung gehen wird: Bei Amazon beispielsweise wird der Vorschlag, beim Erwerb eines Buches auch ein anderes dazuzukaufen, durch die Analyse des Nutzungsverhaltens der entsprechenden Käufergruppe generiert. Aus der Häufigkeit der gewählten Kaufvarianten früherer Erwerber schlussfolgert das System einen thematischen Zusammenhang, sozusagen einen semantischen Zusammenhang der Web-Seiten. Aus der Interaktion mit den Anwendern heraus bietet auch Google auf Basis kollaborativer Mechanismen ohne hinterlegtes Wörterbuch eine automatische Rechtschreibkorrektur. Und nach dem Prinzip „Nutzer dieser Seite waren auch Nutzer der folgenden anderen Seiten“ ist es auch vorstellbar, dass im Internet einfach gefunden werden kann.

Ein Wehrmutstropfen bleibt: Auch ein selbstlernendes Verfahren ist nicht in der Lage, alle vorhandenen Beziehungen zu ermitteln. Das Problem der Unvollständigkeit bleibt. Gut möglich hingegen ist es, die relevanten, typischerweise genutzten Beziehungen zu repräsentieren - genau diese ergeben sich aus der Nutzung. Die Anwender stellen andere Anforderungen an ein selbstlernendes Verfahren, welches das „typische“ Wissen sammelt, als an ein administrativ gepflegtes, von dem man deklarative Vollständigkeit erwartet.

Insofern gibt es gute Gründe, anzunehmen, dass wir mittelfristig auch den „Ariadne-Faden“ nutzen können, der uns zielgerichtet durch das Labyrinth des WWW führt.

Harald Huber | USU AG
Weitere Informationen:
http://www.usu.de

Weitere Berichte zu: MAP Metadaten Semantic Topic

Weitere Nachrichten aus der Kategorie Informationstechnologie:

nachricht CrowdWater: eine App für die Hochwasser-Forschung
18.05.2018 | Universität Zürich

nachricht Hochautomatisiertes Sehen auf dem Prüfstand
17.05.2018 | FOKUS - Fraunhofer-Institut für Offene Kommunikationssysteme

Alle Nachrichten aus der Kategorie: Informationstechnologie >>>

Die aktuellsten Pressemeldungen zum Suchbegriff Innovation >>>

Die letzten 5 Focus-News des innovations-reports im Überblick:

Im Focus: Bose-Einstein-Kondensat im Riesenatom - Universität Stuttgart untersucht exotisches Quantenobjekt

Passt eine ultrakalte Wolke aus zehntausenden Rubidium-Atomen in ein einzelnes Riesenatom? Forscherinnen und Forschern am 5. Physikalischen Institut der Universität Stuttgart ist dies erstmals gelungen. Sie zeigten einen ganz neuen Ansatz, die Wechselwirkung von geladenen Kernen mit neutralen Atomen bei weitaus niedrigeren Temperaturen zu untersuchen, als es bisher möglich war. Dies könnte einen wichtigen Schritt darstellen, um in Zukunft quantenmechanische Effekte in der Atom-Ion Wechselwirkung zu studieren. Das renommierte Fachjournal Physical Review Letters und das populärwissenschaftliche Begleitjournal Physics berichteten darüber.*)

In dem Experiment regten die Forscherinnen und Forscher ein Elektron eines einzelnen Atoms in einem Bose-Einstein-Kondensat mit Laserstrahlen in einen riesigen...

Im Focus: Algorithmen für die Leberchirurgie – weltweit sicherer operieren

Die Leber durchlaufen vier komplex verwobene Gefäßsysteme. Die chirurgische Entfernung von Tumoren ist daher oft eine schwierige Aufgabe. Das Fraunhofer-Institut für Bildgestützte Medizin MEVIS hat Algorithmen entwickelt, die die Bilddaten von Patienten analysieren und chirurgische Risiken berechnen. Leberkrebsoperationen werden damit besser planbar und sicherer.

Jährlich erkranken weltweit 750.000 Menschen neu an Leberkrebs, viele weitere entwickeln Lebermetastasen aufgrund anderer Krebserkrankungen. Ein chirurgischer...

Im Focus: Positronen leuchten besser

Leuchtstoffe werden schon lange benutzt, im Alltag zum Beispiel im Bildschirm von Fernsehgeräten oder in PC-Monitoren, in der Wissenschaft zum Untersuchen von Plasmen, Teilchen- oder Antiteilchenstrahlen. Gleich ob Teilchen oder Antiteilchen – treffen sie auf einen Leuchtstoff auf, regen sie ihn zum Lumineszieren an. Unbekannt war jedoch bisher, dass die Lichtausbeute mit Elektronen wesentlich niedriger ist als mit Positronen, ihren Antiteilchen. Dies hat Dr. Eve Stenson im Max-Planck-Institut für Plasmaphysik (IPP) in Garching und Greifswald jetzt beim Vorbereiten von Experimenten mit Materie-Antimaterie-Plasmen entdeckt.

„Wäre Antimaterie nicht so schwierig herzustellen, könnte man auf eine Ära hochleuchtender Niederspannungs-Displays hoffen, in der die Leuchtschirme nicht von...

Im Focus: Erklärung für rätselhafte Quantenoszillationen gefunden

Sogenannte Quanten-Vielteilchen-„Scars“ lassen Quantensysteme länger außerhalb des Gleichgewichtszustandes verweilen. Studie wurde in Nature Physics veröffentlicht

Forschern der Harvard Universität und des MIT war es vor kurzem gelungen, eine Rekordzahl von 53 Atomen einzufangen und ihren Quantenzustand einzeln zu...

Im Focus: Explanation for puzzling quantum oscillations has been found

So-called quantum many-body scars allow quantum systems to stay out of equilibrium much longer, explaining experiment | Study published in Nature Physics

Recently, researchers from Harvard and MIT succeeded in trapping a record 53 atoms and individually controlling their quantum state, realizing what is called a...

Alle Focus-News des Innovations-reports >>>

Anzeige

Anzeige

VideoLinks
Industrie & Wirtschaft
Veranstaltungen

„Data Science“ – Theorie und Anwendung: Internationale Tagung unter Leitung der Uni Paderborn

18.05.2018 | Veranstaltungen

Visual-Computing an Bord der MS Wissenschaft

17.05.2018 | Veranstaltungen

Tagung »Anlagenbau und -betrieb der Zukunft«

17.05.2018 | Veranstaltungen

VideoLinks
Wissenschaft & Forschung
Weitere VideoLinks im Überblick >>>
 
Aktuelle Beiträge

Bose-Einstein-Kondensat im Riesenatom - Universität Stuttgart untersucht exotisches Quantenobjekt

18.05.2018 | Physik Astronomie

Countdown für Kilogramm, Kelvin und Co.

18.05.2018 | Physik Astronomie

Wie Immunzellen Bakterien mit Säure töten

18.05.2018 | Biowissenschaften Chemie

Weitere B2B-VideoLinks
IHR
JOB & KARRIERE
SERVICE
im innovations-report
in Kooperation mit academics