Forum für Wissenschaft, Industrie und Wirtschaft

Hauptsponsoren:     3M 
Datenbankrecherche:

 

Die Zukunft des Semantic Web

09.11.2004


Die Klasse, nicht die Masse von Informationen ist heute für das Erlangen von Wettbewerbsvorteilen erfolgskritisch. Immer schwerer gestaltet sich jedoch angesichts von mittlerweile über 10 Milliarden Web-Sites der Zugang zu den meist unstrukturierten Inhalten des World Wide Web. Suchmaschinen reagieren auf eine Anfrage oft genug mit Tausenden von „Treffern“. Der Zenit klassischer Volltextsuche à la Google, Altavista oder Lycos ist überschritten. Mit dem „Semantic Web“ malt die Vision des WWW-Architekten Tim Berners-Lee deswegen die Zukunft eines nahezu Datenbank-ähnlichen Zuganges zu den Informationsräumen des weltweiten Netzwerkes. Durch das Hinzufügen semantisch aussagekräftiger Informationen sollen sämtliche WWW-Inhalte für den komfortablen Datenzugriff bereit stehen. Hierfür wurden bereits eine Reihe von Web-Standards vorgeschlagen. Mit ihnen soll die Bedeutung von Informationen auf eine standardisierte Weise beschrieben werden. Diese durch Metadaten hoher Qualität angereicherten Internet-Inhalte sollen so maschinell auswertbar werden.

... mehr zu:
»MAP »Metadaten »Semantic »Topic

Dublin Core beispielsweise ist eine Initiative zur Definition standardisierter Basis-Metadaten wie beispielsweise „Autor“. Damit ähnelt das Internet sozusagen einem klassifizierten Dokumentenbestand in einem Dokumentenmanagement-System. Beim Resource Description Framework (RDF) handelt es sich hingegen um eine allgemeine XML-Notation, die das Definieren von Metadaten erlaubt. Somit ist es möglich, eigene Metadatentypen zu erstellen und in einer einheitlichen Syntax zu beschreiben. Mit Topic Maps können nicht nur Metadaten, sondern ganze Zusammenhänge und Modelle dargestellt werden. Kennt man beispielsweise nur die Sowjetunion, kann man dennoch auch Dokumente aus Russland finden, da die Beziehung in den Daten vermittelt wird. Die Web Ontology Language (OWL) schließlich erlaubt dem Anwender nicht nur dieses Schlussfolgern, also den Schluß, dass Russland und die Sowjetunion in Beziehung stehen, sondern ermöglicht auch den Einsatz von Schlußfolgerungssystemen.

Produkte und Technologien auf Basis von Topic Maps


Erst kürzlich verabschiedete das World Wide Web Consortium (W3C) RDF und OWL als Standards. Für eine Prognose über ihren zukünftigen Praxisnutzen erscheint es sinnvoll, die inzwischen 5jährigen Erfahrungen mit dem Topic Map-Standard zu betrachten. Es zeigt sich, dass die Fortschritte trotz aller Bemühungen bis heute recht verhalten sind. Für einen Erklärungsversuch ist es hilfreich, auch den Micro-Kosmos von Unternehmen zu beleuchten. In betrieblichen Intranets stellen sich nämlich ganz ähnliche Aufgaben. Auch hier geht es um den Zugriff auf Dokumenteninhalte.

In Deutschland gibt es derzeit etwa 100 Installationen von Systemen, welche die Topic Map Technologie adaptieren. Im deutschsprachigen Raum sind dies u.a. Empolis, Moresophy, Intelligent Views, USU oder auch Ontopia. Sieht man genauer hin, wird man feststellen, dass kaum einer der Hersteller sich in seinen Funktionen an den vorgegebenen Standard hält. Die meisten Produkte haben Semantic Web-Komponenten sozusagen versteckt unter der Haube. Einige Hersteller entwickelten ihre Produkte auf der Basis bestehender Anforderungen und glichen die Funktionen dann mit dem Standard ab. Die Folge war eine unterschiedliche Spezialisierung. So stellt beispielsweise K-Infinity von Intelligent Views eine Art Objektorientierte Datenbank dar. Dabei sind die Dokumente Objekte, die in viele Beziehungen gebracht werden können. Auf dieses Beziehungsnetz kann man grafisch zugreifen. Einsatz findet ein derartiges System dann, wenn man rasch in Dokumentenbeständen navigieren will und transitive Abhängigkeiten verwertet werden sollen. Lautet die Frage z.B., in welchem Kundenprojekt ein spezielles Produkt zum Einsatz kam, so findet das System entsprechende Inhalte, auch wenn in der Projekt-Dokumentation lediglich ein Modul dieses Produktes angeführt wird.

Der USU KnowledgeMiner nutzt Topic Maps hingegen vor allem zur Suche in Dokumenten. Statt der Dokumente werden Konzepte vernetzt, mit deren Hilfe ein Suchstring generiert wird, den das System wiederum an eine Metasuchmaschine sendet. Die Erstellung des Wissensnetzes ist für die Kunden ein Zusatzaufwand. Folgerichtig geht der Hersteller den Weg, Wissensnetze automatisch zu erstellen und selbstlernende Mechanismen zu integrieren. Zudem werden nicht nur erfolgreich beantwortete Fragen abgelegt, sondern auch Personen oder Rollen aufgeführt, die sich für spezifische Themen interessieren. Praktische Anwendung findet ein solches Werkzeug schwerpunktmäßig in HelpDesks oder CallCentern. Durch die Möglichkeit, auch auf operative Datenbanken zuzugreifen, kommt es auch in Entwicklungs- und Qualitätssicherungsabteilungen zum Einsatz. Als drittes Beispiel sei noch auf Ontoprise verwiesen. Abhängigkeiten, Beziehungen, aber auch Regeln und Bedingungen spiegeln sich in den Ontoprise-Wissensnetzen. Die Technologie wertet die entsprechend komplexen Netzwerkinhalte aus. Beispielprojekte finden sich in der Prototypenentwicklung. Hier können Abhängigkeiten von sich häufig ändernden Bauteilen dynamisch abgebildet und verwertet werden. Andere Anbieter starteten zwar nach der Veröffentlichung des Standards, verfolgen jedoch ebenfalls sehr ausgeprägt eigene Ideen und Anforderungen. Interessanterweise sind Praxisprojekte mit Topic Map-Produkten, sie sich strikt am Standard ausrichten, in nennenswerter Zahl nicht auszumachen.

Die Praxis-Hürden

Aus den erfolgreichen Projekten in diesem Umfeld stammen die Erfahrungen für einige zentrale Herausforderungen, denen sich Organisationen, Hersteller, Berater und Kunden stellen müssen. Dies gilt parallel auch für das Semantic Web. Einige Aspekte seien genannt.

Die semantische Unschärfe

Alle semantischen Techniken formulieren so genannte Konzepte, also begrifflich adressierbare Einheiten der Erlebens- oder Vorstellungswelt. Entsprechend versuchen alle Modelle, diese Konzepte in Beziehung und Zusammenhang zu setzen, um damit Ausschnitte der Welt zu beschreiben. Die Schwierigkeit besteht darin, dass Klassen und Begriffe, ja jede sprachliche Beschreibung per se unscharf ist. Sind nun DDR und BRD zeitliche Nachfolger Deutschlands? Ist eine solche Nachfolge analog jener der Tschechischen und Slowakischen Republik im Falle der Tschechoslowakei? Man sieht, jede sprachliche oder formale Beschreibung vereinfacht und ist dadurch nicht präzise. Das aber macht es sehr schwierig, gemeinsam genutzte Metadaten zu formulieren.

Die Unvollständigkeit

Bringt man die Konzepte und ihre Zusammenhänge zum Ausdruck, beschreibt beispielsweise die Beziehungen zwischen den Ländern, so bleibt immer unklar, welche Bedeutung eine fehlende Beziehung oder ein fehlendes Konzept hat. Ist die Existenz nicht bekannt, gleichgültig oder nicht gegeben?

Es bleibt für den Anwender deswegen nicht nachvollziehbar, ob das Modell vollständig ist oder nicht. Innerbetrieblich sind semantische Modelle meist nur dann erfolgreich, wenn sie zwar nur einen sehr begrenzten Abschnitt repräsentieren, diesen aber klar und vollständig.

Die Subjektivität

Ob nun Russland ein Nachfolger der Sowjetunion ist oder ob diese Rolle besser der GUS zugebilligt werden sollte, ist nicht nur wahr oder falsch sondern hängt auch vom Blickwinkel und Fragekontext ab. Auch hier zeigt die innerbetriebliche Erfahrung, dass Metadaten stets aus einem einheitlichen, klaren Blickwinkel für eine klare Aufgabe und Zielgruppe erstellt werden müssen.

Das fehlenden Businessmodell

Unbestritten profitieren viele Anwender von der Existenz von Metadaten. In aller Regel sind sie jedoch nicht bereit, für deren Nutzung zu zahlen. Dadurch entsteht das Problem, dass sich niemand findet, der die Fülle aussagekräftiger Metadaten pflegt, da niemand bereit ist, diesen Aufwand zu bezahlen. Lohnenswert erscheinen also Überlegungen, wie ein Geschäftsmodell für die Erstellung und den Betrieb von Metadaten aussehen könnte.

Selbstlernen als Lösung?

Einen Lösungsansatz der für das Intranet skizzierten Herausforderungen stellt nach den Erfahrungen der letzten Jahre der Einsatz selbstlernender Verfahren dar. Entscheidend ist, dass diese keinen manuellen Aufwand verursachen. Damit fallen für die Erstellung der für das Semantic Web notwendigen Metadaten auch keine Kosten an. Und somit ist auch ein entsprechendes Businessmodell nicht notwendig. Durch das automatische Entwickeln von Metadaten können diese viel reichhaltiger sein und damit mehr als nur eine Perspektive repräsentieren - wichtige Voraussetzungen, um die Praxisschwierigkeiten mit der Unschärfe und der subjektiven Blickwinkel umgehen zu können. Bereits heute zeichnet sich ab, dass die Entwicklung in diese Richtung gehen wird: Bei Amazon beispielsweise wird der Vorschlag, beim Erwerb eines Buches auch ein anderes dazuzukaufen, durch die Analyse des Nutzungsverhaltens der entsprechenden Käufergruppe generiert. Aus der Häufigkeit der gewählten Kaufvarianten früherer Erwerber schlussfolgert das System einen thematischen Zusammenhang, sozusagen einen semantischen Zusammenhang der Web-Seiten. Aus der Interaktion mit den Anwendern heraus bietet auch Google auf Basis kollaborativer Mechanismen ohne hinterlegtes Wörterbuch eine automatische Rechtschreibkorrektur. Und nach dem Prinzip „Nutzer dieser Seite waren auch Nutzer der folgenden anderen Seiten“ ist es auch vorstellbar, dass im Internet einfach gefunden werden kann.

Ein Wehrmutstropfen bleibt: Auch ein selbstlernendes Verfahren ist nicht in der Lage, alle vorhandenen Beziehungen zu ermitteln. Das Problem der Unvollständigkeit bleibt. Gut möglich hingegen ist es, die relevanten, typischerweise genutzten Beziehungen zu repräsentieren - genau diese ergeben sich aus der Nutzung. Die Anwender stellen andere Anforderungen an ein selbstlernendes Verfahren, welches das „typische“ Wissen sammelt, als an ein administrativ gepflegtes, von dem man deklarative Vollständigkeit erwartet.

Insofern gibt es gute Gründe, anzunehmen, dass wir mittelfristig auch den „Ariadne-Faden“ nutzen können, der uns zielgerichtet durch das Labyrinth des WWW führt.

Harald Huber | USU AG
Weitere Informationen:
http://www.usu.de

Weitere Berichte zu: MAP Metadaten Semantic Topic

Weitere Nachrichten aus der Kategorie Informationstechnologie:

nachricht Layouterfassung im Flug: Drohne unterstützt bei der Fabrikplanung
19.05.2017 | IPH - Institut für Integrierte Produktion Hannover gGmbH

nachricht Intelligente Industrialisierung von Rechenzentren
15.05.2017 | Rittal GmbH & Co. KG

Alle Nachrichten aus der Kategorie: Informationstechnologie >>>

Die aktuellsten Pressemeldungen zum Suchbegriff Innovation >>>

Die letzten 5 Focus-News des innovations-reports im Überblick:

Im Focus: Orientierungslauf im Mikrokosmos

Physiker der Universität Würzburg können auf Knopfdruck einzelne Lichtteilchen erzeugen, die einander ähneln wie ein Ei dem anderen. Zwei neue Studien zeigen nun, welches Potenzial diese Methode hat.

Der Quantencomputer beflügelt seit Jahrzehnten die Phantasie der Wissenschaftler: Er beruht auf grundlegend anderen Phänomenen als ein herkömmlicher Rechner....

Im Focus: A quantum walk of photons

Physicists from the University of Würzburg are capable of generating identical looking single light particles at the push of a button. Two new studies now demonstrate the potential this method holds.

The quantum computer has fuelled the imagination of scientists for decades: It is based on fundamentally different phenomena than a conventional computer....

Im Focus: Tumult im trägen Elektronen-Dasein

Ein internationales Team von Physikern hat erstmals das Streuverhalten von Elektronen in einem nichtleitenden Material direkt beobachtet. Ihre Erkenntnisse könnten der Strahlungsmedizin zu Gute kommen.

Elektronen in nichtleitenden Materialien könnte man Trägheit nachsagen. In der Regel bleiben sie an ihren Plätzen, tief im Inneren eines solchen Atomverbunds....

Im Focus: Turmoil in sluggish electrons’ existence

An international team of physicists has monitored the scattering behaviour of electrons in a non-conducting material in real-time. Their insights could be beneficial for radiotherapy.

We can refer to electrons in non-conducting materials as ‘sluggish’. Typically, they remain fixed in a location, deep inside an atomic composite. It is hence...

Im Focus: Hauchdünne magnetische Materialien für zukünftige Quantentechnologien entwickelt

Zweidimensionale magnetische Strukturen gelten als vielversprechendes Material für neuartige Datenspeicher, da sich die magnetischen Eigenschaften einzelner Molekülen untersuchen und verändern lassen. Forscher haben nun erstmals einen hauchdünnen Ferrimagneten hergestellt, bei dem sich Moleküle mit verschiedenen magnetischen Zentren auf einer Goldfläche selbst zu einem Schachbrettmuster anordnen. Dies berichten Wissenschaftler des Swiss Nanoscience Institutes der Universität Basel und des Paul Scherrer Institutes in der Wissenschaftszeitschrift «Nature Communications».

Ferrimagneten besitzen zwei magnetische Zentren, deren Magnetismus verschieden stark ist und in entgegengesetzte Richtungen zeigt. Zweidimensionale, quasi...

Alle Focus-News des Innovations-reports >>>

Anzeige

Anzeige

IHR
JOB & KARRIERE
SERVICE
im innovations-report
in Kooperation mit academics
Veranstaltungen

Meeresschutz im Fokus: Das IASS auf der UN-Ozean-Konferenz in New York vom 5.-9. Juni

24.05.2017 | Veranstaltungen

Diabetes Kongress in Hamburg beginnt heute: Rund 6000 Teilnehmer werden erwartet

24.05.2017 | Veranstaltungen

Wissensbuffet: „All you can eat – and learn”

24.05.2017 | Veranstaltungen

 
VideoLinks
B2B-VideoLinks
Weitere VideoLinks >>>
Aktuelle Beiträge

Hochspannung für den Teilchenbeschleuniger der Zukunft

24.05.2017 | Physik Astronomie

3D-Graphen: Experiment an BESSY II zeigt, dass optische Eigenschaften einstellbar sind

24.05.2017 | Physik Astronomie

Optisches Messverfahren für Zellanalysen in Echtzeit - Ulmer Physiker auf der Messe "Sensor+Test"

24.05.2017 | Messenachrichten