Forum für Wissenschaft, Industrie und Wirtschaft

Hauptsponsoren:     3M 
Datenbankrecherche:

 

Die Zukunft des Semantic Web

09.11.2004


Die Klasse, nicht die Masse von Informationen ist heute für das Erlangen von Wettbewerbsvorteilen erfolgskritisch. Immer schwerer gestaltet sich jedoch angesichts von mittlerweile über 10 Milliarden Web-Sites der Zugang zu den meist unstrukturierten Inhalten des World Wide Web. Suchmaschinen reagieren auf eine Anfrage oft genug mit Tausenden von „Treffern“. Der Zenit klassischer Volltextsuche à la Google, Altavista oder Lycos ist überschritten. Mit dem „Semantic Web“ malt die Vision des WWW-Architekten Tim Berners-Lee deswegen die Zukunft eines nahezu Datenbank-ähnlichen Zuganges zu den Informationsräumen des weltweiten Netzwerkes. Durch das Hinzufügen semantisch aussagekräftiger Informationen sollen sämtliche WWW-Inhalte für den komfortablen Datenzugriff bereit stehen. Hierfür wurden bereits eine Reihe von Web-Standards vorgeschlagen. Mit ihnen soll die Bedeutung von Informationen auf eine standardisierte Weise beschrieben werden. Diese durch Metadaten hoher Qualität angereicherten Internet-Inhalte sollen so maschinell auswertbar werden.

... mehr zu:
»MAP »Metadaten »Semantic »Topic

Dublin Core beispielsweise ist eine Initiative zur Definition standardisierter Basis-Metadaten wie beispielsweise „Autor“. Damit ähnelt das Internet sozusagen einem klassifizierten Dokumentenbestand in einem Dokumentenmanagement-System. Beim Resource Description Framework (RDF) handelt es sich hingegen um eine allgemeine XML-Notation, die das Definieren von Metadaten erlaubt. Somit ist es möglich, eigene Metadatentypen zu erstellen und in einer einheitlichen Syntax zu beschreiben. Mit Topic Maps können nicht nur Metadaten, sondern ganze Zusammenhänge und Modelle dargestellt werden. Kennt man beispielsweise nur die Sowjetunion, kann man dennoch auch Dokumente aus Russland finden, da die Beziehung in den Daten vermittelt wird. Die Web Ontology Language (OWL) schließlich erlaubt dem Anwender nicht nur dieses Schlussfolgern, also den Schluß, dass Russland und die Sowjetunion in Beziehung stehen, sondern ermöglicht auch den Einsatz von Schlußfolgerungssystemen.

Produkte und Technologien auf Basis von Topic Maps


Erst kürzlich verabschiedete das World Wide Web Consortium (W3C) RDF und OWL als Standards. Für eine Prognose über ihren zukünftigen Praxisnutzen erscheint es sinnvoll, die inzwischen 5jährigen Erfahrungen mit dem Topic Map-Standard zu betrachten. Es zeigt sich, dass die Fortschritte trotz aller Bemühungen bis heute recht verhalten sind. Für einen Erklärungsversuch ist es hilfreich, auch den Micro-Kosmos von Unternehmen zu beleuchten. In betrieblichen Intranets stellen sich nämlich ganz ähnliche Aufgaben. Auch hier geht es um den Zugriff auf Dokumenteninhalte.

In Deutschland gibt es derzeit etwa 100 Installationen von Systemen, welche die Topic Map Technologie adaptieren. Im deutschsprachigen Raum sind dies u.a. Empolis, Moresophy, Intelligent Views, USU oder auch Ontopia. Sieht man genauer hin, wird man feststellen, dass kaum einer der Hersteller sich in seinen Funktionen an den vorgegebenen Standard hält. Die meisten Produkte haben Semantic Web-Komponenten sozusagen versteckt unter der Haube. Einige Hersteller entwickelten ihre Produkte auf der Basis bestehender Anforderungen und glichen die Funktionen dann mit dem Standard ab. Die Folge war eine unterschiedliche Spezialisierung. So stellt beispielsweise K-Infinity von Intelligent Views eine Art Objektorientierte Datenbank dar. Dabei sind die Dokumente Objekte, die in viele Beziehungen gebracht werden können. Auf dieses Beziehungsnetz kann man grafisch zugreifen. Einsatz findet ein derartiges System dann, wenn man rasch in Dokumentenbeständen navigieren will und transitive Abhängigkeiten verwertet werden sollen. Lautet die Frage z.B., in welchem Kundenprojekt ein spezielles Produkt zum Einsatz kam, so findet das System entsprechende Inhalte, auch wenn in der Projekt-Dokumentation lediglich ein Modul dieses Produktes angeführt wird.

Der USU KnowledgeMiner nutzt Topic Maps hingegen vor allem zur Suche in Dokumenten. Statt der Dokumente werden Konzepte vernetzt, mit deren Hilfe ein Suchstring generiert wird, den das System wiederum an eine Metasuchmaschine sendet. Die Erstellung des Wissensnetzes ist für die Kunden ein Zusatzaufwand. Folgerichtig geht der Hersteller den Weg, Wissensnetze automatisch zu erstellen und selbstlernende Mechanismen zu integrieren. Zudem werden nicht nur erfolgreich beantwortete Fragen abgelegt, sondern auch Personen oder Rollen aufgeführt, die sich für spezifische Themen interessieren. Praktische Anwendung findet ein solches Werkzeug schwerpunktmäßig in HelpDesks oder CallCentern. Durch die Möglichkeit, auch auf operative Datenbanken zuzugreifen, kommt es auch in Entwicklungs- und Qualitätssicherungsabteilungen zum Einsatz. Als drittes Beispiel sei noch auf Ontoprise verwiesen. Abhängigkeiten, Beziehungen, aber auch Regeln und Bedingungen spiegeln sich in den Ontoprise-Wissensnetzen. Die Technologie wertet die entsprechend komplexen Netzwerkinhalte aus. Beispielprojekte finden sich in der Prototypenentwicklung. Hier können Abhängigkeiten von sich häufig ändernden Bauteilen dynamisch abgebildet und verwertet werden. Andere Anbieter starteten zwar nach der Veröffentlichung des Standards, verfolgen jedoch ebenfalls sehr ausgeprägt eigene Ideen und Anforderungen. Interessanterweise sind Praxisprojekte mit Topic Map-Produkten, sie sich strikt am Standard ausrichten, in nennenswerter Zahl nicht auszumachen.

Die Praxis-Hürden

Aus den erfolgreichen Projekten in diesem Umfeld stammen die Erfahrungen für einige zentrale Herausforderungen, denen sich Organisationen, Hersteller, Berater und Kunden stellen müssen. Dies gilt parallel auch für das Semantic Web. Einige Aspekte seien genannt.

Die semantische Unschärfe

Alle semantischen Techniken formulieren so genannte Konzepte, also begrifflich adressierbare Einheiten der Erlebens- oder Vorstellungswelt. Entsprechend versuchen alle Modelle, diese Konzepte in Beziehung und Zusammenhang zu setzen, um damit Ausschnitte der Welt zu beschreiben. Die Schwierigkeit besteht darin, dass Klassen und Begriffe, ja jede sprachliche Beschreibung per se unscharf ist. Sind nun DDR und BRD zeitliche Nachfolger Deutschlands? Ist eine solche Nachfolge analog jener der Tschechischen und Slowakischen Republik im Falle der Tschechoslowakei? Man sieht, jede sprachliche oder formale Beschreibung vereinfacht und ist dadurch nicht präzise. Das aber macht es sehr schwierig, gemeinsam genutzte Metadaten zu formulieren.

Die Unvollständigkeit

Bringt man die Konzepte und ihre Zusammenhänge zum Ausdruck, beschreibt beispielsweise die Beziehungen zwischen den Ländern, so bleibt immer unklar, welche Bedeutung eine fehlende Beziehung oder ein fehlendes Konzept hat. Ist die Existenz nicht bekannt, gleichgültig oder nicht gegeben?

Es bleibt für den Anwender deswegen nicht nachvollziehbar, ob das Modell vollständig ist oder nicht. Innerbetrieblich sind semantische Modelle meist nur dann erfolgreich, wenn sie zwar nur einen sehr begrenzten Abschnitt repräsentieren, diesen aber klar und vollständig.

Die Subjektivität

Ob nun Russland ein Nachfolger der Sowjetunion ist oder ob diese Rolle besser der GUS zugebilligt werden sollte, ist nicht nur wahr oder falsch sondern hängt auch vom Blickwinkel und Fragekontext ab. Auch hier zeigt die innerbetriebliche Erfahrung, dass Metadaten stets aus einem einheitlichen, klaren Blickwinkel für eine klare Aufgabe und Zielgruppe erstellt werden müssen.

Das fehlenden Businessmodell

Unbestritten profitieren viele Anwender von der Existenz von Metadaten. In aller Regel sind sie jedoch nicht bereit, für deren Nutzung zu zahlen. Dadurch entsteht das Problem, dass sich niemand findet, der die Fülle aussagekräftiger Metadaten pflegt, da niemand bereit ist, diesen Aufwand zu bezahlen. Lohnenswert erscheinen also Überlegungen, wie ein Geschäftsmodell für die Erstellung und den Betrieb von Metadaten aussehen könnte.

Selbstlernen als Lösung?

Einen Lösungsansatz der für das Intranet skizzierten Herausforderungen stellt nach den Erfahrungen der letzten Jahre der Einsatz selbstlernender Verfahren dar. Entscheidend ist, dass diese keinen manuellen Aufwand verursachen. Damit fallen für die Erstellung der für das Semantic Web notwendigen Metadaten auch keine Kosten an. Und somit ist auch ein entsprechendes Businessmodell nicht notwendig. Durch das automatische Entwickeln von Metadaten können diese viel reichhaltiger sein und damit mehr als nur eine Perspektive repräsentieren - wichtige Voraussetzungen, um die Praxisschwierigkeiten mit der Unschärfe und der subjektiven Blickwinkel umgehen zu können. Bereits heute zeichnet sich ab, dass die Entwicklung in diese Richtung gehen wird: Bei Amazon beispielsweise wird der Vorschlag, beim Erwerb eines Buches auch ein anderes dazuzukaufen, durch die Analyse des Nutzungsverhaltens der entsprechenden Käufergruppe generiert. Aus der Häufigkeit der gewählten Kaufvarianten früherer Erwerber schlussfolgert das System einen thematischen Zusammenhang, sozusagen einen semantischen Zusammenhang der Web-Seiten. Aus der Interaktion mit den Anwendern heraus bietet auch Google auf Basis kollaborativer Mechanismen ohne hinterlegtes Wörterbuch eine automatische Rechtschreibkorrektur. Und nach dem Prinzip „Nutzer dieser Seite waren auch Nutzer der folgenden anderen Seiten“ ist es auch vorstellbar, dass im Internet einfach gefunden werden kann.

Ein Wehrmutstropfen bleibt: Auch ein selbstlernendes Verfahren ist nicht in der Lage, alle vorhandenen Beziehungen zu ermitteln. Das Problem der Unvollständigkeit bleibt. Gut möglich hingegen ist es, die relevanten, typischerweise genutzten Beziehungen zu repräsentieren - genau diese ergeben sich aus der Nutzung. Die Anwender stellen andere Anforderungen an ein selbstlernendes Verfahren, welches das „typische“ Wissen sammelt, als an ein administrativ gepflegtes, von dem man deklarative Vollständigkeit erwartet.

Insofern gibt es gute Gründe, anzunehmen, dass wir mittelfristig auch den „Ariadne-Faden“ nutzen können, der uns zielgerichtet durch das Labyrinth des WWW führt.

Harald Huber | USU AG
Weitere Informationen:
http://www.usu.de

Weitere Berichte zu: MAP Metadaten Semantic Topic

Weitere Nachrichten aus der Kategorie Informationstechnologie:

nachricht Smart Living: VDE-Institut entwickelt Cloud-basierte interoperable Testplattform
15.02.2017 | VDE Verband der Elektrotechnik Elektronik Informationstechnik e.V.

nachricht Saarbrücker Informatiker machen „Augmented Reality“ fotorealistisch
15.02.2017 | Universität des Saarlandes

Alle Nachrichten aus der Kategorie: Informationstechnologie >>>

Die aktuellsten Pressemeldungen zum Suchbegriff Innovation >>>

Die letzten 5 Focus-News des innovations-reports im Überblick:

Im Focus: Kühler Zwerg und die sieben Planeten

Erdgroße Planeten mit gemäßigtem Klima in System mit ungewöhnlich vielen Planeten entdeckt

In einer Entfernung von nur 40 Lichtjahren haben Astronomen ein System aus sieben erdgroßen Planeten entdeckt. Alle Planeten wurden unter Verwendung von boden-...

Im Focus: Mehr Sicherheit für Flugzeuge

Zwei Entwicklungen am Lehrgebiet Rechnerarchitektur der FernUniversität in Hagen können das Fliegen sicherer machen: ein Flugassistenzsystem, das bei einem totalen Triebwerksausfall zum Einsatz kommt, um den Piloten ein sicheres Gleiten zu einem Notlandeplatz zu ermöglichen, und ein Assistenzsystem für Segelflieger, das ihnen das Erreichen größerer Höhen erleichtert. Präsentiert werden sie von Prof. Dr.-Ing. Wolfram Schiffmann auf der Internationalen Fachmesse für Allgemeine Luftfahrt AERO vom 5. bis 8. April in Friedrichshafen.

Zwei Entwicklungen am Lehrgebiet Rechnerarchitektur der FernUniversität in Hagen können das Fliegen sicherer machen: ein Flugassistenzsystem, das bei einem...

Im Focus: HIGH-TOOL unterstützt Verkehrsplanung in Europa

Forschung am Karlsruher Institut für Technologie (KIT) unterstützt die Europäische Kommission bei der Verkehrsplanung: Anhand des neuen Modells HIGH-TOOL lässt sich bewerten, wie verkehrspolitische Maßnahmen langfristig auf Wirtschaft, Gesellschaft und Umwelt wirken. HIGH-TOOL ist ein frei zugängliches Modell mit Modulen für Demografie, Wirtschaft und Ressourcen, Fahrzeugbestand, Nachfrage im Personen- und Güterverkehr sowie Umwelt und Sicherheit. An dem nun erfolgreich abgeschlossenen EU-Projekt unter der Koordination des KIT waren acht Partner aus fünf Ländern beteiligt.

Forschung am Karlsruher Institut für Technologie (KIT) unterstützt die Europäische Kommission bei der Verkehrsplanung: Anhand des neuen Modells HIGH-TOOL lässt...

Im Focus: Zinn in der Photodiode: nächster Schritt zur optischen On-Chip-Datenübertragung

Schon lange suchen Wissenschaftler nach einer geeigneten Lösung, um optische Komponenten auf einem Computerchip zu integrieren. Doch Silizium und Germanium allein – die stoffliche Basis der Chip-Produktion – sind als Lichtquelle kaum geeignet. Jülicher Physiker haben nun gemeinsam mit internationalen Partnern eine Diode vorgestellt, die neben Silizium und Germanium zusätzlich Zinn enthält, um die optischen Eigenschaften zu verbessern. Das Besondere daran: Da alle Elemente der vierten Hauptgruppe angehören, sind sie mit der bestehenden Silizium-Technologie voll kompatibel.

Schon lange suchen Wissenschaftler nach einer geeigneten Lösung, um optische Komponenten auf einem Computerchip zu integrieren. Doch Silizium und Germanium...

Im Focus: Innovative Antikörper für die Tumortherapie

Immuntherapie mit Antikörpern stellt heute für viele Krebspatienten einen Erfolg versprechenden Ansatz dar. Weil aber längst nicht alle Patienten nachhaltig von diesen teuren Medikamenten profitieren, wird intensiv an deren Verbesserung gearbeitet. Forschern um Prof. Thomas Valerius an der Christian Albrechts Universität Kiel gelang es nun, innovative Antikörper mit verbesserter Wirkung zu entwickeln.

Immuntherapie mit Antikörpern stellt heute für viele Krebspatienten einen Erfolg versprechenden Ansatz dar. Weil aber längst nicht alle Patienten nachhaltig...

Alle Focus-News des Innovations-reports >>>

Anzeige

Anzeige

IHR
JOB & KARRIERE
SERVICE
im innovations-report
in Kooperation mit academics
Veranstaltungen

Big Data Centrum Ostbayern-Südböhmen startet Veranstaltungsreihe

23.02.2017 | Veranstaltungen

DFG unterstützt Kongresse und Tagungen - April 2017

23.02.2017 | Veranstaltungen

Wie werden wir gesund alt? - Alternsforscher tagen auf interdisziplinärem Symposium in Magdeburg

23.02.2017 | Veranstaltungen

 
VideoLinks
B2B-VideoLinks
Weitere VideoLinks >>>
Aktuelle Beiträge

Heinz Maier-Leibnitz-Preise 2017: DFG und BMBF zeichnen vier Forscherinnen und sechs Forscher aus

23.02.2017 | Förderungen Preise

Big Data Centrum Ostbayern-Südböhmen startet Veranstaltungsreihe

23.02.2017 | Veranstaltungsnachrichten

Planeten außerhalb unseres Sonnensystems: Bayreuther Forscher dringen tief ins Weltall vor

23.02.2017 | Physik Astronomie