Forum für Wissenschaft, Industrie und Wirtschaft

Hauptsponsoren:     3M 
Datenbankrecherche:

 

Die Zukunft des Semantic Web

09.11.2004


Die Klasse, nicht die Masse von Informationen ist heute für das Erlangen von Wettbewerbsvorteilen erfolgskritisch. Immer schwerer gestaltet sich jedoch angesichts von mittlerweile über 10 Milliarden Web-Sites der Zugang zu den meist unstrukturierten Inhalten des World Wide Web. Suchmaschinen reagieren auf eine Anfrage oft genug mit Tausenden von „Treffern“. Der Zenit klassischer Volltextsuche à la Google, Altavista oder Lycos ist überschritten. Mit dem „Semantic Web“ malt die Vision des WWW-Architekten Tim Berners-Lee deswegen die Zukunft eines nahezu Datenbank-ähnlichen Zuganges zu den Informationsräumen des weltweiten Netzwerkes. Durch das Hinzufügen semantisch aussagekräftiger Informationen sollen sämtliche WWW-Inhalte für den komfortablen Datenzugriff bereit stehen. Hierfür wurden bereits eine Reihe von Web-Standards vorgeschlagen. Mit ihnen soll die Bedeutung von Informationen auf eine standardisierte Weise beschrieben werden. Diese durch Metadaten hoher Qualität angereicherten Internet-Inhalte sollen so maschinell auswertbar werden.

... mehr zu:
»MAP »Metadaten »Semantic »Topic

Dublin Core beispielsweise ist eine Initiative zur Definition standardisierter Basis-Metadaten wie beispielsweise „Autor“. Damit ähnelt das Internet sozusagen einem klassifizierten Dokumentenbestand in einem Dokumentenmanagement-System. Beim Resource Description Framework (RDF) handelt es sich hingegen um eine allgemeine XML-Notation, die das Definieren von Metadaten erlaubt. Somit ist es möglich, eigene Metadatentypen zu erstellen und in einer einheitlichen Syntax zu beschreiben. Mit Topic Maps können nicht nur Metadaten, sondern ganze Zusammenhänge und Modelle dargestellt werden. Kennt man beispielsweise nur die Sowjetunion, kann man dennoch auch Dokumente aus Russland finden, da die Beziehung in den Daten vermittelt wird. Die Web Ontology Language (OWL) schließlich erlaubt dem Anwender nicht nur dieses Schlussfolgern, also den Schluß, dass Russland und die Sowjetunion in Beziehung stehen, sondern ermöglicht auch den Einsatz von Schlußfolgerungssystemen.

Produkte und Technologien auf Basis von Topic Maps


Erst kürzlich verabschiedete das World Wide Web Consortium (W3C) RDF und OWL als Standards. Für eine Prognose über ihren zukünftigen Praxisnutzen erscheint es sinnvoll, die inzwischen 5jährigen Erfahrungen mit dem Topic Map-Standard zu betrachten. Es zeigt sich, dass die Fortschritte trotz aller Bemühungen bis heute recht verhalten sind. Für einen Erklärungsversuch ist es hilfreich, auch den Micro-Kosmos von Unternehmen zu beleuchten. In betrieblichen Intranets stellen sich nämlich ganz ähnliche Aufgaben. Auch hier geht es um den Zugriff auf Dokumenteninhalte.

In Deutschland gibt es derzeit etwa 100 Installationen von Systemen, welche die Topic Map Technologie adaptieren. Im deutschsprachigen Raum sind dies u.a. Empolis, Moresophy, Intelligent Views, USU oder auch Ontopia. Sieht man genauer hin, wird man feststellen, dass kaum einer der Hersteller sich in seinen Funktionen an den vorgegebenen Standard hält. Die meisten Produkte haben Semantic Web-Komponenten sozusagen versteckt unter der Haube. Einige Hersteller entwickelten ihre Produkte auf der Basis bestehender Anforderungen und glichen die Funktionen dann mit dem Standard ab. Die Folge war eine unterschiedliche Spezialisierung. So stellt beispielsweise K-Infinity von Intelligent Views eine Art Objektorientierte Datenbank dar. Dabei sind die Dokumente Objekte, die in viele Beziehungen gebracht werden können. Auf dieses Beziehungsnetz kann man grafisch zugreifen. Einsatz findet ein derartiges System dann, wenn man rasch in Dokumentenbeständen navigieren will und transitive Abhängigkeiten verwertet werden sollen. Lautet die Frage z.B., in welchem Kundenprojekt ein spezielles Produkt zum Einsatz kam, so findet das System entsprechende Inhalte, auch wenn in der Projekt-Dokumentation lediglich ein Modul dieses Produktes angeführt wird.

Der USU KnowledgeMiner nutzt Topic Maps hingegen vor allem zur Suche in Dokumenten. Statt der Dokumente werden Konzepte vernetzt, mit deren Hilfe ein Suchstring generiert wird, den das System wiederum an eine Metasuchmaschine sendet. Die Erstellung des Wissensnetzes ist für die Kunden ein Zusatzaufwand. Folgerichtig geht der Hersteller den Weg, Wissensnetze automatisch zu erstellen und selbstlernende Mechanismen zu integrieren. Zudem werden nicht nur erfolgreich beantwortete Fragen abgelegt, sondern auch Personen oder Rollen aufgeführt, die sich für spezifische Themen interessieren. Praktische Anwendung findet ein solches Werkzeug schwerpunktmäßig in HelpDesks oder CallCentern. Durch die Möglichkeit, auch auf operative Datenbanken zuzugreifen, kommt es auch in Entwicklungs- und Qualitätssicherungsabteilungen zum Einsatz. Als drittes Beispiel sei noch auf Ontoprise verwiesen. Abhängigkeiten, Beziehungen, aber auch Regeln und Bedingungen spiegeln sich in den Ontoprise-Wissensnetzen. Die Technologie wertet die entsprechend komplexen Netzwerkinhalte aus. Beispielprojekte finden sich in der Prototypenentwicklung. Hier können Abhängigkeiten von sich häufig ändernden Bauteilen dynamisch abgebildet und verwertet werden. Andere Anbieter starteten zwar nach der Veröffentlichung des Standards, verfolgen jedoch ebenfalls sehr ausgeprägt eigene Ideen und Anforderungen. Interessanterweise sind Praxisprojekte mit Topic Map-Produkten, sie sich strikt am Standard ausrichten, in nennenswerter Zahl nicht auszumachen.

Die Praxis-Hürden

Aus den erfolgreichen Projekten in diesem Umfeld stammen die Erfahrungen für einige zentrale Herausforderungen, denen sich Organisationen, Hersteller, Berater und Kunden stellen müssen. Dies gilt parallel auch für das Semantic Web. Einige Aspekte seien genannt.

Die semantische Unschärfe

Alle semantischen Techniken formulieren so genannte Konzepte, also begrifflich adressierbare Einheiten der Erlebens- oder Vorstellungswelt. Entsprechend versuchen alle Modelle, diese Konzepte in Beziehung und Zusammenhang zu setzen, um damit Ausschnitte der Welt zu beschreiben. Die Schwierigkeit besteht darin, dass Klassen und Begriffe, ja jede sprachliche Beschreibung per se unscharf ist. Sind nun DDR und BRD zeitliche Nachfolger Deutschlands? Ist eine solche Nachfolge analog jener der Tschechischen und Slowakischen Republik im Falle der Tschechoslowakei? Man sieht, jede sprachliche oder formale Beschreibung vereinfacht und ist dadurch nicht präzise. Das aber macht es sehr schwierig, gemeinsam genutzte Metadaten zu formulieren.

Die Unvollständigkeit

Bringt man die Konzepte und ihre Zusammenhänge zum Ausdruck, beschreibt beispielsweise die Beziehungen zwischen den Ländern, so bleibt immer unklar, welche Bedeutung eine fehlende Beziehung oder ein fehlendes Konzept hat. Ist die Existenz nicht bekannt, gleichgültig oder nicht gegeben?

Es bleibt für den Anwender deswegen nicht nachvollziehbar, ob das Modell vollständig ist oder nicht. Innerbetrieblich sind semantische Modelle meist nur dann erfolgreich, wenn sie zwar nur einen sehr begrenzten Abschnitt repräsentieren, diesen aber klar und vollständig.

Die Subjektivität

Ob nun Russland ein Nachfolger der Sowjetunion ist oder ob diese Rolle besser der GUS zugebilligt werden sollte, ist nicht nur wahr oder falsch sondern hängt auch vom Blickwinkel und Fragekontext ab. Auch hier zeigt die innerbetriebliche Erfahrung, dass Metadaten stets aus einem einheitlichen, klaren Blickwinkel für eine klare Aufgabe und Zielgruppe erstellt werden müssen.

Das fehlenden Businessmodell

Unbestritten profitieren viele Anwender von der Existenz von Metadaten. In aller Regel sind sie jedoch nicht bereit, für deren Nutzung zu zahlen. Dadurch entsteht das Problem, dass sich niemand findet, der die Fülle aussagekräftiger Metadaten pflegt, da niemand bereit ist, diesen Aufwand zu bezahlen. Lohnenswert erscheinen also Überlegungen, wie ein Geschäftsmodell für die Erstellung und den Betrieb von Metadaten aussehen könnte.

Selbstlernen als Lösung?

Einen Lösungsansatz der für das Intranet skizzierten Herausforderungen stellt nach den Erfahrungen der letzten Jahre der Einsatz selbstlernender Verfahren dar. Entscheidend ist, dass diese keinen manuellen Aufwand verursachen. Damit fallen für die Erstellung der für das Semantic Web notwendigen Metadaten auch keine Kosten an. Und somit ist auch ein entsprechendes Businessmodell nicht notwendig. Durch das automatische Entwickeln von Metadaten können diese viel reichhaltiger sein und damit mehr als nur eine Perspektive repräsentieren - wichtige Voraussetzungen, um die Praxisschwierigkeiten mit der Unschärfe und der subjektiven Blickwinkel umgehen zu können. Bereits heute zeichnet sich ab, dass die Entwicklung in diese Richtung gehen wird: Bei Amazon beispielsweise wird der Vorschlag, beim Erwerb eines Buches auch ein anderes dazuzukaufen, durch die Analyse des Nutzungsverhaltens der entsprechenden Käufergruppe generiert. Aus der Häufigkeit der gewählten Kaufvarianten früherer Erwerber schlussfolgert das System einen thematischen Zusammenhang, sozusagen einen semantischen Zusammenhang der Web-Seiten. Aus der Interaktion mit den Anwendern heraus bietet auch Google auf Basis kollaborativer Mechanismen ohne hinterlegtes Wörterbuch eine automatische Rechtschreibkorrektur. Und nach dem Prinzip „Nutzer dieser Seite waren auch Nutzer der folgenden anderen Seiten“ ist es auch vorstellbar, dass im Internet einfach gefunden werden kann.

Ein Wehrmutstropfen bleibt: Auch ein selbstlernendes Verfahren ist nicht in der Lage, alle vorhandenen Beziehungen zu ermitteln. Das Problem der Unvollständigkeit bleibt. Gut möglich hingegen ist es, die relevanten, typischerweise genutzten Beziehungen zu repräsentieren - genau diese ergeben sich aus der Nutzung. Die Anwender stellen andere Anforderungen an ein selbstlernendes Verfahren, welches das „typische“ Wissen sammelt, als an ein administrativ gepflegtes, von dem man deklarative Vollständigkeit erwartet.

Insofern gibt es gute Gründe, anzunehmen, dass wir mittelfristig auch den „Ariadne-Faden“ nutzen können, der uns zielgerichtet durch das Labyrinth des WWW führt.

Harald Huber | USU AG
Weitere Informationen:
http://www.usu.de

Weitere Berichte zu: MAP Metadaten Semantic Topic

Weitere Nachrichten aus der Kategorie Informationstechnologie:

nachricht Cybersicherheit für die Bahn von morgen
24.03.2017 | Fraunhofer-Institut für Sichere Informationstechnologie SIT

nachricht Schutz vor Angriffen dank flexibler Programmierung
22.03.2017 | FZI Forschungszentrum Informatik am Karlsruher Institut für Technologie

Alle Nachrichten aus der Kategorie: Informationstechnologie >>>

Die aktuellsten Pressemeldungen zum Suchbegriff Innovation >>>

Die letzten 5 Focus-News des innovations-reports im Überblick:

Im Focus: Wegweisende Erkenntnisse für die Biomedizin: NAD⁺ hilft bei Reparatur geschädigter Erbinformationen

Eine internationale Forschergruppe mit dem Bayreuther Biochemiker Prof. Dr. Clemens Steegborn präsentiert in 'Science' neue, für die Biomedizin wegweisende Forschungsergebnisse zur Rolle des Moleküls NAD⁺ bei der Korrektur von Schäden am Erbgut.

Die Zellen von Menschen und Tieren können Schäden an der DNA, dem Träger der Erbinformation, bis zu einem gewissen Umfang selbst reparieren. Diese Fähigkeit...

Im Focus: Designer-Proteine falten DNA

Florian Praetorius und Prof. Hendrik Dietz von der Technischen Universität München (TUM) haben eine neue Methode entwickelt, mit deren Hilfe sie definierte Hybrid-Strukturen aus DNA und Proteinen aufbauen können. Die Methode eröffnet Möglichkeiten für die zellbiologische Grundlagenforschung und für die Anwendung in Medizin und Biotechnologie.

Desoxyribonukleinsäure – besser bekannt unter der englischen Abkürzung DNA – ist die Trägerin unserer Erbinformation. Für Prof. Hendrik Dietz und Florian...

Im Focus: Fliegende Intensivstationen: Ultraschallgeräte in Rettungshubschraubern können Leben retten

Etwa 21 Millionen Menschen treffen jährlich in deutschen Notaufnahmen ein. Im Kampf zwischen Leben und Tod zählt für diese Patienten jede Minute. Wenn sie schon kurz nach dem Unfall zielgerichtet behandelt werden können, verbessern sich ihre Überlebenschancen erheblich. Damit Notfallmediziner in solchen Fällen schnell die richtige Diagnose stellen können, kommen in den Rettungshubschraubern der DRF Luftrettung und zunehmend auch in Notarzteinsatzfahrzeugen mobile Ultraschallgeräte zum Einsatz. Experten der Deutschen Gesellschaft für Ultraschall in der Medizin e.V. (DEGUM) schulen die Notärzte und Rettungsassistenten.

Mit mobilen Ultraschallgeräten können Notärzte beispielsweise innere Blutungen direkt am Unfallort identifizieren und sie bei Bedarf auch für Untersuchungen im...

Im Focus: Gigantische Magnetfelder im Universum

Astronomen aus Bonn und Tautenburg in Thüringen beobachteten mit dem 100-m-Radioteleskop Effelsberg Galaxienhaufen, das sind Ansammlungen von Sternsystemen, heißem Gas und geladenen Teilchen. An den Rändern dieser Galaxienhaufen fanden sie außergewöhnlich geordnete Magnetfelder, die sich über viele Millionen Lichtjahre erstrecken. Sie stellen die größten bekannten Magnetfelder im Universum dar.

Die Ergebnisse werden am 22. März in der Fachzeitschrift „Astronomy & Astrophysics“ veröffentlicht.

Galaxienhaufen sind die größten gravitativ gebundenen Strukturen im Universum, mit einer Ausdehnung von etwa zehn Millionen Lichtjahren. Im Vergleich dazu ist...

Im Focus: Giant Magnetic Fields in the Universe

Astronomers from Bonn and Tautenburg in Thuringia (Germany) used the 100-m radio telescope at Effelsberg to observe several galaxy clusters. At the edges of these large accumulations of dark matter, stellar systems (galaxies), hot gas, and charged particles, they found magnetic fields that are exceptionally ordered over distances of many million light years. This makes them the most extended magnetic fields in the universe known so far.

The results will be published on March 22 in the journal „Astronomy & Astrophysics“.

Galaxy clusters are the largest gravitationally bound structures in the universe. With a typical extent of about 10 million light years, i.e. 100 times the...

Alle Focus-News des Innovations-reports >>>

Anzeige

Anzeige

IHR
JOB & KARRIERE
SERVICE
im innovations-report
in Kooperation mit academics
Veranstaltungen

Rund 500 Fachleute aus Wissenschaft und Wirtschaft diskutierten über technologische Zukunftsthemen

24.03.2017 | Veranstaltungen

Lebenswichtige Lebensmittelchemie

23.03.2017 | Veranstaltungen

Die „Panama Papers“ aus Programmierersicht

22.03.2017 | Veranstaltungen

 
VideoLinks
B2B-VideoLinks
Weitere VideoLinks >>>
Aktuelle Beiträge

Rund 500 Fachleute aus Wissenschaft und Wirtschaft diskutierten über technologische Zukunftsthemen

24.03.2017 | Veranstaltungsnachrichten

Förderung des Instituts für Lasertechnik und Messtechnik in Ulm mit rund 1,63 Millionen Euro

24.03.2017 | Förderungen Preise

TU-Bauingenieure koordinieren EU-Projekt zu Recycling-Beton von über sieben Millionen Euro

24.03.2017 | Förderungen Preise