Forum für Wissenschaft, Industrie und Wirtschaft

Hauptsponsoren:     3M 
Datenbankrecherche:

 

Die Zukunft des Semantic Web

09.11.2004


Die Klasse, nicht die Masse von Informationen ist heute für das Erlangen von Wettbewerbsvorteilen erfolgskritisch. Immer schwerer gestaltet sich jedoch angesichts von mittlerweile über 10 Milliarden Web-Sites der Zugang zu den meist unstrukturierten Inhalten des World Wide Web. Suchmaschinen reagieren auf eine Anfrage oft genug mit Tausenden von „Treffern“. Der Zenit klassischer Volltextsuche à la Google, Altavista oder Lycos ist überschritten. Mit dem „Semantic Web“ malt die Vision des WWW-Architekten Tim Berners-Lee deswegen die Zukunft eines nahezu Datenbank-ähnlichen Zuganges zu den Informationsräumen des weltweiten Netzwerkes. Durch das Hinzufügen semantisch aussagekräftiger Informationen sollen sämtliche WWW-Inhalte für den komfortablen Datenzugriff bereit stehen. Hierfür wurden bereits eine Reihe von Web-Standards vorgeschlagen. Mit ihnen soll die Bedeutung von Informationen auf eine standardisierte Weise beschrieben werden. Diese durch Metadaten hoher Qualität angereicherten Internet-Inhalte sollen so maschinell auswertbar werden.

... mehr zu:
»MAP »Metadaten »Semantic »Topic

Dublin Core beispielsweise ist eine Initiative zur Definition standardisierter Basis-Metadaten wie beispielsweise „Autor“. Damit ähnelt das Internet sozusagen einem klassifizierten Dokumentenbestand in einem Dokumentenmanagement-System. Beim Resource Description Framework (RDF) handelt es sich hingegen um eine allgemeine XML-Notation, die das Definieren von Metadaten erlaubt. Somit ist es möglich, eigene Metadatentypen zu erstellen und in einer einheitlichen Syntax zu beschreiben. Mit Topic Maps können nicht nur Metadaten, sondern ganze Zusammenhänge und Modelle dargestellt werden. Kennt man beispielsweise nur die Sowjetunion, kann man dennoch auch Dokumente aus Russland finden, da die Beziehung in den Daten vermittelt wird. Die Web Ontology Language (OWL) schließlich erlaubt dem Anwender nicht nur dieses Schlussfolgern, also den Schluß, dass Russland und die Sowjetunion in Beziehung stehen, sondern ermöglicht auch den Einsatz von Schlußfolgerungssystemen.

Produkte und Technologien auf Basis von Topic Maps


Erst kürzlich verabschiedete das World Wide Web Consortium (W3C) RDF und OWL als Standards. Für eine Prognose über ihren zukünftigen Praxisnutzen erscheint es sinnvoll, die inzwischen 5jährigen Erfahrungen mit dem Topic Map-Standard zu betrachten. Es zeigt sich, dass die Fortschritte trotz aller Bemühungen bis heute recht verhalten sind. Für einen Erklärungsversuch ist es hilfreich, auch den Micro-Kosmos von Unternehmen zu beleuchten. In betrieblichen Intranets stellen sich nämlich ganz ähnliche Aufgaben. Auch hier geht es um den Zugriff auf Dokumenteninhalte.

In Deutschland gibt es derzeit etwa 100 Installationen von Systemen, welche die Topic Map Technologie adaptieren. Im deutschsprachigen Raum sind dies u.a. Empolis, Moresophy, Intelligent Views, USU oder auch Ontopia. Sieht man genauer hin, wird man feststellen, dass kaum einer der Hersteller sich in seinen Funktionen an den vorgegebenen Standard hält. Die meisten Produkte haben Semantic Web-Komponenten sozusagen versteckt unter der Haube. Einige Hersteller entwickelten ihre Produkte auf der Basis bestehender Anforderungen und glichen die Funktionen dann mit dem Standard ab. Die Folge war eine unterschiedliche Spezialisierung. So stellt beispielsweise K-Infinity von Intelligent Views eine Art Objektorientierte Datenbank dar. Dabei sind die Dokumente Objekte, die in viele Beziehungen gebracht werden können. Auf dieses Beziehungsnetz kann man grafisch zugreifen. Einsatz findet ein derartiges System dann, wenn man rasch in Dokumentenbeständen navigieren will und transitive Abhängigkeiten verwertet werden sollen. Lautet die Frage z.B., in welchem Kundenprojekt ein spezielles Produkt zum Einsatz kam, so findet das System entsprechende Inhalte, auch wenn in der Projekt-Dokumentation lediglich ein Modul dieses Produktes angeführt wird.

Der USU KnowledgeMiner nutzt Topic Maps hingegen vor allem zur Suche in Dokumenten. Statt der Dokumente werden Konzepte vernetzt, mit deren Hilfe ein Suchstring generiert wird, den das System wiederum an eine Metasuchmaschine sendet. Die Erstellung des Wissensnetzes ist für die Kunden ein Zusatzaufwand. Folgerichtig geht der Hersteller den Weg, Wissensnetze automatisch zu erstellen und selbstlernende Mechanismen zu integrieren. Zudem werden nicht nur erfolgreich beantwortete Fragen abgelegt, sondern auch Personen oder Rollen aufgeführt, die sich für spezifische Themen interessieren. Praktische Anwendung findet ein solches Werkzeug schwerpunktmäßig in HelpDesks oder CallCentern. Durch die Möglichkeit, auch auf operative Datenbanken zuzugreifen, kommt es auch in Entwicklungs- und Qualitätssicherungsabteilungen zum Einsatz. Als drittes Beispiel sei noch auf Ontoprise verwiesen. Abhängigkeiten, Beziehungen, aber auch Regeln und Bedingungen spiegeln sich in den Ontoprise-Wissensnetzen. Die Technologie wertet die entsprechend komplexen Netzwerkinhalte aus. Beispielprojekte finden sich in der Prototypenentwicklung. Hier können Abhängigkeiten von sich häufig ändernden Bauteilen dynamisch abgebildet und verwertet werden. Andere Anbieter starteten zwar nach der Veröffentlichung des Standards, verfolgen jedoch ebenfalls sehr ausgeprägt eigene Ideen und Anforderungen. Interessanterweise sind Praxisprojekte mit Topic Map-Produkten, sie sich strikt am Standard ausrichten, in nennenswerter Zahl nicht auszumachen.

Die Praxis-Hürden

Aus den erfolgreichen Projekten in diesem Umfeld stammen die Erfahrungen für einige zentrale Herausforderungen, denen sich Organisationen, Hersteller, Berater und Kunden stellen müssen. Dies gilt parallel auch für das Semantic Web. Einige Aspekte seien genannt.

Die semantische Unschärfe

Alle semantischen Techniken formulieren so genannte Konzepte, also begrifflich adressierbare Einheiten der Erlebens- oder Vorstellungswelt. Entsprechend versuchen alle Modelle, diese Konzepte in Beziehung und Zusammenhang zu setzen, um damit Ausschnitte der Welt zu beschreiben. Die Schwierigkeit besteht darin, dass Klassen und Begriffe, ja jede sprachliche Beschreibung per se unscharf ist. Sind nun DDR und BRD zeitliche Nachfolger Deutschlands? Ist eine solche Nachfolge analog jener der Tschechischen und Slowakischen Republik im Falle der Tschechoslowakei? Man sieht, jede sprachliche oder formale Beschreibung vereinfacht und ist dadurch nicht präzise. Das aber macht es sehr schwierig, gemeinsam genutzte Metadaten zu formulieren.

Die Unvollständigkeit

Bringt man die Konzepte und ihre Zusammenhänge zum Ausdruck, beschreibt beispielsweise die Beziehungen zwischen den Ländern, so bleibt immer unklar, welche Bedeutung eine fehlende Beziehung oder ein fehlendes Konzept hat. Ist die Existenz nicht bekannt, gleichgültig oder nicht gegeben?

Es bleibt für den Anwender deswegen nicht nachvollziehbar, ob das Modell vollständig ist oder nicht. Innerbetrieblich sind semantische Modelle meist nur dann erfolgreich, wenn sie zwar nur einen sehr begrenzten Abschnitt repräsentieren, diesen aber klar und vollständig.

Die Subjektivität

Ob nun Russland ein Nachfolger der Sowjetunion ist oder ob diese Rolle besser der GUS zugebilligt werden sollte, ist nicht nur wahr oder falsch sondern hängt auch vom Blickwinkel und Fragekontext ab. Auch hier zeigt die innerbetriebliche Erfahrung, dass Metadaten stets aus einem einheitlichen, klaren Blickwinkel für eine klare Aufgabe und Zielgruppe erstellt werden müssen.

Das fehlenden Businessmodell

Unbestritten profitieren viele Anwender von der Existenz von Metadaten. In aller Regel sind sie jedoch nicht bereit, für deren Nutzung zu zahlen. Dadurch entsteht das Problem, dass sich niemand findet, der die Fülle aussagekräftiger Metadaten pflegt, da niemand bereit ist, diesen Aufwand zu bezahlen. Lohnenswert erscheinen also Überlegungen, wie ein Geschäftsmodell für die Erstellung und den Betrieb von Metadaten aussehen könnte.

Selbstlernen als Lösung?

Einen Lösungsansatz der für das Intranet skizzierten Herausforderungen stellt nach den Erfahrungen der letzten Jahre der Einsatz selbstlernender Verfahren dar. Entscheidend ist, dass diese keinen manuellen Aufwand verursachen. Damit fallen für die Erstellung der für das Semantic Web notwendigen Metadaten auch keine Kosten an. Und somit ist auch ein entsprechendes Businessmodell nicht notwendig. Durch das automatische Entwickeln von Metadaten können diese viel reichhaltiger sein und damit mehr als nur eine Perspektive repräsentieren - wichtige Voraussetzungen, um die Praxisschwierigkeiten mit der Unschärfe und der subjektiven Blickwinkel umgehen zu können. Bereits heute zeichnet sich ab, dass die Entwicklung in diese Richtung gehen wird: Bei Amazon beispielsweise wird der Vorschlag, beim Erwerb eines Buches auch ein anderes dazuzukaufen, durch die Analyse des Nutzungsverhaltens der entsprechenden Käufergruppe generiert. Aus der Häufigkeit der gewählten Kaufvarianten früherer Erwerber schlussfolgert das System einen thematischen Zusammenhang, sozusagen einen semantischen Zusammenhang der Web-Seiten. Aus der Interaktion mit den Anwendern heraus bietet auch Google auf Basis kollaborativer Mechanismen ohne hinterlegtes Wörterbuch eine automatische Rechtschreibkorrektur. Und nach dem Prinzip „Nutzer dieser Seite waren auch Nutzer der folgenden anderen Seiten“ ist es auch vorstellbar, dass im Internet einfach gefunden werden kann.

Ein Wehrmutstropfen bleibt: Auch ein selbstlernendes Verfahren ist nicht in der Lage, alle vorhandenen Beziehungen zu ermitteln. Das Problem der Unvollständigkeit bleibt. Gut möglich hingegen ist es, die relevanten, typischerweise genutzten Beziehungen zu repräsentieren - genau diese ergeben sich aus der Nutzung. Die Anwender stellen andere Anforderungen an ein selbstlernendes Verfahren, welches das „typische“ Wissen sammelt, als an ein administrativ gepflegtes, von dem man deklarative Vollständigkeit erwartet.

Insofern gibt es gute Gründe, anzunehmen, dass wir mittelfristig auch den „Ariadne-Faden“ nutzen können, der uns zielgerichtet durch das Labyrinth des WWW führt.

Harald Huber | USU AG
Weitere Informationen:
http://www.usu.de

Weitere Berichte zu: MAP Metadaten Semantic Topic

Weitere Nachrichten aus der Kategorie Informationstechnologie:

nachricht Neue interaktive Software: Maschinelles Lernen macht Autodesigns aerodynamischer
14.08.2018 | Institute of Science and Technology Austria

nachricht Sicherheitslücken im Internetprotokoll „IPsec“ identifiziert
14.08.2018 | Ruhr-Universität Bochum

Alle Nachrichten aus der Kategorie: Informationstechnologie >>>

Die aktuellsten Pressemeldungen zum Suchbegriff Innovation >>>

Die letzten 5 Focus-News des innovations-reports im Überblick:

Im Focus: Neue interaktive Software: Maschinelles Lernen macht Autodesigns aerodynamischer

Neue Software verwendet erstmals maschinelles Lernen um Strömungsfelder um interaktiv designbare 3D-Objekte zu berechnen. Methode wird auf der renommierten SIGGRAPH-Konferenz vorgestellt

Wollen Ingenieure oder Designer die aerodynamischen Eigenschaften eines neu gestalteten Autos, eines Flugzeugs oder anderer Objekte testen, lassen sie den...

Im Focus: New interactive machine learning tool makes car designs more aerodynamic

Scientists develop first tool to use machine learning methods to compute flow around interactively designable 3D objects. Tool will be presented at this year’s prestigious SIGGRAPH conference.

When engineers or designers want to test the aerodynamic properties of the newly designed shape of a car, airplane, or other object, they would normally model...

Im Focus: Der Roboter als „Tankwart“: TU Graz entwickelt robotergesteuertes Schnellladesystem für E-Fahrzeuge

Eine Weltneuheit präsentieren Forschende der TU Graz gemeinsam mit Industriepartnern: Den Prototypen eines robotergesteuerten CCS-Schnellladesystems für Elektrofahrzeuge, das erstmals auch das serielle Laden von Fahrzeugen in unterschiedlichen Parkpositionen ermöglicht.

Für elektrisch angetriebene Fahrzeuge werden weltweit hohe Wachstumsraten prognostiziert: 2025, so die Prognosen, wird es jährlich bereits 25 Millionen...

Im Focus: Robots as 'pump attendants': TU Graz develops robot-controlled rapid charging system for e-vehicles

Researchers from TU Graz and their industry partners have unveiled a world first: the prototype of a robot-controlled, high-speed combined charging system (CCS) for electric vehicles that enables series charging of cars in various parking positions.

Global demand for electric vehicles is forecast to rise sharply: by 2025, the number of new vehicle registrations is expected to reach 25 million per year....

Im Focus: Der „TRiC” bei der Aktinfaltung

Damit Proteine ihre Aufgaben in Zellen wahrnehmen können, müssen sie richtig gefaltet sein. Molekulare Assistenten, sogenannte Chaperone, unterstützen Proteine dabei, sich in ihre funktionsfähige, dreidimensionale Struktur zu falten. Während die meisten Proteine sich bis zu einem bestimmten Grad ohne Hilfe falten können, haben Forscher am Max-Planck-Institut für Biochemie nun gezeigt, dass Aktin komplett von den Chaperonen abhängig ist. Aktin ist das am häufigsten vorkommende Protein in höher entwickelten Zellen. Das Chaperon TRiC wendet einen bislang noch nicht beschriebenen Mechanismus für die Proteinfaltung an. Die Studie wurde im Fachfachjournal Cell publiziert.

Bei Aktin handelt es sich um das am häufigsten vorkommende Protein in höher entwickelten Zellen, das bei Prozessen wie Zellstabilisation, Zellteilung und...

Alle Focus-News des Innovations-reports >>>

Anzeige

Anzeige

VideoLinks
Industrie & Wirtschaft
Veranstaltungen

Das Architekturmodell in Zeiten der Digitalen Transformation

14.08.2018 | Veranstaltungen

EEA-ESEM Konferenz findet an der Uni Köln statt

13.08.2018 | Veranstaltungen

Digitalisierung in der chemischen Industrie

09.08.2018 | Veranstaltungen

VideoLinks
Wissenschaft & Forschung
Weitere VideoLinks im Überblick >>>
 
Aktuelle Beiträge

Kleine Helfer bei der Zellreinigung

14.08.2018 | Biowissenschaften Chemie

Neue Oberflächeneigenschaften für holzbasierte Werkstoffe

14.08.2018 | Materialwissenschaften

Fraunhofer IPT unterstützt Zweitplatzierten bei SpaceX-Wettbewerb

14.08.2018 | Förderungen Preise

Weitere B2B-VideoLinks
IHR
JOB & KARRIERE
SERVICE
im innovations-report
in Kooperation mit academics