Ein Blick in die Zukunft: die Technik des Web 3.0

Ein Blick hinter die Kulissen des Web 3.0 ist tatsächlich ein Blick in die Zukunft. Viele Ideen werden diskutiert, doch die endgültige Form eines semantischen Webs ist noch nicht abzusehen. Dabei wurde eine der Grundlagen bereits 2001 im Scientific American theoretisch erläutert: das Semantic Web von Tim Berners-Lee, dem Vater von HTML, sowie James Hendler und Ora Lassila. Aktuelle Ansätze diskutieren die Rolle, die Social Collaboration bei der Konstruktion eines Web 3.0 spielen könnte. Die Blogpiloten tauchen tief ein in die wissenschaftliche Materie und kommen mit dem Wesentlichen wieder an die Oberfläche. Das Semantic Web: eine Vision Das Semantic Web ist eine alte Vision, die durch die Web-3.0-Diskussion wieder brandaktuell geworden ist. Dabei ist das Semantic Web nicht etwa ein neues Web, sondern eine Erweiterung des schon bekannten Webs. „Semantik“ ist der Fachbegriff für die Lehre von den Bedeutungen und soll in diesem Zusammenhang andeuten, wie Computer und Maschinen den Sinn von Information erkennen und auswerten können. Dazu bedient sich das Semantic Web dreier grundlegender Techniken.  Technische Grundlagen des Semantic Web: XML, RDF und Ontologien XML steht für eXtensible Markup Language. Damit wird es möglich, Informationen zu verschlagworten. Solche Schlagworte und Labels könnten also etwa „Postleitzahl“ oder „Autor“ sein. Allerdings müssen Schlagworte für den Computer verständlich gemacht werden, denn mit einem Konzept wie „Postleitzahl“ kann er nichts anfangen.  An dieser Stelle kommt RDF ins Spiel. RDF steht für Resource Description Framework und beschreibt dreiteilige Informationseinheiten, die an die klassische Satzstruktur von Subjekt – Prädikat – Objekt angelegt ist. Ein Beispiel wäre: „Klaus Müller“ (Subjekt) „ist der Autor von“ (Prädikat) „dem Buch Kochen für Anfänger“ (Objekt). Jeder dieser Teile kann nun mit einer eindeutigen Referenz verlinkt werden, einer sogenannten URI (Universal Resource Identifier). Solche URIs kennt man schon aus dem heutigen Web: Adressen wie www.blogpiloten.de sind URIs. Ein Computer könnte mit solchen Informationen eine Frage wie „Wer ist der Autor von Kochen für Anfänger?“ beantworten, indem er untersucht, welche Information (Subjekt) sowohl mit „ist der Autor von“ (Prädikat) als auch mit „Kochen für Anfänger“ (Objekt) verlinkt ist.

Nova Spivack: We are going from a Web of connected documents to a Web of connected data (Quelle)

Als dritter Bestandteil kommen Ontologien ins Spiel. Eine Ontologie ist ein Dokument, das die Beziehung zwischen verschiedenen Begriffen beschreibt. Damit lassen sich die Informationen erweitern. Zwei Beispiele mit zwei unterschiedlichen Verfahren:

  • Taxonomien: Taxonomien sind Klassifizierungen von Informationen, die sich verschachteln lassen. So gehört „Postleitzahl“ etwa zu einer „Stadt“, die wiederum eine „Homepage“ hat. So könnte man von einer Postleitzahl also auf die dazugehörige Stadt und die Homepage schließen und hätte eine neue, wichtige Information.
  • Inferenzregeln: Inferenzregeln bezeichnen logische Ableitungen und machen Ontologien erst so richtig spannend. Wenn eine „Postleitzahl“ also mit einer „Stadt“ verknüpft ist, dann liegt sie auch in dem „Land“, in dem die „Stadt“ liegt. Benutzt eine „Adresse“ nun diese „Postleitzahl“, kann man logisch schlussfolgern, dass sie in dem betreffenden „Land“ liegt, auch wenn das Land gar nicht explitzit angegeben ist. Mit dieser Information könnte ein Programm automatisch eine Adresse so formatieren, wie es im betreffenden Land üblich ist, oder auf die benötigte Sprache rückschließen.

URIs: Der Schlüssel zum Semantic Web? Wie bereits ausgeführt wurde, sind URIs (Universal Resource Identifier) ein wichtiger Schlüssel, um dem Computer Bedeutungen klarzumachen. Computer verstehen Bedeutungen nicht in dem Sinne, in dem Menschen sie verstehen; aber sie haben keine Probleme damit, sie miteinander zu vergleichen. Hat also die Information „Wohnort“ die gleiche URI wie „ist wohnhaft in“, „versteht“ der Computer, dass das Gleiche gemeint ist. Damit werden auch Sprachbarrieren abgebaut, denn alle Übersetzungen von „Wohnort“ verweisen einfach auf die gleiche URI. Es gibt allerdings zwei Dinge zu bedenken: zum einen müssten die verwendeten URIs wirklich eindeutig sein, denn ein Computer kann nicht erkennen, dass ein Begriff wie „Bank“ verschiedene Objekte bezeichnen kann. Das aktuelle Internet-Protokoll IPv4 sieht jedoch nur 4 Milliarden eindeutige URIs vor – wenig in globalen Maßstäben bemessen. Seine Weiterentwicklung IPv6 erweitert die Zahl der möglichen URIs allerdings auf 340 Sextillionen – viel Spielraum für das Semantic Web. Der zweite Punkt ist allerdings die Zuordnung dieser eindeutigen URIs. Denn das Semantic Web kann nur funktionieren, wenn möglichst viele Informationen richtig miteinander verknüpft sind. Computer können diese Verknüpfungen aber nur innerhalb gewisser Grenzen vornehmen: zwar können sie von einer „Postleitzahl“ auf eine „Stadt“ schließen, wenn sie eine entsprechende Liste haben, und den Link selbst setzen. Aber sie können nicht mit Informationen wie „ist der Autor von“ hantieren und schon gar nicht erkennen, dass „hat das Buch geschrieben“ damit verknüpft werden sollte. Wird das Web 2.0 zum Geburtshelfer des Web 3.0? Nach Ansicht einiger Autoren kommt an dieser Stelle das Web 2.0 ins Spiel. Marc Fawzi etwa beschreibt in einem Beitrag zum Web 3.0, wie Tausende von Nutzern zusammenarbeiten könnten, um die erforderlichen Verknüpfungen zu erstellen. Er stellt sich diese Zusammenarbeit als eine Art „Wikipedia 3.0“ vor. Eine weitere Rolle in der Schaffung des Web 3.0 werden nach Ansicht einiger Autoren Verfahren der künstlichen Intelligenz spielen. Die Grundlage jedoch dürfte das Semantic Web bilden, das es dem Computer erst ermöglicht, Sinn zu verstehen und das Web mit Bewertungen zu versehen. Links zum Thema:

Schlagwörter: , , ,
Björn Rohles

Björn Rohles

ist Medienwissenschaftler und beobachtet als Autor („Grundkurs Gutes Webdesign“) und Berater den digitalen Wandel. Seine Themenschwerpunkte sind User Experience, anwenderfreundliches Design und digitale Strategien. Er schreibt regelmäßig für Fachmedien wie das t3n Magazin, die Netzpiloten oder Screenguide.

More Posts - Website - Twitter - Facebook - Google Plus