Wikipedia und das Drama der Relevanz

Der andauernden Löschdiskussion zwischen Inkludisten und Exkludisten fügt die Informationsarchitektin Regine Heidorn die Perspektive der Wissenschaft hinzu. In computergestützt arbeitenden Forschungsprojekten gestalten sich Relevanzkriterien ihrer Erfahrung nach anders: Dort zählt weniger die Qualität einzelner Artikel als die Gesamtheit der zur Verfügung stehenden Daten.

Die Löschdiskussion der deutschsprachigen Wikipedia sind in den letzten Monaten ein im Netz leidenschaftlich diskutiertes Thema. Ganz neu ist das Phänomen nicht, es gab öfter Beschwerden über vermeintlich zu unrecht gelöschte Einträge. Der gesammelte Unmut spaltet sich in zwei Lager: Inkludisten und Exkludisten. Erstere vertreten den Standpunkt, da genügend Serverplatz zur Verfügung stünde, könnten unfertige oder noch nicht ausreichend recherchierte Einträge erhalten bleiben. Auch als Aufforderung, die Einträge zu verbessern und damit als Anreiz zur Mitarbeit bei Wikipedia. Die Exkludisten dagegen argumentieren, bestehende Einträge müssten auch gepflegt und aktualisiert werden, das wäre nicht für jeden Eintrag möglich, die Nutzergemeinde sei zu klein. Daher sei es besser, Einträge, die nicht genügend ausgearbeitet seien oder den Relevanzkriterien von Wikipedia nicht gerecht werden, gleich zu löschen.

Ein wesentlicher Punkt wurde in der bisherigen Wikipedia-Diskussion, die sich in der deutschsprachigen Community zwischen Inkludisten und Exkludisten im Kreis dreht, kaum beachtet: Die Kriterien für Relevanz einer Online-Enzyklopädie sollten sich auch an der Online-Nutzung derselben ausrichten und mit deren Veränderungen und Ansprüchen wachsen. An dieser Stelle kann man vermuten, dass die Relevanzkriterien von Offline-Enzyklopädien aus und an den Nutzungsansprüchen erwuchsen. Und sicher u. a. von der Verfügbarkeit der Ressource Papier sowie erforderlichen Aktualisierungszyklen abhängen.

Diese banale Feststellung erhält Gewicht, wenn der Begriff “Online-Nutzung” erweitert wird auf die wissenschaftliche Online-Nutzung, genau so, wie Offline-Enzyklopädien wissenschaftlich genutzt werden. Allerdings unterscheiden sich die Methoden wissenschaftlicher Online-Nutzung von denen der wissenschafltichen Offline-Nutzung und genau hier ist der Ansatzpunkt, der im Folgenden anhand eines Beispiels beleuchtet werden soll.

Soweit mir die Diskussion bekannt ist, geht es bei den konträren Standpunkten der In- und Exkludisten allein um Kriterien der Relevanz, nicht um tatsächliche Ressourcen-Probleme. Auch dem hartgesottenen Inkludisten ist klar, dass es unsinnige Beiträge gibt. Die Exkludisten dagegen argumentieren nicht mit einem Löschzwang aufgrund mangelnden Serverplatzes. Die künstliche Verknappung relevanten Wissens für Offline-Enzyklopädien, so arbiträr sie vom Gedanken des unbegrenzbaren Wissenshorizonts, wie ihn Popper formuliert hat, erscheinen mag, hatte in der Knappheit der Seiten zumindest eine materiell begründbare Grenze. Die Frage ist nun, inwieweit die Relevanzkriterien einer Offline-Enzyklopädie für eine Online-Ausgabe übernommen werden können. Und inwiefern die wesentlich erweiterte Verfügbarkeit der Ressource Serverplatz die Kriterien für relevante Inhalte beeinflusst.

Sofern es darum geht, als neues digitales Medium ein etabliertes analoges Medium zu verdrängen oder dieses in seinen Leistungen zu übertreffen, erscheint es nur konsequent, sich direkt am analogen Vorbild zu orientieren und den Beweis der Überlegenheit durch Übernahme der vorhandenen Relevanzkriterien anzutreten. Genau darum drehte sich die Wikipedia-Diskussion in den Anfängen. Diesem Stadium ist Wikipedia lange entwachsen und kämpft nun mit anderen Problemen: so zum Beispiel – stellvertretend für die Herausforderungen der alltäglichen Nutzung – mit der Widersprüchlichkeit der Kriterien (Vorsicht, Polemik).

Ein Blick auf die wissenschaftliche Nutzung zeigt ein anderes Bild: Ende 2009 fand am Deutschen Archäologischen Institut in Kooperation mit dem Exzellenzcluster Topoi ein Workshop zum semantischen Daten-Modell CIDOC-CRM statt. Aus dem Workshop möchte ich ein Projekt herausgreifen, um zu zeigen, in welchen Bereichen eine wissenschaftliche Nutzung von nutzergenerierten Inhalten im Internet stattfindet.

Einzug digitaler Methoden in die wissenschaftliche Methodologie

From Questions to Answers – Travelling from Perseus to Arachne and Anywhere” (PDF, 3.8 MB) – bei diesem Projekt geht es um einen “einfachen Anwendungsfall”. Ein Historiker arbeitet an der Entwicklung des alten Pergamon. Um die Bedeutung der Befunde interpretieren zu können, folgt eine Recherche zu allen Nennungen von Pergamon in den unterschiedlichsten Quellen (Literatur, Funde, sonstige Artefakte, Museen etc.). Die Frage ist, wie maschinen-verwertbare Daten zu diesem Zweck vorgehalten werden können. Dafür kann unter anderem die archäologische Objektdatenbank Arachne verwendet werden. Um möglichst viele Quellen mit Nennungen unterschiedlichster Aspekte einzubeziehen, wurde in diesem Beispiel auch eine semantische Abfrage an Wikipedia einbezogen, in dem Fall über DBpedia, eine Plattform die ihrerseits strukturierte Daten aus Wikipedia extrahiert und semantisch aufbereitet wieder zur Verfügung stellt.

Von der Nutzung solcher digitaler Methoden versprechen sich Wissenschaftler genauere und umfassendere Ergebnisse, als sie bisher möglich waren. Dieses Versprechen begründet sich in der Möglichkeit größerer Unabhängigkeit von Ressourcen (Reisen zu Archiven, begrenzte Bearbeitungszeit zwingt zur Eingrenzung der Forschungsfragen auf relevante Kriterien). Ähnlich dem Schritt von der Offline- zur Online-Enzyklopädie wird es nun möglich, virtuell mehr und umfangreichere Datenbanken und Archive als Forschungsgrundlage anzuzapfen. Sofern die Datengrundlage semantisch gründlich aufbereitet wurde, sind wesentlich komplexere Forschungsfragen über Datenbank-Queries in kürzerer Zeit möglich. Zusätzlich können mehrere Disziplinen über neutrale Beschreibungen miteinander verknüpft werden. Hier lösen sich die Grenzen von interdisziplinärer Forschung über transdisziplinäre zu disziplinneutraler Forschung auf.

Zurück zu den Anforderungen an Relevanzkriterien einer Online-Enzyklopädie: Eine digitale Enzyklopädie wird relevant bleiben, sofern sie sich den digitalen Nutzungsbedürfnissen anpasst. Für die in den Beispielen dargestellte Nutzung spielt es z. B. keine Rolle, ob die Befunde in einem exzellenten Artikel verfasst sind: sogar unfertige Artikel, die als Solche nicht gerade menschenlesbar sind, werden relevant, weil sie im semantischen Gerüst der Wikipedia maschinenlesbar ausgewertet werden können. Die Relevanzkriterien einer Online-Enzyklopädie sollten der Funktion als Wissensspeicher, auch für interdisziplinär verbundene Fragmente von Wissen, gerecht werden. Die Nutzung von Wikipedia in diesem Rahmen würde es der digitalen Enzyklopädie ermöglichen, das zu leisten, was auch der Brockhaus im analogen Bereich geleistet hat: eine Verbindung von Wissenschaft und Alltag herzustellen.

Und zwar nicht mehr einseitig kanonisiert durch eine geschlossene Redaktions- oder Admingruppe, sondern zu gegenseitigem Nutzen. Nicht nur könnte die Qualität von Wikipedia-Einträgen allgemein gehoben werden, indem Wissenschaftler mehr beitragen, weil sie gut auf die vorhandene semantische Struktur aufsetzen können. Es könnten auch andere fachlich Interessierte weltweit ihre Daten beitragen. Und wenn das nicht Wikipedia ist, dann wird eine andere Plattform diese offene Stelle besetzen.

Crosspost von digiom.de

Unter Mitarbeit von Jana Herwig