Drucken gegen das Vergessen: Wie alt werden Daten?

Das Internet bietet uns die Möglichkeit, all unser Wissen digital zu speichern und so für alle, zu jeder Zeit, an jedem Ort zugänglich zu machen. Doch dieses Wissen ist bedroht. Google-Chef Vint Cerf warnte kürzlich davor, dass wir zu einem vergessenen Jahrhundert gehören könnten. Wenn wir unsere Daten nicht entsprechend pflegen und aufbewahren, könnte all unser Wissen in 100 Jahren im schwarzen Loch des Internets verschwinden.

Was wäre, wenn wir all unsere Erinnerungen, alle technischen Errungenschaften unserer Zeit, all unsere zeitgenössische Kunst und Literatur, all unser aktuelles Wissen komplett verlieren würden? Wenn unser Jahrhundert mit einem Schlag komplett ausgelöscht würde, ohne dass auch nur ein einziger Bruchteil davon für nachkommende Generationen gespeichert wäre?

Das ist keine Szene aus einem Science-Fiction Film, sondern ein wahrscheinliches Zukunftsszenario, zumindest wenn es nach Google-Präsident Vint Cerf geht. Cerf warnte vor Kurzem davor, dass unsere Gesellschaft vor einem “vergessenen Jahrhundert” steht. Er befürchtet, dass all unsere Daten unwiderrufbar verloren gehen werden, wenn wir nicht bald anfangen, unser digitales Wissen zu archivieren.

Können wir all unser Wissen verlieren?

Wie kann denn all unser Wissen komplett verloren gehen? Wissensverlust ist kein neues Phänomen. Naturkatastrophen, Kriege, Verwüstung, Witterung oder auch einfach Zeit, haben das Wissen ganzer Gesellschaften zerstört. Die Bibliothek von Alexandria wurde etwa im 3. Jahrhundert vor Christus gebaut und galt über 700 Jahre lang als das “Gehirn und die Pracht der Antike,” wie der US-amerikanische Astrophysiker Carl Sagan es beschreibt. Hier wurden alle großen Werke der Zeit über Philosophie, Literatur, Technik, Mathematik und Medizin aufbewahrt. Wenige hundert Jahre später gab es die Bibliothek nicht mehr, das gesamte Wissen darin ist beinahe vollständig verloren gegangen – und keiner weiß genau wie und warum.

Das Internet ist unsere Bibliothek von Alexandria. Ein Versprechen, dass unsere Daten hier für immer und ewig gespeichert bleiben. Hier veröffentlichen wir deshalb all unsere technischen Errungenschaften, hier speichern wir Konzepte zum Bau von Flugzeugen und Ergebnisse zur Dechiffrierung genetischer Codes. Hier sind ebenfalls all unsere privaten Informationen in Emails, Fotos oder Chats gespeichert. Hier finden sich aktuelle Nachrichten, Zeitungsreportagen, Kunstprojekte, Musik und Filme. Doch genau wie die Bibliothek von Alexandria ist auch dieses Wissen bedroht. Unser digitales Wissen ist dabei noch fragiler und kann noch schneller verloren gehen als die Bücher und Papyrusrollen der Antike.

Digitale Daten nicht für die Ewigkeit

Denn digitale Speichermedien sind nicht für die Ewigkeit gedacht. Wie viele von uns haben schließlich noch alte Disketten, die sie aber in keinem neuen Computer mehr abspielen können? Daten auf Webseiten, die es noch vor vier Jahren gab, sind jetzt schon nicht mehr verfügbar. So hat ein US-amerikanischer Pulitzer-Preisträger seine jahrelangen Recherchen beinahe verloren, weil die Webseite, auf der er sie publiziert hatte, eingestellt wurde. Es gibt verschiedene Gründe, warum unser digitales Wissen so instabil ist:

  • Programme, die alte Speichermedien abspielen können, werden nicht mehr produziert und sind nicht mehr verfügbar.

  • Um 700 Jahre alte Dokumente zu lesen, brauchen wir nur unsere Augen. Digitale Dokumente erfordern aber komplizierte Datenentschlüsselung durch Experten – ein Wissen, das, falls es weder gespeichert noch weitergegeben wird, schnell verloren gehen kann. Wer beschäftigt sich schließlich heute noch damit, die Programmierung von “antiken” 1.0 Webseiten zu verstehen?

  • Es existieren kaum physische Artefakte. Wir speichern alles digital ab und wenn wir das Wissen zum Dekodieren dieser Information verlieren, sind auch all unsere Daten unweigerlich verloren.

  • Software, Hardware sowie Webseiten werden zu Opfern von “bit rot”. Das heißt, sie werden nicht mehr genutzt oder eingestellt und verkommen mit der Zeit zu digitalem Müll. 1997 war die Lebensdauer einer Webseite rund 44 Tage, 2011 etwa 100 Tage und etwa 8 Prozent aller Links funktionieren nach einem Jahr nicht mehr.

  • Die digitalen Daten werden immer komplexer und die Mengen immer gigantischer: 1994 gab es weniger als 3000 Webseiten, 2014 wurde die Milliardengrenze überschritten – und jede Sekunde kommen neue dazu.

Wir füttern also all unsere Daten ins Internet, weil wir glauben, hier seien sie sicher. In Wirklichkeit aber saugt das Internet all diese Daten auf, und wenn wir sie nicht pflegen und archivieren, verschwinden sie darin für immer wie in einem schwarzen Loch.

Archivierung von Wissen ist eine internationale Aufgabe

Das Problem haben neben Internetpionier Vint Cerf auch andere erkannt. So bemüht sich zum Beispiel die British Library darum, britische Webseiten zu archivieren. Die British Library will aber nicht nur Dokumente archivieren, sondern auch Töne, also Musik, vergessene Dialekte und wichtige Reden. Auch das US-amerikanische Internet Archive bietet Nutzern freien Zugang zu Millionen von Büchern, Liedern, Filmen und archivierten Webseiten.

Doch das sind für viele Wissenschaftler Babyschritte, die einfach nicht weit genug gehen. So fordert die Gruppe Collaboratory, ein Zusammenschluss von deutschen Wissenschaftlern, die sich der Langzeitarchivierung verschrieben haben, dass die Speicherung unseres Wissens eine internationale Aufgabe werden muss.

In Deutschland ist die Archivierung vor allem Ländersache, was aber zum Speichern von Daten völlig unpraktisch ist. Soll jedes Bundesland eine eigene Software zum Archivieren von Daten entwerfen? Sollen die relevanten Daten in jedem Landesarchiv doppelt und dreifach abgespeichert werden? Überhaupt tauchen beim Thema Langzeitarchivierung viele Fragen auf.

Da wäre zunächst mal die Mammut-Aufgabe an sich, alle wichtigen Daten der Welt für alle zugänglich aufzubewahren. Wer soll sich darum kümmern, und, noch wichtiger, wer soll diesen riesigen technischen Aufwand bezahlen? Datenarchivierung ist darüber hinaus etwas, was viele Bereiche betrifft: Archivwissenschaften und Bibliothekwissenschaften, die das Wissen zum Speichern und Aufbewahren mitbringen; Rechtswissenschaften, die das Urheberrecht sowie die individuelle Privatsphäre – zwei der schwierigsten Knackpunkte für Langzeitarchivierung – klären müssen, Kulturwissenschaften und Geschichtswissen, die einschätzen, was eigentlich gespeichert werden soll; Architektur, die Konzepte entwerfen muss, wie auch sehr empfindliche wissenschaftliche Daten über Jahrhunderte gegen Wind und Wetter sowie gegen künftige Umweltkatastrophen aufbewahrt werden sollen, die Informatik, die technische Konzepte für die Archivierung entwickeln muss und viele mehr.

Es ist keine Aufgabe, die ein einziges Land alleine bewältigen kann. So hat die UNESCO einen ersten Versuch gestartet, um diese Herausforderung international und interdisziplinär zu bewältigen. Auch auf EU-Ebene gibt es erste zögerliche Versuche.

Also doch alles ausdrucken?

Selbst, wenn vielen klar ist, dass die Informationen unserer Zeit gespeichert werden müssen, ist das wie noch problematisch und wirft viele Fragen auf: Welche Daten sollten archiviert werden? Sollten Webseiten von 1995 in aktuellen Browsern dargestellt werden oder ist es wichtig, sie ganz authentisch in den Browsern dieser Zeit zu zeigen? Sind unsere Facebook-Fotoalben wichtig für zukünftige Generationen? Sollten wir alle unsere Tweets aufbewahren, wie es die amerikanische Library of Congress tut?

Google schlägt hier ganz kategorisch vor, wirklich jeden kleinsten Bit aufzubewahren, also jede Email und jedes Foto. Kritikern geht das zu weit. Sie befürchten, dass so eine uneingeschränkte Sammlung all unserer privaten und persönlichen Daten entsteht, ohne unser Wissen und ohne unsere Zustimmung.

Historiker wiederum sind besorgt, gerade die Daten der “Durchschnittsbürger” zu ignorieren. Denn die meisten Dokumente, die wir aus früheren Jahrhunderten kennen, wurden von einer Elite erstellt und beschreiben auch hauptsächlich nur das Leben von Adligen oder Königen. Private Briefe von Bürgern sind selten, liefern aber oft sehr wichtige Informationen über den Alltag und die Probleme einer Epoche.

Diese Debatte zeigt auch, dass der Zugang zu Wissen und auch die Entscheidung darüber, welches Wissen bewahrt, gelehrt und als wichtig erachtet wird, eine Machtfrage ist. Genau deshalb schlagen einige Gruppen vor, Langzeitarchivierung als Open-Source-Projekt umzusetzen, sodass jeder zur Wissensspeicherung beitragen kann und auch alle offenen Zugang zu diesem Wissen haben.

Bislang sind wir allerdings von einem weltweiten, offenen Wissens-Archiv all unserer Daten noch weit entfernt. Vielleicht sollten wir also bis dahin tatsächlich dem Rat von Vint Cerf folgen und alles, was uns wichtig ist, ausdrucken.


Image (adapted) “Canon printer in action” by Jamison Judd (CC BY 2.0)


 

begann ihren journalistischen Werdegang bei kleinen Lokalzeitungen und arbeitete dann während ihres Studiums als Reporterin für den Universitätsradiosender. Ihr Volontariat machte sie bei Radio Jade in Wilhelmshaven. Seit 2010 hat sie ihren Rucksack gepackt und bereist seitdem rastlos die Welt – und berichtet als freie Journalistin darüber. Über alle „inoffiziellen“ Geschichten schreibt sie in ihrem eigenen Blog fest. Mitglied des Netzpiloten Blogger Networks.


Artikel per E-Mail verschicken
Schlagwörter: , , , , , ,

1 comment

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert