Suchmaschinenoptimierung

transparent und partnerschaftlich

Jetzt anfragen!

archive.org – Wayback Machine

Die Wayback Machine (archive.org) ist ein digitales Archiv und ein Teil des „Internet-Archive“. Dieses sammelt Informationen aus dem World Wide Web und legt diese in einem Archiv ab. Gründer des Internet-Archive und somit auch der Wayback Machine ist Brewster Kahle, der sich auch für Alexa verantwortlich zeigt. Mit der Wayback Machine hat man somit die Möglichkeit, alte Versionen einer Webseite abzurufen und zu betrachten. Der Name leitet sich aus einer bekannten Cartoon-Serie ab:  „The Rocky and Bullwinkle Show“. Hier wurde eine Zeitmaschine mit dem Namen „WABAC-Machine“ (gesprochen Wayback) verwendet.

Brewster Kahle und das Internet-Archive

Die Wayback Machine ist im Grunde genommen ein digitales Archiv, welches Momentaufnahmen von Webseiten aufzeichnet und speichert, als Teil des übergeordneten Internet-Archive. In den USA wurde dem Internet-Archive der Status einer Bibliothek eingeräumt, somit ist die Sammlung von Web-Inhalten dort legitimiert. Über die Landesgrenzen hinaus greifen allerdings lokale Gesetzgebungen, eines von mehreren Problemfeldern dieser Art der Informationsdokumentation.

Ins Leben gerufen wurde dieses Projekt bereits 1996 und die hierfür benötigten Daten wurden über Alexa Internet, ebenfalls ein Projekt von Brewster Kahle, gesammelt. Somit ist eine vollständige oder komplette Abbildung des World Wide Web und all seiner Seiten ausgeschlossen, da Alexa nur einen Ausschnitt der Gesamtmenge dokumentiert. Seit dem Jahr 2009 wird das Open Directory Project als Bezugsquelle genannt, hier gelistete Seiten werden auch in die Wayback Machine aufgenommen. Dennoch ist diese Open Library wohl in Größe und Umfang einzigartig.

Problemfelder von archive.org

Die Wayback Machine ist somit mit mehreren, größeren Problemen und Unzulänglichkeiten konfrontiert; bereits angesprochen wurden die einzelnen, rechtlichen Situationen außerhalb der USA, die bis heute teilweise noch nicht restlos geklärt sind, zum anderen auch die Unvollständigkeit der Daten, die gespeichert werden. Hinzu kommt eine Unregelmäßigkeit, in der die Momentaufnahmen der einzelnen Seiten festgehalten werden. Somit kann nicht sichergestellt werden, dass jede Veränderung oder jedes Update einer einzelnen Seite auch von der Wayback Machine festgehalten wird.

Zumindest dem Problem des Datenschutzes und des Urheberrechts versucht man entgegenzukommen, in dem man die sogenannten Opt-out Markierungen berücksichtigt – mit Hilfe einer robots.txt-Datei im Hauptverzeichnis kann man nicht nur den Crawler daran hindern, die Seite zu indexieren, sondern auch die Wayback Machine, mit Hilfe der folgenden Syntax:

User-agent: ia_archiver
Disallow: /

Aber selbst diese Opt-out Markierungen sind in Europa rechtlich fragwürdig und noch nicht gänzlich geklärt.
Grundsätzlich erfolgt eine Veröffentlichung einer Momentaufnahme einer Website innerhalb der Wayback Machine erst nach 6 Monaten, in Ausnahmefällen kann diese Zeitspanne auch ein Jahr oder länger sein. Die Blockierung durch eine entsprechende robots.txt ist leider auch fehleranfällig, zumal auch Seiten dokumentiert werden, in denen keine Inhalte gesperrt werden können; ein gutes Beispiel hierfür sind Foren.
Darüberhinaus wechseln Seiten häufig den Besitzer, der Vorgänger und der neue Besitzer verfolgen unterschiedliche Interessen, sodass keine einheitliche Linie bezüglich der Freigabe gegeben sein muss. Auch Multimedia-Elemente, dynamische Inhalte und Grafiken werden nur bedingt archiviert.

Fazit

Die Wayback Machine ist ein interessantes Projekt und bietet einen Rückblick bis ins Jahr 1996 an. Man hat die Gelegenheit, alte Versionen und Impressionen von Webseiten abzurufen und zu betrachten, allerdings ohne Gewähr auf Vollständigkeit, in jederlei Hinsicht.

Sie wollen besser gefunden werden?

Jetzt kostenlos und unverbindlich anfragen!