Das Internet Archive ist eine Website im Internet, die Kulturgüter digital, kostenlos und frei verfügbar für die Öffentlichkeit anbietet.
Im Herbst 2021 feierte das digitale Archiv bereits seinen 25. Geburtstag: Gegründet wurde es im Oktober 1996 von Brewster Kahle. Der Informatiker und Bibliothekar hatte schon damals eine große Vorliebe für digitale Sammlungen und die Bewahrung von Kulturgütern. Seine Vision: Der Menschheit einen universalen Zugang zum gesamten vorhandenen Wissen bieten.
Zur Umsetzung dieses Ziels macht sich das Internet Archive die digitalen Speichermöglichkeiten zunutze: Es bietet Zugang zu Digitalisaten von Texten und Büchern, Musik und Audiomaterialien, Videos, Software und auch Bildern, Fotos und Grafiken. Am bekanntesten dürfte die Wayback Machine sein, ein Archiv für Internetseiten.
Sammeln, bewahren, zugänglich machen: So arbeitet das „Internet Archive“
Alexis Rossi
Vor 20 Jahren gründete sich in den USA die gemeinnützige Organisation „Internet Archive“. Sie hat sich zur Aufgabe gemacht, Webseiten, Texte, Fotos, Audio- und Video-Werke sowie Videospiele und Software dauerhaft zu speichern und zur Verfügung zu stellen. Alexis Rossi vom Internet Archive beschreibt, wie sich dessen Arbeitsfelder und Ziele fortentwickelt haben. »mehr
Dieser Text erklärt zwei wesentliche Funktionen des Internet Archive: Wie man mit der Wayback Machine archivierte Websites recherchieren und über die digitale Bibliothek Bücher ausleihen kann.
Wayback Machine: Zeitmaschine fürs Internet
Erreichbar ist die Hauptseite des Internet Archive über archive.org. Dort stößt man gleich auf die Wayback Machine. Es handelt sich dabei um eine Suchmaschine, mit der man archivierte Internetseiten durchforsten und aufrufen kann – quasi eine Zeitmaschine fürs Internet.
Mehr als eine Milliarde URLs speichert das Internet Archive nach eigenen Angaben – jeden Tag. Die Angabe bezieht sich dabei nicht nur auf die Hauptseite eines Internetangebots – zum Beispiel irights.info – sondern auch auf dessen Unterseiten, die durch eigene Adressen aufrufbar sind. Im Falle von irights.info wären das zum Beispiel die Artikel, die jeweils unter einer eigenen URL abgespeichert sind.
Das ist wichtig für die Suche: Man kann also etwa herausfinden, wie eine bestimmte Website zu einem gegebenen Zeitpunkt ganz allgemein aussah; oder auch, wie sich die dazugehörigen Unterseiten darstellten. Voraussetzung dafür ist, dass die URL zum jeweiligen Zeitpunkt gespeichert wurde (mit sogenannten „Snapshots“).
Snapshots: Momentaufnahmen einer Website zum Zeitpunkt X
Der Screenshot zeigt, wie oft URLs der Seite irights.info beim Internet Archive gespeichert wurden: Ein Klick auf den Zeitstrahl am oberen Ende der Seite öffnet eine Kalenderansicht für das jeweilige Jahr: Ist ein Tag in diesem Kalender hellblau eingekreist, wurde die URL per Snapshot gespeichert (in der Regel sind auch Uhrzeitangaben enthalten).
Internet Archive/Wayback Machine (Screenshot: iRights.info)
So sah irights.info am 18. März 2005, also vor rund 17 Jahren aus. Das Webportal war kurz zuvor gestartet. Der im Screenshot gezeigte Snapshot ist zudem unter einer eigenen URL beim Archiv gespeichert und abrufbar.
Internet Archive/Wayback Machine, irights.info (Screenshot: iRights.info)
Ein zweites Beispiel: spiegel.de (SPIEGEL ONLINE) kurz nach der US-Präsidentschaftswahl zwischen George W. Bush und Al Gore. In diesem Fall sind auch viele der verlinkten Unterseiten von spiegel.de mit eigenen Snapshots gespeichert und abrufbar. Interessierte können sich also nicht nur ein genaues Bild von der Hauptseite machen, sondern durch die Artikel auf spiegel.de stöbern, als wäre heute der 9. November 2000.
Internet Archive/Wayback Machine, spiegel.de (Screenshot: iRights.info)
Interessierte können mithelfen, das Netz zu archivieren
Die hier vorgestellten Funktionen der Wayback Machine sind auch über eigene Browser-Addons erreichbar, etwa für Mozilla Firefox oder Google Chrome. Mittels dieser kann man zudem mithelfen, das Internet zu archivieren, indem man selbst Snapshots bestimmter Seiten anfertigt und diese der Wayback Machine zur Verfügung stellt.
Auch über web.archive.org lassen sich URLs von Websites manuell eintragen und so für die Nachwelt sichern. Technisch Versierten stehen zudem mehrere Programmierschnittstellen (API) zur Verfügung.
Das Internet Archive kann übrigens nur frei zugängliche Websites aufrufen und archivieren. Ist ein Text einer Online-Zeitung zu einem bestimmten Zeitpunkt hinter einer Paywall, kann der Text selbst nicht archiviert werden: Es bleibt bei einem Snapshot samt Paywall.
Bücher digital ausleihen und mit ihnen arbeiten
Neben der Wayback Machine bietet das Internet Archive mit der digitalen Bibliothek ein weiteres Recherchetool: Wer etwa eine vergriffene Ausgabe sucht oder vor dem Erwerb einen Blick in ein bestimmtes Buch werfen will, kann die digitale Buchausleihe konsultieren.
Für diese arbeitet das Internet Archive mit verschiedenen Bibliotheken zusammen (vor allem aus den USA), die hochauflösende Scans anbieten. Das Angebot ist auch für Nutzer*innen aus Deutschland erreichbar, es braucht lediglich ein Konto.
Bücher recherchieren und Suchergebnisse filtern
Ist man eingeloggt, kann man hier nach dem gewünschten Buch suchen und dafür auf übliche Suchfunktionen zugreifen, etwa was Titel, Autor*in, Jahrgang, etc. betrifft. Auch diverse Filteroptionen sind verfügbar, zum Beispiel bestimmte Sprachen, Sammlungen oder Themen. Diese lassen sich auf der Leiste an der linken Seite an- und abwählen.
Internet Archive/Digital Library (Screenshot: iRights.info)
Ist das gewünschte Buch gelistet, lässt es sich in digitaler Form ausleihen und im Browser betrachten: Das bedeutet, man erhält für einen begrenzten Zeitraum Zugang zum Werk (für eine Stunde oder 14 Tage). In bestimmten Fällen ist es auch möglich, das Buch herunterzuladen und lokal damit zu arbeiten (in der Software Adobe Digital Editions, die mit einem Kopierschutz arbeitet).
Internet Archive/Digital Library (Screenshot: iRights.info)
Die digitale Bibliothek bietet verschiedene weitere Funktionen, etwa durch das Buch zu blättern und Seiten zu vergrößern, Lesezeichen zu setzen, gezielt den maschinenlesbaren Text zu durchsuchen (mit der kleinen Lupe links oben), oder sich bestimmte Passagen vorlesen zu lassen. Auch gibt es verschiedene Speicher- und Verwaltungsoptionen.
Digitale Ausleihe, analoge Logik
So gut die digitalen Werkzeuge auch funktionieren: Es stehen nicht unbegrenzt viele Exemplare eines Buchs zur Verfügung und das hat Auswirkungen auf die Nutzung. Man könnte auch sagen: Die Logik des digitalen Ausleihens orientiert sich an physischer Knappheit.
Vier Verlage verklagen das Internet Archive wegen „Notfall-Bibliothek“
Georg Fischer
In den USA verklagen mehrere große Verlage das Internet Archive, weil sie ihre Urheberrechte verletzt sehen. Das bedroht die Existenz des digitalen Archivs und kann neue Konflikte zwischen Verlagen und Bibliotheken um digitale Ausleihen schüren. »mehr
Das heißt, hat eine andere Person gerade Zugriff auf das gewünschte Buch, muss man warten, bis dieses wieder „zurückgegeben“ wird. Wer also ein Buch nicht mehr braucht, tut gut daran, es auch vor Ablauf der Leihfrist zurückzugeben: Eine andere Person mag sich freuen.
… und noch mehr: Software, Musik, Filme
Websites und Bücher sind aber noch nicht alles – das Internet Archive bietet zudem eigene Sparten für alte Software-Programme, Musik- und Sprachaufnahmen, Video- und Filmmaterial und weiteres. Diese lassen sich entweder in eigenen Sparten und Sammlungen über die Startseite durchstöbern oder im erweiterten Suchmodus durchsuchen.
Internet Archive (Screenshot: iRights.info)
Der Aufwand, um der (internationalen) Öffentlichkeit all diese Angebote zu bieten, ist enorm. Im Frühjahr 2021 dokumentierte das Internet Archive die Arbeiten, die für das „Great 78 Project“, einem Digitalisierungsprojekt für alte Schelllackplatten, notwendig sind. Die einzelnen Arbeitsschritte von Reinigung bis hin zur Aufnahme und Archivierung der etwa 3.000 monatlich digitalisierten Tonträger wurden dafür in einem eigens produzierten Video festgehalten (iRights.info berichtete).
Ganz tief im Archiv: Wie das Internet Archive eine Viertelmillion Schallplatten digitalisiert
Georg Fischer
Das US-amerikanische Internet Archive bewahrt Kulturschätze – Bücher, Filme, Webseiten, Software und natürlich auch Musik. Ein kürzlich veröffentlichtes Video zeigt, wie die Digitalisierung alter Schallplatten im Einzelnen abläuft. »mehr
Eine alte Kirche dient als Hauptsitz
Seinen Sitz hat das Non-Profit-Unternehmen übrigens in einer ehemaligen Kirche in San Francisco. The San Francisco Standard, eine dort ansässige Lokalzeitung, besuchte das Internet Archive im März 2022 und portraitierte dessen Arbeit in einem kurzen Video:
Wer sich lieber in deutscher Sprache über das Konzept und die Geschichte des Internet Archive informieren will: Im Herbst 2016, als das Internet Archive seinen 20. Geburtstag feierte, stellte die Bibliothekarin Alexis Rossi die Aktivitäten der digitalen Gedächtnisinstitution in einem Text für iRights.info ausführlich vor.
Dass all die Aktivitäten möglich sind, verdankt das Internet Archive zahlreichen Freiwilligen, kooperierenden Gedächtnisinstitutionen und natürlich vielen privaten Spender*innen. Wer das Projekt unterstützen möchte, findet an dieser Stelle verschiedene Möglichkeiten, durch kleine oder große Spenden beizutragen.
iRights.info informiert und erklärt rund um das Thema „Urheberrecht und Kreativität in der digitalen Welt“.
Wir sind auch in den Sozialen Medien zu finden: Folgen Sie uns auf Twitter, Facebook, Telegram, LinkedIn oder Mastodon!
Sie möchten uns unterstützen? Das geht ganz einfach über die Spendenplattform Betterplace!
Georg Fischer ist Redakteur bei iRights.info und Referent im Open-Access-Büro Berlin (angesiedelt an der FU Berlin). Hauptsächlich beschäftigt er sich mit Urheberrecht und Medienindustrien. Als Soziologe forscht er unter anderem zu Sampling, Verwertungsgesellschaften und Open Access. Er ist er bei Mastodon aktiv und hat ein ORCiD.