Die Probleme liegen manchmal in Kisten verstaut auf dem Dachboden. Der Südfrankreich-Urlaub, 1989, festgehalten auf VHS-Kassette. Meeresrauschen, Lavendelfelder, Campingplatz – Momente für die Ewigkeit. Oder? Damals konnte noch keiner ahnen, dass es ein Leben nach Magnetbändern gibt. Und so droht auch der schönste Urlaub irgendwann zu verschwinden. Selbst bei optimaler Lagerung halten VHS-Kassetten nur etwa 35 Jahre. Dann treten Bildfehler auf, der Ton wird schlechter.
8-Zoll-Diskette, Blu-ray-Disk, SD-Karte und USB-Stick. Was heute als Speichermedium der Zukunft angepriesen wird, kann morgen schon veraltet sein. Gleiches gilt für Dateiformate von AAC bis MP3, von WebP bis JPG. Und da fängt die Arbeit von Thomas Bähr und seinem Team an. Bähr, 55, ist Leiter der Bestandserhaltung und digitalen Langzeitarchivierung der TIB – Leibniz-Informationszentrum Technik und Naturwissenschaften und Universitätsbibliothek. Zusammen mit 30 Mitarbeiterinnen und Mitarbeitern setzt er sich dafür ein, dass der Forschungsstand für künftige Generationen erhalten bleibt. Die meisten Wissenschaftler sind einfach nur froh, wenn sie ihr Forschungsprojekt abgeschlossen haben. Doch wenn sich niemand um den bestehenden Wissensschatz kümmert, geht er irgendwann verloren
, sagt Thomas Bähr.
Egal ob Texte, Bilder, Videos, Audios oder 3D-Objekte – für mehr als 270 Dateiformate versucht das Team um Bähr, das passende Werkzeug zu finden, um die Daten auszulesen. Der erste Schritt der Langzeitarchivierung ist – egal ob Textformat oder komplexes 3D- Modell – zunächst die Identifikation: Ich muss das Format befragen: Hallo Unbekannte, wer genau bist du?
Und die Fallstricke fangen schon bei Dissertationen an, die im PDF-Format abgespeichert werden: Das Portable Document Format gibt es seit 1993, plattformunabhängig, ein Klassiker. Doch PDF ist nicht gleich PDF, weil das Format laufend erweitert und verändert wurde.
Im zweiten Arbeitsschritt der Langzeitarchivierung validiert das Team das Format. Dabei wird es mit all seinen Eigenheiten detailliert beschrieben. Das ist wichtig, weil Daten absichtlich modifiziert sein können oder aber durch Systemfehler unbemerkt verändert werden. Beim PDF-Format ist der Aufwand überschaubar, weil es bereits millionenfach genutzt und entsprechend gut beschrieben ist.
Im dritten und letzten Schritt werden die technischen Metadaten aus den Dateien extrahiert. Das ist bei Textformaten wie dem PDF grundsätzlich nicht anders als bei komplexeren Formaten. Wir erstellen eine Art Gebrauchsanweisung
, sagt Bähr. Sie soll der Menschheit möglichst für alle Zeit mit auf den Weg geben, wie diese Wissenspakete zu verstehen und zu lesen sind.
Von den Archivierungsdiensten profitiert nicht nur die TIB selbst. Zu Bährs Kundenkreis zählen auch zahlreiche Forschungsinstitute oder andere Bibliotheken. Während Letztere durch ihre tägliche Arbeit mit alten Wissensbeständen ein hohes Bewusstsein für das Thema mitbringen würden, vermisst Bähr diese Sensibilität bei Universitäten noch häufig. Ob aus Unwissenheit oder finanziellen Zwängen, viele Lehrstühle ließen die eigene Arbeit unbedacht verstauben.
Wissen liegt aber nicht nur in Cloudsystemen und auf Servern bereit. In der Langzeitarchivierung der TIB landen auch analoge Objekte, weshalb das Team neben studierten Informationstechnologen auch aus Bibliothekaren, Buchbinderinnen und einer Restauratorin besteht. Um Bücher zu bewahren, werden sie digitalisiert. Das hat wenig mit dem Scanner aus dem Großraumbüro gemein
, sagt Bähr. Seine Hochleistungs-Scanner sind für den Umgang mit speziellen Tinten und Farben, gewellten Oberflächen und Goldauflagen entwickelt und kosten zwischen 20.000 und 40.000 Euro.
Und manchmal kommen auch Menschen mit Disketten zu den Archivaren, wenn auch nicht mit Urlaubsfotos. Bähr erinnert sich an einen Fall, der bei Kollegen einer anderen Bibliothek aufschlug. Ein Nobelpreisträger war verstorben. Zurück blieb eine Kiste mit Disketten, der Nachlass eines großen Naturwissenschaftlers. Es dauerte, ehe die alten Dateiformate geöffnet waren, erzählt Bähr. Was die Experten dann erblickten war kein Wissensschatz, sondern private Korrespondenz. Ein belangloser Teeküchenplausch, für die Nachwelt erhalten.