Jakob Voß

Langzeitarchivierung
Digitale Bibliothek WS 2008/2009 Digitale Bibliothek Fachhochschule Hannover Informationsmanagement (BA) 1. Dezember 2008

Die Inhalte dieser Präsentation stehen (sofern nicht weiter angegeben) von Jakob Voß freigegeben unter der Creative Commons Attribution-Share Alike 3.0 Unported Lizenz.

Warum Langzeitarchivierung?
– –

Digital = Verlustfrei kopier- und modifizierbar Abhängig von (!)
– –

Datenträger und Lesegeräte Betriebssystem, Software, Dateiformate

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement

Ziel und Probleme

Erhaltung für die Nachwelt („Langzeit“)
– –

Nutzbarkeit Authentizität Datenverlust (Naturkatastrophen, Viren, Menschen Software- und Hardwarefehler) Inkompatibilität (!) Was soll gesichert werden? Wer ist dafür verantwortlich?

Probleme
– – – –

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement

Beispiel: NASA

Die Originalaufnahmen der Mondlandung (Apollo 11) sind nicht auffindbar (Video vor der Konvertierung).
http://en.wikipedia.org/wiki/Apollo_program_missing_tapes

Magnetbänder mit Daten über Mondstaub (Apollo 11, 12 und 14) waren ebenfalls verlegt, wurden aber wiedergefunden und konnten erst mit einem speziellen Bandlaufwerk (IBM 729 Mark V) aus dem Australischen Computermuseum gelesen werden.

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement

Was heisst „Langzeit“?
„Langzeit ist die Umschreibung eines nicht näher fixierten Zeitraumes, währenddessen wesentliche nicht vorhersehbare technologische und soziokulturelle Veränderungen eintreten, die sowohl die Gestalt als auch die Nutzungssituation digitaler Ressourcen in rasanten Entwicklungszyklen vollständig umwälzen werden.“ (S. 567)
Schwens/Liegmann: Langzeitarchivierung digitaler Ressourcen. In: Grundlagen der praktischen Information und Dokumentation, 2004

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement

Abgrenzung
“Langzeitarchivierung digitaler Objekte umfasst alle Maßnahmen, die dazu dienen, digitale Objekte für die Nachwelt dauerhaft zu erhalten. Der Begriff ist eng verwandt mit Langzeitverfügbarkeit, die jedoch die dauerhafte Benutzbarkeit mehr in den Vordergrund stellt.“
Nestor-Glossar, Eintrag vom 20.2.2004

Retrodigitalisierung: Nachträgliche Digitalisierung, Erschließung und Archivierung von analogen Publikationen (Zeitungen, Zeitschriften, Bücher, Akten, Photographien etc.).

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement

Was ist zu tun?

Substanzerhaltung der Daten (Bitstream)
– –

Kopieren, digital signieren, Backups Ein Problem: DRM

– –

Benutzbarkeit sicherstellen Standards zur Kodierung Digitaler Objekte
– – –

Originalobjekte (z.B. Dateiformat...) Umgebung (z.B. Betriebssystem, Programm) Konvertierungsschritte

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement

Grundsätzliche Verfahren

Digitalisierung Museum: Erhalt der Hard- und Software Emulation der Hard- und Software Migration auf neue Systeme (Konvertierung) Zusätzlich: Kopie in analoger Form

– – –

Vor allem Mikroform (>500 Jahre!)

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement

Technisches Museum
– – –

Erhalt der technischen Umgebung ggf. Auffrischen der Daten durch Umkopieren Bis
– –

irgendwas kaputtgeht niemand mehr damit umgehen kann

Notwendig aber nicht für die Masse geeignet

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement

Emulation
– – –

Nachahmung der ursprünglichen Umgebung Emulatoren und technische Metadaten Nachteile
– –

Grenzen der Emulation Wer entwickelt und wartet die Emulatoren?

Danke, Computerspiele-Liebhaber!

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement

Migration
– – –

Konvertierung in neue Umgebung Metadaten der Konvertierung Nachteile
– –

Konvertierung ist aufwändig und komplex Datenverlust, Übersetzung ist nicht Original Nutzbarkeit in aktuellen Umgebungen

Vorteil

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement

Zusammenfassung
– –

Langzeitarchivierung ist immer aufwändig Alle drei Strategien (Museum, Emulation, Konvertierung) haben Berechtigung Bei jedem Schritt zusätzliche Metadaten
– – –

Exponentielles Wachstum Gut: Speicherplatz und Rechenleistung wachsen ebenfalls exponentiell Schlecht: Auch Fehler potenzieren sich

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement

Schritte bei der LZA
Migration/Emulation mit Beschreibung

Vorlage

analog digital

Digitalisierung Erhalt Beschreibung

Nutzung

Auffinden

Sicherungskopie

auch digital zu analog (Konversion)

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement

Digitalisierung: Buchscanner
– –

„Buch zerschneiden und ab in den Kopierer“ Profigeräte
– –

Kirtas, Qidenus, Treventus: 1500 p/h ~ 100.000€ 4DigitalBooks: 3000 p/h ~ 200.000€

Aufwand vor allem durch Heterogenität der Vorlagen Spezialscanner für Rara (z.B. Buchspiegel)

Julian Ball, 2008: Report of Public Exhibition of Automated Book Scanners Hosted at the BSB Munich
Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement

http://digitisation.jiscinvolve.org/files/2008/10/automated-book-scanners-munich

Speicherung: Redundanz
– –

LOCKSS (Lots of copies keep stuff Save) Mehrere Kopien (Mindestanzahl) verteilt unter Teilnehmern der Föderation Regelmäßiger Vergleich von Kopien Problem: Kontrolle über Zugriff schwierig, deshalb müssen Rechteinhaber zustimmen

– –

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement

Wer digitalisiert und archiviert?

Viele verstreute Projekte an Bibliotheken und Archiven DigiZeitschriften Google Books Internet Archive Open Content Alliance Verlage bieten höchsten Verfügbarkeit Archivierung nur sehr unterschiedlich (mäßig bis garnicht)

– – – – – –

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement

Regeln und Empfehlungen

DFG-Praxisregeln im Förderprogramm „Kulturelle Überlieferung“

Notwendig für Förderung durch die DFG

Empfehlungen der DBV AG Handschriften / Alte Drucke Good Practice Handbuch zur Digitalisierung im Rahmen des MINVERA-Projekt (2004) IFLA Guidelines for Digitization Projects (2002)

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement

Kodierung und Nutzung: DFG-Viewer

Programm zur einheitlichen Anzeige von Digitalisaten aus Repositories Verwendung als Webservice möglich Struktur- und Metadaten in
– –

– –

Metadata Encoding & Transmission Standard (METS) Metadata Object Description Schema (MODS)

http://dfg-viewer.de/
Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement

METS-Beispiel
<mets:mets xmlns:mets="http://www.loc.gov/METS/">  <mets:dmdSec>   <mets:mdWrap MIMETYPE="text/xml" MDTYPE="MODS" >    <mets:xmlData>     <mods:mods version="3.0" xmlns:mods="http://www.loc.gov/mods/v3">        [Me tadat en d es d igit ali sier ten  Objek tes:  T it el , A ut or .. .]     </mods:mods>  </mets:mdWrap>  </mets:dmdSec>  <mets:amdSec>       [Me tadat en d es D igit ali sat es: Ad minis tr at ion,  Recht e ... ]  </mets:amdSec>  <mets:fileSec>        [V er we is a uf ei nzelne  Dat eien:  Imag es .. .]  </mets:fileSec>  <mets:structMap>        [Gl iede run g, R eih enf olge , Zus ammen hang  ...]  </mets:structMap> </mets:mets>

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement

DFG-Viewer

OAI-PMH

METS/MODS Anzeige Images

Repository

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement

Angebot für BA-Thema
Entwicklung einer Export-Schnittstelle für Struktur- und Metadaten aus Wikisource.
DFG-Viewer ...

Wikisource

METS/MODS

ZVDD-XML
Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement

ZVDD

Einige weitere Standards

Open Archival Information System (OAIS) ISO 14721: „TÜV für Langzeitarchive“ LMER: Langzeitarchivierungsmetadaten für elektronische Ressourcen: DNB und Nationalbibliothek von Neuseeland) URN zur Identifizierung von Objekten „Was keine URI hat, existiert nicht!“ Grundsätzlich ist noch viel im Fluß

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement

Digitalisierungszentren
– –

Professionelle Hardware noch immer teuer Spezielles Know-How notwendig
– – –

OCR und Bildbearbeitung Metadaten Dokumentenmanagement und Storage

Deshalb: Service- und Kompetenzzentren in Göttingen und München
– –

Infrastruktur, Beratung und Kooperation Interessante Praktikumsplätze?

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement

ZVDD
– –

Zentrales Verzeichnis digitalisierter Drucke Vorrangig erstmal Sammlung von Metadaten

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement

Literaturhinweise

Tutorials der
– –

Cornell University Library

Digital Imaging Tutorial

http://www.library.cornell.edu/preservation/tutorial/contents.html

Digital Preservation Management
http://www.icpsr.umich.edu/dpm/

Schwens/Liegmann: Langzeitarchivierung digitaler Ressourcen. In: Grundlagen der praktischen Information und Dokumentation, Saur 2004 Kompetenznetzwerk Langzeitarchivierung
http://www.langzeitarchivierung.de/

Haber, 2007: Digitalisierung und digitale Archivierung
http://infoclio.ch/downloads/infoclio_digitalisierung.pdf

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement

Bis nächste Woche
– – – –

Fällt nicht aus, sondern Pflichtveranstaltung! Probelehrveranstaltungen in Raum 2.39 08:00-08:45, 10:00-10:45, 12:00-12.45 14:30-15:15 und 16.30-17:15

Jakob Voß: Lehrveranstaltung Digitale Bibliothek (WS 2008/2009) FHH Hannover, Bachelor-Studiengang Informationsmanagement