Langzeit-Archivierung
- Langzeit-Archivierung in der Wissenschaft
- Wissenschaftliche Rechenzentren
- Langzeit-Archivierung
Die Formatfrage ...
Die Formatfrage

Mit dem Einlesen der Daten als TIFFs, um sie später per OCR lesbar zu machen, ist man auf der sicheren Seite. Dennoch ist es in der Praxis meist sinnvoll, Textdokumente in dafür geeigneten Formaten zu archivieren. Hier empfehlen Nestor und Institutionen wie das Bundesamt für Sicherheit in der Informationstechnik (BSI) die Beschränkung auf Standardformate.
Erste Wahl sind herstellerunabhängige Standards, die von anerkannten Organisationen wie der ISO oder dem W3C spezifiziert sind, zum Beispiel ASCII, Unicode, SVG und XSL.
Einige herstellerabhängige Formate haben sich als Quasi-Standards am Markt durchgesetzt, bestes Beispiel ist das PDF von Adobe. Die Spezifikation ist ebenfalls frei verfügbar, steht aber unter der alleinigen Kontrolle des Eigentümers.
PDF kommt eine besondere Bedeutung bei der Archivierung zu. 2005 hat die ISO das PDF/A-Format ("A" = Archive) als Standard für die Langzeit-Archivierung von Dokumenten zertifiziert. Das BSI empfiehlt dieses Format ebenfalls für die Langzeit-Archivierung.

Seitdem wird dieses Format im Markt hoch gehandelt. Viele Hersteller sind bereits von den Vorteilen des PDF/A-Formates überzeugt und haben ihre Produktpalette entsprechend angepasst oder erweitert. Der Standard PDF/A (ISO Standard 19005-1) basiert auf PDF 1.4, schließt aber einige Funktionen davon aus, da sie eine langfristige Darstellbarkeit beeinträchtigen könnten.
So ist die Verwendung externer oder spezifischer Ressourcen wie eingebetteter Fonts nicht erlaubt. Durch diese und andere detaillierte Vorschriften soll eine langfristige Lesbarkeit der Dokumente garantiert sein - und zwar unabhängig davon, mit welcher Anwendungs-Software und auf welchem Betriebssystem sie ursprünglich erstellt wurden.
Beim BSI finden Sie eine Liste von Formaten, die für die langfristige Archivierung von Text-, Bild-, Audio-und Videodateien geeignet sind.
Tipps zur Langzeit-Archivierung
Die vorgestellten Projekte sind vor allem auf die wissenschaftliche Archivierung ausgelegt. Eine unmittelbare Übertragung auf andere Bereiche ist derzeit kaum möglich.
Dennoch schälen sich einige Strategien heraus, die auch im Unternehmen oder Privatbereich angewendet werden sollten.
Hier die wichtigsten Faustregeln:
- Verwenden Sie möglichst wenige Datenformate.
- Verwenden Sie möglichst offene und standardisierte Dateiformate. Also statt .DOC, XLS oder BMP besser das OpenDocument-Format ODF, PDF oder TIFF. Diese gelten auch als besonders langlebig.
- Sie sollten das Archiv regelmäßig aktualisieren und Archive mindestens doppelt anlegen.
- Halten Sie sich bei der Vergabe von Dateinamen an den 8.3-Standard: Acht für den Namen, drei für den Dateityp, etwa: beispiel.pdf
- Bewahren Sie das Backup räumlich getrennt vom Original auf.
- Alle drei bis fünf Jahre sollte das komplette Archiv plus Backup vom alten Datenträger auf einen neuen migrieren.
- Verwenden Sie keine CDs oder DVDs zur Archivierung, sondern statt dessen Festplatten oder, im Unternehmensbereich, Magnetbänder. Festplatten sollten staubdicht lagern und gelegentlich gestartet werden.
- Im professionellen Bereich bieten sich zur Verwaltung des Archivs Dokumentenmanagementsysteme an.Weitere konkrete Tipps finden Sie in der FAQ von langzeitarchivierung.de
LANGZEITARCHIVIERUNG IN WISSENSCHAFT UND KULTUR
Nestor-Projekt: www.langzeitarchivierung.de Nestor-Handbuch: https://nestor.sub.uni-goettingen.de/handbuch/index.php Kopal-Projekt: https://kopal.Langzeit-Archivierung.de DigitalPreservationEurope (EU-Projekt): www.digitalpreservationeurope.eu PDF/A Kompetenzcenter: www.pdfa.org/doku.php Auswahl geeigneter Datenformate: www.bsi.bund.de/ContentBSI/grundschutz/kataloge/m/m04/m04170.html Informationssammlung: www.uni-muenster.de/Forum-Bestandserhaltung/konversion/digi-langdat.html Langzeit-Archivierungs-Projekte am LRZ: www.lrz.de/projekte/langzeitarchivierung Google Projekt bei der Bayerischen Staatsbibliothek: www.bsb-muenchen.de/Massendigitalisierung_im_Rahme.1842.0.html