Zum Inhalt springen
Der Guide für ein smartes Leben.
VG Wort Pixel
Daten für die Ewigkeit

Wissenschaftliche Rechenzentren

Autor: Klaus Manhart • 20.6.2011 • ca. 2:10 Min

Inhalt
  1. Langzeit-Archivierung in der Wissenschaft
  2. Wissenschaftliche Rechenzentren
  3. Langzeit-Archivierung

Archivbeispiel Leibniz-Rechenzentrum ...

Archivbeispiel Leibniz-Rechenzentrum

image.jpg
Vorsintflutliche Datenträger? Daten auf Disketten sind heute schon kaum mehr lesbar.
© PC Magazin

Auch in den wissenschaftlichen Rechenzentren ist Langzeit-Archivierung ein großes Thema. Primärdaten aus Studien und Experimenten müssen laut den Richtlinien der Deutschen Forschungsgemeinschaft (DFG) mindestens zehn Jahre aufbewahrt werden, einzelne Einrichtungen wie Unikliniken wollen ihre Daten 30 Jahre und länger halten.

Diese Institutionen kämpfen, neben dem Medienproblem, vor allem mit riesigen Datenmengen. Beim Leibniz-Rechenzentrum (LRZ) in München z.B., dem IT-Dienstleister für alle Münchner Hochschulen, wurde bereits 2007 die 3000-Terabyte-Grenze überschritten, die Hälfte davon sind Archivdaten.

DVDs kommen bei diesen Datenmengen als Speichermedium nicht in Frage, stattdessen archiviert das LRZ auf Magnetbändern. Die Bandtechnologie, die dabei zum Einsatz kommt, ermöglicht die Speicherung von bis zu 1000 GByte auf einem Magnetband.

Theoretisch sind dafür zwar auch Festplatten als Datenträger geeignet. Doch die gelten bei den großen Datenmengen wegen der hohen Energiekosten als nicht effizient genug.

Im Gegensatz zu Bändern muss man nämlich in Platten auch die Wärme wieder abführen, die beim Betrieb entsteht. Für tausende von Festplatten ist eine große, teure Klimaanlage nötig. Magnetbänder hingegen brauchen im Gegensatz zu Festplatten kaum Energie und produzieren auch keine Wärme.

Die Verwaltung der Archivdaten erfolgt mit einer speziellen Archivierungs-Software, mit der sich verschiedene Policies definieren lassen. Über diese lässt sich festlegen, wie lange welche Daten aufbewahrt werden, wie viele Versionen es geben soll und wann welche Daten gelöscht werden sollen.

Mehrfach gesichert

image.jpg
Das Leibniz-Rechenzentrum in Garching bei München beteiligt sich an einer kontinuierlich wachsenden Zahl von Archivierungs-Projekten.
© PC Magazin

Um digitale Daten über Jahrzehnte hinweg zu erhalten, sieht das LRZ nur eine praktikable Lösung: Die Informationen müssen nach einigen Jahren auf neue Datenträger kopiert - im Fachjargon: "migriert" - werden. Mehr als fünf Jahre werden die Daten in der Regel am LRZ nicht auf dem gleichen Medium gehalten.

Mit dieser Strategie schlägt das LRZ zwei Fliegen mit einer Klappe: Man senkt die Wahrscheinlichkeit, dass Daten infolge mangelnder Haltbarkeit des Datenträgers verloren gehen. Und: Man bleibt auf dem aktuellen Stand der Technik der Lesegeräte.

Aufbewahrt werden die Bänder in vollklimatisierten Räumen mit konstanter Temperatur und Feuchtigkeit, die mehrfach gegen alle möglichen Katastrophen abgesichert sind. Sollte es trotz aller Vorsichtsmaßnahmen doch einmal zu einer völligen Zerstörung des Rechenzentrums kommen, bleiben immer noch die Nachbarn: Die wichtigsten Daten werden an das einige hundert Meter entfernte Rechenzentrum der Max-Planck-Gesellschaft in Garching kopiert.

image.jpg
Scan-Robotor wie von der österreichischen Firma Treventus digitalisieren Bücher und andere gebundenen Druckerzeugnisse automatisch und schonend.
© PC Magazin

Know-how und technische Infrastruktur machen das LRZ zu einem begehrten Partner bei Archivierungs-Projekten. So führt das LRZ mit der Bayerischen Staatsbibliothek mehrere Projekte durch. Zusammen mit Google erfolgt etwa die Massendigitalisierung des urheberrechtsfreien historischen Bestandes an Druckwerken - über eine Million Titel mit über 250 Millionen Seiten.

Bereits abgeschlossen ist das von der DFG geförderte Projekt vd16digital, bei dem zwischen 2007 und 2009 das deutsche Schriftgut des 16. Jahrhunderts eingescannt und archiviert wurde.

Die Buchseiten wurden über Scan-Roboter eingelesen, die automatisch umblättern können, und anschließend als Bilddaten im TIFF-Format gespeichert - TIFF ist weit verbreitet, gilt als zukunftssicher und besitzt eine sehr hohe Farbtreue. Später sollen die TIFFs per OCR-Software eingelesen werden, um Texte per Volltextsuche zu erreichen.

Nächste passende Artikel
Schnäppchen-Guide: Im Web kann man sehr preiswert einkaufen. Wir zeigen, wie!
Gratis oder fast geschenkt Schnäppchen-Guide fürs Internet
internet, webdesign, blogs, google, blogmarketing, seo
Ungeliebte Geschenke loswerden
Concrete5
Online-Redaktionssysteme Concrete5
internet, webdesign, clouddienste, cdns, akamai
fotos,internet, ahnenforschung
Alte Zeiten, neue Technik Ahnenforschung am PC
hardware, pc, komponenten, erste hilfe, kasten
Frau, geld
Mehr netto vom Bruttoverdienst Vergleichstest: Steuersparprogramme