Daten für die Ewigkeit

lanline.de, 18. September 2007

Revisionssichere Langzeitarchivierung

Von Hans Peter Schmidt/wg Hans Peter Schmidt ist Abteilungsleiter Storage-
Management beim IZB Informatik-Zentrum.

Gesetzliche Vorgaben verpflichten Unternehmen, bestimmte Daten sechs bis 30 oder mehr Jahre lang zu archivieren und dabei sicherzustellen, dass niemand die Daten verändern oder löschen kann. Doch wenn es um die Entwicklung einer entsprechenden Strategie zur revisionssicheren Langzeitarchivierung geht, gibt es bei vielen Anwendern mehr Fragen als Antworten.

Unter Langzeitarchivierung versteht man grundsätzlich die langfristige Aufbewahrung und Erhaltung der dauerhaften Verfügbarkeit von Informationen. Der Begriff findet unterschiedliche Verwendung. Von Langzeitarchivierung spricht man, wenn Informationen mindestens zehn Jahre aufbewahrt und zugänglich gehalten werden sollen. Eine revisionssichere Archivierung liegt hingegen dann vor, wenn ein Archivierungssystem unter anderem den Anforderungen an eine sichere, ordnungsgemäße Aufbewahrung von kaufmännischen Dokumenten entsprechend dem Handelsgesetzbuch (Paragraphen 239 und 257), der Abgabenordnung und den Grundsätzen ordnungsgemäßer DV-gestützter Buchführungssysteme entspricht. Für Unternehmen sind heute in der Praxis Aufbewahrungsfristen von bis zu zehn Jahren für handelsrechtlich und steuerlich relevante Daten und Dokumente gefordert. Im Finanzumfeld sind aufgrund der Gewährleistungsfrist der Banken für bestimmte Unterlagen sogar 30 Jahre Aufbewahrung vorgeschrieben. Zwar scheinen diese Fristen kurz, wenn man sie mit den Archivierungshorizonten von Bibliotheken oder Museen vergleicht, deren Blick weit in die nächsten Jahrhunderte und das nächste Jahrtausend reicht. Doch betrachtet man von heute aus, wie sich die Informationswelt in den letzten 30 Jahren verändert hat, so wird klar, dass schon die Archivierung von Daten für die nächsten zehn Jahre eine große Herausforderung darstellt. Die erste Hürde ist dabei rein organisatorischer Art und besteht in der Definition, welche Daten überhaupt archivierungspflichtig und/oder -würdig sind. Dies sollte jedes Unternehmen in einer Richtlinie festlegen und allen betroffenen Mitarbeitern kommunizieren.

Formatfrage
Neben der Art der Daten sollte in der Richtlinie auch festgehalten sein, in welchem Format unternehmensrelevante Daten zu archivieren sind. Vor allem proprietäre Dateiformate lassen sich oft nur mit einer bestimmten Version einer bestimmten Software lesen, die unter Umständen zudem nur auf einer bestimmten Hardwareplattform läuft. Um sicherzustellen, dass sich Dateien von heute auch zukünftig verarbeiten lassen, empfiehlt sich bei der Archivierung der Einsatz offener, standardisierter Dateiformate. Zu den offenen Formaten für Grafiken zählen die Typen TIF, PNG und JPG; bei der langfristigen Archivierung von Bilddaten sind verlustfreie Dateiformate vorzuziehen. Für Dokumente hingegen bieten sich Stand heute XML, PDF/A oder Open Document an. Denn der Aufbau dieser Formate ist bekannt, und daher ist die Wahrscheinlichkeit höher, dass dieser Art kodierte Daten auch in einigen Jahren noch interpretierbar sind.
Microsoft bemüht sich derzeit, ihr Open-XML-Format für Office-Dokumente als ISO-Standard anerkennen zu lassen. Doch bislang konnte der Hersteller nur die European Computer Manufacturers Association (ECMA) davon überzeugen, Office Open XML als Standard anzunehmen. Schwierig wird es auch bei Daten, die an eine bestimmte Anwendung gebunden sind. Dies kann beispielsweise ein E-Mail-Server wie Exchange, eine Oracle-Datenbank oder ein SAP-System sein. Hier benötigen Unternehmen Schnittstellen für die jeweilige Applikation, die die Daten in einem standardisierten Format – meist XML, Komma-separierter Text (CSV) oder Nur-Text – für Archivierungszwecke zur Verfügung stellen.

Migration oder Emulation
Doch was passiert, wenn ein Unternehmen nach zehn Jahren auf Daten zugreifen muss, für die es keine aktuelle Anwendung mehr besitzt? Zur Sicherstellung der Verfügbarkeit archivierter Informationen gibt es hier mehrere Strategien. Der erste Ansatz ist die Migration bestehender Daten in eine neue Systemumgebung. Dies birgt allerdings das Risiko, dass Informationen nicht nachweislich unverändert von einem System auf ein anderes gelangen. Zudem könnte eine Migration die Originalität und Authentizität von Daten kompromittieren. Der technische Wandel zwingt Unternehmen jedoch dazu, rechtzeitig auf neue Speicher- und Anwendungskomponenten zu wechseln, um ihre Informationen verfügbar zu halten. Daher ist bereits bei der Ersteinrichtung eines langfristigen Archiv- und Speichersystems eine mögliche zukünftige Migration zu berücksichtigen. Die kontrollierte, verlustfreie, „kontinuierliche Migration“ ist zurzeit der wichtigste Ansatz, um Information über Jahrzehnte und Jahrhunderte verfügbar zu halten. Standardisierte Formate helfen hier, die Migrationszyklen so weit wie möglich zu verlängern.
Als Alternative zur Migration wird zumindest in der wissenschaftlichen Welt das Modell der Emulation diskutiert. Dabei geht es darum, die Eigenschaften eines älteren Systems so zu simulieren, dass damit auch Daten mit neueren Computern und Betriebssystemen wieder nutzbar sind. Ein Beispiel ist der C64-Emulator, der unter aktuellen Betriebssystemen den Einsatz von Software des Commodore C-64 ermöglicht. Im Bereich der langfristigen Datenspeicherung kommt Emulation heute noch nicht in größerem Ausmaß zum Einsatz. Zu ihren Nachteilen gehört, dass der Aufwand künftiger Emulationsschritte nicht zu planen und eine Emulation bei einem zu großen Paradigmenwechsel eines Tages vielleicht gar nicht mehr durchführbar ist.

Das richtige Medium
Neben der Interpretation des Datenformats muss natürlich auch das Speichermedium und damit die Lesbarkeit der Daten an sich dem Zahn der Zeit widerstehen. Bei der revisionssicheren Archivierung stellen dabei WORM-Medien (Write Once Read Many) sicher, dass einmal gespeicherte Daten nicht nachträglich verändert oder gelöscht werden können. Optische Medien wie CD-WORM und DVD-WORM eignen sich hier jedoch eher für den Hausgebrauch als für professionelle Archivierungslösungen. Denn deren Speicherkapazität ist für Unternehmensansprüche zu gering und die Haltbarkeit der Rohlinge mit fünf bis zehn Jahren zu kurz. Stand der Technik im optischen Bereich sind heute Ultra-Density-Optical-(UDO-)Medien, die eine Speicherkapazität von bis zu 60 GByte bieten und deren Datenintegrität für 50 Jahre zertifiziert ist.
Aus dem Lager der magnetischen Speichermedien mit weitaus höheren Speicherkapazitäten stammen WORM-Festplatten mit ein TByte Größe – auch Content Addressed Storage (CAS) genannt – sowie WORM-Tapes, die heute bis zu 800 GByte Speicherkapazität bieten. CAS-Systeme sind Festplattensysteme, die durch spezielle Software dieselben Eigenschaften wie ein herkömmliches WORM-Medium bieten. Eine Kodierung bei der Speicherung und eine spezielle Adressierung auf dem Datenträger verhindern ein Überschreiben oder Ändern von Informationen auf dem Speichersystem. WORM-Tapes hingegen sind Magnetbänder, die durch eine spezielle Kodierung der Bandmedien die Einmalbeschreibbarkeit sicherstellen.
Besonders in Rechenzentren, in denen Bandroboter und Library-Systeme bereits vorhanden sind, stellen WORM-Tapes eine einfach zu integrierende Komponente für die Langzeitarchivierung dar. Für größere Unternehmen und Organisationen mit Rechenzentren sind Festplatten- oder WORM-Tape-Archive heute das Medium der Wahl, da sie sich bei hoher Speicherkapazität einfach in den laufenden Betrieb integrieren lassen. Die Hersteller von WORM-Tapes und -Festplatten garantieren zudem eine Haltbarkeit von bis zu 30 Jahren. Während der Vorteil von WORM-Festplatten gegenüber Tapes vor allem die Geschwindigkeit beim Zugriff auf Daten ist, punkten die Bandlaufwerke weiterhin mit deutlich geringeren Gesamtbetriebskosten von zirka einem Drittel bis einem Viertel im Vergleich zur Festplatte.

Fit für 4007 - nur über Migration
Bis in das übernächste Jahrtausend werden UDO-, CAS- und WORM-Tape-Systeme unternehmenswichtige Daten nicht retten können. Archivare unserer digitalen Kulturgüter müssen sich also aller Wahrscheinlichkeit nach auf zukünftige Migrationen ihrer Daten gut vorbereiten. Unternehmen mit einem kürzeren Archivierungshorizont sollten zunächst festlegen, was sie wie lange archivieren möchten, und dann geeignete Formate und Speichermedien auswählen. Wer sich nicht selbst mit der technischen Seite der revisionssicheren Langzeitarchivierung auseinandersetzen möchte, kann sich an einen spezialisierten Dienstleister wenden. Wenn dieser aus dem Finanzumfeld stammt und seine Rechenzentren in Deutschland betreibt, sind die Daten dort zumindest auf absehbare Zeit so sicher wie in der Bank.
rechenzentrum, langzeit-archivierung, ibm mainframe rechenzentrum, langzeit-archivierung, ibm mainframe


Quelle: lanline.de


zurück