Datenhaltung und Backup, Teil 1
Früher gab es Negative. Die waren empfindlich, man konnte sie schlecht duplizieren und wenn man sie nicht ordentlich behandelt hat, verlor sich ihr Inhalt binnen weniger Jahre. Da haben wir es heute doch viel besser: Digitale Daten lassen sich verlustfrei kopieren, sie werden nicht schlechter so lange man sie nicht in verlustbehaftete Formate umwandelt oder komprimiert und sie benötigen deutlich weniger Platz. Auf eine 500 Gigabyte große Festplatte passen rund 100.000 Fotos im JPG-Format. Oder immerhin noch 30.000 Fotos im RAW-Format.
Das verleitet natürlich auch nur zu gerne zu kleinen Schlampereien. Da werden große Teile des Archivs auf einer zweiten Festplatte im Arbeitsplatzrechner gehortet, eine Datensicherung erfolgt sporadisch auf externe Festplatten oder DVDs. Kaum ein Gedanke wird an Redundanzen oder die Haltbarkeit der Backups verschwendet. Das fatale daran: Wenn ein Defekt auftritt, sind die Daten oft nur mit erheblichem Aufwand zu retten oder gar ganz verloren. Und je größer die Kapazitäten der Speichermedien werden, desto größer werden auch die Löcher, die ein Defekt in das Archiv reißen kann. Zeit also, sich mit redundanter Datenhaltung und sicherem Backup zu befassen.
Datenhaltung
Egal wie groß das Archiv auch sein mag, am liebsten hätte man alles komplett und schnell im Zugriff. Wer seine Daten auf DVDs auslagert, muss ältere Dateien erst auf den DVDs suchen, bevor er ein Bild nutzen kann. Bestenfalls hilft dabei eine Archivsoftware oder sehr exakte Beschriftung. Aber je größer das Archiv wird, desto länger braucht man für die Suche nach dem richtigen Bild. Zudem muss man sich mit der Zeit Gedanken machen, ob die Daten auch noch wirklich verwertbar sind. Denn die handelsüblichen DVD-Rohlinge halten nicht ewig. Durch falsche Lagerung können die Daten schon nach wenigen Jahren fehlerhaft oder gar verloren sein. Man muss also regelmäßig umkopieren, was je nach Menge der DVDs einen immensen Arbeitstaufwand bedeuten kann.
Einen möglichen Ausweg bietet die Lagerung der Daten auf Festplatten. Dabei hat man die Wahl, alle Daten auf externe Festplatten auszulagern oder den Arbeitsplatzrechner mit großen Festplatten auszustatten. Externe Festplatten sind einfach zu lagern und schnell angeschlossen, außerdem bieten sie inzwischen Kapazitäten von bis zu zwei Terabyte. Über die aktuellen USB 2.0- oder Firewire 800-Anschlüsse hat man sehr schnellen Zugriff auf die Daten. Aber auch hier gilt: je nach Größe des Archivs kommt man früher oder später an den Punkt, an dem man ein Sammelsurium von externen Festplatten auf dem Schreibtisch herumschwirren hat. Da muss man auch erst einmal den Überblick behalten – vor allem, wenn man auf Redundanz Wert legt, denn dann muss jede Festplatte doppelt vorhanden sein. Außerdem muss man die Schnittstellen der externen Festplatten im Auge behalten. Während vor wenigen Jahren noch Firewire 400 als Standard galt, ist es heute längst abgelöst bzw. an vielen Rechnern nicht mehr vorhanden. Meistens sind die Nachfolger der Schnittstellen eine Weile abwärtskompatibel – eine Garantie gibt es dafür allerdings nicht.
Ein möglicher Ausweg aus dem Durcheinander mit den externen Festplatten ist die Anschaffung eines Fileservers oder NAS-Systems. Da gibt es inzwischen sehr gute fertige Lösungen wie z.B. die TeraStation von Buffalo oder die Synology DS409. Diese Systeme nehmen je nach Bauart und Ausstattung mehrere Festplatten auf und spiegeln diese auf Wunsch automatisch in einem RAID-Verbund. Das sorgt für den nötigen Schutz vor Defekten. Realisiert werden die Funktionen meistens über Linux-Systeme, die vom Hersteller auf die jeweilige Hardware angepasst werden. Genau da liegt auch einer der Schwachpunkte: Für Anpassungen und Erweiterungen ist man auf den Support des Herstellers angewiesen, außerdem muss man damit rechnen, dass proprietäre Funktionen verwendet wurden, die nicht zu üblichen Funktionen kompatibel sind. Das wird im Alltagsbetrieb nicht auffallen – wenn das System jedoch ausfällt und man die Festplatten in einem anderen System verwenden möchte, können diese inkompatibel sein, so dass alle Daten verlorengehen.
Eine Alternative zu den NAS-Systemen sind richtige Fileserver. Je nach Bauform kann ein Fileserver acht oder mehr Festplatten aufnehmen. Im Gegensatz zu den abgeschlossenen NAS-Systemen kann man die Komponenten selbst auswählen und im Falle eines Defekts ersetzen. Der Nachteil sind die Kosten sowie die nötige Administrationsarbeit. Über den Aufbau und die Einrichtung eines Fileservers wird im dritten Teil dieser Reihe noch ausführlich berichtet.
Dateiformate
Die Wahl des richtigen Dateiformats vom Archivierungszweck ab. Wer höchsten Wert auf maximale Qualität legt und auch in Zukunft auf extreme Ausgabeformate angewiesen ist, wird sicher ein verlustfreies Datenformat wählen. Das wird das Rohdatenformat (RAW) des Kameraherstellers sein. Leider sind diese RAW-Formate proprietär, so dass man ohne Offenlegung des Herstellers keine Chance hat, die Daten zu lesen. Sollte ein Hersteller keine Unterstützung mehr für veraltete Dateiformate anbieten, wird man ein Problem bekommen. Denn wer archiviert neben seinen Daten auch die zum Verarbeiten nötige Software? Oder gar die Rechner, auf denen die Software installiert ist? Während man also bei den Negativen aus der analogen Zeit mittels Licht und einer Projektionsfläche immer selbst auf die Bildinformation zurückgreifen kann, ist man bei digitalen Daten auf das Wohlwollen des Kameraherstellers bzw. der Softwarehersteller angewiesen. Kein schöner Gedanke, wenn man sich vor Augen hält, was da alles passieren kann. Zumal man ohne die Spezifikation des jeweiligen Dateiformats kaum einen Einblick nehmen kann. So kann der Hersteller am Dateiformat unbemerkt Änderungen vornehmen, die man als Anwender zunächst vielleicht nicht bemerkt. Will man jedoch nach Jahren auf die Daten zurückgreifen, erhält man nur unlesbare Daten. Auch wenn der Gedanke zunächst abwegig erscheint – möglich ist es dennoch. Wer über eine Langzeitarchivierung im Bereich von 20, 30 oder gar 50 Jahren nachdenkt, wird sich nicht darauf verlassen wollen, dass es bis dahin noch a) den Hersteller oder b) kompatible Software gibt.
Damit also an dieser Stelle nichts schiefgehen kann, sollte man die Daten in ein offenes Format (z.B. DNG) konvertieren. Dieses Format wurde von Adobe entwickelt und die Spezifikation komplett offengelegt. Als Ergebnis unterstützen viele Programme das Format und es existiert inzwischen auch freie Software, die das Format lesen und weiterverarbeiten kann. Letztendlich gibt es trotz aller Bemühungen wenig Sicherheit in Bezug auf die Dateiformate. Man kann aber bei aller Sorge auch davon ausgehen, dass es für offene Formate wie DNG auf jeden Fall Konvertierungsmöglichkeiten auf die nächste Dateigeneration geben wird. Um böse Überraschungen zu vermeiden, sollte man in regelmäßigen Abständen die Daten überprüfen und beim Update der Software bzw. dem Umstieg auf eine andere Software ausreichend Zeit in Tests investieren.
Der Nachteil der Rohdatenspeicherung liegt auf der Hand: Der Speicherplatzverbrauch ist deutlich höher. Je nach Modell ist der Speicherplatzverbrauch einer Rohformat-Datei drei bis vier Mal so hoch wie der einer komprimierten JPEG-Datei. Damit steigen natürlich auch die Kosten. Für eine solide Festplatte mit einem Terabyte Speicherplatz muss man derzeit rund 90 EUR investieren. Redundanzen für den RAID-Verbund sowie weiteren Speicherplatz für Backupdaten eingerechnet liegt man bei rund 270.- EUR je Terabyte Nettospeicherkapazität. Will man diese Kapazität für Rohdaten erweitern muss man also mit Mehrausgaben im hohen dreistelligen Bereich rechnen. Ob das auf Dauer lohnt, muss man selbst entscheiden. Neben dem aktuellen Verwendungszweck der Daten hängt die Formatentscheidung Rohdaten oder JPEG auch davon ab, ob man die Daten später noch in der Detailtiefe benötigt wie bisher.
Soweit zu den prinzipiellen Möglichkeiten worauf und in welchem Format man die digitalen Daten speichert. Im nächsten Teil der Serie geht es mit dem Thema Redundanz weiter.
Ähnliche Beiträge:
2 Kommentare
Hinterlasse einen Kommentar

Rene am 11.01.2010, 13:20
Also für den privaten lohnt sich ein Fileserver nicht wie ich finde.
Ich persönlich habe eine DiskStation und sichere diese als BackUp auf Externe Festplatte(n).
Bei der DiskStation hat man den Vorteil, dass man den kompletten Zugriff auf das Linux System hat und vor allem von der Firma Synology KOSTENLOS neue Funktionen bekommt.
Dieses System kann ich also nur empfehlen, vor allem da es auch Stromsparend ist.
Wer natürlich 10 TB und mehr Daten hat für den lohnt sich ein FileServer…
Peter am 11.01.2010, 16:43
@Rene: Die Diskstations sind nicht schlecht, da hat Synology schon ganz gut Ahnung. Alleine auf so ein Ding würde ich mich allerdings trotzdem ungern verlassen. Wenn man die Diskstation aber so wie Du auf eine externe Platte sichert, hat man auf jeden Fall ausreichend Sicherheit. Wichtig ist halt immer, dass man sich des Zustands der Geräte bewusst ist und sich nicht einfach auf einen wahllos zusammengestellten Plattenstapel verlässt…