12. Mai 2015
Laufend erhalten wir in unseren Laboren RAID-Systeme, bei denen Daten durch falsche REBUILD-Vorgänge vernichtet worden sind.
Wir von Attingo Datenrettung nennen dies „fatale Rebuilds“.
– Rebuild mit einer falschen Anzahl von Datenträgern
– Rebuild mit einer falschen Reihenfolge von Datenträgern
– Rebuild mit einem schon früher ausgefallenen Datenträger
Die genannten Möglichkeiten sind natürlich beliebig kombinierbar, also zum Beispiel eine falsche Anzahl plus einer falschen Reihenfolge und einem bereits früher ausgefallenen – jetzt wieder online gezwungenen – Datenträger.
Generell haben alle fatalen Rebuilds gemeinsam, dass Daten auf den Datenträgern unwiderruflich überschrieben werden.
Was passiert nun bei den einzelnen Varianten im Detail:
Egal ob zu viele oder zu wenige Festplatten – Streifen werden auf allen verbleibenden Datenträgern überschrieben.
Startet man zum Beispiel ein REBUILD mit 4 statt den ursprünglichen 5 Festplatten, so werden auf den vier Datenträgern jeweils etwa 25% der Daten mit ungültigen Parity-Informationen überschrieben. Bei einem REBUILD mit zum Beispiel 3 Festplatten sind es ein Drittel der Daten per Datenträger. Je nach Konfiguration ist es möglich, dass auch immer ein Datenträger weniger betroffen sein kann.
Attingo Datenrettung kann auch noch in solchen Fällen, also wenn ein RAID5 oder RAID6 mit einer falschen Anzahl von Datenträgern angelegt worden ist, noch Daten zurück berechnen, eine Datenrettung ist somit in vielen Fällen trotzdem noch möglich.
Sehr häufig erhalten wir RAID-Systeme, bei denen ein REBUILD durchgeführt worden ist, jedoch mit einer falschen Reihenfolge der Datenträger.
Gerade bei RAIDs mit Spare-Datenträger kommt es vor, dass RAIDs gelöscht und neu angelegt werden, um noch irgendwie auf verlorene Daten zugreifen zu können. Dabei passiert, dass das neue RAID eine andere Reihenfolge an Festplatten enthält als der ursprüngliche Verbund.
Die Parity-Informationen – soweit es sich um die ursprünglichen Datenträger mit der selben Anzahl handelt – werden bei einem BUILD oder REBUILD nicht zerstört, auch die Daten bleiben erhalten.
Die Folge ist jedoch meistens deutlich schlimmer: Das Dateisystem wird noch vom Betriebssystem erkannt, jedoch als fehlerhaft interpretiert. Die Dateisystemeinträge stehen an der falschen Stelle, eine Dateisystemreparatur wird automatisch durchgeführt (z.B. chkdsk (Checkdisk) oder fsck). Die Folge ist, dass ein ursprünglich heiles Dateisystem vernichtet wird.
Eine Datenrettung ist in diesen Fällen zwar auch noch oft möglich, jedoch extrem aufwendig und teils nur unvollständig.
Ein ähnlicher Effekt wie soeben beschrieben tritt auf, wenn ein bereits früher ausgefallener Datenträger plötzlich wieder Teil des RAID-Verbundes wird. Man nennt diesen Vorgang „online force“, „force online“ oder „online zwingen“.
Meistens fällt ein Datenträger in einem RAID-Verbund aus, ohne dass der Vorgang bemerkt wird. Sobald ein weiterer Datenträger – zum Beispiel in einem RAID5 – ausfällt, kann auf die Daten nicht mehr zugegriffen werden.
In vielen Fällen setzen Systemadministratoren oder auch der Hersteller-Support die beiden defekten Festplatten wieder auf „online“. Nach einem Neustart erkennt das Betriebssystem wiederum ein Dateisystem, aber ebenfalls mit fehlerhaften Einträgen, da Teile der Informationen veraltet und ungültig sind.
Ein Dateisystem-Check wird durchgeführt, und in Folge Teile des Dateisystems vernichtet.
Wir empfehlen dringend bei drohendem Datenverlust von RAID-Systemen keine Experimente durchzuführen, der Schaden wird in fast allen Fällen schlimmer.
Oft klammert man sich an einen letzten Versuch und denkt es wird schon nicht schief gehen. Aber gerade diese Aktionen sind dann in manchen Fällen fatal.