Operation Manual

263 Copyright © Acronis International GmbH, 2002-2015
Die Deduplizierungsdatenbank wird in einem lokalen Ordner des Storage Nodes gespeichert. Sie
können den Pfad zur Datenbank bei Erstellung des Depots spezifizieren.
Die Größe einer Deduplizierungsdatenbank beträgt ungefähr 1,5 Prozent der Gesamtgröße aller im
Depot gespeicherten 'einmaligen Daten'. Mit anderen Worten, jedes Terabyte an neuen (nicht
doppelten) Daten fügt der Datenbank ca. 15 GB hinzu.
Sollte eine Datenbank beschädigt sein oder der Storage Node verloren gehen, während der Inhalt des
Depots bestehen bleibt, so scannt der neue Storage Node das Depot und erstellt die Datenbank
wieder neu.
7.5.7.2 So funktioniert Deduplizierung
Deduplizierung an der Quelle
Während der Backup-Erstellung zu einem deduplizierenden Depot berechnet der Acronis Backup
Agent für jeden Datenblock einen so genannten Fingerabdruck. Ein solcher Fingerabdruck wird auch
als Hash-Wert bezeichnet.
Bevor ein Datenblock zum Depot übertragen wird, fragt der Agent die Deduplizierungsdatenbank ab,
um zu bestimmen, ob der Hash-Wert dieses Blocks dem eines bereits gespeicherten Blocks entspricht.
Trifft dies zu, dann überträgt der Agent nur den Hash-Wert, wenn nicht, dann wird der Block selbst
übertragen. Der Storage Node speichert die empfangenen Datenblöcke in einer temporären Datei.
Einige Daten, etwa verschlüsselte Dateien oder Laufwerksdatenblöcke mit nicht standardkonformer
Größe, können nicht dedupliziert werden. Solche Daten werden vom Agenten immer ohne
Berechnung ihrer Hash-Werte zum Depot übertragen. Mehr Informationen über Beschränkungen bei
der Deduplizierung finden Sie unter Deduplizierungsbeschränkungen (S. 267).
Sobald der Backup-Prozess abgeschlossen wurde, sind im Depot das resultierende Backup sowie die
temporäre Datei mit den einmaligen Datenblöcken enthalten. Die temporäre Datei wird dann in der
nächsten Phase verarbeitet. Das Backup (eine tib-Datei) enthält Hash-Werte zusammen mit Daten,
die nicht dedupliziert werden können. Eine weitere Verarbeitung dieses Backups ist nicht notwendig.
Sie können ohne Weiteres Daten aus diesem wiederherstellen.
Deduplizierung am Ziel
Nachdem ein Backup zu einem deduplizierenden Depot abgeschlossen wurde, führt der Storage
Node eine Indizierungsaktivität aus. Durch diese Aktivität werden die Daten in dem Depot
folgendermaßen dedupliziert:
1. Die Datenblöcke werden aus der temporären Datei in eine spezielle Datei innerhalb des Depots
verschoben, in der doppelt vorhandene Elemente dann nur noch einmal gespeichert werden.
Diese Datei wird Deduplizierungsdatenspeicher genannt.
2. Sie speichert die Hash-Werte und Links, die zum Zusammensetzen der deduplizierten Daten für
die Deduplizierungsdatenbank notwendig sind.
3. Nachdem alle Datenblöcke verschoben wurden, wird die temporäre Datei gelöscht.
Als Ergebnis enthält der Datenspeicher eine bestimmte Anzahl an einmaligen Datenblöcken. Von den
Backups gibt es einen oder mehrere Verweise auf jeden Block. Die Verweise sind in der
Deduplizierungsdatenbank enthalten. Die Backups selbst verbleiben unberührt. Sie enthalten
Hash-Werte sowie Daten, die nicht dedupliziert werden können.