Operation Manual
261 Copyright © Acronis International GmbH, 2002-2016
7.5.7.2 So funktioniert Deduplizierung
Deduplizierung an der Quelle
Während der Backup-Erstellung zu einem deduplizierenden Depot berechnet der Acronis Backup
Agent für jeden Datenblock einen so genannten Fingerabdruck. Ein solcher Fingerabdruck wird auch
als Hash-Wert bezeichnet.
Bevor ein Datenblock zum Depot übertragen wird, fragt der Agent die Deduplizierungsdatenbank ab,
um zu bestimmen, ob der Hash-Wert dieses Blocks dem eines bereits gespeicherten Blocks entspricht.
Trifft dies zu, dann überträgt der Agent nur den Hash-Wert, wenn nicht, dann wird der Block selbst
übertragen. Der Storage Node speichert die empfangenen Datenblöcke in einer temporären Datei.
Einige Daten, etwa verschlüsselte Dateien oder Laufwerksdatenblöcke mit nicht standardkonformer
Größe, können nicht dedupliziert werden. Solche Daten werden vom Agenten immer ohne
Berechnung ihrer Hash-Werte zum Depot übertragen. Mehr Informationen über Beschränkungen bei
der Deduplizierung finden Sie unter Deduplizierungsbeschränkungen (S. 265).
Sobald der Backup-Prozess abgeschlossen wurde, sind im Depot das resultierende Backup sowie die
temporäre Datei mit den einmaligen Datenblöcken enthalten. Die temporäre Datei wird dann in der
nächsten Phase verarbeitet. Das Backup (eine tib-Datei) enthält Hash-Werte zusammen mit Daten,
die nicht dedupliziert werden können. Eine weitere Verarbeitung dieses Backups ist nicht notwendig.
Sie können ohne Weiteres Daten aus diesem wiederherstellen.
Deduplizierung am Ziel
Nachdem ein Backup zu einem deduplizierenden Depot abgeschlossen wurde, führt der Storage
Node eine Indizierungsaktivität aus. Durch diese Aktivität werden die Daten in dem Depot
folgendermaßen dedupliziert:
1. Die Datenblöcke werden aus der temporären Datei in eine spezielle Datei innerhalb des Depots
verschoben, in der doppelt vorhandene Elemente dann nur noch einmal gespeichert werden.
Diese Datei wird Deduplizierungsdatenspeicher genannt.
2. Sie speichert die Hash-Werte und Links, die zum Zusammensetzen der deduplizierten Daten für
die Deduplizierungsdatenbank notwendig sind.
3. Nachdem alle Datenblöcke verschoben wurden, wird die temporäre Datei gelöscht.
Als Ergebnis enthält der Datenspeicher eine bestimmte Anzahl an einmaligen Datenblöcken. Von den
Backups gibt es einen oder mehrere Verweise auf jeden Block. Die Verweise sind in der
Deduplizierungsdatenbank enthalten. Die Backups selbst verbleiben unberührt. Sie enthalten
Hash-Werte sowie Daten, die nicht dedupliziert werden können.