Operation Manual

ManualsBrandsAcronis ManualsSoftwareBackup Advanced Version 11.5 Update 6

261

262

263

264

265

266

267

268

269

270

Die Deduplizierungsdatenbank wird in einem lokalen Ordner des Storage Nodes gespeichert. Sie

können den Pfad zur Datenbank bei Erstellung des Depots spezifizieren.

Die Größe einer Deduplizierungsdatenbank beträgt ungefähr 1,5 Prozent der Gesamtgröße aller im

Depot gespeicherten 'einmaligen Daten'. Mit anderen Worten, jedes Terabyte an neuen (nicht

doppelten) Daten fügt der Datenbank ca. 15 GB hinzu.

Sollte eine Datenbank beschädigt sein oder der Storage Node verloren gehen, während der Inhalt des

Depots bestehen bleibt, so scannt der neue Storage Node das Depot und erstellt die Datenbank

wieder neu.

7.5.7.2 So funktioniert Deduplizierung

Deduplizierung an der Quelle

Während der Backup-Erstellung zu einem deduplizierenden Depot berechnet der Acronis Backup

Agent für jeden Datenblock einen so genannten Fingerabdruck. Ein solcher Fingerabdruck wird auch

als Hash-Wert bezeichnet.

Bevor ein Datenblock zum Depot übertragen wird, fragt der Agent die Deduplizierungsdatenbank ab,

um zu bestimmen, ob der Hash-Wert dieses Blocks dem eines bereits gespeicherten Blocks entspricht.

Trifft dies zu, dann überträgt der Agent nur den Hash-Wert, wenn nicht, dann wird der Block selbst

übertragen. Der Storage Node speichert die empfangenen Datenblöcke in einer temporären Datei.

Einige Daten, etwa verschlüsselte Dateien oder Laufwerksdatenblöcke mit nicht standardkonformer

Größe, können nicht dedupliziert werden. Solche Daten werden vom Agenten immer ohne

Berechnung ihrer Hash-Werte zum Depot übertragen. Mehr Informationen über Beschränkungen bei

der Deduplizierung finden Sie unter Deduplizierungsbeschränkungen (S. 267).

Sobald der Backup-Prozess abgeschlossen wurde, sind im Depot das resultierende Backup sowie die

temporäre Datei mit den einmaligen Datenblöcken enthalten. Die temporäre Datei wird dann in der

nächsten Phase verarbeitet. Das Backup (eine tib-Datei) enthält Hash-Werte zusammen mit Daten,

die nicht dedupliziert werden können. Eine weitere Verarbeitung dieses Backups ist nicht notwendig.

Sie können ohne Weiteres Daten aus diesem wiederherstellen.

Deduplizierung am Ziel

Nachdem ein Backup zu einem deduplizierenden Depot abgeschlossen wurde, führt der Storage

Node eine Indizierungsaktivität aus. Durch diese Aktivität werden die Daten in dem Depot

folgendermaßen dedupliziert:

1. Die Datenblöcke werden aus der temporären Datei in eine spezielle Datei innerhalb des Depots

verschoben, in der doppelt vorhandene Elemente dann nur noch einmal gespeichert werden.

Diese Datei wird Deduplizierungsdatenspeicher genannt.

2. Sie speichert die Hash-Werte und Links, die zum Zusammensetzen der deduplizierten Daten für

die Deduplizierungsdatenbank notwendig sind.

3. Nachdem alle Datenblöcke verschoben wurden, wird die temporäre Datei gelöscht.

Als Ergebnis enthält der Datenspeicher eine bestimmte Anzahl an einmaligen Datenblöcken. Von den

Backups gibt es einen oder mehrere Verweise auf jeden Block. Die Verweise sind in der

Deduplizierungsdatenbank enthalten. Die Backups selbst verbleiben unberührt. Sie enthalten

Hash-Werte sowie Daten, die nicht dedupliziert werden können.