User's Guide

Theorie Datenkomprimierung
43
Datenkomprimierung
Typische Datenströme aus Text, Graphiken, Software-Code oder andere Formen von Daten enthalten
bestimmte wiederholte Informationen, entweder auf einer Textebene, wobei regelmäßige
Wiederholungen einzelner Wörter leicht erkennbar sind, oder auf einer binären Ebene, wobei die
Wiederholungen aus Bits oder Bytes bestehen. Obwohl die meisten Daten einzigartig und willkürlich
sind, besitzen die Daten auf binärer Ebene Muster von verschiedenen Größen, die mit
unterschiedlicher Regelmäßigkeit wiederholt werden.
Die Speicherleistung wird erhöht, wenn die Redundanzen oder Wiederholungen in den Daten vor
der Aufnahme aufs Band entfernt werden. Die Datenkomprimierungs-Technologie vermindert oder
entfernt Redundanzen erheblich in Daten, bevor die Informationen aufs Band aufgenommen werden.
Hierdurch wird die Anzahl an Daten erhöht, die auf einem begrenzten Datenträger gespeichert
werden können, und die Gesamtspeicherleistung des Systems wird erhöht.
Mit Datenkomprimierung werden die redundanten Informationen in einem Datenstrom identifiziert
und durch Code-Wörter oder -Symbole dargestellt, wodurch die gleichen Daten auf weniger Bits
aufgenommen werden können. Diese Code-Wörter oder -Symbole zeigen auf die ursprüngliche
Datenzeichenkette und verwenden dabei weniger Zeichen zur Darstellung der Zeichenketten. Da
kleinere Symbole die längeren Datenzeichenketten ersetzen, können mehr Daten im gleichen
physischen Speicher gelagert werden.
Datenkomprimierung auf Bandlaufwerken bieten einige wichtige Vorteile:
Die gleiche Menge an Informationen kann auf einer kürzeren Bandlänge gespeichert werden.
Mehr Daten können auf einer festgelegten Bandlänge gespeichert werden.
Die Leistung gleicht fast der von Hochübertragungsgeschwindigkeits-Computern.
Mehr Informationen können im gleichen Zeitintervall übertragen werden.
Datenkomprimierungs-Berücksichtigungen
Bei einer leistungsfähigen Datenkomprimierungsmethode sind mehrere Faktoren wichtig:
Der Umfang der Komprimierung. Der Umfang der Komprimierung wird durch das
Komprimierungsverhältnis gemessen. Dieses Verhältnis vergleicht die Menge der
unkomprimierten Daten mit der Menge der komprimierten Daten. (Es wird durch das Teilen
der Größe der unkomprimierten Daten durch die Größe der komprimierten Daten errechnet)
Die Geschwindigkeit, mit der Daten komprimiert und dekomprimiert werden im Verhältnis zu
der Host-Übertragungsgeschwindigkeit.
Die zu komprimierenden Datentypen.
Die Datenintegrität der komprimierten Daten.
Die Menge der Komprimierung, die in einem Datenstrom möglich ist, hängt unter anderem von den
folgenden Faktoren ab:
Datenmuster
Komprimierungsalgorithmus
Musterwiederholungslänge
Musterwiederholungshäufigkeit
Objektgröße (zu komprimierender Informationsblock)