Kompression
Durch Kompression wird das Volumen von Daten reduziert, um z.B. Speicherplatz und/oder Bandbreite einzusparen. Dass Kompression notwendig ist, soll anhand von vier Beispielen belegt werden. In jedem Beispiel wird gezeigt, wie viele Daten auf einer handelsüblichen 1.44 MByte Diskette Platz finden. Auf eine Diskette passen, bei Formatierung mit dem FAT Dateisystem, 1.423 KByte. Das entspricht 1.457.152 Byte und das wiederum 11.657.216 Bit.
Normaler Text:
Eine Seite Text bestehe aus 64 Zeilen, jede Zeile bestehe aus 80 Zeichen und ein Zeichen sei 1 Byte groß.
Das Datenvolumen einer Seite ist also:
80 Byte/Zeile x 64 Zeilen/Seite x 8 = 40960 Bit/Seite. Es passen somit
11.657.216 Bit / 40960 Bit/Seite = 284,6 Seiten Text auf eine Diskette.
Standbilder:
Ein Standbild bestehe aus 512x512 Bildpunkten, jeder Bildpunkt besitze eine Farbtiefe von 24 Bit
(je acht Bit für Rot-, Gelb- und Blauanteil). Ein Bild hat folglich eine Größe von:
512 x 512 Bildpunkte/Bild x 24 Bit/Bildpunkt = 6.291.456 Bit/Bild. Man kann
11.657.216 Bit / 6.291.456 Bit/Bild = 1,9 Bilder auf Diskette speichern.
Besser gesagt: Es passt nur ein einziges Bild auf eine Diskette.
Audio in CD Qualität:
Es wird eine Sample Frequenz von 44.100 Hz bei 16 Bit/Sample und Stereoton verwendet. Also:
44.100 Samples/Sekunde x 16 Bit/Sample x 2 = 1.411.200 Bit/Sekunde. Auf eine Diskette passen
11.657.216 Bit / 1.411.200 Bit/Sekunde = 8 Sekunden Audio.
Video:
Es sollen 30 Bilder pro Sekunde aufgenommen werden. Jedes Bild besitze eine Größe von 360x240 Bildpunkten
(also 86.400 Bildpunkte) und jeder Bildpunkt habe eine Farbtiefe von 24 Bit. Das ergibt:
86.400 Bildpunkte x 24 Bit x 30 Bilder/Sekunde = 622.080.000 Bit/Sekunde.
Auf eine Diskette passen somit 11.657.216 Bit / 622.080.000 Bit/Sekunde = 0,19 Sekunden Video.
Man sieht also, dass die Archivierung und Übertragung von Daten ein Problem darstellt, da das Datenvolumen zu groß ist. Möchte man z.B. eine Stunde Videomaterial archivieren, so wäre ein Speichermedium nötig mit einer Kapazität von 3600 Sekunden x 622.080.000 Bit/Sekunde = 2,24 x 1012 Bit. Um das Problem zu lösen, muss man das Datenaufkommen reduzieren, indem die Daten komprimiert werden. Es gibt zwei Grundideen bei der Datenkompression: Einerseits kann ein verlustfreies Kompressionsverfahren verwendet werden oder andererseits kann ein verlustbehaftetes Kompressionsverfahren benutzt werden:
Verlustfreie Kompressionsverfahren zeichnen sich dadurch aus, dass nach der Rekonstruktion zuvor komprimierter Daten (z.B. Bilder, Videos oder Audioinformationen), die Originalinformationen wieder vollständig wiederhergestellt werden können.
Die Idee der verlustbehafteten Komprimierung ist, Informationen, welche für den Menschen gar nicht oder nur teilweise wahrzunehmen sind, einfach aus den Originaldaten zu entfernen und dadurch die zu komprimierende Datenmenge zu verkleinern. Als Bespiel für eine verlustbehaftete Komprimierung lässt sich die Umwandlung von Audiodaten in das MP3 Format aufführen. Hier wird unter anderem eine Kompression dadurch erzielt, dass für das menschliche Ohr unhörbare Frequenzen nicht abgespeichert werden. Das menschliche Ohr vermag Frequenzen aus einem Bereich von 20 Hertz bis 20.000 Hertz wahrzunehmen.
Im Gegensatz zu Audiodaten bietet sich bei Bildern eine Möglichkeit das Datenvolumen zu verringern, durch die Wahl des Farbmodells zur Speicherung des Bildes. Benutzt man das RGB-Farbmodell so werden für jeden einzelnen Bildpunkt die Werte für Rot-,Gelb- und Blauanteil gesichert (4 Pixel x 3 Farben x 8 Bit = 96 Bit/4 Pixel). Macht man sich hingegen die Schwäche des menschlichen Sehvermögens zunutze, empfindlicher auf Helligkeitsveränderungen als auf Farbveränderungen zu reagieren, kann man das YUV-Farbmodell heranziehen. Dort werden zwar, wie beim RGB-Modell auch, drei Komponenten gespeichert, aber nicht für jeden Bildpunkt. Bei YUV kommt nämlich noch ein Quantisierungsschritt hinzu. In der Y-Komponente wird für jeden Bildpunkt der Helligkeitswert gesichert, aber nur für jeden 2x2 Bildpunkte großen Block wird ein Farbwert erfasst (siehe Abbildung).
Betrachtet man nur die Farbkomponenten (U und V Komponente), so hat das Bild nur noch die halbe Auflösung der Helligkeitskomponente. Durch die bereits genannte Sehschwäche des menschlichen Auges erzielt man eine Reduzierung des Datenvolumens, durch Bevorzugung des YUV Bildformates gegenüber dem RGB Bildformat, auf die Hälfte des Volumens: (4 Pixel x 8 Bit + 2 x 8 Bit = 48 Bit/4 Pixel) bei einem Informationsverlust, der kaum oder sogar überhaupt nicht feststellbar ist.