3. ΤΕΧΝΙΚΕΣ ΣΥΜΠΙΕΣΗΣ ΠΟΛΥΜΕΣΩΝ
ΑΝΑΓΚΗ ΣΥΜΠΙΕΣΗΣ ΔΕΔΟΜΕΝΩΝ Local Multimedia Π.χ. Μία ταινία 90 min απαιτεί 120 GB, και τα σημερινά μέσα αποθήκευσης < 25 GB. Άρα σήμερα είναι αδύνατη η αποθήκευση και η μεταφορά τόσο μεγάλου Όγκου δεδομένων. ΑΠΑΙΤΕΙΤΑΙ ΣΥΜΠΙΕΣΗ!! Processing Compressed Compressing Decompressing Storage
Απαιτήσεις σε αποθηκευτικό χώρο διαφόρων τύπων δεδομένων Κείμενο (text) Εικόνα (Image) Ήχος (Audio) Animation Video Τύπος δεδομένων ASCII, EBCDIC Γραφικά bitmap ακίνητες εικόνες, Fax Μη κωδικοποιημένος ήχος ή φωνή Συγχρονισμένη εικονοσειρά σε 15 έως 19 fps Αναλογικό ή ψηφιακό σήμα με τους παλμούς χρονισμού στα 24-30 fps Απαιτούμενου μεγέθους και εύρος φάσματος 2 KB/σελίδα Δείγμα: 64 KB/εικόνα Λεπτομερής, έγχρωμη: 7.5 MB/εικόνα 6-44KB/sec για ποιότητα τηλεφώνου (8khz, 8bit, mono) 176 KB/s για ποιότητα CD- DA (44.1 khz, 16 bit, stereo) 2.5 MB/sec για 320Χ640pixel/frame (16-bit χρώμα) 27.7 MByte/s για 640Χ480pixel/frame (24-bit χρώμα) 30 fps
ΑΝΑΓΚΗ ΣΥΜΠΙΕΣΗΣ ΔΕΔΟΜΕΝΩΝ Λόγοι που επιβάλουν την συμπίεση: οι υψηλές απαιτήσεις σε χώρο αποθήκευσης των δεδομένων τους, οι σχετικά αργές συσκευές αποθήκευσης που δεν μπορούν να αναπαράγουν τα δεδομένα των εφαρμογών (ιδιαίτερα το video) σε πραγματικό χρόνο, και το εύρος φάσματος που απαιτείται για τη μεταφορά των δεδομένων στα δίκτυα των υπολογιστών σε πραγματικό χρόνο.
ΑΝΑΓΚΗ ΣΥΜΠΙΕΣΗΣ ΔΕΔΟΜΕΝΩΝ Networked Multimedia Σήμερα μόνο με συμπίεση είναι εφικτή η αποθήκευση και η μετάδοση Ψηφιακού Audio και Video. Original Processing Compressed Network Interface Network Original Processing Compressed Network Interface
Η ΣΥΜΠΙΕΣΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΕΠΙΤΡΕΠΕΙ: ΔΙΑΘΕΣΙΜΟΤΗΤΑ ΥΠΟΛΟΓΙΣΤΙΚΗ ΙΣΧΥΣ ΑΚΡΙΒΕΙΑ ΠΕΡΙΕΧΟΜΕΝΟΥ Η πληροφορία δεν είναι άμεσα Αξιοποιήσιμη! Η συμπίεση και Αποσυμπίεση Απαιτεί Υπολογιστική ισχύ. Η αποσυμπίεση Οδηγεί σε Υποβιβασμό της ακρίβειας.
ΑΛΓΟΡΙΘΜΟΙ ΣΥΜΠΙΕΣΗΣ ΧΩΡΙΣ ΑΠΩΛΕΙΕΣ (Loss less) ΜΕ ΑΠΩΛΕΙΕΣ (Lossy) Δεν αλλοιώνεται η πληροφορία. Έχουμε αλλοίωση της πληροφορίας. Χρησιμοποιείται όταν δεν υπάρχει περιθώριο απωλειών. Απώλεια τόση ώστε να μην επηρεάζεται η ποιότητα. Υπάρχουν αλγόριθμοι οι οποίοι επιτρέπουν στον χρήστη να ορίσει το ποσοστό συμπίεσης.
ΤΕΧΝΙΚΕΣ ΣΥΜΠΙΕΣΗΣ ΚΩΔΙΚΟΠΟΙΗΣΗ ΕΝΤΡΟΠΙΑΣ ΚΩΔΙΚΟΠΟΙΗΣΗ ΠΗΓΗΣ Περιορισμός ακολουθιών Στατιστική κωδικοποίηση Κωδικοποίηση Μετασχηματισμού Διανυσματική Κωδικοποίηση. Η κωδικοποίηση Εντροπίας : δεν λαμβάνει υπ όψιν το είδος της πληροφορίας αλλά την θεωρεί σαν μία σειρά από bits. Είναι κωδικοποίηση χωρίς απώλειες. Διαφορική Κωδικοποίηση. Η κωδικοποίηση Πηγής. ~ από το είδος της πληροφορίας. Έχει μεταβλητό λόγο συμπίεσης Έχει υψηλό λόγο συμπίεσης. Με ή χωρίς απώλειες.
ΣΥΜΠΙΕΣΗ : ΠΕΡΙΟΡΙΣΜΟΣ ΑΚΟΛΟΥΘΙΩΝ ΚΩΔΙΚΟΠΟΙΗΣΗ ΕΝΤΡΟΠΙΑΣ Π.χ. ΧΝΝΝΝΝΝΤΥΚΚΗSΙΤ ΠΕΡΙΟΡΙΣΜΟΣ ΑΚΟΛΟΥΘΙΩΝ Χ!6ΝΤΥΚΚΗSΙΤ αρχεία εικόνων, audio & video μπορούμε να συμπιέσουμε όμοια Bytes. δεν υπάρχει πρακτική αξία να αντικαταστήσουμε τέτοιες ακολουθίες με μήκος μικρότερο από 4 χαρακτήρες. Αν εφαρμόσουμε την τεχνική αυτή για < 4 χαρακ/ρες τότε έχουμε αύξηση του όγκου της αρχικής πληροφορίας.
ΚΩΔΙΚΟΠΟΙΗΣΗ ΕΝΤΡΟΠΙΑΣ ΑΝΤΙΚΑΤΑΣΤΑΣΗ ΠΡΟΤΥΠΩΝ ΣΤΑΤΙΣΤΙΚΗ ΚΩΔΙΚΟΠΟΙΗΣΗ ΚΩΔΙΚΟΠΟΙΗΣΗ Hoffman Στατιστική Κωδικοποίηση. Βασίζεται στην συχνότητα εμφάνισης ακολουθιών Bytes. Συχνή εμφάνιση ακολουθιών = αντικατάσταση με λιγότερα bytes και Σπάνια εμφάνιση ακολουθιών = αντικατάσταση με περισσότερα bytes. H Συμπίεση/Αποσυμπίεση πραγματοποιείται με βάση ένα πίνακα που περιέχει τις αντιστοιχίες των εμφανιζομένων ακολουθιών με τους κατάλληλους κώδικες αντικατάστασης. Ο πίνακας λέγεται Λεξικό. Αντικατάσταση Προτύπων. Χρησιμοποίηση για συμπίεση προτύπων.
ΚΩΔΙΚΟΠΟΙΗΣΗ ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΥ (Transform Encoding) Αρχικό Πεδίο Χρόνου ή Χώρου f(t). ΜΑΘΗΜΑΤΙΚΟΣ ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΣ Αφηρημένο Πεδίο g(t). ΣΥΜΠΙΕΣΗ Χρησιμοποιείται συνήθως στη συμπίεση εικόνων. Σ αυτή την κατηγορία ανήκει ο μετασχηματισμός Fourier και ο διακριτός μετασχηματισμός Fourier. Περνάμε από το πεδίο του χρόνου στο πεδίο της συχνότητας και αφαιρούμε τους συντελεστές με πολύ μικρό πλάτος. η αφαίρεση αυτή απώλειες. Μετασχηματισμός Fourier, Hadaman, Haar & Karhunen-Loeve. O Μετασχηματισμός είναι αντιστρεπτός.
ΔΙΑΦΟΡΙΚΗ ΚΩΔΙΚΟΠΟΙΗΣΗ ΑΠΛΗ ΔΙΑΦΟΡΙΚΗ ΚΩΔΙΚΟΠΟΙΗΣΗ (Simple Differential Pulse Code) (DPCΜ) ΠΡΟΣΑΡΜΟΣΜΕΝΗ ΔΙΑΦΟΡΙΚΗ ΚΩΔΙΚΟΠΟΙΗΣΗ (Adaptive Differential Pulse Code) (ADPCM) Kκωδικοποιείται μόνο η διαφορά ανάμεσα στην πραγματική και στην προβλεπόμενη τιμή. ΚΩΔΙΚΟΠΟΙΗΣΗ ΔΕΛΤΑ (Delta Modulation) (Delta -DPCΜ) Η Κωδικοποίηση είναι ίδια με την απλή DPCM αλλά χρησιμοποιεί για κωδικοποίηση των διαφορών μόνο 1 bit.. O μηχανισμός πρόβλεψης δεν είναι σταθερός αλλά προσαρμόζεται ανάλογα με τα χαρακτηριστικά του προς δειγματοληψία σήματος.
ΔΙΑΦΟΡΙΚΗ ΚΩΔΙΚΟΠΟΙΗΣΗ
τα αρχικά δεδομένα χωρίζονται σε τμήματα (ή περιοχές) τα οποία καλούνται διανύσματα. τα διανύσματα έχουν ίδιες διαστάσεις (μεγέθη). δημιουργείται λεξικό το οποίο περιέχει τα πρότυπα διανύσματα. αν το λεξικό προϋπάρχει τότε λέγεται Στατικό. αν το λεξικό δημιουργείται κατά την συμπίεση λέγεται Δυναμικό. Μετά την διαμόρφωση δεν μεταδίδεται η αρχική πληροφορία αλλά το λεξικό και οι κωδικοί οι οποίοι αντιστοιχούν σε συγκεκριμένο πρότυπο του λεξικού που ταιριάζει με την αρχική πληροφορία. ΔΙΑΝΥΣΜΑΤΙΚΗ ΚΒΑΝΤΟΠΟΙΗΣΗ (Vector Quantization) δεδομένα ΣΤΑΤΙΚΟ ΛΕΞΙΚΟ ΔΥΝΑΜΙΚΟ ΛΕΞΙΚΟ ΔΙΑΔΙΚΑΣΙΑ ΣΥΜΠΙΕΣΗΣ Συμπιεσμένα δεδομένα
Συμπίεση LZW. LZW (Ονόματα των Lempel, Ziv και Weleh που τον επινόησαν). Τον συναντάμε κυρίως σε αρχεία GIF, TIFF κλπ. Φάση κωδικοποίησης: Διαβάζει τα αρχικά δεδομένα και δημιουργεί ένα λεξικό. Το λεξικό περιέχει περίπλοκες σειρές δεδομένων τις οποίες αντικαθιστά με έναν κωδικό. Στο τέλος προκύπτει: το κύριο περιεχόμενο σαν αλληλουχία κωδικών και σειρών δεδομένων. Φάση αποκωδικοποίησης: Αντικαθιστά τους κωδικούς των συμπιεσμένων δεδομένων και επαναδημιουργεί τις αρχικές σειρές δεδομένων..
Συμπίεση RLE RLE (Run Length Encoding). Καλά αποτελέσματα για σκίτσα ή σχέδια αλλά όχι σε φωτογραφίες. Χρησιμοποιείται συχνά σε PCX, TIFF Εφαρμόζεται όταν έχουμε επανάληψη στοιχείων. Φάση κωδικοποίησης: προσπάθεια μη επανάληψης των πληροφοριών χρώματος για σειρές pixels οι οποίες έχουν το ίδιο χρώμα. Αντικατάστασή τους από ένα δείκτη. Φάση αποκωδικοποίησης: Το πρόγραμμα αναδημιουργεί τα αρχικά pixels βασιζόμενο στους δείκτες.
Συμπίεση Hoffman (entropy code). Επινόηση του David Hoffman 1952. Χρησιμοποιείται σε σειρές δεδομένων που έχουν συγκεκριμένη στατική κατανομή. Δηλ. δεδομένα χαμηλής εντροπίας (πχ κείμενο). Αποδίδει πολύ καλό λόγο συμπιέσεως. Φάση κωδικοποίησης: Διατρέχονται τα δεδομένα και εφαρμόζεται ο αλγόριθμος Hoffman. O αλγόριθμος Hoffman εντοπίζει την στατιστική κατανομή των στοιχείων. Με βάση την στατιστική κατανομή σχηματίζεται ένα δένδρο δεδομένων. Το δένδρο Hoffman έχει κλαδιά, παρακλάδια και φύλλα. Τα δεδομένα που συναντώνται πιο συχνά βρίσκονται πιο κοντά στην ρίζα του δένδρου. Η περιγραφή της θέσης γίνεται με την χρήση 0,1 αρχίζοντας από την ρίζα.
Οι κάμερες χρησιμοποιούν το RGB Σύστημα.
ΠΡΑΚΤΙΚΕΣ ΜΕΘΟΔΟΙ ΣΥΜΠΙΕΣΗΣ ΤΥΠΟΠΟΙΗΜΕΝΕΣ ΜΕΘΟΔΟΙ ΜΗ ΤΥΠΟΠΟΙΗΜΕΝΕΣ ΜΕΘΟΔΟΙ JPEG H-261 MPEG-1 H-263 MPEG-2 MPEG-4 Τα πρότυπα προέκυψαν από έρευνα των Πανεπιστημίων. JPEG Joint Photographic Expert Group MPEG Motion Picture Expert Group. (Motion JPEG). Eίναι οικογένεια από Standards της ISO. (MPEG-1, MPEG-2,,MPEG-3, MPEG-7). H-261:κωδικοποίηση video. Ταχύτητα = P*64(Kbps) (P=1-30) H-263:ορίζει κωδικοποιητή/ αποκωδικοποιητή για συμπίεση για την συμπίεση στοιχείων κινούμενης εικόνας σε χαμηλή ταχύτητα.