Συµπίεση Ψηφιακών Εικόνων:



Σχετικά έγγραφα
Περιεχόµενα. ΕΠΛ 422: Συστήµατα Πολυµέσων. Γιατί Συµπίεση; Βιβλιογραφία

Συµπίεση δεδοµένων: Εισαγωγή, Κατηγορίες τεχνικών συµπίεσης, Ανάλυση βασικών τεχνικών συµπίεσης

Περιεχόµενα. ΕΠΛ 422: Συστήµατα Πολυµέσων. Βιβλιογραφία. Κατηγορίες τεχνικών συµπίεσης. Τεχνικές Συµπίεσης

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ,

Συµπίεση Ψηφιακών Εικόνων: Συµπίεση µε Απώλειες. Πρότυπα Συµπίεσης Εικόνων

Αρχές κωδικοποίησης. Τεχνολογία Πολυµέσων 08-1

Επεξεργασία Χαρτογραφικής Εικόνας

Τεχνολογία Πολυμέσων. Ενότητα 4: Συμπίεση Δεδομένων. Νικολάου Σπύρος Τμήμα Μηχανικών Πληροφορικής ΤΕ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ, ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ

Συστήματα Πολυμέσων. Ενότητα 6: Συμπίεση Ψηφιακής Εικόνας. Θρασύβουλος Γ. Τσιάτσος Τμήμα Πληροφορικής ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

3. ΤΕΧΝΙΚΕΣ ΣΥΜΠΙΕΣΗΣ ΠΟΛΥΜΕΣΩΝ

Συστήματα Πολυμέσων. Ενότητα 3: Εισαγωγικά θέματα Συμπίεσης. Θρασύβουλος Γ. Τσιάτσος Τμήμα Πληροφορικής ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

Συµπίεση Εικόνας: Το πρότυπο JPEG

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΛΟΠΟΝΝΗΣΟΥ, ΤΜΗΜΑ ΤΕΧΝΟΛΟΓΙΑΣ ΤΗΛΕΠΙΚΟΙΝΩΝΙΩΝ

Ψηφιακή Επεξεργασία Εικόνας

Τεράστιες ανάγκες σε αποθηκευτικό χώρο

19/3/2007 Πολυµέσα και Συµπίεση εδοµένων

DIP_06 Συμπίεση εικόνας - JPEG. ΤΕΙ Κρήτης

Περιεχόµενα. ΕΠΛ 422: Συστήµατα Πολυµέσων. Βιβλιογραφία. Εισαγωγή. Συµπίεση εικόνων: Το πρότυπο JPEG. Εισαγωγή. Ευθύς µετασχηµατισµός DCT

ΒΕΣ 04: Συµπίεση και Μετάδοση Πολυµέσων. Περιεχόµενα. Βιβλιογραφία. Συµπίεση εικόνων: Το πρότυπο JPEG. Εισαγωγή. Ευθύς µετασχηµατισµός DCT

Αρχές κωδικοποίησης. Τεχνολογία Πολυμέσων και Πολυμεσικές Επικοινωνίες 08-1

Συμπίεση Πολυμεσικών Δεδομένων

Θέμα: «ΣΥΜΠΙΕΣΗ ΔΕΔΟΜΕΝΩΝ ΚΑΙ ΠΟΛΥΜΕΣΑ» Εισηγητής: Παναγιώτης Γιώτης 20 Μαϊου 2007 Αθήνα

Πληροφορική Ι. Μάθημα 9 ο Συμπίεση δεδομένων. Τμήμα Χρηματοοικονομικής & Ελεγκτικής ΤΕΙ Ηπείρου Παράρτημα Πρέβεζας. Δρ.

Τεχνολογία Πολυμέσων. Ενότητα # 8: Αρχές κωδικοποίησης Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής

Ακαδηµαϊκό Έτος , Χειµερινό Εξάµηνο ιδάσκων Καθ.: Νίκος Τσαπατσούλης

χωρίςναδηµιουργείταιαίσθησηαπώλειαςτηςποιότηταςτηςανακατασκευασµένηςεικόνας.

Συστήµατα Πολυµέσων Ενδιάµεση Εξέταση: Οκτώβριος 2004

ΤΕΙ ΚΡΗΤΗΣ ΤΜ. ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡ/ΚΗΣ & ΠΟΛΥΜΕΣΩΝ ΔΙΔΑΣΚΩΝ: Δρ. Γ. ΓΑΡΔΙΚΗΣ. Κωδικοποίηση εικόνας

ΒΕΣ 04: Συµπίεση και Μετάδοση Πολυµέσων. Περιεχόµενα. Βιβλιογραφία. Εικόνες και Πολυµεσικές Εφαρµογές. Ψηφιακή Επεξεργασία Εικόνας.

Ψηφιακή Επεξεργασία και Ανάλυση Εικόνας Ενότητα 6 η : Συμπίεση Εικόνας. Καθ. Κωνσταντίνος Μπερμπερίδης Πολυτεχνική Σχολή Μηχανικών Η/Υ & Πληροφορικής

Μάθημα 7 ο. Συμπίεση Εικόνας ΤΜΗΥΠ / ΕΕΣΤ 1

Μετάδοση Πολυμεσικών Υπηρεσιών Ψηφιακή Τηλεόραση

Συµπίεση Δεδοµένων: Συµπίεση Ψηφιακού Βίντεο

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ, ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ

Group (JPEG) το 1992.

Θέματα Συστημάτων Πολυμέσων

Συμπίεση Δεδομένων

Επεξεργασία Πολυµέσων. Δρ. Μαρία Κοζύρη Π.Μ.Σ. «Εφαρµοσµένη Πληροφορική» Τµήµα Ηλεκτρολόγων Μηχανικών & Μηχανικών Υπολογιστών Πανεπιστήµιο Θεσσαλίας

ΘΕΩΡΙΑ ΠΛΗΡΟΦΟΡΙΑΣ. Κεφάλαιο 3 : Πηγές Πληροφορίας Χρήστος Ξενάκης. Πανεπιστήμιο Πειραιώς, Τμήμα Ψηφιακών Συστημάτων

ITU-T : H.261 (1990), H.262 (1996), H.263 (1995) MPEG-1, MPEG-2, MPEG-4. Αποθήκευση, Μετάδοση, Επικοινωνίες, ίκτυα

Κωδικοποίηση βίντεο (MPEG)

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ, ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ

DIP_06 Συµπίεσηεικόνας - JPEG. ΤΕΙ Κρήτης

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ,

Μάθημα Εισαγωγή στις Τηλεπικοινωνίες Κωδικοποίηση πηγής- καναλιού Μάθημα 9o

Συστήµατα και Αλγόριθµοι Πολυµέσων

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΛΟΠΟΝΝΗΣΟΥ, ΤΜΗΜΑ ΤΕΧΝΟΛΟΓΙΑΣ ΤΗΛΕΠΙΚΟΙΝΩΝΙΩΝ

Συστήματα Πολυμέσων. Ενότητα 7: Συμπίεση Εικόνας κατά JPEG. Θρασύβουλος Γ. Τσιάτσος Τμήμα Πληροφορικής ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

Κωδικοποίηση βίντεο (H.261 / DVI)

Τι συσχετίζεται με τον ήχο

Επεξεργασία Χαρτογραφικής Εικόνας

Κατηγορίες Συμπίεσης. Συμπίεση με απώλειες δεδομένων (lossy compression) π.χ. συμπίεση εικόνας και ήχου

Ελληνική Δημοκρατία Τεχνολογικό Εκπαιδευτικό Ίδρυμα Ηπείρου. Πληροφορική Ι. Ενότητα 9 : Συμπίεση δεδομένων. Δρ. Γκόγκος Χρήστος

Τμήμα Επιστήμης Υπολογιστών ΗΥ-474. Ψηφιακή Εικόνα. Χωρική ανάλυση Αρχεία εικόνων

Ραδιοτηλεοπτικά Συστήματα Ενότητα 4: Ψηφιοποίηση και συμπίεση σημάτων εικόνας

Κωδικοποίηση ήχου. Κωδικοποίηση καναλιού φωνής Κωδικοποίηση πηγής φωνής Αντιληπτική κωδικοποίηση Κωδικοποίηση ήχου MPEG

Τμήμα Χρηματοοικονομικής & Ελεγκτικής ΤΕΙ Ηπείρου Παράρτημα Πρέβεζας. Πληροφορική Ι ΨΗΦΙΑΚΗ ΑΝΑΠΑΡΑΣΤΑΣΗ ΔΕΔΟΜΕΝΩΝ. Δρ.

Θεωρία Πληροφορίας. Διάλεξη 4: Διακριτή πηγή πληροφορίας χωρίς μνήμη. Δρ. Μιχάλης Παρασκευάς Επίκουρος Καθηγητής

Θεωρία πληροφοριών. Τεχνολογία Πολυµέσων 07-1

Συστήματα Πολυμέσων. Ενότητα 15: Συμπίεση Ψηφιακού Βίντεο. Θρασύβουλος Γ. Τσιάτσος Τμήμα Πληροφορικής ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

Ακαδηµαϊκό Έτος , Χειµερινό Εξάµηνο ιδάσκων Καθ.: Νίκος Τσαπατσούλης

Κατάτµηση εικόνας σε οµοιόµορφες περιοχές

Κωδικοποίηση βίντεο (MPEG)

Δομές Δεδομένων και Αλγόριθμοι

Χρήστος Ξενάκης. Πανεπιστήμιο Πειραιώς, Τμήμα Ψηφιακών Συστημάτων

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ Τ Μ Η Μ Α Π Λ Η Ρ Ο Φ Ο Ρ Ι Κ Η Σ

Χρήστος Ξενάκης. Πανεπιστήμιο Πειραιώς, Τμήμα Ψηφιακών Συστημάτων

Τεχνολογία Πολυμέσων. Ενότητα # 12: Κωδικοποίηση βίντεο: H.26x Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής

Θέματα Συστημάτων Πολυμέσων. Ενότητα #3: Ιδιότητες μέσων Διδάσκων: Γεώργιος K. Πολύζος Τμήμα: Μεταπτυχιακό Πρόγραμμα Σπουδών Επιστήμη των Υπολογιστών

Τηλεπικοινωνιακά Συστήματα ΙΙ

Μέθοδοι Αναπαράστασης Περιοχών

Τεχνολογία Πολυμέσων. Ενότητα # 11: Κωδικοποίηση εικόνων: JPEG Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής

ΤΗΛΕΜΑΤΙΚΗ ΚΑΙ ΝΕΕΣ ΥΠΗΡΕΣΙΕΣ

Εφαρμογές που συνδυάζουν ταυτόχρονα πολλαπλά μέσα : Κί Κείμενο, Εικόνα, Ήχος, Video, Animation. Στα υπερμέσα η πρόσπέλαση της πληροφορίας γίνεται

Πληροφορική Εφαρμογές Πολυμέσων

Ακαδηµαϊκό Έτος , Χειµερινό Εξάµηνο ιδάσκων Καθ.: Νίκος Τσαπατσούλης

Συστήματα Πολυμέσων. Ενότητα 12: Συμπίεση Ψηφιακού Ήχου. Θρασύβουλος Γ. Τσιάτσος Τμήμα Πληροφορικής ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

Θέματα Συστημάτων Πολυμέσων. Ενότητα # 7: JPEG Διδάσκων: Γεώργιος Πολύζος Τμήμα: Μεταπτυχιακό Πρόγραμμα Σπουδών Επιστήμη των Υπολογιστών

Ανάκτηση Πληροφορίας

Πολυμέσα. Συμπίεση δεδομένων Κωδικοποίηση JPEG. Δρ. Γεώργιος Π. Παυλίδης ΔΗΜΟΚΡΙΤΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΡΑΚΗΣ

Ασκήσεις Επεξεργασίας Εικόνας

Δ11 Δ12. Συμπίεση Δεδομένων

Εισαγωγή στην επιστήμη των υπολογιστών. Υπολογιστές και Δεδομένα Κεφάλαιο 2ο Αναπαράσταση Δεδομένων

Περιεχόµενα. ΕΠΛ 422: Συστήµατα Πολυµέσων. Μέθοδοι συµπίεσης ηχητικών. Βιβλιογραφία. Κωδικοποίηση µε βάση την αντίληψη.

Μοντέλο Επικοινωνίας Δεδομένων. Επικοινωνίες Δεδομένων Μάθημα 6 ο

MPEG-4: Βασικά Χαρακτηριστικά

Συστήµατα και Αλγόριθµοι Πολυµέσων

Τεχνολογία Πολυμέσων. Ενότητα # 9: Κωδικοποίηση εντροπίας Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής

2. ΨΗΦΙΟΠΟΙΗΣΗ ΠΛΗΡΟΦΟΡΙΑΣ

Ασκήσεις στο µάθηµα «Επισκόπηση των Τηλεπικοινωνιών»

Ακαδηµαϊκό Έτος , Χειµερινό Εξάµηνο ιδάσκων Καθ.: Νίκος Τσαπατσούλης

Παλμοκωδική Διαμόρφωση. Pulse Code Modulation (PCM)

Πρόλογος 1. 1 Μαθηµατικό υπόβαθρο 9

Κωδικοποίηση εικόνων κατά JPEG

Η ανάγκη για συμπίεση

Πολυμέσα πάνω από κινητά δίκτυα

Γιώργος Τζιρίτας Τµήµα Επιστήµης Υπολογιστών

DIP_01 Εισαγωγή στην ψηφιακή εικόνα. ΤΕΙ Κρήτης

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΙΟΝΙΩΝ ΝΗΣΩΝ ΠΑΡΑΡΤΗΜΑ ΛΕΥΚΑΔΑΣ ΤΜΗΜΑ: ΕΦΑΡΜΟΓΩΝ ΠΛΗΡΟΦΟΡΙΚΗΣ ΣΤΗ ΔΙΟΙΚΗΣΗ ΚΑΙ ΤΗΝ ΟΙΚΟΝΟΜΙΑ

Transcript:

ΤΨΣ 5 Ψηφιακή Επεξεργασία Εικόνας Συµπίεση Ψηφιακών Εικόνων: Συµπίεση χωρίς απώλειες Τµήµα ιδακτικής της Τεχνολογίας και Ψηφιακών Συστηµάτων Πανεπιστήµιο Πειραιώς Περιεχόµενα Βιβλιογραφία Περιεχόµενα Ενότητας Εισαγωγή - Βασικά Στοιχεία Συµπίεσης Ψηφιακών Εικόνων Κατηγορίες Τεχνικών Συµπίεσης Μοντέλο Συµπίεσης Εικόνων Συµπίεση χωρίς Απώλειες (lossless compression) Κωδικοποίηση Huffman Κωδικοποίηση Μήκους ιαδροµής Προβλεπτική Κωδικοποίηση Βιβλιογραφία: Πήτας [999]: Κεφάλαιο 9, Ενότητες 9.-9.6 Gonzales [22]: Chapter, Sections.-.4 Gonzales [24]: Chapter, Sections.-.3

Εισαγωγή Συµπίεση ονοµάζουµε τη διαδικασία ελάττωσης των δεδοµένων που χρειάζονται για την αναπαράσταση µιας µορφής πληροφορίας (όπως εικόνες, ήχος, κείµενο, βίντεο κλπ) εδοµένα ονοµάζουµε το µέσο απεικόνισης - αναπαράστασης της πληροφορίας. Για παράδειγµα θεωρήστε δύο αφηγητές που διηγούνται την ίδια ιστορία Η πληροφορία που πρέπει να µεταδοθεί είναι η ιστορία Τα δεδοµένα µέσω των οποίων µεταφέρεται η πληροφορία στους ακροατές είναι οι λέξεις Αν ο ένας εκ των δύο αφηγητών χρησιµοποιεί περισσότερες λέξεις για την αφήγηση της ιστορίας τότε χρησιµοποιεί πλεονασµατικά δεδοµένα (η ιστορία γίνεται αντιληπτή και χωρίς τις επιπλέον αυτές λέξεις. Στις ψηφιακές εικόνες πληροφορία θεωρούµε την εικόνα και δεδοµένα των αριθµό των bits που χρειάζονται για την αναπαράσταση της Στη πραγµατικότητα τα δεδοµένα είναι οι τιµές χρώµατος ή φωτεινότητας των pixel καθώς και οι διαστάσεις της εικόνας. Όµως και αυτά δεδοµένα αναπαρίστανται τελικά ως bits Γιατί χρειάζεται Συµπίεση; Αποθήκευση: Πόση διάρκεια ασυµπίεστου ψηφιακού βίντεο µπορεί να αποθηκευτεί σε ένα CD-ROM; Τι χωρητικότητα µνήµης χρειαζόµαστε για να αποθηκεύσουµε: Μετάδοση: Το ραδιοτηλεοπτικό αρχείο της ΕΡΤ; Απεικονιστικές εξετάσεις ασθενών (π.χ. υπέρηχοι) που παράγονται κατά εκατοντάδες την ηµέρα σε ένα νοσοκοµείο; Μπορώ να παρακολουθήσω ένα τηλεοπτικό πρόγραµµα που µεταδίδεται ιαδικτυακά: Αν έχω σύνδεση PSTN (modem 56kbs); Αν έχω σύνδεση ISDN (2x64 kbps); Aν έχω σύνδεση ADSL (256 kbps 2 Mbps); Αν βρίσκοµαι στο Πανεπιστήµιο και έχω σύνδεση LAN ( Mbps, Mbps); 2

Γιατί χρειάζεται Συµπίεση (II); Κόστος: Πόσο θα πληρώσω αν έχω χρέωση µε βάση τη διάρκεια σύνδεσης; Πόσο θα πληρώσω αν έχω χρέωση µε τον όγκο της διακινούµενης πληροφορίας; Ικανοποίηση χρήσης εφαρµογών πολυµέσων: Πόσο πρέπει να περιµένει ο χρήστης για να ακούσει την απάντηση του συνοµιλητή του σε περιβάλλον τηλεδιάσκεψης; Πόσο πρέπει να περιµένει ο χρήστης για να δει µια εικόνα στην ιστοσελίδα που έχει επισκεφθεί; Πόσο πρέπει να περιµένει ο χρήστης για να δει ένα βίντεο ή ένα animation στη ιστοσελίδα που έχει επισκεφθεί; Μερικά παραδείγµατα Κείµενο Μια σελίδα κειµένου περιέχει προσεγγιστικά 4 χαρακτήρες => Γραφικά ~4, kbytes σε κωδικοποίηση ASCII ~9,6 kbytes σε κωδικοποίηση Unicode Μια εικόνα γραφικών περιέχει προσεγγιστικά 5 γραµµές => Eικόνες Για κάθε γραµµή ορίζονται οι συντεταγµένες της αρχής (2 x bits), οι συντεταγµένες του τέλους (2 x bits) και bits για τον χαρακτηρισµό των ιδιοτήτων της γραµµής => 5 x 4 bits ~= 3 kbytes Μια εικόνα 64 x 4 pixels µε 256 αποχρώσεις του γκρί => 64 x 4 x byte ~= 37 kbytes Η ίδια εικόνα σε πραγµατικό χρώµα (3 bytes per pixel) => 64 x 4 x 3 byte ~= 92 kbytes 3

Μερικά παραδείγµατα (ΙΙ) Ήχος: Τηλεφωνική ποιότητα => ~ kbyte / sec Ποιότητα CD =>,4 Mbps => ~ 76 kbyte / sec Ένα τυπικό CD-ROM της αγοράς χωράει: Βίντεο 74 λεπτά µουσικής, ποιότητας CD ή... 2 δευτερόλεπτα ασυµπίεστου ψηφιακού βίντεο Τηλεοπτική ποιότητα (π.χ. ανάλογο του PAL system) => 625 lines x 4 pixel /line x 3 bytes /pixel x 25 frames (εικόνες) /sec => 39 Mbyte / sec Τηλεόραση Υψηλής Ευκρίνειας (HDTV) (διπλάσιος αριθµός γραµµών, aspect ratio 6:9 αντί 4:3)=> 5.33 x Τηλεοπτική ποιότητα => 2 Mbyte / sec 2 GB δίσκος χωράει λιγότερο από 6 λεπτά ασυµπίεστου ψηφιακού βίντεο Ορισµός Συµπίεσης Μέσα αποθήκευσης µε µεγαλύτερη χωρητικότητα ίκτυα µετάδοσης πληροφοριών µε µεγαλύτερο bandwidth (ταχύτητα µετάδοσης) Ναι αλλά για ποιους; Μήπως συµπίεση; Μείωση του αριθµού bits ΑΛΛΑ µε συµβιβασµό (π.χ. διαθεσιµότητα, ποιότητα της πληροφορίας) Συµπίεση: Μια συνάρτηση g εφαρµόζεται σε κάθε ενότητα δεδοµένων d i ώστε να παραχθούν δεδοµένα m i g(d i ) = m i Στόχος: Ο περιορισµός του µεγέθους που καταλαµβάνει µια ποσότητα πληροφορίας 4

Ορισµός Συµπίεσης (II) Αποσυµπίεση: Μια συνάρτηση g r εφαρµόζεται στα δεδοµένα m i ώστε να παραχθούν τα δεδοµένα d r g r (m i ) = d r Trade-off: Ποσοστό Συµπίεσης vs. Παραποίηση εδοµένων Ένας αλγόριθµος συµπίεσης προκαλεί µια σειρά µετασχηµατισµών στο αρχικό σήµα οι οποίοι µπορεί να είναι: χωρίς απώλειες ή αντιστρεπτοί (lossless compression algorithms) µε απώλειες ή µη αντιστρεπτοί (lossy compression algorithms) Η µορφή συµπίεσης που επιλέγουµε εξαρτάται από το είδος της πληροφορίας Περιορισµοί Συµπίεσης Οι απαιτήσεις κατά τη συµπίεση και αποσυµπίεση κάποιας µορφής πληροφορίας διαφοροποιούνται από εφαρµογή σε εφαρµογή Εξαρτώνται άµεσα από το αν η εφαρµογή είναι διαλογικού τύπου ή τύπου ανάκλησης δεδοµένων Εφαρµογές διαλογικού τύπου Η διαδικασία συµπίεσης / αποσυµπίεσης δεν πρέπει να διαρκεί πάνω από 5 msecs (end-to-end delay) για συνηθισµένες εφαρµογές Καθυστέρηση της τάξης των 5 msecs για face-to-face εφαρµογές Για τη συνολική end-to-end καθυστέρηση πρέπει να συνυπολογιστούν καθυστερήσεις που οφείλονται στο δίκτυο, το πρωτόκολλο επικοινωνίας, τις συσκευές Ι/Ο που χρησιµοποιούνται κλπ. 5

Περιορισµοί Συµπίεσης (ΙΙ) Εφαρµογές τύπου ανάκλησης δεδοµένων (Retrieval Mode) Γρήγορη αναζήτηση και ανάκτηση πληροφοριών (forward and backward) και ταυτόχρονη προβολή τους Τυχαία προσπέλαση σε οποιοδήποτε πλαίσιο εικόνας ή ήχου, µε χρόνο προσπέλασης µικρότερο από,5 sec υνατότητα αποσυµπίεσης σε τυχαία µεµονωµένα πλαίσια (έτσι ώστε να επιτρέπεται η επεξεργασία τους) Η συµπίεση είναι εφικτή επειδή υπάρχει πλεονασµός δεδοµένων όσον αφορά την αναπαράσταση της πληροφορίας. Στις εικόνες πλεονασµός αυτός µπορεί να προέρχεται από: Πλεονασµό κωδικοποίησης: Αναπαράσταση των τιµών φωτεινότητας ή χρώµατος των pixel µε κώδικες οι οποίοι απαιτούν µεγαλύτερο αριθµό bits από όσο χρειάζεται Πλεονασµό pixel Υπάρχει συσχέτιση µεταξύ των των τιµών των pixels (ή των αναπαραστάσεων τους). H τιµή φωτεινότητας ή χρώµατος γειτονικών pixel συνήθως είναι παρόµοια ή έχει κάποια σχέση. Οι οµοιόµορφες περιοχές έχουν πολύ παρόµοια επίπεδα φωτεινότητας Για παράδειγµα οι τιµές φωτεινότητες των pixel κατά µήκος των ακµών έχουν παρόµοιες σχέσεις. Εικόνες υφής (texture - pattern) έχουν πλεονασµό εκ φύσεως λόγο της περιοδικής συµµετρίας, κλπ. Ψυχο-οπτικό πλεονασµό: Πλεονασµός δεδοµένων Λαµβάνεται υπόψη η οπτική ικανότητα των ανθρώπων 6

Μετρήσεις Συµπίεσης Bits για κάθε pixel (ΒPΡ Bits Per Pixel) είναι ο µέσος αριθµός των bits που χρειάζονται την αποθήκευση των επιπέδων φωτεινότητας για κάθε pixel της εικόνας Σε µια µη-συµπιεσµένη εικόνα BPP = log 2 (K) = B: όπου K = ο αριθµός των επιτρεπόµενων επιπέδων φωτεινότητας (π.χ 256 από [ 255]. Συνήθως B = log 2 (256) =. Ο αριθµός των bits που χρησιµοποιούνται για την κωδικοποίηση των pixel µπορεί να διαφέρει κατά µήκος της κωδικοποιηµένης εικόνας (Variable Length Coding VLC). Ας ορίσουµε το B(x, y) = ο αριθµός των bits που χρησιµοποιούνται για την κωδικοποίηση του pixel f(x,y). Τότε: BPP = MxN M N x= y= B( x, y) όπου Μ,Ν οι γραµµές και οι στήλες της εικόνας f αντίστοιχα Μετρήσεις Συµπίεσης (II) O ολικός αριθµός B total των bits που χρησιµοποιείται για την αναπαράσταση της εικόνας f δεν απαρτίζεται µόνο από την περιγραφή των τιµών των pixel αλλά και από την επικεφαλίδα της εικόνας. Στην επικεφαλίδα (header) περιλαµβάνονται στοιχεία όπως: Οι διαστάσεις της εικόνας Η µορφή συµπίεσης της εικόνας Πληροφορία για την αναπαράσταση της εικόνας (έγχρωµη, παλέτας, αποχρώσεων του γκρι) Εποµένως τελικά ο µέσος αριθµός BPP δίνεται από τη σχέση: BPP = MxN B total Ο λόγος συµπίεσης CR (Compression Ratio) δίνεται από τη σχέση (Β είναι αριθµός bits per pixel της ασυµπίεστης εικόνας): B CR = BPP 7

Ποιότητα συµπίεσης Η αξιολόγηση της ποιότητας µιας συµπιεσµένης εικόνας γίνεται µε τη βοήθεια µιας οµάδας εµπειρογνωµόνων σε θέµατα εικόνας. Πρόκειται προφανώς για υποκειµενική αξιολόγηση Η βαθµολόγηση της ποιότητας γίνεται µε βάση την ταξινόµηση του επόµενου πίνακα. Πλεονασµός Κωδικοποίησης Η αναπαράσταση των τιµών φωτεινότητας ή χρώµατος µιας ασυµπίεστης εικόνα γίνεται µε συγκεκριµένο και προκαθορισµένο αριθµό bits per pixel Β Συνήθως έχουµε Β= για µαυρόασπρες εικόνες (binary images), Β= για εικόνες αποχρώσεων του γκρι ή παλέτας χρωµάτων (indexed) και Β=24 για εικόνες πλήρους χρώµατος (full color RGB). Τι γίνεται αν έχουµε περιορισµένο πλήθος διαφορετικών τιµών φωτεινότητας ή αν ορισµένες τιµές φωτεινότητας είναι πολύ περισσότερο συχνές από άλλες;

Πλεονασµός Κωδικοποίησης Έστω µια εικόνα µε οκτώ () διαφορετικές τιµές φωτεινότητας r k (k=..7) όπως φαίνεται στον επόµενο πίνακα. Για την κωδικοποίηση των τιµών αυτών µε σταθερό µήκος λέξης χρειαζόµαστε B bits per pixel όπου Β τ.ω.: 2 Β. Προφανώς στη συγκεκριµένη περίπτωση Β=3. Η πιθανότητα εµφάνισης p r (r k ) των τιµών φωτεινότητας δίνεται επίσης στον επόµενο πίνακα (Πως υπολογίζεται αυτή η πιθανότητα;) Είναι φανερό ότι αν κωδικοποιήσουµε τις τιµές φωτεινότητας µε µεγαλύτερη πιθανότητα εµφάνισης µε λιγότερα bits θα επιτύχουµε αναπαράσταση της εικόνας µε BPP<B. Άρα υπάρχει κάποιος κώδικας αναπαράστασης της εικόνας που κωδικοποιεί την εικόνα περισσότερο αποτελεσµατικά. Πόσο είναι τo BPP στην συγκεκριµένη περίπτωση; Πλεονασµός pixel Οι τιµές φωτεινότητας ή χρώµατος γειτονικών pixel σπάνια διαφέρουν σηµαντικά. Ακόµα και αν οι συχνότητες εµφάνισης τιµών φωτεινότητας δεν παρουσιάζουν σηµαντική διακύµανση (ώστε να υπάρχει πλεονασµός κωδικοποίησης) οι διαφορές ανάµεσα σε γειτονικά pixel θα έχουν παρόµοιες τιµές Εποµένως αντί να κωδικοποιούµε τις ίδιες τις τιµές φωτεινότητας κωδικοποιούµε απλά τις διαφορές ανάµεσα σε γειτονικά pixel Οι διαφορές έχουν µικρότερο εύρος τιµών άρα µπορούν να κωδικοποιηθούν µε λιγότερα bits. 9

Ψυχοοπτικός πλεονασµός (Psychvisual redundancy) Υπάρχει πληροφορία στη εικόνα η οποία δεν µπορεί να γίνει αντιληπτή από το ανθρώπινο οπτικό σύστηµα. Για παράδειγµα απότοµες αλλαγές φωτεινότητας δεν γίνονται εύκολα αντιληπτές Για να γίνει αντιληπτή µια µεταβολή φωτεινότητας η µεταβολή αυτή πρέπει να είναι αρκετά µεγάλη σε σχέση µε την τιµή φωτεινότητας πριν τη µεταβολή Το ανθρώπινο οπτικό σύστηµα ενώ µπορεί να διαχωρίσει περισσότερα χρώµατα από τιµές φωτεινότητας είναι περισσότερο ευαίσθητο στην ύπαρξη σωστού φωτισµού Η αξιοποίηση του ψυχοοπτικού πλεονασµού δεν είναι πάντα προφανής. Το πρότυπο JPEG χρωστά ένα µέρος από την αποτελεσµατικότητα του, όσον αφορά την συµπίεση, στην αξιοποίηση του ψυχοοπτικού πλεονασµού χρησιµοποιώντας πιο ευρείες στάθµες κβαντισµού για τις υψηλές συχνότητες της εικόνας Κατηγορίες Τεχνικών Συµπίεσης Ανάλογα µε τη σχέση που έχει η αρχική εικόνα µε το αποτέλεσµα της αποσυµπίεσης υπάρχουν δύο κατηγορίες µεθόδων συµπίεσης: Τεχνικές χωρίς απώλειες (lossless compression schemes): εν µεταβάλλουν τα χαρακτηριστικά της εικόνας κατά τη διάρκεια της συµπίεσης => η εικόνα που προκύπτει κατά την αποσυµπίεση είναι ακριβές αντίγραφο της αρχικής. Τεχνικές αυτής της µορφής χρησιµοποιούνται για τη συµπίεση εικόνων οι οποίες δε θα πρέπει να αλλοιωθούν κατά τη διαδικασία της συµπίεσης / αποσυµπίεσης (π.χ. ιατρικά εικόνες όπως υπερηχογραφήµατα). Τεχνικές µε απώλειες (lossy compression schemes): Αλλοιώνουν τα χαρακτηριστικά της εικόνας κατά τη διαδικασία της συµπίεσης. Τεχνικές αυτής της µορφής χρησιµοποιούνται για τη συµπίεση εικόνων στις περισσότερες εφαρµογές (όπως µετάδοση τηλεοπτικών προγραµµάτων, µεταφορά µέσω του ιαδικτύου κλπ). Οι αλλοιώσεις εισάγονται επιλεκτικά στην εικόνα ώστε να µην γίνονται εύκολα αντιληπτές.

Ανάλογα µε τη µέθοδο που ακολουθείται για τη συµπίεση εικόνων: Κατηγορίες Τεχνικών Συµπίεσης (ΙΙ) Τεχνικές κωδικοποίησης εντροπίας (entropy encoding): Είναι τεχνικές χωρίς απώλειες οι οποίες δε λαµβάνουν υπόψη τους τη φύση των εικόνων στις οποίες εφαρµόζονται. Οι συγκεκριµένες µέθοδοι θεωρούν ότι η εικόνα που συµπιέζεται είναι απλά µία σειρά από δυαδικά ψηφία. Εκµετάλλευση του πλεονασµού κωδικοποίησης Τεχνικές κωδικοποίησης πηγής (source encoding): Λαµβάνουν υπόψη τους τη φύση της εικόνας που συµπιέζεται. Εκµετάλλευση του πλεονασµού pixel. Πετυχαίνουν µεγαλύτερους βαθµούς συµπίεσης από τις κωδικοποιήσεις εντροπίας αν και ο βαθµός συµπίεσης είναι µεταβλητός και εξαρτάται από τη µορφή της συγκεκριµένης εικόνας. Μπορεί να είναι τεχνικές µε ή χωρίς απώλειες Υβριδικές τεχνικές (hybrid encoding): Αν και µερικές τεχνικές ανήκουν σε κάποια από τις παραπάνω δύο κατηγορίες, οι περισσότερες είναι υβριδικές (οι σχετικοί αλγόριθµοι χρησιµοποιούν ένα µίγµα τεχνικών εντροπίας και πηγής) ιακρίνονται σε: Τεχνικές Μήκους ιαδροµής (Run Length Encoding) RLC (Run Length Coding) Zero Suppression Τεχνικές Κωδικοποίησης Εντροπίας Στατιστικές: Huffman Αριθµητική Αντικατάσταση προτύπων packbits encoding (π.χ. LZW, LUT)

ιακρίνονται σε: Προβλεπτικές DPCM (Difference Pulse Code Modulation) DM (Difference Modulation) Μετασχηµατισµού FFT (Fast Fourier Transform) DCT (Discrete Cosine Transform) Στρωµατοποίησης (Layered) Subband Coding ιανυσµατικές Ταύτισης µε προκαθορισµένα πρότυπα Quadtree Fractals Τεχνικές Κωδικοποίησης Πηγής Αποτελούν συνδυασµό µεθόδων από τις άλλες κατηγορίες Έχουν υλοποιηθεί από πολύ επιτυχηµένα πρότυπα κωδικοποίησης (coding standards) JPEG (Joint Photographic Experts Group) Συνδυάζει κωδικοποίηση µετασχηµατισµού (DCT) και µήκους διαδροµής (RLC) H263 (συµπίεση βίντεο): Υβριδικές Τεχνικές Συνδυάζει κωδικοποίηση µετασχηµατισµού (DCT), προβλεπτική (αντιστάθµιση κίνησης MC: motion compensation) και µήκους διαδροµής (RLC) MPEG (Moving Pictures Expert Group) - (συµπίεση βίντεο, ήχου): Συνδυάζει κωδικοποίηση µετασχηµατισµού (DCT), προβλεπτική (αντιστάθµιση κίνησης MC: motion compensation), µήκους διαδροµής (RLC) και στρωµατοποίησης (Subband Coding) για την συµπίεση του ήχου (MP3). 2

Μοντέλο Συµπίεσης Εικόνων Το βασικό µοντέλο συµπίεσης εικόνων περιγράφεται από το επόµενο σχήµα. Περιλαµβάνει τρία βασικά στάδια: Ταύτιση (Mapping) Έχουµε κάποιας µορφής µετασχηµατισµό στις τιµές φωτεινότητας της εικόνας (π.χ. Μετασχηµατισµό στο χώρο της συχνότητας, εύρεση διαφορών ανάµεσα γειτονικά pixel κλπ) Κβάντισµός (Quantization) Περιορισµός των διακριτών τιµών της µετασχηµατισµένης εικόνες οι οποίες θα αναπαρασταθούν Κωδικοποίηση (Encoder) Αναπαράσταση µε δυαδική συµβολοσειρά κάθε κβαντισµένης στάθµης (σύµβολο) Συµπίεση χωρίς Απώλειες Οι τεχνικές συµπίεσης χωρίς απώλειες επιτυγχάνουν συµπίεση της εικόνας έτσι ώστε η αρχική εικόνα να µπορεί να ανασκευαστεί ακριβώς από τη συµπιεσµένη εικόνα. Συνήθως στη συµπίεση χωρίς απώλειες δεν επιτυγχάνεται µεγάλος βαθµός συµπίεσης Ο λόγος συµπίεσης που επιτυγχάνεται κυµαίνεται συνήθως στο διάστηµα 2: CR 3: αν και γενικά αλλάζει από εικόνα σε εικόνα Εφαρµογές: Αποθήκευση ιατρικών εικόνών Αποθήκευση σκανναρισµένων εγγράφων ή φωτογραφηµένων έργων τέχνης. Βασικές Αρχές Χρησιµοποίηση µεταβλητού µήκους λέξης variable length encoding (κώδικα) για κωδικοποίηση των επιπέδων φωτεινότητας. Χρήση µικρού µήκους λέξης για φωτεινότητες οι οποίες εµφανίζονται συχνά. 3

Τεχνικές Κωδικοποίησης Εντροπίας Τι είναι εντροπία (entropy) εικόνας Ο (θεωρητικά) ελάχιστος αριθµός από bits ανά pixel (τιµή φωτεινότητας ή χρώµατος) που χρειάζεται για την κωδικοποίηση µιας εικόνας. Πως υπολογίζεται η εντροπία µιας εικόνας; Με βάση την εξίσωση Shannon: E = K k= P k log 2 P k όπου K o αριθµός των διακεκριµένων (διαφορετικών) τιµών φωτεινότητας που υπάρχουν στη εικόνα και P k η πιθανότητα εµφάνισης της τιµής φωτεινότητας k. Πως υπολογίζονται οι πιθανότητες P k ; Από το κανονικοποιηµένο ιστόγραµµα της εικόνας P k =H I (k) = n/(μxn), για κάθε k =,... K-, αν το επίπεδο φωτεινότητας k εµφανίζεται (ακριβώς) n φορές στην εικόνα I, (διάστασης ΜxN pixels) K τα διαφορετικά επίπεδα φωτεινότητας. Τεχνικές Κωδικοποίησης Εντροπίας (II) Επειδή η εντροπία υποδεικνύει τη βέλτιστη συµπίεση (χωρίς απώλειες), που µπορεί να επιτευχθεί, η αποδοτικότητα κωδικοποίησης µιας µεθόδου συχνά συγκρίνεται µε την εντροπία. Η αποδοτικότητα κωδικοποίησης υπολογίζεται µε βάση τον µέσο αριθµό bits ανά pixel (BPP). H συνηθισµένη µέτρηση του BPP για τεχνικές χωρίς απώλειες (µε µεταβλητό µήκος λέξης) δίνεται από τη σχέση: K = BPP N k= k H ( k) I όπου Κ o αριθµός των διακεκριµένων τιµών φωτεινότητας ή χρώµατος στη εικόνα, Η I (k) η πιθανότητα εµφάνισης της τιµής k και Ν k τα bits που χρησιµοποιούνται για την κωδικοποίηση της τιµής φωτεινότητας k. 4

Ιδιότητες Εντροπίας Η εντροπία είναι απλά µια µέτρηση η οποία µας παρέχει πληροφορίες για τη στρατηγική κωδικοποίησης της εικόνας. Η εντροπία µιας εικόνας Ι είναι µια µέτρηση της πολυπλοκότητας του µεγέθους της πληροφορίας που περιλαµβάνει. Μπορεί να αποδειχτεί ότι η εντροπία έχει µέγιστη τιµή όταν Pk = H I ( k) = K το οποίο αντιπροσωπεύει ένα επίπεδο ιστόγραµµα. Σε αυτή την περίπτωση και µε δεδοµένο ότι K = 2 B K E{ I} = k= log2 { } K K = B Η εντροπία της εικόνας I αυξάνεται όταν το ιστόγραµµα της εικόνας ανοίγει. Πότε η εντροπίας µιας εικόνας I έχει ελάχιστη τιµή; Όταν υπάρχει µια και µόνη τιµή φωτεινότητας (οµοιόµορφη ή σταθερή εικόνα) Ιδιότητες Εντροπίας (ΙΙ) Ισχύει: Ε{Ι} Β Ένα σηµαντικό θεώρηµα της θεωρίας κωδικοποίησης περιορίζει το πόσο καλά µπορούµε να κωδικοποιήσουµε µια εικόνα χωρίς απώλειες µε τη χρήση µεταβλητού µήκους λέξης: BPP Ε{Ι} Αυτός είναι ο καλύτερος λόγος για την χρησιµοποίηση της εντροπίας σαν µέτρο κωδικοποίησης. Μας λέει π.χ. ότι για µια εικόνα µε τέλειο επίπεδο ιστόγραµµα E{Ι} = B δεν µπορεί να συµπιεστεί χρησιµοποιώντας ένα κώδικα µεταβλητών µήκων λέξεων. Ευτυχώς, συχνά µπορούµε να διορθώσουµε αυτή την κατάσταση (Πως;) Μείωση της εντροπίας της εικόνας µπορεί να επιτευχθεί µε µετασχηµατισµό των τιµών φωτεινότητας (αλλαγή συµβόλων) όπως π.χ. µε χρήση των διαφορών ανάµεσα σε pixels Ο κώδικας µεταβλητού µήκους λέξης θεωρεί ότι οι πιθανότητες P k είναι γνωστές και έχουν διαβιβαστεί και στον παραλήπτη Με τη λέξη κώδικας, εννοούµε µοναδικά αποκωδικοποιηµένο κώδικα 5

Παράδειγµα Μια εικόνα έχει µόνα 5 διαφορετικές τιµές φωτεινότητας τις Α = 32, Β = 6, C =45, D =9, E = 225 των οποίων οι πιθανότητες εµφάνισης έχουν εκτιµηθεί ως P(A)=.4, P(B)=., P(C)=.6, P(D)=.6, P(E)=.2. Να υπολογιστεί η εντροπία της εικόνας Να υπολογιστεί η αποδοτικότητα του βέλτιστου αλγορίθµου κωδικοποίησης του παραπάνω µηνύµατος αν χρησιµοποιείται σταθερού µεγέθους µήκος λέξης. Κωδικοποίηση Huffman Η τεχνική βασίζεται στη πιθανότητα εµφάνισης συµβόλων (για τη περίπτωση της εικόνας οι τιµές φωτεινότητας) Κατασκευή δυαδικού δέντρου, αρχίζοντας από τους σύµβολα µε τη µικρότερη πιθανότητα εµφάνισης Η τεχνική µπορεί να χρησιµοποιηθεί και για κωδικοποίηση οµάδων συµβόλων, όπου η έννοια του «συµβόλου» αντικαθίσταται από εκείνη της «οµάδας συµβόλων» 6

Κωδικοποίηση Huffman (ΙΙ) Αλγόριθµος Huffman: Από ένα δυαδικό δέντρο µε κλαδιά που έχουν επιγραφή το επίπεδο φωτεινότητας k i και τις πιθανότητες P ki () Μας περιορίζει από την µελέτη κάθε k i όπου P ki = () Βρίσκει τις 2 µικρότερες πιθανότητες p i = P ki και p j = P kj (2) Αντικαθιστά µε p ij = p i + p j (βάση σηµάδι, µειώνει την λίστα κατά ένα) (3) ίνει τιµές στα κλαδιά: για το k i '' και για το k j '' 4) Μέχρι έως ότου η λίστα να έχει µόνο στοιχείο (ρίζα) επιστρέφουµε στο () Παράδειγµα Κωδικοποίησης Huffman (Ι) P(ADCEB)=. σύµβολο A B C D E Πιθανότητα εµφάνισης P P(A)=.6 P(B)=.5 P(C)=.9 P(D)=.3 P(E)=. απεικόνιση P(ADCE)=.49 P(B)=.5 P(CE)=.2 P(AD)=.29 P(C)=.9 P(E)=. P(D)=.3 P(A)=.6 7

Παράδειγµα Κωδικοποίησης Huffman (ΙΙ) Έστω η εικόνα Ι µε K = τιµές {,.., 7} που θα πρέπει να κωδικοποιηθούν. Οι αντίστοιχες πιθανότητες είναι: p() = /2 p (4) = /6 p() = / p (5) = /32 p(2) = / p (6) = /32 p (3) = / p (7) = Να υπολογιστεί η εντροπία της εικόνας Να βρεθούν οι κωδικές λέξεις Huffman Να βρεθεί ο µέσος αριθµός bit ανά pixel BPP Να υπολογιστεί ο βαθµός συµπίεσης Αποκωδικοποίηση δυαδικής συµβολοσειράς Huffman Ο κώδικας Huffman έχει µόνο ένα τρόπο αποκωδικοποίησης. Υπάρχει µόνο µια ερµηνεία για µια σειρά από bits Η αποκωδικοποίηση προχωρεί µε τη σάρωση του δέντρου. Έστω στην περίπτωση του παραδείγµατος ότι λαµβάνεται από το δέκτη η επόµενη σειρά από bits: Η παραπάνω σειρά αποκωδικοποιείται µοναδικά στα σύµβολα: CBADBBBCECDEAABD Πιθανότητα σύµβολο απεικόνιση εµφάνισης P A B C D E P(A)=.6 P(B)=.5 P(C)=.9 P(D)=.3 P(E)=.

Παρατηρήσεις σχετικά µε τον κώδικα Huffman Ο λόγος συµπίεσης που επιτυγχάνεται µε τον κώδικα Huffman είναι συνήθως γύρω στο 2: CR 3: Ο κώδικας Huffman µπορεί να προσβληθεί από θόρυβο στην µετάδοση (πολύ περισσότερο από την µετάδοση της αρχικής εικόνας) Σκεφτείτε τι µπορεί να συµβεί αν αλλάξει µια και µόνο τιµή σε ένα bit στο προηγούµενο παράδειγµα: Ποια συµβολοσειρά θα αποκωδικοποιηθεί; Υπάρχουν κώδικες διόρθωσης λαθών οι οποίοι είναι πολύ λιγότερο ευαίσθητοι στο θόρυβο. Μεγαλώνουν κάπως το συντελεστή κωδικοποίησης. Σε πολλές περιπτώσεις σχήµατα συµπίεσης µε απώλειες µπορούν να συνδυαστούν µε τον κώδικα Huffman, κωδικοποιώντας τις λέξεις κώδικα µε απώλειες, µε τον κώδικα Huffman. Ο τελικός λόγος συµπίεσης προκύπτει από το γινόµενο της συµπίεσης µε απώλειες επί το λόγο της συµπίεσης Huffman. Άσκηση Να βρεθούν οι κωδικές λέξεις Huffman για την αναπαράσταση µηνυµάτων που απαρτίζονται από τα σύµβολα A,B,C,D,E και των οποίων οι πιθανότητες εµφάνισης στα µηνύµατα είναι όπως υποδεικνύεται στο διπλανό πίνακα Να υπολογισθεί το µέσο µήκος λέξης της κωδικοποίησης και να συγκριθεί µε την αντίστοιχη εντροπία των µηνυµάτων σύµβολο A Β C D E Πιθανότητα εµφάνισης P.4..6.6.2 9

Αριθµητική Κωδικοποίηση Η αριθµητική κωδικοποίηση είναι µια εναλλακτική, της µεθόδου Ηuffman, µέθοδος κωδικοποίησης εντροπίας. Βασίζεται στη λογική της κωδικοποίησης µιας σειράς από σύµβολα και όχι µεµονωµένων συµβόλων Για παράδειγµα σε µια ακολουθία συµβόλων a a 2..an τα a i δεν κωδικοποιούνται ξεχωριστά όπως στην περίπτωση της κωδικοποίησης Huffman αλλά ως µια οµάδα συµβόλων Όσο περισσότερα σύµβολα οµαδοποιήσουµε τόσο αποτελεσµατικότερη κωδικοποίηση έχουµε αλλά τόσο πολυπλοκότερη γίνεται η υλοποίηση του κωδικοποιητή Αριθµητική Κωδικοποίηση (ΙΙ) Για την παρακάτω εικόνα f έχουµε πιθανότητες εµφάνισης των τιµών των pixel ([ 2 3 4 5 6 7]) όπως παρακάτω: [.2.25.9375.75.9375.563 ]. Εντροπία ης τάξης της εικόνας: Η=2.492 bit/pixel Με κωδικοποίηση Huffman επιτυγχάνεται έχουµε τις εξής κωδικές λέξεις: =>, =>, 2 =>, 3 =>, 4 =>, 5 => BPP = 2.533 bit/pixel Έστω ότι κωδικοποιούµε την ίδια εικόνα µε αριθµητική κωδικοποίηση ανά δύο Histogram of Image f pixel (4,), (3,5),, (,5):.25.2 4 f = 2 5 5 3 4 4 3 5 2 5 3 2 3 5 3 5 Probability of Occurence.5..5 2 3 4 5 6 7 Value of Pixel 2

Αριθµητική Κωδικοποίηση (IΙΙ) Αρχικά διαιρείται το διάστηµα [,] ανάλογα µε τις πιθανότητες των συµβόλων: [.2.46.5625.75.43 ]. Υπάρχουν διαστήµατα στον παραπάνω διαχωρισµό Στο σύµβολο 4 αντιστοιχεί το διάστηµα [.75.43] Για τη κωδικοποίηση του συµβόλου 4 αρκεί να πάρουµε το δεκαδικό µέρος ενός δυαδικού αριθµού που να αντιστεοιχεί στο παραπάνω διάστηµα, π.χ.. =>.25, άρα η συµβολοσειρά είναι µια ορθή κωδικοποίηση του συµβόλου 4. Για την κωδικοποίηση της σειράς συµβόλων 4, το διάστηµα [.75.43] διαιρείται ξανά σε οκτώ διαστήµατα: [.75.43] =>[.75.775.794.2.24.29.43.43.43] Το σύµβολο αντιστοιχεί στο δεύτερο από τα διαστήµατα, άρα συνολικά για την κωδκοποίηση της σειράς συµβόλων 4 χρειαζόµαστε ένα δυαδικό δεκαδικό αριθµό στο διάστηµα [.775.794]. =>.73, άρα το είναι µια ορθή κωδικοποίηση για τη σειρά συµβόλων 4 Αριθµητική Κωδικοποίηση (ΙV) Εφαρµόζοντας την προηγούµενη διαδικασία για όλες τις δυάδες pixel της εικόνας f επιτυγχάνουµε κωδικοποίηση της µε: BPP =.25 bit/pixel. Η πιο πάνω τιµή είναι µικρότερη από την εντροπία ης τάξης της εικόνας (Η=2.492 bit/pixel). Πως εξηγείται αυτό; Η εντροπία ης τάξης της εικόνας µας δίνει τον ελάχιστο αριθµό bits/pixel που χρειάζονται για την κωδικοποίηση της εικόνας χωρίς οµαδοποίηση pixel.25 Histogram of Image f f 4 = 2 5 5 3 4 4 3 5 2 5 3 2 3 5 3 5 Probability of Occurence.2.5..5 2 3 4 5 6 7 Value of Pixel 2

Κωδικοποίηση Μήκους ιαδροµής Οι τεχνικές κωδικοποίησης εντροπίας (Huffman, Αριθµητική και οι παραλλαγές τους) προσπαθούν να µειώσουν τον πλεονασµό κωδικοποίησης: Η συµπίεση µε εκµετάλλευση του πλεονασµού κωδικοποίησης είναι σχετικά µικρή (συνήθως <2) εν υπάρχει εκµετάλλευση των ιδιαιτεροτήτων που παρουσιάζουν οι εικόνες (π.χ. Μεγάλες οµοιόµορφες περιοχές) Οι τεχνικές κωδικοποίησης µήκους διαδροµής εκµεταλλεύονται το γεγονός ότι σπάνια η τιµή ενός pixel είναι ανεξάρτητη από τις προηγούµενες της (πλεονασµός pixel) Σε εικόνες µαύρου-άσπρου (binary images) η εξάρτηση της τιµής ενός pixel από προηγούµενες τιµές σηµαίνει πρακτικά ότι έχουµε µεγάλες ακολουθίες από διαδοχικά η διαδοχικά. Αντί να κωδικοποιούµε τις ίδιες τις τιµές των pixels µπορούµε να κωδικοποιήσουµε το µήκος των ακολουθιών Κωδικοποίηση Μήκους ιαδροµής (II) 22

Κωδικοποίηση Μήκους ιαδροµής (ΙΙΙ) Ο αλγόριθµος έχεις ως εξής: Υποθέτουµε ότι κάθε εικόνα αρχίζει µε λευκό pixel Το πρώτο σύµβολο είναι το µήκος των διαδοχικών λευκών pixels Το δεύτερο σύµβολο είναι το µήκος των διαδοχικών µαύρων pixels που ακολουθούν Το τρίτο σύµβολο είναι το µήκος των διαδοχικών λευκών pixels που ακολουθούν,... Έως ότου φτάσουµε στο τέλος της γραµµής. Η διαδικασία επαναλαµβάνεται για τις επόµενες γραµµές Έστω η γραµµή της εικόνας µε τα εξής στοιχεία: [ ] Τα σύµβολα που προκύπτουν είναι: 9 5 Κωδικοποίηση Μήκους ιαδροµής (ΙV) Αν κωδικοποιήσουµε κάθε µήκος διαδροµής µε byte τότε η προηγούµενη γραµµή θα κωδικοποιηθεί 5 bytes: Για την αρχική εικόνα (γραµµή) έχουµε 72 pixels bit/pixel => 9 bytes για τη κωδικοποίηση της ασυµπίεστης εικόνας Συµπίεση: CR = 9 / 5 =. Στη πράξη τα µήκη διαδροµής παρουσιάζουν σηµαντικό πλεονασµό κωδικοποίησης: Θεωρούµε τα µήκη διαδροµής ως σύµβολα Εφαρµόζουµε κωδικοποίηση εντροπίας (π.χ. Huffman) στα µήκη διαδροµής Με συνδυασµό της κωδικοποίησης µήκους διαδροµής και Huffman επιτυγχάνεται συµπίεση 2 CR 3 Συνδυασµός της κωδικοποίησης µήκους διαδροµής και Huffman εφαρµόζεται στην αποστολή εγγράφων µε FAX. 23

Κωδικοποίηση Μήκους ιαδροµής (V) Μπορεί να εφαρµοστεί κωδικοποίηση µήκους διαδροµής σε εικόνες αποχρώσεων του γκρι (ή στους πίνακες των χρωµατικών καναλιών RGB σε εικόνες πλήρους χρώµατος); Εφαρµόζεται σε δύο δυνατές παραλλαγές: Άµεση επέκταση µε χρήση µπαλαντέρ (flag): Έστω η γραµµή της εικόνας µε τα εξής στοιχεία: [255 255 255 255 23 23 22 22 22 22 22 77 76] Κωδικοποίηση: 255!4 23 23 22!5 77 66 Αποτελεσµατική τεχνική όταν µια τιµή pixel επαναλαµβάνεται τουλάχιστον τέσσερις φορές Εφαρµογή της δυαδικής κωδικοποίησης µήκους διαδροµής σε κάθε επίπεδο bit των τιµών των pixels: Για µια εικόνα εικόνα αποχρώσεων του γκρι µε τιµές στο διάστηµα [ 255] κάθε pixel περιγράφεται από bits Σχηµατίζουµε εικόνες (bit planes) κρατώντας τα συγκεκριµένα bits από κάθε pixel Κωδικοποίηση Μήκους ιαδροµής Bit Planes 24

Αντικατάσταση Προτύπων (packbits encoding) Βασική ιδέα: Αναζήτηση των πιο συχνά χρησιµοποιούµενων ακολουθιών τιµών pixel και αντικατάστασή τους από ειδικές κωδικές λέξεις (codewords) Ανάλυση Η τεχνική αυτή (pattern substitution ή packbits encoding) είναι παραλλαγή της τεχνικής «κωδικοποίηση µήκους διαδροµής» Προέρχεται από τις τεχνικές κειµένου: Στην αγγλική, τα πιο συχνά χρησιµοποιούµενα ζεύγη χαρακτήρων είναι τα παρακάτω (προσοχή στους χαρακτήρες κενού): E, T, TH, A, S, RE, IN, HE Οι ειδικοί χαρακτήρες που αντικαθιστούν τα παραπάνω ζευγάρια δεν πρέπει να εµφανίζονται πουθενά αλλού στο κείµενο Ο ευρέως διαδεδοµένος αλγόριθµος συµπίεσης LZW (Lempel, Ziv & Welch) βασίζεται στη λογική αντικατάστασης προτύπων. Ο αλγόριθµος LZW εφαρµόζεται σε πολλά format εικόνων όπως TIFF, GIF, BMP Αντικατάσταση Προτύπων (ΙΙ) Έστω η αρχική ακολουθία αριθµών (π.χ. τιµών δειγµάτων): 23 45 2 4 9 9 243 245 59 26 45 2 4 243 245... Με βάση την αντικατάσταση προτύπων η ακολουθία που θα προκύψει από τη συµπίεση θα είναι: 23 256 9 9 257 59 26 256 257... Είχαµε δηλαδή τις αντικαταστάσεις: 45 2 4 => 256 243 245 => 257 25

Αλγόριθµος LZW Ο αλγόριθµος LZW για εικόνες δηµιουργεί νέους κώδικες (τιµές µεγαλύτερες από 255 για εικόνες µε τιµές pixel στο διάστηµα [ 255]) για σειρές από pixel µε επαναλαµβανόµενες τιµές Οι νέες κώδικες λέξεις δεν είναι ίδιες για όλες τις εικόνες Ο αποκωδικοποιητης πρέπει να είναι σε θέση να αντιλαµβάνεται τις τιµές για τους νέους κώδικές εφαρµόζοντας την ίδια διαδικασία µε τον κωδικοποιητή Προβλεπτική Κωδικοποίηση Ο πλεονασµός pixel έχεις ως συνέπεια οι διαφορές ανάµεσα σε γειτονικά pixel να έχουν µικρές τιµές: Από τη σύγκριση του ιστογράµµατος των διαφορών των pixel σε σχέση µε το ιστόγραµµα της αρχικής εικόνας αντιλαµβανόµαστε ότι η κωδικοποίηση εντροπίας θα ήταν πιο αποτελεσµατική αν εφαρµοζόταν στις διαφορές ανάµεσα στα pixel παρά στις ίδιες τις τιµές των pixel Histogram of Cameraman Image Histogram of pixel differences of the Cameraman Image 6 9 4 7 Probability of Occurence 2 6 Probability of Occurence 6 5 4 3 4 2 2 5 5 2 25 Value of Pixel - - -6-4 -2 2 4 6 Value of Pixel difference 26

Προβλεπτική Κωδικοποίηση (II) Η προβλεπτική κωδικοποίηση βασίζεται στην προηγούµενη παρατήρηση: Αντί να κωδικοποιούµε την ίδια την πληροφορία (τιµές pixel) κωδικοποιούµε τη νέα πληροφορία (ότι δεν µπορούµε να προβλέψουµε από τις τιµές των προηγούµενων pixel) Έστω ότι θέλουµε να κωδικοποιήσουµε την τιµή (x,y) του pixel (x,y). Μια πρόβλεψη για αυτή την τιµή µπορεί να γίνει µε τους παρακάτω τρόπους: f ( x, y ) f ( x, y ) + f ( x, f ) f ) ( x, y) =.75 ( f ( x, y ) + f ( x, y) ) ( x, y) = 2 2 f ) ( x, y) = f ( x, y ) y ) Έστω η εικόνα f = Πρόβλεψη: Προβλεπτική Κωδικοποίηση (ΙΙΙ) 9 9 9 9 9 9 9 9 9 9 9 3 f ) ( x, y) = f ( x, y ) f ) = 9 9 9 9 9 9 9 9 9 9 Νέα πληροφορία (διαφορά πραγµατικής τιµής από πρόβλεψη) η πρώτη στήλη είναι όπως στην αρχική εικόνα γιατί δεν υπάρχει εκτίµηση: ) d( x, y) = f ( x, y) f ( x, y) = d 2 3 27

Προβλεπτική Κωδικοποίηση (ΙV) Μετά το σχηµατισµό της διαφοράς της πρόβλεψης από τις πραγµατικές τιµές των pixel οι διαφορές κωδικοποιούνται µε κωδικοποίηση εντροπίας Παρουσιάζουν πιο ανοµοιόµορφο ιστόγραµµα => αποδοτικότερη κωδικοποίηση εντροπίας Παρατηρήστε τη συγκέντρωση τιµών (της εικόνας διαφορών) στο µηδέν Σύνοψη Το υλικό που παρουσιάστηκε σε αυτή την ενότητα αποτελεί µια εισαγωγή στις βασικές τεχνικές συµπίεσης χωρίς απώλειες. Οι περισσότερες από τις τεχνικές συµπίεσης χωρίς απώλειες εφαρµόζονται σε πολλές µορφές δεδοµένων (κείµενο, ήχος, εικόνα) γιατί δεν κάνουν κάποια υπόθεση για τη µορφή της πηγής που δηµιούργησε τα δεδοµένα Οι βασικές τεχνικές συµπίεσης χωρίς απώλειες που εφαρµόζονται στις ψηφιακές εικόνες είναι: Η κωδικοποίηση Huffman Η αριθµητική κωδικοποίηση Η κωδικοποίηση µήκους διαδροµής Η αντικατάσταση προτύπων Η προβλεπτική κωδικοποίηση Στη πράξη σχεδόν ποτέ κάποια από τις παραπάνω τεχνικές δεν εφαρµόζεται αυτούσια. Αντίθετα συνδυάζονται µε τεχνικές κωδικοποίησης πηγής 2