ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Ανώτατο Εκπαιδευτικό Ίδρυμα Πειραιά Τεχνολογικού Τομέα ΕΠΕΞΕΡΓΑΣΙΑ ΕΙΚΟΝΑΣ Ενότητα 6: Κωδικοποίηση & Συμπίεση Εικόνας Ιωάννης Έλληνας Τμήμα Υπολογιστικών Συστημάτων
Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για εκπαιδευτικό υλικό, όπως εικόνες, που υπόκειται σε άλλου τύπου άδειας χρήσης, η άδεια χρήσης αναφέρεται ρητώς. Χρηματοδότηση Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα. Το έργο «Ανοικτά Ακαδημαϊκά Μαθήματα στο Ανώτατο Εκπαιδευτικό Ίδρυμα Πειραιά Τεχνολογικού Τομέα» έχει χρηματοδοτήσει μόνο τη αναδιαμόρφωση του εκπαιδευτικού υλικού. Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος «Εκπαίδευση και Δια Βίου Μάθηση» και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους. 2
1. Σκοποί ενότητας... 4 2. Περιεχόμενα ενότητας... 4 3. Ασκήσεις... 5 3.1 1 η Άσκηση... 5 3.2 2 η Άσκηση... 5 3.3 3 η Άσκηση... 5 3.4 4 η Άσκηση... 5 3.5 5 η Άσκηση... 6 3.6 6 η Άσκηση... 6 3.7 7 η Άσκηση... 7 3.8 8 η Άσκηση... 8 3.9 9 η Άσκηση... 8 3
1. Σκοποί ενότητας Σκοπός της ενότητας είναι να αναπτυχθούν οι τρόποι κωδικοποίησης μιας εικόνας και να κληθεί ο εκπαιδευόμενος να λύσει πρακτικές ασκήσεις. 2. Περιεχόμενα ενότητας H ενότητα αυτή καλύπτει τις ακόλουθες βασικές έννοιες: Εντροπία πηγής συμβόλων Τεχνικές κωδικοποίησης pixel Κωδικοποίηση Huffman Κωδικοποίηση RLC Αριθμητική κωδικοποίηση Κωδικοποίηση επιπέδου Τεχνικές κωδικοποίησης με πρόβλεψη Διαφορική κωδικοποίηση χωρίς απώλειες Διαφορική κωδικοποίηση με απώλειες Βέλτιστη διαφορική κωδικοποίηση με απώλειες Κωδικοποίηση DPCM Τεχνικές κωδικοποίησης με μετασχηματισμό Διαδικασία κωδικοποίησης με μετασχηματισμό Διαδικασία διάθεσης επιθυμητού ρυθμού Με τις αντίστοιχες ασκήσεις για λύση που καλύπτουν τις παραπάνω θεματικές. 4
3. Ασκήσεις 3.1 1 η Άσκηση Διαβάστε την εικόνα woman.mat και υπολογίστε την εντροπία με τη βοήθεια της συνάρτησης entropy.m. Εντροπία = bits/pixel 3.2 2 η Άσκηση Για την ίδια εικόνα να υπολογιστούν τα bits/pixel εάν γίνει κωδικοποίηση Huffman. H συνάρτηση huffbin.m δίνει για κάθε σύμβολο (δηλ. pixel) την δεκαδική τιμή της κωδικής λέξης και τον αριθμό των bits αυτής (π.χ. [26,8] για το πρώτο pixel, το οποίο σημαίνει ότι η κωδική λέξη είναι 00011010). Συγκρίνετε αυτήν την τιμή με την εντροπία. Κωδικοποίηση Huffman = bits/pixel 3.3 3 η Άσκηση Έστω η εικόνα: x=[0001;1100;0001;1110], η οποία σαρώνεται οριζόντια και κωδικοποιείται με RLC. Ποιοι αριθμοί θα μεταδοθούν; Εφαρμόστε τη συνάρτηση runlength.m και δείξτε το αποτέλεσμα. RLC = 3.4 4 η Άσκηση Να γραφτεί πρόγραμμα το οποίο να αναλύει την εικόνα woman.mat σε 8 bit planes με κώδικα Gray και στη συνέχεια να τα κωδικοποιεί με RLC. Να υπολογιστεί η εντροπία και ο συντελεστής συμπίεσης. Να απεικονιστούν τα επίπεδα 1και 8. Bit plane 1 Bit plane 8 5
Εντροπία = bits/pixel 3.5 5 η Άσκηση Να γραφτεί πρόγραμμα το οποίο να υπολογίζει τις οκτώ περιπτώσεις πρόβλεψης και τις αντίστοιχες εντροπίες για δεδομένη εικόνα, με τη βοήθεια του προγράμματος differential_lossless_coding.m. Σημειώστε την αποτελεσματικότερη. H1 H2 H3 H4 H5 H6 H7 H8 3.6 6 η Άσκηση Με τη βοήθεια του προγράμματος optimum_lossy_differential.m να υπολογιστεί η βέλτιστη τιμή της σταθεράς α, για μια συμβολοσειρά 10000 τυχαίων δειγμάτων με κατανομή Gaussian N(0,1). Ο κβαντιστής Q παίρνει τιμή 1 για x>=0 και -1 για x<0. (Βλέπε παράδειγμα 6.7 των σημειώσεων). α = Παραμόρφωση = 6
3.7 7 η Άσκηση Να απεικονιστεί το σφάλμα πρόβλεψης εάν η εικόνα woman κωδικοποιηθεί με τεχνική DPCM και με ιδανικό κβαντιστή μηδενικού σφάλματος. Οι σχέσεις πρόβλεψης να είναι ίδιες με αυτές του παραδείγματος 6.7 των σημειώσεων. Το πρόγραμμα υλοποίησης είναι το DPCM.m. Απεικονίστε τα τέσσερα σφάλματα πρόβλεψης και κάνετε παρατηρήσεις. Πρόβλεψη 1 Πρόβλεψη 2 Πρόβλεψη 3 Πρόβλεψη 4 7
3.8 8 η Άσκηση Να διαβαστεί η εικόνα woman. Με τη χρήση του προγράμματος zonal_mask.m να συμπιεστεί η εικόνα για τις εξής περιπτώσεις: (α) Η μάσκα να περιλαμβάνει το DC συντελεστή και τους οκτώ AC συντελεστές με τη μεγαλύτερη διασπορά. (β) Η μάσκα να περιλαμβάνει το DC συντελεστή και τους τέσσερις AC συντελεστές με τη μεγαλύτερη διασπορά. Να απεικονιστούν οι ανακατασκευασμένες εικόνες, να γραφτούν τα PSNR και να σχολιαστούν. Ανακατασκευασμένη Εικόνα (α) Ανακατασκευασμένη Εικόνα (β) 3.9 9 η Άσκηση Να διαβαστεί η εικόνα woman. Με τη χρήση του προγράμματος threshold_mask.m να συμπιεστεί η εικόνα για τις εξής περιπτώσεις: (α) Η μάσκα να περιλαμβάνει το DC συντελεστή και τους οκτώ AC συντελεστές με το μεγαλύτερο μέγεθος. (β) Η μάσκα να περιλαμβάνει το DC συντελεστή και τους τέσσερις AC συντελεστές με το μεγαλύτερο μέγεθος. 8
Να απεικονιστούν οι ανακατασκευασμένες εικόνες, να γραφτούν τα PSNR και να σχολιαστούν μεταξύ τους καθώς επίσης και με τις προηγούμενες. Ανακατασκευασμένη Εικόνα (α) Ανακατασκευασμένη Εικόνα (β) 9