ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΙΡΑΙΩΣ, ΤΜΗΜΑ ΔΙΔΑΚΤΙΚΗΣ ΤΗΣ ΤΕΧΝΟΛΟΓΙΑΣ ΚΑΙ ΨΗΦΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ ΔΤΨΣ 150: ΨΗΦΙΑΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΕΙΚΟΝΑΣ Ακαδημαϊκό Έτος 2006 2007, Χειμερινό Εξάμηνο ΤΕΛΙΚΗ ΕΞΕΤΑΣΗ Η εξέταση αποτελείται από δύο μέρη. Το πρώτο περιλαμβάνει 20 ερωτήσεις πολλαπλής επιλογής και βαθμολογείται με 40 μονάδες. Κάθε ερώτηση έχει μόνο μία ορθή απάντηση και οι ορθές απαντήσεις πρέπει να μεταφερθούν στον πίνακα που σας δίνεται στην τελευταία σελίδα. Το δεύτερο μέρος περιλαμβάνει δύο ασκήσεις / θεωρητικές ερωτήσεις και βαθμολογείται με 60 μονάδες. ΔΙΑΡΚΕΙΑ ΕΞΕΤΑΣΗΣ: 3 ΩΡΕΣ ΚΑΛΗ ΕΠΙΤΥΧΙΑ! ΟΝΟΜΑΤΕΠΩΝΥΜΟ: ΑΡΙΘΜΟΣ ΦΟΙΤΗΤΙΚΗΣ ΤΑΥΤΟΤΗΤΑΣ:... ΕΞΑΜΗΝΟ: ΜΕΡΟΣ Α ΒΑΘΜΟΛΟΓΙΑ ΜΕΡΟΣ Β ΣΥΝΟΛΟ
2
ΜΕΡΟΣ Β: ΑΣΚΗΣΕΙΣ Άσκηση 1 (30 μονάδες): Παρακάτω δίνεται το διάγραμμα ενός JPEG encoder. Να εξηγήσετε συνοπτικά αλλά τεκμηριωμένα: (a) Γιατί εφαρμόζουμε Διαφορική Κωδικοποίηση (DPCM) στους DC συντελεστές (γειτονικών block) (4 μονάδες). Επειδή η μέση φωτεινότητα γειτονικών 8x8 block στην εικόνα σπάνια διαφέρει σημαντικά οι συντελεστές DC των εν λόγω μπλοκ θα έχουν παρόμοια τιμή. Η εφαρμογή της κωδικοποίησης DPCM σε τέτοιες περιπτώσεις μειώνει την εντροπία (τυχαιότητα) των τιμών που προκύπτουν (δηλαδή οι τιμές των διαφορών των DC συντελεστών παρουσιάζουν μικρότερη τυχαιότητα από τις ίδιες τις τιμές) και οδηγεί σε αποτελεσματική κωδικοποίηση εντροπίας (βλέπε block entropy coding). (b) Γιατί εφαρμόζουμε Κωδικοποίηση Μήκους Διαδρομής (Run Length Encoding -RLC) στους AC συντελεστές (εντός του block) (4 μονάδες) Μετά από το zig-zag scanning των κβαντισμένων AC συντελεστών δημιουργούνται ακολουθίες με μεγάλο αριθμό μηδενικών (ειδικά η τελευταία έχει συνήθως πολύ μεγάλο μήκος και αντικαθίσταται από σύμβολο ΕΟΒ - End Of Block) η οποίες ευνοούν την κωδικοποίηση μήκους διαδρομής. Τα σύμβολα που προκύπτουν μετά την κωδικοποίηση μήκους διαδρομής είναι πεπερασμένα το πλήθος και παρουσιάζουν μικρή εντροπία (τυχαιότητα). Επομένως οδηγούν σε αποτελεσματική κωδικοποίηση εντροπίας (βλέπε block entropy coding). Σχήμα Β.1 (c) Στη συνέχεια δίνεται ο πίνακας των συντελεστών DCT ενός block 8x8 μιας εικόνας καθώς και ένας συχνά χρησιμοποιούμενος πίνακας κβαντισμού Q. Να υπολογίσετε τις (ακέραιες) τιμές των συντελεστών DCT μετά τον κβαντισμό (5 μονάδες). Οι κβαντισμένοι συντελεστές προκύπτουν μετά από διαίρεση στοιχείου προς στοιχείο των συντελεστών DCT με τον πίνακα κβαντισμού και ακεραιοποίηση (rounding) των αποτελεσμάτων: 3
DCT συντελεστές 34 0 13-1 -1 1 0 0-38 0 9 1 0-1 0 0-18 0 2 0-1 0 0-1 -9 0 2-1 -1 0-1 0-3 0-2 1 2-1 0 0-2 0-2 0 2 1 3-1 -3 0-1 0 1 0 2 1-2 0 0 0 0 0-1 -1 Πίνακας Κβαντισμού Q 10 10 15 20 25 30 35 40 10 15 20 25 30 35 40 50 15 20 25 30 35 40 50 60 20 25 30 35 40 50 60 70 25 30 35 40 50 60 70 80 30 35 40 50 60 70 80 90 35 40 50 60 70 80 90 100 40 50 60 70 80 90 100 110 Κβαντισμένοι συντελεστές 3 0 1 0 0 0 0 0-4 0 0 0 0 0 0 0-1 0 0 0 0 0 0 0 (d) Να εφαρμόσετε κωδικοποίηση μήκους διαδρομής (της μορφής σύμβολο! αριθμός επαναλήψεων όπου απαιτείται) με zigzag scanning στο αποτέλεσμα του ερωτήματος (c). Σημειώνεται ότι το τελευταίο block μηδενικών κωδικοποιείται με ένα χαρακτήρα & (ΕΟΒ End Of Block) (8 μονάδες). 3!1 0!1-4!1-1!1 0!1 1!1& (e) Υπολογίστε το βαθμό συμπίεσης που επιτυγχάνεται στο συγκεκριμένο block με συνδυασμό κωδικοποίησης μετασχηματισμού και μήκους διαδρομής. Θεωρήστε για απλότητα ότι τόσο τα σύμβολα! και & καθώς και οι τιμές των κβαντισμένων συντελεστών αλλά και επαναλήψεων κωδικοποιούνται με ένα byte έκαστο. (5 μονάδες). Για την κωδικοποίηση της συμβολοσειράς 3!1 0!1-4!1-1!1 0!1 1!1& (19 σύμβολα) θα χρειαστούμε 19 bytes. Η κωδικοποίηση των gray scale τιμών του αρχικού μπλοκ θα απαιτούσε 64 bytes (ένα byte για κάθε τιμή φωτεινότητας). Επομένως έχουμε βαθμό συμπίεσης 64/19 = 3.37 4
(f) Πως θα μπορούσαμε να αυξήσουμε τη συμπίεση τροποποιώντας τον πίνακα κβαντισμού και τι συνέπειες θα είχε αυτό (4 μονάδες) Θα μπορούσαμε να πολλαπλασιάσουμε τον πίνακα κβαντισμού με μία ακέραια τιμή k>1. Αυτό θα είχε ως αποτέλεσμα τον μηδενισμό περισσότερων κβαντισμένων συντελεστών αλλά και αύξηση του σφάλματος κβαντισμού με αποτέλεσμα τη δημιουργία τεχνουργημάτων (artifacts τεχνητά δημιουργημένων ομοιόμορφων περιοχών) στην εικόνα. ------------------------------------------------------------------------------------------------------------------------------------------ Άσκηση 2 (30 μονάδες): Δίνονται οι δύο εικόνες αποχρώσεων του γκρι που φαίνονται στο επόμενο σχήμα. Αμφότερες έχουν διαστάσεις 64x64 pixels και μόνο δύο διαφορετικές τιμές: σκούρο γκρι => τιμή φωτεινότητας 90, ανοικτό γκρι => τιμή φωτεινότητας 180 Image A Image B (a) Να σχεδιάσετε τα ιστογράμματα των δύο εικόνων. Τι παρατηρείτε συγκρίνοντας τα; Σχολιάστε τη χρήση της ομοιότητας ιστογραμμάτων ως κριτήριο ομοιότητας εικόνων; (3 μονάδες) Αμφότερες οι εικόνες έχουν το πιο κάτω ιστόγραμμα (τιμή 90 -> εμφανίσεις 2048, τιμή 180 -> εμφανίσεις 2048,). Είναι εμφανές ότι η ομοιότητα ιστογραμμάτων είναι μια φτωχή μέθοδος σύγκρισης εικόνων. 2000 1800 1600 1400 1200 1000 800 600 400 200 0 0 50 100 150 200 250 5
(b) Στις δύο εικόνες εφαρμόζουμε το φίλτρο εξομάλυνσης h η μάσκα του οποίου φαίνεται στο διπλανό σχήμα. Πόσες και ποιες διακριτές τιμές φωτεινότητας θα έχουν οι δύο εικόνες A και Β μετά την εφαρμογή του φίλτρου (αγνοήστε τις επιπτώσεις που δημιουργούν τα όρια της εικόνας); (12 μονάδες) Φίλτρο (μάσκα) h 1/9 1/9 1/9 1/9 1/9 1/9 1/9 1/9 1/9 Η εικόνα Α μετά την εφαρμογή του φίλτρου θα έχει τις εξής τιμές φωτεινότητας: 90, 120, 150, 180. Η εικόνα β μετά την εφαρμογή του φίλτρου θα έχει τις εξής τιμές φωτεινότητας: 90, 120, 130, 140 150, 180. (c) Για τις φιλτραρισμένες εικόνες να υπολογίσετε προσεγγιστικά (αγνοώντας τις επιπτώσεις που δημιουργούν τα όρια της εικόνας) τον αριθμό των pixels που έχουν κάθε μια από τις παραπάνω τιμές φωτεινότητας και να σχεδιάσετε τα αντίστοιχα ιστογράμματα. (10 μονάδες). Εικόνα Α: Τιμή 90 -> 2032 εμφανίσεις, Τιμή 120 -> 64 εμφανίσεις, Τιμή 150 -> 64 εμφανίσεις, Τιμή 180 -> 2032 εμφανίσεις, Εικόνα β: Τιμή 90 -> 1152 εμφανίσεις, Τιμή 120 -> 768 εμφανίσεις, Τιμή 130 -> 128 εμφανίσεις, Τιμή 140 -> 128 εμφανίσεις, Τιμή 150 -> 768 εμφανίσεις, Τιμή 180 -> 1152 εμφανίσεις (d) Τι παρατηρείτε συγκρίνοντας τα ιστογράμματα του ερωτήματος (c); Εξηγήστε που οφείλονται τυχόν διαφορές στα ιστογράμματα. Σχολιάστε τη χρήση της ομοιότητας ιστογραμμάτων ως κριτήριο ομοιότητας εικόνων μετά από τα αποτελέσματα του ερωτήματος (c); (5 μονάδες) Τα ιστογράμματα των φιλτραρισμένων εικόνων διαφέρουν αρκετά. Αυτό δείχνει ότι η ομοιότητα ιστογραμμάτων είναι όχι μόνο φτωχή μέθοδος σύγκρισης εικόνων αλλά επιπλέον δεν είναι ούτε εύρωστη. 6
ΠΙΝΑΚΑΣ ΑΠΑΝΤΗΣΕΩΝ Ερώτηση Α Β Γ Δ 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 7