ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ, ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΕΠΛ 4: ΣΥΣΤΗΜΑΤΑ ΠΟΛΥΜΕΣΩΝ Ακαδηµαϊκό Έτος 004 005, Χειµερινό Εξάµηνο Καθ.: Νίκος Τσαπατσούλης ΤΕΛΙΚΗ ΕΞΕΤΑΣΗ Η εξέταση αποτελείται από δύο µέρη. Το πρώτο περιλαµβάνει 0 ερωτήσεις πολλαπλής επιλογής και βαθµολογείται µε 40 µονάδες. Κάθε ερώτηση έχει µόνο µία ορθή απάντηση και οι ορθές απαντήσεις πρέπει να µεταφερθούν στον πίνακα που σας δίνεται στην τελευταία σελίδα. Το δεύτερο µέρος περιλαµβάνει ασκήσεις / θεωρητικές ερωτήσεις και βαθµολογείται µε 60 µονάδες. ΙΑΡΚΕΙΑ ΕΞΕΤΑΣΗΣ: 3 ΩΡΕΣ ΚΑΛΗ ΕΠΙΤΥΧΙΑ! ΟΝΟΜΑΤΕΠΩΝΥΜΟ: ΑΡΙΘΜΟΣ ΤΑΥΤΟΤΗΤΑΣ: ΤΜΗΜΑ: ΜΕΡΟΣ Α ΒΑΘΜΟΛΟΓΙΑ ΜΕΡΟΣ Β ΣΥΝΟΛΟ
Τελική Εξέταση: εκέµβριος 004 ΜΕΡΟΣ Β: ΑΣΚΗΣΕΙΣ Άσκηση 1 (1 µονάδες): Για τις παρακάτω εικόνες να: (a) Υπολογίσετε και σχεδιάσετε τα κανονικοποιηµένα ιστογράµµατα τους 6 µονάδες (b) Να υπολογίσετε την οµοιότητα τους µε βάση την Ευκλείδια απόσταση και τη διασταύρωση ιστογράµµατος - 6 µονάδες (c) Ποια από τις δύο εικόνες θα συµπιεζόταν αποδοτικότερα µε χρήση Στατιστικής Κωδικοποίησης (π.χ. Huffman). Αιτιολογήστε την απάντηση σας - 3 µονάδες (d) Ποια από τις δύο εικόνες θα συµπιεζόταν αποδοτικότερα µε χρήση ιαφορικής Κωδικοποίησης. Αιτιολογήστε την απάντηση σας - 3 µονάδες Εικόνα Α Εικόνα Β 1 3 5 7 6 4 3 5 7 7 6 6 5 7 7 7 6 7 7 7 7 6 4 1 3 5 7 6 6 3 5 7 7 6 5 7 7 7 7 7 7 7 1 1 1 1 1 1 1 1 1 1 3 3 3 3 4 4 3 3 3 3 4 4 4 4 3 3 4 4 4 4 5 5 5 5 4 4 5 5 5 5 6 6 6 6 6 6 6 6 6 6 7 7 7 7 7 7 7 7 7 7 (a) Τα ιστογράµµατα των εικόνων Α και Β φαίνονται στα σχήµατα (a) και (b) αντίστοιχα, ενώ τα κανονικοποιηµένα ιστογράµµατα (συχνότητα εµφάνισης / συνολικός αριθµός pixel) δίνονται στα σχήµατα (c) και (d). Οι τιµές των κανονικοποιηµένων ιστογραµµάτων είναι Η Α ={0.0313, 0.0313, 0.065, 0.0313, 0.093, 0.150, 0.315, 0.315} και Η Β ={0.15, 0.15, 0.15, 0.150, 0.100, 0.15, 0.15, 0.15} (b) Η Ευκλείδια απόσταση των ιστογραµµάτων δίνεται από τη σχέση:
Τελική Εξέταση: εκέµβριος 004 NumberOfBins D( H A, H B ) = A B ( H ( i) H ( i) ) = ( H ( i) H ( i) ) = ( 0.0313 0.15) +... + ( 0.315 0.15) A B i= 1 i= 1 =0.355 Η οµοιότητα µε βάση την Ευκλείδια απόσταση δίνεται από τη σχέση S Euclidian Η διασταύρωση ιστογράµµατος (Histogram Intersection) δίνεται από τη σχέση: NumberOfBins = 1 D = 0.6745. I ( H A, H B ) = min( H A( i), H B ( i) ) = min( 0.0313,0.15) +... + min( 0.315,0.15) = 0.65 i= 1 Η οµοιότητα µε βάση τη διασταύρωση ιστογράµµατος είναι η ίδια η τιµή της διασταύρωσης ιστογράµµατος άρα S sec tion I = 0.65 Inter = Image A: Histogram Image B: Histogram 0 1 1 16 10 Frequency of Appearence 14 1 10 6 Frequency of Appearence 6 4 4 0 1 3 4 5 6 7 Intensity Value 0 1 3 4 5 6 7 Intensity Value (a) (b) 0.35 Image A: Normalized Histogram 0.16 Image B: Normalized Histogram 0.3 0.14 0.5 0.1 Probability of Appearence 0. 0.15 Probability of Appearence 0.1 0.0 0.06 0.1 0.04 0.05 0.0 0 1 3 4 5 6 7 Intensity Value 0 1 3 4 5 6 7 Intensity Value (c) (d) (c) Με δεδοµένο ότι υπάρχει σηµαντική διαφορά όσον αφορά τις πιθανότητες εµφάνισης των τιµών φωτεινότητας για την εικόνα Α (η τιµή έχει πιθανότητα εµφάνισης 0.315 ενώ η τιµή 1 έχει πιθανότητα εµφάνισης 0.0313) είναι φανερό ότι η χρήση κωδικών λέξεων (codewords) µικρού 3
Τελική Εξέταση: εκέµβριος 004 µήκους για τα περισσότερο συχνά εµφανιζόµενα σύµβολα (π.χ. η τιµή φωτεινότητας ) όπως προβλέπει η στατιστική κωδικοποίηση θα οδηγήσει σε αποτελεσµατικότερη συµπίεση. (d) Στη διαφορική κωδικοποίηση η εικόνα σαρώνεται κατά γραµµές και κάθε τιµή φωτεινότητας κωδικοποιείται ως η διαφορά της τιµής φωτεινότητας από το προηγούµενο pixel. Είναι φανερό ότι τις µικρότερες αλλαγές ανάµεσα σε γειτονικά pixel της παρουσιάζει η εικόνα B η οποία και θα συµπιέζεται αποδοτικότερα µε χρήση αυτής της τεχνικής. Άσκηση (4 µονάδες): Για κάθε ένα από τα πρότυπα συµπίεσης H61, H63, MPEG-1, MPEG- να δώσετε τη κυρίαρχη εφαρµογή τους (για ποια εφαρµογή κατά κύριο λόγο αναπτύχθηκαν). Η61 => Βιντεοτηλεφωνία (Βίντεο µέσω γραµµών ISDN) Η63 => Τηλεδιάσκεψη µέσω ιαδικτύου (Video over IP) MPEG-1 => ιανοµή Βίντεο µέσω CD-ROM, Αποθήκευση κασετών VHS σε ψηφιακή µορφή MPEG- => ιανοµή Βίντεο µέσω DVD-ROM, Ψηφιακή αναµετάδοση Βίντεο (π.χ. Nova). Άσκηση 3 (6 µονάδες) Μια εικόνα GIF, µεγέθους γραµµές x 360 στήλες, µεταδίδεται σε interlaced mode. Να υπολογίσετε τον αριθµό των bytes που πρέπει να αποθηκεύσει ο δέκτης ώστε να µπορέσει να προβάλει την πρώτη εκδοχή της εικόνας. Για τη πρώτη εκδοχή της εικόνας χρειάζεται να προβληθούν η πρώτη και ανά γραµµές της εικόνας. Εποµένως χρειάζεται να αποθηκευτούν / =36 γραµµές της εικόνας. Εποµένως χρειάζεται να αποθηκευτούν 36*360 τιµές pixel. Με δεδοµένο ότι οι εικόνες GIF χρησιµοποιούν παλέτα 56 χρωµάτων χρησιµοποιείται ένα byte ανά pixel άρα τελικά χρειάζεται να αποθηκευτούν 36*360*1=1960 bytes. 4
Τελική Εξέταση: εκέµβριος 004 Άσκηση 4 (1 µονάδες): Μια ερασιτεχνική ψηφιακή βιντεοκάµερα καταγράφει σε DV format (πρότυπο SIF: χρωµατική δειγµατοληψία 4:1:1, frame size γραµµές x 360 στήλες, 5 frames/sec, non-interlaced). Το σήµα βίντεο συµπιέζεται σύµφωνα µε το πρότυπο MPEG-1. Το συµπιεσµένο σήµα απoτελείται από GoP της µορφής ΙΒΒPΒΒPBBPBB. (a) Είναι το GoP ανοικτό ή κλειστό; Αιτιολογήστε (πολύ συνοπτικά) την απάντηση σας 1 µονάδα ; (b) Να υπολογίσετε το συνολικό µέσο βαθµό συµπίεσης αν κάθε Ι frame συµπιέζεται µε µέσο βαθµό συµπίεσης 10:1, κάθε P frame συµπιέζεται µε µέσο βαθµό συµπίεσης 0:1 και κάθε P frame συµπιέζεται µε µέσο βαθµό συµπίεσης 50:1 3 µονάδες. (c) Να υπολογίσετε το bit rate του συµπιεσµένου σήµατος - 3 µονάδες. (d) Να δώσετε κάποιους κανόνες σχετικά µε το πότε ένα frame κωδικοποιείται ως Ι, P ή Β (γενικά, όχι στην περίπτωση του παραδείγµατος) 3 µονάδες (e) Να υπολογίσετε το bit rate του συµπιεσµένου σήµατος αν αντί για MPEG-1 χρησιµοποιούσαµε το πρότυπο MJPEG- µονάδες. (a) Το GoP είναι ανοικτό αφού καταλήγει σε B frame και εποµένως χρειάζεται το I frame του επόµενου GoP για την αποκωδικοποίηση του. (b) Με δεδοµένο ότι το συµπιεσµένο βίντεο αποτελείται από GoP της µορφής ΙΒΒPΒΒPBBPBB είναι φανερό ότι το 1/1 των frames κωδικοποιούνται ως I frames, τα 3/1 κωδικοποιούνται ως Ρ frames και τα /1 κωδικοποιούνται ως Β frames. Εποµένως κάθε frame (κατά µέσο όρο) συµπιέζεται στο (1/1)*0.1+(3/1)*0.05+(/1)*0.0 = 0.034 του µεγέθους του ασυµπίεστου frame, άρα βαθµός συµπίεσης 1/0.034 = 9.7:1 (c) Το bit rate του ασυµπίεστου βίντεο είναι: (x360+*144*10) pixels / frame * bits /pixel *5 frame / sec = 31.104 Mbps. Οπότε εφόσον έχουµε µέσο λόγο συµπίεσης 9.7:1 θα έχουµε bit rate για το συµπιεσµένο σήµα 31.104 Mbps/9.7 = 1.063 Mbps (d) I frames χρησιµοποιούµε σε αλλαγές σκηνών ή σε περιπτώσεις µικρής οµοιότητας ανάµεσα σε διαδοχικά frames. Σε κάθε περίπτωση πρέπει να έχουµε κωδικοποίηση ενός I frame τουλάχιστον κάθε 13 πλαίσια ώστε να δίνεται η δυνατότητα επανασυγχρονισµού του δέκτη. P frames χρησιµοποιούµε όταν υπάρχει οµοιότητα ανάµεσα σε διαδοχικά frames αλλά ταυτόχρονα υπάρχει και σηµαντική κίνηση εποµένως η πολυπλοκότητα της αντιστάθµισης κίνησης είναι µεγάλη για να επεκταθεί σε δύο frames. B frames χρησιµοποιούµε όταν υπάρχει µικρή κίνηση ανάµεσα σε διαδοχικά frames ώστε η αντιστάθµιση κίνησης σε δύο πλαίσια να µην απαιτεί υπερβολικό υπολογιστικό φόρτο. (e) Στο MJPEG όλα τα frames κωδικοποιούνται ως I frames. Εποµένως το συµπιεσµένο και MJPEG σήµα έχει bit rate 31.104 Mbps/10 = 3.11 Mbps 5
Τελική Εξέταση: εκέµβριος 004 Άσκηση 5 (0 µονάδες): Παρακάτω δίνεται το διάγραµµα ενός JPEG encoder. Να εξηγήσετε συνοπτικά αλλά τεκµηριωµένα: (a) Γιατί πριν την εφαρµογή του µετασχηµατισµού DCT (forward DCT) σε κάθε block x αφαιρείται το 1 από όλες τις τιµές του block - µονάδες (b) Γιατί εφαρµόζουµε ιαφορική Κωδικοποίηση (Differential Encoding) στους DC συντελεστές (γειτονικών block) 3 µονάδες (c) Γιατί εφαρµόζουµε Κωδικοποίηση Μήκους ιαδροµής (Run Length Encoding) στους AC συντελεστές (εντός του block) 3 µονάδες (d) Στη συνέχεια δίνεται ο πίνακας των συντελεστών DCT ενός block x µιας εικόνας καθώς και ένας συχνά χρησιµοποιούµενος πίνακας κβαντισµού Q. Τι µπορείτε να συµπεράνετε για τη µορφή του block της εικόνας µονάδες Ποιος συντελεστής θα έχει τη µεγαλύτερη (απόλυτη) τιµή µετά τον κβαντισµό 3 µονάδες Πόσο µήκος έχει η µεγαλύτερη ακολουθία µηδενικών που προκύπτει µετά τη διανυσµατοποίηση των κβαντισµένων συντελεστών - 4 µονάδες Πως θα µπορούσαµε να αυξήσουµε τη συµπίεση τροποποιώντας τον πίνακα κβαντισµού και τι συνέπειες θα είχε αυτό - 3 µονάδες DCT συντελεστές 93 37 331 334 33 30 1 67-7 -4-37 -34-45 -60-67 -0-43 -33-31 -7-31 -19 - - - -0 - -19-14 4 10 10 1 - -1-10 -4 - -1 13 5-5 -3 0-4 -10 5 1-1 1-1 1 3-1 0 4 1 1-1 5-5 - 6
Τελική Εξέταση: εκέµβριος 004 Πίνακας Κβαντισµού Q 10 10 15 0 5 30 35 40 10 15 0 5 30 35 40 50 15 0 5 30 35 40 50 60 0 5 30 35 40 50 60 70 5 30 35 40 50 60 70 0 30 35 40 50 60 70 0 90 35 40 50 60 70 0 90 100 40 50 60 70 0 90 100 110 (a) Ο συντελεστής DC είναι ανάλογος του µέσου χρώµατος του block. Με δεδοµένο ότι οι τιµές στα pixel των block κυµαίνονται από 0-55, η αναµενόµενη µέση τιµή χρώµατος για ένα τυχαίο block είναι 1. Επειδή οι συντελεστές DC κωδικοποιούνται µε διαφορική κωδικοποίηση επιθυµούµε να έχουν όσο το δυνατό µικρότερες τιµές. Εποµένως αφαιρώντας την τιµή 1 από όλες τις τιµές του block η αναµενόµενη µέση τιµή για ένα τυχαίο block είναι 0 και κατά αντιστοιχία η αναµενόµενη τιµή για το DC συντελεστή θα είναι και αυτή 0. (b) Επειδή είναι πολύ πιθανό γειτονικά block να έχουν το ίδιο µέσο χρώµα και εποµένως τον ίδιο DC συντελεστή. Εφαρµόζοντας διαφορική κωδικοποίηση µπορούµε να κωδικοποιήσουµε τη διαφορά των DC συντελεστών µε λιγότερα bits από όσα θα χρειαζόµασταν για την κωδικοποίηση των ίδιων των συντελεστών (c) Μετά τον κβαντισµό των συντελεστών ενός block δηµιουργούνται πολλά µηδενικά, εποµένως η κωδικοποίηση µήκους διαδροµής (µε σάρωση των κβαντισµένων συντελεστών κατά zig-zag) είναι µια κατάλληλη τεχνική για να επιτύχουµε συµπίεση (µεγάλες ακολουθίες από µηδενικά). (d) (i) Το block περιέχει κυρίως αλλαγές της φωτεινότητας κατά την οριζόντια κατεύθυνση (ii) ιαιρώντας στοιχείο προς στοιχείo το block από τους DCT συντελεστές µε τον πίνακα κβαντισµού προκύπτει ότι τη µεγαλύτερη τιµή έχει ο συντελεστής F(0,1) = round (37/10) = 33, όπου round(:) δηλώνει στρογγυλοποίηση στο πλησιέστερο ακέραιο. (iii) Μετά από zig-zag scanning των κβαντισµένων συντελεστών προκύπτει ότι η µεγαλύτερη ακολουθία µηδενικών έχει µήκος 1 (Βλέπε τους κβαντισµένους DCT συντελεστές παρακάτω). 9 33 17 13 10 7 - -3 - -1 - - - - -3 - -1-1 -1 0 0 0 0-1 -1-1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 7
Τελική Εξέταση: εκέµβριος 004 (iv) Μπορούµε να πολλαπλασιάσουµε τον πίνακα κβαντισµού µε µια σταθερά c>1. Με αυτό το ακόµη περισσότεροι κβαντισµένοι θα έχουν τιµή µηδέν, άρα µεγαλύτερες ακολουθίες από µηδενικά άρα αποδοτικότερη συµπίεση. Φυσικά αυτό έχει κόστος ως προς την πιστότητα της αποκωδικοποιηµένης εικόνας σε σχέση µε την αρχική (αύξηση του πίνακα κβαντισµού = αύξηση συµπίεσης = µείωση ποιότητας αποκωδικοποιηµένης εικόνας) ΠΙΝΑΚΑΣ ΑΠΑΝΤΗΣΕΩΝ Ερώτηση Α Β Γ 1 3 4 5 6 7 9 10 11 1 13 14 15 16 17 1 19 0 ΠΑΡΑΡΤΗΜΑ V V max min n Vmax V q V e min max = = = n+ 1 = min SNR min 0log 10 emax D( H A, H B ) = NumberOfBins i= 1 ( H ( i) H ( i) ) A B