Ενδιάµεση Εξέταση: Οκτώβριος 4 ΜΕΡΟΣ Β: ΑΣΚΗΣΕΙΣ Άσκηση (25 µονάδες): Μια εικόνα αποχρώσεων του γκρι και διαστάσεων 25 x pixel έχει κωδικοποιηθεί κατά PCM µε βάθος χρώµατος 3 bits /pixel. Οι τιµές φωτεινότητας που έχουν κωδικοποιηθεί, µαζί µε τη συχνότητα εµφάνισης τους στην εικόνα, δίνονται στο ιστόγραµµα του Σχήµατος αλλά και στον Πίνακα. Στον ίδιο πίνακα δίνονται και οι κωδικές λέξεις PCM που χρησιµοποιήθηκαν για την κωδικοποίηση των τιµών φωτεινότητας. Frequency of Appearence => 7 6 5 4 3 Image Histogram 6 48 8 2 44 76 8 24 Intensity Value => Τιµή Φωτεινότητας Συχνότητα Εµφάνισης Κωδική λέξη PCM 6 5 48 5 8 55 2 7 44 6 76 3 8 24 5 Σχήµα Πίνακας (a) Να υπολογίσετε το µέγεθος της παραπάνω εικόνας σε bytes. ( µονάδα) 25 x x 3 = 75 bits = 9375 bytes (b) Με βάση τη συχνότητα εµφάνισης να υπολογίσετε τις πιθανότητες εµφάνισης των τιµών φωτεινότητας τις εικόνας. (2 µονάδες) p(6)=.2, p(48)=.6, p(8)=.22, p(2)=.28, p(44)=.24, p(76)=.2, p(8)=.4, p(24)=.2 (c) Χρησιµοποιώντας την απάντηση του (b) υπολογίστε την εντροπία της εικόνας. (2 µονάδες) Η=2.5 bits / pixel, (d) Θέλουµε να συµπιέσουµε τη συγκεκριµένη εικόνα εφαρµόζοντας την κωδικοποίηση Huffman. Με βάση τις πιθανότητες εµφάνισης που υπολογίσατε στο (b) υπολογίστε τις κωδικές λέξεις Huffman και το µέσο µέγεθος κωδικής λέξης (7 µονάδες). 6 =>, 24 =>, 8 =>, 48 =>, 76 =>, 8 =>, 44 =>, 2 => Μέσο κωδικό µήκος λέξης = 6x(.2+.2) + 5x.4 + 4x.6 + 3x.2 + 2x(.22+.24+.28) = = 2.52 bits /codeword 8
Ενδιάµεση Εξέταση: Οκτώβριος 4 (e) Υπολογίστε το µέγεθος της συµπιεσµένης κατά Huffman εικόνας. ( µονάδες) 25 x x 2.52 = 63 bits = 7875 bytes (f) Κατά την αποκωδικοποίηση της συµπιεσµένης κατά Huffman εικόνας ο αποκωδικοποιητής λαµβάνει την επόµενη ακολουθία από bits:. Ποιες τιµές φωτεινότητας αντιστοιχούν στην ακολουθία αυτή; (3 µονάδες) Εξαρτάται από τις κωδικές λέξεις της κωδικοποίησης που έχει προηγηθεί. Με βάση την προηγούµενη κωδικοποίηση οι τιµές φωτεινότητες θα είναι: 2 2 2 8 8 44 76 8 76 (g) Κατασκευάστε το διάγραµµα ροής (ή γράψτε το ψευδοκώδικα) για την αποκωδικοποίηση των ακολουθιών Huffman (υποθέστε ότι το λεξικό των κωδικών λέξεων είναι γνωστό στο δέκτη). (9 µονάδες) 9
Ενδιάµεση Εξέταση: Οκτώβριος 4 Άσκηση 2: Το διάγραµµα του φάσµατος συχνοτήτων ενός ηχητικού σήµατος δίνεται στο επόµενο σχήµα. 6 Frequency Spectrum 5 4 3 2 4 6 8 2 Frequency (khz)=> (a) Να υποδείξετε την ελάχιστη συχνότητα δειγµατοληψίας, για την ψηφιοποίηση του σήµατος, σύµφωνα µε το θεώρηµα του Nyquist. ( µονάδα)
Ενδιάµεση Εξέταση: Οκτώβριος 4 f max =2kHz => f s, = 2* 2 khz = 24 samples/sec (b) Να υπολογίσετε το προκύπτον bit rate αν τελικά επιλέξουµε συχνότητα δειγµατοληψίας.2 φορές µεγαλύτερη από την υποδεικνυόµενη από το θεώρηµα Nyquist και κωδικοποίηση PCM 8 bits ανά δείγµα. (2 µονάδες) f s =.2*f s, =.2*24 samples/sec = 28 8 samples/sec bit rate = 28 8 samples/sec * 8 bits/sample = 234 bps. (c) Να υπολογιστεί ο µέγιστος αριθµός των bits ανά δείγµα, σε κωδικοποίηση σταθερού µήκους λέξης, ώστε το δειγµατοληπτηµένο (µε τη συχνότητα που έχετε υπολογίσει στο (b)) σήµα να µπορεί να µεταδοθεί ζωντανά (streag) µέσω του ιαδικτύου σε ακροατές µε ISDN συνδέσεις 28kbps. (2 µονάδες) f s *n max < 28 bits/sec => n max = 4 bits/sample (d) Υποθέτοντας ότι το σήµα µας (ηλεκτρική µορφή µετά από µετατροπή µε χρήση µικροφώνου) έχει δυναµικό εύρος ζώνης D=34.7db και µέγιστη τιµή V max =63mv να υπολογίσετε το σηµατοθορυβικό λόγο (σε db) για την περίπτωση του ερωτήµατος (c). (6 µονάδες) V = log V D max => max n 2 + V V = max D = 3 mv V V 63 3 e max = = = 5 mv 4+ 2 V = 3 SNR log = log emax 5 = -4.44 db (e) Για την περίπτωση του ερωτήµατος (d) να υπολογίσετε τον ελάχιστο αριθµό των bits ανά δείγµα που απαιτούνται ώστε να έχουµε ελάχιστο σηµατοθορυβικό λόγο µεγαλύτερο από 3 db. (6 µονάδες) V SNR = log => emax e max = SNR ~= 2 mv V Vmax V Vmax V e max = => n = log n 2 + 2 = 6 bits/sample emax (f) Να υπολογίσετε το bit rate που προκύπτει για την περίπτωση του ερωτήµατος (e) (ισχύει η συχνότητα δειγµατοληψίας του ερωτήµατος (b)). ( µονάδa) bit rate = 28 8 samples/sec * 6 bits/sample = 728 bps. (g) Οι παρακάτω είναι οι πρώτες 3 τιµές δειγµάτων του σήµατος (σε mv): 6 24 3 35 43 5 58 63 7 8 89 94 8 2 3 38 45 5 58 49 43 38 3 27 4 5. Να υπολογίσετε τον ελάχιστο αριθµό bits ανά δείγµα που απαιτούνται για την κωδικοποίηση µε την τεχνική DPCM των παραπάνω δειγµάτων ώστε το µέγιστο σφάλµα κβαντισµού να είναι µικρότερο από mv. Το DPCM σήµα είναι: 6 8 7 4 8 7 8 5 8 9 9 5 7 7 4 9 9 8 7 7 6-9 -6-5 -6-5 -7-6 -9.
Ενδιάµεση Εξέταση: Οκτώβριος 4 Το εύρος τιµών για το DPCM σήµα είναι V max -V = -(-9) = 9. Vmax V Vmax V e max = => n = log n 2 + 2 = 3 bits/ DPCM sample emax (h) Ποιος είναι ο βαθµός συµπίεσης που επιτυγχάνεται µε την κωδικοποίηση DPCM (ερώτηµα (h)) σε σχέση µε την κωδικοποίηση PCM (ερώτηµα (f)); DPCM => 3 bits/sample, PCM=> 6 bits/sample => Συµπίεση 2: (i) Με βάση την απάντηση του ερωτήµατος (g) και θεωρώντας ότι η µέγιστη και ελάχιστη τιµή του σήµατος DPCM είναι V max = mv V = - mv αντίστοιχα να υποδείξετε τις στάθµες κωδικοποίησης και τις αντίστοιχες κωδικές λέξεις. (5 µονάδες) Έχουµε 3 bits/sample, άρα 8 στάθµες. Το εύρος του σήµατος DPCM είναι V max -V =24mv άρα το εύρος q κάθε στάθµης θα είναι 3mv. Εποµένως οι προτεινόµενες στάθµες και µια πιθανή κωδικοποίηση θα είναι: -5 mv =>, -75 mv =>, -45 mv =>, -5 mv =>, 5 mv =>, 45 mv =>, 75 mv =>, 5 mv =>, Άσκηση 3 (3 µονάδες): Στο Σχήµα 3 δίνονται τα ελάχιστα επίπεδα ακουστικής ικανότητας των ανθρώπων ανά ζώνη συχνοτήτων εύρους 5 Hz. Στο Σχήµα 4 δίνεται η φασµατική κάλυψη για ένα πλαίσιο 384 δειγµάτων ενός ηχητικού σήµατος δειγµατοληπτηµένου στα 3 δείγµατα ανά δευτερόλεπτο ενώ στο Σχήµα 5 δίνεται το φάσµα συχνοτήτων του εν λόγω σήµατος (εκτιµηµένο µε βάση τα 384 δείγµατα). 45 Minimum Sound Pressure Levels audible by Humans 3 Spectral Masking per Frequency Band 4 35 3 25 5 5 25 5 5 5 5 25 3 5 5 25 3 Σχήµα 3 Σχήµα 4 2
Ενδιάµεση Εξέταση: Οκτώβριος 4 Frequency Spectrum of Input Signal 8 7 6 5 4 3 5 5 25 3 Σχήµα 5 (a) Να υπολογίσετε προσεγγιστικά το bit allocation per frequency band µε βάση τη λογική της κωδικοποίησης MPEG-, layer. ( µονάδες) Το συνολικό φαινόµενο κάλυψης (ακουστική ικανότητα ανθρώπου + φασµατική κάλυψη) δίνεται στο Σχήµα 6. Η διαφορά του φάσµατος ισχύος του σήµατος εισόδου (όπως έχει εκτιµηθεί από τα 384 δείγµατα) µε το φαινόµενο κάλυψης δίνεται στο Σχήµα 7. Ο αριθµός των bits ανά ζώνη συχνοτήτων (υπενθυµίζεται ότι κάθε bit προσθέτει περίπου 6 db σηµατοθορυβικού λόγου) δίνεται στο Σχήµα 8. Τέλος στο Σχήµα 9 δίνεται ο σηµατοθορυβικός λόγος που επιτυγχάνεται µε το προηγούµενο bit allocation ανά ζώνη συχνοτήτων (κόκκινες µπάρες) σε σχέση µε τα αντιληπτά επίπεδα έντασης του σήµατος (µπλε µπάρες). 5 45 4 35 3 25 5 5 Overall Masking 5 5 25 3 Difference between Power Spectrum and Overall Masking 7 6 5 4 3 - - -3-4 5 5 25 3 Σχήµα 6 Σχήµα 7 3
Ενδιάµεση Εξέταση: Οκτώβριος 4 Number of Bits => 2 8 6 4 2 Bit Allocation per Frequency Band 5 5 25 3 SNR (red) and Sound Level Pressure (blue) (db) => SNR per Frequency Band due to Bit Allocation 6 4 - -4 5 5 25 3 Σχήµα 8 Σχήµα 9 (b) Να δώσετε επακριβώς τα περιεχόµενα του πεδίου bit allocation του MPEG- frame για την περίπτωση του ερωτήµατος (a) θεωρώντας ότι για τον προσδιορισµό του bit allocation για κάθε ζώνη συχνοτήτων χρησιµοποιούνται 4 bits. (8 µονάδες) Το πεδίο bit allocation περιγράφει (µε τη χρήση 4 bits) τον αριθµό των bits ανά ζώνη συχνοτήτων που απαιτούνται για την κωδικοποίηση των δειγµάτων. Εποµένως είναι ένα πεδίο 32 x 4 bits = 28 bits. Οι τιµές του είναι: (c) Να υπολογίσετε το βαθµό συµπίεσης που επιτυγχάνεται µε την κωδικοποίηση MPEG-, layer στο συγκεκριµένο πλαίσιο δειγµάτων. Θεωρήστε ότι () δεν υπάρχουν ancillary data, (2) χρησιµοποιείται CRC κώδικας 6 bit για έλεγχο σφαλµάτων µετάδοσης. (3) για την κωδικοποίηση κάθε µη µηδενικού scale factor χρησιµοποιούνται 6 bits. Η σύγκριση να πραγµατοποιηθεί µε την περίπτωση κωδικοποίησης των δειγµάτων κατά PCM, 6 bits/sample. (2 µονάδες) Το µέγεθος του MPEG audio frame θα είναι: 32 bits επικεφαλίδα 6 bits CRC 28 bits πεδίο bit allocation 6 x 22 = 32 bits πεδίο scale factors (22 ζώνες από τις 32 έχουν µη µηδενικό bit allocation) 2 x 8 = 46 bits πεδίο samples. Το πεδίο samples περιλαµβάνει την κωδικοποίηση 2 32άδων από δείγµατα (=384) σύµφωνα µε τον αριθµό των 4 bits ανά ζώνη που υπολογίσθηκε. Μια 32αδα χρειάζεται 8 bits για την αναπαράσταση των δειγµάτων 8 = άθροισµα των bits σε όλες τις ζώνες. Σύνολο bits = 724. H κωδικοποίηση κατά PCM απαιτεί 384 x 6 = 644 bits => Συµπίεση 644/724 =3.56 4
Ενδιάµεση Εξέταση: Οκτώβριος 4 ΠΙΝΑΚΑΣ ΑΠΑΝΤΗΣΕΩΝ Ερώτηση Α Β Γ 2 3 4 5 6 7 8 9 2 3 4 5 6 ΤΥΠΟΛΟΓΙΟ H = n i= ( p( ) p( si ) log2 s i ), ACL = N( si ) p( s i ), V n SNR = log q, 2 Vmax e max = = = e max 2 2 n+ 2 n i= V max V V 5