Ακαδηµαϊκό Έτος , Χειµερινό Εξάµηνο ιδάσκων Καθ.: Νίκος Τσαπατσούλης

Σχετικά έγγραφα
ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ,

Συστήµατα Πολυµέσων Ενδιάµεση Εξέταση: Οκτώβριος 2004

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ. 2 η Γραπτή Εργασία ΠΛΗ 23 Ακαδημαϊκό Έτος (Τόμος Α, Κεφάλαια 1-3) Ημερομηνία Παράδοσης 27/01/2013.

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ, ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ

Ακαδηµαϊκό Έτος , Χειµερινό Εξάµηνο ιδάσκων Καθ.: Νίκος Τσαπατσούλης

Περιεχόµενα. ΕΠΛ 422: Συστήµατα Πολυµέσων. Μέθοδοι συµπίεσης ηχητικών. Βιβλιογραφία. Κωδικοποίηση µε βάση την αντίληψη.

Συµπίεση Ήχου µεβάσητην Αντίληψη: Τα πρότυπα συµπίεσης MPEG-1 layer I, layer II, layer III

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ,

Ακαδηµαϊκό Έτος , Χειµερινό Εξάµηνο ιδάσκων Καθ.: Νίκος Τσαπατσούλης

Ακαδηµαϊκό Έτος , Χειµερινό Εξάµηνο ιδάσκων Καθ.: Νίκος Τσαπατσούλης

Συµπίεση Εικόνας: Το πρότυπο JPEG

Αρχές κωδικοποίησης. Τεχνολογία Πολυµέσων 08-1

ΒΕΣ 04: Συµπίεση και Μετάδοση Πολυµέσων. Περιεχόµενα. Βιβλιογραφία. Συµπίεση εικόνων: Το πρότυπο JPEG. Εισαγωγή. Ευθύς µετασχηµατισµός DCT

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΛΟΠΟΝΝΗΣΟΥ, ΤΜΗΜΑ ΤΕΧΝΟΛΟΓΙΑΣ ΤΗΛΕΠΙΚΟΙΝΩΝΙΩΝ

Περιεχόµενα. ΕΠΛ 422: Συστήµατα Πολυµέσων. Βιβλιογραφία. Εισαγωγή. Συµπίεση εικόνων: Το πρότυπο JPEG. Εισαγωγή. Ευθύς µετασχηµατισµός DCT

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ, ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ

Περιεχόµενα. ΕΠΛ 422: Συστήµατα Πολυµέσων. Γιατί Συµπίεση; Βιβλιογραφία

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ, ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ

Συµπίεση Δεδοµένων: Συµπίεση Ψηφιακού Βίντεο

Συµπίεση Ψηφιακών Εικόνων: Συµπίεση µε Απώλειες. Πρότυπα Συµπίεσης Εικόνων

Αρχές κωδικοποίησης. Τεχνολογία Πολυμέσων και Πολυμεσικές Επικοινωνίες 08-1

Τεράστιες ανάγκες σε αποθηκευτικό χώρο

ΤΕΙ ΚΡΗΤΗΣ ΤΜ. ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡ/ΚΗΣ & ΠΟΛΥΜΕΣΩΝ ΔΙΔΑΣΚΩΝ: Δρ. Γ. ΓΑΡΔΙΚΗΣ. Κωδικοποίηση εικόνας

ITU-T : H.261 (1990), H.262 (1996), H.263 (1995) MPEG-1, MPEG-2, MPEG-4. Αποθήκευση, Μετάδοση, Επικοινωνίες, ίκτυα

Τεχνολογία Πολυμέσων. Ενότητα # 8: Αρχές κωδικοποίησης Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής

Επεξεργασία Χαρτογραφικής Εικόνας

Κωδικοποίηση βίντεο (MPEG)

Συστήµατα και Αλγόριθµοι Πολυµέσων

Ραδιοτηλεοπτικά Συστήματα Ενότητα 4: Ψηφιοποίηση και συμπίεση σημάτων εικόνας

Περιεχόµενα. ΕΠΛ 422: Συστήµατα Πολυµέσων. Βιβλιογραφία. Κατηγορίες τεχνικών συµπίεσης. Τεχνικές Συµπίεσης

Τι συσχετίζεται με τον ήχο

Μετάδοση Πολυμεσικών Υπηρεσιών Ψηφιακή Τηλεόραση

Κωδικοποίηση βίντεο (H.261 / DVI)

Ευρυζωνικά δίκτυα (2) Αγγελική Αλεξίου

Πολυμέσα πάνω από κινητά δίκτυα

Πληροφορική Ι. Μάθημα 9 ο Συμπίεση δεδομένων. Τμήμα Χρηματοοικονομικής & Ελεγκτικής ΤΕΙ Ηπείρου Παράρτημα Πρέβεζας. Δρ.

DIP_06 Συμπίεση εικόνας - JPEG. ΤΕΙ Κρήτης

ΕΙΔΗ ΠΛΑΙΣΙΩΝ Ενδο-πλαισιακή κωδικοποίηση (Intra- frame Coding): Δια-πλαισιακή κωδικοποίηση (Inter-frame Coding):

Ακαδηµαϊκό Έτος , Εαρινό Εξάµηνο ιδάσκων Καθ.: Νίκος Τσαπατσούλης

Συστήματα Πολυμέσων. Ενότητα 2: Εισαγωγικά θέματα Ψηφιοποίησης. Θρασύβουλος Γ. Τσιάτσος Τμήμα Πληροφορικής ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

Πολυμέσα. Συμπίεση δεδομένων Κωδικοποίηση MPEG. Δρ. Γεώργιος Π. Παυλίδης ΔΗΜΟΚΡΙΤΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΡΑΚΗΣ

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Ανώτατο Εκπαιδευτικό Ίδρυμα Πειραιά Τεχνολογικού Τομέα ΕΠΕΞΕΡΓΑΣΙΑ ΕΙΚΟΝΑΣ. Ενότητα 6: Κωδικοποίηση & Συμπίεση Εικόνας

Συστήματα Πολυμέσων. Ενότητα 3: Εισαγωγικά θέματα Συμπίεσης. Θρασύβουλος Γ. Τσιάτσος Τμήμα Πληροφορικής ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

Δ11 Δ12. Συμπίεση Δεδομένων

Ψηφιακή Επεξεργασία Εικόνας

Η κωδικοποίηση των συντελεστών DC

Συστήματα Πολυμέσων. Ενότητα 12: Συμπίεση Ψηφιακού Ήχου. Θρασύβουλος Γ. Τσιάτσος Τμήμα Πληροφορικής ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

Συμπίεση Πολυμεσικών Δεδομένων

Συστήματα Πολυμέσων. Ενότητα 16: Διαμορφώσεις και Πρότυπα Ψηφιακού Βίντεο. Θρασύβουλος Γ. Τσιάτσος Τμήμα Πληροφορικής

19/3/2007 Πολυµέσα και Συµπίεση εδοµένων

Συµπίεση Ψηφιακών Εικόνων:

Συστήματα Πολυμέσων. Ενότητα 15: Συμπίεση Ψηφιακού Βίντεο. Θρασύβουλος Γ. Τσιάτσος Τμήμα Πληροφορικής ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

Θέματα Συστημάτων Πολυμέσων. Ενότητα #3: Ιδιότητες μέσων Διδάσκων: Γεώργιος K. Πολύζος Τμήμα: Μεταπτυχιακό Πρόγραμμα Σπουδών Επιστήμη των Υπολογιστών

Περιεχόµενα. ΕΠΛ 422: Συστήµατα Πολυµέσων. Συµπίεση Βίντεο. Βιβλιογραφία. Αρχές συµπίεσης βίντεο

Συμπίεση Δεδομένων

Πολυμέσα. Συμπίεση δεδομένων Κωδικοποίηση JPEG. Δρ. Γεώργιος Π. Παυλίδης ΔΗΜΟΚΡΙΤΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΡΑΚΗΣ

Ψηφιακή Επεξεργασία και Ανάλυση Εικόνας Ενότητα 6 η : Συμπίεση Εικόνας. Καθ. Κωνσταντίνος Μπερμπερίδης Πολυτεχνική Σχολή Μηχανικών Η/Υ & Πληροφορικής

Εισαγωγή. Λύση: Λύση:

χωρίςναδηµιουργείταιαίσθησηαπώλειαςτηςποιότηταςτηςανακατασκευασµένηςεικόνας.

Κωδικοποίηση ήχου. Κωδικοποίηση καναλιού φωνής Κωδικοποίηση πηγής φωνής Αντιληπτική κωδικοποίηση Κωδικοποίηση ήχου MPEG

Ενότητα 1. Εισαγωγή στις βασικές έννοιες των ικτύων ΗΥ

Συστήµατα και Αλγόριθµοι Πολυµέσων

ΕΣΔ 200: ΔΗΜΙΟΥΡΓΙΑ ΠΕΡΙΕΧΟΜΕΝΟΥ ΙΙ. Ακαδημαϊκό Έτος , Χειμερινό Εξάμηνο Διδάσκων Καθ.: Νίκος Τσαπατσούλης

Ακαδηµαϊκό Έτος , Χειµερινό Εξάµηνο ιδάσκων Καθ.: Νίκος Τσαπατσούλης

Τι συσχετίζεται με τον ήχο

Κωδικοποίηση εικόνων κατά JPEG

Θέμα: «ΣΥΜΠΙΕΣΗ ΔΕΔΟΜΕΝΩΝ ΚΑΙ ΠΟΛΥΜΕΣΑ» Εισηγητής: Παναγιώτης Γιώτης 20 Μαϊου 2007 Αθήνα

Ακαδηµαϊκό Έτος , Εαρινό Εξάµηνο ιδάσκων Καθ.: Νίκος Τσαπατσούλης

Η ανάγκη για συμπίεση

Group (JPEG) το 1992.

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΛΟΠΟΝΝΗΣΟΥ, ΤΜΗΜΑ ΤΕΧΝΟΛΟΓΙΑΣ ΤΗΛΕΠΙΚΟΙΝΩΝΙΩΝ

Μάθημα 7 ο. Συμπίεση Εικόνας ΤΜΗΥΠ / ΕΕΣΤ 1

Ραδιοτηλεοπτικά Συστήματα Ενότητα 5: Ψηφιοποίηση και συμπίεση σημάτων ήχου

Συµπίεση δεδοµένων: Εισαγωγή, Κατηγορίες τεχνικών συµπίεσης, Ανάλυση βασικών τεχνικών συµπίεσης

ΒΕΣ 04: Συµπίεση και Μετάδοση Πολυµέσων

ΒΕΣ 04: Συµπίεση και Μετάδοση Πολυµέσων. Περιεχόµενα. Βιβλιογραφία. Εικόνες και Πολυµεσικές Εφαρµογές. Ψηφιακή Επεξεργασία Εικόνας.

Συστήματα Πολυμέσων. Ενότητα 7: Συμπίεση Εικόνας κατά JPEG. Θρασύβουλος Γ. Τσιάτσος Τμήμα Πληροφορικής ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

Ακαδημαϊκό Έτος , Χειμερινό Εξάμηνο

Ψηφιακό Βίντεο. ΕΣ 200: ημιουργία Περιεχομένου ΙΙ. Περιεχόμενα - Βιβλιογραφία. Περιεχόμενα. Βιβλιογραφία. Βασικές έννοιες

Εφαρµογές Προσαρµοστικών Συστηµάτων: Καταστολή ηχούς, Ισοστάθµιση καναλιού και ανίχνευση συµβόλων

Ψηφιακή Επεξεργασία Σηµμάτων

ΙΚΤΥΑ ΕΠΙΚΟΙΝΩΝΙΩΝ. Ιωάννης Σταυρακάκης, Καθηγητής Password: edi

Κωδικοποίηση βίντεο (MPEG)

Ακαδηµαϊκό Έτος , Χειµερινό Εξάµηνο ιδάσκων Καθ.: Νίκος Τσαπατσούλης

ιαφορική εντροπία Σεραφείµ Καραµπογιάς

Τεχνολογία Πολυμέσων. Ενότητα # 11: Κωδικοποίηση εικόνων: JPEG Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής

3. ΤΕΧΝΙΚΕΣ ΣΥΜΠΙΕΣΗΣ ΠΟΛΥΜΕΣΩΝ

Γιώργος Τζιρίτας Τµήµα Επιστήµης Υπολογιστών

Διαδικασία Ψηφιοποίησης (1/2)

ΘΕΩΡΙΑ ΠΛΗΡΟΦΟΡΙΑΣ. Κεφάλαιο 3 : Πηγές Πληροφορίας Χρήστος Ξενάκης. Πανεπιστήμιο Πειραιώς, Τμήμα Ψηφιακών Συστημάτων

Ψηφιακή Αναπαράσταση Σήματος: Δειγματοληψία, Κβαντισμός και Κωδικοποίηση

Λύση: Λύση: Λύση: Λύση:

Τεχνολογία Πολυμέσων. Ενότητα # 10: Κωδικοποίηση ήχου Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής

Τεχνολογία Πολυμέσων. Ενότητα # 12: Κωδικοποίηση βίντεο: H.26x Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής

ίκτυα Πρόσβασης Ευρείας Ζώνης

Ακαδημαϊκό Έτος , Χειμερινό Εξάμηνο

ΤΕΙ Κρήτης, Παράρτηµα Χανίων

Περιεχόµενα ΕΠΛ 422: στα Συστήµατα Πολυµέσων. Βιβλιογραφία. ειγµατοληψία. ηµιουργία ψηφιακής µορφής πληροφορίας στα Συστήµατα Πολυµέσων

ΒΕΣ 04: Συµπίεση και Μετάδοση Πολυµέσων

ΙΚΤΥΑ ΕΠΙΚΟΙΝΩΝΙΩΝ Ασκήσεις για το φυσικό στρώμα. λ από τον ρυθμό μετάδοσής της. Υποθέτοντας ότι ο κόμβος A

Transcript:

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΛΟΠΟΝΝΗΣΟΥ, ΤΜΗΜΑ ΤΕΧΝΟΛΟΓΙΑΣ ΤΗΛΕΠΙΚΟΙΝΩΝΙΩΝ ΒΕΣ 04: ΣΥΜΠΙΕΣΗ ΚΑΙ ΜΕΤΑ ΟΣΗ ΠΟΛΥΜΕΣΩΝ Ακαδηµαϊκό Έτος 2005 2006, Χειµερινό Εξάµηνο Καθ.: Νίκος Τσαπατσούλης ΤΕΛΙΚΗ ΕΞΕΤΑΣΗ Η εξέταση αποτελείται από δύο µέρη. Το πρώτο περιλαµβάνει 36 ερωτήσεις πολλαπλής επιλογής και βαθµολογείται µε 45 µονάδες. Κάθε ερώτηση έχει µόνο µία ορθή απάντηση και οι ορθές απαντήσεις πρέπει να µεταφερθούν στον πίνακα που σας δίνεται στην τελευταία σελίδα. Το δεύτερο µέρος περιλαµβάνει πέντε ασκήσεις / θεωρητικές ερωτήσεις, από τις οποίες πρέπει να απαντήσετε δύο, και βαθµολογείται µε 55 µονάδες. ΠΡΟΣΟΧΗ: Σε περίπτωση απάντησης περισσότερων από δύο ασκήσεων θα ληφθούν υπόψη οι δύο µε τη χειρότερη βαθµολογία. ΙΑΡΚΕΙΑ ΕΞΕΤΑΣΗΣ: 2 ΩΡΕΣ ΚΑΛΗ ΕΠΙΤΥΧΙΑ! ΟΝΟΜΑΤΕΠΩΝΥΜΟ: ΑΡΙΘΜΟΣ ΦΟΙΤΗΤΙΚΗΣ ΤΑΥΤΟΤΗΤΑΣ:... ΕΞΑΜΗΝΟ: ΜΕΡΟΣ Α ΒΑΘΜΟΛΟΓΙΑ ΜΕΡΟΣ Β ΣΥΝΟΛΟ

2

ΜΕΡΟΣ Β: ΑΣΚΗΣΕΙΣ Άσκηση (25 µονάδες): Για την εικόνα f: (a) Υπολογίστε τον ελάχιστο αριθµό bits/pixel που απαιτούνται για τη κωδικοποίηση της µε σταθερό µήκος κωδικών λέξεων (codewords) ( µονάδα) Η συγκεκριµένη εικόνα παίρνει ακέραιες τιµές στο διάστηµα [0 7]. Έχουµε εποµένως 8 διαφορετικές τιµές. Ζητάµε N (ακέραιο) τ.ω. 2 Ν 8. Εποµένως Ν=3 bits/pixel (b) Υπολογίστε και σχεδιάστε το κανονικοποιηµένο ιστόγραµµα Εικόνα f 3 2 0 0 2 3 5 5 3 2 2 3 5 5 6 5 5 4 4 5 5 6 7 6 6 6 6 6 6 7 7 7 6 6 6 6 7 7 7 7 7 6 6 6 7 7 7 7 7 7 6 7 7 7 7 7 7 7 7 7 7 7 της (3 µονάδες) (c) Υπολογίστε την εντροπία της (2 µονάδες) H = n i= ( p( s ) log p( )=2.377 bits/pixel i 2 s i ) (d) Υπολογίστε τις κωδικές λέξεις Huffman (4 µονάδες) Οι κωδικές λέξεις Huffman είναι (σηµειώνεται ότι η λύση δεν είναι µοναδική): 0 => 00, => 0, 2 => 0, 3 => 00, 4 => 00, 5 =>, 6 =>0, 7 => 0 Το δένδρο Huffman φαίνεται στο επόµενο σχήµα. 3

(e) Υπολογίσετε το µέσο µέγεθος λέξης κατά Huffman (2 µονάδες) ACL = n i= N( s ) p( ) =2.4375 bits/pixel i s i (f) Με βάση τα αποτελέσµατα των ερωτηµάτων (a) και (e) υπολογίστε τη συµπίεση που επιτυγχάνεται µε την τεχνική Huffman (4 µονάδες) CR=3/2.4375 =.2308 (g) Υπολογίστε την εικόνα e διαφοράς πρόβλεψης εφαρµόζοντας προβλεπτική κωδικοποίηση µε βάση µόνο το προηγούµενο δείγµα, δηλαδή ~ f ( x, y) = f ( x, y ) (το x αναφέρεται στις γραµµές της εικόνας και το y στις στήλες - θεωρήστε ότι ~ f (, ) = f (, ) και ότι η εικόνα σαρώνεται γραµµή προς γραµµή) (3 µονάδες) Εικόνα e 3 - - - 0 2 0-2 - 0 2 0-0 - 0 0 4

- 0 0 0 0 0 0 0-0 0 0 0 0 0 0-0 0 0 0 0 0 0-0 0 0 0 0 0 0 0 0 0 5

(h) Υπολογίστε και σχεδιάστε το κανονικοποιηµένο ιστόγραµµα της εικόνας e (3 µονάδες) (i) Υπολογίστε την εντροπία της εικόνας e και συγκρίνετε την µε το αποτέλεσµα του ερωτήµατος (c). Τι συµπεραίνεται σχετικά µε τη κωδικοποίηση της εικόνας µε τεχνικές κωδικοποίησης εντροπίας; - (6 µονάδες) H = n i= ( p( s ) log p( )=.666 bits/pixel i 2 s i ) Είναι φανερό ότι η εικόνα των διαφορών µπορεί να συµπιεστεί καλύτερα µε τεχνικές κωδικοποίησης εντροπίας δεδοµένης της µορφής του ιστογράµµατος της αλλά και του γεγονότος ότι η εντροπία της είναι αρκετά χαµηλότερη από αυτήν της αρχικής εικόνας (.666 έναντι 2.377). ------------------------------------------------------------------------------------------------------------------------------------------ 6

Άσκηση 2 (30 µονάδες): Στο Σχήµα 9 δίνονται τα ελάχιστα επίπεδα ακουστικής ικανότητας των ανθρώπων ανά ζώνη συχνοτήτων εύρους 500 Hz. Στο Σχήµα 0 δίνεται η φασµατική κάλυψη για ένα πλαίσιο 52 (36x32) δειγµάτων ενός ηχητικού σήµατος δειγµατοληπτηµένου στα 32000 δείγµατα ανά δευτερόλεπτο ενώ στο Σχήµα δίνεται το φάσµα συχνοτήτων του εν λόγω σήµατος (εκτιµηµένο µε βάση τα 52 δείγµατα). 45 Minimum Sound Pressure Levels audible by Humans 30 Spectral Masking per Frequency Band Sound Level Pressure (db) => 40 35 30 25 20 5 0 5 Sound Level Pressure (db) => 25 20 5 0 5 0 0 5 0 5 20 25 30 Frequency Band => 0 0 5 0 5 20 25 30 Frequency Band => Σχήµα 9 Σχήµα 0 80 Frequency Spectrum of Input Signal 70 Sound Level Pressure (db) => 60 50 40 30 20 0 0 0 5 0 5 20 25 30 Frequency Band => Σχήµα (a) Να υπολογίσετε προσεγγιστικά το bit allocation per frequency band µε βάση τη λογική της κωδικοποίησης MPEG-, layer ΙΙ. (0 µονάδες) 7

Το συνολικό φαινόµενο κάλυψης (ακουστική ικανότητα ανθρώπου + φασµατική κάλυψη) δίνεται στο Σχήµα.. Η διαφορά του φάσµατος ισχύος του σήµατος εισόδου (όπως έχει εκτιµηθεί από τα 52 δείγµατα) µε το φαινόµενο κάλυψης δίνεται στο Σχήµα.2. Ο αριθµός των bits ανά ζώνη συχνοτήτων (υπενθυµίζεται ότι κάθε bit προσθέτει περίπου 6 db σηµατοθορυβικού λόγου) δίνεται στο Σχήµα.3. Τέλος στο Σχήµα.4 δίνεται ο σηµατοθορυβικός λόγος που επιτυγχάνεται µε το προηγούµενο bit allocation ανά ζώνη συχνοτήτων (κόκκινες µπάρες) σε σχέση µε τα αντιληπτά επίπεδα έντασης του σήµατος (µπλε µπάρες). Sound Level Pressure (db) => 50 45 40 35 30 25 20 5 0 5 Overall Masking 0 0 5 0 5 20 25 30 Frequency Band => Sound Level Pressure (db) => Difference between Power Spectrum and Overall Masking 70 60 50 40 30 20 0 0-0 -20-30 -40 0 5 0 5 20 25 30 Frequency Band => Σχήµα. Σχήµα.2 Number of Bits => 2 0 8 6 4 2 Bit Allocation per Frequency Band 0 0 5 0 5 20 25 30 Frequency Band => SNR (red) and Sound Level Pressure (blue) (db) => SNR per Frequency Band due to Bit Allocation 60 40 20 0-20 -40 0 5 0 5 20 25 30 Frequency Band => Σχήµα.3 Σχήµα.4 (b) Να δώσετε επακριβώς τα περιεχόµενα του πεδίου bit allocation του MPEG- frame για την περίπτωση του ερωτήµατος (a) θεωρώντας ότι για τον προσδιορισµό του bit allocation για κάθε ζώνη συχνοτήτων χρησιµοποιούνται 4 bits. (8 µονάδες) 8

Το πεδίο bit allocation περιγράφει (µε τη χρήση 4 bits) τον αριθµό των bits ανά ζώνη συχνοτήτων που απαιτούνται για την κωδικοποίηση των δειγµάτων. Εποµένως είναι ένα πεδίο 32 x 4 bits = 28 bits. Οι τιµές του είναι: 0000 0000 000 00 000 00 00 00 00 00 0 000 00 000 00 00 00 00 00 00 00 000 000 000 0000 0000 0000 0000 0000 0000 0000 0000 (c) Να υπολογίσετε το βαθµό συµπίεσης που επιτυγχάνεται µε την κωδικοποίηση MPEG-, layer ΙΙ στο συγκεκριµένο πλαίσιο δειγµάτων. Θεωρήστε ότι () δεν υπάρχουν ancillary data, (2) χρησιµοποιείται CRC κώδικας 6 bits για έλεγχο σφαλµάτων µετάδοσης, (3) για την κωδικοποίηση κάθε µη µηδενικού scale factor χρησιµοποιούνται 6 bits. Η σύγκριση να πραγµατοποιηθεί µε την περίπτωση κωδικοποίησης των δειγµάτων κατά PCM, 6 bits/sample. (2 µονάδες) Το µέγεθος του MPEG audio frame θα είναι: 32 bits επικεφαλίδα 6 bits CRC 28 bits πεδίο bit allocation 6 x 22 = 32 bits πεδίο scale factors (22 ζώνες από τις 32 έχουν µη µηδενικό bit allocation) 36 x 8 = 4248 bits πεδίο samples. Το πεδίο samples περιλαµβάνει την κωδικοποίηση 36 32άδων από δείγµατα (=52) σύµφωνα µε τον αριθµό των 4 bits ανά ζώνη που υπολογίσθηκε. Μια 32αδα χρειάζεται 8 bits για την αναπαράσταση των δειγµάτων 8 = άθροισµα των bits σε όλες τις ζώνες. Σύνολο bits = 724. H κωδικοποίηση κατά PCM απαιτεί 52 x 6 = 8432 bits => Συµπίεση 8432/4556 =4.046 ------------------------------------------------------------------------------------------------------------------------------------------ Άσκηση 3 (25 µονάδες): A. Μια εικόνα GIF, µεγέθους 288 γραµµές x 360 στήλες, µεταδίδεται σε interlaced mode. Να υπολογίσετε τον αριθµό των bytes που πρέπει να αποθηκεύσει ο δέκτης ώστε να µπορέσει να προβάλει την πρώτη εκδοχή της εικόνας (4 µονάδες). Για τη πρώτη εκδοχή της εικόνας χρειάζεται να προβληθούν η πρώτη και ανά 8 γραµµές της εικόνας. Εποµένως χρειάζεται να αποθηκευτούν 288/8 =36 γραµµές της εικόνας. Άρα χρειάζεται να αποθηκευτούν 36*360 τιµές pixel. Με δεδοµένο ότι οι εικόνες GIF χρησιµοποιούν παλέτα 256 χρωµάτων χρησιµοποιείται ένα byte ανά pixel άρα τελικά χρειάζεται να αποθηκευτούν 36*360*=2960 bytes. B. Για κάθε ένα από τα πρότυπα συµπίεσης H26, H263, MPEG-, MPEG-2 να δώσετε τη κυρίαρχη εφαρµογή τους (για ποια εφαρµογή κατά κύριο λόγο αναπτύχθηκαν) - 4 µονάδες. 9

Η26 => Βιντεοτηλεφωνία (Βίντεο µέσω γραµµών ISDN) Η263 => Τηλεδιάσκεψη µέσω ιαδικτύου (Video over IP) MPEG- => ιανοµή Βίντεο µέσω CD-ROM (VCD), Αποθήκευση κασετών VHS σε ψηφιακή µορφή MPEG-2 => ιανοµή Βίντεο µέσω DVD-ROM, Ψηφιακή αναµετάδοση Βίντεο (π.χ. Nova). Γ. Μια ερασιτεχνική ψηφιακή βιντεοκάµερα καταγράφει σε DV format (πρότυπο SIF: χρωµατική δειγµατοληψία 4::, frame size 288 γραµµές x 360 στήλες, 25 frames/sec, non-interlaced). Το σήµα βίντεο συµπιέζεται σύµφωνα µε το πρότυπο MPEG-. Το συµπιεσµένο σήµα απoτελείται από ακολουθίες frames της µορφής ΙΒΒPΒΒPBBPBB ΙΒΒPΒΒPBBPBBIBBP.. (a) Να υπολογίσετε το µέγεθος του GoP (Group of Pictures) και την εµβέλεια πρόβλεψης (Prediction Span) (2 µονάδες). Μέγεθος GoP = Απόσταση από Ι σε Ι frame (συµπεριλαµβανόµενου του πρώτου) = 2 Prediction Span = Απόσταση από Ι (ή P) στο πλησιέστερο Ι (ή P) (συµπεριλαµβανόµενου του πρώτου frame) = 3 (b) Να υπολογίσετε το συνολικό µέσο βαθµό συµπίεσης αν κάθε Ι frame συµπιέζεται µε µέσο βαθµό συµπίεσης 0:, κάθε P frame συµπιέζεται µε µέσο βαθµό συµπίεσης 20: και κάθε P frame συµπιέζεται µε µέσο βαθµό συµπίεσης 50: (5 µονάδες). Με δεδοµένο ότι το συµπιεσµένο βίντεο αποτελείται από GoP της µορφής ΙΒΒPΒΒPBBPBB είναι φανερό ότι το /2 των frames κωδικοποιούνται ως I frames, τα 3/2 κωδικοποιούνται ως Ρ frames και τα 8/2 κωδικοποιούνται ως Β frames. Εποµένως κάθε frame (κατά µέσο όρο) συµπιέζεται στο (/2)*0.+(3/2)*0.05+(8/2)*0.02 = 0.0342 του µεγέθους του ασυµπίεστου frame, άρα βαθµός συµπίεσης /0.0342 = 29.27: (c) Να υπολογίσετε το bit rate του συµπιεσµένου σήµατος (4 µονάδες). 0

Το bit rate του ασυµπίεστου βίντεο είναι: (288x360+2*44*80) pixels / frame *8 bits /pixel *25 frame / sec = 3.04 Mbps. Οπότε εφόσον έχουµε µέσο λόγο συµπίεσης 29.27: θα έχουµε bit rate για το συµπιεσµένο σήµα 3.04 Mbps/29.27 =.063 Mbps (d) Να δώσετε ένα παράδειγµα στο οποίο να αιτιολογείται η αµφίδροµη εκτίµηση κίνησης (εκτίµηση κίνησης από το προηγούµενο P ή Ι frame αλλά και από το επόµενο P ή Ι frame) η οποία χρησιµοποιείται στα B frames (3 µονάδες). Εισαγωγή ενός νέου αντικειµένου στη σκηνή. Η αντιστάθµιση κίνησης µε βάση το προηγούµενο frame θα αποτύχει (δεν υπάρχει το αντικείµενο στη σκηνή) ενώ αντιστάθµιση κίνησης µε βάση το επόµενο frame θα µας δώσει µια πολύ καλή πρόβλεψη. (e) Να υπολογίσετε το bit rate του συµπιεσµένου σήµατος αν αντί για MPEG- χρησιµοποιούσαµε το πρότυπο MJPEG (όλες τα frame κωδικοποιούνται ως I frames) (3 µονάδες). Στο MJPEG όλα τα frames κωδικοποιούνται ως I frames. Εποµένως το συµπιεσµένο και MJPEG σήµα έχει bit rate 3.04 Mbps/0 = 3. Mbps ------------------------------------------------------------------------------------------------------------------------------------------

Άσκηση 4 (25 µονάδες): Παρακάτω δίνεται το διάγραµµα ενός JPEG encoder. Να εξηγήσετε συνοπτικά αλλά τεκµηριωµένα: (a) Γιατί πριν την εφαρµογή του µετασχηµατισµού DCT (DCT) σε κάθε block 8x8 αφαιρείται το 28 από όλες τις τιµές του block (3 µονάδες). Ο συντελεστής DC είναι ανάλογος του µέσου χρώµατος του block. Με δεδοµένο ότι οι τιµές στα pixel των block κυµαίνονται από 0-255, η αναµενόµενη µέση τιµή χρώµατος για ένα τυχαίο block είναι 28. Επειδή οι συντελεστές DC κωδικοποιούνται µε διαφορική κωδικοποίηση επιθυµούµε να έχουν όσο το δυνατό µικρότερες τιµές. Εποµένως αφαιρώντας την τιµή 28 από όλες τις τιµές του block η αναµενόµενη µέση τιµή για ένα τυχαίο block είναι 0 και κατά αντιστοιχία η αναµενόµενη τιµή για το DC συντελεστή θα είναι και αυτή 0. (b) Γιατί εφαρµόζουµε ιαφορική Κωδικοποίηση (DPCM) στους DC συντελεστές (γειτονικών block) (3 µονάδες). Επειδή είναι πολύ πιθανό γειτονικά block να έχουν το ίδιο µέσο χρώµα και εποµένως τον ίδιο DC συντελεστή. Εφαρµόζοντας διαφορική κωδικοποίηση µπορούµε να κωδικοποιήσουµε τη διαφορά των DC συντελεστών µε λιγότερα bits από όσα θα χρειαζόµασταν για την κωδικοποίηση των ίδιων των συντελεστών (c) Γιατί εφαρµόζουµε Κωδικοποίηση Μήκους ιαδροµής (Run Length Encoding -RLC) στους AC συντελεστές (εντός του block) (3 µονάδες) Μετά τον κβαντισµό των συντελεστών ενός block δηµιουργούνται πολλά µηδενικά, εποµένως η κωδικοποίηση µήκους διαδροµής (µε σάρωση των κβαντισµένων συντελεστών κατά zig-zag) είναι µια κατάλληλη τεχνική για να επιτύχουµε συµπίεση (µεγάλες ακολουθίες από µηδενικά). Σχήµα 2 2

(d) Στη συνέχεια δίνεται ο πίνακας των συντελεστών DCT ενός block 8x8 µιας εικόνας καθώς και ένας συχνά χρησιµοποιούµενος πίνακας κβαντισµού Q. Να υπολογίσετε τις (ακέραιες) τιµές των συντελεστών DCT µετά τον κβαντισµό (3 µονάδες). DCT συντελεστές 34 0 3 - - 0 0-38 0 9 0-0 0-8 0 2 0-0 0 - -9 0 2 - - 0-0 -3 0-2 2-0 0-2 0-2 0 2 3 - -3 0-0 0 2-2 0 0 0 0 0 - - Πίνακας Κβαντισµού Q 0 0 5 20 25 30 35 40 0 5 20 25 30 35 40 50 5 20 25 30 35 40 50 60 20 25 30 35 40 50 60 70 25 30 35 40 50 60 70 80 30 35 40 50 60 70 80 90 35 40 50 60 70 80 90 00 40 50 60 70 80 90 00 0 Πίνακας Κβαντισµένων Συντελεστών DCT 3 0 0 0 0 0 0-4 0 0 0 0 0 0 0-0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 (e) Να εφαρµόσετε κωδικοποίηση µήκους διαδροµής (της µορφής σύµβολο! αριθµός επαναλήψεων όπου απαιτείται) µε zigzag scanning στο αποτέλεσµα του ερωτήµατος (d). Σηµειώνεται ότι το τελευταίο block µηδενικών κωδικοποιείται µε ένα χαρακτήρα & (ΕΟΒ End Of Block) (5 µονάδες). 3 0-4 - 0 & (f) Υπολογίστε το βαθµό συµπίεσης που επιτυγχάνεται στο συγκεκριµένο block µε συνδυασµό κωδικοποίησης µετασχηµατισµού και µήκους διαδροµής (4 µονάδες). Για τη κωδικοποίηση της παραπάνω ακολουθίας συµβόλων χρειαζόµαστε 7 bytes. Για τη κωδικοποίηση ενός µπλοκ του 8x8 της εικόνας χρειαζόµαστε 64 bytes => CR =64/7 = 9.43 3

(g) Πως θα µπορούσαµε να αυξήσουµε τη συµπίεση τροποποιώντας τον πίνακα κβαντισµού και τι συνέπειες θα είχε αυτό (4 µονάδες) Μπορούµε να πολλαπλασιάσουµε τον πίνακα κβαντισµού µε µια σταθερά c>. Με αυτό το ακόµη περισσότεροι κβαντισµένοι θα έχουν τιµή µηδέν, άρα µεγαλύτερες ακολουθίες από µηδενικά άρα αποδοτικότερη συµπίεση. Φυσικά αυτό έχει κόστος ως προς την πιστότητα της αποκωδικοποιηµένης εικόνας σε σχέση µε την αρχική (αύξηση του πίνακα κβαντισµού = αύξηση συµπίεσης = µείωση ποιότητας αποκωδικοποιηµένης εικόνας) ------------------------------------------------------------------------------------------------------------------------------------------ Άσκηση 5 (30 µονάδες): ύο χρήστες στους σταθµούς εργασίας Α και Β επιθυµούν να έχουν βιντεοδιάσκεψη διαµέσου του δικτύου κορµού (backbone network) του σχήµατος. Το δίκτυο είναι packet switched connection oriented (µεταγωγή πακέτου µε χρήση εικονικών κυκλωµάτων - virtual circuits) και αποτελείται από 8 κόµβους µεταγωγής (PSE - Packet Switched Exchange) οι οποίοι είναι συνδεδεµένοι µέσω 2 γραµµών επικοινωνίας (links). Τα χαρακτηριστικά των κόµβων µεταγωγής αλλά και των γραµµών περιγράφονται στους πίνακες που ακολουθούν: PSE no Mean Store and Forward Delay - d m (ms) Maximum Store and Forward Delay - d max (ms) Jitter - J(ms) 20 35 5 2 5 28 4 3 22 40 6 4 5 32 5 5 2 22 3 6 25 47 7 7 8 34 5 8 20 33 4 link no Bit Rate - BR (kbps) Bit Error Rate - BER (probability) Length - l(km) 0 000 0-5 50 2 34 000 0.25x0-4 420 3 024 0-6 2 4 34 000 0.25x0-4 250 5 34 000 0.25x0-4 300 6 0 000 0-5 50 7 34 000 0.25x0-4 360 8 0 000 0-5 25 9 2048 0.5x0-5 40 0 2048 0.5x0-5 45 2048 0.5x0-5 30 2 2048 0.5x0-5 25 3 0 000 0-5 40 4 024 0-6 20 0 52 0-5 2 5 256 0-5 3 4

Σχήµα 3 Το δίκτυο του παραπάνω σχήµατος είναι ένα δίκτυο βέλτιστης προσπάθειας µη αξιόπιστων υπηρεσιών (best effort unreliable services) και οι χρήστες A και Β επικοινωνούν µέσω της διαδροµής Α<=>PSE<=> PSE4<=>PSE6<=>PSE8<=>B. O χρόνος εγκατάστασης του εικονικού κυκλώµατος (virtual circuit) είναι Τ vc = 5ms/κόµβο, η ταχύτητα µετάδοσης Ηλεκτροµαγνητικών Κυµάτων στις γραµµές του δικτύου είναι u = 2x0 8 m/s, o χρόνος πακεταρίσµατος για εφαρµογές βιντεοδιάσκεψης είναι Τ p = 2ms ενώ ο χρόνος διαπραγµάτευσης για τις ίδιες εφαρµογές είναι N VC =50ms. Με βάση τα παραπάνω να υπολογιστούν: (a) Οι παράµετροι ποιότητας υπηρεσιών δικτύου (Network Quality of Services NQoS): Το µέγιστο µέγεθος πακέτου δεδοµένων L max αν η µέγιστη επιτρεπτή πιθανότητα απόρριψης πακέτων είναι P b-max =0-2. (5 µονάδες) Αν S είναι το σύνολο των links που απαρτίζουν τη διαδροµή από τον Α στο Β η µέγιστη πιθανότητα σφάλµατος µετάδοσης σε αυτή τη διαδροµή δίνεται από τη σχέση BER = max{ BER( i)} και είναι ίση µε: BERmax = 0.25x0-4. max i S Για πακέτο µε L bits η πιθανότητα απόρριψης του p b (περιέχει ένα σφάλµα σε κάποιο bit) δίνεται από τη σχέση: b L p = ( BER ). Ζητώντας p b 0-2 θα έχουµε max L max =402 bits. log0 L log0 { pb} { } BERmax = 402 bits άρα Ο µέσος χρόνος καθυστέρησης µετάδοσης πακέτων MPTD (Mean Packet Transfer Delay). (2 µονάδες) Ο µέσος χρόνος καθυστέρησης µετάδοσης πακέτων MPTD είναι το άθροισµα των µέσων χρόνων καθυστέρησης στους κόµβους, εξαιτίας της διαδικασίας store and forward, για όλη τη διαδροµή από τον Α στον B. Άρα MPTD = d m ( i) = 80ms, i K όπου Κ είναι το σύνολο των κόµβων που συναντώνται κατά τη διαδροµή S. 5

Ο µέσος ρυθµός µετάδοσης πακέτων MPTR (Mean Packet Transfer Rate) αν υιοθετηθεί το µέγιστο µέγεθος πακέτου (L= L max ). (4 µονάδες) Για να υπολογίσουµε το MPTR χρειαζόµαστε το χρόνο µετάδοσης του πακέτου. Άρα L MPTR = όπου t transfer =, BR = min{ BR( i)} = 256 kbps (link 0), ttransfer=.57 t transfer ms, και τελικά MPTR = 637.94 packets/sec BR min min i S Ο µέσος ρυθµός απόρριψης πακέτων MPER (Mean Packet Error Rate) αν υιοθετηθεί µέγεθος πακέτου L= 360 bits. (3 µονάδες) Ο µέσος ρυθµός απόρριψης πακέτων MPER ισούται πρακτικά µε την πιθανότητα απόρριψης του p b (περιέχει ένα σφάλµα σε κάποιο bit): L MPER = ( BER ) = 9x0-3 (απορρίπτονται 9 πακέτα στα 000 που µεταδίδονται). max Η χείριστη διακύµανση καθυστέρησης µετάδοσης πακέτων WCJ (Worst Case Jitter). ( µονάδa) Η χείριστη διακύµανση καθυστέρησης µετάδοσης πακέτων WCJ είναι η µέγιστη διακύµανση καθυστέρησης στους κόµβους, εξαιτίας της διαδικασίας store and forward, για όλη τη διαδροµή από τον Α στον B. Άρα WCJ = max{ J ( i) } = 7 ms, i K όπου Κ είναι το σύνολο των κόµβων που συναντώνται κατά τη διαδροµή S. H συνολική καθυστέρηση µετάδοσης (Transmission Delay) T D-total. (4 µονάδες) Η συνολική καθυστέρηση µετάδοσης είναι ίση µε το άθροισµα της µέσης καθυστέρησης µετάδοσης πακέτων MPTD, της καθυστέρησης πακεταρίσµατος T p στα δύο άκρα Α και Β της σύνδεσης, και της καθυστέρησης µετάδοσης του Η/Μ σήµατος T ΗΜ στη διαδροµή. LTOTAL Άρα t TOTAL = MPTD + Tp + THM, thm = u, L TOTAL = l( i) =342 km, t HM =.7 ms, t TOTAL = 80 + 2 +.7 = 83.7ms i S (b) Οι παράµετροι ποιότητας υπηρεσιών εφαρµογής (Application Quality of Services AQoS) εφόσον το ζητούµενο (εγγυηµένο) από την εφαρµογή εύρος ζώνης είναι BR req = 28 kbps: H µέγιστη καθυστέρηση έναρξης της εφαρµογής (Startup Delay) SD max. ( µονάδα) Η µέγιστη καθυστέρηση έναρξης της εφαρµογής καθορίζεται από το χρόνο εγκατάστασης του εικονικού κυκλώµατος + το χρόνο διαπραγµάτευσης ανάµεσα σε καλούντα και καλούµενο. Με βάση τα παραπάνω έχουµε SD max = N d Tvc + N vc = 70 ms, όπου N d είναι ο αριθµός των κόµβων που συναντώνται κατά τη διαδροµή S. 6

Το ελάχιστο µέγεθος του buffer B min για αντιστάθµιση της διακύµανσης καθυστέρησης στην άφιξη των πακέτων (jitter) (θεωρήστε µέγεθος πακέτου L= 360 bits). (6 µονάδες) Στον buffer αποθηκεύονται τόσα πακέτα ώστε να υπάρχει πληροφορία για την εκτέλεση της εφαρµογής για χρόνο µεγαλύτερο από το WCJ (worst case jitter). Εποµένως πρέπει να ισχύει Bmin = N p min L, όπου Npmin είναι ο ελάχιστος αριθµός των πακέτων που αποθηκεύονται στον buffer ώστε να ισχύει N p min BR req L > WCJ. Από τα δεδοµένα της άσκησης προκύπτει N pmin = 3 και εποµένως ισχύει B min = 080 bits. Σηµειώνεται ότι για να µπορούν να εφαρµοστούν τα παραπάνω πρέπει να ισχύει BR req < BR min (το οποίο ισχύει στην περίπτωση της άσκησης). Επιπλέον στην πράξη χρησιµοποιείται µέγεθος buffer αρκετά µεγαλύτερο από το ελάχιστο (Β =2*B min ) H µέγιστη από άκρο σε άκρο καθυστέρηση (End-to-end Delay) EED max. Θεωρείστε µέγεθος buffer B = 2*B min (4 µονάδες) H µέγιστη από άκρο σε άκρο καθυστέρηση συντίθεται από τη συνολική καθυστέρηση µετάδοσης και το χρόνο που αντιστοιχεί στην αποθήκευση στο buffer T B. Άρα B EED max = t TOTAL + T B, όπου T B = =6.875 ms. BR req Εποµένως EEDmax=83.7+6.875 = 00.575 ms ΤΥΠΟΛΟΓΙΟ H = n i= ( p( ) p( s ) log, ACL = N( s ) p( ), i 2 s i ) n i= i s i Vmax Vmin D V = max 20 log 0 Vmin, V = min n SNR min 20log q 2 max 0, V V emax e max = = = 2 2 n+ 2 min V V max min n 2 Vmax V q V e min max = = = 2 2 n+ 2 = min SNR min 20log 0 emax 7

ΠΙΝΑΚΑΣ ΑΠΑΝΤΗΣΕΩΝ GROUP A Ερώτηση Α Β Γ 2 3 4 5 6 7 8 9 0 2 3 4 5 6 7 8 9 20 2 22 23 24 25 26 27 28 29 30 3 32 33 34 35 36 GROUP B Ερώτηση Α Β Γ 2 3 4 5 6 7 8 9 0 2 3 4 5 6 7 8 9 20 2 22 23 24 25 26 27 28 29 30 3 32 33 34 35 36 8