Συμπίεση Δεδομένων

Σχετικά έγγραφα
Θεωρία Πληροφορίας. Διάλεξη 4: Διακριτή πηγή πληροφορίας χωρίς μνήμη. Δρ. Μιχάλης Παρασκευάς Επίκουρος Καθηγητής

ΘΕΩΡΙΑ ΠΛΗΡΟΦΟΡΙΑΣ. Κεφάλαιο 3 : Πηγές Πληροφορίας Χρήστος Ξενάκης. Πανεπιστήμιο Πειραιώς, Τμήμα Ψηφιακών Συστημάτων

Χρήστος Ξενάκης. Πανεπιστήμιο Πειραιώς, Τμήμα Ψηφιακών Συστημάτων

Τηλεπικοινωνιακά Συστήματα ΙΙ

Δομές Δεδομένων και Αλγόριθμοι

Επεξεργασία Πολυµέσων. Δρ. Μαρία Κοζύρη Π.Μ.Σ. «Εφαρµοσµένη Πληροφορική» Τµήµα Ηλεκτρολόγων Μηχανικών & Μηχανικών Υπολογιστών Πανεπιστήµιο Θεσσαλίας

( ) log 2 = E. Σεραφείµ Καραµπογιάς

Συμπίεση χωρίς Απώλειες

Συμπίεση Δεδομένων

Θεώρημα κωδικοποίησης πηγής

Θέματα Συστημάτων Πολυμέσων

ΕΑΠ/ΠΛΗ22/ΑΘΗ-4. 3 η ΟΣΣ

Αριθμητική Κωδικοποίηση

Ψηφιακή Επεξεργασία Εικόνας

Κωδικοποίηση Πηγής. Η λειτουργία ενός συστήματος επικοινωνίας (γενικό διάγραμμα):

Μάθημα Εισαγωγή στις Τηλεπικοινωνίες Κωδικοποίηση πηγής- καναλιού Μάθημα 9o

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ, ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ

Θεωρία πληροφοριών. Τεχνολογία Πολυµέσων 07-1

Συμπίεση Πολυμεσικών Δεδομένων

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΛΟΠΟΝΝΗΣΟΥ, ΤΜΗΜΑ ΤΕΧΝΟΛΟΓΙΑΣ ΤΗΛΕΠΙΚΟΙΝΩΝΙΩΝ

Χρήστος Ξενάκης. Πανεπιστήμιο Πειραιώς, Τμήμα Ψηφιακών Συστημάτων

Τεχνολογία Πολυμέσων. Ενότητα # 9: Κωδικοποίηση εντροπίας Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής

Κωδικοποίηση Πηγής. Δρ. Α. Πολίτης

Συστήματα Πολυμέσων. Ενότητα 3: Εισαγωγικά θέματα Συμπίεσης. Θρασύβουλος Γ. Τσιάτσος Τμήμα Πληροφορικής ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

Μάθημα 7 ο. Συμπίεση Εικόνας ΤΜΗΥΠ / ΕΕΣΤ 1

Ψηφιακή Επεξεργασία και Ανάλυση Εικόνας Ενότητα 6 η : Συμπίεση Εικόνας. Καθ. Κωνσταντίνος Μπερμπερίδης Πολυτεχνική Σχολή Μηχανικών Η/Υ & Πληροφορικής

Κατηγορίες Συμπίεσης. Συμπίεση με απώλειες δεδομένων (lossy compression) π.χ. συμπίεση εικόνας και ήχου

Θεωρία τησ Πληροφορίασ (Θ) ΔΙΔΑΚΩΝ: Δρ. Αναςτάςιοσ Πολίτησ

Συμπίεση Δεδομένων

ΕΑΠ/ΠΛΗ22/ΑΘΗ-3. 3 η ΟΣΣ

ΕΑΠ/ΠΛΗ22/ΑΘΗ-4. 3 η ΟΣΣ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΛΟΠΟΝΝΗΣΟΥ, ΤΜΗΜΑ ΤΕΧΝΟΛΟΓΙΑΣ ΤΗΛΕΠΙΚΟΙΝΩΝΙΩΝ

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ

Ψηφιακές Τηλεπικοινωνίες

Πληροφορική Ι. Μάθημα 9 ο Συμπίεση δεδομένων. Τμήμα Χρηματοοικονομικής & Ελεγκτικής ΤΕΙ Ηπείρου Παράρτημα Πρέβεζας. Δρ.

Αρχές κωδικοποίησης. Τεχνολογία Πολυµέσων 08-1

Τεχνολογία Πολυμέσων. Ενότητα # 7: Θεωρία πληροφορίας Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής

Ψηφιακές Τηλεπικοινωνίες. Θεωρία Ρυθμού Παραμόρφωσης

Θεωρία Πληροφορίας. Διάλεξη 5: Διακριτή πηγή πληροφορίας με μνήμη. Δρ. Μιχάλης Παρασκευάς Επίκουρος Καθηγητής

Σημείωμα Αδειοδότησης

7ο ΕΡΓΑΣΤΗΡΙΟ AAAABBBBAAAAABBBBBBCCCCCCCCCCCCCCBBABAAAABBBBBBCCCCD

Συμπίεση Δεδομένων

Μετάδοση Πολυμεσικών Υπηρεσιών Ψηφιακή Τηλεόραση

Συμπίεση Δεδομένων

Κωδικοποίηση εικόνων κατά JPEG

Ανάκτηση Πληροφορίας

ιαφορική εντροπία Σεραφείµ Καραµπογιάς

Σεραφείµ Καραµπογιάς. Πηγές Πληροφορίας και Κωδικοποίηση Πηγής 6.3-1

Θεωρία τησ Πληροφορίασ (Θ) ΔΙΔΑΚΩΝ: Δρ. Αναςτάςιοσ Πολίτησ

Αρχές κωδικοποίησης. Τεχνολογία Πολυμέσων και Πολυμεσικές Επικοινωνίες 08-1

Επεξεργασία Χαρτογραφικής Εικόνας

Μάθημα Επισκόπηση των Τηλεπικοινωνιών

Τεχνολογία Πολυμέσων. Ενότητα # 11: Κωδικοποίηση εικόνων: JPEG Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής

Τεράστιες ανάγκες σε αποθηκευτικό χώρο

Απαντήσεις σε απορίες

Αριθμητική Κωδικοποίηση

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ, ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ

Διακριτά Μαθηματικά ΙΙ Χρήστος Νομικός Τμήμα Μηχανικών Η/Υ και Πληροφορικής Πανεπιστήμιο Ιωαννίνων 2018 Χρήστος Νομικός ( Τμήμα Μηχανικών Η/Υ Διακριτά

ΠΛΗ21 Κεφάλαιο 2. ΠΛΗ21 Ψηφιακά Συστήματα: Τόμος Α Κεφάλαιο: 2 Δυαδική Κωδικοποίηση

Τεχνικές Συµπίεσης Βίντεο. Δρ. Μαρία Κοζύρη Τµήµα Πληροφορικής Πανεπιστήµιο Θεσσαλίας

ΤΕΧΝΟΛΟΓΙΕΣ ΠΟΛΥΜΕΣΩΝ

Χρήστος Ξενάκης. Πανεπιστήμιο Πειραιώς, Τμήμα Ψηφιακών Συστημάτων

Τεχνολογία Πολυμέσων. Ενότητα # 8: Αρχές κωδικοποίησης Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής

d k 10 k + d k 1 10 k d d = k i=0 d i 10 i.

Πρόλογος 1. 1 Μαθηµατικό υπόβαθρο 9

Μοντέλο Επικοινωνίας Δεδομένων. Επικοινωνίες Δεδομένων Μάθημα 6 ο

ΕΕ728 Προχωρηµένα Θέµατα Θεωρίας Πληροφορίας 4η διάλεξη (4η έκδοση, 11/3/2013)

Συμπίεση Πολυμεσικών Δεδομένων

Τηλεπικοινωνιακά Συστήματα ΙΙ

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Ανώτατο Εκπαιδευτικό Ίδρυμα Πειραιά Τεχνολογικού Τομέα ΕΠΕΞΕΡΓΑΣΙΑ ΕΙΚΟΝΑΣ. Ενότητα 6: Κωδικοποίηση & Συμπίεση Εικόνας

Πανεπιστήμιο Δυτικής Μακεδονίας. Τμήμα Μηχανικών Πληροφορικής & Τηλεπικοινωνιών. Ψηφιακή Σχεδίαση

Πανεπιστήμιο Πατρών Τμήμα Φυσικής Εργαστήριο Ηλεκτρονικής. Ψηφιακά Ηλεκτρονικά. Αριθμητικά Συστήματα. Επιμέλεια Διαφανειών: Δ.

Συµπίεση Εικόνας: Το πρότυπο JPEG

Δ10. Συμπίεση Δεδομένων

Θεωρία Υπολογισμού Άρτιοι ΑΜ. Διδάσκων: Σταύρος Κολλιόπουλος. eclass.di.uoa.gr. Περιγραφή μαθήματος

Θεωρία Υπολογισμού Αρτιοι ΑΜ Διδάσκων: Σταύρος Κολλιόπουλος eclass.di.uoa.gr

Μέρος ΙΙ. Τυχαίες Μεταβλητές

Δυναμικά Σύνολα. Δυναμικό σύνολο. Tα στοιχεία του μεταβάλλονται μέσω εντολών εισαγωγής και διαγραφής. διαγραφή. εισαγωγή

Θέματα Συστημάτων Πολυμέσων

Συστήματα Πολυμέσων. Ενότητα 6: Συμπίεση Ψηφιακής Εικόνας. Θρασύβουλος Γ. Τσιάτσος Τμήμα Πληροφορικής ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

Θεωρία Πληροφορίας. Διάλεξη 7: Κωδικοποίηση καναλιού με γραμμικούς κώδικες block. Δρ. Μιχάλης Παρασκευάς Επίκουρος Καθηγητής

Θεωρία Πληροφορίας. Διάλεξη 12:Κωδικοποίηση Καναλιού με Κώδικες Turbo. Δρ. Μιχάλης Παρασκευάς Επίκουρος Καθηγητής

Ασκήσεις Φροντιστηρίου «Υπολογιστική Νοημοσύνη Ι» 5 o Φροντιστήριο

ΚΕΦΑΛΑΙΟ ΠΕΜΠΤΟ ΘΕΩΡΙΑ ΠΛΗΡΟΦΟΡΙΑΣ

Αθανάσιος Χρ. Τζέμος Τομέας Θεωρητικής Φυσικής. Εντροπία Shannon

Η κωδικοποίηση των συντελεστών DC

! Εάν ο αριθμός διαθέτει περισσότερα bits, χρησιμοποιούμε μεγαλύτερες δυνάμεις του 2. ! Προσοχή στη θέση του περισσότερο σημαντικού bit!

Τμήμα Μηχανικών Η/Υ και Πληροφορικής

Πράξεις με δυαδικούς αριθμούς

1 Βασικές Έννοιες Θεωρίας Πληροφορίας

Συμπίεση Δεδομένων Δοκιμής (Test Data Compression) Νικολός Δημήτριος, Τμήμα Μηχ. Ηλεκτρονικών Υπολογιστών & Πληροφορικής, Παν Πατρών

Διακριτά Μαθηματικά ΙΙ Χρήστος Νομικός Τμήμα Μηχανικών Η/Υ και Πληροφορικής Πανεπιστήμιο Ιωαννίνων 2018 Χρήστος Νομικός ( Τμήμα Μηχανικών Η/Υ Διακριτά

Ελληνική Δημοκρατία Τεχνολογικό Εκπαιδευτικό Ίδρυμα Ηπείρου. Πληροφορική Ι. Ενότητα 9 : Συμπίεση δεδομένων. Δρ. Γκόγκος Χρήστος

3. ΤΕΧΝΙΚΕΣ ΣΥΜΠΙΕΣΗΣ ΠΟΛΥΜΕΣΩΝ

Θεωρία Πληροφορίας. Διάλεξη 10: Κωδικοποίηση καναλιού με συνελικτικούς κώδικες. Δρ. Μιχάλης Παρασκευάς Επίκουρος Καθηγητής

MPEG-4: Βασικά Χαρακτηριστικά

ΗΜΥ 100 Εισαγωγή στην Τεχνολογία

Τετάρτη 5-12/11/2014. ΣΗΜΕΙΩΣΕΙΣ 3 ου και 4 ου ΜΑΘΗΜΑΤΟΣ ΕΙΔΙΚΟΤΗΤΑ: ΤΕΧΝΙΚΟΣ ΕΦΑΡΜΟΓΩΝ ΠΛΗΡΟΦΟΡΙΚΗΣ ΜΑΘΗΜΑ: ΑΡΧΙΤΕΚΤΟΝΙΚΗ Η/Υ Α ΕΞΑΜΗΝΟ

Διακριτά Μαθηματικά. Προχωρημένες μέθοδοι απαρίθμησης: Εγκλεισμός- Αποκλεισμός

Transcript:

Συμπίεση Δεδομένων 2014-2015

Ρυθμός κωδικοποίησης Ένας κώδικας που απαιτεί L bits για την κωδικοποίηση μίας συμβολοσειράς N συμβόλων που εκπέμπει μία πηγή έχει ρυθμό κωδικοποίησης (μέσο μήκος λέξης) L R = lim N N Ποιος είναι ο ελάχιστος ρυθμός (ελάχιστο μέσο μήκος λέξης); Δρ. Ν. Π. Σγούρος 2

Θεώρημα Shannon (Κωδικοποίηση Πηγής DMS) Μία πηγή εντροπίας H μπορεί να κωδικοποιηθεί με αυθαίρετα μικρό σφάλμα (ε 0) σε οποιοδήποτε ρυθμό R>H. Αντίστροφα, δεν υπάρχει κώδικαςρυθμό R <H που να κωδικοποιεί μία πηγή εντροπίας H χωρίς σφάλματα. Δρ. Ν. Π. Σγούρος 3

Πλεονασμός Ο πλεονασμός μίας πηγής μπορεί να οριστεί ως: π = R H 0 Ο σχετικός πλεονασμός θα δίνεται από τη σχέση: δ = π H 100% Δρ. Ν. Π. Σγούρος 4

Κώδικες Πηγής Ι Κατηγοριοποιήσεις κωδίκων Ανάλογα με το μήκος των κωδικών λέξεων (σταθερό, μεταβλητό) Ανάλογα με τις απώλειες (Απωλεστικοί, Μη απωλεστικοί) Ανάλογα με τη χρήση στατιστικής των δεδομένων (Στατικοί, Δυναμικοί) Δρ. Ν. Π. Σγούρος 5

Κώδικες Πηγής ΙΙ Κατηγοριοποιήσεις κωδίκων Ανάλογα με το μήκος των κωδικών λέξεων (σταθερό, μεταβλητό) Μήκος Λέξης - Συμβόλων Πηγής Σταθερό Σταθερό Μεταβλητό Μεταβλητό Μήκος Λέξης Κώδικα Σταθερό Μεταβλητό Σταθερό Μεταβλητό Δρ. Ν. Π. Σγούρος 6

Κώδικες Πηγής ΙΙ Κατηγοριοποιήσεις κωδίκων Ανάλογα με το μήκος των κωδικών λέξεων (σταθερό, μεταβλητό) Απόδοση Συμπίεσης Σταθερού μήκους Εξαρτάται από το συνδυασμό πηγής-κώδικα Μεταβλητού Μήκους Εξαρτάται από το συνδυασμό πηγής-κώδικα Πολυπλοκότητα Μικρότερη Μεγαλύτερη Δρ. Ν. Π. Σγούρος 7

Κώδικες Πηγής ΙΙΙ Κατηγοριοποιήσεις κωδίκων Ανάλογα με τις απώλειες (Απωλεστικοί, Μη απωλεστικοί) Απωλεστικοί Μη Απωλεστικοί Απόδοση Συμπίεσης Μεγαλύτερη Μικρότερη Απώλεια Δεδομένων Ναι Όχι Δρ. Ν. Π. Σγούρος 8

Κώδικες Πηγής ΙV Κατηγοριοποιήσεις κωδίκων Ανάλογα με τη χρήση στατιστικής των δεδομένων (Στατικοί, Δυναμικοί) Στατικοί Δυναμικοί Πολυπλοκότητα Μικρή Μεγάλη Προϋπολογισμένες πιθανότητες Εμφάνισης Ναι Όχι Δρ. Ν. Π. Σγούρος 9

Μη απωλεστικοί κώδικες πηγής Δρ. Ν. Π. Σγούρος 10

Κώδικες Σταθερού Μήκους Λέξης Σε κάθε σύμβολο της πηγής αντιστοιχίζεται σε μία κωδική λέξη σταθερού πλήθους bits. Για μία πηγή που διαθέτει k διακριτά σύμβολα απαιτούνται δυαδικές κωδικές λέξεις με r bits ώστε να ισχύει : 2 r 1 < k 2 r Το μέσο μήκος δυαδικής λέξης είναι r bits Δεν απαιτείται γνώση των στατιστικών χαρακτηριστικών της πηγής Κώδικας ASCII, Δυαδικός Κώδικας Gray κ.α. Δρ. Ν. Π. Σγούρος 11

Κώδικες Μεταβλητού Μήκους Λέξης Ι Σε κάθε σύμβολο της πηγής αντιστοιχίζεται σε μία κωδική λέξη μεταβλητού πλήθους bits. Υπάρχουν πολλαπλές διαφορετικές κωδικοποιήσεις όπως και μη επιτρεπτές κωδικοποιήσεις Για αποτελεσματική κωδικοποίηση απαιτείται γνώση των στατιστικών χαρακτηριστικών της πηγής Κώδικες Shannon-Fano, Huffman κ.α. Δρ. Ν. Π. Σγούρος 12

Κώδικες Μεταβλητού Μήκους Λέξης ΙΙ Έστω μία πηγή η οποία εκπέμπει σύμβολαs i από ένα αλφάβητοc S i C = S 1, S 2,, S M Σε κάθε σύμβολο S i του παραπάνω αλφάβητου αναθέτουμε μία δυαδική λέξη Β i με μήκος l S i = l i 1 : Β i = B i i 0, B li 1 Αν οι πιθανότητες εμφάνισης των συμβόλων είναι αντίστοιχα p Si = p i τότε το μέσο μήκος λέξης του κώδικα θα έχει αναμενόμενη τιμή: M R = l = p i l i i=1 Δρ. Ν. Π. Σγούρος 13

Άσκηση 2.1 Να υπολογίσετε το μέσο μήκος λέξης για τους παρακάτω κώδικες S i p i Κώδικας Α Κώδικας Β Κώδικας Γ Κώδικας Δ Κώδικας Ε Κώδικας ΣΤ S1 0,5 00 0 0 0 00 0 S2 0,25 01 10 01 01 01 10 S3 0,125 10 11 010 011 10 110 S4 0,125 11 11 011 111 110 111 Δρ. Ν. Π. Σγούρος 14

Άσκηση 2.1 Να υπολογίσετε το μέσο μήκος λέξης για τους παρακάτω κώδικες S i p i Κώδικας Α Κώδικας Β Κώδικας Γ Κώδικας Δ Κώδικας Ε Κώδικας ΣΤ S1 0,5 00 0 0 0 00 0 S2 0,25 01 10 01 01 01 10 S3 0,125 10 11 010 011 10 110 S4 0,125 11 11 011 111 110 111 l(bits/symbol) 2 1,5 1,75 1,75 2,125 1,75 Δρ. Ν. Π. Σγούρος 15

Αποκωδικοποίηση Ένας κώδικας θα πρέπει να είναι μονοσήμαντα αποκωδικοποιήσιμος Για κάθε σύμβολο S i να υπάρχει μοναδική αναπαράσταση Β i στον κώδικα Αν παραχθούν πολλά σύμβολα σε μία συνεχή σειρά στην αναπαράσταση του κώδικα θα πρέπει τα σύμβολα να μπορούν να διαχωριστούν κατά την αποκωδικοποίηση Δρ. Ν. Π. Σγούρος 16

Προθεματικοί Κώδικες - Άμεσα Αποκωδικοποιήσιμοι Προθεματική Συνθήκη Αν μία σειρά από ψηφία του κώδικα είναι αναγνωρίσιμη κωδική λέξη, τότε δεν υπάρχει πιθανότητα αυτή η κωδική λέξη πρόθεμα μιας άλλης μεγαλύτερης κωδικής λέξης με την ίδια αρχή. Άμεση Αποκωδικοποίηση Ένα σύμβολο μπορεί να αποκωδικοποιηθεί αμέσως μόλις ολοκληρωθεί η λήψη της κωδικοποιημένης αναπαράστασης του Δρ. Ν. Π. Σγούρος 17

Άσκηση 2.2 Να χαρακτηρίσετε τους παρακάτω κώδικες S i p i Κώδικας Α Κώδικας Β Κώδικας Γ Κώδικας Δ Κώδικας Ε Κώδικας ΣΤ S1 0,5 00 0 0 0 00 0 S2 0,25 01 10 01 01 01 10 S3 0,125 10 11 010 011 10 110 S4 0,125 11 11 011 111 110 111 l(bits/symbol) 2 1,5 1,75 1,75 2,125 1,75 Δρ. Ν. Π. Σγούρος 18

Βέλτιστοι κώδικες Μεταβλητού Μήκους Ο Shannon απέδειξε ότι για τους κώδικες μεταβλητού μήκους, μπορούν να δημιουργηθούν κώδικες για τους οποίους ισχύει ότι : Η R < H + 1 Δρ. Ν. Π. Σγούρος 19

Κώδικας Huffman Δρ. Ν. Π. Σγούρος 20

Κώδικας Huffman 1/2 0 0 1/4 10 0 1/2 1/8 1/16 1/16 110 1110 1111 0 1 0 1/8 1 1/4 1 1 Δρ. Ν. Π. Σγούρος 21

Κωδικοποίηση Huffman symbols = [1:6]; % Σϋμβολα της πηγής p = [.5.125.125.125.0625.0625]; % Πιθανότητες Συμβόλων [dict,avglen] = huffmandict(symbols,p); % Δη actualsig = randsrc(100,1,[symbols; p]); % Create data using p. comp = huffmanenco(actualsig,dict); % Encode the data. Δρ. Ν. Π. Σγούρος 22

Κώδικες Lempel-Ziv Έχουν ασυμπτωτική προσέγγιση στην εντροπία μιας πηγής για μεγάλες ακολουθίες συμβόλων Δεν απαιτείται στον αποκωδικοποιητή η γνώση του πίνακα κωδικοποίησης που έφτιαξε ο κωδικοποιητής Ο πίνακας κωδικοποίησης κατασκευάζεται δυναμικά Τα δεδομένα έχουν και ρόλο πίνακα κωδικοποίησης Οι κωδικές λέξεις έχουν σταθερό μήκος Αλγόριθμοι : LZ77(gzip,pkzip), LZ78(GIF) Δρ. Ν. Π. Σγούρος 23

Κώδικας Huffman Δρ. Ν. Π. Σγούρος 24

Αλγόριθμος Lempel-Ziv-Welch Δρ. Ν. Π. Σγούρος 25

Άσκηση 2.3 Δρ. Ν. Π. Σγούρος 26

Άσκηση 2.3 Κωδικοποίηση της ακολουθίας : abbcdeabbcdeabdeaf Δρ. Ν. Π. Σγούρος 27

Άσκηση 2.3 Ποιο το συνολικό κόστος για την κωδικοποίηση της παραπάνω ακολουθίας με τον LZW και ποιό το κόστος μετάδοσης χωρίς κωδικοποίηση; Θεωρήστε ότι για κάθε σύμβολο στο 0-255 χρησιμοποιούνται 8bits ενώ το πλήθος των bits θα αυξηθεί για όλα τα μεταβιβαζόμενα κωδικοποιημένα σύμβολα με τον LZW κατά 1 bit Δρ. Ν. Π. Σγούρος 28

Επέκταση πηγής I Με τον όρο επέκταση πηγής εννοείται η αλλαγή των συμβόλων της σε νέα σύμβολα που δημιουργούνται από τους πιθανούς συνδυασμούς των συμβόλων της Θεωρώντας συνδυασμούς L συμβόλων μίας πηγής που αρχικά είχε Ν σύμβολα τα νέα σύμβολα της πηγής θα είναι N L Προκαλείται μεταβολή στις πιθανότητες εμφάνισης άρα μεταβάλλεται η εντροπία της πηγής Η επέκταση πηγής χρησιμοποιείται για τη βελτίωση αποδοτικότητας αλγορίθμων συμπίεσης Δρ. Ν. Π. Σγούρος 29

Επέκταση πηγής II Ο ρυθμός για την L επέκταση πηγής θα φράσσεται από την H L R L < H L + 1 Ο μέσος ρυθμός ανά σύμβολο θα είναι R = 1 L R L Οπότε H L L R < H L + 1 H L L R < H L L + 1 L Επειδή (αποδεικνύεται) H L = L Η προκύπτει ότι Η R < H + 1 L Δρ. Ν. Π. Σγούρος 30

Παράδειγμα Θεωρήστε μία πηγή με 3 διαφορετικά σύμβολα s1, s2, s3 τα οποία έχουν πιθανότητες εμφάνισης p1=0.95, p2=0.03, p3=0.02 Να κατασκευαστεί ο κώδικας Huffmann για την παραπάνω πηγή Να βρεθεί η ποσοστιαία % διαφορά του μέσου μήκους της λέξης του κώδικα από την εντροπία της πηγής Δρ. Ν. Π. Σγούρος 31

Παράδειγμα Θεωρήστε μία πηγή με 3 διαφορετικά σύμβολα s1, s2, s3 τα οποία έχουν πιθανότητες εμφάνισης p1=0.95, p2=0.03, p3=0.02 Να κατασκευαστεί ένας κώδικας Huffmann για την παραπάνω πηγή Να βρεθεί η ποσοστιαία % διαφορά του μέσου μήκους της λέξης του κώδικα από την εντροπία της πηγής Σύμβολο Κωδική Λέξη s1 0 s2 11 s3 10 Δρ. Ν. Π. Σγούρος 32

Παράδειγμα Θεωρήστε μία πηγή με 3 διαφορετικά σύμβολα s1, s2, s3 τα οποία έχουν πιθανότητες εμφάνισης p1=0.95, p2=0.03, p3=0.02 Να κατασκευαστεί ένας κώδικας Huffmann για την παραπάνω πηγή Να βρεθεί η ποσοστιαία % διαφορά του μέσου μήκους της λέξης του κώδικα από την εντροπία της πηγής Η = 0.335 bits symbol, l = R = 1.05 bits symbol δ % = l H H 100 = 213% Δρ. Ν. Π. Σγούρος 33

Παράδειγμα Θεωρώντας την L=2 επέκταση της πηγής προκύπτει ο πίνακας Σύμβολο Πιθανότητα εμφάνισης Κωδικές Λέξεις Huffman s 1 s 1 0,9025 0 s 1 s 2 0,0190 111 s 1 s 3 0,0285 100 s 2 s 1 0,0190 1101 s 2 s 2 0,0004 110011 s 2 s 3 0,0006 110001 s 3 s 1 0,0285 101 s 3 s 2 0,0006 110010 s 3 s 3 0,0009 110000 Δρ. Ν. Π. Σγούρος 34

Παράδειγμα Υπολογίζοντας το μέσο ρυθμό (μέσο μήκος λέξης) και την εντροπία προκύπτει ότι Η = 0.335 bits symbol, R = R L L = 0.611 bits symbol δ % = R H H 100 = 82% Δρ. Ν. Π. Σγούρος 35

Αριθμητική Κωδικοποίηση Ι Δεν ορίζονται διαφορετικές κωδικές λέξεις για τα σύμβολα της πηγής Μία σειρά από σύμβολα κωδικοποιείται με μία μοναδική κωδική λέξη Αύξηση απόδοσης από την εξάλειψη της ανάγκης ανάθεσης ακέραιου πλήθους ψηφίων στις κωδικές λέξεις κάθε συμβόλου Απαιτείται γνώση των πιθανοτήτων εμφάνισης των συμβόλων Βασίζεται στο αξίωμα πληρότητας των πραγματικών αριθμών Δρ. Ν. Π. Σγούρος 36

Αριθμητική Κωδικοποίηση ΙΙ Διαίρεση του διαστήματος [0,1) ανάλογα με τις πιθανότητες εμφάνισης των συμβόλων (χρησιμοποιείται η συνάρτηση αθροιστικής πιθανότητας) Καθορίζονται διαστήματα αντί για συγκεκριμένες κωδικές λέξεις Το διάστημα κωδικοποίησης ενός συμβόλου καθορίζεται από το διάστημα του προηγούμενου συμβόλου που κωδικοποιήθηκε Δρ. Ν. Π. Σγούρος 37

Αριθμητική Κωδικοποίηση ΙΙ Αρχικοποίηση διαστήματος [0,1) με αθροιστική συνάρτηση πιθανότητας συμβόλων (lowbound[ ] και highbound[ ]) low=0, high=1 Διάβασε s Δ=high-low low=low+δ lowbound[s] high=low+δ highbound[s] EOS: End of Stream EOS Δρ. Ν. Π. Σγούρος 38

Παράδειγμα Πηγή: wikipedia Δρ. Ν. Π. Σγούρος 39

Άσκηση 2.4 Έστω μία πηγή με τρία σύμβολα α 1,α 2,α 3 με πιθανότητες p 1 =0.7, p 2 =0.1, p 3 =0.2. Να κωδικοποιηθεί με αριθμητική κωδικοποίηση η συμβολοσειρά α 1,α 2,α 3 Για την ίδια πηγή να αποκωδικοποιήσετε το μήνυμα 0.7538 Δρ. Ν. Π. Σγούρος 40

Άσκηση 2.4 Πηγή: Sayood Δρ. Ν. Π. Σγούρος 41

Αλγόριθμος Run Length Encoding (RLE) Κωδικοποίηση επαναλαμβανόμενων χαρακτήρων στη μορφή : Χαρακτήρας, Πλήθος Λαμβάνεται ειδική μέριμνα στην περίπτωση ύπαρξης αριθμών στο κείμενο: Χαρακτήρας, &Πλήθος Μπορεί να χρησιμοποιηθεί με μεγάλη αποτελεσματικότητα σε δυαδικές ή δυαδικά κωδικοποιημένες πηγές Μπορεί να γίνει αποσύζευξη του ζεύγους κωδικοποίησης και επανακωδικοποίησης με άλλη μέθοδο για αύξηση του ποσοστού συμπίεσης. Δρ. Ν. Π. Σγούρος 42

Παράδειγμα Απλοποιημένης κωδικοποίησης με RLE Να κωδικοποιηθεί η συμβολοσειρά ΑΑΑΒΒΒΑΒΒΒCCAACCAAB με χρήση του αλγορίθμου RLE ΑΑΑΒΒΒΑΒΒΒCCAACCAAB A3B3A1B3C2A2C2A2B1(ABABCACAB)(331322221) Η αποσυζευγμένη ακολουθία επιδέχεται επιπλέον κωδικοποίηση Δρ. Ν. Π. Σγούρος 43

Αλγόριθμος Run Length Encoding (RLE) C=0,R=0 Διάβασε ch O O C=1 SC=ch R<N O N EOF N N N R=R+1 R=R+1 O SC=ch R=R+1 OUT=SCSC..SC OUT=SC&R C=C+1 R=0 R=0 Εκτύπωση τερτματισμού Τέλος SC=ch SC=ch Δρ. Ν. Π. Σγούρος 44

Άσκηση 2.5 Να υπολογιστεί ο λόγος συμπίεσης που επιτυγχάνεται για την κωδικοποίηση μιας συμβολοσειράς Ν χαρακτήρων στην περίπτωση που αυτή περιλαμβάνει γράμματα και αριθμούς και συνολικά περιέχει Μ επαναλαμβανόμενες σειρές χαρακτήρων μέσου μήκους L. Ποια η τιμή του λόγου συμπίεσης στην περίπτωση που κανένας χαρακτήρας δεν επαναλαμβάνεται; Σημείωση: Ο λόγος συμπίεσης είναι ίσος με λ = Μέγεθος συμπιεσμένης μορφής (έξοδος) Μέγεθος ασυμπίεστης μορφής (είσοδος) Δρ. Ν. Π. Σγούρος 45

Άσκηση 2.6 Θεωρήστε ότι για τη μετάδοση μιας συμβολοσειράς η οποία χρησιμοποιεί 5 διαφορετικά σύμβολα χρησιμοποιείται ο κώδικας Huffman. Αν οι πιθανότητες των συμβόλων είναι α1=0.4, α2=α3=0.2, α4=α5=0.1, να κατασκευάσετε δύο πιθανούς κώδικες Huffman για την κωδικοποίηση της παραπάνω συμβολοσειράς. Να αναπτύξετε κατάλληλο κριτήριο για την αξιολόγηση της επίδοσης των διαφορετικών κωδίκων Huffman για την παραπάνω συμβολοσειρά που θα εξασφαλίζει όσο το δυνατό σταθερό ρυθμό μετάδοσης σε ένα δίκτυο δεδομένων. Δρ. Ν. Π. Σγούρος 46