Συμπίεση χωρίς Απώλειες

Σχετικά έγγραφα
Θεωρία τησ Πληροφορίασ (Θ) ΔΙΔΑΚΩΝ: Δρ. Αναςτάςιοσ Πολίτησ

Κωδικοποίηση Πηγής. Δρ. Α. Πολίτης

Κωδικοποίηση Πηγής. Η λειτουργία ενός συστήματος επικοινωνίας (γενικό διάγραμμα):

Θεωρία τησ Πληροφορίασ (Θ) ΔΙΔΑΚΩΝ: Δρ. Αναςτάςιοσ Πολίτησ

Δομές Δεδομένων και Αλγόριθμοι

Θεωρία Πληροφορίας. Διάλεξη 4: Διακριτή πηγή πληροφορίας χωρίς μνήμη. Δρ. Μιχάλης Παρασκευάς Επίκουρος Καθηγητής

ΘΕΩΡΙΑ ΠΛΗΡΟΦΟΡΙΑΣ. Κεφάλαιο 3 : Πηγές Πληροφορίας Χρήστος Ξενάκης. Πανεπιστήμιο Πειραιώς, Τμήμα Ψηφιακών Συστημάτων

Τηλεπικοινωνιακά Συστήματα ΙΙ

Συμπίεση Δεδομένων

Μελετάμε την περίπτωση όπου αποθηκεύουμε ένα (δυναμικό) σύνολο στοιχειών. Ένα στοιχείο γράφεται ως, όπου κάθε.

7ο ΕΡΓΑΣΤΗΡΙΟ AAAABBBBAAAAABBBBBBCCCCCCCCCCCCCCBBABAAAABBBBBBCCCCD

Χρήστος Ξενάκης. Πανεπιστήμιο Πειραιώς, Τμήμα Ψηφιακών Συστημάτων

Δίαυλος Πληροφορίας. Δρ. Α. Πολίτης

Επεξεργασία Πολυµέσων. Δρ. Μαρία Κοζύρη Π.Μ.Σ. «Εφαρµοσµένη Πληροφορική» Τµήµα Ηλεκτρολόγων Μηχανικών & Μηχανικών Υπολογιστών Πανεπιστήµιο Θεσσαλίας

Μετάδοση Πολυμεσικών Υπηρεσιών Ψηφιακή Τηλεόραση

Πληροφορική Ι. Μάθημα 9 ο Συμπίεση δεδομένων. Τμήμα Χρηματοοικονομικής & Ελεγκτικής ΤΕΙ Ηπείρου Παράρτημα Πρέβεζας. Δρ.

Κατηγορίες Συμπίεσης. Συμπίεση με απώλειες δεδομένων (lossy compression) π.χ. συμπίεση εικόνας και ήχου

Μάθημα Εισαγωγή στις Τηλεπικοινωνίες Κωδικοποίηση πηγής- καναλιού Μάθημα 9o

ΕΑΠ/ΠΛΗ22/ΑΘΗ-4. 3 η ΟΣΣ

Ειδικά θέματα Αλγορίθμων και Δομών Δεδομένων (ΠΛΕ073) Απαντήσεις 1 ου Σετ Ασκήσεων

Τεχνολογία Πολυμέσων. Ενότητα # 9: Κωδικοποίηση εντροπίας Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής

Δένδρα Αναζήτησης Πολλαπλής Διακλάδωσης

Αρχές κωδικοποίησης. Τεχνολογία Πολυµέσων 08-1

Συμπίεση Δεδομένων Δοκιμής (Test Data Compression) Νικολός Δημήτριος, Τμήμα Μηχ. Ηλεκτρονικών Υπολογιστών & Πληροφορικής, Παν Πατρών

Δίαυλος Πληροφορίας. Η λειτουργία του περιγράφεται από:

Θεωρία πληροφοριών. Τεχνολογία Πολυµέσων 07-1

Επεξεργασία Χαρτογραφικής Εικόνας

Κεφάλαιο 2 Πληροφορία και εντροπία

( ) log 2 = E. Σεραφείµ Καραµπογιάς

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ Τ Μ Η Μ Α Π Λ Η Ρ Ο Φ Ο Ρ Ι Κ Η Σ

Τεχνολογία Πολυμέσων. Ενότητα # 7: Θεωρία πληροφορίας Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής

4.4 Το πρόβλημα του ελάχιστου ζευγνύοντος δένδρου

Συμπίεση Δεδομένων

Ελληνική Δημοκρατία Τεχνολογικό Εκπαιδευτικό Ίδρυμα Ηπείρου. Πληροφορική Ι. Ενότητα 9 : Συμπίεση δεδομένων. Δρ. Γκόγκος Χρήστος

Επίλυση Προβληµάτων µε Greedy Αλγόριθµους

Δίκτυα Υπολογιστών ΙΙ (Ασκήσεις Πράξης)

Χρήστος Ι. Σχοινάς Αν. Καθηγητής ΔΠΘ. Συμπληρωματικές σημειώσεις για το μάθημα: «Επιχειρησιακή Έρευνα ΙΙ»

EE728 (22Α004) - Προχωρημένα Θέματα Θεωρίας Πληροφορίας 3η σειρά ασκήσεων Διακριτά και Συνεχή Κανάλια. Παράδοση: Έως 22/6/2015

Θέματα Συστημάτων Πολυμέσων

Όρια Αλγόριθμων Ταξινόμησης. Εισαγωγή στην Ανάλυση Αλγορίθμων Μάγια Σατρατζέμη

Στοχαστικές Ανελίξεις- Ιούλιος 2015

Θεωρία Πληροφορίας. Διάλεξη 5: Διακριτή πηγή πληροφορίας με μνήμη. Δρ. Μιχάλης Παρασκευάς Επίκουρος Καθηγητής

Συστήματα Ανάκτησης Πληροφοριών ΗΥ-463

ΘΕΜΑ 1: Αλγόριθμος Ford-Fulkerson

Θεώρημα κωδικοποίησης πηγής

ΕΑΠ/ΠΛΗ22/ΑΘΗ-3. 3 η ΟΣΣ

Χρήστος Ξενάκης. Πανεπιστήμιο Πειραιώς, Τμήμα Ψηφιακών Συστημάτων

Συμπίεση Δεδομένων

Δομές Δεδομένων & Αλγόριθμοι

Πρόλογος 1. 1 Μαθηµατικό υπόβαθρο 9

ΕΑΠ/ΠΛΗ22/ΑΘΗ-4. 3 η ΟΣΣ

ΑΣΚΗΣΗ 1 Για τις ερωτήσεις 1-4 θεωρήσατε τον ακόλουθο γράφο. Ποιές από τις παρακάτω προτάσεις αληθεύουν και ποιές όχι;

a n + 6a n a n 2 + 8a n 3 = 0, a 0 = 1, a 1 = 2, a 2 = 8

Θέματα Υπολογισμού στον Πολιτισμό - Δένδρα. Δένδρα

Ανάκτηση Πληροφορίας

Ψηφιακή Επεξεργασία Εικόνας

Σχεδιαση Αλγοριθμων -Τμημα Πληροφορικης ΑΠΘ - Κεφαλαιο 9ο

Συμπίεση Πολυμεσικών Δεδομένων

Άσκηση 1 (ανακοινώθηκε στις 20 Μαρτίου 2017, προθεσμία παράδοσης: 24 Απριλίου 2017, 12 τα μεσάνυχτα).

Ομαδοποίηση Ι (Clustering)

13/5/2015 ΟΥΡΕΣ ΠΡΟΤΕΡΑΙΟΤΗΤΑΣ. Δομές Δεδομένων. Ουρές Προτεραιότητας

( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )

Εξωτερική Αναζήτηση. Ιεραρχία Μνήμης Υπολογιστή. Εξωτερική Μνήμη. Εσωτερική Μνήμη. Κρυφή Μνήμη (Cache) Καταχωρητές (Registers) μεγαλύτερη ταχύτητα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΙΑΣ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ Η/Υ ΠΡΩΤΗ ΠΡΟΟΔΟΣ ΣΤΗΝ «ΟΡΓΑΝΩΣΗ ΚΑΙ ΣΧΕΔΙΑΣΗ Η/Y»

... Αν ν = 16 εγκαταλείπει τις προσπάθειες μετάδοσης του πακέτου. Τοπολογία Διαύλου (BUS).

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΑΝΑΛΥΣΗ ΑΛΓΟΡΙΘΜΩΝ

Ενδεικτικές Λύσεις 1ου Σετ Ασκήσεων

Δομές Δεδομένων και Αλγόριθμοι. Λουκάς Γεωργιάδης

Κατανεμημένα Συστήματα Ι

ΟΥΡΕΣ ΠΡΟΤΕΡΑΙΟΤΗΤΑΣ

Ν. Μ. Μισυρλής. Τµήµα Πληροφορικής και Τηλεπικοινωνιών, Πανεπιστήµιο Αθηνών. Καθηγητής: Ν. Μ. Μισυρλής 29 Μαΐου / 18

Κώδικες µεταβλητού µήκους

Συστήµατα Πολυµέσων Ενδιάµεση Εξέταση: Οκτώβριος 2004

Μη γράφετε στο πίσω μέρος της σελίδας

Υπολογιστική Πολυπλοκότητα Εξέταση Ιουνίου 2017 Σελ. 1 από 5

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΦΡΟΝΤΙΣΤΗΡΙΟ ΑΛΓΟΡΙΘΜΩΝ ΒΟΗΘΟΣ: ΒΑΓΓΕΛΗΣ ΔΟΥΡΟΣ

ΕΠΛ 211: Θεωρία Υπολογισμού και Πολυπλοκότητας. Διάλεξη 11: Μη Ασυμφραστικές Γλώσσες

Graph Algorithms. Παρουσίαση στα πλαίσια του μαθήματος «Παράλληλοι Αλγόριθμοι» Καούρη Γεωργία Μήτσου Βάλια

Αριθμητική Ανάλυση & Εφαρμογές

DOMES DEDOMENWN KAI ANALUSH ALGORIJMWN. ParousÐash 8: Huffman Encoding

Θεωρία Υπολογισμού και Πολυπλοκότητα Ασυμφραστικές Γλώσσες (3)

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ, ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ

Δένδρα. Μαθηματικά (συνδυαστικά) αντικείμενα. Έχουν κεντρικό ρόλο στην επιστήμη των υπολογιστών :

Αρχές κωδικοποίησης. Τεχνολογία Πολυμέσων και Πολυμεσικές Επικοινωνίες 08-1

1. 4 ΠΟΛΛΑΠΛΑΣΙΑΣΜΟΣ ΠΟΛΥΩΝΥΜΩΝ

Τεχνητή Νοημοσύνη. 4η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

22Α004 - Προχωρημένα Θέματα Θεωρίας Πληροφορίας Τελική Εξέταση

Ασκήσεις στο µάθηµα «Επισκόπηση των Τηλεπικοινωνιών»

Χρήστος Ξενάκης. Πανεπιστήμιο Πειραιώς, Τμήμα Ψηφιακών Συστημάτων

ΘΕΜΑ 1 ο. α. τα μήκη κύματος από 100m έως 50m ονομάζονται κύματα νύχτας και τα μήκη κύματος από 50m έως 10m ονομάζονται κύματα ημέρας.

Περιεχόμενα. Περιεχόμενα

Μη γράφετε στο πίσω μέρος της σελίδας

Το Πρόβλημα του Περιοδεύοντος Πωλητή - The Travelling Salesman Problem

Σειρά Προβλημάτων 5 Λύσεις

Μη γράφετε στο πίσω μέρος της σελίδας

4 η Σειρά ασκήσεων (Συμπίεση, Ομαδοποίηση, Ευρετηρίαση Πολυμέσων, Κατανεμημένη Ανάκτηση)

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ, ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ

Τεχνητή Νοημοσύνη. 2η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

Transcript:

Συμπίεση χωρίς Απώλειες Στόχοι της συμπίεσης δεδομένων: Μείωση του απαιτούμενου χώρου αποθήκευσης των δεδομένων. Περιορισμός της απαιτούμενης χωρητικότητας διαύλου επικοινωνίας για την μετάδοση. μείωση του χρόνου αποστολής. Από τα συμπιεσμένα δεδομένα θα πρέπει να μπορούν να ανακτηθούν πλήρως οι αρχικές πληροφορίες Ο κώδικας συμπίεσης θα πρέπει να είναι γνωστός στον πομπό και δέκτη. Ο κώδικας συμπίεσης θα πρέπει να συνοδεύει τα συμπιεσμένα δεδομένα. Θα μας απασχολήσουν κώδικες χωρίς απώλειες. Μερικές από τις ιδιότητες του βέλτιστου κώδικα συμπίεσης είναι: Να είναι στιγμιαία αποκωδικοποιήσιμος (άρα και μονοσήμαντος). Σύμβολα του αλφαβήτου της πηγής με μεγαλύτερη πιθανότητα θα πρέπει να αντιστοιχίζονται σε κωδικές λέξεις μικρότερου μήκους. Κατέχει το μικρότερο δυνατό μέσο μήκος.

Κώδικας Huffman Ανακαλύφθηκε από τον David Huffman το 95. Αποτελεί σήμερα το βασικότερο τμήμα των περισσοτέρων αλγορίθμων συμπίεσης: π.χ., GZIP, JPEG Είναι κώδικας χωρίς απώλειες. Η βασική ιδιότητα του είναι ότι αποτελεί τον βέλτιστο κώδικα: δεν υπάρχει κώδικας χωρίς απώλειες με μικρότερο μέσο μήκος.

Κώδικας Huffman Ο αλγόριθμος Huffman (για την περίπτωση δυαδικού κώδικα) οδηγεί στην κατασκευή ενός δεδνροδιαγράμματος και περιγράφεται παρακάτω: Βήμα : Θεωρούμε ότι κάθε σύμβολο πηγής είναι ένα φύλλο του δενδροδιαγράμματος. Στο κάθε φύλλο αντιστοιχίζουμε την πιθανότητα εμφάνισης του κάθε συμβόλου. Βήμα : Εντοπίζουμε τους δύο κόμβους με τις μικρότερες πιθανότητες και τους συγχωνεύουμε σε έναν. Ο νέος κόμβος θα έχει το άθροισμα των πιθανοτήτων των δύο κόμβων που συγχωνεύτηκαν. Βήμα 3: Το δεύτερο βήμα επαναλαμβάνεται μέχρι την δημιουργία του τελικού κόμβου (ρίζα). Σε κάθε ακμή αντιστοιχίζουμε ένα κωδικό σύμβολο ή τυχαία. 3

Παράδειγμα Έστω πηγή πληροφορίας με αλφάβητο {Α,Β,Γ,Δ,Ε} και κατανομή {.,.4,.,.,.}. Κωδικοποίηση Huffman ( η Υλοποίηση): Β(.4) Α(.) Γ(.) Δ(.) Ε(.) Δενδροδιάγραμμα () (.6) (.4) L i (.) Κώδικας Α Β Γ Δ Ε ) Ο κώδικας είναι στιγμιαία αποκωδικοποιήσιμος. ) Ολόκληρος (complete): M i l i 3) Μέσο μήκος: p i l i. 3 4 4.4. 3. 4. 4. 4

Εναλλακτική κωδικοποίηση: Παράδειγμα Δενδροδιάγραμμα Κώδικας Β(.4) Γ(.) Α(.) Δ(.) Ε(.) () (.6) (.4) L i (.) Α Β Γ Δ Ε ) Ο κώδικας είναι στιγμιαία αποκωδικοποιήσιμος. ) Ολόκληρος (complete): M i l i 3) Μέσο μήκος: p i l i. 3 3 4 4.4.. 4. 4. 5

Τρίτη υλοποίηση: Παράδειγμα Α(.) Γ(.) Δ(.) Ε(.) Δενδροδιάγραμμα (.) (.4) Β(.4) Κώδικας Α Β Γ Δ Ε () (.6) ) Ο κώδικας είναι στιγμιαία αποκωδικοποιήσιμος. ) Ολόκληρος (complete): M i l i 3) Μέσο μήκος: 3 3 L i p i l i..4.. 3. 3 6.

Σύγκριση των τριών υλοποιήσεων: Παράδειγμα 7

Ασκήσεις Για την υλοποίηση με την μικρότερη μεταβλητότητα θα πρέπει σε κάθε βήμα του αλγορίθμου όπου προκύπτουν περισσότρες από μια επιλογές για τους κόμβους μικρότερης πιθανότητας, να επιλέγουμε για συγχώνευση τους δύο κόμβους που έχουν δημιουργηθεί παλαιότερα (ψηλότερα στο δένδρο). Εφαρμογή Ι: Έστω μια πηγή Χ που εκπέμπει 6 σύμβολα με πιθανότητες: Α.4 Β.5 Γ. Δ. Ε. Ζ.5 Α) Να κατασκευάσετε μια υλοποίηση του δενδροδιαγράμματος κατά Huffman και να γράψετε τις κωδικές λέξεις για κάθε σύμβολο της πηγής. Β) Να βρείτε το μέσο μήκος του κώδικα. 8

Ασκήσεις Εφαρμογή ΙΙ: Έστω μια πηγή Χ που εκπέμπει 6 σύμβολα με πιθανότητες: Α.3 Β.5 Γ.5 Δ.5 Ε.5 Ζ. Α) Να κατασκευάσετε μια υλοποίηση του δενδροδιαγράμματος κατά Huffman και να γράψετε τις κωδικές λέξεις για κάθε σύμβολο της πηγής. Β) Να υπολογίσετε το μέσο μήκος του κώδικα. 9

Ασκήσεις Εφαρμογή ΙΙΙ: (Εξεταστική 9) Δίνεται πηγή πληροφορίας με σύμβολα πηγής και αντίστοιχες πιθανότητες Χ={Α,Β,Γ,Δ,Ε,Ζ,Η}, P={.5,.5,.5,.,.,.5,.} Α) Να κατασκευάσετε το δενδροδιάγραμμα μετά την εφαρμογή του αλγορίθμου Huffman ελάχιστης μεταβλητότητας και γράψτε τις κωδικές λέξεις για κάθε σύμβολο του Χ. Β) Να υπολογίσετε το μέσο μήκος του κώδικα. Γ) Την μεταβλητότητα του. Στο Γ) γράψτε τον τύπο και αντικαταστήστε (μετά μην κάνετε τις πράξεις).