Τεχνολογία Πολυμέσων. Ενότητα 4: Συμπίεση Δεδομένων. Νικολάου Σπύρος Τμήμα Μηχανικών Πληροφορικής ΤΕ

Σχετικά έγγραφα
Περιεχόµενα. ΕΠΛ 422: Συστήµατα Πολυµέσων. Γιατί Συµπίεση; Βιβλιογραφία

Συστήματα Πολυμέσων. Ενότητα 3: Εισαγωγικά θέματα Συμπίεσης. Θρασύβουλος Γ. Τσιάτσος Τμήμα Πληροφορικής ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

Περιεχόµενα. ΕΠΛ 422: Συστήµατα Πολυµέσων. Βιβλιογραφία. Κατηγορίες τεχνικών συµπίεσης. Τεχνικές Συµπίεσης

Συστήματα Πολυμέσων Ενότητα 4: Συμπίεση. Επικ. Καθηγητής Συνδουκάς Δημήτριος Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά)

Τεράστιες ανάγκες σε αποθηκευτικό χώρο

Συµπίεση δεδοµένων: Εισαγωγή, Κατηγορίες τεχνικών συµπίεσης, Ανάλυση βασικών τεχνικών συµπίεσης

Τεχνολογία Πολυμέσων. Ενότητα # 8: Αρχές κωδικοποίησης Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής

Τεχνολογία Πολυμέσων. Ενότητα 8: Pool Table. Νικολάου Σπύρος Τμήμα Μηχανικών Πληροφορικής ΤΕ

3. ΤΕΧΝΙΚΕΣ ΣΥΜΠΙΕΣΗΣ ΠΟΛΥΜΕΣΩΝ

Τεχνολογία Πολυμέσων. Ενότητα 6: Keyframes και Transitions. Νικολάου Σπύρος Τμήμα Μηχανικών Πληροφορικής ΤΕ

Συστήματα Επικοινωνιών

Αρχές κωδικοποίησης. Τεχνολογία Πολυμέσων και Πολυμεσικές Επικοινωνίες 08-1

Τεχνολογία Πολυμέσων. Ενότητα 6: Υπερκείμενο - Υπερμέσα. Νικολάου Σπύρος Τμήμα Μηχανικών Πληροφορικής ΤΕ

Τεχνολογία Πολυμέσων. Ενότητα 2: Διάδραση & Διαδραστικά Πολυμέσα. Νικολάου Σπύρος Τμήμα Μηχανικών Πληροφορικής ΤΕ

Τεχνολογία Πολυμέσων. Ενότητα4: Επεξεργασία Βίντεο - Avidemux. Νικολάου Σπύρος Τμήμα Μηχανικών Πληροφορικής ΤΕ

Τεχνολογία Πολυμέσων. Ενότητα 10: Ανάπτυξη εφαρμογής αναλογικού ρολογιού Νικολάου Σπύρος Τμήμα Μηχανικών Πληροφορικής ΤΕ

Πληροφορική Εφαρμογές Πολυμέσων

Ελληνική Δημοκρατία Τεχνολογικό Εκπαιδευτικό Ίδρυμα Ηπείρου. Πληροφορική Ι. Ενότητα 9 : Συμπίεση δεδομένων. Δρ. Γκόγκος Χρήστος

Συστήματα Πολυμέσων Ενότητα 7: Ψηφιοποίηση και ψηφιακή επεξεργασία σήματος.

Συστήματα Πολυμέσων Ενότητα 1: Εικόνες - Γραφικά. Επικ. Καθηγητής Συνδουκάς Δημήτριος Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά)

Αρχές κωδικοποίησης. Τεχνολογία Πολυµέσων 08-1

Συστήματα Πολυμέσων. Ενότητα 7: Συμπίεση Εικόνας κατά JPEG. Θρασύβουλος Γ. Τσιάτσος Τμήμα Πληροφορικής ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

Συστήματα Πολυμέσων. Ενότητα 6: Συμπίεση Ψηφιακής Εικόνας. Θρασύβουλος Γ. Τσιάτσος Τμήμα Πληροφορικής ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

Εισαγωγή στην Διοίκηση Επιχειρήσεων

19/3/2007 Πολυµέσα και Συµπίεση εδοµένων

Λογιστική Κόστους Ενότητα 12: Λογισμός Κόστους (2)

Νέες Τεχνολογίες και Καλλιτεχνική Δημιουργία

Τεχνολογία Πολυμέσων. Ενότητα 7: Εξάσκηση στην ανάπτυξη animation. Νικολάου Σπύρος Τμήμα Μηχανικών Πληροφορικής ΤΕ

Εισαγωγή στη Δικτύωση Υπολογιστών

Τεχνολογία Πολυμέσων. Ενότητα 1: Επεξεργασία εικόνας & γραφικών - GIMP. Νικολάου Σπύρος Τμήμα Μηχανικών Πληροφορικής ΤΕ

Συστήματα Πολυμέσων Ενότητα 5: Σαρωτές. Επικ. Καθηγητής Συνδουκάς Δημήτριος Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά)

Επεξεργασία Χαρτογραφικής Εικόνας

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΠΛΗΡΟΦΟΡΙΚΗ Ενότητα 2: Ψηφιοποίηση, Αναπαράσταση και αποθήκευση δεδομένων. Πασχαλίδης Δημοσθένης Τμήμα Ιερατικών Σπουδών

Πληροφορική Ι. Μάθημα 9 ο Συμπίεση δεδομένων. Τμήμα Χρηματοοικονομικής & Ελεγκτικής ΤΕΙ Ηπείρου Παράρτημα Πρέβεζας. Δρ.

Ψηφιακή Επεξεργασία Εικόνας

Συστήματα Επικοινωνιών

ΟΙΚΟΝΟΜΕΤΡΙΑ. Ενότητα 3: Πολλαπλή Παλινδρόμηση. Αναπλ. Καθηγητής Νικόλαος Σαριαννίδης Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά)

Τεχνολογία Πολυμέσων. Ενότητα 2: Επεξεργασία Ήχου - Audacity. Νικολάου Σπύρος Τμήμα Μηχανικών Πληροφορικής ΤΕ

Εισαγωγή στην Διοίκηση Επιχειρήσεων

Συστήματα Πολυμέσων. Ενότητα 12: Συμπίεση Ψηφιακού Ήχου. Θρασύβουλος Γ. Τσιάτσος Τμήμα Πληροφορικής ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

Ψηφιοποίηση και Ψηφιακή Επεξεργασία Εικόνας

Τεχνολογία Πολυμέσων. Ενότητα 11: Αντίγραφή, Επικόλληση και Καθαρισμός Νικολάου Σπύρος Τμήμα Μηχανικών Πληροφορικής ΤΕ

Εισαγωγή στους Αλγορίθμους

Τεχνολογία Πολυμέσων. Ενότητα 3: Επεξεργασία 3D γραφικών & 3D Animation - Blender Νικολάου Σπύρος Τμήμα Μηχανικών Πληροφορικής ΤΕ

ΟΙΚΟΝΟΜΕΤΡΙΑ. Ενότητα 1: Εκτιμητές και Ιδιότητες. Αναπλ. Καθηγητής Νικόλαος Σαριαννίδης Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά)

Βάσεις Δεδομένων. Ενότητα 1: Εισαγωγή στις Βάσεις δεδομένων. Πασχαλίδης Δημοσθένης Τμήμα Ιερατικών σπουδών

Συστήματα Πολυμέσων. Ενότητα 11: Χαρακτηριστικά Ψηφιακού Ήχου. Θρασύβουλος Γ. Τσιάτσος Τμήμα Πληροφορικής ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

ΠΛΗΡΟΦΟΡΙΚΗ Ι Ενότητα 8: Συστήματα αρίθμησης

Θέμα: «ΣΥΜΠΙΕΣΗ ΔΕΔΟΜΕΝΩΝ ΚΑΙ ΠΟΛΥΜΕΣΑ» Εισηγητής: Παναγιώτης Γιώτης 20 Μαϊου 2007 Αθήνα

Συστήματα Πολυμέσων. Ενότητα 2: Εισαγωγικά θέματα Ψηφιοποίησης. Θρασύβουλος Γ. Τσιάτσος Τμήμα Πληροφορικής ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

Εισαγωγή στους Αλγορίθμους

Μετάδοση Πολυμεσικών Υπηρεσιών Ψηφιακή Τηλεόραση

Εισαγωγή στην Διοίκηση Επιχειρήσεων

Διδακτική της Πληροφορικής

Λογιστική Κόστους Ενότητα 8: Κοστολογική διάρθρωση Κύρια / Βοηθητικά Κέντρα Κόστους.

Συµπίεση Ψηφιακών Εικόνων:

Διοίκηση Εξωτερικής Εμπορικής Δραστηριότητας

Εισαγωγή στην Διοίκηση Επιχειρήσεων

Εισαγωγή στην Διοίκηση Επιχειρήσεων

Συστήματα Επικοινωνιών

Θέματα Συστημάτων Πολυμέσων. Ενότητα #3: Ιδιότητες μέσων Διδάσκων: Γεώργιος K. Πολύζος Τμήμα: Μεταπτυχιακό Πρόγραμμα Σπουδών Επιστήμη των Υπολογιστών

Εισαγωγή στην Πληροφορική

Τεχνολογία Πολυμέσων. Ενότητα 9: Behaviors. Νικολάου Σπύρος Τμήμα Μηχανικών Πληροφορικής ΤΕ

Μεθοδολογία Έρευνας Κοινωνικών Επιστημών Ενότητα 2: ΣΥΓΚΕΝΤΡΩΣΗ ΠΛΗΡΟΦΟΡΙΩΝ ΜΑΡΚΕΤΙΝΓΚ Λοίζου Ευστράτιος Τμήμα Τεχνολόγων Γεωπόνων-Kατεύθυνση

Τεχνολογία Πολυμέσων. Ενότητα # 4: Ήχος Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής

Εισαγωγή στους Αλγορίθμους Φροντιστήριο 1

Συστήματα Αναμονής. Ενότητα 3: Στοχαστικές Ανελίξεις. Αγγελική Σγώρα Τμήμα Μηχανικών Πληροφορικής ΤΕ

Συστήματα Πολυμέσων. Ενότητα 15: Συμπίεση Ψηφιακού Βίντεο. Θρασύβουλος Γ. Τσιάτσος Τμήμα Πληροφορικής ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

Εισαγωγή στην Διοίκηση Επιχειρήσεων

ΗΛΕΚΤΡΟΤΕΧΝΙΑ-ΗΛΕΚΤΡΟΝΙΚΗ ΕΡΓΑΣΤΗΡΙΟ

Συστήματα Αναμονής. Ενότητα 5: Ανέλιξη Poisson. Αγγελική Σγώρα Τμήμα Μηχανικών Πληροφορικής ΤΕ

Συστήματα Αναμονής. Ενότητα 9: Ανέλιξη Γέννησης - Θανάτου. Αγγελική Σγώρα Τμήμα Μηχανικών Πληροφορικής ΤΕ

Συστήματα Αναμονής. Ενότητα 7: Ουρά Μ/Μ/1. Αγγελική Σγώρα Τμήμα Μηχανικών Πληροφορικής ΤΕ

Προγραμματισμός H/Y Ενότητα 4: Δείκτες. Επικ. Καθηγητής Συνδουκάς Δημήτριος Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά)

Ειδικά Θέματα Δικτύων ΙΙ. Ενότητα 8: Δρομολόγηση κατάστασης ζεύξης (Μέρος 2) Νικολάου Σπύρος Τμήμα Μηχανικών Πληροφορικής ΤΕ

Τίτλος Μαθήματος: Μαθηματική Ανάλυση Ενότητα Γ. Ολοκληρωτικός Λογισμός

Λογιστική Κόστους Ενότητα 11: Λογισμός Κόστους (1)

Εισαγωγικές έννοιες θεωρίας Συστημάτων Αυτομάτου Ελέγχου Ενότητα 2 η : ΠΕΡΙΓΡΑΦΗ ΣΥΣΤΗΜΑΤΩΝ ΜΕ ΜΑΘΗΜΑΤΙΚΑ ΜΟΝΤΕΛΑ

Οργάνωση Υπολογιστών

Στατιστική Ι. Ενότητα 2: Στατιστική Ι (2/4) Αναπλ. Καθηγητής Νικόλαος Σαριαννίδης Τμήμα Διοίκησης Επιχειρήσεων (Κοζάνη)

ΑΝΑΛΥΣΗ ΧΡΗΜΑΤΟΟΙΚΟΝΟΜΙΚΩΝ ΚΑΤΑΣΤΑΣΕΩΝ

Θερμοδυναμική. Ανοικτά Ακαδημαϊκά Μαθήματα. Πίνακες Νερού σε κατάσταση Κορεσμού. Γεώργιος Κ. Χατζηκωνσταντής Επίκουρος Καθηγητής

DIP_06 Συμπίεση εικόνας - JPEG. ΤΕΙ Κρήτης

Συστήματα Αναμονής. Ενότητα 4: Αλυσίδες Markov. Αγγελική Σγώρα Τμήμα Μηχανικών Πληροφορικής ΤΕ

Λογιστική Κόστους Ενότητα 10: Ασκήσεις Προτύπου Κόστους Αποκλίσεων.

Ηλεκτροτεχνία ΙΙ. Ενότητα 1: Βασικές Έννοιες Ηλεκτροτεχία Ηλεκτρονική. Δημήτρης Στημονιάρης, Δημήτρης Τσιαμήτρος Τμήμα Ηλεκτρολογίας

Λογιστική Κόστους Ενότητα 11: Λογισμός Κόστους

Τίτλος Μαθήματος: Μαθηματική Ανάλυση Ενότητα Β. Διαφορικός Λογισμός

Ανάκτηση Πληροφορίας

Προγραμματισμός Ηλεκτρονικών Υπολογιστών 2 - Εργαστήριο

Οργάνωση και Διοίκηση Πωλήσεων

Στατιστική Ι. Ενότητα 3: Στατιστική Ι (3/4) Αναπλ. Καθηγητής Νικόλαος Σαριαννίδης Τμήμα Διοίκησης Επιχειρήσεων (Κοζάνη)

Κβαντική Επεξεργασία Πληροφορίας

Εισαγωγή στους Αλγορίθμους Ενότητα 10η Άσκηση Αλγόριθμος Dijkstra

Διοικητική Λογιστική

Θέματα Συστημάτων Πολυμέσων. Ενότητα # 8: MPEG Διδάσκων: Γεώργιος Πολύζος Τμήμα: Μεταπτυχιακό Πρόγραμμα Σπουδών Επιστήμη των Υπολογιστών

ΤΕΙ ΚΡΗΤΗΣ ΤΜ. ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡ/ΚΗΣ & ΠΟΛΥΜΕΣΩΝ ΔΙΔΑΣΚΩΝ: Δρ. Γ. ΓΑΡΔΙΚΗΣ. Κωδικοποίηση εικόνας

Τεχνολογία Πολυμέσων. Ενότητα # 11: Κωδικοποίηση εικόνων: JPEG Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ, ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ

Οικονομετρία Ι. Ενότητα 2: Ανάλυση Παλινδρόμησης. Δρ. Χαϊδώ Δριτσάκη Τμήμα Λογιστικής & Χρηματοοικονομικής

Transcript:

Τεχνολογία Πολυμέσων Ενότητα 4: Συμπίεση Δεδομένων Νικολάου Σπύρος Τμήμα Μηχανικών Πληροφορικής ΤΕ

Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για εκπαιδευτικό υλικό, όπως εικόνες, που υπόκειται σε άλλου τύπου άδειας χρήσης, η άδεια χρήσης αναφέρεται ρητώς. 2

Χρηματοδότηση Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα. Το έργο «Ανοικτά Ακαδημαϊκά Μαθήματα στο TEI Δυτικής Μακεδονίας και στην Ανώτατη Εκκλησιαστική Ακαδημία Θεσσαλονίκης» έχει χρηματοδοτήσει μόνο τη αναδιαμόρφωση του εκπαιδευτικού υλικού. Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος «Εκπαίδευση και Δια Βίου Μάθηση» και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους. 3

Σκοποί ενότητας Η ενότητα αυτή πραγματεύεται ζητήματα σχετικά με τη συμπίεση δεδομένων. 4

Περιεχόμενα ενότητας Τι είναι συμπίεση; Γιατί χρειαζόμαστε τη συμπίεση; Ορισμοί συμπίεσης. Ποιες είναι οι απαιτήσεις από τη συμπίεση; Κατηγορίες τεχνικών συμπίεσης. Τεχνικές κωδικοποίησης Εντροπίας. Τεχνικές κωδικοποίησης Πηγής. Υβριδικές τεχνικές συμπίεσης. 5

Συμπίεση Δεδομένων

Τι είναι συμπίεση; (1/2) Ένα σημαντικό ερώτημα είναι πάντοτε αν μπορεί η πληροφορία να κωδικοποιηθεί πιο αποδοτικά, δηλ. να βρεθεί ένας τρόπος να μεταδοθεί η ίδια πληροφορία αλλά με λιγότερα bit. Η διαδικασία που επανακωδικοποιεί την εκπεμπόμενη πληροφορία με στόχο να μεταδώσει το ίδιο περιεχόμενο αλλά με μικρότερη επιβάρυνση του καναλιού, δηλαδή με λιγότερα bits ανά σύμβολο, λέγεται συμπίεση. 7

Τι είναι συμπίεση; (2/2) Η πληροφορία πολυμέσων (ψηφιακή εικόνα, ήχος, animation, video) έχει ένα βασικό χαρακτηριστικό που το εκμεταλλευόμαστε για να δημιουργήσουμε αποδοτικούς τρόπους συμπίεσής της: Συνήθως, προέρχεται από ψηφιοποίηση αναλογικών σημάτων του πραγματικού κόσμου και απευθύνεται σε ανθρώπους. Αυτό σημαίνει ότι μπορούμε να εκμεταλλευτούμε τα φυσιολογικά χαρακτηριστικά και περιορισμούς των ανθρώπινων αισθητηρίων οργάνων (μάτι, αυτί) και να συμπιέσουμε την πληροφορία χωρίς να μειώσουμε αισθητά την ποιότητά της (ψυχοφυσιολογική συμπίεση). 8

Γιατί χρειαζόμαστε τη συμπίεση; (1/4) Η υψηλή συχνότητα δειγματοληψίας και το μεγάλο μέγεθος δείγματος δημιουργεί ένα ψηφιακό αρχείο αντίστοιχα μεγάλου μεγέθους για το οποίο πρέπει: Να βρεθεί κατάλληλος αποθηκευτικός χώρος. Η πληροφορία του ψηφιακού αρχείου να μεταφέρεται αρκετά γρήγορα προς αναπαραγωγή στα αντίστοιχα υποσυστήματα (υποσύστημα ήχου, εικόνας, κλπ.). Η πληροφορία να μεταφέρεται ικανοποιητικά γρήγορα στα δίκτυα υπολογιστών. 9

Γιατί χρειαζόμαστε τη συμπίεση; Αποθήκευση: (2/4) Πόση διάρκεια ασυμπίεστου ψηφιακού βίντεο μπορεί να αποθηκευτεί σε ένα οπτικό δίσκο (CD-ROM, DVD-ROM ή Blue-Ray); Τι χωρητικότητα μνήμης χρειαζόμαστε για την αποθήκευση απεικονιστικών εξετάσεις ασθενών (π.χ. ακτινογραφίες, αξονικές τομογραφίες, υπέρηχοι) που παράγονται κατά εκατοντάδες την ημέρα σε ένα νοσοκομείο; 10

Γιατί χρειαζόμαστε τη συμπίεση; Μετάδοση: (3/4) Μπορώ να παρακολουθήσω ένα τηλεοπτικό πρόγραμμα SD ή HD (Standard or High Definition) που μεταδίδεται μέσω του διαδικτύου; Αν έχω σύνδεση PSTN (modem 56kbs); Αν έχω σύνδεση ISDN (2x64 kbps); Αν έχω σύνδεση ADSL (2-24 Mbps) ή VDSL (30-50 Mbps); Αν έχω σύνδεση FTTH / FTTB μέσω οπτικής ίνας (100-1000 Mbps); 11

Γιατί χρειαζόμαστε τη συμπίεση; (4/4) Κόστος: Πόσο θα πληρώσω αν έχω χρέωση με βάση τη διάρκεια σύνδεσης; Πόσο θα πληρώσω αν έχω χρέωση με βάση τον όγκο της διακινούμενης πληροφορίας; Ικανοποίηση χρήσης εφαρμογών πολυμέσων: Πόσο πρέπει να περιμένει ο χρήστης για να ακούσει την απάντηση του συνομιλητή του σε περιβάλλον τηλεδιάσκεψης; Πόσο πρέπει να περιμένει ο χρήστης για να δει μια εικόνα στην ιστοσελίδα που έχει επισκεφθεί; Πόσο πρέπει να περιμένει ο χρήστης για να δει ένα βίντεο ή ένα animation στη ιστοσελίδα που έχει επισκεφθεί; 12

Μερικά παραδείγματα (1/3) Κείμενο: Μια A4 σελίδα κειμένου περιέχει προσεγγιστικά 480 λέξεις και περίπου 4800 χαρακτήρες, δηλαδή ~4.8 Kbytes σε κωδικοποίηση ASCII, ή ~9.6 Kbytes σε κωδικοποίηση Unicode. Eικόνα: Μια εικόνα 1024 x 768 pixels με 256 αποχρώσεις του γκρί (βάθος χρώματος 8 bit) καταλαμβάνει: 1024 x 768 x 1 byte = 768 Kbytes. Η ίδια εικόνα σε πραγματικό χρώμα (βάθος χρώματος 24 bit), δηλαδή 3 bytes per pixel) καταλαμβάνει: 1024 x 768 x 3 byte = 2304 Kbytes = 2.25 Μbytes. 13

Μερικά παραδείγματα (2/3) Ήχος: Τηλεφωνική ποιότητα: 8000 samples/sec x 8 bit/sample = 64kbps = 8 Kbytes/sec. Ποιότητα stereo CD: 44100 samples/sec x 16 bit/sample x 2 = 176.4 Kbytes/sec. 14

Μερικά παραδείγματα (3/3) Βίντεο: Τηλεοπτικό σήμα PAL κανονικής ευκρίνειας (Standard Definition - SD): 576 lines x 720 pixel/line x 3 byte/pixel x 25 frames/sec = 29.6 Mbytes/sec. Τηλεοπτικό σήμα 1080i υψηλής ευκρίνειας (Full High Definition HD): 1080 lines x 1920 pixel/line x 3 byte/pixel x 25 frames/sec = 148.3 Mbytes/sec. Mια ταινία με ασυμπίεστο video SD διάρκειας 90 λεπτών απαιτεί ~150GB. Mια ταινία με ασυμπίεστο video Full HD 90 διάρκειας λεπτών απαιτεί ~750GB. 15

Λύσεις Για αποδοτικότερη αποθήκευση και μεταφορά πολυμεσικών πληροφοριών οι πιθανές λύσεις είναι: Μέσα αποθήκευσης με μεγαλύτερη χωρητικότητα. Δίκτυα μετάδοσης πληροφοριών με μεγαλύτερο bandwidth (ευρυζωνικές συνδέσεις). Συμπίεση: Μείωση του αριθμού bits ΑΛΛΑ με συμβιβασμούς: Μείωση της διαθεσιμότητας πληροφορίας (απαιτείται αποσυμπίεση). Αυξημένες απαιτήσεις σε υπολογιστική ισχύ ανάλογα με την πολυπλοκότητα των διαδικασιών συμπίεσης-αποσυμπίεσης. Απώλειες πληροφορίας. 16

Ορισμοί συμπίεσης (1/4) Συμπίεση: Μια συνάρτηση f εφαρμόζεται σε κάθε ενότητα δεδομένων di ώστε να παραχθούν δεδομένα mi f(di)= mi. Αποσυμπίεση: Μια συνάρτηση fr εφαρμόζεται στα δεδομένα mi ώστε να παραχθούν τα δεδομένα dr fr(mi)= dr. 17

Ορισμοί συμπίεσης (2/4) Trade-off: Ποσοστό Συμπίεσης έναντι της Παραποίησης Δεδομένων. Ένας αλγόριθμος συμπίεσης προκαλεί μια σειρά μετασχηματισμών στο αρχικό σήμα οι οποίοι μπορεί να είναι: Χωρίς απώλειες ή αντιστρεπτοί. Με απώλειες ή μη αντιστρεπτοί. Η μορφή συμπίεσης που επιλέγουμε εξαρτάται από το είδος της πληροφορίας. 18

Ορισμοί συμπίεσης (3/4) Αλγόριθμος Συμπίεσης : Είναι κάθε αλγόριθμος που έχει σαν στόχο την επίτευξη συμπίεσης των δεδομένων εισόδου. Δηλαδή ο αλγόριθμος εφαρμόζει μια απλή και συγκεκριμένη μεθοδολογία επεξεργασίας των δεδομένων ώστε να προκύψει μια περισσότερο συμπιεσμένη μορφή τους. Συμπιεστής : Είναι ένα γενικότερο σχήμα συμπίεσης (και αποσυμπίεσης) που συνήθως περιλαμβάνει περισσότερους από έναν αλγόριθμους στη σειρά, δηλ. τα δεδομένα εξόδου του ενός να αποτελούν δεδομένα εισόδου του επόμενου. π.χ. JPEG, MPEG. 19

Ορισμοί συμπίεσης (4/4) Λόγος Συμπίεσης (compression ratio): Πρόκειται για ένα μέγεθος που εκφράζει την σχέση του χώρου που καταλαμβάνουν τα αρχικά δεδομένα ως προς τον χώρο που καταλαμβάνουν τα συμπιεσμένα δεδομένα. Ο λόγος συμπίεσης είναι ένας καθαρός αριθμός και δίνεται από τη σχέση; Λόγος συμπίεσης = αρχικό μέγεθος δεδομένων / μέγεθος συμπιεσμένων δεδομένων. Για παράδειγμα, λόγος συμπίεσης «3 προς 1» (γράφεται 3:1) σημαίνει ότι η μετά τη συμπίεση το μέγεθος του αρχείου θα είναι το 1/3 του αρχικού. Ρυθμός συμπίεσης (compression rate): Εκφράζει το ρυθμό μετάδοσης των συμπιεσμένων δεδομένων και μετριέται συνήθως σε bits per second (bps). 20

Συμπίεση και πολυμεσικές εφαρμογές (1/3) Οι απαιτήσεις κατά τη συμπίεση και αποσυμπίεση κάποιας μορφής πληροφορίας διαφοροποιούνται από εφαρμογή σε εφαρμογή. Εξαρτώνται άμεσα από το αν η εφαρμογή είναι διαλογικού τύπου ή τύπου ανάκλησης δεδομένων. Εικόνα 1: Συμπίεση. Πηγή: Διδάσκων (2015). 21

Συμπίεση και πολυμεσικές εφαρμογές (2/3) Εφαρμογές διαλογικού τύπου (Dialogue Mode). Η διαδικασία συμπίεσης/αποσυμπίεσης δεν πρέπει να διαρκεί πάνω από 150 msecs (end-to-end delay) για συνηθισμένες εφαρμογές. Καθυστέρηση της τάξης των 50 msecs για face-to-face εφαρμογές. Για τη συνολική καθυστέρηση (end-to-end delay) πρέπει να συνυπολογιστούν καθυστερήσεις που οφείλονται στο δίκτυο, το πρωτόκολλο επικοινωνίας, τις συσκευές εισόδου/εξόδου που χρησιμοποιούνται κλπ. Εικόνα 2: Εφαρμογή διαλογικού τύπου. Πηγή: Διδάσκων (2015). 22

Συμπίεση και πολυμεσικές εφαρμογές (3/3) Εφαρμογές τύπου ανάκτησης δεδομένων (Retrieval Mode). Γρήγορη αναζήτηση και ανάκτηση πληροφοριών (forward and backward) και ταυτόχρονη προβολή τους. Τυχαία προσπέλαση σε οποιοδήποτε πλαίσιο εικόνας ή ήχου, με χρόνο προσπέλασης μικρότερο από 0,5 sec. Δυνατότητα αποσυμπίεσης σε τυχαία μεμονωμένα πλαίσια (έτσι ώστε να επιτρέπεται η επεξεργασία τους). Εικόνα 3: Εφαρμογή ανάκτησης δεδομένων. Πηγή: Διδάσκων (2015). 23

Κατηγορίες τεχνικών συμπίεσης (1/2) Ανάλογα με τη σχέση που έχει το αρχικό σήμα µε το αποτέλεσμα της αποσυμπίεσης υπάρχουν δύο κατηγορίες μεθόδων συμπίεσης: 1. Τεχνικές χωρίς απώλειες (lossless compression schemes): Δεν μεταβάλλουν τα χαρακτηριστικά του σήματος κατά τη διάρκεια της συμπίεσης => το σήμα που προκύπτει κατά την αποσυμπίεση είναι ακριβές αντίγραφο του αρχικού. Τεχνικές αυτής της μορφής χρησιμοποιούνται για τη συμπίεση σημάτων τα οποία δε θα πρέπει να αλλοιωθούν κατά τη διαδικασία της συμπίεσης / αποσυμπίεσης (π.χ. ιατρικά σήματα όπως υπερηχογραφήματα). 24

Κατηγορίες τεχνικών συμπίεσης (2/2) 2. Τεχνικές με απώλειες (lossy compression schemes): Αλλοιώνουν τα χαρακτηριστικά του σήματος κατά τη διαδικασία της συμπίεσης. Τεχνικές αυτής της μορφής χρησιμοποιούνται κυρίως για τη συμπίεση ηχητικών σημάτων ή εικόνων. Εκμεταλλεύονται τα φυσιολογικά χαρακτηριστικά της ανθρώπινης όρασης και ακοής για να εισάγουν επιλεκτικά αλλοιώσεις στο σήμα οι οποίες γίνονται δύσκολα αντιληπτές. 25

Συμπίεση χωρίς απώλειες (1/2) Η συμπίεση χωρίς απώλειες εξαλείφει τον πλεονασμό της πληροφορίας χωρίς να «θυσιάζει» κανένα δεδομένο. Π.χ. ο συμπιεστής WinZip. Παράδειγμα: Αν η αρχική πληροφορία είχε τη μορφή: ΠΠΠΟΟΟΟΟΟΛΛΥΥΥΥΥΥΥΜΜΕΕΕΕΕΕΕΕΣΣΣΑΑΑΑΑΑΑ Αφαιρώντας τον πλεονασμό συμπιέζεται: 3Π 6Ο 2Λ 7Υ 2Μ 8Ε 3Σ 7Α Κατά την αποκωδικοποίηση η πληροφορία αναπαράγεται με την αρχική της μορφή: ΠΠΠΟΟΟΟΟΟΛΛΥΥΥΥΥΥΥΜΜΕΕΕΕΕΕΕΕΣΣΣΑΑΑΑΑΑΑ 26

Συμπίεση χωρίς απώλειες (2/2) Ευρέως διαδεδομένοι αλγόριθμοι χωρίς απώλειες είναι οι εξής: Run Length Encoding (RLE). Huffman. Delta. LZW. 27

Συμπίεση με απώλειες (1/2) Στη συμπίεση με απώλειες εφαρμόζονται αλγόριθμοι που αφαιρούν μέρος της πληροφορίας με επιλεκτικό τρόπο. Αυτό μπορεί να γίνει γιατί υπάρχουν είδη πληροφορίας που δεν αλλοιώνονται ουσιαστικά από την απώλεια κάποιων bit. 28

Συμπίεση με απώλειες (2/2) Παράδειγμα: Αν η αρχική πληροφορία είχε τη μορφή: ΠΠΠΟΟΟΟΟΟΛΛΥΥΥΥΥΥΥΜΜΕΕΕΕΕΕΕΕΣΣΣΑΑΑΑΑΑΑ Αφαιρώντας τον πλεονασμό συμπιέζεται: 3Π 6Ο 2Λ 7Υ 2Μ 8Ε 3Σ 7Α Αν όμως ο αλγόριθμος αγνοεί τις υψηλότερες συχνότητες εμφάνισης (π.χ. πάνω από το 5) τότε κωδικοποιεί ως εξής: 3Π 5Ο 2Λ 5Υ 2Μ 5Ε 3Σ 5Α Κατά την αποκωδικοποίηση η πληροφορία αναπαράγεται με τη μορφή: ΠΠΠΟΟΟΟΟΛΛΥΥΥΥΥΜΜΕΕΕΕΕΣΣΣΑΑΑΑΑ 29

Κατηγορίες τεχνικών συμπίεσης - Συνέχεια (1/2) Ανάλογα με τη μέθοδο που ακολουθείται για τη συμπίεση μίας πηγής πληροφορίας υπάρχουν τρεις κατηγορίες τεχνικών συμπίεσης: 1. Τεχνικές κωδικοποίησης εντροπίας (entropy encoding): Είναι τεχνικές χωρίς απώλειες οι οποίες δε λαμβάνουν υπόψη τους τα ιδιαίτερα χαρακτηριστικά του κάθε μέσου και τη φύση των σημάτων στα οποία εφαρμόζονται. Οι συγκεκριμένες μέθοδοι θεωρούν ότι το σήμα που συμπιέζεται δεν είναι τίποτα άλλο παρά μία σειρά από δυαδικά ψηφία. 30

Κατηγορίες τεχνικών συμπίεσης - Συνέχεια (2/2) 2. Τεχνικές κωδικοποίησης πηγής (source encoding): Λαμβάνουν υπόψη τους τα ιδιαίτερα χαρακτηριστικά του κάθε μέσου και τη φύση του σήματος που συμπιέζεται. Πετυχαίνουν μεγαλύτερους βαθμούς συμπίεσης από τις κωδικοποιήσεις εντροπίας αν και ο βαθμός συμπίεσης είναι μεταβλητός και εξαρτάται από τη μορφή του συγκεκριμένου σήματος. Μπορεί να είναι τεχνικές με ή χωρίς απώλειες. 3. Υβριδικές Τεχνικές κωδικοποίησης (hybrid encoding): Οι περισσότερες τεχνικές κωδικοποίησης είναι υβριδικές, δηλαδή οι σχετικοί αλγόριθμοι χρησιμοποιούν ένα μίγμα τεχνικών κωδικοποίησης εντροπίας και πηγής. 31

Τεχνικές κωδικοποίησης εντροπίας (1/2) Οι τεχνικές κωδικοποίησης εντροπίας αντιμετωπίζουν την πληροφορία απλά σαν μια σειρά από bits και επιχειρούν να τη συμπιέσουν συνήθως εφαρμόζοντας κάποιες στατιστικές μεθόδους. Εκμεταλλεύονται, τους κανόνες στην εκπομπή των συμβόλων και προσπαθούν να μειώσουν τον πλεονασμό. Οι αλγόριθμοι κωδικοποίησης εντροπίας προσφέρουν συμπίεση χωρίς απώλειες. 32

Τεχνικές κωδικοποίησης εντροπίας (2/2) Τεχνικές Περιορισμού Επαναλαμβανόμενων Ακολουθιών: RLC (Run Length Encoding). Zero Suppression. Τεχνικές Στατιστικής κωδικοποίησης : Huffman. Αριθμητική. Αντικατάσταση προτύπων (π.χ. LZW, LUT). 33

Εντροπία (1/2) Εντροπία (entropy) είναι ο (θεωρητικά) ελάχιστος αριθμός από bits ανά σύμβολο που απαιτείται για τη κωδικοποίηση / μετάδοση ενός μηνύματος. Η εντροπία ενός μηνύματος υπολογίζεται με βάση την εξίσωση Shannon: H n i 1 p i log 2 p i Όπου n o αριθμός των συμβόλων που αποτελούν το μήνυμα και pi η πιθανότητα εμφάνισης του συμβόλου i. 34

Εντροπία (2/2) Η εντροπία υποδεικνύει τη βέλτιστη συμπίεση (χωρίς απώλειες), που μπορεί να επιτευχθεί. Η αποδοτικότητα κωδικοποίησης υπολογίζεται με βάση τον μέσο αριθμό bits ανά κωδική λέξη (codeword): Average number of bits per codeword n i 1 N i p i Όπου n o αριθμός των συμβόλων που αποτελούν το μήνυμα, pi η πιθανότητα εμφάνισης του συμβόλου i και Νi τα bits που χρησιμοποιούνται για την κωδικοποίηση του συμβόλου i. 35

Άσκηση εντροπίας (1/2) Ένα μήνυμα αποτελείται από τα σύμβολα A,B,C,D,E των οποίων οι πιθανότητες εμφάνισης έχουν εκτιμηθεί ως: P(A)=0.4, P(B)=0.08, P(C)=0.16, P(D)=0.16, P(E)=0.2 Να υπολογιστεί η εντροπία του μηνύματος. Να υπολογιστεί η αποδοτικότητα του βέλτιστου αλγορίθμου κωδικοποίησης του παραπάνω μηνύματος αν χρησιμοποιείται σταθερού μεγέθους μήκος λέξης. 36

Άσκηση εντροπίας (2/2) Λύση: Η = 2.13 bits / σύμβολο. Για σταθερό μήκος λέξης χρειαζόμαστε 3 bits /σύμβολο, αφού έχουμε n = 5 σύμβολα χρειαζόμαστε L bits ανά σύμβολο ώστε να ισχύει 2L n. Το ελάχιστο L που ικανοποιεί την προηγούμενη σχέση είναι L = 3. O μέγιστος βαθμός συμπίεσης που θα μπορούσε να επιτευχθεί με κωδικοποίηση εντροπίας είναι: L/H => 1.41:1. 37

Περιορισμός επαναλαμβανόμενων ακολουθιών (1/2) Βασική Ιδέα: Η κωδικοποίηση Περιορισμού Επαναλαμβανόμενων Ακολουθιών βασίζεται στην παρατήρηση ότι σε πολλές περιπτώσεις μέσα σε μια ομάδα δεδομένων εμφανίζεται το ίδιο σύμβολο να επαναλαμβάνεται πολλές φορές στη σειρά. Θα μπορούσε επομένως αυτή η ακολουθία πολλαπλών εμφανίσεων του ίδιου συμβόλου να αντικατασταθεί από δύο άλλα σύμβολα: a. Το σύμβολο που εμφανίζεται. b. Πόσες φορές εμφανίζεται. Εικόνα 4: Περιορισμός επαναλαμβανόμενων ακολουθιών. Πηγή: Διδάσκων (2015). 38

Περιορισμός επαναλαμβανόμενων ακολουθιών (2/2) Ανάλυση: Αποτελεσματική τεχνική όταν ένας χαρακτήρας επαναλαμβάνεται τουλάχιστον τέσσερις φορές (βλ. σχήμα). Η ίδια ουσιαστικά τεχνική μπορεί να εφαρμοστεί και σε εικόνες όπου η ίδια τιμή φωτεινότητας ή χρώματος επαναλαμβάνεται πολλές φορές. Η μέθοδος είναι αποτελεσματική για την συμπίεση κειμένου και εικόνων δύο τόνων (άσπρο μαύρο). Εικόνα 4: Περιορισμός επαναλαμβανόμενων ακολουθιών. Πηγή: Διδάσκων (2015). 39

Στατιστική κωδικοποίηση (1/2) Κωδικοποίηση Huffman: Τα πιο συχνά χρησιμοποιούμενα σύμβολα κωδικοποιούνται με λιγότερα bits. Τα σπάνια εμφανιζόμενα σύμβολα θα έχουν μεγαλύτερου μεγέθους κωδικές λέξεις, ενώ τα συχνά μικρότερου μεγέθους. 40

Στατιστική κωδικοποίηση (2/2) Αντικατάσταση προτύπων (packbits encoding): Ακολουθίες συμβόλων κωδικοποιούνται ομαδικά ως ένας νέο σύμβολο τους με λιγότερα bits. Για παράδειγμα οι σημειώσεις του μαθήματος θα μπορούσαν συνολικά να συμπιεστούν με την ανάθεση μιας κωδικής λέξης *π αντί για πολυμέσα. Είναι φανερό ότι η μέθοδος απαιτεί την ύπαρξη λεξικού, όπου αποθηκεύονται οι ακολουθίες που αντιστοιχούν σε κάθε κωδικό για να μπορεί να γίνει η αποσυμπίεση. Το λεξικό προκύπτει από ανάλυση του κειμένου, ενώ κάποιες ακολουθίες συμβόλων είναι εκ των προτέρων γνωστό ότι θα εμφανιστούν σίγουρα. 41

Κωδικοποίηση Huffman (1/2) Βασική Ιδέα: Τα πιο συχνά χρησιμοποιούμενα σύμβολα κωδικοποιούνται με μικρότερες σειρές από bits. Σε αντίθεση με τα λιγότερο χρησιμοποιούμενα τα οποία κωδικοποιούνται με μεγαλύτερες σειρές από bits. 42

Κωδικοποίηση Huffman (2/2) Ανάλυση: Η τεχνική βασίζεται σε στατιστικές μεθόδους (πιθανότητες εμφάνισης συμβόλων). Κατασκευή δυαδικού δέντρου, αρχίζοντας από τους χαρακτήρες με τη μικρότερη πιθανότητα εμφάνισης. Η τεχνική μπορεί να χρησιμοποιηθεί και για κωδικοποίηση ομάδων συμβόλων, όπου η έννοια του «συμβόλου» αντικαθίσταται από εκείνη της «ομάδας συμβόλων». Η τεχνική μπορεί να χρησιμοποιηθεί σε οποιοδήποτε άλλο μέσο (εκτός από κείμενο), όπου η έννοια του «χαρακτήρα» αντικαθίσταται από εκείνη της «ομάδας από bytes». 43

Παράδειγμα κωδικοποίησης Huffman (1/4) Να βρεθούν οι κωδικές λέξεις Huffman για την αναπαράσταση μηνυμάτων που απαρτίζονται από τα εξής οκτώ (8) σύμβολα {Α,Β,Γ,Δ,Ε,Ζ,Η.Θ} και των οποίων οι πιθανότητες εμφάνισης στα μηνύματα είναι όπως υποδεικνύεται στον πίνακα της επόμενης διαφάνειας. Να υπολογισθεί το μέσο μήκος λέξης της κωδικοποίησης και να συγκριθεί με την αντίστοιχη εντροπία των μηνυμάτων. 44

Παράδειγμα κωδικοποίησης Huffman (2/4) Πίνακας 1: Πιθανότητες εμφάνισης. Πηγή: Διδάσκων (2015). Σύμβολο Πιθανότητα εμφάνισης Α 0.15 Β 0.03 Γ 0.04 Δ 0.12 Ε 0.50 Ζ 0.02 Η 0,10 Θ 0.04 45

Λύση: Παράδειγμα κωδικοποίησης Huffman (3/4) Εικόνα 5: Λύση παραδείγματος κωδικοποίησης Huffman. Πηγή: Διδάσκων (2015). 46

Παράδειγμα κωδικοποίησης Huffman (4/4) Λύση: Πίνακας 2: Λύση παραδείγματος κωδικοποίησης Huffman. Πηγή: Διδάσκων (2015). 47

Άσκηση κωδικοποίησης Huffman (1/2) Να βρεθούν οι κωδικές λέξεις Huffman για την αναπαράσταση μηνυμάτων που απαρτίζονται από τα εξής οκτώ (8) σύμβολα {A,B,C,D,E,F,G.H} και των οποίων οι πιθανότητες εμφάνισης στα μηνύματα είναι όπως υποδεικνύεται στον πίνακα της επόμενης διαφάνειας. Να υπολογισθεί το μέσο μήκος λέξης της κωδικοποίησης και να συγκριθεί με την αντίστοιχη εντροπία των μηνυμάτων. 48

Άσκηση κωδικοποίησης Huffman (2/2) Πίνακας 3: Πίνακας άσκησης κωδικοποίησης Huffman. Πηγή: Διδάσκων (2015). Σύμβολο Πιθανότητα εμφάνισης A 0.18 Β 0.035 C 0.16 D 0.13 E 0.035 F 0.10 G 0,16 H 0.20 49

Αντικατάσταση προτύπων (1/2) Βασική Ιδέα: Αναζήτηση των πιο συχνά χρησιμοποιούμενων ακολουθιών συμβόλων κι αντικατάστασή τους από ειδικές κωδικές λέξεις (codewords). Ανάλυση: Η τεχνική αυτή (pattern substitution) είναι παραλλαγή της τεχνικής «Περιορισμού των επαναλαμβανόμενων ακολουθιών». Στην αγγλική, πιο συχνά χρησιμοποιούμενα ζεύγη χαρακτήρων είναι τα εξής: (προσοχή στους χαρακτήρες κενού) E, T, TH, A, S, RE, IN, HE. Οι ειδικοί χαρακτήρες που αντικαθιστούν τα παραπάνω ζευγάρια δεν πρέπει να εμφανίζονται πουθενά αλλού στο κείμενο. 50

Αντικατάσταση προτύπων (2/2) Ανάλυση (Συνέχεια): Το λεξικό προκύπτει από ανάλυση κειμένου. Η τεχνική μπορεί να πετύχει συμπίεση της τάξης του 10% Ο ευρέως διαδεδομένος αλγόριθμος συμπίεσης LZW (Lempel, Ziv & Welch) βασίζεται στη λογική αντικατάστασης προτύπων. 51

Παράδειγμα συμπίεσης LZW (1/2) Έστω η αρχική ακολουθία αριθμών (π.χ. τιμών δειγμάτων): 123 145 201 4 119 89 243 245 59 11 206 145 201 4 243 245... Με βάση των αλγόριθμο LZW η ακολουθία που θα προκύψει από τη συμπίεση θα είναι: 123 256 119 89 257 59 11 206 256 257... Είχαμε δηλαδή τις αντικαταστάσεις: 145 201 4 => 256. 243 245 => 257. 52

Παράδειγμα συμπίεσης LZW (2/2) Εικόνα 6: Παράδειγμα συμπίεσης LZW. Πηγή: Διδάσκων (2015). 53

Τεχνικές κωδικοποίησης πηγής (1/3) Στη κωδικοποίηση πηγής οι μετασχηματισμοί τους οποίους υφίστανται το αρχικό σήμα, με στόχο τη συμπίεση, εξαρτώνται άμεσα από τον τύπο του. Για παράδειγμα, μία τέτοια μέθοδος μπορεί να ανιχνεύει και να συμπιέζει δραστικά περιόδους σιωπής σε ένα ηχητικό σήμα δεδομένου ότι οι τελευταίες δεν περιέχουν καμία χρήσιμη ακουστική πληροφορία πέραν της διάρκειας τους. Δηλαδή, οι μετασχηματισμοί του σήματος κάνουν χρήση των ιδιαίτερων σημασιολογικών χαρακτηριστικών που μεταφέρει το σήμα. 54

Τεχνικές κωδικοποίησης πηγής (2/3) Οι τεχνικές κωδικοποίησης πηγής, στη γενική περίπτωση, επιτυγχάνουν μεγαλύτερα ποσοστά συμπίεσης σε σχέση με την κωδικοποίηση εντροπίας. Μειονεκτούν στη σταθερότητα, γιατί το ποσοστό συμπίεσης που επιτυγχάνουν διαφοροποιείται ανάλογα με το αντικείμενο που συμπιέζεται. Η κωδικοποίηση πηγής μπορεί να λειτουργήσει και με απώλειες και χωρίς απώλειες. 55

Τεχνικές κωδικοποίησης πηγής (3/3) Οι τεχνικές κωδικοποίησης πηγής διακρίνονται σε τρεις τύπους: Κωδικοποίηση μετασχηματισμού (transform encoding). Διαφορική ή προβλεπτική κωδικοποίηση (differential or predictive encoding). Διανυσματική κβαντοποίηση (vector quantization). Να σημειωθεί ότι οι παραπάνω κατηγορίες κωδικοποίησης δεν αποκλείουν η μια την άλλη. Υπάρχουν αλγόριθμοι που συνδυάζουν τεχνικές δύο ή και όλων των κατηγοριών για να επιτύχουν καλύτερα αποτελέσματα. 56

Κωδικοποίηση μετασχηματισμού (1/6) Βασική Ιδέα: Στη κωδικοποίηση μετασχηματισμού, το σήμα υφίσταται ένα μαθηματικό μετασχηματισμό από το αρχικό πεδίο του χρόνου ή του χώρου σε ένα αφηρημένο πεδίο το οποίο είναι πιο κατάλληλο για συμπίεση. Αυτή η διαδικασία είναι αντιστρεπτή, δηλαδή υπάρχει ο αντίστροφος μετασχηματισμός που θα επαναφέρει το σήμα στην αρχική του μορφή. Ένα τέτοιος μετασχηματισμός είναι ο μετασχηματισμός Fourier. Μέσω του μετασχηματισμού Fourier μια συνάρτηση του χρόνου g(t) μπορεί να μετασχηματιστεί σε μια G(f) στο πεδίο των συχνοτήτων. 57

Κωδικοποίηση μετασχηματισμού Ανάλυση: (2/6) Αφού επιλεχθεί κι εκτελεστεί ο μετασχηματισμός, βρίσκουμε τους πιο σημαντικούς από τους συντελεστές και τους περιγράφουμε με μεγάλη ακρίβεια. Τους λιγότερο σημαντικούς μπορούμε να τους περιγράψουμε με μικρότερη ακρίβεια ή και να τους αγνοήσουμε τελείως. Κάνοντας κάτι τέτοιο η διαδικασία συμπίεσης έχει απώλειες. Οι μετασχηματισμοί από μόνοι τους είναι αντιστρεπτοί. 58

Κωδικοποίηση μετασχηματισμού Πεδίο του Χρόνου. (3/6) Εικόνα 7: Κωδικοποίηση μετασχηματισμού - Πεδίο του Χρόνου. Πηγή: Διδάσκων (2015). 59

Κωδικοποίηση μετασχηματισμού (4/6) Μετασχηματισμός T Πεδίο της Συχνότητας. Δεδομένα που πιθανόν να μην γίνονται αντιληπτά από το αυτί Εικόνα 8: Κωδικοποίηση μετασχηματισμού - Πεδίο της Συχνότητας. Πηγή: Διδάσκων (2015). 60

Κωδικοποίηση μετασχηματισμού (5/6) Ένας μετασχηματισμός (transform) είναι μια μαθηματική διαδικασία που με βάση κάποιον αλγόριθμο αντιστοιχεί μία σειρά από τιμές σε μια άλλη σειρά τιμών. Ο μετασχηματισμός επεκτείνει την έννοια της συνάρτησης επιτρέποντας στις παραμέτρους εισόδου και εξόδου να μην είναι απλές τιμές αλλά συναρτήσεις, δηλαδή σύνολα τιμών. Εικόνα 9: Επέκταση της έννοιας της συνάρτησης. Πηγή: Διδάσκων (2015). 61

Κωδικοποίηση μετασχηματισμού (6/6) Εικόνα 10: Από το πεδίο του χρόνου στο πεδίο της συχνότητας. Πηγή: Διδάσκων (2015). 62

Μετασχηματισμοί Fourier (1/3) Οι μετασχηματισμοί Fourier μετασχηματίζουν μια συνάρτηση g(t) από το πεδίο του χρόνου σε μια συνάρτηση G(f) στο πεδίο των συχνοτήτων και προσδιορίζουν το πλάτος G καθεμιάς συχνότητας f στις οποίες αναλύεται η αρχική g(t). Εικόνα 11: Μετασχηματισμός Fourier. Πηγή: Διδάσκων (2015). 63

Μετασχηματισμοί Fourier (2/3) Στο σχήμα οι τελείες δείχνουν τις τιμές των δειγμάτων από τις οποίες αποτελείται το σήμα (πρόκειται για ψηφιοποίηση ήχου). Εικόνα 12: Οι τιμές των δειγμάτων. Πηγή: Διδάσκων (2015). 64

Μετασχηματισμοί Fourier (3/3) Οι σχετικές τιμές των πλατών (συντελεστές Fourier) δείχνουν ποιες συχνότητες συνεισφέρουν περισσότερο στη διαμόρφωση του σήματος. Εικόνα 13: Οι τιμές των πλατών. Πηγή: Διδάσκων (2015). 65

Διακριτός μετασχηματισμός συνημιτόνου - DCT Ο Διακριτός Μετασχηματισμός Συνημιτόνου (Discrete Cosine Transform, DCT) εφαρμόζεται συνήθως για την συμπίεση σημάτων εικόνας & ήχου. Ο συγκεκριμένος μετασχηματισμός μετατρέπει το διακριτό σήμα (δηλ. τις τιμές των δειγμάτων) σε μια σειρά από απλές ακέραιες τιμές (τους συντελεστές του μετασχηματισμού) που αποτελούν τα πλάτη των συχνοτήτων που το συνθέτουν. Στη συνέχεια είναι εύκολο να μηδενίσει κανείς τους μικρότερους συντελεστές και να επιτύχει έτσι σημαντική συμπίεση. Η τεχνική αυτή αποτελεί τη βάση των λεγόμενων ψυχοφυσιολογικών συμπιεστών (JPEG, MPEG). 66

Διαφορική ή προβλεπτική Βασική Ιδέα: κωδικοποίηση (1/2) Όπως όλες οι τεχνικές πρόβλεψης (predictive techniques), βασίζεται στην πρόβλεψη (με βάση τις προηγούμενες τιμές δειγμάτων) του ποια θα είναι η επόμενη τιμή του δείγματος. Κωδικοποιείται η διαφορά της πρόβλεψης από την πραγματική τιμή. Εκμετάλλευση του γεγονότος ότι συνεχόμενα δείγματα (λόγω της συχνότητας δειγματοληψίας) θα έχουν παρόμοιες τιμές. 67

Διαφορική ή προβλεπτική κωδικοποίηση (2/2) Ανάλυση: Χρησιμοποιείται συνήθως σε κωδικοποίηση μονοδιάστατων σημάτων (ήχος) και κωδικοποιεί ένα δείγμα ως διαφορά από το προηγούμενό του. Επειδή η διαφορά αυτή είναι πολλές φορές μικρή ή ανύπαρκτη, η κωδικοποίηση των διαφορών μπορεί να γίνει μόνο με 4 bits χωρίς απώλεια πληροφοριών. Μειονέκτημα: Σε περιπτώσεις μεγάλων διαφορών ανάμεσα σε γειτονικά δείγματα χάνεται πληροφορία. Το πρόβλημα αντιμετωπίζεται με την τεχνική της προσαρμοζόμενης DPCM, όπου ο ρυθμός δειγματοληψίας μεταβάλλεται στις περιοχές που εμφανίζουν σημαντικές αλλαγές στη δομή του μέσου ( compression on-the-fly ). 68

Μέθοδοι διαφορικής ή προβλεπτικής κωδικοποίησης (1/7) Διαφορική παλμοκωδική διαμόρφωση. Differential Pulse Code Modulation. Ο μηχανισμός που χρησιμοποιείται για την πρόβλεψη των τιμών των δειγμάτων είναι σταθερός σε όλη τη διάρκεια της κωδικοποίησης. Η προβλεπόμενη τιμή κάθε δείγματος είναι απλά η τιμή του προηγούμενου δείγματος. Δηλαδή για τη χρονική στιγμή t θα κωδικοποιηθεί η διαφορά των δειγμάτων s(t)-s(t-1) όπου ως προβλεπόμενη τιμή έχει χρησιμοποιηθεί η τιμή του δείγματος s(t-1) τη χρονική στιγμή t-1. Η κωδικοποίηση διαφορικής παλμοκωδικής διαμόρφωσης έχει ακριβώς σαν βασική ιδέα την καταγραφή όχι της ακριβούς τιμής κάθε δεδομένου αλλά της διαφοράς του από μια πρόβλεψη. Στη συγκεκριμένη περίπτωση η πρόβλεψη για τη τιμή του δείγματος είναι η τιμή του προηγούμενου δείγματος. 69

Μέθοδοι διαφορικής ή προβλεπτικής κωδικοποίησης (2/7) Διαφορική παλμοκωδική διαμόρφωση (Differential Pulse Code Modulation). Εικόνα 14: Διαφορική παλμοκωδική διαμόρφωση. Πηγή: Διδάσκων (2015). 70

Μέθοδοι διαφορικής ή προβλεπτικής κωδικοποίησης (3/7) Δέλτα διαμόρφωση (Delta Modulation). Στη δέλτα διαμόρφωση, η διαφορά μεταξύ της προβλεπόμενης και της τρέχουσας τιμής του δείγματος κωδικοποιείται με ένα μόνο bit. Αυτό σημαίνει ότι κάθε δείγμα μπορεί να είναι είτε μεγαλύτερο είτε μικρότερο κατά ένα κβάντο (διάστημα δειγματοληψίας) από το προηγούμενο του. Αυτός ο περιορισμός οδηγεί σε μεγάλη οικονομία αλλά αν το σήμα αλλάζει γρήγορα θα υπάρχει μεγάλη απώλεια πληροφορίας. Η δέλτα διαμόρφωση είναι κατάλληλη για σήματα χαμηλών συχνοτήτων που δειγματοληπτούνται με συχνότητα αρκετά μεγαλύτερη από τη συχνότητα Nyquist. 71

Μέθοδοι διαφορικής ή προβλεπτικής κωδικοποίησης (4/7) Παράδειγμα: Αρχικά δεδομένα: 28 30 47 14 29 28 31 25 27 28 32 33 37 41 29 Δεδομένα μετά την κωδικοποίηση δέλτα: 28 +2 +19 14 +1 0 +3 3 1 0 +4 +5 +9 +12 +1 72

Μέθοδοι διαφορικής ή προβλεπτικής κωδικοποίησης (5/7) Δέλτα διαμόρφωση (Delta Modulation). Εικόνα 15: Δέλτα διαμόρφωση. Πηγή: Διδάσκων (2015). 73

Μέθοδοι διαφορικής ή προβλεπτικής κωδικοποίησης (6/7) Προσαρμοστική διαφορική παλμοκωδική διαμόρφωση (Adaptive DPCM). Στην προσαρμοστική διαφορική παλμοκωδική διαμόρφωση (ADPCM), αντί να χρησιμοποιείται ένας σταθερός μηχανισμός πρόβλεψης, χρησιμοποιείται ένας δυναμικός μηχανισμός που προσαρμόζεται ανάλογα με τα χαρακτηριστικά του προς δειγματοληψία σήματος. 74

Μέθοδοι διαφορικής ή προβλεπτικής κωδικοποίησης (7/7) Εικόνα 16: Μέθοδοι διαφορικής ή προβλεπτικής κωδικοποίησης. Πηγή: Διδάσκων (2015). 75

Διανυσματική κβαντοποίηση (1/4) Η διανυσματική κβαντοποίηση αποτελεί μια παραλλαγή της μεθόδου αντικατάστασης προτύπων στην οποία όμως επιτρέπονται απώλειες. Βασική Ιδέα: Τα δεδομένα χωρίζονται σε διανύσματα. Αντί να μεταδίδεται η πραγματική πληροφορία, μεταδίδεται η ετικέτα των πιο ταιριαστών προτύπων μέσα από ένα λεξικό. 76

Διανυσματική κβαντοποίηση (2/4) Εικόνα 17: Διανυσματική κβαντοποίηση. Πηγή: Διδάσκων (2015). 77

Διανυσματική κβαντοποίηση Ανάλυση: (3/4) Τα δεδομένα χωρίζονται σε τμήματα που ονομάζονται διανύσματα. Για παράδειγμα, αν τα δεδομένα μας αποτελούν μια εικόνα, κάθε διάνυσμα μπορεί να είναι ένα τετράγωνο ή παραλληλόγραμμο τμήμα της εικόνας (βλέπε κωδικοποίηση Quadtree). Υπάρχει ένας πίνακας που περιέχει ένα σύνολο από πρότυπα διανύσματα (Look-Up Table). Αυτός ο πίνακας αποτελεί το λεξικό της μεθόδου και πρέπει να είναι διαθέσιμο τόσο κατά την συμπίεση, όσο και την αποσυμπίεση των δεδομένων. 78

Διανυσματική κβαντοποίηση Ανάλυση (Συνέχεια): (4/4) Το λεξικό μπορεί να είναι προκαθορισμένο, δηλαδή το ίδιο σε όλες τις διαδικασίες συμπίεσης ή δυναμικό. Στην τελευταία περίπτωση, κάθε φορά που ξεκινά η συμπίεση των δεδομένων, ένα νέο λεξικό δημιουργείται. Η συμπίεση έγκειται στην αντικατάσταση κάθε διανύσματος της αρχικής πληροφορίας με το πιο ταιριαστό από τα πρότυπα του λεξικού. Κάνοντας χρήση του λεξικού, αντί για ολόκληρα τα πρότυπα, μόνο η ετικέτα τους ή ο αύξων αριθμός τους στο λεξικό είναι απαραίτητο να αποθηκευτεί 79

Υβριδικές τεχνικές συμπίεσης (1/8) Αποτελούν συνδυασμό μεθόδων από τις άλλες κατηγορίες. Είναι επομένως στην ουσία συμπιεστές παρά αλγόριθμοι συμπίεσης. Έχουν υλοποιηθεί από πολύ επιτυχημένα πρότυπα κωδικοποίησης (coding standards). JPEG (Joint Photographic Experts Group). Συνδυάζει κωδικοποίηση μετασχηματισμού (DCT) και μήκους διαδρομής (RLC). 80

Υβριδικές τεχνικές συμπίεσης H263: (2/8) Συνδυάζει κωδικοποίηση μετασχηματισμού (DCT), προβλεπτική (αντιστάθμιση κίνησης MC: motion compensation) και μήκους διαδρομής (RLC). MPEG (Moving Pictures Expert Group): Συνδυάζει κωδικοποίηση μετασχηματισμού (DCT), προβλεπτική (αντιστάθμιση κίνησης MC: motion compensation), μήκους διαδρομής (RLC) και στρωματοποίησης (Subband Coding) για την συμπίεση του ήχου (MP3). 81

Υβριδικές τεχνικές συμπίεσης (3/8) Γενικό σχήμα συμπιεστή. Εικόνα 18: Υβριδικές τεχνικές συμπίεσης. Πηγή: Διδάσκων (2015). 82

Υβριδικές τεχνικές συμπίεσης (4/8) Γενικά στοιχεία για το JPEG. Χρησιμοποιείται κυρίως για κωδικοποίηση εικόνων (αποχρώσεων του γκρι ή έγχρωμες), αλλά και για βίντεο (Motion JPEG). Υλοποιείται μέσω είτε μόνο ειδικού λογισμικού είτε συνδυασμού λογισμικού και hardware (ειδικών καρτών). Ο χρήστης μπορεί να ορίσει: Την ποιότητα της αναπαραχθείσης εικόνας. Το χρόνο επεξεργασίας της συμπίεσης. Το μέγεθος της συμπιεσμένης εικόνας. 83

Υβριδικές τεχνικές συμπίεσης (5/8) Γενικά στοιχεία για το JPEG (Συνέχεια). Εκτός από τις γενικές απαιτήσεις που πρέπει να ικανοποιεί κάθε τεχνική συμπίεσης, ισχύουν επίσης τα εξής: 1. Η τεχνική είναι ανεξάρτητη του μεγέθους ή του περιεχομένου της εικόνας και εφαρμόσιμη σε οποιοδήποτε είδος εικόνας και pixel aspect ratio. 2. Η αναπαράσταση των χρωμάτων πρέπει να είναι ανεξάρτητη από τη συγκεκριμένη υλοποίηση της τεχνικής. 3. Ο βαθμός συμπίεσης και η ποιότητα της εικόνας που επιτυγχάνεται πρέπει να είναι όσο το δυνατόν καλύτερα. 84

Υβριδικές τεχνικές συμπίεσης (6/8) Γενικά στοιχεία για το JPEG (Συνέχεια). Εκτός από τις γενικές απαιτήσεις που πρέπει να ικανοποιεί κάθε τεχνική συμπίεσης, ισχύουν επίσης τα εξής: 4. Αν η υλοποίηση της τεχνικής γίνεται μέσω λογισμικού, αυτό πρέπει να «τρέχει» ικανοποιητικά σε οποιαδήποτε πλατφόρμα. Επιπλέον, η χρήση ειδικών καρτών θα πρέπει να αυξάνει αισθητά την ποιότητα της εικόνας. 5. Πρέπει να υποστηρίζεται σειριακή συμπίεση (γραμμήγραμμή) και σταδιακή αποσυμπίεση (ραφινάρισμα) της εικόνας. 85

Υβριδικές τεχνικές συμπίεσης (7/8) Γενικά στοιχεία για το MPEG. Χρησιμοποιείται για συμπίεση βίντεο και ήχου. Βασίζεται στα πρότυπα JPEG και Η.261. Διάφορα MPEG πρότυπα. MPEG-1, MPEG-2, MPEG-4, MPEG-7, MPEG-21. Το MPEG-1 επιτυγχάνει ρυθμούς της τάξης των 1.2 Mbits/sec (τυπικός ρυθμός δεδομένων για CD-ROMs), το MPEG-2 ρυθμούς της τάξης των 40 Mbits/sec (τυπικός ρυθμός δεδομένων για DVD encoding και HDTV broadcast), ενώ το MPEG-4 ρυθμούς της τάξης των 64 Kbits/sec (για διαδικτυακές εφαρμογές και flash video). 86

Υβριδικές τεχνικές συμπίεσης (8/8) Γενικά στοιχεία για το MPEG (Συνέχεια). Είναι κατάλληλο τόσο για συμμετρική όσο και ασύμμετρη συμπίεση: Η συμμετρική συμπίεση (symmetric compression) απαιτεί ίσο χρόνο για κωδικοποίηση και αποκωδικοποίηση. Οι εφαρμογές διαλογικού τύπου κάνουν χρήση αυτής της μεθόδου. Η ασύμμετρη συμπίεση (asymmetric compression) απαιτεί μεγαλύτερο χρόνο κατά τη διάρκεια της κωδικοποίησης παρά της αποκωδικοποίησης. Η συμπίεση γίνεται μία φορά, ενώ η αποσυμπίεση πολλές φορές (βλ. συστήματα ανάκλησης πληροφοριών). 87

Ανακεφαλαίωση Τι είναι συμπίεση; Γιατί χρειαζόμαστε τη συμπίεση; Ορισμοί συμπίεσης. Ποιες είναι οι απαιτήσεις από τη συμπίεση; Κατηγορίες τεχνικών συμπίεσης. Τεχνικές κωδικοποίησης Εντροπίας. Τεχνικές κωδικοποίησης Πηγής. Υβριδικές τεχνικές συμπίεσης. 88

Σημείωμα Αναφοράς Copyright ΤΕΙ Δυτικής Μακεδονίας, Νικολάου Σπύρος. «Τεχνολογία Πολυμέσων». Έκδοση: 1.0. Κοζάνη 2015. Διαθέσιμο από τη δικτυακή διεύθυνση: 89

Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά, Μη Εμπορική Χρήση Παρόμοια Διανομή 4.0 [1] ή μεταγενέστερη, Διεθνής Έκδοση. Εξαιρούνται τα αυτοτελή έργα τρίτων π.χ. φωτογραφίες, διαγράμματα κ.λ.π., τα οποία εμπεριέχονται σε αυτό και τα οποία αναφέρονται μαζί με τους όρους χρήσης τους στο «Σημείωμα Χρήσης Έργων Τρίτων». [1] http://creativecommons.org/licenses/by-nc-sa/4.0/ Ως Μη Εμπορική ορίζεται η χρήση: που δεν περιλαμβάνει άμεσο ή έμμεσο οικονομικό όφελος από την χρήση του έργου, για το διανομέα του έργου και αδειοδόχο. που δεν περιλαμβάνει οικονομική συναλλαγή ως προϋπόθεση για τη χρήση ή πρόσβαση στο έργο. που δεν προσπορίζει στο διανομέα του έργου και αδειοδόχο έμμεσο οικονομικό όφελος (π.χ. διαφημίσεις) από την προβολή του έργου σε διαδικτυακό τόπο. Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση, εφόσον αυτό του ζητηθεί. 90

Διατήρηση Σημειωμάτων Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει: το Σημείωμα Αναφοράς. το Σημείωμα Αδειοδότησης. τη δήλωση Διατήρησης Σημειωμάτων. το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει). μαζί με τους συνοδευόμενους υπερσυνδέσμους. 91

Βιβλιογραφία 1. Τεχνολογία πολυμέσων, Δημητριάδης Σταύρος Ν., Πομπόρτσης Ανδρέας Σ., Τριανταφύλλου Ευάγγελος Γ. 2. Συστήματα Πολυμέσων: Αλγόριθμοι, Πρότυπα και Εφαρμογές, Havaldar P., Medioni G. 3. Πολυμέσα Αναλυτικός Οδηγός, 8η Έκδοση, Tay Vaughan. 4. Τεχνολογία Πολυμέσων και Πολυμεσικές Επικοινωνίες, Γεώργιος Β. Ξηλωμένος, Γεώργιος Κ. Πολύζος. 92

Τέλος Ενότητας