ΓΤΠ 61 Ηλεκτρονικοί Υπολογιστές στις Γραφικές Τέχνες Πολυµέσα και Συµπίεση εδοµένων Εισαγωγή Βασικές Έννοιες Ταξινόµηση Τεχνικών Συµπίεσης Συµπίεση Κειµένου Συµπίεση Εικόνας Συµπίεση Ήχου Συµπίεση Video Βιβλιογραφία: ηµητριάδης Σ., Ποµπόρτσης Α., Τριανταφύλλου Ε., 2004, Τεχνολογία Πολυµέσων Θεωρία και Πράξη, ΤΖΙΟΛΑΣ, Θεσσαλονίκη www.it.uom.gr/project/ntua_java 1
Εισαγωγή - Συµπίεση Στόχος: ΠΕΡΙΟΡΙΣΜΟΣ ΤΟΥ ΜΕΓΕΘΟΥΣ ΤΗΣ ΠΛΗΡΟΦΟΡΙΑΣ Πλεονεκτήµατα Αποθήκευση Μετάδοση Κόστος ιαχείριση Ικανοποίηση Χρήσης Εφαρµογών Πολυµέσων Μειονεκτήµατα ιαθεσιµότητα Υπολογιστική Ισχύς Ακρίβεια Περιεχοµένου Πολυµέσα: Το κάθε σήµα περιέχει ένα ποσοστό πλεονασµού (redundancy). Πληροφορία που µπορεί να παραληφθεί ή να κωδικοποιηθεί µε λιγότερη ακρίβεια χωρίς αυτό να έχει αξιοσηµείωτη επίδραση στο τελικό αποτέλεσµα. 2
Εισαγωγή Βασικές Έννοιες Λόγος Συµπίεσης (Compression ratio) π.χ. 20:1 Ρυθµός Συµπίεσης (Compression rate) π.χ. 64Kbps Αλγόριθµοι χωρίς απώλειες, αντιστρεπτοί (lossless) Αλγόριθµοι µε απώλειες, µη αντιστρεπτοί (lossy) Συµµετρία Ασυµµετρία Αλγορίθµου Video Codec Audio Codec 3
Ταξινόµηση Τεχνικών Συµπίεσης Κωδικοποίηση Εντροπίας (entropy encoding) δεν λαµβάνεται υπόψη το είδος της πληροφορίας η πληροφορία αντιµετωπίζεται ως απλή ακολουθία bits κωδικοποίηση χωρίς απώλειες Κωδικοποίηση Πηγής (source encoding) λαµβάνεται υπόψη το είδος της πληροφορίας µεγαλύτερα ποσοστά συµπίεσης µειωµένη σταθερότητα µε ή χωρίς απώλειες Υβριδική Κωδικοποίηση (Συνδυασµός) 4
Κωδικοποίηση Εντροπίας Περιορισµός των επαναλαµβανόµενων ακολουθιών (RLE) 1 2 0 0 0 0 0 0 0 0 3 1 2 0 8 3 Στατιστική Κωδικοποίηση Αντικατάσταση Προτύπων πολυµέσα *π (Κείµενα - Χρήση Λεξικού) Κωδικοποίηση Huffman Σύµβολα µε µεγαλύτερη συχνότητα λιγότερα bits Σύµβολα µε µικρότερη συχνότητα περισσότερα bits Χρήση λεξικού LZW (Lempel Ziv Welch), 1984 περιορισµός επαναλαµβανόµενων ακολουθιών (κείµενα, Α/Μ εικόνες) WinZip (1990) συνδυάζει διάφορες τεχνικές (RLE, Huffman, LZW) 5
Κωδικοποίηση Πηγής - Κωδικοποίηση Μετασχηµατισµού (Transform( Encoding) Εντοπίζονται οι συχνότητες που µπορούν να εξαλειφθούν Εντοπίζεται η συµβολή της κάθε συχνότητας στο αρχικό σήµα Το σήµα υφίσταται ένα µαθηµατικό µετασχηµατισµό Μετασχηµατισµός Fourier f(t) g(λ) ιακριτός Μετασχηµατισµός Συνηµιτόνου (DCT) βάση JPEG και MPEG Ανάλογα µε τις ιδιότητες του τύπου της πληροφορίας Walsh-Hadamar (WHT), Haar (HT), Karhunen-Loeve (KLT) 6
Κωδικοποίηση Πηγής - ιαφορική ή Προβλεπτική Κωδικοποίηση (differential( or predictive encoding) Μόνο η διαφορά ανάµεσα στην πραγµατική τιµή ενός δείγµατος και στην προβλεπόµενη τιµή κωδικοποιείται. Κατάλληλη για σήµατα των οποίων οι διαδοχικές τιµές αναµένεται να διαφέρουν όχι κατά πολύ Απλή ιαφορική Παλµοκωδική Κωδικοποίηση (DPCM) Προβλεπόµενη τιµή τελευταίο δείγµα έλτα διαµόρφωση (Delta modulation) Η διαφορά κωδικοποιείται µε ένα bit Προσαρµοστική DPCM (ADPCM) Η προβλεπόµενη τιµή υπολογίζεται µε βάση τις προηγούµενες τιµές 7
Κωδικοποίηση Πηγής - ιανυσµατική Κβαντοποίηση (vector quantization) Ειδική περίπτωση της µεθόδου αντικατάστασης προτύπων Το ρεύµα των δεδοµένων χωρίζεται σε τµήµατα ( ιανύσµατα) Πίνακας µε ένα σύνολο από πρότυπα διανύσµατα (Λεξικό) Αντικατάσταση κάθε διανύσµατος της αρχικής πληροφορίας µε το πιο ταιριαστό από τα πρότυπα Αρχικά δεδοµένα Λεξικό Πρότυπο 0 Συµπιεσµένα δεδοµένα ιάνυσµα 0 ιάνυσµα 1 ιάνυσµα n πιο ταιριαστά πρότυπα Πρότυπο i Πρότυπο k Πρότυπο p k 0 i 8
Συµπίεση Κειµένου Όχι µεγάλης σηµασίας Αντικατάσταση Προτύπων Κωδικοποίηση Huffman LZW 9
Συµπίεση Εικόνας Κωδικοποίηση Εντροπίας Κωδικοποίηση Μετασχηµατισµού, συνήθως DCT ιανυσµατική Κβαντοποίηση Συνδυασµός LZW ή παραλλαγές της (gif, tiff, png) 10
Συµπίεση Εικόνας Πρότυπο JPEG Σήµα Προετοιµασία RGB YCbCr Υποδειγµατοληψία Πλαίσιο 8x8 DCT Κβάντωση Συντελεστών DCT Περαιτέρω Συµπίεση Τελικό Αρχείο Εικόνες συνεχούς τόνου, (ΟΧΙ βάθος χρώµατος < 4bit και σχέδια) Με απώλειες (διάφοροι συνδυασµοί λόγου συµπίεσης ποιότητας) ή και χωρίς απώλειες 20:1 25:1 µε απώλειες, 2:1 χωρίς απώλειες 30:1-50:1 µε µικρές έως µεσαίες παραµορφώσεις 100:1 σηµαντική πτώση της ποιότητας 11
Συµπίεση Ήχου Οµιλία vs Μουσική Αφαίρεση σιωπηλών τµηµάτων Πολύπλοκοι αλγόριθµοι Συνδυασµός απωλεστικών και µη απωλεστικών Ψυχο-ακουστικά µοντέλα 12
Συµπίεση Ήχου Ψηφιακό Σήµα ΦΙΛΤΡΑ ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΙ (DCT, FFT) ΨΥΧΟ-ΑΚΟΥΣΤΙΚΑ ΜΟΝΤΕΛΑ ΚΒΑΝΤΩΣΗ ΚΩ ΙΚΟΠΟΙΗΣΗ ΠΕΡΑΙΤΕΡΩ ΣΥΜΠΙΕΣΗ (HUFFMAN) Κωδικοποιηµένο Σήµα 13
Συµπίεση Ήχου Μέθοδοι Κωδικοποίησης Ψηφιοποίηση Παλµοκωδική Κωδικοποίηση, (PCM) - ΓΡΑΜΜΙΚΗ Mu-Law PCM και Α-Law PCM (ΛΟΓΑΡΙΘΜΙΚΗ και συµπίεση, ISDN) DPCM ιαµόρφωση έλτα - ADPCM Γραµµική Προβλεπόµενη Κωδικοποίηση, Linear Predictive Coding (LPC) Code Excited Linear Prediction (CELP) 14
Συµπίεση Ήχου Ψυχο-ακουστικά Μοντέλα Συχνότητες έξω από 20Hz 20KHz Καµπύλες κατωφλιού ακουστικότητας (Minimal Audition Threshold) Ελάχιστο αντιληπτό επίπεδο θορύβου Ηχητική σκίαση (auditory masking) βάση MP3, AC3 Κυρίαρχος Ήχος Περιοχή όπου τα Ασθενέστερα σήµατα αποκρύπτονται 15
Συµπίεση Ήχου Πρότυπα MPEG (Moving Pictures Experts Group) MPEG-1 MPEG-2 (MPEG-3) MPEG-4 MPEG-1 (1992) Audio Layer-1 (4:1, mp1) o Απλοί codec vs ποιότητα o Bandwith 192 ή 256Kbps ανά κανάλι Audio Layer-2 (6:1 8:1, mp2) o Ποιότητα CD - 96 ή 128Kbps ανά κανάλι Audio Layer-3 (12:1, mp3) o Ποιότητα σχεδόν CD - 64Kbps ανά κανάλι MPEG-2 (1994) DVD (5.1) Bandwidth < 64Kbps ανά κανάλι - Internet MPEG-4 (1998 - σε εξέλιξη, mp4) Ποιότητα Bandwidth (6-64Kbps) 16
Συµπίεση Video Χωρικό + Χρονικό Πλεόνασµα Αναλογικό Σήµα Συµπίεση (π.χ. JPEG) Ψηφιακό Σήµα Αναλογικό Σήµα Συµπίεση (π.χ. JPEG) Αντιστάθµιση Κίνησης Ψηφιακό Σήµα 17
Συµπίεση Video - MPEG Ενδοπλαισιακή Συµπίεση (Intra( Intra-frame) I-frames, πλαίσια κλειδιά (JPEG) ιαπλαισιακή Συµπίεση (Inter( Inter-frame) P-frames, µόνο η µεταβολή σε σχέση µε 1 (I ή P frame) B-frames, µόνο η µεταβολή σε σχέση µε 2 (I-P ή P-P frames) κατά δύο διευθύνσεις (bi-directional) Aντιστάθµιση κίνησης (Motion Compensation), P, B-frames αποθηκεύεται µόνο το διάνυσµα κίνησης (π.χ. 3,-1) ενός τµήµατος του αρχικού πλαισίου 18
Συµπίεση Video - MPEG Βασικές Φάσεις Συµπίεσης Υποδειγµατοληψία Χρώµατος Ενδοπλαισιακή Συµπίεση Αντιστάθµιση Κίνησης 19
Συµπίεση Video - MPEG MPEG-1 1 (1992) Σε CD-ROM, 1.5Mbps Ποιότητα VCR - 352x288, 50:1-100:1 MPEG-2 2 (MPEG( MPEG-3) (1994) Σε DVD + (HDTV), 4 80 Mbps, 1920x1080 MPEG-4 (1998 - σε εξέλιξη) 4.8 64Kbps, Internet ίκτυα Γραφικά + 2D,3D σχεδιοκίνηση Πολυµέσα και ιαδραστικότητα Οπτικοακουστικά Αντικείµενα (Οντότητες + Σχέσεις) 20
Συµπίεση Video MPEG-7 MPEG-7 (2001...) Περιβάλλον Περιγραφής Πολυµεσικού Περιεχοµένου (Multimedia Content Description Interface) εν είναι ένα πρότυπο κωδικοποίησης οπτικο-ακουστικού υλικού (OXI OXI MPEG1, MPEG-2, MPEG-4) Περιγραφή Πολυµεσικού Περιεχοµένου Ευέλικτη ιαχείριση εδοµένων ιαλειτουργικότητα Συστηµάτων Νότες Τα κοµµάτια που περιέχουν αυτές τις νότες Οι εικόνες που ταιριάζουν στο συναίσθηµα Σκαρίφηµα Τις εικόνες µε παρόµοια γραφικά, λογότυπα, ιδεογράµµατα 21
ΓΤΠ 61 Ηλεκτρονικοί Υπολογιστές στις Γραφικές Τέχνες Σας Ευχαριστώ Πολύ 22