Επεξεργασία Χαρτογραφικής Εικόνας ιδάσκων: Αναγνωστόπουλος Χρήστος Αλγόριθµος JPEG για έγχρωµες εικόνες Είδη αρχείων εικόνων Συµπίεση video και ήχου Μπλόκ x Τιµές - 55 Αρχική πληροφορία, 54 54 75 6 7 75 75 54 34 4 4 67 55 5 i 54 34 7 47 5 75 6 5 9 9 4 33 6 45 95 4 9 6 6 34 7 4 74 9 47 6 4 5 47 6 95 9 75 75 67 4 7 75 74 j 7,7
Μετασχηµατισµός DCT Ο µετασχηµατισµός DCT υπολογίζει τους συντελεστές DCT στο χώρο των συχνοτήτων Συντελεστές DCT Οι συντελεστές αυτοί δηλώνουν τη σχετική βαρύτητα κάθε συχνότητας που συµβάλει στη σύνθεση του διακριτού σήµατος της εικόνας και έχουν πραγµατικές ακέραιες τιµές, u 4 59 3 45 77 53 75 49 5 6 4 7 64 33 4 75 4 7 5 5 99 75 4 6 4 76 45 7 6 4 64 5 9 45 4 6 v 3 6 7,7
Ησηµασία των συντελεστών DCT Χαµηλές συχνότητες ΠΑΝΩ ΑΡΙΣΤΕΡΑ Συνήθως η σηµαντικότερη πληροφορία της εικόνας 75 64 5 59 49 33 99 3 5 4 75 45 75 4 4 77 6 7 6 53 4 5 7 4 Υψηλές συχνότητες ΚΑΤΩ ΕΞΙΑ 76 45 64 7 6 5 4 Συνήθως µπορούν να αγνοηθούν 9 3 6 45 4 6 Φάση (β): Κβαντοποίηση συντελεστών DCT Ο πίνακας συντελεστών DCT διαιρείται µε τονπίνακα κβάντωσης δηλ. έναν πίνακα που περιέχει στις διάφορες θέσεις το βήµα κβάντωσης Όσο µικρότερο αυτό το βήµα τόσο καλύτερη η προσέγγιση στις τιµές του σήµατος. Το JPEG κάνει κάτι ακόµη πιο αποδοτικό στο θέµα της κβαντοποίησης: χρησιµοποιεί µεταβλητό βήµα ανάλογα µε το αν πρόκειται για συντελεστές χαµηλών ή υψηλών συχνοτήτων. 3
Υψηλή συµπίεση Βήµατα κβάντωσης Χαµηλή συµπίεση Το αποτέλεσµα της διαίρεσης µπαίνει ως συντελεστής DCT στην αντίστοιχη θέση του νέου πίνακα που προκύπτει. Αυτή η διαδικασία ακριβώς προσδίδει τον απωλεστικό χαρακτήρα στο JPEG. 95 7 3 393 5 54 4 5 6 76 3 5 64 5 9 3 4 4
Πρότυπο JPEG Πως δουλεύει Πρότυπο JPEG Πως δουλεύει 5
Γιατί Zig-Zag; Συνήθως όµοιες τιµές βρίσκονται γειτονικά και πλάγια. Οπότε χρησιµοποιείται η τεχνική zig-zag ώστε να έχουµε όσο το δυνατόν ίδιες τιµές. Αργότερα θα µας βοηθήσει µε την τεχνική περιορισµού επαναλαµβανόµενων χαρακτήρων. 3 4 5 3 4 5 Παράδειγµα κωδικοποίησης αποκωδικοποίησης 6
Παράδειγµα κωδικοποίησης Στις περιοχές µε υψηλότερη πληροφορία (µεγαλύτερη διακύµανση των τιµών), τα blocks είναι µικρότερα. ιαδικασία αποσυµπίεσης Γίνεται αποκωδικοποίηση των τιµών των διανυσµάτων. Ανακατασκευάζεται ο πίνακας που είχε προκύψει από την κβαντοποίηση, κατά τη συµπίεση. Ο πίνακας αυτός πολλαπλασιάζεται (στοιχείο επί στοιχείο) µε τον ίδιο πίνακα-µάσκα κανονικοποίησης που χρησιµοποιήθηκε κατά τη συµπίεση. Εφαρµόζεται ο Αντίστροφος ιακριτός Μετασχηµατισµός Συνηµίτονου, οπότε προκύπτει η αντίστοιχη υποεικόνα. Επανατοποθετώντας τις υπο-εικόνες στην θέση τους µέσα στην εικόνα, επιτυγχάνεται η πλήρης ανακατασκευή της. 7
Και µε τιςέγχρωµες εικόνες; Μετασχηµατισµός από RGB στο µοντέλο YCbCr Σε αυτό το πεδίο, η φωτεινότητα (luminocity) αποθηκεύεται σαν ένα απλό στοιχείο (Υ), και η τιµή chrominance σαν δύο διαφορετικά στοιχεία (Cb και Cr). Η τιµή Cb αντιπροσωπεύει την διαφορά µεταξύ του γαλάζιου και µιας τιµής αναφοράς. Από την άλλη πλευρά η τιµή Cr αντιπροσωπεύει τη διαφορά µεταξύ του κόκκινου και µιας τιµής αναφοράς. Y =.99R +.57G +.4B Cb =.67R.333G +.5B + Cr =.5R.47G.3B + Σύνθεση χρωµάτων στην TV Σύνθεση χρωµάτων Ζ = α*r + b*g + c*b Μετατροπή RGB σε YIQ Ανθρώπινηόρασηπιοευαίσθητηστηφωτεινότηταπαράστα χρώµατα ιατήρηση συµβατότητας µεταξύ έγχρωµης και ασπρόµαυρης TV Υ: µεταφέρει την πληροφορία φωτεινότητας Ι, Q: χρωµατική πληροφορία, η οποία µπορεί να µεταδοθεί µε µικρότερη ακρίβεια NTSC Y=,3*R +,59*G +,4*B I =,74*(R-Y),7*(B-Y) =,6*R +,*G +,3*B Q =,4*(R-Y) +,4*(b-Y)=,*R +,5*G +,3*B PAL Y=,3*R +,59*G +,*B I =,493*(R-Y) = -,5*R +,9*G +,44*B Q =,77*(R-Y) =,6*R -,5*G -,*B
Και µε τιςέγχρωµες εικόνες; ηµιουργία τριών καναλιών: Y =.99R +.57G +.4B Cb =.67R.333G +.5B + Cr =.5R.47G.3B + Και µε τιςέγχρωµες εικόνες; Φωτεινότητα Y Τιµή Cb Τιµή Cr x block κωδικοποίηση 4x4 block κωδικοποίηση 4x4 block κωδικοποίηση 9
Και µε τιςέγχρωµες εικόνες; Αυτό το βήµα µειώνει το µέγεθος των δεδοµένων. Αριθµητικά υπάρχουν µεγάλες απώλειες. εν παρατηρείται σηµαντική µείωση της ποιότητας της εικόνας λόγω της αδυναµίας του ανθρώπινου µατιού να διακρίνει τις αλλαγές που έχουν συµβεί στο χρωµατικό µέρος της εικόνας. Η παραπάνω διαδικασία δεν γίνεται στις ασπρόµαυρες εικόνες ή σε αυτές µε διαβαθµίσεις του γκρίζου και αυτός είναι ο λόγος που οι έγχρωµες εικόνες µπορούν να συµπιεστούν περισσότερο από αυτές. Οι υπόλοιπες διαδικασίες είναι ίδιες. Πρότυπο JPEG Κατάλληλο για τη συµπίεση έγχρωµων και ασπρόµαυρων εικόνων (gray-scale). Καλή συµπεριφορά στην συµπίεση χαρτογραφικών εικόνων, που αποκτούνται από frame-grabber, scanner ή CCD (ψηφιακή κάµερα). Όµως σε διανυσµατικές όπως σκίτσα, γραµµικάσχέδιαή άλλες µη πραγµατικές εικόνες: φτωχά αποτελέσµατα σε ποιότητα ή σε συµπίεση!!!! Αποτελεί το πλέον τυποποιηµένο πρότυπο, αφού είναι προϊόν της CCITT και της ISO.
Πλεονεκτήµατα JPEG Οαπαιτούµενος χρόνος συµπίεσης και αποσυµπίεσης κινείται σε ανεκτά όρια. Επιτρέπει τη µεταβολή πολλών παραµέτρων που αφορούν τον τρόπο της συµπίεσης. Το JPEG έχει τέσσερις ρυθµούς λειτουργίας: ιαδοχική κωδικοποίηση (sequential encoding) Προοδευτική κωδικοποίηση (progressive encoding) Κωδικοποίηση χωρίς απώλειες (lossless encoding) Ιεραρχική κωδικοποίηση (hierarchical encoding) Άλλες µορφές αρχείων Κάθε τύπος έχει τα παρακάτω χαρακτηριστικά: Περιορισµούςωςπροςτηναπόδοσηκαιτηνχρήση. Κατάληξη (3 ή 4 γράµµατα). Παραδείγµατα: *.PSD, *.TIF, *.BMP, *.EPS, *.GIF, *.PNG Επιτυγχάνουν συµπίεση ή όχι.
Αρχείο TIFF ΟτύποςΤΙFF (Tagged-Image File Format) χρησιµοποιείται κυρίως για ανταλλαγή αρχείων µεταξύ λογισµικών εφαρµογών όπως επίσης και υπολογιστικών πλατφόρµων. Υποστηρίζει CMYK, RGB, LAB, και Grayscale µορφές εικόνων. Ειδικά στο Photoshop η µορφή TIFF µπορεί να κρατήσει και πληροφορίες επιπέδων. Πλεονεκτήµατα:. Αποθηκεύει πληροφορίες υψηλής ανάλυσης. Πιο συγκεκριµένα, ενώ σχεδόν όλες οι άλλες µορφές αρχείων έχουν εξ ορισµού ανάλυση 7 pixels/ίντσα, η µορφή TIFF µπορεί να δώσει ανάλυση µέχρι και 57 pixels/ίντσα!!!. Ανταλλάσσεται πολύ εύκολα µεταξύ των υπολογιστικών πλατφόρµων Windows και Mac OS. Αρχείο BMP Ο τύπος αυτός δηµιουργήθηκε αρχικά για εικόνες που αποθηκεύονταν και χρησιµοποιούνταν από κοινού µεταξύ των Windows 3. και του DOS. Ο τύπος αυτός υποστηρίζει υαδικές, Grayscale, RGB, 4- bit και -bit εικόνες. εν υποστηρίζει το χρωµατικό φάσµα του χρωµατικού µοντέλου CMYK. Άρα δεν ενδείκνυται για αποθήκευση εικόνων προς εκτύπωση.
Αρχείο GIF Η µορφή αυτή αναπτύχθηκε από την CompuServe ως µία πλατφόρµα ανεξάρτητης µορφής γραφικών. Προορίζονται κυρίως για Web εφαρµογές. Χρησιµοποιεί -bit χρώµατα και µπορεί να κρατήσει δοµικές λεπτοµέρειες µιας εικόνας που όµως δεν έχουν σχέση µε χρωµατισµό. Η µορφή αυτή χρησιµοποιεί την LZW (Lempel, Ziv, Welch) συµπίεση, η οποία είναι ένα σχήµα συµπίεσης χωρίς απώλειες. Μειονεκτήµατα: Η µορφή GIF αντιστοιχίζεται στον χαµηλότερο δυνατό αριθµό χρωµάτων, δηλαδή 56 χρώµατα. Όταν µετατρέπουµε µια 4-bit εικόνα σε GIF (-bit εικόνα) τότε ως φυσικό επακόλουθο χάνονται βασικές πληροφορίες της εικόνας. Gif (cont.) 3
Τύπος Αρχείου BMP GIF TIF JPG TGA CDR DXF Format Αρχείων Εικόνας Graphics Interchange Format (-bit) Tag Image File Format (true color, διαθέτει µέθοδο συµπίεσης LZW) Joint Photographic Experts Group (true color, διαθέτει την οµώνυµη µέθοδο συµπίεσης ) Targa (true color) Περιγραφή standard Windows format (true color) CorelDraw διανυσµατικό format Drawing Exchange Format (διανυσµατικό Format της Auto-CAD) Συµπίεση ψηφιακού βίντεο (MPEG/MJPEG). MPEG (Moving Pictures Experts Group) MPEG, MPEG, MPEG4... MPEG7 (το 3). MJPEG- Moving JPEG Κάθε εικόνα (frame) της ακολουθίας βίντεο -> JPEG 4
Συµπίεση ήχου Ο ήχος είναι γενικά δύσκολο να συµπιεστεί γιατί η ακοή είναι πιο ευαίσθητη στις αλλοιώσεις του ήχου σε σχέση µε την όραση. Στην µουσική τα πράγµατα είναι πιο δύσκολα γιατί και οι απαιτήσεις ποιότητας είναι µεγαλύτερες και το εύρος ζώνης της είναι σηµαντικά µεγαλύτερο από αυτό της ανθρώπινης φωνής. (Μουσική *.MIDI, *.MP3, *.OGG) Ησυµπίεση επιτυγχάνεται µε δειγµατοληψία. Χωρισµός του συνεχούς ηχητικού σήµατος. Περαιτέρω συµπίεση: αφαίρεση σιωπηλών τµηµάτων. Τηλεφωνία: PCM (Pulse Code Modulation) APCM (Adaptive PCM) Συµπίεση ήχου. Αρχικό σήµα. ειγµατοληψία 3. Κβαντοποίηση 3 5
Συµπίεση ήχου Συχνότητα ειγµατοληψίας (khz) 44. 37. 37..9 Κβαντοποίηση (bits) 6 Τεχνική Κωδικοποίησης PCM ADPCM ADPCM ADPCM PCM Ποιότητα Hi-fi Hi-fi FM µετάδοση (µουσική) AM µετάδοση (οµιλία) Τηλεφωνική Συµπίεση ήχου Τελευταία επιτεύγµατα Συµπίεση ήχου-µουσικής µε τοπρότυποogg Vorbis. Αρχεία µε κατάληξη *.ogg Το Ogg Vorbis είναι ένα νέο ακουστικό πρότυπο συµπίεσης. Είναι κατά προσέγγιση συγκρίσιµο µε άλλα πρότυπα που χρησιµοποιούνται για να αποθηκεύσουν και να παίξουν την ψηφιακή µουσική, όπως MP3, VQF, AAC, και άλλα ψηφιακά ακουστικά πρότυπα. Είναι διαφορετικό από αυτά επειδή είναι απολύτως ελεύθερο στη διακίνηση, ανοικτό προς βελτίωση και αλλαγή, και απατεντάριστο. 6
Πλεονεκτήµατα αρχείων Ogg Vorbis Το Vorbis παρέχει ένα υψηλής ποιότητας πρότυπο για να ακούσει κάποιος µουσική. Για ένα δεδοµένο µέγεθος αρχείων, ακούγεται καλύτερα από ένα αντίστοιχο MP3. Αυτό σηµαίνει: Το µουσικό αρχείο παραµένει στο ποιοτικό επίπεδο, αλλά σε λιγότερο αποθηκευτικό χώρο. ή Καταλαµβάνοντας τον ίδιο αποθηκευτικό χώρο, προσφέρει καλύτερη ποιότητα από το αντίστοιχο MP3. 7