ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ"

Transcript

1 ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ ΣΗΜΑΤΩΝ, ΕΛΕΓΧΟΥ & ΡΟΜΠΟΤΙΚΗΣ ιερεύνηση πιθανότητας βελτίωσης της απόδοσης του προτύπου συµπίεσης ψηφιακών εικόνων JPEG, µε τη χρήση σχηµάτων ανάλυσης σε πολλαπλές κλίµακες. ΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ του ΚΩΝΣΤΑΝΤΙΝΟΥ Α. ΤΣΙΒΕΡ Η Επιβλέπων : Πέτρος Α. Μαραγκός Καθηγητής Ε.Μ.Π. Αθήνα, Μάρτιος 2003

2

3 ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ ΣΗΜΑΤΩΝ, ΕΛΕΓΧΟΥ & ΡΟΜΠΟΤΙΚΗΣ ιερεύνηση πιθανότητας βελτίωσης της απόδοσης του προτύπου συµπίεσης ψηφιακών εικόνων JPEG, µε τη χρήση σχηµάτων ανάλυσης σε πολλαπλές κλίµακες. ΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ του Κωνσταντίνου Α. Τσιβερδή Επιβλέπων : Πέτρος Μαραγκός Καθηγητής Ε.Μ.Π. Εγκρίθηκε από την τριµελή εξεταστική επιτροπή τη 2 η Απριλίου Π. Μαραγκός Σ. Κόλλιας Κ. Τζαφέστας Καθηγητής Ε.Μ.Π. Καθηγητής Ε.Μ.Π. Λέκτορας Ε.Μ.Π. Αθήνα, Μάρτιος

4 ... ΚΩΝΣΤΑΝΤΙΝΟΣ Α. ΤΣΙΒΕΡ ΗΣ ιπλωµατούχος Ηλεκτρολόγος Μηχανικός και Μηχανικός Υπολογιστών Ε.Μ.Π All rights reserved 4

5 Περίληψη Στη διπλωµατική εργασία διερευνάται η υπό προϋποθέσεις πιθανότητα βελτίωσης της απόδοσης όσον αφορά τη συµπίεση του προτύπου JPEG, χωρίς επεµβάσεις στο ίδιο το πρότυπο, το οποίο αποτελεί απλά ένα από τα στάδια της πειραµατικής υλοποίησης που αναπτύχθηκε στα πλαίσια της εργασίας. Η προσπάθεια για τη βελτίωση εστιάζεται στην υλοποίηση σχηµάτων αποδόµησης σε πολλαπλές κλίµακες, κατώτερα επίπεδα των οποίων (ειδικότερα τα επίπεδα 1 και 2, θεωρώντας ως µηδενικό επίπεδο την αρχική προς συµπίεση εικόνα) αφού υποβληθούν σε JPEG συµπίεση, υφίστανται επαναφορά στο αρχικό µέγεθος (µιλώντας χωρικά) µε τη βοήθεια των λειτουργιών ανακατασκευής του εκάστοτε σχήµατος. Τα σχήµατα αυτά βασίζονται σε ανάλυση µε χρήση πυραµίδων ή wavelet. Οι αλγόριθµοι που αναπτύχθηκαν σχηµάτισαν µια απόπειρα αξιολόγησης έξι διαφορετικών µεθόδων, µε τη χρήση ισάριθµων διαφορετικών σχηµάτων, ως προς το SNR σε σχέση µε την αρχική εικόνα. Αναπόφευκτη ήταν η σύγκριση µε την περίπτωση της απλής εφαρµογής του προτύπου JPEG, οπότε και κατέστη προφανές το πλεονέκτηµα οποιασδήποτε των έξι προσεγγίσεων, όσον αφορά τις περιπτώσεις συµπίεσης µε χαµηλά bit rate. 5

6 Abstract The scope of this diploma thesis was to investigate the possibility of improving the compression efficiency of the JPEG codec, provided certain conditions are met. No modifications were applied to the codec, which was used as is. The original JPEG codec was one of many compression stages implemented for the purposes of experimentation. The improvement efforts are focused on the implementation of multiple level decomposition schemes. The lower levels of those (especially levels 1 and 2, considering the original image as the zero level) after being JPEG compressed are restored to their original spatial size by means of the reconstruction operators of each scheme. The decomposition schemes are based on pyramidal or wavelet analysis. The algorithms produced formed an attempt of rating the efficiency, in terms of SNR ratio with reference to the original image, of six compression approaches, each based on a different decomposition scheme. The comparison with the original JPEG codec was inevitable and pointed out the advantage of every one of the six approaches, as far as the compression requirements forced low bit rate encoding. 6

7 Ευχαριστίες Στον καθηγητή και επιβλέποντα της διπλωµατικής κύριο Μαραγκό για την εξαιρετική καθοδήγηση και την πολύτιµη βοήθεία του. Στο έµψυχο δυναµικό του εργαστηρίου Συστηµάτων Όρασης, Ήχου και Επεξεργασίας Πληροφορίας για τη σηµαντική βοήθειά τους. Στην οικογένειά µου για την υποµονή τους. Στο φίλο µου Μανώλη για τα καθοριστικής σηµασίας σχόλιά του σε κρίσιµες στιγµές. Στη φίλη µου Λίνα για τη συµπαράσταση. 7

8 ΠΙΝΑΚΑΣ ΠΕΡΙΕΧΟΜΕΝΩΝ Κεφ. 1 Εισαγωγή Ψηφιακή Επεξεργασία Εικόνας Γενικά Αποκατάσταση εικόνας Συµπίεση εικόνας Όραση Υπολογιστών Γενικά Κατευθύνσεις και επιµέρους προβλήµατα στην όραση υπολογιστών Εφαρµογές της όρασης υπολογιστών Το πρότυπο JPEG Γενικά, σύντοµη επισκόπηση Συµβολή της διπλωµατικής εργασίας...27 Κεφ. 2 Απαραίτητο γνωστικό υπόβαθρο Απωλεστική συµπίεση JPEG λεπτοµερής ανάλυση Γενικά Μετασχηµατισµός χρωµατικού χώρου Μετασχηµατισµός DCT Κβαντισµός Απεικόνιση συντελεστών DCT σε σύµβολα και κωδικοποίηση Πειραµατική υλοποίηση προτύπου JPEG Γενικά ιαφορές σε σχέση µε το πρότυπο JPEG Κώδικας σε Matlab που αναπτύχθηκε Σχετικά µε το paper (δηµοσίευση) DOWN SCALING FOR BETTER TRANSFORM COMPRESSION [2] Γενικά υνατότητα βελτίωσης της απόδοσης του JPEG µε υποδειγµατοληψία και κατόπιν παρεµβολή στο αρχικό µέγεθος...41 Κεφ. 3 Ανάλυση εικόνων σε πολλαπλές κλίµακες Εισαγωγή στην ανάλυση σε πολλαπλές κλίµακες Ορισµός γενική περιγραφή των σχηµάτων πυραµιδικής αποδόµησης σηµάτων Απλή πυραµίδα υποδειγµατοληψίας Gaussian πυραµίδα Adjunction πυραµίδες Προαπαιτούµενα στα µαθηµατικά Adjunction πυραµίδα

9 3.5.3 Sun-Maragos πυραµίδα Leveling πυραµίδα Εισαγωγή Προαπαιτούµενα στα µαθηµατικά και ορισµοί Σχηµατισµός των leveling Leveling πολλαπλής κλίµακας Υλοποίηση της leveling πυραµίδας στα πλαίσια της διπλωµατικής εργασίας Μορφολογικές Wavelet πυραµίδες Εισαγωγή Γενικά σχήµατα wavelet αποδόµησης D µορφολογικό Haar wavelet Υλοποίηση της 2D µορφολογικής Haar wavelet πυραµίδας στα πλαίσια της διπλωµατικής εργασίας Επεκτάσεις της θεωρίας των µορφολογικών wavelet σχηµάτων αποδόµησης Κεφ. 4 Φιλοσοφία και τεχνικές λεπτοµέρειες της διπλωµατικής εργασίας Γενικά Στόχος και γενικότερο πλαίσιο της διπλωµατικής εργασίας Παράγοντες που υποβιβάζουν την ποιότητα των µετρήσεων Η στατιστικής φύσεως ανεπάρκεια του σετ εικόνων ελέγχου Το πρόβληµα της ορθής εκτίµησης του SNR Αποτελέσµατα της διπλωµατικής εργασίας Γενικά Αποτελέσµατα Κεφ. 5 Συµπεράσµατα και µελλοντική έρευνα Σχόλια πάνω στα αποτελέσµατα Μελλοντική έρευνα

10 ΕΥΡΕΤΗΡΙΟ ΟΡΩΝ 1D D D...18 active contours...16 AC-συνιστώσες...31, 32 ADC (Analog to Digital Converter Αναλογικό σε Ψηφιακό Μετατροπέα)...79 aliasing (αναδίπλωσης)...47 analysis (ανάλυση)...42 artifacts (τεχνουργήµατα παραµορφώσεις, αλλοιώσεις λόγω της κωδικοποίησης)...89 audio...13 background (παρασκήνιο φόντο)...85 band-pass (ζωνοπερατού)...85 bandwidth...13 bit rate...21 bit stream...20 black box (µαύρο κουτί)...89 block...25 bpp...21 CCITT...20 code words...32 codec...35 CV...16 data...13 DCT...20, 24 DC-συνιστώσα...31 decoder...21 deformable templates (παραµορφώσιµες ταµπλέτες)...16 DFT...26 DIP...12 DPCM...31 expand (επέκταση)...43 gray images...16 grayscale (αποχρώσεων του γκρι)...82 grey valued συναρτήσεων (συναρτήσεων που λαµβάνουν διακριτές τιµές) GUI (Graphical User Interface Γραφική ιαπροσωπία Χρήστη) hardware HVS idct ISO JFIF JPEG... 18, 20, 23 lifted (εξυψωµένη) lifting (εξυψώσεως) LP filtering (Low Pass filtering Βαθυπερατό φιλτράρισµα)... 43, 47 marker (σηµαδευτής) MMI MSE multimedia OCR padding (γέµισµα µε µηδενικά) path (µονοπάτι διαδροµή στον αποθηκευτικό χώρο) pixel PSNR (Peak to peak Signal to Noise Ratio Λόγος Σήµατος προς Θόρυβο από Κορυφή σε κορυφή) reduce (µείωση) reference (αναφορά) RGB (Red Green Blue Κόκκινο Πράσινο Μπλε) RLE snakes (καµπύλες φίδια) SNR software synthesis (σύνθεση) true color (αληθινού χρώµατος)

11 vanishing moments (στιγµών εξαφάνισης)..72 video...13 VLBR (Very Low Bit Rate Πολύ Χαµηλό Ρυθµό εδοµένων)...74 VLC...32 wavelet (κυµατιδίων) XLBR (extremely Low Bit Rate Εξαιρετικά Χαµηλό Ρυθµό εδοµένων). 74 Zig-zag αριθµητική κωδικοποίηση δοµικό στοιχείο (structuring element) κωδικοποίηση Huffman Κωδικοποίηση εντροπίας

12 ΕΥΡΕΤΗΡΙΟ ΕΙΚΟΝΩΝ Εικόνα 2-1, Κωδικοποιητής JPEG...29 Εικόνα 2-2 DCT µετασχηµατισµός...30 Εικόνα 2-3 Συναρτήσεις βάσης του DCT...31 Εικόνα 2-4 Υπολογισµός 2D DCT µε τη βοήθεια δύο εφαρµογών 1D DCT µετασχηµατισµών...32 Εικόνα 2-5 Zig-zag σάρωση κβαντισµένων συντελεστών DCT...36 Εικόνα 3-1 Αρχική φωτογραφία της Lena, All Rights Reserved...46 Εικόνα 3-2 Πυραµίδα εικόνων µε αρχική τη γνωστή Lena...47 Εικόνα 3-3 Ανάλυση εικόνας σε πολλαπλές κλίµακες, µε σταθερά κλίµακας την τυπική απόκλιση...49 Εικόνα 3-4 Απλή πυραµίδα υποδειγµατοληψίας, τα τέσσερα πρώτα επίπεδα...52 Εικόνα 3-5 Απλή πυραµίδα υποδειγµατοληψίας, αναδόµηση τεσσάρων επιπέδων...53 Εικόνα 3-6 Gaussian πυραµίδα, τα τέσσερα πρώτα επίπεδα...56 Εικόνα 3-7 Gaussian πυραµίδα, αναδόµηση τεσσάρων επιπέδων...56 Εικόνα 3-8 Adjunction πυραµίδα, τα τέσσερα πρώτα επίπεδα...59 Εικόνα 3-9 Adjunction πυραµίδα, αναδόµηση τεσσάρων επιπέδων...60 Εικόνα 3-10 Sun-Maragos πυραµίδα, τα τέσσερα πρώτα επίπεδα...61 Εικόνα 3-11Sun-Maragos πυραµίδα, αναδόµηση τεσσάρων επιπέδων...61 Εικόνα 3-12 Leveling πυραµίδα, τα τέσσερα πρώτα επίπεδα...68 Εικόνα 3-13 Leveling πυραµίδα, αναδόµηση τεσσάρων επιπέδων...68 Εικόνα 3-14 Μορφολογική Haar wavelet πυραµίδα, τα τέσσερα πρώτα επίπεδα...74 Εικόνα 3-15 Μορφολογική Haar wavelet πυραµίδα, αναδόµηση τεσσάρων επιπέδων...75 Εικόνα 4-1Οπτικοποίηση του PSNR για δύο εκδοχές ανακατασκευής διαφορετικής ποιότητας...86 Εικόνα 4-2 trui.bmp, 1 η εικόνα του σετ ελέγχου...93 Εικόνα 4-3 PSNR συναρτήσει του CR για L1 ανακατασκευή...94 Εικόνα 4-4 PSNR συναρτήσει του CR για L2 ανακατασκευή...94 Εικόνα 4-5 Original JPEG συµπίεση, CR= Εικόνα 4-6 L1 ανακατασκευή µε Gaussian πυραµίδα, CR= Εικόνα 4-7 L1 ανακατασκευή µε Leveling πυραµίδα, CR= Εικόνα 4-8 Original JPEG συµπίεση, CR= Εικόνα 4-9 L1 ανακατασκευή µε Gaussian πυραµίδα, CR= Εικόνα 4-10 L1 ανακατασκευή µε Leveling πυραµίδα, CR= Εικόνα 4-11 lena.bmp, 2 η εικόνα του σετ ελέγχου...97 Εικόνα 4-12 PSNR συναρτήσει του CR για L1 ανακατασκευή...98 Εικόνα 4-13 PSNR συναρτήσει του CR για L2 ανακατασκευή...98 Εικόνα 4-14 Original JPEG συµπίεση, CR= Εικόνα 4-15 L1 ανακατασκευή µε Gaussian πυραµίδα, CR= Εικόνα 4-16 L1 ανακατασκευή µε Leveling πυραµίδα, CR=

13 Εικόνα 4-17 Original JPEG συµπίεση, CR= Εικόνα 4-18 L1 ανακατασκευή µε Gaussian πυραµίδα, CR= Εικόνα 4-19 L1 ανακατασκευή µε Leveling πυραµίδα, CR= Εικόνα 4-20 chania.bmp, 3 η εικόνα του σετ ελέγχου Εικόνα 4-21 PSNR συναρτήσει του CR για L1 ανακατασκευή Εικόνα 4-22 PSNR συναρτήσει του CR για L2 ανακατασκευή Εικόνα 4-23 Original JPEG συµπίεση, CR= Εικόνα 4-24 L1 ανακατασκευή µε Gaussian πυραµίδα, CR= Εικόνα 4-25 L1 ανακατασκευή µε Leveling πυραµίδα, CR= Εικόνα 4-26 Original JPEG συµπίεση, CR= Εικόνα 4-27 L1 ανακατασκευή µε Gaussian πυραµίδα, CR= Εικόνα 4-28 L1 ανακατασκευή µε Leveling πυραµίδα, CR= Εικόνα 4-29 bottles.bmp, 4 η εικόνα του σετ ελέγχου Εικόνα 4-30 PSNR συναρτήσει του CR για L1 ανακατασκευή Εικόνα 4-31 PSNR συναρτήσει του CR για L2 ανακατασκευή Εικόνα 4-32 Original JPEG συµπίεση, CR= Εικόνα 4-33 L1 ανακατασκευή µε Gaussian πυραµίδα, CR= Εικόνα 4-34 L1 ανακατασκευή µε Leveling πυραµίδα, CR= Εικόνα 4-35 Original JPEG συµπίεση, CR= Εικόνα 4-36 L1 ανακατασκευή µεgaussian πυραµίδα, CR= Εικόνα 4-37 L1 ανακατασκευή µε Leveling πυραµίδα, CR= Εικόνα 4-38 elcap.bmp, 5 η εικόνα του σετ ελέγχου Εικόνα 4-39 PSNR συναρτήσει του CR για L1 ανακατασκευή Εικόνα 4-40 PSNR συναρτήσει του CR για L2 ανακατασκευή Εικόνα 4-41 Original JPEG συµπίεση, CR= Εικόνα 4-42 L1 ανακατασκευή µεgaussian πυραµίδα, CR= Εικόνα 4-43 L1 ανακατασκευή µε Leveling πυραµίδα, CR= Εικόνα 4-44 Original JPEG συµπίεση, CR= Εικόνα 4-45 L1 ανακατασκευή µεgaussian πυραµίδα, CR= Εικόνα 4-46 L1 ανακατασκευή µε Leveling πυραµίδα, CR= Εικόνα 4-47 gates.bmp, 6 η εικόνα του σετ ελέγχου Εικόνα 4-48 PSNR συναρτήσει του CR για L1 ανακατασκευή Εικόνα 4-49 PSNR συναρτήσει του CR για L2 ανακατασκευή Εικόνα 4-50 Original JPEG συµπίεση, CR= Εικόνα 4-51 L1 ανακατασκευή µε Gaussian πυραµίδα, CR= Εικόνα 4-52 L1 ανακατασκευή µε Leveling πυραµίδα, CR= Εικόνα 4-53 Original JPEG συµπίεση, CR= Εικόνα 4-54 L1 ανακατασκευή µε Gaussian πυραµίδα, CR=

14 Εικόνα 4-55 L1 ανακατασκευή µε Leveling πυραµίδα, CR= Εικόνα 4-56 people.bmp, 7 η εικόνα του σετ ελέγχου Εικόνα 4-57 PSNR συναρτήσει του CR για L1 ανακατασκευή Εικόνα 4-58 PSNR συναρτήσει του CR για L2 ανακατασκευή Εικόνα 4-59 Original JPEG συµπίεση, CR= Εικόνα 4-60 L1 ανακατασκευή µε Gaussian πυραµίδα, CR= Εικόνα 4-61 L1 ανακατασκευή µε Leveling πυραµίδα, CR= Εικόνα 4-62 Original JPEG συµπίεση, CR= Εικόνα 4-63 L1 ανακατασκευή µε Gaussian πυραµίδα, CR= Εικόνα 4-64 L1 ανακατασκευή µε Leveling πυραµίδα, CR= Εικόνα 4-65 sanfran.bmp, 8 η εικόνα του σετ ελέγχου Εικόνα 4-66 PSNR συναρτήσει του CR για L1 ανακατασκευή Εικόνα 4-67 PSNR συναρτήσει του CR για L2 ανακατασκευή Εικόνα 4-68 Original JPEG συµπίεση, CR= Εικόνα 4-69 L1 ανακατασκευή µε Gaussian πυραµίδα, CR= Εικόνα 4-70 L1 ανακατασκευή µε Leveling πυραµίδα, CR= Εικόνα 4-71 Original JPEG συµπίεση, CR= Εικόνα 4-72 L1 ανακατασκευή µε Gaussian πυραµίδα, CR= Εικόνα 4-73 L1 ανακατασκευή µε Leveling πυραµίδα, CR= Εικόνα 4-74 protein.bmp, 9 η εικόνα του σετ ελέγχου Εικόνα 4-75 PSNR συναρτήσει του CR για L1 ανακατασκευή Εικόνα 4-76 PSNR συναρτήσει του CR για L2 ανακατασκευή Εικόνα 4-77 Original JPEG συµπίεση, CR= Εικόνα 4-78 L1 ανακατασκευή µε Gaussian πυραµίδα, CR= Εικόνα 4-79 L1 ανακατασκευή µε Morphological Haar Wavelet, CR= Εικόνα 4-80 Original JPEG συµπίεση, CR= Εικόνα 4-81 L1 ανακατασκευή µε Gaussian πυραµίδα, CR= Εικόνα 4-82 L1 ανακατασκευή µε Morphological Haar Wavelet, CR= Εικόνα 4-83 tmax.bmp, 10 η εικόνα του σετ ελέγχου Εικόνα 4-84 PSNR συναρτήσει του CR για L1 ανακατασκευή Εικόνα 4-85 PSNR συναρτήσει του CR για L2 ανακατασκευή Εικόνα 4-86 Original JPEG συµπίεση, CR= Εικόνα 4-87 L1 ανακατασκευή µε Gaussian πυραµίδα, CR= Εικόνα 4-88 L1 ανακατασκευή µε Leveling πυραµίδα, CR= Εικόνα 4-89 Original JPEG συµπίεση, CR= Εικόνα 4-90 L1 ανακατασκευή µε Gaussian πυραµίδα, CR= Εικόνα 4-91 L1 ανακατασκευή µε Leveling πυραµίδα, CR= Εικόνα 5-1 L3 ανακατασκευή µε Leveling πυραµίδα, CR 203, PSNR= db

15 Εικόνα 5-2 L3 ανακατασκευή µε Leveling πυραµίδα, CR 409, PSNR=+39.09dB Εικόνα 5-3 L4 ανακατασκευή µε Leveling πυραµίδα, CR 439, PSNR= db Εικόνα 5-4 L4 ανακατασκευή µε Leveling πυραµίδα, CR 801, PSNR= db

16 ΕΥΡΕΤΗΡΙΟ ΕΞΙΣΩΣΕΩΝ Εξίσωση Εξίσωση Εξίσωση Εξίσωση Εξίσωση Εξίσωση Εξίσωση Εξίσωση Εξίσωση Εξίσωση Εξίσωση Εξίσωση Εξίσωση Εξίσωση Εξίσωση Εξίσωση Εξίσωση Εξίσωση Εξίσωση Εξίσωση Εξίσωση Εξίσωση Εξίσωση Εξίσωση Εξίσωση Εξίσωση Εξίσωση Εξίσωση Εξίσωση Εξίσωση Εξίσωση Εξίσωση Εξίσωση Εξίσωση Εξίσωση Εξίσωση

17 Εξίσωση Εξίσωση Εξίσωση Εξίσωση Εξίσωση Εξίσωση Εξίσωση Εξίσωση

18 ΕΥΡΕΤΗΡΙΟ ΠΙΝΑΚΩΝ Πίνακας 2-1, Πίνακας κβαντισµού συνιστώσας φωτεινότητας στο πρότυπο JPEG Πίνακας 2-2, Πίνακας κβαντισµού χρωµατικών συνιστωσών στο πρότυπο JPEG Πίνακας 3-1 2D Haar wavelet µετασχηµατισµός ** x 1 =ψ ( x), y i = ω (x) **, i=v, h, d73 Πίνακας 5-1, βαθµοί συµπίεσης για τους οποίους αξίζει να προτιµηθεί κάποιο σχήµα ανάλυσης σε πολλαπλές κλίµακες, έναντι της απλής εφαρµογής του προτύπου JPEG

19 Εισαγωγή 1.1 Ψηφιακή Επεξεργασία Εικόνας Γενικά Η εικόνα ανέκαθεν (τουλάχιστον από όταν κατέστη δυνατό τεχνικά να αποτυπώνεται σε κάποιο φυσικό µέσο) υπήρξε η πλέον προτιµητέα µορφή έκφρασης και ανταλλαγής απόψεων και εντυπώσεων. Προς αυτή την κατεύθυνση σίγουρα βοήθησε και η ικανότητα της µεγάλης πλειοψηφίας των ανθρώπων να αντιλαµβάνονται και να αφοµοιώνουν γρήγορα και εύκολα οπτική πληροφορία, η οποία µάλιστα µπορεί να είναι εξαιρετικά συµπυκνωµένη. Η DIP (Digital Image Processing - Ψηφιακή Επεξεργασία Εικόνας), ξεκίνησε ουσιαστικά από τη στιγµή που οι υπολογιστές απέκτησαν υποσυστήµατα γραφικών ικανά να απεικονίζουν όχι µόνο χαρακτήρες, αλλά και περισσότερο σύνθετα σχήµατα και χρώµατα επί της οθόνης. Η DIP, η οποία προφανώς και αναφέρεται σε ψηφιακές εικόνες, δηλαδή εικόνες του φυσικού κόσµου που µε κάποιο τρόπο έχουν δειγµατοληπτηθεί ή συνθετικές εικόνες που έχουν εξαρχής κατασκευαστεί µε τη βοήθεια κάποιου υπολογιστή, βρίσκει εφαρµογή σε δύο µεγάλους τοµείς: Αποκατάσταση εικόνας Συµπίεση εικόνας Αποκατάσταση εικόνας Η αποκατάσταση της εικόνας αφορά στη διαδικασία που πραγµατοποιείται προκειµένου από µια αρχική εικόνα να µεταβούµε σε µια τελική µορφή της, η οποία παρουσιάζει πλεονεκτήµατα στην εποπτική παρατήρηση και όχι µόνο, σε σχέση µε την αρχική. Για παράδειγµα, µπορεί να έχει αυξηµένη αντίθεση, εξισορροπηµένο ιστόγραµµα ή να έχει απαλλαγεί από κάποιο είδος προσθετικού θορύβου. Πρόκειται για εξαιρετικά σηµαντική διαδικασία, εφόσον πολύ συχνά µόνο µετά το πέρας της ορισµένα είδη εικόνων (π.χ. δορυφορικές φωτογραφίες ή βιοϊατρικές απεικονίσεις) µπορούν να καταστούν χρήσιµες και η µελέτη τους να έχει ουσιαστικά αποτελέσµατα. Στην πράξη, η αποκατάσταση εικόνας σε µικρότερο ή µεγαλύτερο βαθµό εφαρµόζεται σχεδόν σε όλες τις περιπτώσεις όπου χρησιµοποιούνται ψηφιακές εικόνες, καθώς µε τρόπο σχετικά απλό, 19

20 συχνά συστηµατικό και όχι ιδιαίτερα δαπανηρό από υπολογιστικής σκοπιάς η αρχική εικόνα αποκτά ιδιότητες που την καθιστούν περισσότερο προσοδοφόρα για περαιτέρω µελέτη Συµπίεση εικόνας Η συµπίεση εικόνας, από την άλλη πλευρά βρίσκει πληθώρα εφαρµογών ιδιαίτερα στη σύγχρονη εποχή µε την τεράστια διείσδυση του Internet και πολύ περισσότερο των ασύρµατων τηλεπικοινωνιών, όπου ενώ το ζητούµενο πλέον είναι το πλούσιο οπτικοακουστικό περιεχόµενο το διαθέσιµο bandwidth (εύρος ζώνης) είναι µάλλον περιορισµένο, οπότε η συµπίεση εικόνας καθίσταται αναγκαία. Η συµπίεση της ψηφιακής εικόνας συνίσταται στην αναπαράστασή της µε κάποιο διαφορετικό τρόπο, ώστε ο χώρος αποθήκευσης που απαιτεί να είναι µικρότερος από αυτόν που απαιτούσε αρχικά, µε προϋπόθεση όµως η ποιότητά της (µε κριτήριο είτε την εποπτική παρατήρηση, είτε το SNR (Signal to Noise Ratio - σηµατοθορυβικό λόγο) σε σχέση µε την αρχική της µορφή, είτε προτιµότερα µε τη χρήση κάποιου ψυχοφυσικού µοντέλου), να είναι αναλλοίωτη ή χειρότερη αλλά σε κάποιο βαθµό ελεγχόµενο. Υπάρχουν δύο διακριτές ως προς τη φιλοσοφία και την εφαρµογή µέθοδοι συµπίεσης data (δεδοµένων), τα οποία µπορεί να είναι εικόνες ή audio (ήχος) ή video (κινούµενη εικόνα + ήχος): Μη απωλεστική συµπίεση Απωλεστική συµπίεση Μη απωλεστική συµπίεση Στη µη απωλεστική συµπίεση (µε εφαρµογή σε ψηφιακές εικόνες πάντοτε), το ζητούµενο είναι η τέλεια αναπαράσταση της αρχικής-ασυµπίεστης εικόνας σε µία νέα µορφή η οποία µπορεί να αποθηκευτεί σε µικρότερο χώρο. Οι βαθµοί συµπίεσης που επιτυγχάνονται είναι συνήθως µικροί(της τάξης του 1:2 ~ 1:5 σε µη εξεζητηµένες περιπτώσεις), ενώ η απαίτηση είναι η µηδενική απώλεια ποιότητας. Σε κάθε εφαρµογή όπου υπάρχουν υψηλά στάνταρ ποιότητας, όπως για παράδειγµα σε εικόνες έργων τέχνης ή πολύ περισσότερο σε ιατρικές απεικονίσεις, η µοναδική δυνατότητα συµπίεσης είναι µε µη απωλεστικές µεθόδους. 20

21 Η µη απωλεστική συµπίεση είναι ουσιαστικά εφαρµογή της θεωρίας πληροφορίας, που σε συνήθεις περιπτώσεις εφαρµογών συµπίεσης είναι κάποιο είδος κωδικοποίησης µήκους ή εντροπίας ή και αριθµητική κωδικοποίηση, µε ζητούµενο πάντοτε τη µείωση του όγκου των data Απωλεστική συµπίεση Στην απωλεστική συµπίεση, που είναι και η πλέον διαδεδοµένη και χρήσιµη, ο στόχος είναι η συχνά πάρα πολύ µεγάλη συµπίεση, εις βάρος προφανώς της ποιότητας του αποτελέσµατος, µα µε τρόπο ελεγχόµενο, όπως έχει ήδη αναφερθεί. Σε αυτό τον τρόπο συµπίεσης, κάποιες φορές εξετάζεται το συχνοτικό περιεχόµενο της εικόνας, ένα µέρος του οποίου δεν κωδικοποιείται, µε άµεση επίπτωση τη µείωση του όγκου των data. Βέβαια, αποκλείοντας ένα τµήµα του περιεχοµένου της εικόνας δεν είναι δυνατό να υπάρξει ακριβής ανακατασκευή, µα χάρις σε κάποιους περιορισµούς του HVS (Human Vision System Ανθρώπινου Συστήµατος Όρασης), το ποσοστό αυτό που δεν κωδικοποιείται αν και µεγάλο σχετικά κάποιες φορές, έχει µικρή επίπτωση στο εποπτικό αποτέλεσµα. Οι βαθµοί συµπίεσης που επιτυγχάνονται είναι συνήθως µεγάλοι, της τάξης του 1:5 ~ 1:100 σε µη εξεζητηµένες περιπτώσεις, ενώ σε ακραία παραδείγµατα επιτυγχάνονται εξαιρετικά µεγάλες συµπιέσεις της τάξης του 1:200 και παραπάνω. Η πολύ µεγάλη συµπίεση οφείλεται προφανώς στην απώλεια πληροφορίας που υπεισέρχεται κατά τη διαδικασία, ωστόσο συνήθως τα καθιερωµένα πρωτόκολλα απωλεστικής συµπίεσης στο τελευταίο στάδιο της διαδικασίας χρησιµοποιούν και κάποια µέθοδο µη απωλεστικής συµπίεσης πάνω στα data που έχουν επιλεγεί να κωδικοποιηθούν ήδη από το προηγούµενο στάδιο. Η απωλεστικοί τρόποι συµπίεσης έχουν απόλυτη εφαρµογή σε όλες τις περιπτώσεις όπου το bandwidth είναι περιορισµένο, µε κορυφαίο παράδειγµα την πρόσβαση στο Internet, όπου η συντριπτική πλειοψηφία του multimedia (πολυµεσικού οπτικοακουστικού) υλικού βρίσκεται σε απωλεστικά συµπιεσµένη µορφή, ώστε να διευκολύνεται η πρόσβαση των διαφόρων χρηστών, ανεξάρτητα από το bandwidth που διαθέτουν. Μάλιστα, η τεράστια διείσδυση του Internet, οφείλεται σε πολύ µεγάλο βαθµό ακριβώς στον πλούτο του multimedia υλικού το οποίο είναι διαθέσιµο σε τόση πληθώρα χάρις στη συµπίεση που εφαρµόζεται. 21

22 1.2 Όραση Υπολογιστών Γενικά Η CV (Computer Vision Όραση Υπολογιστών), διαφοροποιείται σαφέστατα από την DIP, τόσο σε θεωρητικό όσο και σε πρακτικό επίπεδο. Με βάση το [1], επιχειρώντας µια πολύ σύντοµη επισκόπηση της ιστορικής εξέλιξης της CV, προκύπτει πως τα πρώτα βήµατα αυτού του επιστηµονικού κλάδου έγιναν τις δεκαετίες των 50 και 60 µε απλή ανάλυση binary images (δυαδικών εικόνων), απλές εφαρµογές αναγνώρισης προτύπων (π.χ. OCR (Optical Character Recognition Οπτική Αναγνώριση Χαρακτήρων)) και µε τα πρώτα απλά νευρωνικά δίκτυα. Στη δεκαετία του 70, αναπτύχθηκαν απλά συστήµατα CV που αφορούσαν gray images (γκρίζες εικόνες) και κάποιες πρώτες µεθοδολογίες που αφορούσαν σε 2D (δισδιάστατο) σχήµα και κίνηση και σε ανάλυση υφής. Στη δεκαετία του 80, σηµαντική έρευνα έγινε στο AI Lab του πανεπιστηµίου MIT, αναπτύχθηκαν ιδέες για ανάλυση σε πολλαπλές κλίµακες από διάφορες ερευνητικές οµάδες µε επίκεντρο τις Η.Π.Α. και την Ευρώπη, οι οποίες εστίασαν περισσότερο στην εφαρµογή και στη θεωρία αντίστοιχα. Επίσης, εισήχθηκε η χρήση µερικών διαφορικών εξισώσεων και προέκυψαν µη γραµµικές µεθοδολογίες όπως η µαθηµατική µορφολογία και η ανισοτροπική διάχυση µε PDEs (Partial Differential Equations Μερικές ιαφορικές Εξισώσεις). Αυτή την εποχή εξελίχθηκαν οι active contours (ενεργές καµπύλες), οι οποίες ξεκίνησαν από τα snakes (καµπύλες φίδια) και συνέχισαν µε τις deformable templates (παραµορφώσιµες ταµπλέτες). Τέλος, κατά την περασµένη δεκαετία και τα τελευταία χρόνια γενικότερα, αναπτύχθηκαν οι ιδέες της εξέλιξης καµπύλων και των γεωδεσικών περιγραµµάτων, ενώ συντελέστηκε ουσιώδης πρόοδος στους τοµείς της κατάτµησης, της υφής, του χρώµατος, αλλά και στη στερέοψη, στην κίνηση και στην αναγνώριση αντικειµένων. Η CV έχει ως τελικό στόχο την ανάπτυξη ενός συστήµατος, το οποίο µε ένα συνδυασµό από κατάλληλο hardware (υλικό) και software (λογισµικό), θα µπορεί να «βλέπει» όπως και ένας άνθρωπος. Θα µπορούσε να ειπωθεί πως το όραµα όσων ασχολούνται µε CV είναι η δηµιουργία µιας εφαρµογής που να προσεγγίζει ικανοποιητικά τη λειτουργία του HVS, το οποίο συχνά θεωρείται ως το κορυφαίο σύστηµα βιολογικής όρασης και είναι οπωσδήποτε το πλέον σηµαντικό. 22

23 1.2.2 Κατευθύνσεις και επιµέρους προβλήµατα στην όραση υπολογιστών Στην όραση υπολογιστών έχουν αναπτυχθεί οι εξής τρεις κατευθύνσεις (βλ. [1]): Μηχανική Όραση, που αφορά στον εφοδιασµό µηχανών, ροµπότ και αισθητήρων µε δυνατότητες-στοιχεία όρασης. Βιολογική Όραση, που εστιάζεται στην ανάλυση και κατανόηση της βιολογικής όρασης µε τη βοήθεια υπολογιστικών µοντέλων και στη χρησιµοποίηση των παραπάνω αποτελεσµάτων και παραδειγµάτων για τη δηµιουργία µηχανικής όρασης. Μοντελοποίηση Εγκεφάλου, δηλαδή κατανόηση του τρόπου µε τον οποίο οι άνθρωποι σκέφτονται δεδοµένου ότι η κατανόηση του τρόπου σκέψης εξαρτάται κυρίως από την κατανόηση του µηχανισµού όρασης, εφόσον η όραση είναι η πλέον σηµαντική αίσθηση για την κατανόηση του κόσµου. Ωστόσο, είναι γεγονός ότι η CV δεν είναι σε θέση µέχρι σήµερα όχι µόνο να επιτύχει το στόχο της, µα ούτε καν να επιλύσει αξιόπιστα και συστηµατικά το καθένα από µια σειρά εξαιρετικά απλούστερων προβληµάτων που από κοινού συνθέτουν την τελική «πρόκληση». Βέβαια, συντελείται συστηµατική έρευνα σε ένα τεράστιο εύρος διαφορετικών τοµέων, µε πληθώρα αξιόλογων ερευνητικών οµάδων να παράγει πρωτοποριακές ιδέες ή και να παρέχει οριστικές λύσεις σε επιµέρους προβλήµατα, ωστόσο υπάρχουν ακόµη πάρα πολλά που πρέπει να επιτευχθούν. Οι επιµέρους απλούστερες περιοχές προβληµάτων που αντιµετωπίζει η CV, είναι επιγραµµατικά: Σχηµατισµός εικόνων και προεπεξεργασία. Ανάλυση αλγεβρική, γεωµετρική και τοπολογική binary images. Ανάλυση αλγεβρική και γεωµετρική gray images και οµαλοποίηση. Εξαγωγή χαρακτηριστικών (π.χ. ακµών) σε πολλαπλές κλίµακες. Μοντελοποίηση και ανάλυση υφής. Μοντελοποίηση και ανάλυση χρώµατος. Μοντελοποίηση και ανάλυση 2D σχήµατος. Κατάτµηση εικόνων σε οµογενείς (µε βάση κάποιο κριτήριο οµοιογένειας) περιοχές. Στερέοψη και γεωµετρία πολλαπλών όψεων. Ανίχνευση και εκτίµηση 2D & 3D (τρισδιάστατης) κίνησης. Εκτίµηση 3D σχήµατος και γεωµετρίας µε χρήση πληροφορίας κίνησης και σκίασης. Αναγνώριση και κατηγοριοποίηση οπτικών αντικειµένων. 23

24 1.2.3 Εφαρµογές της όρασης υπολογιστών Οι εφαρµογές της CV είναι πάρα πολλές και ιδιαίτερα σηµαντικές και αφορούν διάφορους τοµείς, οι οποίοι µπορούν να συνοψιστούν ως εξής (βλ. [1]): Βιοµηχανική αυτοµατοποίηση, µε στόχο τον έλεγχο της ποιότητας του προϊόντος µε συστηµατικό τρόπο. Ευφυείς κάµερες, µε στόχο τη δηµιουργία αισθητήρων που να µπορούν να επεξεργάζονται την οπτική είσοδο και να τροφοδοτούν συστήµατα λήψης απλών σχετικά αποφάσεων. Μέσα µεταφοράς, µε στόχο την αποτελεσµατικότερη και ασφαλέστερη αυτόµατη πλοήγηση και αποφυγή εµποδίων. Ροµποτική, µε εφαρµογή στην κίνηση και γενικότερα στον έλεγχο συστηµάτων µε οπτική ανάδραση. Βιοϊατρική, µε εφαρµογή στην ανάλυση των βιοϊατρικών εικόνων. Multimedia, µε εφαρµογή στην αναζήτηση και εξόρυξη δεδοµένων µε αποτελεσµατικές µεθόδους όχι απαραίτητα βασισµένες σε κείµενο πλέον. Επικοινωνία ανθρώπου-µηχανής, µε στόχο τη δηµιουργία MMI (Man Machine Interface ιαπροσωπεία Ανθρώπου-Μηχανής) χωρίς ανάγκη χρησιµοποίησης περιφερειακών συσκευών όπως πληκτρολόγια, παρά µε φυσική αλληλεπίδραση, όπως µεταξύ ανθρώπων που επικοινωνούν. Από την παραπάνω εισαγωγή στην CV, καθίσταται προφανές πως πρόκειται για επιστηµονικό κλάδο αιχµής, µε πληθώρα εφαρµογών. Στη συνέχεια της ανάλυσης θα συζητηθούν και θα ελεγχθούν πειραµατικά εφαρµογές κάποιων στοιχείων επιµέρους τοµέων της CV, στη βελτίωση της απόδοσης του προτύπου συµπίεσης ψηφιακών εικόνων JPEG (Joint Experts Photographic Group). Παρότι η κωδικοποίηση δεν αποτελεί πρόβληµα της CV, µπορούν κάλλιστα να χρησιµοποιηθούν µεθοδολογίες της CV προκειµένου να βελτιωθεί και να καταστεί αποδοτικότερη. 24

25 1.3 Το πρότυπο JPEG Γενικά, σύντοµη επισκόπηση Η ονοµασία του προτύπου JPEG, όπως έχει προαναφερθεί, αποτελεί ακρωνύµιο των όρων Joint Photographic Experts Group και τελεί υπό την αιγίδα διεθνών οργανισµών τυποποίησης όπως οι ISO (International Standards Organization) και CCITT (Consultative Committee of the International Telephone and Telegraph). Το πρότυπο έχει πάρει την ονοµασία της επιτροπής που το δηµιούργησε και που συνεχίζει να καθοδηγεί την εξέλιξή του, τα δε µέλη της επιτροπής είναι ειδικοί που επιλέχθηκαν είτε από κρατικούς οργανισµούς είτε από µεγάλες εταιρίες που ασχολούνται µε την ψηφιακή εικόνα. Το πρότυπο αφορά στη συµπίεση ακίνητων εικόνων, ενώ η διαδικασία απωλεστικής συµπίεσης JPEG, η οποία ακολουθείται στη συντριπτική πλειοψηφία των JPEG εφαρµογών και που θα περιγραφεί λεπτοµερώς ως προς τη δοµή της στο επόµενο κεφάλαιο αυτής της παρουσίασης, αποτελεί ένα µέρος ενός ευρύτερου συνόλου standards κατά ISO, του IS ,2,3 (ITU-T Recommendations T.81, T.83, T.84). Η διαδικασία προτυποποίησης του JPEG ξεκίνησε το 1986, µε αποτέλεσµα τα Μάρτιο του 1987 να κατατεθούν προς αξιολόγηση από την επιτροπή 12 προτάσεις. Η αρχική προσπάθεια, παρήγαγε µια συναίνεση ότι η συµπίεση θα έπρεπε να βασιστεί στο DCT (Discrete Cosine Transform ιακριτός Μετασχηµατισµός Συνηµιτόνου) και τελικά το 1992 αυτή η προσέγγιση πιστοποιήθηκε ως διεθνές standard. Το πρότυπο JPEG αποτελεί σήµερα ένα από τα πλέον αποδεκτά standards στον κόσµο των υπολογιστικών εφαρµογών, µε εκτενή και πολύ συχνά µονοπωλιακή χρήση σε εφαρµογές κωδικοποίησης εικόνας, στα multimedia, αλλά κυρίως στην αποθήκευση εικόνων στα πλαίσια του WWW (WorldWide Web). Η εξαιρετικά χαµηλή για τα σηµερινά δεδοµένα υπολογιστική πολυπλοκότητα του, σε συνδυασµό µε την ανοιχτή αρχιτεκτονική του, το καθιστούν ιδανική πλατφόρµα για πλειάδα εφαρµογών. Παρότι το JPEG standard ορίζει τόσο απωλεστικούς όσο και µη απωλεστικούς αλγόριθµους συµπίεσης, το βάρος τόσο στη µετέπειτα ανάλυσή µας, όσο και στην πράξη δίνεται στο απωλεστικό κοµµάτι, το οποίο ουσιαστικά παρέχει µια µη αντιστρέψιµη απεικόνιση της αρχικής εικόνας σε ένα συµπιεσµένο bit stream (ροή δυαδικών ψηφιών). Τα βασικά χαρακτηριστικά της απωλεστικής µορφής του προτύπου JPEG, είναι επιγραµµατικά τα εξής: 25

26 Υποστηρίζονται τόσο σειριακή όσο και προοδευτική κωδικοποίηση, µε την έννοια ότι στην πρώτη µορφή όλοι οι DCT συντελεστές κωδικοποιούνται σε ένα πέρασµα, ενώ στη δεύτερη στο 1 ο πέρασµα κωδικοποιείται ένα µέρος µόνο των συντελεστών µε τους υπόλοιπους να κωδικοποιούνται σε επόµενα διαδοχικά περάσµατα. Είναι εφικτές υλοποιήσεις µε χαµηλή πολυπλοκότητα, τόσο σε hardware όσο και σε software. Όλοι οι τύποι εικόνων ανεξαρτήτως προέλευσης, περιεχοµένου, ανάλυσης, χρωµατικού τύπου είναι αποδεκτοί ως είσοδοι. Προσφέρεται µια ικανοποιητική σχέση συµβιβασµού ανάµεσα στο bit rate (ρυθµός δυαδικών ψηφίων) και στην ποιότητα του αποτελέσµατος, εκτός από την περίπτωση που το ζητούµενο είναι πολύ χαµηλό bit rate. Υποστηρίζεται µια ιεραρχική µορφή κωδικοποίησης µε πολλαπλά επίπεδα ανάλυσης της εικόνας. Υποστηρίζεται στην εικόνα εισόδου ανάλυση από 8 ως 12 bpp (bits per pixel). ιατίθεται ένας τύπος αρχείου, που ονοµάζεται JFIF (JPEG File Interchange Format), το οποίο επιτρέπει την ανταλλαγή JPEG bit streams ανάµεσα σε µια πληθώρα από πλατφόρµες. Ολοκληρώνοντας αυτή την πρώτη προσέγγιση του προτύπου JPEG, είναι απαραίτητο να σηµειωθεί πως ένας συµβατός JPEG decoder (αποκωδικοποιητής) οφείλει να ικανοποιεί ένα ελάχιστο σύνολο προδιαγραφών, η δε υλοποίηση αυτού φέρει την ονοµασία «βασική υλοποίηση». Υπάρχει όµως και η «εκτεταµένη υλοποίηση» του προτύπου η οποία έχει επιπλέον δυνατότητες, οι οποίες δεν κρίνεται απαραίτητο να αναλυθούν στα πλαίσια αυτής της εργασίας. 26

27 1.4 Συµβολή της διπλωµατικής εργασίας Στη διπλωµατική εργασία διερευνάται η δυνατότητα βελτίωσης της απόδοσης του προτύπου JPEG, χωρίς επεµβάσεις στο ίδιο το πρότυπο, το οποίο αποτελεί απλά ένα από τα στάδια της πειραµατικής υλοποίησης που αναπτύχθηκε στα πλαίσια της εργασίας. Η έµπνευση για το θέµα της εργασίας, βασίζεται εν µέρει στο paper των Alfred M. Bruckstein, Michael Elad, Ron Kimmel, DOWN SCALING FOR BETTER TRANSFORM COMPRESSION [2], το οποίο παρουσιάστηκε στα πλαίσια του παγκόσµιου συνεδρίου Scale-Space 2001, αν και τελικά εξελίχθηκε αρκετά διαφορετικά από την ιδέα που παρουσιάζεται στο paper. Η προσπάθεια για τη βελτίωση εστιάζεται στη δηµιουργία µη γραµµικών µορφολογικών πυραµίδων, κατώτερα επίπεδα των οποίων (ειδικότερα τα επίπεδα 1 και 2, θεωρώντας ως µηδενικό επίπεδο την αρχική προς συµπίεση εικόνα) αφού υποβληθούν σε JPEG συµπίεση, υφίστανται επαναφορά στο αρχικό µέγεθος (µιλώντας χωρικά) µε τη βοήθεια των λειτουργιών της εκάστοτε πυραµίδας. Γίνεται ουσιαστικά µια απόπειρα αξιολόγησης έξι διαφορετικών µεθόδων, µε τη χρήση ισάριθµων διαφορετικών πυραµίδων, ως προς το SNR σε σχέση µε την αρχική εικόνα. Επίσης, γίνεται σύγκριση µε την περίπτωση της απλής εφαρµογής του προτύπου JPEG, οπότε και καθίσταται προφανές το πλεονέκτηµα οποιασδήποτε των έξι προσεγγίσεων, όσον αφορά τις περιπτώσεις συµπίεσης µε χαµηλά bit rate. Τα τελικά αποτελέσµατα και η αξιολόγησή τους, ακολουθούν στο σχετικό κεφάλαιο της εργασίας, όπου εκτός από τα SNR που επιτεύχθηκαν παρατίθενται και οι συµπιεσµένες εικόνες µε στόχο την εποπτική επαλήθευση των αποτελεσµάτων. Είναι πάντως απαραίτητο να σηµειωθεί πως η υλοποίηση είναι πειραµατική, µε αποτέλεσµα οι αλγόριθµοι που αναπτύχθηκαν να µην είναι βελτιστοποιηµένοι από άποψη ταχύτητας εκτέλεσης. Αυτό οφείλεται εν µέρει στο γεγονός ότι το εργαλείο που χρησιµοποιήθηκε για την υλοποίηση είναι το πακέτο Matlab Version a Release 13, το οποίο αποτελεί το πλέον κατάλληλο προγραµµατιστικό περιβάλλον για την ανάπτυξη των µεθόδων που πραγµατεύεται η συγκεκριµένη εργασία. 27

28 28

29 Κεφ. 2 Απαραίτητο γνωστικό υπόβαθρο 2.1 Απωλεστική συµπίεση JPEG λεπτοµερής ανάλυση Γενικά Αρχίζοντας την παρουσίαση του προτύπου JPEG, πρέπει να σηµειωθεί πως το πρότυπο πέρα από τον ορισµό ενός κωδικοποιητή και ενός αποκωδικοποιητή, επίσης ορίζει και ένα συντακτικό για την αναπαράσταση των συµπιεσµένων data καθώς και σχετικούς πίνακες και άλλες παραµέτρους. Στη µετέπειτα παρουσίαση ωστόσο, αυτά τα συντακτικά θέµατα αγνοούνται και εξετάζεται λεπτοµερώς η δοµή του κωδικοποιητή και του αποκωδικοποιητή. Η µελέτη επικεντρώνεται στον κωδικοποιητή και τα στάδια που τον αποτελούν, εφόσον ο αποκωδικοποιητής αποτελείται απλά από τις αντίστροφες διαδικασίες αυτών που απαρτίζουν την κωδικοποίηση, που εφαρµόζονται όµως µε αντίστροφη σειρά. Εικόνα 2-1, Κωδικοποιητής JPEG 29

30 2.1.2 Μετασχηµατισµός χρωµατικού χώρου Πρόκειται για το πρώτο βήµα στη διαδικασία κωδικοποίησης και συνίσταται στο µετασχηµατισµό της αρχικής έγχρωµης εικόνας από το διανυσµατικό χώρο [R,G,B] στο χώρο φωτεινότητας και χρωµατικών συνιστωσών [Y,U,V], ο οποίος εξασφαλίζει µικρότερη αυτοσυσχέτιση ανάµεσα στα επιµέρους σήµατά του. Επιπλέον, επειδή το HVS παρουσιάζει µειωµένη ευαισθησία στις χρωµατικές συνιστώσες U, V, παρά στη φωτεινότητα Y, η χρήση του παραπάνω µετασχηµατισµού αν και όχι επιβεβληµένη παρουσιάζει πολλά πλεονεκτήµατα από άποψη επιτυγχανόµενου βαθµού συµπίεσης, τα οποία θα καταστούν προφανή σε επόµενη παράγραφο που διαπραγµατεύεται τον κβαντισµό Μετασχηµατισµός DCT O DCT, µετασχηµατίζει την εικόνα από το πεδίο του χώρου στο πεδίο της συχνότητας, όπως παριστάνεται στο σχήµα που ακολουθεί: Εικόνα 2-2 DCT µετασχηµατισµός Η εξίσωση ορισµού του µετασχηµατισµού αυτού, ο οποίος είναι αντιστρέψιµος, είναι: F( u, v) Λ( u) Λ( v) 4 = 1, ξ = 0 Λ( ξ ) = 2 1, ξ 0 Εξίσωση i= 0 j= 1 (2i + 1) uπ (2 j + 1) vπ cos cos f ( i, j) Υπάρχει βέβαια και ο idct (inverse DCT αντίστροφος DCT), ο οποίος ορίζεται: 30

31 ) f ( i, j) 1 4 = Λ u= 0 v= 0 1, ξ = 0 Λ( ξ ) = 2 1, ξ (2i + 1) uπ (2 j + 1) vπ ( u) Λ( v)cos cos F( u, v) Εξίσωση 2 Ο DCT, ο οποίος ανήκει στην οικογένεια των ηµιτονοειδών µετασχηµατισµών, έχει αποτελέσει αντικείµενο µεγάλης προσοχής εξαιτίας της επιτυχίας του στη συµπίεση εικόνων του φυσικού κόσµου. Μάλιστα, στην περίπτωση ψηφιακών εικόνων του πραγµατικού κόσµου, που αναµένεται αρκετά υψηλή συσχέτιση µεταξύ των pixel (εικονοστοιχείων) τους, η απόδοση του DCT είναι παραπλήσια µε αυτή του βέλτιστου µετασχηµατισµού Karhunen-Loeve. Πρόκειται για 2D µετασχηµατισµό, µα µπορεί να γραφεί ως γινόµενο 1D (µονοδιάστατων) µετασχηµατισµών που εφαρµόζονται διαδοχικά και ξεχωριστά κατά µήκος των γραµµών και των στηλών της ψηφιακής εικόνας. Στην περίπτωση του προτύπου JPEG, η εφαρµογή του DCT γίνεται σε block (περιοχές τµήµατα) της εικόνας, διαστάσεων 8 8 pixel. Οι συναρτήσεις βάσης του 2D DCT, µε ένα γραµµικό συνδυασµό των οποίων παριστάνεται κάθε block της εικόνας, είναι πραγµατικές και ουσιαστικά αποτελούν δειγµατοληπτηµένη µορφή ενός γινοµένου ηµιτονοειδών συναρτήσεων. Εικόνα 2-3 Συναρτήσεις βάσης του DCT Σε αυτό το σηµείο αξίζει να σηµειωθεί πως ο DCT προτιµάται σε σχέση µε τον DFT (Discrete Fourier Transform ιακριτός Μετασχηµατισµός Fourier), επειδή στον τελευταίο υπεισέρχεται µια περιοδικότητα που η οποία ενισχύει τις αναπόφευκτες ασυνέχειες των ακµών της εικόνας, µε αποτέλεσµα οι υψίσυχνοι συντελεστές DFT να είναι µεγαλύτερη των αντίστοιχων του DCT. 31

32 Αντίθετα στον DCT υπεισέρχεται συµµετρική περιοδικότητα, χάρις στην οποία αποφεύγονται οι ασυνέχειες των ακµών από block σε block της εικόνας. Έτσι, κατά µέσο όρο οι υψίσυχνοι συντελεστές του DCT είναι µικρότεροι από αυτούς του DFT, γεγονός που υπαγορεύει τη χρήση του πρώτου, εφόσον το ζητούµενο είναι η συµπίεση της αρχικής ποσότητας data. Το πλέον ενδιαφέρον και σηµαντικό όµως χαρακτηριστικό του DCT, είναι η ικανότητά του να αποδίδει µεγάλες συγκριτικά τιµές στους χαµηλής συχνότητας συντελεστές, οι οποίοι τυχαίνει να είναι και οι πιο σηµαντικοί οπτικά για το HVS. Επιπλέον, συντελεστές αυτοί συγκεντρώνονται σε ένα µικρό µέρος (συγκεκριµένα στην πάνω αριστερή γωνία) του υπό µετασχηµατισµό block, γεγονός που καθιστά τους DCT συντελεστές πρόσφορους για αποδοτική κωδικοποίηση και που αποτελεί την ουσία όλων των κωδικοποιήσεων µετασχηµατισµού. Σε αυτού του είδους τις κωδικοποιήσεις, η λειτουργία που επιτελείται είναι ο µετασχηµατισµός των αρχικών data σε µια µορφή που επιδέχεται καλύτερη κωδικοποίηση, χωρίς όµως αυτό να σηµαίνει ότι ο µετασχηµατισµός από µόνος του οδηγεί σε συµπίεση. Η συµπίεση ειδικά για το πρότυπο JPEG, οφείλεται κατά κύριο λόγο στον κβαντισµό και λιγότερο στην κωδικοποίηση εντροπίας, που εξετάζονται στη συνέχεια της εργασίας. Ολοκληρώνοντας αυτή την προσέγγιση στον 2D DCT, αξίζει να σηµειωθεί πως διαθέτει µια σηµαντική ιδιότητα, αυτή της διαχωρισιµότητας, που οδηγεί σε απλούστερες και ταχύτερες υλοποιήσεις του τόσο σε hardware όσο και σε software, εφόσον ο 2D DCT µπορεί να υπολογιστεί ως το γινόµενο δύο 1D DCT µετασχηµατισµών που εφαρµόζονται στο block διαδοχικά, ο ένας κατά µήκος των γραµµών και ο άλλος των στηλών. Η διαχωρισιµότητα και η διαδοχική εφαρµογή των 1D DCT µετασχηµατισµών, φαίνονται στην εξίσωση 2-3 και στην εικόνα 2-4 που ακολουθούν. Εξίσωση 3 1 F[ u, v] = 2 1 G[ i, v] = 2 j i (2i + 1) uπ Λ( u) cos G[ i, v] 16 (2 j + 1) vπ Λ( v) cos f [ i, j] Εικόνα 2-4 Υπολογισµός 2D DCT µε τη βοήθεια δύο εφαρµογών 1D DCT µετασχηµατισµών

33 2.1.4 Κβαντισµός Γενικά Το στάδιο του κβαντισµού, στο οποίο στην πράξη οφείλεται η πολύ καλή συµπίεση του προτύπου JPEG, είναι και το µοναδικό µη αντιστρεπτό στάδιο στην όλη διαδικασία κωδικοποίησης και άρα το µοναδικό που εισάγει σφάλµατα. Θεωρώντας τους πραγµατικούς DCT συντελεστές που αντιστοιχούν σε ένα block της προς συµπίεση εικόνας: F(u,v), 0 u,v 7, ο κβαντισµός αποτελεί µια απεικόνιση της πραγµατικής τιµής των συντελεστών σε ένα από ένα περιορισµένο πλήθος επιπέδων ακεραίων τιµών, µε την τιµή κάθε επιπέδου να σχετίζεται αντιστρόφως ανάλογα µε τον επιδιωκόµενο βαθµό συµπίεσης για το συγκεκριµένο συντελεστή. Αυτό επιτυγχάνεται διαιρώντας κάθε στοιχείο κάθε block του πίνακα των συντελεστών DCT µε ένα πίνακα Q[u,v] διαστάσεων 8 8 που ονοµάζεται πίνακας κβαντισµού και στρογγυλοποιώντας το αποτέλεσµα. Κατά συνέπεια, αν το στοιχείο Q[i,j] που αντιστοιχεί στην i-γραµµή και j-στήλη του πίνακα κβαντισµού έχει µεγάλη τιµή, τότε ο αντίστοιχος DCT συντελεστής κβαντίζεται χονδροειδώς. Οι τιµές του πίνακα κβαντισµού είναι ακέραιοι αριθµοί από 1 ως 255 και σύµφωνα µε τα προηγούµενα καθορίζουν τη λεπτοµέρεια της κβάντισης των αντίστοιχων DCT συντελεστών. Με βάση τα παραπάνω, προκύπτει προφανώς πως ο κβαντισµός δεν είναι οµοιόµορφος. Οι κβαντισµένοι πλέον συντελεστές DCT παρέχονται από τη σχέση: F[ u, v] QF [ u, v] = round Q[ u, v] Εξίσωση 4 Για κάθε χρωµατική συνιστώσα της προς συµπίεση εικόνας χρειάζεται από ένας πίνακας κβαντισµού, χωρίς όµως να αποκλείεται περισσότερες της µίας συνιστώσες να χρησιµοποιούν τον ίδιο πίνακα, όπως ακριβώς συµβαίνει µε το πρότυπο JPEG, όπου οι δύο χρωµατικές συνιστώσες U, V χρησιµοποιούν ένα πίνακα κβαντισµού ενώ η συνιστώσα φωτεινότητας χρησιµοποιεί ένα διαφορετικό. 33

34 Καθιερωµένοι πίνακες κβαντισµού Στο πρότυπο JPEG αν και επιτρέπεται η χρήση οποιοδήποτε πίνακα κβαντισµού, συνήθως χρησιµοποιούνται δύο συγκεκριµένοι πίνακες ένας για τη φωτεινότητα και ένας για τις χρωµατικές συνιστώσες. Πίνακας 2-1, Πίνακας κβαντισµού συνιστώσας φωτεινότητας στο πρότυπο JPEG Πίνακας 2-2, Πίνακας κβαντισµού χρωµατικών συνιστωσών στο πρότυπο JPEG Αυτοί οι πίνακες υπολογίστηκαν µε τη βοήθεια µιας σειράς ψυχοφυσικών πειραµάτων που στόχευαν στον προσδιορισµό των κατωφλίων ορατότητας για τις συναρτήσεις βάσης του DCT για µια εικόνα διαστάσεων , της οποίας οι χρωµατικές συνιστώσες έχουν υποδειγµατοληπτηθεί κατά 2 στην οριζόντια διάσταση και σε απόσταση ίση µε το εξαπλάσιο του πλάτους της οθόνης η οποία χρησιµοποιήθηκε για τη διεξαγωγή του πειράµατος. 34

35 Εξετάζοντας τους παραπάνω πίνακες, καθίσταται προφανές πως ο πίνακας κβαντισµού των χρωµατικών συνιστωσών έχει µεγαλύτερες τιµές από τον αντίστοιχο της συνιστώσας φωτεινότητας, πράγµα που σηµαίνει ότι οι χρωµατικές συνιστώσες κβαντίζονται χονδροειδέστερα από ότι η συνιστώσα φωτεινότητας και που υπαγορεύεται από τη µικρότερη σχετικά ευαισθησία του HVS στις χρωµατικές από ότι στις συνιστώσες φωτεινότητας. Οι δύο αυτοί πίνακες κβαντισµού παρουσιάζουν ικανοποιητική επίδοση κατά µέσο όρο, σε µια µεγάλη ποικιλία εφαρµογών και συνθηκών ορατότητας, γεγονός στο οποίο οφείλουν τη µεγάλη αποδοχή τους και βέβαια την ονοµασία καθιερωµένοι. Σηµειώνεται εδώ πως στο πρότυπο JPEG ορίζεται ο συντελεστής ποιότητας Q, που είναι ένας ακέραιος από 1 ως 100, µε βάση τον οποίο προκύπτει ένας συντελεστής QF, ως εξής: 100 Q, Q > QF = Q, Q = 50 50, Q < 50 Q Εξίσωση 5 Με το συντελεστή QF πολλαπλασιάζονται οι καθιερωµένοι πίνακες κβαντισµού, µε αποτέλεσµα ο τελικός χρήστης να µπορεί να ρυθµίζει κατά έµµεσο τρόπο το βαθµό συµπίεσης που επιθυµεί, ανάλογα µε τη συγκεκριµένη εφαρµογή Βέλτιστοι πίνακες κβαντισµού Σχεδίαση πινάκων κβαντισµού Παρά τη µεγάλη διάδοσή τους, οι καθιερωµένοι πίνακες κβαντισµού είναι σαφώς υποβέλτιστοι για κάποιες κατηγορίες εικόνων. Άλλωστε, η τεράστια ποικιλία διαφορετικών εικόνων υπαγορεύει την ύπαρξη ενός µόνο βέλτιστου πίνακα για κάθε εικόνα. Προς αυτή την κατεύθυνση έχει γίνει σηµαντική έρευνα, η οποία βελτιώνει ουσιαστικά το πρότυπο JPEG, και που έχει ως αφετηρία το γεγονός πως πρέπει να αφιερώνονται περισσότερα bits σε DCT συνιστώσες µε µεγαλύτερη µεταβλητότητα. Συχνά οι απωλεστικοί αλγόριθµοι συµπίεσης εικόνων εξετάζονται ως προς την παραµόρφωση, σε σχέση µε την αρχική εικόνα, που εισάγουν συναρτήσει του επιλεγόµενου bit-rate. Ωστόσο, η εύρεση του βέλτιστου πίνακα κβαντισµού (µε το στάδιο της κβάντισης να εισάγει ουσιαστικά την παραµόρφωση στο πρότυπο JPEG), είναι επίπονη διαδικασία αν λάβει κανείς υπόψη το πλήθος 35

36 των διαφορετικών εικόνων, των δυνατών bit-rate, αλλά και των διαφορετικών ορισµών της παραµόρφωσης, που µπορεί να είναι είτε µαθηµατικοί είτε καθαρά υποκειµενικοί. Κρίνεται λοιπόν πως η περαιτέρω ενασχόληση µε το θέµα της εύρεσης των βέλτιστων πινάκων κβαντισµού ξεφεύγει από το πνεύµα της συγκεκριµένης εργασίας, σκοπός της οποίας δεν είναι η βελτιστοποίηση του JPEG µε αυτόν τουλάχιστον τον τρόπο Απεικόνιση συντελεστών DCT σε σύµβολα και κωδικοποίηση Γενικά Ο κβαντισµός καθιστά τον τρόπο συµπίεσης απωλεστικό, µα συνεισφέρει τα µέγιστα στη συµπίεση. Ωστόσο, η φύση των κβαντισµένων συντελεστών DCT και η παρουσία πολλών µηδενικών σε κάθε block, υπαγορεύει τη χρήση και κάποιου µη απωλεστικού σχήµατος κωδικοποίησης. Απαραίτητη προϋπόθεση για αυτό όµως είναι οι κβαντισµένοι συντελεστές DCT να είναι κατά τέτοιο τρόπο διαταγµένοι ώστε να είναι αποδοτική η µη απωλεστική κωδικοποίησή τους. Γι αυτό το λόγο, στο πρότυπο JPEG η πάνω αριστερά συνιστώσα κάθε block που ονοµάζεται και DC-συνιστώσα και όλες οι υπόλοιπες που ονοµάζονται AC-συνιστώσες, έχουν διαφορετική αντιµετώπιση Zig-zag σάρωση συντελεστών DCT Οι κβαντισµένοι πλέον συντελεστές DCT υποβάλλονται σε µια διαδικασία zig-zag σάρωσης, σύµφωνα µε το παρακάτω σχήµα. Εικόνα 2-5 Zig-zag σάρωση κβαντισµένων συντελεστών DCT 36

37 Αυτή η zig-zag σάρωση ταξινοµεί τους συντελεστές σε σειρά αυξανόµενης χωρικής συχνότητας, ενώ µετά τον κβαντισµό προκύπτει πως οι υψίσυχνοι συντελεστές είναι µε µεγάλη πιθανότητα µηδενικοί. Άµεση επίπτωση αυτού του γεγονότος είναι πως µετά τη σάρωση οι συντελεστές κάθε block απαρτίζουν µια ακολουθία µήκους 64 που στο τέλος της υπάρχουν αρκετά µηδενικά και που µπορεί να κωδικοποιηθεί αποδοτικά σύµφωνα µε τα παρακάτω DC-συνιστώσα Το βασικό χαρακτηριστικό των DC-συνιστωσών κάθε block, είναι πως είναι ισχυρά συσχετισµένες µεταξύ τους, µε αποτέλεσµα να κωδικοποιούνται ξεχωριστά από όλες τις υπόλοιπες. Κατά συνέπεια, µε βάση και το γεγονός ότι γενικά έχουν µεγάλη τιµή, το πρότυπο JPEG χρησιµοποιεί για την κωδικοποίησή τους την κωδικοποίηση DPCM (Differential Pulse Code Modulation ιαφορική Παλµοκωδική ιαµόρφωση), όπου κωδικοποιείται η διαφορά από συνιστώσα σε συνιστώσα καθώς διατρέχονται τα block το ένα µετά το άλλο AC-συνιστώσες Όπως έχει ήδη γίνει αντιληπτό η πλειοψηφία των AC-συνιστωσών είναι µηδενικές, µε αποτέλεσµα σε κάθε ακολουθία των 63 συντελεστών DCT (που αντιστοιχούν στις AC-συνιστώσες) για κάθε block, να υπάρχουν πολλά διαδοχικά (λόγω της zig-zag σάρωσης) µηδενικά. Σε τέτοιες περιπτώσεις, κρίνεται ιδιαίτερα κατάλληλη η κωδικοποίηση RLE (Run Length Encoding Κωδικοποίηση Μήκους ιαδροµής), η οποία εύκολα µπορεί να γίνει κατανοητή µε το παράδειγµα που ακολουθεί. Έστω η προς κωδικοποίηση µήκους διαδροµής ακολουθία: abcddddddcbbbbabcdef, η οποία έχει µήκος 20. Κάθε υποακολουθία επαναλαµβανόµενων συµβόλων αντικαθίσταται από ένα θετικό ακέραιο που ισούται µε το πλήθος των όµοιων συµβόλων και από το ίδιο το σύµβολο που επαναλαµβάνεται. Πριν από κάθε υποακολουθία διαφορετικών συµβόλων εισάγεται ένας αρνητικός ακέραιος µε τιµή ίση µε το πλήθος της υποακολουθίας. Με βάση τα παραπάνω, η RLE κωδικοποιηµένη πλέον ακολουθία έχει ως εξής: -3abc6d-1c4b6abcdef. Το µήκος της κωδικοποιηµένης ακολουθίας είναι 17, ενώ η συµπίεση που επιτυγχάνεται είναι µη απωλεστική. Η RLE προφανώς αποδίδει καλύτερα όσο µεγαλώνει η το πλήθος των επαναλαµβανόµενων υποακουλουθιών και η συχνότητα µε την οποία παρουσιάζονται. Σε αυτό το σηµείο πρέπει να τονιστεί πως σε εξεζητηµένες περιπτώσεις ακολουθιών, όπως για παράδειγµα όταν όλα τα σύµβολα είναι διαφορετικά µεταξύ τους, τότε η κωδικοποίηση καταλήγει σε αρνητική συµπίεση. Ωστόσο, αυτές οι περιπτώσεις δεν είναι συνήθεις στα πλαίσια του 37

38 προτύπου JPEG, εφόσον η συµπίεση αφορά συνήθως εικόνες του φυσικού κόσµου, που εµφανίζουν γενικά υψηλή αυτοσυσχέτιση όσον αφορά τις τιµές (φωτεινότητας και χρωµατικών συνιστωσών) σε γειτονικά pixel Κωδικοποίηση εντροπίας Η κωδικοποίηση εντροπίας είναι το τελευταίο από τα στάδια που απαρτίζουν τον κωδικοποιητή JPEG και είναι διαδικασία αντιστρέψιµη και µάλιστα ιδιαίτερα αποδοτική συνήθως. Η αρχή λειτουργίας τέτοιου είδους κωδικοποιήσεων που συνοψίζονται στη σχετική βιβλιογραφία µε το όνοµα VLC (Variable Length Coding Κωδικοποίηση Μεταβλητού Μήκους), είναι η αντιστοίχιση µικρότερων code words (λέξεων κώδικα) στα συχνότερα εµφανιζόµενα σύµβολα µιας ακολουθίας, µε στόχο το µέσο µήκος code word να ανταποκρίνεται στην εντροπία της πηγής της προς κωδικοποίηση ακολουθίας. Στο πρότυπο JPEG χρησιµοποιείται η κωδικοποίηση Huffman, η οποία είναι βέλτιστη µόνο όταν οι πιθανότητες εµφάνισης των συµβόλων είναι ακέραιες δυνάµεις του ½. Αντί της κωδικοποίησης Huffman, θα µπορούσε εναλλακτικά να χρησιµοποιηθεί η αριθµητική κωδικοποίηση, η οποία προσεγγίζει καλύτερα όσον αφορά την απόδοση το θεωρητικό όριο της εντροπίας της πηγής των συµβόλων. Ωστόσο, στη βασική υλοποίηση του προτύπου µε στην οποία αναφέρεται η παρούσα εργασία, χρησιµοποιείται η κωδικοποίηση Huffman όπου εν ολίγοις µε τη βοήθεια ειδικών πινάκων αντιστοίχισης σχετίζονται τα σύµβολα µε κατάλληλες code words, µε µήκη αντιστρόφως ανάλογα µε τη συχνότητα εµφάνισης κάθε συµβόλου. Η κωδικοποίηση εντροπίας συµβάλλει καθοριστικά στην επίτευξη ικανοποιητικής σχετικά απόδοσης από το µη απωλεστικό τµήµα συµπίεσης του προτύπου JPEG, κρίνεται όµως πως περαιτέρω ανάλυση ξεφεύγει από το πνεύµα και το σκοπό της εργασίας αυτής. 38

39 2.2 Πειραµατική υλοποίηση προτύπου JPEG Γενικά Η υλοποίηση του απωλεστικού αλγορίθµου συµπίεσης της βασικής υλοποίησης του προτύπου JPEG που έλαβε χώρα στα πλαίσια της διπλωµατικής εργασίας, στόχευε περισσότερο στην εξοικείωση µε το πρότυπο και την κατανόηση της δοµής του, παρά στην πιστή απόδοσή του. Αυτή η παραχώρηση κατέστη αναγκαία, καθώς η ανάπτυξη ενός 100% συµβατού αλγορίθµου εγείρει πλήθος συντακτικών θεµάτων η αντιµετώπιση των οποίων απαιτούσε πρόσβαση στο πλήρες συντακτικό του προτύπου, το οποίο δεν είναι ελεύθερα διαθέσιµο. Πολύ περισσότερο, µια τέτοια προσέγγιση δε συνάδει µε το γενικότερο πνεύµα της εργασίας, η έµφαση της οποίας δίνεται στη διερεύνηση της πιθανότητας βελτίωσης της απόδοσης του προτύπου JPEG µε τη χρήση µορφολογικών πυραµίδων. Υπό αυτό το πρίσµα και εφόσον η όλη απόπειρα έχει διερευνητικό-πειραµατικό χαρακτήρα, σηµειώνεται πως η ανάπτυξη του αλγορίθµου έγινε χωρίς µεγάλες απαιτήσεις σε ταχύτητα εκτέλεσης, χωρίς βέβαια αυτό να σηµαίνει πως δεν έχει καταβληθεί προσπάθεια βελτιστοποίησης όπου αυτό ήταν εφικτό, δεδοµένων πάντα των χρονικών ορίων και συνθηκών ιαφορές σε σχέση µε το πρότυπο JPEG Στην παράγραφο αυτή συνοψίζονται οι ουσιαστικές διαφορές ανάµεσα στον πειραµατικό αλγόριθµο που αναπτύχθηκε και στη βασική υλοποίηση του προτύπου JPEG αυτή καθαυτή. ε γίνεται υποδειγµατοληψία κατά 2 σε κάθε διάσταση των χρωµατικών συνιστωσών, όπως συνηθίζεται σε τυπικές υλοποιήσεις. Υποστηρίζονται και άλλοι πίνακες κβαντισµού εκτός των καθιερωµένων, καθώς υπάρχει η αντίστοιχη επιλογή. Χρησιµοποιούνται ωστόσο οι καθιερωµένοι. Οι DC-συνιστώσα και οι AC-συνιστώσες στο µη απωλεστικό µέρος της κωδικοποίησης αντιµετωπίζονται ενιαία, σε αντίθεση µε τις τυπικές υλοποιήσεις όπου ακολουθείται η λογική που αναπτύχθηκε στην παράγραφο 2.1. Το αρχείο εξόδου που αποτελεί και το αποτέλεσµα του αλγορίθµου δεν είναι συµβατό µε το πρότυπο JPEG, µε αποτέλεσµα να µην είναι προσβάσιµο από τα τυπικά εργαλεία επεξεργασίας εικόνας και να απαιτείται ο αντίστοιχος decoder, που επίσης αναπτύχθηκε στα πλαίσια της εργασίας. 39

40 Παρέχεται µια εκτίµηση του SNR ανάµεσα στη συµπιεσµένη και την αρχική εικόνα, η οποία βασίζεται στο µαθηµατικό κριτήριο MSE (Mean Square Error Μέσο Τετραγωνικό Σφάλµα), καθώς επίσης και η δυνατότητα οπτικοποίησης του. Με αυτό τον τρόπο πέρα από την εποπτική παρατήρηση του αποτελέσµατος, υπάρχει και ένα αυστηρά ορισµένο κριτήριο αξιολόγησης της ποιότητάς του, ιδιαίτερα βολικό στην περίπτωση όπου το ζητούµενο είναι η σύγκριση της ποιότητας ανάµεσα σε δύο ή περισσότερες εικόνες Κώδικας σε Matlab που αναπτύχθηκε Ο κώδικας που αναπτύχθηκε στα πλαίσια της εργασίας, αποτελείται από τρία τµήµατα: Πειραµατική υλοποίηση του JPEG codec (Coder, Decoder Κωδικοποιητή, Αποκωδικοποιητή). Υλοποίηση έξι διαφορετικών µεθόδων πυραµιδικής ανάλυσης. Script files που επιτελούν τις απαραίτητες µετρήσεις και παρέχουν τα αποτελέσµατα µε τη µορφή εικόνων, κειµένου και γραφηµάτων. Ο κώδικας συνοδεύεται από τα απαραίτητα σχόλια, όπου αυτό κρίνεται αναγκαίο για την καλύτερη κατανόηση του, ωστόσο αναγκαία προϋπόθεση για την πλήρη κατανόησή του αποτελεί η µικρή έστω εξοικείωση µε το προγραµµατιστικό περιβάλλον της Matlab. Κρίνεται αναγκαίο σε αυτό το σηµείο να επισηµανθεί, όχι για πρώτη φορά, ότι ο κώδικας δεν είναι βελτιστοποιηµένος όσον αφορά την ταχύτητα εκτέλεσης, καθώς πρόκειται για καθαρά πειραµατική υλοποίηση εποµένως το ουσιώδες είναι η ορθότητα των αποτελεσµάτων µε όλες τις άλλες παραµέτρους να καθίστανται δευτερεύουσας σηµασίας. Μάλιστα, για το λόγο ακριβώς που προαναφέρθηκε, κρίθηκε καλύτερο για τη διεξαγωγή των πειραµάτων και µετρήσεων να χρησιµοποιηθεί ο επίσηµος JPEG codec της Matlab, εφόσον είναι σαφέστατα ταχύτερος και παράλληλα περισσότερο αξιόπιστος εφόσον είναι προϊόν που έχει υποστεί τυποποίηση από διεθνείς οργανισµούς, µε αποτέλεσµα η πειραµατική υλοποίηση του JPEG codec να αποσκοπεί στην εξοικείωση και µόνο µε το πρότυπο και στη βαθύτερη κατανόηση της λειτουργίας του, η οποία όµως είναι απαραίτητη προκειµένου αυτό να αποτελέσει την αφετηρία για την απόπειρα βελτίωσης που εξετάζεται στη συνέχεια της εργασίας. 40

41 2.3 Σχετικά µε το paper (δηµοσίευση) DOWN SCALING FOR BETTER TRANSFORM COMPRESSION [2] Γενικά Το [2] αποτέλεσε τον πυρήνα της ιδέας που πραγµατεύεται η διπλωµατική εργασία, αν και τελικά υπήρξε σηµαντική διαφοροποίηση ανάµεσα στην αρχική ιδέα που αναπτύσσεται στο [2] και στη φιλοσοφία που ακολουθήθηκε στα πλαίσια της εργασίας. Οι συγγραφείς του [2] είχαν ως κίνητρο για την έρευνά τους τη σαφώς χαµηλή απόδοση του προτύπου JPEG στις περιπτώσεις συµπίεσης εικόνων σε χαµηλά και ειδικά σε πολύ χαµηλά bit rate. Γι αυτό το λόγο, ολόκληρη η υπόλοιπη ανάλυσή τους εστιάζεται στη συµπίεση εικόνων µε χαµηλά bit rate και αφορά αποκλειστικά και µόνο αυτές τις περιπτώσεις. Από την εργασία τους προκύπτει πως αν η προς συµπίεση εικόνα υποδειγµατοληπτηθεί, στη συνεχεία εφαρµοστεί ο αλγόριθµος JPEG στην υποδειγµατοληπτηµένη εικόνα και τελικά χρησιµοποιηθεί κάποια µέθοδος παρεµβολής ώστε να επανέλθει η εικόνα στις αρχικές τις διαστάσεις, τότε το αποτέλεσµα είναι οπτικά καλύτερο σε σχέση µε αυτό που θα προέκυπτε µε απευθείας εφαρµογή του JPEG στην αρχική εικόνα. Αυτή η παρατήρηση θεµελιώνεται θεωρητικά στο [2], η δε θεµελίωσή αυτή θα αναπαραχθεί συνοπτικά στην επόµενη παράγραφο, µε στόχο όχι τόσο την παρουσίαση της µεθόδου των συγγραφέων αλλά κυρίως την επισήµανση της διαφοράς ανάµεσα στην εργασία τους και στη διπλωµατική εργασία υνατότητα βελτίωσης της απόδοσης του JPEG µε υποδειγµατοληψία και κατόπιν παρεµβολή στο αρχικό µέγεθος Ανάλυση ενός συνεχούς µοντέλου αναπαράστασης εικόνας, στο πνεύµα του προτύπου JPEG Σε αυτή την παράγραφο γίνεται µια απόπειρα να αποδοθεί το πνεύµα της µεθόδου των συγγραφέων του [2], µε ανάλυση ποιοτική, καθώς κρίνεται περιττό να αναπαραχθεί στη λεπτοµέρειά της η µεθοδολογία που ακολουθείται. Συγκεκριµένα, στο [2] προτείνεται µια αναλυτική απόδειξη της αρχικής παρατήρησης που αναφέρθηκε προηγούµενα, ενώ επίσης παρέχεται µία µαθηµατική έκφραση που περιγράφει το σφάλµα στην ανακατασκευή της αρχικής εικόνας, ως συνάρτηση του συνολικού αριθµού των bits που αφιερώνονται στην αναπαράσταση της συµπιεσµένης εικόνας, των στατιστικών 41

42 χαρακτηριστικών της αρχικής εικόνας και του παράγοντα κλίµακας, ο οποίος καθορίζει το βαθµό υποδειγµατοληψίας. Το µαθηµατικό µοντέλο που αναπτύχθηκε θεωρεί την αρχική ψηφιακή εικόνα ως συνεχή 2D συνάρτηση και όχι ως διακριτή (όπως πράγµατι είναι), ώστε να απλουστευθεί η όλη διαδικασία, ενώ τα βήµατα που ακολουθούνται προκειµένου να προκύψει το τελικό αποτέλεσµα είναι τα εξής: Εξαγωγή του αναµενόµενου τετραγωνικού σφάλµατος ανακατασκευής για µια γενικότερη διαδικασία απεικόνισης εικόνας, βασισµένης στον τεµαχισµό της εικόνας σε block διαστάσεων Μ Ν pixels. Εξαγωγή µιας έκφρασης για το σφάλµα, η οποία λαµβάνει υπόψη το γεγονός πως η κωδικοποίηση είναι κωδικοποίηση µετασχηµατισµού και χρησιµοποιεί ορθοκανονικές συναρτήσεις βάσης, ενώ υποθέτει πως το σφάλµα οφείλεται αποκλειστικά στην περικοπή ενός µέρους των συνιστωσών του µετασχηµατισµού. Επέκταση της παραπάνω έκφρασης, ώστε να κβαντισµού των µη περικοµµένων συνιστωσών. συµπεριλαµβάνεται και το σφάλµα Επέκταση της παραπάνω έκφρασης, ώστε να υπεισέρχεται σε αυτή το γεγονός ότι ο µετασχηµατισµός που λαµβάνει χώρα είναι o DCT, δηλαδή ότι οι ορθοκανονικές συναρτήσεις βάσης είναι ηµίτονα. Ολοκλήρωση της έκφρασης για το σφάλµα ανακατασκευής µε τη συµµετοχή σε αυτή µιας προσέγγισης των σφαλµάτων κβαντισµού που εισάγονται λόγω διαφόρων πολιτικών κατανοµής του ολικού αριθµού των διαθέσιµων bits. Το τελικό αποτέλεσµα, η διαδικασία που οδήγησε στο οποίο δεν κρίνεται απαραίτητο να αναπαραχθεί εδώ εφόσον κάθε ενδιαφερόµενος µπορεί να ανατρέξει στο [2], έχει ως εξής: Εξίσωση 6 Q [ ε ] 2 1 (2 δ k )(2 δ l k, l Ω 2 = r0 a a x y Κ ) Μ ; k, k Μ ; l, l 1 M N E w 2 b kl 42

43 Q Στην παραπάνω εξίσωση, [ ] 2 E ε είναι το αναµενόµενο µέσο σφάλµα ανακατασκευής, bkl είναι ο w αριθµός των bits που αφιερώνονται στην αναπαράσταση των συνιστωσών DCT, R(x, y; x+r x, a r a r 2 x x y y y+r y )= r0 e e είναι η αυτοσυσχέτιση µιας 2D στατικής τυχαίας διαδικασίας µηδενικής µέσης τιµής (µε την αρχική εικόνα να θεωρείται ως πραγµάτωση µιας τέτοιας διαδικασίας), ενώ ισχύει: 2 A k l D D A l+ k A (2 e ( ) ( ) [( 1) + ( 1) ] 1+ δ δ 1+ ( 1) ( )( ) M ( A; k, l) = korl k l A + k π A + ( lπ ) A + ( kπ ) 2 Εξίσωση Οι θεωρητικές προβλέψεις του µοντέλου Στα προηγούµενα που αναφέρθηκαν, προτάθηκε ένα µοντέλο για το τετραγωνικό σφάλµα ανακατασκευής ως συνάρτηση των στατιστικών χαρακτηριστικών 2 ης τάξης της αρχικής προς συµπίεση εικόνας r 0, a x, a y, του συνολικού αριθµού των διαθέσιµων bits και του αριθµού των τεµαχίων της εικόνας Μ και Ν. Θεωρείται στην παρακάτω ανάλυση πως η αρχική εικόνα διαστάσεων pixel µε 8 bpp, ορίζεται πάνω στο µοναδιαίο τετράγωνο [0,1] [0,1], κατά συνέπεια το εύρος του pixel είναι 1. Υποτίθεται και πάλι πως η αρχική εικόνα είναι πραγµάτωση µιας 2D στατικής τυχαίας 512 διαδικασίας µηδενικής µέσης τιµής µε αυτοσυσχέτιση της µορφής R 2 i i' i i' ( i i' j j' ) = r ρ ρ 0 1 συνήθως συµβαίνει. 2 Από µία και µόνο εικόνα, η τιµή του r , όπου τα ρ 1, ρ 2 κινούνται στην περιοχή τιµών [0.8, 0.9], όπως = i, j 0 r 2 2 ( I( i, j) I ) = 2 i µπορεί να εκτιµηθεί από την έκφραση, υποθέτοντας ισοσταθµισµένο ιστόγραµµα. Θεωρώντας πως ρ i i' e i i' a , µπορεί να προκύψει µια εκτίµηση για το α a 512 χρησιµοποιώντας ότι e = ρ [0.8,0.9], µε αποτέλεσµα: a = 512 log ρ, ρ [50,150]. e Ο συνολικός αριθµός των bits για την αναπαράσταση της εικόνας θα κυµαίνεται από 0.05 bpp ως 2.0 bpp, κατά συνέπεια η τιµή του B TOT θα κυµαίνεται από =13107 ως = bits για αρχικές εικόνες διαστάσεων Κατά συνέπεια στις 43

44 θεωρητικές αναλύσεις υποτίθεται ότι: ax, a y [50,150], r0 = για εικόνες µε 256 διαβαθµίσεις του γκρι µε το συνολικό αριθµό bits που αφιερώνονται στην αναπαράσταση να κυµαίνεται από ως Η εξίσωση 6 παρέχει την έκφραση για το αναµενόµενο τετραγωνικό σφάλµα ανακατασκευής, όπου η τιµή του b kl Λ = παρέχεται από την ικανοποίηση του κριτηρίου της βέλτιστης κατανοµής kl 2 επιπέδων και είναι: Εξίσωση 8 Λ 2 kl = (2 δ 2 k 2 )(2 δ l ) Μ a M a ; k, k Μ ; l, l Κ M 2 2BTOT / M ( 2 ) 1 Ω 1 ( k, l) Ω ~ 2 σ kl Με βάση τις παραπάνω εκτιµήσεις για τις περιοχές τιµών των παραµέτρων που εξετάζονται, µπορεί να σχεδιαστεί γραφικά η προσέγγιση του αναλυτικού µοντέλου για το αναµενόµενο τετραγωνικό σφάλµα ως συνάρτηση του αριθµού των τεµαχίων Μ µε παράµετρο τον αριθµό των bits που αφιερώνονται στην αναπαράσταση. Τα γραφήµατα αυτά δεν αναπαράγονται εδώ για λόγους που έχουν ήδη αναφερθεί προηγούµενα, από τα οποία όµως προκύπτει πως για κάθε δεδοµένη εικόνα και κάθε δεδοµένο συνολικό αριθµό bits υπάρχει µία βέλτιστη τιµή της παραµέτρου τεµαχισµού Μ, η οποία υποδεικνύει το βέλτιστο συντελεστή υποδειγµατοληψίας, που ελαχιστοποιεί το µέσο τετραγωνικό σφάλµα ανακατασκευής Στο επόµενο κεφάλαιο η µελέτη θα επικεντρωθεί σε χωρική υποδειγµατοληψία σταθερής κλίµακας, όπου όµως πιθανόν να λαµβάνουν χώρα και κάποιοι µη γραµµικοί µορφολογικοί µετασχηµατισµοί που διατηρούν κάποια χαρακτηριστικά της εικόνας παρά τη µείωση του µεγέθους της. 1 Ω 44

45 Κεφ. 3 Ανάλυση εικόνων σε πολλαπλές κλίµακες 3.1 Εισαγωγή στην ανάλυση σε πολλαπλές κλίµακες Στο φυσικό κόσµο υπάρχουν εικόνες που συνήθως περιλαµβάνουν αντικείµενα σε πολλαπλές κλίµακες, ενώ παράλληλα η εµφάνιση και τα χαρακτηριστικά διαφόρων αντικειµένων είναι πιθανό να διαφέρουν όταν αλλάζει η κλίµακα της παρατήρησης. Για παράδειγµα, όταν κάποιος βρίσκεται σε µεγάλη σχετικά απόσταση από µια κατοικία, την αντιλαµβάνεται (υπό την προϋπόθεση ότι το οπτικό του πεδίο είναι απαλλαγµένο από εµπόδια) ως ένα στερεό σώµα σχετικά οµογενές εφόσον οι πόρτες και τα παράθυρα αποτελούν λεπτοµέρειές που δεν είναι δυνατό να διακρίνει σε τέτοια απόσταση, ενώ όσο πλησιάζει ανακαλύπτει όλο και περισσότερες λεπτοµέρειες. Όταν πλησιάσει πιο κοντά στην είσοδο βλέπει την πόρτα, ενώ φτάνοντας ακόµη πιο κοντά βλέπει το κουδούνι. Καθίσταται λοιπόν προφανές πως σε αυτή την περίπτωση η κλίµακα σχετίζεται µε την απόσταση του παρατηρητή από το αντικείµενο της προσοχής του, ενώ όσο αυτή µειώνεται τόσο αυξάνει το πλήθος και η λεπτοµέρεια των χαρακτηριστικών που µπορεί να αντιληφθεί. Η ανάλυση εικόνων σε πολλαπλές κλίµακες έχει προκύψει ως χρήσιµη και συχνά απαραίτητη υποδοµή για µια πληθώρα θεµάτων της όρασης υπολογιστών και της επεξεργασίας εικόνας, όπως: Καταπολέµηση θορύβου σε διαφορετικές κλίµακες. Πυραµίδες εικόνων. Ανίχνευση χαρακτηριστικών σε µεγάλες κλίµακες, µε στόχο την ακριβέστερη προσέγγιση της θέσης ή της τιµής αυτών χρησιµοποιώντας µικρότερες κλίµακες. Εκτίµηση κίνησης ή στερέοψη µέσω ταιριάσµατος χαρακτηριστικών σε πολλαπλές κλίµακες. Ανάλυση υφής και σχήµατος σε πολλαπλές κλίµακες. Κατάτµηση σε πολλαπλές κλίµακες. Από τα παραπάνω αυτό που αναλύεται στη διπλωµατική εργασία είναι οι πυραµίδες εικόνων και σε αυτές θα αφιερωθεί η ανάλυση στο υπόλοιπο του κεφαλαίου. Μια σηµαντική διάκριση των πυραµίδων εικόνων ή απλά πυραµίδων στη συνέχεια του κειµένου είναι σε γραµµικές και µη γραµµικές, µε τις δύο πρώτες που θα εξεταστούν στη συνέχεια να εµπίπτουν στην 1 η κατηγορία και τις υπόλοιπες στη 2 η. Σε αυτό το σηµείο κρίνεται απαραίτητο να παρατεθεί η αρχική ασυµπίεστη εικόνα που θα χρησιµοποιηθεί (µεταξύ άλλων) στη συνέχεια της εργασίας ως αφετηρία για την εκτέλεση των 45

46 πειραµάτων, αλλά και ως σηµείο αναφοράς στην αξιολόγηση µέσω του SNR των διαφορετικών µεθόδων που αναπτύχθηκαν. Εικόνα 3-1 Αρχική φωτογραφία της Lena, All Rights Reserved Η εικόνα παρουσιάζεται παραπάνω στο φυσικό της µέγεθος, ώστε να είναι ορατές οι λεπτοµέρειές της και να αποκτά ο αναγνώστης την πραγµατική αίσθηση της ποιότητας της αρχικής εικόνας, οπότε να είναι εύκολη η εποπτική σύγκριση µε τις ανακατασκευασµένες εκδοχές της που ακολουθούν στις επόµενες παραγράφους, όπου αναλύονται τα διάφορα σχήµατα ανάλυσης σε πολλαπλές κλίµακες. 46

47 3.2 Ορισµός γενική περιγραφή των σχηµάτων πυραµιδικής αποδόµησης σηµάτων Στην περίπτωση που πραγµατεύεται η εργασία, τα σήµατα που ενδιαφέρουν είναι 2D χωρικά σήµατα, δηλαδή εικόνες, οι οποίες µάλιστα όταν προέρχονται από το φυσικό κόσµο παρουσιάζουν υψηλή αυτοσυσχέτιση ανάµεσα στα δείγµατα που τις αποτελούν. Πυραµίδα εικόνων είναι µια πεπερασµένη ή και άπειρη αλληλουχία επιπέδων σε κάθε ένα από τα οποία αντιστοιχεί και µία εικόνα, µε τέτοιο τρόπο ώστε το πληροφοριακό περιεχόµενο να µειώνεται όσο αυξάνονται τα επίπεδα. Οι εικόνες που αντιστοιχούν στα µη µηδενικά επίπεδα παράγονται από µία αρχική εικόνα, η οποία και περιλαµβάνεται στην έννοια της πυραµίδας και θεωρείται πως αποτελεί το µηδενικό της επίπεδο, όπως φαίνεται στο σχήµα που ακολουθεί: Εικόνα 3-2 Πυραµίδα εικόνων µε αρχική τη γνωστή Lena Επιπλέον προκειµένου µια αλληλουχία εικόνων να αποτελεί πυραµίδα, πρέπει η µετάβαση από ένα δεδοµένο επίπεδο κ στο αµέσως µεγαλύτερο κ+1 να γίνεται µέσω µιας λειτουργίας reduce (µείωση) ή analysis (ανάλυση) µε το µέγεθος της εικόνας του επιπέδου κ+1 σε κάθε διάσταση να είναι πολλαπλασιασµένο επί ένα συγκεκριµένο συντελεστή µικρότερο της µονάδας, ενώ στο αµέσως µικρότερο κ-1 µέσω µιας λειτουργίας expand (επέκταση) ή synthesis (σύνθεση) µε το µέγεθος της εικόνας του επιπέδου κ-1 σε κάθε διάσταση να είναι πολλαπλασιασµένο επί ένα συγκεκριµένο συντελεστή µεγαλύτερο της µονάδας. Συνήθως, οι τιµές του συντελεστή αυτού είναι 2 και 47

48 1 αντίστοιχα, ενώ η αλλαγή µεγέθους γίνεται µε κάποια µέθοδο παρεµβολής που θα συζητηθεί 2 στη συνέχεια. Στο εξής θα προτιµηθούν οι όροι analysis και synthesis, οι οποίοι και αποδίδουν ακριβέστερα το νόηµα της διεργασίας που επιτελούν, αν και οι όροι reduce και expand συνάδουν περισσότερο µε την αίσθηση της µεταβολής του µεγέθους (χωρικά µιλώντας) της εικόνας, καθώς αλλάζει το επίπεδο της πυραµίδας. Αυτό ισχύει επειδή στην πράξη η δηµιουργία µιας πυραµίδας συνεπάγεται πολύ περισσότερα από την αλλαγή απλώς των διαστάσεων της αρχικής εικόνας βάσης της πυραµίδας. Ωστόσο, προκειµένου µία αλληλουχία επιπέδων όντως να αποτελεί πυραµίδα, πρέπει πέρα από τις δύο προηγούµενες προϋποθέσεις να ικανοποιείται και η υπόθεση ότι η διαδοχική εφαρµογή των τελεστών synthesis, analysis σε µία εικόνα δεν επιφέρουν αλλαγή στο πληροφοριακό της περιεχόµενο. ηλαδή σε µαθηµατική σηµειολογία: analysis ( synthesis) = id Εξίσωση 9 Η λειτουργία synthesis είναι µια απεικόνιση από την εικόνα επιπέδου κ στην εικόνα επιπέδου κ-1, η οποία έχει πολλαπλάσια και συνήθως (όπως θα θεωρείται από εδώ και στο εξής, στα πλαίσια της εργασίας) τετραπλάσια ανάλυση. Από την άλλη πλευρά η λειτουργία analysis είναι µια απεικόνιση από την εικόνα επιπέδου κ στην εικόνα επιπέδου κ+1, η οποία έχει υποπολλαπλάσια και συνήθως (όπως θα θεωρείται από εδώ και στο εξής, στα πλαίσια της εργασίας) υποτετραπλάσια ανάλυση. Ένας δηµοφιλής τρόπος για να υλοποιηθεί ένα σχήµα πολυδιακριτικής αποδόµησης σήµατος, είναι πρώτα να υποστεί το αρχικό αυτό σήµα LP filtering (Low Pass filtering Βαθυπερατό φιλτράρισµα) ώστε να αποµακρυνθούν οι υψηλές συχνότητες και στη συνέχεια να υποδειγµατοληπτηθεί το προηγούµενο αποτέλεσµα, ώστε να προκύψει µια µειωµένης κλίµακας έκδοση του αρχικού προς επεξεργασία σήµατος. Οι διεργασίες synthesis και analysis προφανώς προκαλούν πέρα από την αλλαγή ανάλυσης και κάποιο µετασχηµατισµό στις εικόνες στις οποίες εφαρµόζονται. Έτσι, οι πυραµίδες διακρίνονται σε: Γραµµικές πυραµίδες Μη γραµµικές πυραµίδες, 48

49 Στις γραµµικές πυραµίδες ο µετασχηµατισµός αυτός είναι γραµµικός, ενώ στις µη γραµµικές είναι προφανώς µη γραµµικός. Στόχος της διπλωµατικής εργασίας ήταν η ανάπτυξη κατάλληλων µη γραµµικών πυραµίδων, εφαρµογή του προτύπου JPEG σε κατώτερα επίπεδα των οποίων και στη συνέχεια επαναφορά στην αρχική ανάλυση µε παρεµβολή, επιδιώκεται να παρέχει καλύτερα συγκριτικά οπτικά αποτελέσµατα. Σε αυτό το σηµείο πρέπει να τονιστεί πως η ανάλυση εικόνων σε πολλαπλές κλίµακες δεν υπαγορεύει τη δηµιουργία πυραµίδας, εφόσον δεν είναι απαραίτητη η αλλαγή της ανάλυσης για κάθε τιµή της κλίµακας. Ωστόσο, το πρόγραµµα που αναπτύχθηκε στα πλαίσια της εργασίας δηµιουργεί έξι διαφορετικά είδη πυραµίδων, µιας και η βασική ιδέα είναι η µείωση της ανάλυσης της προς συµπίεση εικόνας πριν τη συµπίεση κατά το πρότυπο JPEG. Στην εικόνα που ακολουθεί, φαίνεται η ανάλυση της αρχικής εικόνας της Lena σε τέσσερις κλίµακες, όπου στην 1 η κλίµακα φαίνεται η συνέλιξη της αρχικής εικόνας µε µια Gaussian (γκαουσιανή συνάρτηση Gauss) µε τυπική απόκλιση σ=1, στη 2 η µε σ=3, στην 3 η µε σ=5 και στην 4 η µε σ=7. Εικόνα 3-3 Ανάλυση εικόνας σε πολλαπλές κλίµακες, µε σταθερά κλίµακας την τυπική απόκλιση Στο παραπάνω παράδειγµα ανάλυσης σε πολλαπλές κλίµακες, δε δηµιουργείται πυραµίδα εφόσον η ανάλυση της εικόνας σε κάθε κλίµακα παραµένει σταθερή. Στη συνέχεια της εργασίας πάντως η ανάλυση σε πολλαπλές κλίµακες θα συνεπάγεται τη δηµιουργία πυραµίδας, κάτι που αποτελεί βασική προϋπόθεση της µεθόδου που αναπτύσσεται και αξιολογείται στα πλαίσια της διπλωµατικής. Στην επόµενη παράγραφο θα εξεταστούν διεξοδικά τα έξι διαφορετικά είδη πυραµίδων που υλοποιήθηκαν και που είναι: Απλή πυραµίδα υποδειγµατοληψίας Gaussian πυραµίδα Leveling πυραµίδα Adjunction πυραµίδα Sun-Maragos πυραµίδα 49

50 Morphological Haar Wavelet πυραµίδα Σε κάθε σχετική υποπαράγραφο θα παρατίθεται και µία εικόνα των επιπέδων 0 ως και 3 της εκάστοτε πυραµίδας, ώστε να εξοικειώνεται και διαισθητικά ο αναγνώστης µε την έννοια της ανάλυσης σε πολλαπλές κλίµακες µε τη χρήση πυραµίδας. Σηµειώνεται εδώ πως σε αυτές τις εικόνες τα επίπεδα των πυραµίδων που θα απεικονίζονται προκύπτουν από το προηγούµενό τους µε χρήση αποκλειστικά της διεργασίας analysis, γι αυτό και παρατηρείται υποβάθµιση της ποιότητας της εικόνας όσο ανεβαίνουν τα επίπεδα. Επίσης, θα παρουσιάζεται και µια εικόνα της αναδόµησης από τα επίπεδα 0 ως και 3 πίσω στην αρχική εικόνα, ουσιαστικά δηλαδή απεικονίζεται η δράση του τελεστή προσέγγισης, ο οποίος ορίζεται στο τέλος της παρούσας παραγράφου. Ολοκληρώνοντας αυτή τη συνοπτική εισαγωγή στα σχήµατα πυραµιδικής αποδόµησης σηµάτων, πρέπει να σηµειωθεί πως στη σχετική βιβλιογραφία [3] έχει προταθεί µια ενιαία αντιµετώπιση όλων των πυραµιδικών σχηµάτων ανεξαρτήτως γραµµικού ή µη χαρακτήρα η οποία και απαντάει στα εξής ερωτήµατα: Όλες οι µη γραµµικές µέθοδοι πυραµιδικής ανάλυσης που έχουν κατά καιρούς προταθεί στη βιβλιογραφία είναι ριζικά διαφορετικές ή αποτελούν απλά πραγµατώσεις της ίδιας θεωρίας; Ποια είναι η βάση µιας τέτοιας θεωρίας και πώς µπορεί αυτή να δοµηθεί; Αν µια τέτοια θεωρία υφίσταται τελικά, θα µπορούσε να εµπεριέχει και τις γραµµικές πυραµίδες ως ειδικές περιπτώσεις; Έχει λοιπόν διατυπωθεί ένα γενικότερο σχήµα πολυδιακριτικής ανάλυσης το οποίο αναπαριστά ένα σήµα ή ειδικότερα µια εικόνα σε µία αλληλουχία εικόνων διαδοχικά µειούµενου όγκου (αφορά στο χώρο που καταλαµβάνουν προκειµένου να αποθηκευτούν), η οποία προκύπτει µε την εφαρµογή κανόνων που απεικονίζουν ένα επίπεδο στο επόµενο. Υπό αυτή την έννοια, ένα επίπεδο της πυραµίδας καθορίζεται αποκλειστικά από το προηγούµενό του. Αυτή η ενιαία προσέγγιση, περιλαµβάνει τρεις βασικές υποθέσεις: ε γίνεται καµία υπόθεση όσον αφορά το χώρο στον οποίο ανήκουν τα προς επεξεργασία σήµατα. Θα µπορούσε να είναι γραµµικός ή και µη γραµµικός χώρος. Το σχήµα που προτείνεται απαρτίζεται από τελεστές µεταξύ διαφορετικών χώρων (των επιπέδων της πυραµίδας), οι οποίοι διακρίνονται σε τελεστές ανάλυσης που αντιπροσωπεύουν διαδικασίες ανόδου στα επίπεδα και που επιφέρουν µείωση του 50

51 πληροφοριακού περιεχοµένου της εικόνας και σε τελεστές σύνθεσης που αντιπροσωπεύουν διαδικασίες καθόδου στα επίπεδα και που δεν επιφέρουν επιπλέον µείωση του πληροφοριακού περιεχοµένου της εικόνας. Οι τελεστές synthesis και analysis οφείλουν να ικανοποιούν την εξίσωση 9, η οποία και αποκαλείται συνθήκη πυραµίδας. Πρέπει πάντως εδώ να σηµειωθεί πως σε πολλές περιπτώσεις σχηµάτων αποδόµησης η παραπάνω συνθήκη παραβλέπεται. Ολοκληρώνοντας, µπορεί να ειπωθεί πως για κάθε πυραµιδικό σχήµα ισχύουν τα εξής: Κάθε τελεστής ανάλυσης ο οποίος απεικονίζει ένα σήµα χ j από το επίπεδο j στο αµέσως επόµενο επίπεδο j+1 µειώνει την πληροφορία. Αυτή η πληροφορία µπορεί να αποθηκευτεί σε ένα σήµα λεπτοµέρειας (στο επίπεδο j), που είναι η διαφορά ανάµεσα στο σήµα χ j και στην προσέγγιση ) χ j, η οποία προκύπτει από την εφαρµογή του τελεστή σύνθεσης στο σήµα χ j+1. Σε γενικές γραµµές κάθε αναπαράσταση µέσω κάποιου σχήµατος πυραµιδικής αποδόµησης (δηλαδή µε τη βοήθεια του αδρότερου σήµατος µαζί µε τα σήµατα λεπτοµέρειας σε όλα τα επίπεδα) είναι πλεονάζουσα, µε την έννοια ότι η αποδόµηση παράγει περισσότερη πληροφορία σε σχέση µε αυτήν του αρχικού σήµατος. 3.3 Απλή πυραµίδα υποδειγµατοληψίας Η απλή πυραµίδα υποδειγµατοληψίας, είναι η απλούστερη δυνατή και υλοποιήθηκε κυρίως για να παρέχει µία βάση αναφοράς για τη σχέση τιµής απόδοσης που θα πρέπει να ικανοποιεί η κάθε µία από τις µεθόδους που αναπτύχθηκαν, προκειµένου να είναι αξιοποιήσιµες. Αυτό σηµαίνει πως µια µικρή βελτίωση της απόδοσης όσον αφορά το SNR, δε µπορεί να δικαιολογήσει την πολύ µεγάλη αύξηση της υπολογιστικής πολυπλοκότητας. Εντούτοις, η εργασία έχει καθαρά διερευνητικό χαρακτήρα και κατά συνέπεια η µέθοδος που προτιµάται είναι αυτή που επιτυγχάνει τα καλύτερα αποτελέσµατα, ανεξαρτήτως οποιουδήποτε άλλο κριτηρίου αξιολόγησης. Άλλωστε οι αλγόριθµοι που αναπτύχθηκαν στα πλαίσια της εργασίας δεν είναι βελτιστοποιηµένοι από άποψη ταχύτητας εκτέλεσης. Στην πυραµίδα αυτή, οι διεργασίες analysis και synthesis, έχουν ως εξής: Analysis: Οµαδοποιώντας τα pixel της εικόνας σε block των 2 2, διατηρείται µόνο το ένα από αυτά και συγκεκριµένα το κάτω δεξιά. Σε µαθηµατική σηµειολογία: ψ ( f ) = DOWNSAMPLE( f ), όπου ο τελεστής DOWNSAMPLE κάνει 51

52 υποδειγµατοληψία της εικόνας κατά 2 σε κάθε χωρική διάσταση και υλοποιήθηκε στα πλαίσια της διπλωµατικής εργασίας µε τη µέθοδο πλησιέστερου γείτονα. Synthesis: Για κάθε pixel της εικόνας δηµιουργούνται άλλα τρία µε ίδιες τιµές φωτεινότητας και στα τρία χρωµατικά κανάλια, ώστε και τα τέσσερα µαζί να αποτελέσουν ένα block από pixel µε την ίδια τιµή. Σε µαθηµατική σηµειολογία: ψ ( f ) = UPSAMPLE( f ), όπου ο τελεστής UPSAMPLE κάνει επέκταση της εικόνας κατά 2 σε κάθε χωρική διάσταση και υλοποιήθηκε στα πλαίσια της διπλωµατικής εργασίας επίσης µε παρεµβολή πλησιέστερου γείτονα. Αξίζει στο σηµείο αυτό να τονιστεί πως επειδή µε αυτή την πρώτη µέθοδο δηµιουργίας πυραµίδας εικόνων συντελείται χωρική υποδειγµατοληψία της εικόνας κατά δύο και ως προς τις δύο διαστάσεις, χωρίς όµως να έχει προηγηθεί LP filtering, είναι πιθανό να παρουσιαστούν φαινόµενα aliasing (αναδίπλωσης) ανάλογα βέβαια και µε το συχνοτικό περιεχόµενο της εικόνας. Τα φαινόµενα aliasing στις εικόνες γίνονται αντιληπτά µε τη µορφή µικρών ή και µεγαλύτερων διαταραχών των ακµών τις εικόνας, µε την αντικατάσταση των ευθυγράµµων τµηµάτων των ακµών από τεθλασµένα και είναι άµεση συνέπεια του θεωρήµατος υποδειγµατοληψίας του Nyqyist. Στις εικόνες που ακολουθούν παρουσιάζονται τα τέσσερα πρώτα επίπεδα της απλής πυραµίδας υποδειγµατοληψίας, µε µορφή που εποπτικά παραπέµπει στην πυραµίδα. Επίσης παρουσιάζεται η αναδόµηση τεσσάρων επιπέδων µε τη βοήθεια του σχήµατος ανάλυσης σε πολλαπλές κλίµακες µε χρήση της απλής πυραµίδας υποδειγµατοληψίας. Εικόνα 3-4 Απλή πυραµίδα υποδειγµατοληψίας, τα τέσσερα πρώτα επίπεδα 52

53 Level 0 - Original Image Level 1 Level 2 Level 3 Εικόνα 3-5 Απλή πυραµίδα υποδειγµατοληψίας, αναδόµηση τεσσάρων επιπέδων 3.4 Gaussian πυραµίδα Η Gaussian πυραµίδα, η οποία προτάθηκε από τους P. J. Burt και E. H. Adelson στο [4], αποτέλεσε την απαρχή των σχηµάτων πυραµιδικής αποδόµησης και έθεσε µε κοµψό και απλό µαθηµατικά τρόπο τις βάσεις για την πυραµιδική ανάλυση. Πρόκειται για γραµµική πυραµίδα, εφόσον οι τελεστές analysis και synthesis ορίζουν γραµµικές διαδικασίες. Αξίζει σε αυτό το σηµείο να επαναληφθεί πως βασικό χαρακτηριστικό των εικόνων του φυσικού κόσµου που έχουν µετατραπεί σε ψηφιακή µορφή, είναι η υψηλή σχετικά αυτοσυσχέτιση ανάµεσα στα pixel τους. Άρα, η αναπαράσταση µιας τέτοιας εικόνας απευθείας µε τις τιµές της φωτεινότητας των pixel της, αποθηκεύει και πλεονάζουσα πληροφορία. Κατά συνέπεια, προκειµένου να αποθηκευτεί µια εικόνα µε αποδοτικό τρόπο και να συµπιεστεί πρέπει να βρεθεί µια αναπαράσταση που αποσυσχετίζει τα pixel της. Αυτό µπορεί να γίνει µε τεχνικές: Πρόβλεψης, που είναι σχετικά απλές στην υλοποίηση και προσαρµόζονται στα τοπικά χαρακτηριστικά της εικόνας. Μετασχηµατισµού, που παρέχουν µεγαλύτερη συµπίεση και είναι υπολογιστικά. πολυπλοκότερες 53

54 Στις τεχνικές πρόβλεψης, οι τιµές των pixel κωδικοποιούνται διαδοχικά. Ωστόσο, πριν την κωδικοποίηση κάθε pixel η τιµή του προβλέπεται µε τη βοήθεια αυτών προηγούµενων pixel, ενώ αυτό που κωδικοποιείται τελικά είναι διαφορά ανάµεσα στην πραγµατική τιµή και σε αυτή που προβλέφθηκε για κάποιο pixel, που ονοµάζεται και σφάλµα πρόβλεψης. Η δυνατότητα της αποκωδικοποίησης διασφαλίζεται από το γεγονός ότι η τιµή που αποδίδεται σε ένα pixel κατά την κωδικοποίηση είναι συνάρτηση µόνων των τιµών των pixel που κωδικοποιήθηκαν πριν από αυτό, δηλαδή η διαδικασία είναι αιτιατή. Στις τεχνικές µετασχηµατισµού, γίνεται µετασχηµατισµός της εικόνας σε κάποιο άλλο χώρο όπου η συσχετίσεις των pixel είναι µικρότερες. Σε αυτές τις περιπτώσεις, δε λαµβάνει χώρα διαδοχική κωδικοποίηση των pixel, αλλά ταυτόχρονη ή σε block. Στην περίπτωση της Gaussian πυραµίδας, η τιµή της φωτεινότητας κάθε pixel υπολογίζεται ως ο τοπικός µέσος µιας ψηφιακής προσέγγισης της Gauss συνάρτησης, µε κέντρο το ίδιο το pixel. Οι προσεγγιστικές τιµές των pixel της εικόνας, υπολογίζονται ως συνέλιξη της συνάρτησης βάρους µε την αρχική εικόνα. Στη Gaussian πυραµίδα, κάθε επίπεδο προκύπτει από το προηγούµενό του µε βαθυπερατό φιλτράρισµα. Οι συναρτήσεις βάρους που χρησιµοποιούνται για τη συνέλιξη που υλοποιεί το φιλτράρισµα είναι συµµετρικές. Στην πυραµίδα αυτή (όπως υλοποιήθηκε στην εργασία), δεδοµένου πως η εικόνα-βάση g 0 (επίπεδο 0) έχει διαστάσεις R C και πως τα υπόλοιπα επίπεδα συµβολίζονται µε g l, 0 < l < N, οι διεργασίες analysis και synthesis, έχουν ως εξής: Analysis: 2 2 g ( i, j) = w( m, n) g, 0 < l < N, 0 i C l, l m= 2n= 2 0 j R l, όπου ο πυρήνας της συνέλιξης είναι: l 1 (2i + m,2 j + n) w(m,n) = Εξίσωση 10 Ο πυρήνας αυτός είναι διαχωρισµός, µε την έννοια ότι προκύπτει από πολλαπλασιασµό δύο 1D πυρήνων και µπορεί να εφαρµοστεί και µε 1D συνέλιξη, πρώτα σε στήλες και κατόπιν σε γραµµές. Αυτή η µέθοδος ακολουθήθηκε και στα πλαίσια της διπλωµατικής εργασίας. 54

55 Synthesis: g l, n ( i, j) = m= 2n= 2 w( m, n) g l, n 1 i m, 2 j n, όπου (i-m)/2 και 2 (j-n)/2 είναι ακέραιοι, 0 < l N, 0 n, 0 i C l-n, 0 j R l-n. Σηµειολογικά, ορίζεται: g l,n είναι το αποτέλεσµα της εφαρµογής του τελεστή analysis n φορές πάνω στο g l. Εξίσωση 11 Σηµειώνεται εδώ πως ο τελεστής synthesis µετατρέπει µια εικόνα διαστάσεων (Μ+1) (Ν+1) σε µια εικόνα διαστάσεων (2Μ+1) (2Ν+1), παρεµβάλλοντας νέες τιµές ανάµεσα στις γνωστές τιµές των pixel του προηγούµενου επιπέδου. Για λόγους πληρότητας,αξίζει να παρατεθεί σε αυτό το σηµείο η εξίσωση της ισοτροπικής 2D Gaussian συνάρτησης: f x + y 1 2 2σ ( x, y) = e 2 2π σ Εξίσωση 12 Μια διακριτή προσέγγιση της εξίσωσης 12, σε ένα διακριτό παράθυρο µεγέθους 5 5, είναι ο συνελικτικός πυρήνας της εξίσωσης 10. Η διακριτή 2D συνέλιξη, η οποία αφορά διακριτά ψηφιακά σήµατα όπως οι εικόνες που συµπιέζονται στα πλαίσια της διπλωµατικής εργασίας, ορίζεται ως εξής: 2 2 Έστω a, b συναρτήσεις δύο διακριτών µεταβλητών n 1, n 2. Τότε η 2D συνέλιξη των a, b, παρέχεται από: + c( n1, n2 ) a( k1, k2 ) b( n1 k1, n2 k2 ) = k = k = Εξίσωση 13 Ολοκληρώνοντας την παρουσίαση της Gaussian πυραµίδας, υπενθυµίζεται στον αναγνώστη πως η τεχνική που ακολουθείται στη διπλωµατική δεν περιορίζεται στη δηµιουργία της εκάστοτε πυραµίδας, παρά εστιάζεται στην κατά JPEG συµπίεση του ανώτερου επιθυµητού επιπέδου αυτής και στη συνέχεια µέσω της διεργασίας synthesis στην επαναφορά στο αρχικό µέγεθος της εικόνας, δηλαδή στο επίπεδο 0 της πυραµίδας. Το ζητούµενο πάντοτε είναι η διερεύνηση της πιθανότητας βελτίωσης της απόδοσης της συµπίεσης µε τη βοήθεια αυτού του σχήµατος, σε σύγκριση µε την εφαρµογή απλώς του πρωτοκόλλου JPEG. Στις εικόνες που ακολουθούν παρουσιάζονται τα τέσσερα πρώτα επίπεδα της απλής πυραµίδας υποδειγµατοληψίας, µε µορφή που εποπτικά παραπέµπει στην πυραµίδα. Επίσης παρουσιάζεται η αναδόµηση τεσσάρων επιπέδων µε τη βοήθεια του σχήµατος ανάλυσης σε πολλαπλές κλίµακες µε χρήση της Gaussian πυραµίδας. 55

56 Εικόνα 3-6 Gaussian πυραµίδα, τα τέσσερα πρώτα επίπεδα Level 0 - Original image Level 1 Level 2 Level 3 Εικόνα 3-7 Gaussian πυραµίδα, αναδόµηση τεσσάρων επιπέδων 3.5 Adjunction πυραµίδες Προαπαιτούµενα στα µαθηµατικά Ο αναγνώστης που ενδιαφέρεται να εµβαθύνει στο µαθηµατικό υπόβαθρο, µπορεί να ανατρέξει στα [5], [6]. 56

57 Έστω σήµα f(x) µε πεδίο ορισµού δοµικό στοιχείο (structuring element). Ορίζονται πλέον οι τελεστές: Dilation του f από το A: δ f )( x) = f ( x y) Εξίσωση 14 A d F Z και Α ένα υποσύνολο του Ζ d, το οποίο ονοµάζεται ( max y A, x y F Erosion του f από το Α: ε f )( x) = f ( x y) Εξίσωση 15 ( min A + y A, x+ y F Οι τελεστές dilation και erosion απλά αντικαθιστούν κάθε τιµή του διακριτού σήµατος από τη µέγιστη ή την ελάχιστη αντίστοιχα, σε µια περιοχή που ορίζεται από το δοµικό στοιχείο Α. Ορίζονται επίσης οι τελεστές opening και closing του f από το Α αντίστοιχα, ως εξής: a ( f )( x) = δ ( ε ( f ))( x) A Εξίσωση 16 φ ( f )( x) = ε ( δ ( f ))( x) A A A A A Εξίσωση 17 Tα opening (γράφεται απλά opening και όχι ο τελεστής opening για ευκολία και συντοµία παρόµοια ισχύουν και για τους άλλους τρεις τελεστές που ορίστηκαν παραπάνω) και closing είναι προϊόντα των dilation και erosion προφανώς. Το opening είναι αυξάνον ( f g α ( f ) α ( g) ), µη επεκτατικό ( α ( f ) f ) και αυτοδύναµο A A ( a A ( a A ( f )) = a A ( f ) ). Παροµοίως και το closing, το οποίο όµως είναι επεκτατικό. Στην πράξη, το opening ελαττώνει τις κορυφές ενός σήµατος, το δε closing τις κοιλάδες του. A Σε αυτό το σηµείο κρίνεται απαραίτητο να παρατεθεί ο ορισµός των µορφολογικών adjunction πυραµίδων, οι οποίες ικανοποιούν τα ακόλουθα κριτήρια: V j =Fun(Z d, T), είναι ο χώρος των grey valued συναρτήσεων (συναρτήσεων που λαµβάνουν διακριτές τιµές), όπου το σύνολο των διακριτών τιµών Τ, είναι πλήρες πλέγµα. Οι τελεστές analysis και synthesis είναι ανεξάρτητοι του επιπέδου της πυραµίδας, δηλαδή: = ψ ψ j και ψ = ψ j. Το ζεύγος των τελεστών ( ψ ) ψ,, όπου: ψ : V0 V1 και ψ : V1 V0 συνιστούν ένα adjunction ανάµεσα στο χώρο V 0 και στο χώρο V 1. Αυτό σηµαίνει ότι ο τελεστής analysis είναι ένα erosion και ο τελεστής synthesis είναι ένα dilation. 57

58 Προκειµένου η adjunction πυραµίδα να ικανοποιεί τη συνθήκη πυραµίδας (βλ. Εξίσωση 9), πρέπει να υπάρχει a A τέτοιο, ώστε µετατοπίσεις του α κατά ζυγό αριθµό βηµάτων πάνω στο διακριτό ψηφιακό πλέγµα να µην περιέχονται στο δοµικό στοιχείο Α. Σηµειώνεται εδώ πως ο τελεστής προσέγγισης = ψ ψ ψ δηλαδή η εφαρµογή του τελεστή synthesis πάνω στον τελεστή analysis, είναι ένα opening και κατά συνέπεια είναι µη επεκτατικός. Σε αυτή την περίπτωση µπορoύν να οριστούν οι τελεστές γενικευµένης πρόσθεσης και αφαίρεσης, ως εξής: t +& s = t s, όπου το σύµβολο σηµαίνει µέγιστο. t, t > s t & s =, t = s, όπου είναι το ελάχιστο του συνόλου Τ Στη συνέχεια θεωρείται ότι το σύνολο Τ είναι το σύνολο των µη αρνητικών ακεραίων, κατά συνέπεια = 0. Κατά συνέπεια, τα σήµατα λεπτοµέρειας είναι µη αρνητικά, δηλαδή: d ( n) = f ( n) & ψ ( f 1)( n) = f ( n) & ψ ψ ( f )( n) 0 j j A j+ Σύµφωνα µε την προηγούµενη σχέση που ορίζει τη γενικευµένη αφαίρεση, το σήµα λεπτοµέρειας d j (n) ισούται µε f j (n), εκτός από τα σηµεία όπου f ( n) = ψ ψ ( f )( n). Κατά συνέπεια, τα σήµατα λεπτοµέρειας δεν είναι µικρά σε περιοχές όπου το δοµικό στοιχείο δεν ταιριάζει καλά στα δεδοµένα. Εφόσον ωστόσο το ενδιαφέρον εστιάζεται στο σήµα προσέγγισης και όχι στο σήµα λεπτοµέρειας αυτό δεν είναι πρόβληµα, απεναντίας είναι πλεονέκτηµα της µεθόδου. j j A A A A j j Adjunction πυραµίδα Στην πυραµίδα αυτή, που θεµελιώνεται θεωρητικά στο [6], οι τελεστές analysis και synthesis, έχουν ως εξής: Analysis: ψ ( f ) = DOWNSAMPLE( ε ( f )), όπου ε Α είναι ένα erosion µε δοµικό A A στοιχείο το Α και ο τελεστής DOWNSAMPLE κάνει υποδειγµατοληψία της εικόνας κατά 2 σε κάθε χωρική διάσταση και υλοποιήθηκε στα πλαίσια της διπλωµατικής εργασίας µε τη µέθοδο πλησιέστερου γείτονα. Εξίσωση 18 58

59 Synthesis: ψ ( f ) = δ ( UPSAMPLE( f )), όπου δ Α είναι ένα dilation µε δοµικό στοιχείο A A το Α και ο τελεστής UPSAMPLE κάνει επέκταση της εικόνας κατά 2 σε κάθε χωρική διάσταση και υλοποιήθηκε στα πλαίσια της διπλωµατικής εργασίας επίσης µε παρεµβολή πλησιέστερου γείτονα. Εξίσωση 19 Στις εικόνες που ακολουθούν παρουσιάζονται τα τέσσερα πρώτα επίπεδα της Adjunction πυραµίδας µε µορφή που εποπτικά παραπέµπει στην πυραµίδα. Επίσης παρουσιάζεται η αναδόµηση τεσσάρων επιπέδων µε τη βοήθεια του σχήµατος ανάλυσης σε πολλαπλές κλίµακες µε χρήση της Adjunction πυραµίδας. Εικόνα 3-8 Adjunction πυραµίδα, τα τέσσερα πρώτα επίπεδα 59

60 Level 0 - Original image Level 1 Level 2 Level 3 Εικόνα 3-9 Adjunction πυραµίδα, αναδόµηση τεσσάρων επιπέδων Sun-Maragos πυραµίδα Η πυραµίδα αυτή προτάθηκε στο [7] και οι τελεστές analysis και synthesis, έχουν ως εξής: Analysis: ψ ( f ) = DOWNSAMPLE( α ( f )), όπου α Α είναι ένα opening µε δοµικό A A στοιχείο το Α και ο τελεστής DOWNSAMPLE κάνει υποδειγµατοληψία της εικόνας κατά 2 σε κάθε χωρική διάσταση και υλοποιήθηκε στα πλαίσια της διπλωµατικής εργασίας µε παρεµβολή πλησιέστερου γείτονα. Εξίσωση 20 Synthesis: ψ ( f ) = δ ( UPSAMPLE( f )), όπως ακριβώς και στην περίπτωση της A A πυραµίδας adjunction. Εξίσωση 21 Στις εικόνες που ακολουθούν παρουσιάζονται τα τέσσερα πρώτα επίπεδα της Sun-Maragos πυραµίδας µε µορφή που εποπτικά παραπέµπει στην πυραµίδα. Επίσης παρουσιάζεται η αναδόµηση τεσσάρων επιπέδων µε τη βοήθεια του σχήµατος ανάλυσης σε πολλαπλές κλίµακες µε χρήση της Sun-Maragos πυραµίδας. 60

61 Εικόνα 3-10 Sun-Maragos πυραµίδα, τα τέσσερα πρώτα επίπεδα Level 0 - Original image Level 1 Level 2 Level 3 Εικόνα 3-11Sun-Maragos πυραµίδα, αναδόµηση τεσσάρων επιπέδων 61

62 3.6 Leveling πυραµίδα Εισαγωγή Η αναγκαιότητα της ανάλυσης σε πολλαπλές κλίµακες, που έχει τονιστεί στην εισαγωγική παράγραφο του κεφαλαίου, υπαγορεύεται και από το γεγονός ότι σε πολλές περιπτώσεις τα αντικείµενα του ενδιαφέροντος στα πλαίσια µιας ψηφιακής εικόνας εµπεριέχουν πληροφορία που δεν ανήκει αποκλειστικά σε µία και µόνο κλίµακα. Σε τέτοιες περιπτώσεις έχουν προταθεί στη βιβλιογραφία διάφορες τεχνικές ανάλυσης σε πολλαπλές κλίµακες, όπου παράγεται µια σειρά χονδροειδέστερων αναπαραστάσεων της αρχικής εικόνας, κάτι που συµβαίνει και µε όλα τα προηγούµενα σχήµατα πυραµιδικής ανάλυσης που παρουσιάστηκαν ήδη. Μία πλήρης αναπαράσταση σε πολλαπλές κλίµακες, µπορεί να θεωρηθεί επαρκώς ορισµένη όταν έχουν οριστεί οι µετασχηµατισµοί από µία λεπτοµερή κλίµακα σε µία αδρότερη κλίµακα. Ωστόσο προκειµένου να µειωθεί ο βαθµός ελευθερίας στην επιλογή των µετασχηµατισµών, µπορούν να οριστούν κάποιες προδιαγραφές για τους ίδιους τους µετασχηµατισµούς. Έτσι, επιθυµητό είναι αυτοί να έχουν τις εξής ιδιότητες: Ανεξαρτησία από τη µετατόπιση Ανεξαρτησία από την περιστροφή Ανεξαρτησία από την αλλαγή φωτεινότητας Θα µπορούσαν επίσης να τεθούν κάποιες προϋποθέσεις για το αποτέλεσµα των µετασχηµατισµών: Ο µετασχηµατισµός πρέπει να οδηγεί σε απλοποίηση της εικόνας. Κατά συνέπεια δε µπορεί να είναι αναστρέψιµος, οπότε καθώς ανεβαίνει η κλίµακα θα χάνεται πληροφορία. Μια συγκεκριµένη µορφή απλοποίησης µπορεί να εκφραστεί ως εξής: Σε κάθε αλλαγή κλίµακας η µέγιστη φωτεινότητα της αδρότερης κλίµακας είναι πάντα µικρότερη από τη µέγιστη φωτεινότητα στη λεπτοµερέστερη κλίµακα, η δε ελάχιστη πάντα µικρότερη. Οι αδρότερες κλίµακες οφείλουν την ύπαρξή τους στις λεπτοµερέστερες και παράγονται από αυτές. Ο µετασχηµατισµός δεν πρέπει να δηµιουργεί νέες δοµές σε αδρότερες κλίµακες, µε συνηθέστερη απαίτηση να µη δηµιουργεί νέα τοπικά ακρότατα. Οι διάφορες τεχνικές ανάλυσης σε πολλαπλές κλίµακες που έχουν ήδη εξεταστεί δεν ικανοποιούν απαραίτητα όλους αυτούς τους περιορισµούς. Για παράδειγµα, η προσέγγιση µε τη Gaussian πυραµίδα, οδηγεί σε ένα συνολικό θόλωµα της εικόνας, άρα και των περιοχών ιδιαίτερου 62

63 ενδιαφέροντος όπως οι ακµές. Επιπρόσθετα, οι χωρικές συντεταγµένες των δοµών που ενδιαφέρουν στην εικόνα γίνονται ιδιαίτερα ανακριβείς όσο ανεβαίνει η κλίµακα, ενώ σε υψηλές κλίµακες τα διάφορα αντικείµενα δεν είναι καν αναγνωρίσιµα όχι µόνο λόγω του θολώµατος αλλά και λόγω της εµφάνισης ψευδών ακρότατων και στις δύο χωρικές διαστάσεις. Στη βιβλιογραφία έχουν προταθεί διάφορες εναλλακτικές προσεγγίσεις (βλ. Εισαγωγή του [3]), όπως είναι και οι Adjunction πυραµίδες που µελετήθηκαν προηγούµενα. Μία πρόσφατη µεθοδολογία που επιλύει το πρόβληµα της ασύµµετρης αντιµετώπισης του προσκηνίου και του παρασκηνίου της εικόνας, είναι η ανάπτυξη µιας γενικής και δυνατής τάξης από µορφολογικά φίλτρα, που ονοµάζονται levelings και εισήχθησαν από τον Meyer [8] και µελετήθηκαν επίσης από τους Maragos [9] και Matheron [10]. Τα leveling είναι µετασχηµατισµοί Λ(f,g) που βασίζονται σε δύο σήµατα, το reference (αναφορά) f και το marker (σηµαδευτή) g, τα οποία παρουσιάζουν τις επιθυµητές προφανώς ιδιότητες να διατηρούν τα περιγράµµατα της εικόνας, να µην παράγουν ψευδή ακρότατα και να διατηρούν τις χωρικές συντεταγµένες των δοµών της εικόνας για όλες τις κλίµακες που αυτές είναι ακόµη ορατές Προαπαιτούµενα στα µαθηµατικά και ορισµοί Τα επόµενα αναπαράγονται από το [9] ώστε να καταστεί κατανοητή η έννοια του leveling στον αναγνώστη, ο οποίος θεωρείται πως είναι σχετικά εξοικειωµένος (όπως και στο σύνολο του κειµένου της διπλωµατικής εργασίας άλλωστε) µε πολύ βασικές έννοιες από σήµατα & συστήµατα, επεξεργασία εικόνας και µαθηµατική µορφολογία. Σύµφωνα λοιπόν µε το [9], δύο pixel x,y ανήκουν στην ίδια R-επίπεδη ζώνη µιας συνάρτησης f, αν και µόνο αν υπάρχει µια ν-ιάδα από pixel (p 1, p 2,,p n ) τέτοια ώστε p 1 =x και p n =y και για κάθε i τα (p i,p i+1 ) να είναι γειτονικά pixel που ικανοποιούν τη συµµετρική σχέση απλούστερη συµµετρική σχέση είναι η ισότητα, επίπεδες. f p = f i pi +1 f p Rf i p i+1. Η, οπότε οι R-επίπεδες ζώνες είναι Ορίζεται πως µια εικόνα g είναι ένα leveling της εικόνας f, αν για κάθε (p,q) γειτονικά pixel, ισχύει: f p g p g p > g q and. g q f q Εξίσωση 22 63

64 Από τον παραπάνω ορισµό προκύπτει µε απλή παρατήρηση πως αν µια συνάρτηση g είναι σταθερή (άρα δε µπορεί να βρεθεί ζεύγος γειτονικών pixel που να ικανοποιούν το πρώτο µέλος της συνεπαγωγής στην Εξίσωση 22), αποτελεί leveling κάθε άλλης συνάρτησης. Αν δύο συναρτήσεις g 1, g 2 είναι και οι δύο leveling της ίδιας συνάρτησης f, τότε g1 g 2 και g1 g 2 είναι επίσης leveling της f. Αυτή η ιδιότητα επιτρέπει το συσχετισµό νέων leveling µε µια οικογένεια από leveling. Σηµειώνεται εδώ πως τα leveling όπως ορίστηκαν παραπάνω προφανώς ικανοποιούν το πρώτο σετ των απαιτήσεων που διατυπώθηκαν στην παράγραφο Μπορεί επίσης να αποδειχθεί µε βάση τους ορισµούς πως τα leveling ικανοποιούν και τις υπόλοιπες προδιαγραφές της 3.6.1, ωστόσο κρίνεται περιττό να αναπαραχθούν οι αποδείξεις εφόσον κάθε ενδιαφερόµενος µπορεί να ανατρέξει στο [9] Σχηµατισµός των leveling Τα leveling µπορούν να διακριθούν σε δύο κατηγορίες, ως εξής: Κατώτερα leveling: Μια συνάρτηση g είναι ένα κατώτερο leveling της συνάρτησης f, αν και µόνο αν για κάθε ζεύγος γειτονικών pixel (p, q) ισχύει: g p > g g f. Ανώτερα leveling: Μια συνάρτηση g είναι ένα ανώτερο leveling της συνάρτησης f, αν και µόνο αν για κάθε ζεύγος γειτονικών pixel (p, q) ισχύει: g p q > g g f. q q p q p Προφανώς µια συνάρτηση g είναι leveling µιας συνάρτησης f, αν και µόνο αν είναι ταυτόχρονα ανώτερο και κατώτερο leveling της συνάρτησης f.. Τα pixel που ικανοποιούν τη συνθήκη του κατώτερου leveling είναι εκείνα για τα οποία ο τελεστής dilation αυξάνει την τιµή τους, δηλαδή g q < δ g, άρα µπορεί να διατυπωθεί πως µια συνάρτηση g q είναι ένα κατώτερο leveling της συνάρτησης f, αν και µόνο αν ισχύει: g q < δ g g f. q q q Επειδή το λογικό περιεχόµενο της σχέσης [ A B ] είναι [(not A) or B], µπορεί να µεταφραστεί η σχέση [ g q < δ q g g q f q ] ως [ g q δ q g or g q f q ] ή ισοδύναµα [ g q f q δ q g ]. Κατά συνέπεια, µπορεί να διατυπωθεί: 64

65 Μια συνάρτηση g είναι κατώτερο leveling της συνάρτησης f, αν και µόνο αν Μια συνάρτηση g είναι ανώτερο leveling της συνάρτησης f, αν και µόνο αν g f δg. g f εg. Μια συνάρτηση g είναι leveling της συνάρτησης f, αν και µόνο αν Αξίζει εδώ να σηµειωθεί πως: f δg g f εg. Μια συνάρτηση g είναι ένα opening µέσω ανακατασκευής µιας συνάρτησης f, αν και µόνο αν g f και για κάθε ζεύγος γειτονικών pixel (p, q): g p >g q g q =f q. Μια συνάρτηση g είναι ένα closing µέσω ανακατασκευής µιας συνάρτησης f, αν και µόνο αν g f και για κάθε ζεύγος γειτονικών pixel (p, q): g p >g q g p =f p. Ο γενικευµένος ορισµός του leveling, έχει ως εξής: Μια συνάρτηση g είναι leveling της συνάρτησης f, αν και µόνο αν f αg g τελεστής α είναι επεκτατικός (αg g) και ο τελεστής β είναι µη επεκτατικός (βg g). Εξίσωση 23 f βg, όπου ο Με τη βοήθεια της παραπάνω εξίσωσης µπορεί κάθε συνάρτηση g να µετατραπεί στο leveling της συνάρτησης f. Η συνάρτηση f είναι η συνάρτηση reference και η συνάρτηση g είναι η συνάρτηση marker. οθέντων των δύο συναρτήσεων f, g το ζητούµενο είναι να µετατραπεί η g σε leveling της f. Αν η g δεν είναι ήδη leveling της f, τότε η εξίσωση 21 δεν ικανοποιείται για ένα τουλάχιστον pixel p. Η εξίσωση 23 δεν ικανοποιείται στις εξής δύο περιπτώσεις: g < f a g. Κατά συνέπεια, η µικρότερη δυνατή αλλαγή της g p ώστε να ικανοποιείται p p p η εξίσωση είναι: g p = f p a p g. Σηµειώνεται εδώ πως g p g p f p. g > f a g. Κατά συνέπεια, η µικρότερη δυνατή αλλαγή της g p ώστε να ικανοποιείται p p p η εξίσωση είναι: g p = f p β p g. Σηµειώνεται εδώ πως g p g p f p. Προφανώς για {g p =f p } η εξίσωση 23 ικανοποιείται πάντα. Θα µπορούσε πλέον ο αλγόριθµος σχηµατισµού των leveling να γραφεί ως εξής: lev - : Για {g<f} να γίνει g = f αg. Lev + : Για {g>f} να γίνει g = f βg. 65

66 Εύκολα προκύπτει πως ο αλγόριθµος αυτός µπορεί να αντικατασταθεί από αντικατάσταση της g από τη νέα τιµή: g = ( f αg) βg = ( f βg) αg οπουδήποτε. Εξίσωση 24 Ο αλγόριθµος επαναλαµβάνεται έως ότου η εξίσωση 23 να ικανοποιείται οπουδήποτε. Είναι δε σίγουρο πως ο αλγόριθµος θα συγκλίνει, καθώς οι αλλαγές στην τιµή της g είναι µονότονες: Οι διαδοχικές τιµές της g πλησιάζουν όλο και περισσότερο την f µέχρι τη σύγκλιση Leveling πολλαπλής κλίµακας Τα leveling επιτρέπουν τη δηµιουργία διαφόρων οικογενειών πολλαπλής κλίµακας, όπως οι εξής: Leveling συσχετιζόµενα µε µονότονες οικογένειες από erosion και dilation Leveling συσχετιζόµενα µε µία αυθαίρετη οικογένεια από marker συναρτήσεις Leveling συσχετιζόµενα µε µία εναλλασσόµενη οικογένεια από marker συναρτήσεις Στα πλαίσια της διπλωµατικής εργασίας, ακολουθήθηκε η δεύτερη µέθοδος, αυτή µε την αυθαίρετη οικογένεια των marker συναρτήσεων. Περισσότερα για τις άλλες δύο µεθόδους µπορεί να βρει ο αναγνώστης στο [9]. Ας θεωρηθεί λοιπόν µια αρχική εικόνα αναφοράς r(x, y) και ένα leveling Λ. Αν µπορούν να βρεθούν διάφοροι markers f i (x, y), i=1, 2, 3,, οι οποίοι σχετίζονται µε κάποια αυξανόµενη παράµετρο κλίµακας i και να υπολογιστούν τα leveling Λ(f i r) της εικόνας r µε βάση τους marker αυτούς, τότε παράγεται µια leveling αναπαράσταση πολλαπλής κλίµακας: Εξίσωση 25 h = Λ( f1 r), h2 = Λ( f 2 h1 ), h3 = Λ( f3 2 ),... 1 h Η παραπάνω ακολουθία ορισµού των leveling πολλαπλής κλίµακας διασφαλίζει το γεγονός ότι: h j είναι leveling του h i, για j>i. Η ακολουθία των marker συναρτήσεων f i,µπορεί να προκύψει από την αρχική εικόνα r µε οποιοδήποτε αυθαίρετο τρόπο. Ιδιαίτερο ενδιαφέρον ωστόσο παρουσιάζει η περίπτωση όπου οι marker συναρτήσεις f i είναι συνελίξεις πολλαπλής κλίµακας της r µε Gaussian συναρτήσεις µε αυξανόµενη τυπική απόκλιση σ. Αυτή είναι και η επιλογή που έγινε στα πλαίσια της διπλωµατικής εργασίας και από τα σχετικά πειράµατα που έγιναν, προκύπτει πως οι ακµές και τα σύνορα της εικόνας r που είχαν θολώσει και µετακινηθεί κατά τη δηµιουργία της Gaussian πυραµίδας διατηρούνται πολύ καλύτερα σε όλες τις κλίµακες µε τη βοήθεια της leveling πυραµίδας που χρησιµοποιεί ως marker συναρτήσεις τις Gaussian συνελίξεις. Με βάση τα προηγούµενα, 66

67 προκύπτει πως διάφορες εφαρµογές της CV που χρησιµοποιούν ανάλυση σε πολλαπλές κλίµακες µε χρήση Gaussian πυραµίδας µπορούν να ωφεληθούν αν χρησιµοποιήσουν την πυραµίδα αυτή ως πρώτο στάδιο και τη leveling αναπαράσταση σε πολλαπλές κλίµακες ως δεύτερο,το οποίο οξύνει τα Gaussian επίπεδα προς την αρχική εικόνα. Ολοκληρώνοντας το απαραίτητο θεωρητικό υπόβαθρο για τη δηµιουργία της πυραµίδας των leveling, αξίζει να σηµειωθεί πως εναλλακτικά µπορούν να σχηµατιστούν leveling µε τη βοήθεια διακριτών ψηφιακών προσεγγίσεων µιας PDE, µέθοδος η οποία είναι αποτελεσµατικότερη από τη διακριτή µορφολογική προσέγγιση που υλοποιήθηκε στα πλαίσια της εργασίας όσον αφορά την ισοτροπικότητα και την υπό-pixel ακρίβεια. Περισσότερα πάνω σε PDE που δηµιουργούν levelings µπορούν να βρεθούν στο [9], ενώ στο [11] ο Maragos παρέχει το θεωρητικό υπόβαθρο που εξασφαλίζει την υπό προϋποθέσεις σύγκλιση της µεθόδου και τη µαθηµατική ευστάθειά της Υλοποίηση της leveling πυραµίδας στα πλαίσια της διπλωµατικής εργασίας Στην πυραµίδα αυτή, οι τελεστές analysis και synthesis, έχουν ως εξής: Analysis: o ψ f ) = h = Λ( f ), όπου f 1 είναι το πρώτο επίπεδο της Gaussian πυραµίδας 1 ( 1 1 r που αναλύθηκε στην παράγραφο 3.4 και r η αρχική εικόνα. o ψ f ) = h = Λ( f ), όπου f 2 είναι το δεύτερο επίπεδο της Gaussian 2 ( 2 2 h1 πυραµίδας που αναλύθηκε στην παράγραφο 3.4 και h 1 το πρώτο επίπεδο της leveling πυραµίδας. o ψ f ) h = Λ( f h ), όπου f n είναι το n-οστό επίπεδο της Gaussian n ( = n n n 1 πυραµίδας που αναλύθηκε στην παράγραφο 3.4 και h n-1 το (n-1)-οστό επίπεδο της leveling πυραµίδας. Synthesis: ψ f ) Λ( f g ), όπου f n-1 είναι το (n-1)-οστό επίπεδο της Gaussian n ( = n 1 n 1 πυραµίδας που αναλύθηκε στην παράγραφο 3.4 και g n-1 το (n-1)-οστό επίπεδο της απλής πυραµίδας υποδειγµατοληψίας που αναλύθηκε στην παράγραφο 3.3. Στις εικόνες που ακολουθούν παρουσιάζονται τα τέσσερα πρώτα επίπεδα της Leveling πυραµίδας µε µορφή που εποπτικά παραπέµπει στην πυραµίδα. Επίσης παρουσιάζεται η αναδόµηση τεσσάρων επιπέδων µε τη βοήθεια του σχήµατος ανάλυσης σε πολλαπλές κλίµακες µε χρήση της Leveling πυραµίδας. 67

68 Εικόνα 3-12 Leveling πυραµίδα, τα τέσσερα πρώτα επίπεδα Level 0 - Original image Level 1 Level 2 Level 3 Εικόνα 3-13 Leveling πυραµίδα, αναδόµηση τεσσάρων επιπέδων 68

69 3.7 Μορφολογικές Wavelet πυραµίδες Εισαγωγή Η αποδόµηση σηµάτων µέσω wavelet (κυµατιδίων) είναι ένα νέο σχετικά εργαλείο που αναπτύχθηκε τα τελευταία δέκα µε δεκαπέντε χρόνια. Στην αρχική του µορφή ο µετασχηµατισµός wavelet είναι ένα γραµµικό εργαλείο. Ωστόσο έχει σταδιακά αναγνωριστεί πως µη γραµµικές επεκτάσεις του είναι δυνατές. Η βιβλιογραφία πάνω στα µη γραµµικά σχήµατα wavelet αποδόµησης δεν είναι εκτενής, ενώ έχουν αναπτυχθεί διαφορετικές προσεγγίσεις, όπως µπορεί ο ενδιαφερόµενος αναγνώστης να δει στην εισαγωγή του [12]. Όπως και στην περίπτωση των γραµµικών και µη γραµµικών πυραµίδων ωστόσο, έχει προταθεί στη βιβλιογραφία (βλ. [12]) ένα αξιωµατικό πλαίσιο για την ανάλυση σηµάτων σε πολλαπλές κλίµακες µε χρήση wavelet µετασχηµατισµών, το οποίο συµπεριλαµβάνει ως υποπεριπτώσεις όλες τα γνωστά γραµµικά και µη σχήµατα wavelet αποδόµησης. Αυτό το πλαίσιο θα παρουσιαστεί συνοπτικά στην επόµενη παράγραφο, προκειµένου να εισαγάγει τον αναγνώστη στη φιλοσοφία των wavelet µετασχηµατισµών Γενικά σχήµατα wavelet αποδόµησης Coupled σχήµατα wavelet αποδόµησης Το coupled σχήµα wavelet αποδόµησης επεκτείνει την έννοια της πυραµίδας, όπως αυτή διατυπώνεται στο [3]. Έστω τα σύνολα V j και W j, που ονοµάζονται χώρος σήµατος και χώρος λεπτοµέρειας αντίστοιχα, στο επίπεδο j. Η ανάλυση του σήµατος εστιάζεται στην αποδόµηση του προς την κατεύθυνση που αυξάνει το j µε τη βοήθεια τελεστών analysis σήµατος ψ V V 1 j : j j + και τελεστών analysis λεπτοµέρειας ω V W 1. Από την άλλη πλευρά η σύνθεση του j : j j + σήµατος ακολουθεί την κατεύθυνση όπου µειώνεται το j και υλοποιείται µε τη βοήθεια του τελεστή synthesis : V. Ψ j V j+ 1 W j+ 1 j Το προηγούµενο σχήµα αποδόµησης είναι απαραίτητο να οδηγεί σε πλήρη ανακατασκευή του ψ j, ω j : V j V j+ W j+ και σήµατος, µε την έννοια ότι οι απεικονίσεις ( ) 1 1 : V είναι αντίστροφες η µία της άλλης. Αυτό οδηγεί στις επόµενες συνθήκες: Ψ j V j+ 1 W j+ 1 j 69

70 Ψ j ( ψ ( x), ω ( x)) = x, x V j j j Εξίσωση 26 ψ j ( Ψ ω j ( Ψ j j ( x, y)) = x, x V ( x, y)) = y, x V j+ 1 j+ 1, y W, y W j+ 1 j+ 1 Εξίσωση 27 Η εξίσωση 26 ονοµάζεται και «συνθήκη τέλειας ανακατασκευής», ενώ οι δύο συνθήκες στην εξίσωση 27 εγγυώνται πως η αποδόµηση δεν είναι πλεονάζουσα. οθέντος λοιπόν ενός σήµατος εισόδου x0 V0, µπορεί να θεωρηθεί το ακόλουθο σχήµα αναδροµικής ανάλυσης: x x, y } { x, y, y }... { x, y, y,..., y }..., όπου j+ 1 = j ( x j ) V j+ 1 0 { k k k 1 1 j+ 1 = j ( j ) j+ x ψ και y ω x W 1, j 0. Εξίσωση 28 Το αρχικό σήµα x 0 µπορεί να ανακατασκευαστεί ακριβώς από τα σήµατα x k και y 1, y 2,, y k, µε χρήση του ακόλουθου σχήµατος αναδροµικής σύνθεσης: Εξίσωση 29 x Ψ x, y ), j=k-1, k-2,, 0. j = j ( j+1 j+ 1 Η εξίσωση 27 αποδεικνύει ότι η αποδόµηση που περιγράφει η εξίσωση 29 είναι αναστρέψιµη. Ολοκληρώνοντας, αξίζει να σηµειωθεί πως µε τις εξισώσεις 26 ως και 29 ορίζεται το coupled σχήµα wavelet αποδόµησης Uncoupled σχήµατα wavelet αποδόµησης Ιδιαίτερης σηµασίας για τη wavelet αποδόµηση είναι η περίπτωση όπου υπάρχει ένας δυαδικός τελεστής + ) στο V j, ο οποίος ονοµάζεται πρόσθεση (σηµειώνεται πως ο + ) µπορεί να εξαρτάται από το j) και τελεστές ψ j : V j + 1 V j και ω j : V j + 1 W j, τέτοιοι ώστε: Εξίσωση 30 Πλέον τα ψ, j ω j Ψ ) ω j ( x, y) = j ( x) + j ( y), x V j+ y W j+ 1 εξισώσεις 26 και 27 της προηγούµενης παραγράφου, γράφονται ως εξής: 70 ψ ονοµάζονται τελεστής synthesis σήµατος και λεπτοµέρειας αντίστοιχα, ενώ οι 1,

71 ) ψ ψ ( x) + ω ω ( x) = x, x V j j j j j Εξίσωση 31 Εξίσωση 32 ψ ω ψ ) ω j ( j ( x) + j ( y)) = x, x V j+ y W j+ 1 ψ ) ω j ( j ( x) + j ( y)) = y, x V j+ y W j+ 1 1, 1, Εξίσωση 33 Οι εξισώσεις 31 ως και 33 ορίζουν το uncoupled σχήµα wavelet αποδόµησης. οθέντος λοιπόν ενός σήµατος εισόδου x0 V0, µπορεί να θεωρηθεί το ακόλουθο σχήµα αναδροµικής ανάλυσης: x x, y } { x, y, y }... { x, y, y,..., y }..., όπου j+ 1 = j ( x j ) V j+ 1 0 { k k k 1 1 j+ 1 = j ( j ) j+ x ψ και y ω x W 1, j 0. Εξίσωση 34 Το αρχικό σήµα x 0 µπορεί να ανακατασκευαστεί ακριβώς από τα σήµατα x k και y 1, y 2,, y k, µε χρήση του ακόλουθου σχήµατος αναδροµικής σύνθεσης: ) x ψ x ) + ψ ( y ), j=k-1, k-2,, 0. Εξίσωση 35 j = j ( j+ 1 j j+ 1 Κατά συνέπεια, το σήµα x j στο επίπεδο j, ανακατασκευάζεται µε πληροφορία διαθέσιµη από το επίπεδο j+1 και µόνο. Πρώτα, το σήµα x j+1 απεικονίζεται στο επίπεδο j µε τη βοήθεια του τελεστή ) synthesis σήµατος ψ ώστε να προκύψει µια προσέγγιση x ψ x ) του x j. Στη συνέχεια, το j j = j ( j+ 1 σήµα λεπτοµέρειας y j+1 1 απεικονίζεται στο επίπεδο j µε τη βοήθεια του τελεστή analysis σήµατος ω, ώστε να προκύψει το σήµα λεπτοµέρειας c ω y ) στο επίπεδο j. Τελικά, τα µερικά j j = j ( j+ 1 αυτά αποτελέσµατα συνδυάζονται µέσω του τελεστή πρόσθεσης + ) D µορφολογικό Haar wavelet Η µορφολογική εκδοχή του Haar wavelet διαφέρει από την κλασική γραµµική στο γεγονός ότι το γραµµικό φίλτρο για την ανάλυση του σήµατος στο δεύτερο αντικαθίσταται από ένα µορφολογικό τελεστή (π.χ. ένα dilation ή ένα erosion), δηλαδή από την επιλογή του µεγίστου ή του ελαχίστου από δύο δείγµατα. 71

72 Τόσο το 1D όσο και το 2D µορφολογικά Haar wavelet ανήκουν στην ευρύτερη οικογένεια των uncoupled σχηµάτων wavelet αποδόµησης. Το 2D µορφολογικό Haar wavelet µπορεί να προκύψει από το αντίστοιχο 1D µε τη χρησιµοποίηση ενός διαχωρίσιµου πυρήνα (π.χ. εφαρµόζοντας διαδοχικά την 1D αποδόµηση πρώτα στις στήλες και µετά στις γραµµές µιας 2D εικόνας). Μολαταύτα, µπορεί να οριστεί και µία µη διαχωρίσιµη εκδοχή του µορφολογικού Haar wavelet. Πράγµατι, έστω V 0 και V 1 να αποτελούνται από όλες τις συναρτήσεις µε πεδίο ορισµού το Z 2 και πεδίο τιµών το R και W 1 να αποτελείται από όλες τις συναρτήσεις µε πεδίο ορισµού το Z 2 και πεδίο τιµών το R 3. Σε αυτό το σηµείο, κρίνεται απαραίτητο να εξηγηθεί η σηµειολογία που θα ακολουθηθεί στο υπόλοιπο της παραγράφου: Με n, 2n εννοούνται τα σηµεία (m, n), (2m, 2n) µε 2 n +, + 2 n, + 2 n + τα σηµεία (2m+1, 2n), (2m, 2n+1), (2m+1, 2n+1) αντίστοιχα. 2 Z αντίστοιχα και Οι τελεστές analysis σήµατος και λεπτοµέρειας, έχουν ως εξής: Εξίσωση 36 + ψ ( x)( n) = x(2n) x(2n ) x(2n ) x(2n ω ( x)( n) = ( ω ( x)( n), ω ( x)( n), ω ( x)( n)), όπου τα ω v, ω h, ω d αναπαριστούν τα κάθετα, v h d οριζόντια, διαγώνια σήµατα λεπτοµέρειας, που παρέχονται από τις ακόλουθες σχέσεις: Εξίσωση 37 Εξίσωση 38 Εξίσωση 39 Εξίσωση ω v ( x)( n) = ( x(2n) x(2n ) + x(2n + ) x(2n ω h ( x)( n) = ( x(2n) x(2n + ) + x(2n ) x(2n ω d ( x)( n) = ( x(2n) x(2n + ) x(2n ) + x(2n ) )) )) )) Οι τελεστές synthesis σήµατος και λεπτοµέρειας, έχουν ως εξής: 72

73 + + ψ ( x )(2n) = ψ ( x)(2n ) = ψ ( x)(2n ) = ψ ( x)(2n ) = x( n) + + Εξίσωση 41 Εξίσωση 42 ω ( y)(2n) = ( y ( n) + y ( n)) ( y ( n) + y ( n)) ( y ( n) + y ( n)) 0 v h v ω ( y)(2n ) = ( y ( n) y ( n)) ( y ( n) y ( n)) ( y ( n) y ( n)) 0 + v h v + ω ( y)(2n ) = ( y ( n) y ( n)) ( y ( n) y ( n)) ( y ( n) y ( n)) 0 h v + ω ( y)(2n ) = ( y ( n) y ( n)) ( y ( n) y ( n)) ( y ( n) y ( n)) 0, + v h όπου y W1 και y = y, y, y ) v d d d d v ( v h d Εύκολα αποδεικνύεται πως οι εξισώσεις 31 ως και 33 ικανοποιούνται µε την προϋπόθεση ότι η πράξη + ) είναι η στάνταρ πρόσθεση στο R, πράγµα που επαληθεύει τον ισχυρισµό ότι το Haar wavelet είναι παράδειγµα uncoupled σχήµατος wavelet αποδόµηση. h h h d d d d h Οι τελεστές analysis ψ και ω των εξισώσεων 36 και 37 απεικονίζουν µια τετράδα δειγµάτων του σήµατος όπως αυτή στο αριστερό τµήµα του πίνακα που ακολουθεί σε µία άλλη, όπως αυτή που φαίνεται στο δεξιό τµήµα. Πίνακας 3-1 2D Haar wavelet µετασχηµατισµός *** x 1 ( x) =ψ, y i = ω (x) ***, i=v, h, d + x ( 2n) x(2n ) + x 2n ) x(2 ) ( + n + Wavelet Transform Scaled x 1 (n) Signal Horizontal y h (n) Detail Vertical y v (n) Detail Diagonal y d (n) Detail Υλοποίηση της 2D µορφολογικής Haar wavelet πυραµίδας στα πλαίσια της διπλωµατικής εργασίας Στην πυραµίδα αυτή, οι τελεστές analysis και synthesis, έχουν ως εξής: Analysis: Οµαδοποιώντας τα pixel της εικόνας σε block των 2 2, διατηρείται µόνο το ένα από αυτά και συγκεκριµένα αυτό µε την ελάχιστη τιµή. Σε µαθηµατική σηµειολογία: ψ ( f ) = blkproc( f, [2 2], minimum ), που σηµαίνει ακριβώς αυτό που περιγράφεται λεκτικά παραπάνω. Synthesis: Για κάθε pixel της εικόνας δηµιουργούνται άλλα τρία µε ίδιες τιµές φωτεινότητας και στα τρία χρωµατικά κανάλια, ώστε και τα τέσσερα µαζί να αποτελέσουν ένα block από 73

74 pixel µε την ίδια τιµή. Σε µαθηµατική σηµειολογία: ψ ( f ) = UPSAMPLE( f ), όπου ο τελεστής UPSAMPLE κάνει επέκταση της εικόνας κατά 2 σε κάθε χωρική διάσταση και υλοποιήθηκε στα πλαίσια της διπλωµατικής εργασίας επίσης µε παρεµβολή πλησιέστερου γείτονα. Σε αυτό το σηµείο πρέπει να τονιστεί πως στα πλαίσια της υλοποίησης της πυραµίδας που έγινε για τη διπλωµατική εργασία και εφόσον το ζητούµενο είναι η συµπίεση της πληροφορίας, πως η διαδικασία analysis δεν παρέχει το σήµα λεπτοµέρειας το οποίο και δεν χρησιµοποιείται από τη διαδικασία synthesis. Στις εικόνες που ακολουθούν παρουσιάζονται τα τέσσερα πρώτα επίπεδα της Leveling πυραµίδας µε µορφή που εποπτικά παραπέµπει στην πυραµίδα. Επίσης παρουσιάζεται η αναδόµηση τεσσάρων επιπέδων µε τη βοήθεια του σχήµατος ανάλυσης σε πολλαπλές κλίµακες µε χρήση της µορφολογικής Haar wavelet πυραµίδας. Εικόνα 3-14 Μορφολογική Haar wavelet πυραµίδα, τα τέσσερα πρώτα επίπεδα 74

75 Level 0 - Original image Level 1 Level 2 Level 3 Εικόνα 3-15 Μορφολογική Haar wavelet πυραµίδα, αναδόµηση τεσσάρων επιπέδων Επεκτάσεις της θεωρίας των µορφολογικών wavelet σχηµάτων αποδόµησης Μία χρήσιµη και πολύ γενική τεχνική για την κατασκευή νέων σχηµάτων wavelet αποδόµησης από ήδη υπάρχοντα, προτάθηκε πρόσφατα στη βιβλιογραφία και είναι γνωστή ως το σχήµα lifting (εξυψώσεως). Το lifting σηµαίνει µεταβολή των τελεστών analysis και synthesis µε τέτοιο τρόπο ώστε οι ιδιότητες του διαφοροποιηµένου σήµατος να είναι καλύτερες από αυτές του αρχικού. Η βελτίωση σε σχέση µε το αρχικό µπορεί να σηµαίνει διαφορετικά πράγµατα, έτσι στα γραµµικά wavelet µπορεί να σηµαίνει ότι µεγαλώνει ο αριθµός των vanishing moments (στιγµών εξαφάνισης) ή γενικότερα σε εφαρµογές συµπίεσης όπως αυτή που µελετάται από την εργασία να σηµαίνει ότι το σήµα λεπτοµέρειας είναι µικρότερο. ύο είδη σχηµάτων lifting wavelet αποδόµησης µπορούν να διακριθούν: Lifting πρόβλεψης, οπότε µεταβάλλεται ο τελεστής analysis λεπτοµέρειας ω και ο τελεστής synthesis σήµατος Ψ στο coupled σχήµα wavelet αποδόµησης ή ο τελεστής synthesis σήµατος ψ στο uncoupled σχήµα wavelet αποδόµησης. Lifting αναπροσαρµογής, οπότε µεταβάλλεται ο τελεστής analysis σήµατος ψ και ο τελεστής synthesis σήµατος Ψ στο coupled σχήµα wavelet αποδόµησης ή ο τελεστής synthesis σήµατος λεπτοµέρειας ω στο uncoupled σχήµα wavelet αποδόµησης. 75

76 Περισσότερα για τα lifting σχήµατα wavelet αποδόµησης µπορούν να αναζητηθούν στο [12], όπου και παρουσιάζεται µία lifted (εξυψωµένη) εκδοχή του µορφολογικού Haar wavelet, η οποία ωστόσο δεν υλοποιήθηκε στα πλαίσια της εργασίας γιατί παραβαίνει τους κανόνες που ετέθησαν για τα σχήµατα που θα εξεταστούν και θα συγκριθούν όσον αφορά την απόδοσή τους στη συµπίεση. Οι κανόνες αυτοί και µια γενικότερη περιγραφή της φιλοσοφίας που ακολουθήθηκε κατά την εκπόνηση της διπλωµατικής εργασίας ακολουθούν στο επόµενο κεφάλαιο. 76

77 Κεφ. 4 Φιλοσοφία και τεχνικές λεπτοµέρειες της διπλωµατικής εργασίας 4.1 Γενικά Η διπλωµατική εργασία περιλαµβάνει ένα µαθηµατικό και ένα προγραµµατιστικό τµήµα. Το µαθηµατικό µέρος αναλύθηκε στα προηγούµενα κεφάλαια του κειµένου, ενώ το προγραµµατιστικό επισυνάπτεται στο τέλος της αναφοράς σε µορφή παραρτήµατος. Ο κώδικας που αναπτύχθηκε στα πλαίσια της εργασίας γράφτηκε όπως έχει αναφερθεί και προηγούµενα στο προγραµµατιστικό πακέτο Matlab Version a Release 13, το οποίο αποτελεί την πλέον δόκιµη επιλογή για µια υλοποίηση αυτού του είδους. Πιο συγκεκριµένα, το ζητούµενο στην εργασία δεν είναι σε καµία περίπτωση η παραγωγή ενός εµπορικά εκµεταλλεύσιµου προϊόντος, παρά η καθαρά διερευνητική προσέγγιση της συµπίεσης ψηφιακών εικόνων µε χρήση καθιερωµένων µεθόδων, εµπλουτισµένων όµως και µε κάποια στοιχεία καινοτοµίας που αποσκοπούν τελικά στη βελτίωση της απόδοσης της συµπίεσης. Για αυτό το λόγο ο χειρισµός του προγράµµατος που υλοποιήθηκε είναι από τη γραµµή εντολών και δε χρησιµοποιείται κάποιο GUI (Graphical User Interface Γραφική ιαπροσωπία Χρήστη). Κατά συνέπεια υλοποιήσεις σε προγραµµατιστικά περιβάλλοντα τύπου C++ που θα µπορούσαν πρακτικά να παρέχουν κοµψότερους και σαφέστατα ταχύτερους αλγόριθµους δεν προτιµήθηκαν, εφόσον κάτι τέτοιο θα απέβαινε εις βάρος της όποιας γόνιµης έρευνας επιτελείται. Γι αυτό και επιλέχθηκε το προγραµµατιστικό πακέτο Matlab το οποίο παρέχει αυξηµένη ευκολία υλοποίησης µε τη βοήθεια του Image Processing Toolbox που εµπεριέχει. Έτσι διαδικασίες όπως οι erosion και dilation (3.5.1), 2D συνελίξεις (3.4), εργαλεία ανάλυσης DCT (2.1.3), αλλά και γενικότερα ο εξελιγµένος και αυτοµατοποιηµένος σε µεγάλο βαθµό χειρισµός των εργαλείων που παρέχονται, καθιστούν το Matlab αναντικατάστατο για τέτοιου είδους προσεγγίσεις. Πρέπει πάντως εδώ να επισηµανθεί πως έχει καταβληθεί προσπάθεια για βελτιστοποίηση του κώδικα που αναπτύχθηκε στα πλαίσια πάντα µιας διερευνητικής και όχι εµπορικής απόπειρας. Ο κώδικας συνοδεύεται από τα απαραίτητα για την κατανόησή του σχόλια, διατηρείται σε µικρό µέγεθος και είναι κατασκευασµένος µε τρόπο τέτοιο ώστε εύκολα να µπουν να γίνουν αλλαγές και 77

78 προσθαφαιρέσεις χρησιµοποιώντας πληθώρα µικρών σε µέγεθος συναρτήσεων που καλούνται από άλλες προς επίτευξη του τελικού στόχου, ώστε να µην αποθαρρύνεται ο αναγνώστης από τη µελέτη του. Όσον αφορά το µέρος του κώδικα που αφορά την πειραµατική υλοποίηση του προτύπου JPEG, ο απαραίτητος σχολιασµός έχει γίνει στην παράγραφο 2.2 και κρίνεται περιττό να αναπαραχθεί εδώ. Αξίζει όµως να διατυπωθούν µερικές σκέψεις και κρίσεις πάνω στο µέρος της εργασίας που αφορά την ανάλυση σε πολλαπλές κλίµακες και στα τελικά προγράµµατα που παρέχουν και τα αποτελέσµατα της διπλωµατικής εργασίας. 4.2 Στόχος και γενικότερο πλαίσιο της διπλωµατικής εργασίας Ο στόχος της εργασίας είναι η αξιολόγηση και σύγκριση έξι διαφορετικών µεθόδων ανάλυσης σε πολλαπλές κλίµακες, οι οποίες συνδυαζόµενες µε την απλή JPEG συµπίεση επιδιώκεται να παρέχουν αποδοτικότερη συµπίεση από αυτή του προτύπου JPEG αυτού καθαυτού. Τονίζεται εδώ, όχι για πρώτη φορά, πως εξαρχής το όποιο πλεονέκτηµα των µεθόδων αυτών εστιάζεται σε περιπτώσεις συµπίεσης ψηφιακών εικόνων µε VLBR (Very Low Bit Rate Πολύ Χαµηλό Ρυθµό εδοµένων) ή και XLBR (extremely Low Bit Rate Εξαιρετικά Χαµηλό Ρυθµό εδοµένων), κάτι που σηµαίνει απλά πως ενδιαφέρουν µόνο περιπτώσεις υψηλού βαθµού συµπίεσης ως προς την αρχική εικόνα. Οι εικόνες που αποτελούν είσοδο και έξοδο του προγράµµατος, είναι εικόνες τύπου true color (αληθινού χρώµατος) και υπάγονται στο χρωµατικό χώρο RGB (Red Green Blue Κόκκινο Πράσινο Μπλε), µε ακρίβεια στην αναπαράσταση κάθε χρώµατος 8 bpp όπως προβλέπεται για την είσοδο του απλού JPEG κωδικοποιητή. Η σχετικότητα της έννοιας «υψηλός βαθµός συµπίεσης» αίρεται µερικώς από τα πειράµατα που διεξήχθησαν και όπου για ένα προκαθορισµένο σετ εικόνων ελέγχου προσδιορίζεται επακριβώς ο βαθµός συµπίεσης εκείνος που καθιστά ασύµφορη ή µη την εφαρµογή οποιασδήποτε από τις έξι µεθόδους σε σχέση µε την απλή JPEG συµπίεση. Στην πράξη, η διαδικασία που ακολουθείται εστιάζεται στη δηµιουργία γραµµικών και µη πυραµίδων, κατώτερα επίπεδα των οποίων (ειδικότερα τα επίπεδα 1 και 2, θεωρώντας ως µηδενικό επίπεδο την αρχική προς συµπίεση εικόνα) αφού υποβληθούν σε JPEG συµπίεση αποτελούν και το αποτέλεσµα της κωδικοποίησης που επιτελείται. Στη συνέχεια τα κωδικοποιηµένα αυτά δεδοµένα αποτελούν είσοδο του αποκωδικοποιητή ο οποίος τα επαναφέρει στο αρχικό (µιλώντας χωρικά) 78

79 µέγεθος µε τη βοήθεια των τελεστών synthesis των πυραµίδων που υλοποιήθηκαν, οι οποίες αναφέρονται και πάλι εδώ για λόγους ευκολίας: Απλή πυραµίδα υποδειγµατοληψίας Gaussian πυραµίδα Adjunction πυραµίδα Sun-Maragos πυραµίδα Leveling πυραµίδα Μορφολογική Haar wavelet πυραµίδα Σηµειώνεται σε αυτό το σηµείο πως προκειµένου να έχει νόηµα η αξιολόγηση και σύγκριση έξι διαφορετικών προσεγγίσεων (επτά, αν λάβει κάποιος υπόψη και την απλή κατά JPEG συµπίεση), χρειάζεται ένα σηµείο αναφοράς. Εξηγώντας περαιτέρω, η αποτελεσµατικότητα στη συµπίεση χαρακτηρίζεται από δύο βαθµούς ελευθερίας: Το µέγεθος σε bytes του αποτελέσµατος του κωδικοποιητή. Την ποιότητα της τελικής αποκωδικοποιηµένης εικόνας σε σχέση µε την αρχική ασυµπίεστη, όπως αυτή προκύπτει από κάποιο κριτήριο εκτίµησης του SNR. Στα πλαίσια της εργασίας επιλέχθηκε και κατέστη εφικτό προγραµµατιστικά να διατηρείται σταθερό(µε µία διακύµανση της τάξης του ±5% από το µέγεθος του συµπιεσµένου κατά το πρότυπο JPEG αρχείου) το µέγεθος του κωδικοποιηµένου αρχείου, του εκάστοτε κωδικοποιητή. Κατά συνέπεια, όσο υψηλότερο προκύπτει το SNR, τόσο πιο επιτυχηµένη είναι η συµπίεση. Η επιλογή να διατηρείται σταθερό το µέγεθος του κωδικοποιηµένου αρχείου και όχι η ποιότητα της συµπίεσης δικαιολογείται όχι µόνο γιατί είναι αποδοτικότερη από πλευράς ταχύτητας εκτελέσεως, αλλά και γιατί το µέγεθος του αρχείου είναι παράµετρος που µπορεί να προσδιοριστεί µε απόλυτο τρόπο. Κατά συνέπεια, θεωρήθηκε προτιµότερο να θεωρηθεί ως σηµείο αναφοράς αυτό, καθώς η µέθοδος εκτίµησης του SNR θα µπορούσε θεωρητικά να αντικατασταθεί από µία άλλη ή και από την εποπτική παρατήρηση. Περισσότερα πάνω στο θέµα της εκτίµησης της ποιότητας µιας εικόνας παρατίθενται στην επόµενη παράγραφο. Σε αυτό σηµείο κρίνεται απαραίτητο να εξηγηθεί στον αναγνώστη ο λόγος για τον οποίο γίνεται αποδόµηση και κατόπιν ανακατασκευή ενός ή δύο επιπέδων και όχι περισσότερων, ανεξαρτήτως του σχήµατος πυραµιδικής ανάλυσης που ακολουθείται ενώ η υλοποίηση της κάθε πυραµίδας επιτρέπει αποδόµηση και ανακατασκευή οσοδήποτε χαµηλού επιπέδου (συνήθως στη βιβλιογραφία 79

80 το µέγιστο επίπεδο µιας πυραµίδας θεωρείται πως δεν πρέπει να έχει διάσταση µικρότερη από 8 8 pixel). Έστω αρχική ασυµπίεστη (π.χ. τύπου.bmp) εικόνα µεγέθους Χ σε bytes. Τότε η απλή εφαρµογή του προτύπου JPEG µπορεί να δώσει αποτέλεσµα µεγέθους που ανήκει στο διάστηµα Α 1 =[Α 1 min, Α 1 max], όπου το Α 1 min αντιστοιχεί στη µέγιστη δυνατή συµπίεση (συντελεστής ποιότητας = 1) και το Α 1 max στην ελάχιστη δυνατή (συντελεστής ποιότητας = 100). Σε περίπτωση που εφαρµόζεται αποδόµηση ενός επιπέδου στην πυραµιδική µέθοδο που ακολουθείται, η εικόνα που συµπιέζεται κατά JPEG µε οποιαδήποτε από τις έξι διαφορετικές µεθόδους είναι υποδιπλάσια σε κάθε διάσταση από την αρχική. Κατά συνέπεια, η εφαρµογή του προτύπου JPEG σε αυτή την εικόνα µπορεί να δώσει αποτέλεσµα µεγέθους που ανήκει στο διάστηµα A 2 =[Α 2 min, Α 2 max], όπου το Α 2 min αντιστοιχεί στη µέγιστη δυνατή συµπίεση (συντελεστής ποιότητας = 1) και το Α 2 max στην ελάχιστη δυνατή (συντελεστής ποιότητας = 100). Παρόµοια, σε περίπτωση που εφαρµόζεται αποδόµηση n επιπέδων στην πυραµιδική µέθοδο που ακολουθείται, η εικόνα που συµπιέζεται κατά JPEG µε οποιαδήποτε από τις έξι διαφορετικές n µεθόδους είναι κατά 2 µικρότερη σε κάθε διάσταση από την αρχική. Κατά συνέπεια, η εφαρµογή του προτύπου JPEG σε αυτή την εικόνα µπορεί να δώσει αποτέλεσµα µεγέθους που ανήκει στο διάστηµα A n =[Α n min, Α n max], όπου το Α n min αντιστοιχεί στη µέγιστη δυνατή συµπίεση (συντελεστής ποιότητας = 1) και το Α n max στην ελάχιστη δυνατή (συντελεστής ποιότητας = 100). Προκειµένου να έχει νόηµα η σύγκριση κάθε µίας των έξι µεθόδων όχι µόνο µεταξύ τους αλλά και µε την περίπτωση της απλής εφαρµογής του προτύπου JPEG, πρέπει να υπάρχει σηµείο αναφοράς, το οποίο όπως έχει ήδη σηµειωθεί είναι το µέγεθος του κωδικοποιηµένου αρχείου. ηλαδή πρέπει τα διαστήµατα Α 1, A 2,..., A n να έχουν τοµή που δεν είναι το κενό σύνολο. Στατιστικά (µε βάση το διαθέσιµο σετ εικόνων ελέγχου) προκύπτει πως αυτό ισχύει µόνο για αποδοµήσεις πρώτου και δεύτερου επιπέδου, µε την τοµή A I A1 να είναι προφανώς υπερσύνολο της τοµής A I A2. Ο αλγόριθµος λοιπόν που υλοποιήθηκε παίρνει ως είσοδο από το χρήστη τον αριθµό του επιπέδου της αποδόµησης που θα εφαρµοστεί και ο οποίος σύµφωνα µε τα προηγούµενα είναι ένα ή δύο και το πλήρες path (µονοπάτι διαδροµή στον αποθηκευτικό χώρο) της αρχικής ασυµπίεστης εικόνας τύπου.bmp µε βάση την οποία θα δηµιουργηθούν οι έξι πυραµίδες και θα επιχειρηθεί η κατά περίπτωση κωδικοποίηση. Θεωρήθηκε σκόπιµο να µην αφήνονται περισσότερες επιλογές στην ελευθερία του χρήστη, εφόσον ο τελικός στόχος είναι η λήψη µετρήσεων της απόδοσης του κάθε πυραµιδικού σχήµατος ανάλυσης και προκειµένου η σύγκριση να είναι αντικειµενική κατά το δυνατόν πρέπει να γίνεται µε ένα 80

81 προκαθορισµένο σετ παραµέτρων. Αυτές οι παράµετροι, όπως π.χ. ο πυρήνας της συνέλιξης στη Gaussian πυραµίδα ή το µέγεθος και ο τύπος του δοµικού στοιχείου στις πυραµίδες Adjunction, Sun-Maragos, Leveling έχουν προεπιλεγεί µε βάση τη θεωρία ή το πείραµα ώστε να επιτυγχάνεται η βέλτιστη απόδοση κάθε σχήµατος αποδόµησης, τουλάχιστον όσον αφορά τις παραµέτρους αυτές. Το πρόγραµµα που πραγµατοποιεί τη µέτρηση προσαρµόζεται σε κάθε αρχική εικόνα είσοδο και προσδιορίζει 15 διακριτές ακέραιες τιµές του βαθµού συµπίεσης, που είναι ίδιος είτε εφαρµόζεται απλώς JPEG συµπίεση είτε κάποιο σχήµα ανάλυσης σε πολλαπλές κλίµακες µε χρήση πυραµίδας ή wavelet. Η µέγιστη τιµή του είναι η ακέραια προς τα κάτω προσέγγιση της µέγιστης συµπίεσης που µπορεί να παρέχει το πρότυπο JPEG για τη συγκεκριµένη εικόνα και ελάχιστη ίση µε τη µέγιστη µειωµένη κατά 15 φορές το βήµα της µείωσης, που είναι σταθερό και εξαρτάται αποκλειστικά από το διάστηµα τιµών που µπορεί να λάβει ο βαθµός συµπίεσης του προτύπου JPEG. Προφανώς επιλέχτηκε να συµπεριλαµβάνεται πάντα η µέγιστη (έστω η ακέραια προσέγγισή της) τιµή του βαθµού συµπίεσης και όχι η ελάχιστη, εφόσον όπως αναφέρθηκε προηγούµενα η όλη φιλοσοφία της διπλωµατικής εργασίας προσανατολίζεται σε VLBR ή και XLBR κωδικοποιήσεις. Φυσικά θα ήταν προτιµότερο από άποψη στατιστικής αξιοπιστίας να είχε πραγµατοποιηθεί λεπτοµερέστερη κβάντιση του διαστήµατος τιµών του βαθµού συµπίεσης, ωστόσο κάτι τέτοιο θα ήταν ιδιαίτερα ασύµφορο υπολογιστικά και ίσως όχι ουσιώδους σηµασίας. Θεωρείται πως µε 15 διακριτές τιµές του βαθµού συµπίεσης µπορεί κάλλιστα να προκύψει ένα συµπέρασµα στατιστικά αξιοποιήσιµο. Άλλωστε σε κάθε διαδικασία λήψης µετρήσεων υπεισέρχονται πάρα πολλοί παράγοντες εισαγωγής σφάλµατος, σηµαντικότερος των οποίων για την περίπτωση που εξετάζεται είναι η αδυναµία εντοπισµού ενός ικανοποιητικού σετ εικόνων ελέγχου. Περισσότερα πάνω σε αυτά τα ζητήµατα ακολουθούν στην επόµενη παράγραφο. Έξοδος του προγράµµατος κάθε φορά είναι ένα συγκεντρωτικό διάγραµµα των SNR που επιτεύχθηκαν από κάθε πυραµιδικό σχήµα καθώς και από το πρότυπο JPEG απλώς, συναρτήσει των διακριτών τιµών του βαθµού συµπίεσης που προαναφέρθηκαν. Κάθε διάγραµµα αντιστοιχεί σε µία αρχική εικόνα και σε µία τιµή για το επίπεδο της αποδόµησης που επιτελέστηκε. Ολοκληρώνοντας επαναλαµβάνεται εδώ χάριν πληρότητας πως η κατά το πρότυπο JPEG συµπίεση που µεσολαβεί ανάµεσα στα στάδια της κωδικοποίησης και της αποκωδικοποίησης προτιµήθηκε να γίνεται µε τον επίσηµο JPEG encoder που παρέχει το προγραµµατιστικό περιβάλλον Matlab, τόσο για λόγους ιδιαίτερα µεγαλύτερης ταχύτητας εκτέλεσης όσο και για λόγους τυποποίησης και δυνατότητας εξαγωγής εύκολα ερµηνεύσιµων αποτελεσµάτων. 81

82 Χρειάζεται ωστόσο κριτική στάση απέναντι στα αριθµητικά αποτελέσµατα για να υπάρξει σωστή και ικανοποιητική ερµηνεία τους και για να αξιολογηθεί επαρκώς η αξιοπιστία τους, για λόγους που θα αναλυθούν στην επόµενη παράγραφο. 4.3 Παράγοντες που υποβιβάζουν την ποιότητα των µετρήσεων Η στατιστικής φύσεως ανεπάρκεια του σετ εικόνων ελέγχου Ο σκοπός κάθε πρωτοκόλλου απωλεστικής συµπίεσης ψηφιακών εικόνων είναι να δέχεται ως είσοδο µία αρχική εικόνα µεγέθους Α σε bytes και να παράγει ως έξοδο µια εικόνα Β<Α επίσης σε A bytes. Ο λόγος > 1είναι ο βαθµός συµπίεσης που επιτυγχάνεται. B Στην περίπτωση που εξετάζεται στα πλαίσια της διπλωµατικής εργασίας, ενδιάµεσο στάδιο ανάµεσα στην κωδικοποίηση και την αποκωδικοποίηση, είναι η κωδικοποίηση κατά JPEG, η οποία όπως προκύπτει από την παράγραφο σχετίζεται άµεσα µε το συχνοτικό περιεχόµενο της όποιας εικόνας υπόκειται την κωδικοποίηση αυτή. Επιπλέον, οι ψηφιακές εικόνες δεν είναι µόνο διακριτές προσεγγίσεις εικόνων του φυσικού κόσµου προερχόµενες από κάποιο ADC (Analog to Digital Converter Αναλογικό σε Ψηφιακό Μετατροπέα), αλλά και εικόνες δορυφορικές, βιοϊατρικές, πιθανώς εκτός ορατού φάσµατος, συνθετικές εικόνες δηµιουργηµένες εξαρχής µε τη βοήθεια υπολογιστή, ακόµη και εικόνες θορύβου. Αυτή η πρακτικά ανεξάντλητη ποικιλία ψηφιακών εικόνων καθιστά πάρα πολύ δύσκολο, αν όχι αδύνατο, τον καθορισµό ενός αντιπροσωπευτικού σετ εικόνων ελέγχου για οποιοδήποτε είδος κωδικοποίησης. Το ουσιώδες πρόβληµα είναι ότι δεν είναι δυνατό να εκτιµηθεί µία µέση τιµή του φασµατικού περιεχοµένου όλων των πιθανών ψηφιακών εικόνων. Για παράδειγµα, µία εικόνα της φύσης (όπως ένα δάσος) έχει συνήθως χαµηλό φασµατικό περιεχόµενο, ενώ µια εικόνα συνθετική (όπως ένα σκίτσο ή µια γεωµετρική εικόνα) έχει συνήθως πολύ υψηλό. Το συµπέρασµα των παραπάνω είναι πως µόνο η µακροχρόνια εφαρµογή του εκάστοτε πρωτόκολλου συµπίεσης µπορεί να παρέχει αξιόπιστες ενδείξεις για την αποτελεσµατικότητά του, η οποία τουλάχιστον για το JPEG έχει πλέον αποδειχθεί. εν πρέπει να λησµονείται πάντως πως σε κάθε τέτοιο πρωτόκολλο µεγάλη σηµασία έχει και η υπολογιστική πολυπλοκότητα και κατ επέκταση κόστος σε hardware που συνεπάγεται, αν και τα τελευταία χρόνια και για εφαρµογές συµπίεσης ακίνητης εικόνας (όχι video) το πρόβληµα του hardware µπορεί να θεωρηθεί πως έχει λυθεί. 82

83 Καθίσταται λοιπόν προφανές πως τα διάφορα σετ έλεγχου για τα διάφορα πρότυπα κωδικοποίησης είναι ουσιαστικά ανεπαρκή και βασίζονται σε εκτιµήσεις και στην προηγούµενη εµπειρία. Για παράδειγµα το επίσηµο σετ ελέγχου του προτύπου JPEG αποτελείται από ψηφιακές εικόνες του φυσικού κόσµου, εποµένως και το ίδιο το πρότυπο έχει αποδεδειγµένη αποτελεσµατικότητα σε τέτοιες εικόνες και µόνο. Στα πλαίσια της εργασίας στόχο αποτέλεσε η χρησιµοποίηση του επίσηµου σετ εικόνων ελέγχου του JPEG, η όλη απόπειρα άλλωστε αφορά στη βελτίωση της απόδοσής του, αλλά αυτό δεν κατέστη εφικτό γιατί το σετ αυτό δεν είναι ελεύθερα διαθέσιµο. Κατά συνέπεια, το ζήτηµα της επιλογής εικόνων ελέγχου επιλύθηκε µε τρόπο αυθαίρετο, χωρίς αυτό να σηµαίνει πως δεν καταβλήθηκε προσπάθεια εύρεσης αντιπροσωπευτικών δειγµάτων από διάφορες κατηγορίες εικόνων. Στη σχετική παράγραφο παρατίθεται ολόκληρο το σετ εικόνων ελέγχου σε ασυµπίεστη µορφή Το πρόβληµα της ορθής εκτίµησης του SNR Υλοποίηση της µέτρησης του SNR στα πλαίσια της εργασίας Για την εκτίµηση της ποιότητας των αποτελεσµάτων του εκάστοτε σχήµατος ανάλυσης σε πολλαπλές κλίµακες και της απλής εφαρµογής του προτύπου JPEG, επιλέχθηκε να χρησιµοποιηθεί το κριτήριο του PSNR (Peak to peak Signal to Noise Ratio Λόγος Σήµατος προς Θόρυβο από Κορυφή σε κορυφή). Στη συνέχεια θα οριστεί σε µαθηµατική σηµειολογία το κριτήριο αυτό. Στο σηµείο αυτό πρέπει να σηµειωθεί πως οι εικόνες που αποτελούν είσοδο στον εκάστοτε κωδικοποιητή έχουν επιλεγεί ώστε η κάθε τους χωρική διάσταση να είναι ακέραιο πολλαπλάσιο του 8, ώστε να αποφεύγεται το zero padding (γέµισµα µε µηδενικά) της εικόνας ώστε να έρθει αναγκαστικά στις επιθυµητές διαστάσεις. Αυτή η επιλογή ήταν συνειδητή, ώστε να διασφαλίζεται κατά το δυνατόν η αξιοπιστία στη µέτρηση του PSNR. Επίσης πρέπει να επισηµανθεί πως µόνο στην περίπτωση της Gaussian πυραµίδας και για λόγους πιστότητας στην υλοποίηση σύµφωνα µε το πνεύµα του [4], η δράση του τελεστή synthesis πάνω σε ένα επίπεδο της πυραµίδας διαστάσεων (Μ+1) (Ν+1) οδηγεί σε µία εικόνα διαστάσεων (2Μ+1) (2Ν+1) και όχι 2(Μ+1) 2(Ν+1), όπως σε όλα τα υπόλοιπα σχήµατα αποδόµησης. Κατά συνέπεια απαιτείται και η αναπροσαρµογή των εισόδων στη συνάρτηση που υπολογίζει το PSNR ώστε να µην υπάρχει ασυµφωνία στα µεγέθη των εικόνων. Πάντως η αναπροσαρµογή αυτή, όσον αφορά τα πειράµατα που διεξήχθησαν, σηµαίνει (κατά τον υπολογισµό του PSNR) την παράλειψη µίας γραµµής και µίας στήλης στην αποδόµηση 83

84 πρώτου επιπέδου και τριών στην αποδόµηση δύο επιπέδων και θεωρείται ασήµαντη, οπότε και δεν πλήττει την αντικειµενικότητα της µέτρησης. Έστω Α η αρχική ασυµπίεστη εικόνα και Β η τελική αποδοµηµένη και ανακατασκευασµένη (στην περίπτωση των σχηµάτων ανάλυσης σε πολλαπλές κλίµακες) ή απλά συµπιεσµένη σύµφωνα µε το πρότυπο JPEG εικόνα. Τότε, ως =Α-Β, ορίζεται η διαφορά ανάµεσα στις δύο εικόνες, όπου µε συµβολίζεται, όπως συνήθως, η αφαίρεση στο R. Για κάθε block i της εικόνας µεγέθους 8 8 pixel, υπολογίζεται η τιµή: Σ i = log i mean mean 255 µέσο όρο σε µία διάσταση και η ύψωση στο τετράγωνο είναι σηµειακή. 2, όπου mean είναι ο τελεστής που βρίσκει το Εξίσωση 43 Η τελική ένδειξη του PSNR είναι ο µέσος όρος Σ i i i i, όλων των block που απαρτίζουν την εικόνα. Στα αθροίσµατα τόσο του αριθµητή όσο και του παρονοµαστή όµως αµελούνται τα Σ i που έχουν άπειρη τιµή, η οποία προκύπτει όταν τα αντίστοιχα block τόσο στην αρχική όσο και στην ανακατασκευασµένη εικόνα είναι ακριβώς ίδια, κάτι όχι σπάνιο ιδιαίτερα σε χαµηλούς βαθµούς συµπίεσης. Οι παραλείψεις αυτές είναι αναγκαίες γιατί διαφορετικά θα απειριζόταν η ένδειξη του PSNR έστω και αν υπήρχε µόνο ένα κοινό block. Μία µέθοδος που θα µπορούσε να παρακάµψει αυτό το πρόβληµα θα ήταν να προσαρµοστεί η τελική ένδειξη ως εξής: PSNR median( Σ ) =, όπου median είναι ο τελεστής που προσδιορίζει την ενδιάµεση τιµή σε µία διάσταση. Ωστόσο, προτιµήθηκε η λύση του µέσου όρου γιατί είναι γραµµικός τελεστής και πλησιάζει περισσότερο την ανθρώπινη διαίσθηση. i i Ολοκληρώνοντας πρέπει να σηµειωθεί πως η διαδικασία εκτίµησης του PSNR γίνεται ξεχωριστά για κάθε χρωµατική συνιστώσα και ως τελική τιµή λαµβάνεται ο (γραµµικός) µέσος όρος των τριών, κάτι µάλλον δικαιολογηµένο καθώς η εµπειρία αποδεικνύει πως ειδικά σε εικόνες του φυσικού κόσµου δεν υπάρχουν µεγάλες αποκλίσεις ανάµεσα στις τιµές της φωτεινότητας για κάθε χρωµατική συνιστώσα. Ανακεφαλαιώνοντας τους συµβιβασµούς που λαµβάνουν χώρα κατά τη διαδικασία της εκτίµησης του PSNR, προκύπτει: 84

85 Ως µέτρο της διαφοροποίησης ανάµεσα σε στοιχειώδη τµήµατα των συγκρινόµενων εικόνων λαµβάνεται η ευκλείδεια απόστασή τους, κάτι που δε συµβαδίζει αναγκαστικά µε την ανθρώπινη εκτίµηση της όποιας διαφοράς. Αµελούνται κατά τον υπολογισµό, τα block των εικόνων που παρουσιάζουν απειρισµό του PSNR και που είναι πιθανό να είναι σχετικά πάρα πολλά. Εισάγεται µια έντονη γραµµικότητα όταν συνδυάζονται τα µερικά αποτελέσµατα ανά χρωµατική συνιστώσα προκειµένου να προκύψει το τελικό αποτέλεσµα, η οποία δε µπορεί να δικαιολογηθεί απόλυτα Μολαταύτα, η µέθοδος αυτή εκτίµησης του PSNR θεωρείται από τις πλέον αξιόπιστες και ακολουθείται συχνά στη σχετική βιβλιογραφία. Στα πλαίσια της εργασίας αναπτύχθηκε αν και δεν εφαρµόστηκε κατά τη λήψη των µετρήσεων (για λόγους οικονοµίας στους υπολογισµούς και όχι µόνο) και ένας εναλλακτικός τρόπος παρουσίασης του PSNR που ίσως συµβαδίζει περισσότερο µε την υποκειµενική αντίληψη του ανθρώπινου παρατηρητή. Σε αυτή τη µέθοδο, αφού υπολογιστεί µε τη βοήθεια της εξίσωσης 43 το PSNR για κάθε block, παράγεται µια grayscale (αποχρώσεων του γκρι) εικόνα η οποία οπτικοποιεί το αποτέλεσµα ανά block σε µία κλίµακα 256 διακριτών αποχρώσεων, µε τις ανοιχτόχρωµες να αντιστοιχούν σε ακριβέστερη ανακατασκευή του block και τις πιο σκούρες σε µεγαλύτερα σφάλµατα. Στην εικόνα που ακολουθεί φαίνεται το αποτέλεσµα της οπτικοποίησης για δύο συµπιεσµένες εκδοχές της ίδιας αρχικής εικόνας, µε την πάνω σειρά να αντιστοιχεί στη µικρότερη (κατά το πρότυπο JPEG) δυνατή συµπίεση και την κάτω στη µεγαλύτερη. Οι ενδείξεις του PSNR έχουν ως εξής: Ανακατασκευή χαµηλού βαθµού συµπίεσης: 95,02 db Ανακατασκευή υψηλού βαθµού συµπίεσης: 29,65 db Από την παρατήρηση των δύο οπτικοποιήσεων του PSNR σε αντιπαραβολή µε τις ανακατασκευασµένες εικόνες, προκύπτει το εξαιρετικά ενδιαφέρον συµπέρασµα, πως µε τη µέθοδο αυτή της οπτικοποίησης µπορεί ο παρατηρητής να εστιάσει στα σηµεία της εικόνας που ανακατασκευάζονται µε µεγάλο σφάλµα και που όπως είναι γνωστό για την περίπτωση της απλής εφαρµογής του προτύπου JPEG, είναι τα σηµεία των ακµών. Σε αυτά τα σηµεία ως γνωστόν το συχνοτικό περιεχόµενο της εικόνας είναι σχετικά πολύ µεγάλο και η κβάντιση των DCT συντελεστών που επιφέρει η εφαρµογή του JPEG οδηγεί σε µεγάλα σφάλµατα. Αυτό διακρίνεται εύκολα στις δύο οπτικοποιήσεις και ενισχύει την πεποίθηση πως η µέθοδος αυτή της οπτικοποίησης 85

86 από τη µία επαληθεύει τις θεωρητικές προβλέψεις και από την άλλη προσφέρεται για την εξαγωγή συµπερασµάτων και ανταποκρίνεται καλύτερα από µία απλή αριθµητική ένδειξη στην ανθρώπινη διαίσθηση. JPEG, Quality=100 PSNR visualization: Red Color Channel JPEG, Quality=1 PSNR visualization: Red Color Channel Εικόνα 4-1Οπτικοποίηση του PSNR για δύο εκδοχές ανακατασκευής διαφορετικής ποιότητας Πρέπει πάντως να σηµειωθεί πως η συνάρτηση της οπτικοποίησης εµπεριέχει µια κβάντιση στις τιµές της φωτεινότητας και δεν είναι δυνατό να αποδώσει µε µεγάλη πιστότητα την πραγµατική κατάσταση, όσον αφορά τις τιµές του PSNR ανά block. Αυτή η τελευταία παρατήρηση επαναφέρει το ζήτηµα της αξιοπιστίας της εκτίµησης του SNR µε µαθηµατικό, συστηµατικό τρόπο και της απόκλισης που ίσως έχουν τέτοιες µέθοδοι από την ανθρώπινη διαίσθηση Υποκειµενικά κριτήρια για την εκτίµηση της ποιότητας των εικόνων Εισαγωγή Όπως έχει αναφερθεί και προηγούµενα, είναι διαθέσιµη µία τεράστια ποικιλία ψηφιακών εικόνων κάθε µία εκ των οποίων µπορεί να προέρχεται από το φυσικό ορατό κόσµο, να συντίθεται από υπολογιστές, να ανήκει στο υπέρυθρο µέρος του φάσµατος, να είναι απεικόνιση που προέρχεται 86

87 από ακτινοβολία-χ ή από µαγνητική τοµογραφία ή από άλλες πηγές. Στην παράγραφο αυτή το ενδιαφέρον εστιάζεται αποκλειστικά σε φωτογραφίες που τελικά θα τις εξετάσει κάποιος άνθρωπος για διάφορους λόγους και από διαφορετική σκοπιά κάθε φορά. Η µεγάλη διαφορά ανάµεσα στον άνθρωπο παρατηρητή και σε κάποιο µαθηµατικό κριτήριο εκτίµησης της ποιότητας, είναι ότι η ευαισθησία του ανθρώπινου οφθαλµού εξαρτάται από ένα σύνολο παραγόντων, όπως είναι το επίπεδο του φωτός, οι χωρικές συχνότητες και το περιεχόµενο των υπό εξέταση σηµάτων. Σε αυτό το σηµείο πρέπει να γίνει η διάκριση ανάµεσα στην ποιότητα και στην πιστότητα µιας εικόνας ως προς µία άλλη (βλ. [13]), καθώς όταν χρησιµοποιούνται µαθηµατικά κριτήρια εκτίµησης πάντα εννοείται το δεύτερο, ενώ το HVS είναι ιδιαίτερα ικανό στην εκτίµηση της ποιότητας µιας εικόνας χωρίς απαραίτητα να διαθέτει κάποιο σηµείο αναφοράς. Στα πλαίσια της διπλωµατικής εργασίας πάντως η ποιότητα και η πιστότητα είναι ταυτόσηµες έννοιες και χρησιµοποιείται πάντα ο πρώτος όρος. Μια συµπιεσµένη εικόνα είναι υψηλής ποιότητας όταν οι όποιες παραµορφώσεις σε σχέση µε την αρχική είναι τέτοιες ώστε να µη γίνονται αντιληπτές από το HVS. Οι απαιτήσεις για συµπίεση είναι οπωσδήποτε µεγάλες παρά την τεράστια αύξηση του διαθέσιµου bandwidth, γι αυτό και τα περισσότερα πρωτόκολλα συµπίεσης εκµεταλλευόµενα κάποια χαρακτηριστικά του HVS συµπιέζουν απωλεστικά µεν, πολύ αποδοτικά δε, παράγοντας αποτελέσµατα που είναι γενικά ανεκτά. Στη βιβλιογραφία ωστόσο έχουν προταθεί προσφάτως αλγόριθµοι συµπίεσης που επιδιώκουν να διατηρήσουν τις όποιες παραµορφώσεις σε επίπεδα που δε γίνονται αντιληπτά από το HVS, µε αποτέλεσµα συµπιέσεις που είναι απωλεστικές στην πράξη, αλλά µε απώλειες που δε γίνονται αντιληπτές, δηλαδή αλγόριθµοι αντιληπτικά µη απωλεστικοί. Συνήθως οι αλγόριθµοι αυτοί αναλύσουν τα σήµα σε ζώνες και χρησιµοποιούν ένα υποκειµενικό µοντέλο ώστε η παραµόρφωση που εισάγεται σε κάθε ζώνη να µη συνεισφέρει σε µη συνολικά αντιληπτή αλλοίωση του αρχικού περιεχοµένου Θεµελιώδεις αρχές της ανθρώπινης αντίληψης της ποιότητας εικόνων Η προσέγγιση που ακολουθείται από τα περισσότερα µοντέλα εκτίµησης οπτικής ποιότητας, είναι να προσδιορίζεται πως το κατώτερο ιεραρχικά επίπεδο της φυσιολογίας του HVS περιορίζει την οπτική ευαισθησία. Στη συνέχεια θα επιχειρηθεί µια συνοπτική εισαγωγή στα τέσσερα φαινόµενα που εισάγουν διακυµάνσεις στην οπτική ευαισθησία του HVS (βλ. [13]): Η µη γραµµικότητα στην αντίληψη της φωτεινότητας. Είναι ευρέως γνωστό πως η αντίληψη της φωτεινότητας είναι µη γραµµική συνάρτηση της έντασης του φωτός. Μάλιστα, έχει προσδιοριστεί πειραµατικά πως για µία µεγάλη κλίµακα φωτεινοτήτων στο 87

88 background (παρασκήνιο φόντο) µιας εικόνας, η οριακά αντιληπτή µεταβολή της φωτεινότητας δι διαιρούµενη µε Ι, είναι σταθερή. Ισχύει λοιπόν: Εξίσωση 44 δi I = k 0,33 και η εξίσωση αυτή ονοµάζεται νόµος του Weber Η µορφή της συνάρτησης ευαισθησίας στην αντίθεση. Από διάφορα πειράµατα που έχουν γίνει µε σκοπό τον προσδιορισµό των χαρακτηριστικών της, έχει προκύψει πως παρουσιάζει συµπεριφορά band-pass (ζωνοπερατού) φίλτρου. Η επικάλυψη της αντίθεσης, που είναι το φαινόµενο της µείωσης της ορατότητας κάποιου συστατικού της εικόνας, η οποία οφείλεται στην παρουσία άλλου ή άλλων συστατικών της εικόνας µε παρόµοια χωρική τοποθέτηση και παραπλήσιο συχνοτικό περιεχόµενο. Η χρονική επικάλυψη, η οποία εκδηλώνεται µε δύο διαφορετικούς τρόπους, µέσω της αλλαγής σκηνής και της συνάρτησης ευαισθησίας χρονικής αντίθεσης. Η επικάλυψη αυτή είναι ιδιαίτερα σηµαντική σε σήµατα video, οφείλεται στη χρονική µεταβολή των οπτικών ερεθισµάτων και οπωσδήποτε ενισχύεται από το γεγονός ότι η αντίληψη ενός κινούµενου αντικειµένου εξαρτάται σε πολύ µεγάλο βαθµό από ο ανθρώπινος οφθαλµός έχει εστιάσει σε αυτό και το παρακολουθεί ή όχι. Σε ένα video, µια αλλαγή σκηνής συµβαίνει οποτεδήποτε υπάρχει µια απότοµη αλλαγή του περιεχοµένου ολόκληρης της εικόνας και έχει ως αποτέλεσµα µια δραµατική αύξηση στα επίπεδα επικάλυψης για ένα χρονικό διάστηµα ως και 100 ms µετά την αλλαγή της σκηνής. Η συνάρτηση ευαισθησίας χρονικής αντίθεσης µπορεί να θεωρηθεί ως επέκταση της συνάρτησης ευαισθησίας χωρικής αντίθεσης, ο δε συνδυασµός των δύο αποτελεσµάτων παρέχει ένα τρόπο απεικόνισης της χωροχρονικής συνάρτησης µεταφοράς του HVS Μετρικά της ποιότητας εικόνων βασισµένα σε υποκειµενικά κριτήρια Ο στόχος ενός υποκειµενικού µετρικού για την ποιότητα εικόνων, είναι να προσδιορίσει τις ορατές από το HVS διαφορές ανάµεσα σε δύο εικόνες. Η µία από τις δύο αποτελεί την αναφορά και θεωρείται τέλεια, ενώ η άλλη έχει µεταβληθεί ή αλλοιωθεί κατά κάποιο τρόπο. Κατά συνέπεια η εκτίµηση της ποιότητας µιας εικόνας γίνεται σε σχέση µε κάποια άλλη και άρα εκφυλίζεται σε εκτίµηση πιστότητας, αν και για ιστορικούς λόγους αντί του όρου πιστότητα χρησιµοποιείται ο µάλλον αδόκιµος ποιότητα. Ένα υποκειµενικό µετρικό, σε αντίθεση µε τα συνήθη αντικειµενικά, χρησιµοποιεί και κάποιες άλλες πληροφορίες πέραν της αρχικής και τελικής εικόνας, όπως είναι η απόσταση θέασης, η χρήση της εικόνας και οι παράµετροι της απεικόνισης. Η έξοδος ενός τέτοιου µετρικού είναι ένας αριθµός που αντιπροσωπεύει την πιθανότητα ο ανθρώπινος οφθαλµός να ανιχνεύσει τη διαφορά ανάµεσα στις δύο εικόνες ή που υπολογίζει και κατατάσσει την αντιληπτική 88

89 ανοµοιοµορφία ανάµεσα στις εικόνες αυτές. Εναλλακτικά, η έξοδος θα µπορούσε να είναι ένας χάρτης πιθανοτήτων ανίχνευσης αντιληπτικά ανοµοιόµορφων τιµών. Έχει προταθεί στη βιβλιογραφία (βλ. [13]) πλήθος διαφορετικών µετρικών εκτίµησης της ποιότητας εικόνας, όλα βασισµένα στο χαµηλότερο επίπεδο επεξεργασίας του HVS, τα οποία περιλαµβάνουν τα ακόλουθα στάδια: Ανάλυση συχνότητας Ευαισθησία αντίθεσης βάσης Επικάλυψη φωτεινότητας Επικάλυψη αντίθεσης / υφής Συγκέντρωση σφαλµάτων Ενδεικτικά αναφέρονται τα µοντέλα των Daly και Lubin, των Teo και Heger, των Safranek- Johnston που είναι συνδυασµός κωδικοποιητή και αντιληπτικού κριτηρίου εκτίµησης του SNR. Περισσότερες πληροφορίες πάνω σε αυτά µπορούν να αναζητηθούν στο [12] και στις αναφορές του, καθώς η αναπαραγωγή τους εδώ κρίνεται πως είναι εκτός πνεύµατος της διπλωµατικής εργασίας Το βασισµένο στο DCT µετρικό του Watson Πολλά σύγχρονα πρότυπα συµπίεσης βασίζονται στην αποδόµηση µε τη βοήθεια του DCT µετασχηµατισµού. Ο Watson πρότεινε ένα µοντέλο για τον υπολογισµό των ορίων της ορατότητας για τις DCT συνιστώσες, το οποίο κατ επέκταση παρέχει ένα µετρικό για την ποιότητα της εικόνας. Λόγω της ευρείας διάδοσης codecs βασισµένων στο DCT και της µικρής υπολογιστικής επιβάρυνσης που συνεπάγονται, αξίζει να παρουσιαστεί λίγο εκτενέστερα το βασισµένο στο DCT αντιληπτικό µοντέλο του Watson, η υλοποίησή του και η χρήση του ως υποκειµενικής φύσεως µετρικού της ποιότητας. Το πρώτο στάδιο στην υλοποίηση είναι η µετατροπή χρωµατικού χώρου, κατά τα γνωστά από την παράγραφο Οι συντελεστές της φωτεινότητας και της χρωµατικότητας υφίστανται ανάλυση σε block των 8 8 pixel και µετατρέπονται στο πεδίο της συχνότητας µέσω του DCT µετασχηµατισµού. Στη συνέχεια, τα αντιληπτικά όρια ορατότητας υπολογίζονται για κάθε block της εικόνας. Για κάθε συνιστώσα b(k, n), όπου k συµβολίζει τη DCT συνιστώσα και n συµβολίζει το block της εικόνας αναφοράς, υπολογίζεται ένα όριο t(k, n), το οποίο αφορά τα φαινόµενα της ευαισθησίας αντίθεσης, της επικάλυψης φωτεινότητας και της επικάλυψης αντίθεσης. 89

90 Τα όρια βασικής ευαισθησίας αντίθεσης καθορίζονται σύµφωνα µε τη µέθοδο των Peterson, Ahumada, Watson, ενώ οι σχετικοί πίνακες παρατίθενται στο [13]. Αυτά τα όρια κατόπιν µεταβάλλονται ώστε να ληφθούν υπόψη πρώτα η επικάλυψη φωτεινότητας και µετά επικάλυψη αντίθεσης και να προκύψουν τελικά τα συνολικά όρια ευαισθησίας. Καθώς η επικάλυψη φωτεινότητας είναι συνάρτηση µόνο της µέσης τιµής µιας περιοχής, εξαρτάται µόνο από τη DCT συνιστώσα b(0, n) για κάθε block. Το όριο επικάλυψης φωτεινότητας, είναι: a T b(0, n) tl k n tb k b (, ) = ( ), όπου b (0) είναι η DCT συνιστώσα που αντιστοιχεί στη µέση (0) φωτεινότητα της εικόνας, ο συντελεστής α Τ έχει προτεινόµενη τιµή ίση µε 0,649 και καθορίζει το µέγεθος της επικάλυψης φωτεινότητας που λαµβάνει χώρα. Το µοντέλο του Watson για την επικάλυψη αντίθεσης υποθέτει η µείωση της ορατότητας περιορίζεται σε κάθε συνιστώσα µέσα σε κάθε block. Η διόρθωση επικάλυψης αντίθεσης τ c (k, n) είναι συνάρτηση της συνιστώσας b(k, n) και του ορίου επικάλυψης φωτεινότητας τ ( k, n) = max 1, c wc ( k ) wc { (, ) (, ) } ( k b k n t ) l k n t l (k, n):, όπου ο εκθέτης w c (k) έχει τιµή από 0 (οπότε δε συνυπολογίζεται η επικάλυψη αντίθεσης) ως 1, αλλά συνήθως θεωρείται ως µια σταθερά στην περιοχή του 0,7. Το συνολικό όριο ευαισθησίας είναι: t( k, n) = τ c ( k, n) t1( k, n). Για κάθε συνιστώσα σε κάθε block λοιπόν, έχει υπολογιστεί ένα όριο διαταραχής της ορατότητας. Μπορεί λοιπόν να υπολογιστεί για κάθε συνιστώσα το ποσό της διαταραχής, ως το πηλίκο του σφάλµατος στην ανακατασκευή των DCT συνιστωσών προς το όριο ευαισθησίας: ) b( k, n) b( k, n) d( k, n) =, όπου b( k, n) και b ) ( k, n) είναι η αρχική και τελική αντίστοιχα t( k, n) εικόνες. Όσο ισχύει d(k, n)<1, η διαταραχή σε αυτή την τοποθεσία δεν είναι ορατή, ενώ για d(k, n)>1 είναι ορατή. Σε αυτό το σηµείο έχει δηµιουργηθεί ένας πίνακας ενδείξεων ορατότητας διαταραχών. Αυτές πρέπει να συνδυαστούν σε µία µοναδική τιµή, η οποία θα περιγράφει την ποιότητα της εικόνας. Αυτός ο συνδυασµός γίνεται σε δύο στάδια πρώτα γίνεται συγκέντρωση των σφαλµάτων χωρικά και στη συνέχεια οι χωρικές συγκεντρώσεις σφαλµάτων συγκεντρώνονται κατά τη συχνότητα. Οι δύο αυτές διαδικασίες συγκέντρωσης χρησιµοποιούν το ίδιο πλαίσιο άθροισης πιθανοτήτων: 1 Q p( k) d( k, n) n πειράµατα ψυχοφυσιολογίας. s Qs =, όπου η τιµή της παραµέτρου Q s έχει βρεθεί ίση µε 4, από διάφορα 90

91 Ο πίνακας p(k) παρέχει ένα µέτρο του βαθµού ορατότητας των παραµορφώσεων σε κάθε συχνότητα. Προκειµένου να προσδιοριστεί µοναδική τιµή για το σφάλµα αντίληψης, πρέπει τα στοιχεία του πίνακα p(k) να συγκεντρωθούν, κατά παρόµοιο τρόπο µε τη χωρική συγκέντρωση 1 Q f Q f σφάλµατος: P = p( k), όπου η παράµετρος µπορεί να πάρει χαµηλότερες ή k υψηλότερες τιµές ανάλογα µε το αν η έµφαση δίνεται στο µέσο σφάλµα ή στο χειρότερο δυνατό σφάλµα αντίστοιχα. Μια εναλλακτική παρουσίαση της ποιότητας της εικόνας, στο πνεύµα της παραγράφου , είναι η χρήση ενός χάρτη διαταραχών αντί για µία αριθµητική τιµή. Αυτός ο χάρτης υπολογίζεται αν στην προηγούµενη διαδικασία παραλειφθεί το στάδιο της συγκέντρωσης χωρικών σφαλµάτων. Με αυτό τον τρόπο προκύπτει η κατανοµή του σφάλµατος πάνω στην εικόνα και έχει το πλεονέκτηµα πως παρέχει µια οπτική ένδειξη της ποιότητας. Για παράδειγµα η χρήση χαρτών ορατότητας µπορεί να διακρίνει την περίπτωση όπου η µέγιστη παραµόρφωση περιορίζεται σε ένα και µόνο block της εικόνας από αυτή όπου η παραµόρφωση επεκτείνεται σε ένα µεγάλο ποσοστό επί του συνολικού αριθµού των block, ενώ η απλή αριθµητική ένδειξη θα ήταν η ίδια. Ολοκληρώνοντας, πρέπει να σηµειωθεί πως το µετρικό αυτό είναι πολύ αποδοτικό στην πρόβλεψη της απόδοσης κωδικοποιητών που χρησιµοποιούν τη διάσπαση της εικόνας σε block. Ωστόσο, δεν είναι και τόσο αξιόπιστο στην εκτίµηση της ποιότητας άλλου τύπου κωδικοποιητών. Πάντως, στα πλαίσια της διπλωµατικής εργασίας για τον υπολογισµό της ποιότητας του αποτελέσµατος χρησιµοποιήθηκε το αντικειµενικό κριτήριο του τοπικού PSNR, καθώς θεωρήθηκε πως η υλοποίηση κάποιου αντιληπτικού κριτηρίου θα ήταν ιδιαίτερα απαιτητική υπολογιστικά και όχι απαραίτητα δόκιµη, αφού απαιτεί πρόσβαση σε στατιστικά στοιχεία που δεν ήταν διαθέσιµα. 4.4 Αποτελέσµατα της διπλωµατικής εργασίας Γενικά Θεωρώντας το σύνολο των αλγορίθµων που υλοποιήθηκαν στα πλαίσια της εργασίας ως black box (µαύρο κουτί), αυτό έχει ως είσοδο την αρχική ασυµπίεστη εικόνα (βλ. Παράγραφο 4.2) και ως έξοδο ένα συγκεντρωτικό διάγραµµα των αποδόσεων των επτά (έξι µε τη βοήθεια σχηµάτων ανάλυσης σε πολλαπλές κλίµακες και µία µε απευθείας εφαρµογή του προτύπου JPEG) διαφορετικών προσεγγίσεων συναρτήσει του βαθµού συµπίεσης. Επίσης, προκύπτει ένα αρχείο τύπου.txt στο οποίο περιέχονται οι αποδόσεις των επτά προσεγγίσεων σε µορφή κειµένου και οι 105 (15 δηλαδή για κάθε διαφορετική προσέγγιση) απεικονίσεις της ανακατασκευασµένης εικόνας. 91

92 Αυτές οι εικόνες προκύπτουν σε ασυµπίεστη µορφή, µα στη συνέχεια συµπιέζονται κατά το πρότυπο JPEG µε πολύ καλή ποιότητα όµως, ώστε από τη µία να εξοικονοµείται αποθηκευτικός χώρος και από την άλλη να µην εισάγονται λόγω της συµπίεσης αυτής artifacts (τεχνουργήµατα παραµορφώσεις, διαταραχές λόγω της κωδικοποίησης) που µπορούν να υποπέσουν στην ανθρώπινη αντίληψη και να αλλοιώσουν τα όποια συµπεράσµατα σχετικά µε την ποιότητα µπορούν να διεξαχθούν από την παρατήρηση. Το σετ εικόνων ελέγχου που χρησιµοποιήθηκε ως είσοδος, περιελάµβανε 10 εικόνες, για τις οποίες καταβλήθηκε προσπάθεια να είναι αρκετά αντιπροσωπευτικές και να συγκροτούν από κοινού ένα στατιστικά αξιόπιστο δείγµα. Κάθε µία από αυτές τις εικόνες υποβλήθηκε σε αξιολόγηση µε χρήση σχηµάτων ανάλυσης σε πολλαπλές κλίµακες µε αποδόµηση επιπέδου-1 και επιπέδου-2. Κατά συνέπεια (βλ ) παράγονται εικόνες αποτελέσµατα για κάθε εικόνα, γεγονός που σηµαίνει ότι ο τελικός όγκος αποτελεσµάτων, είναι που είναι οι ανακατασκευασµένες εικόνες και επιπλέον που είναι τα διαγράµµατα απόδοσης. Στο εξής µε CR συµβολίζεται ο βαθµός συµπίεσης και µε L1 και Λ2 τα επίπεδα 1 και 2 αντίστοιχα για λόγους συντοµίας και απλότητας. Καθίσταται προφανές πως δεν είναι δυνατό να παρατεθεί στην ολότητά του ένας τέτοιος όγκος αποτελεσµάτων. Αντί αυτού, παρουσιάζονται οι αρχικές εικόνες που απαρτίζουν το σετ ελέγχου και τα απαραίτητα διαγράµµατα απόδοσης. Επίσης παρουσιάζονται και αντιπροσωπευτικές περιπτώσεις ανακατασκευής από τις δύο προσεγγίσεις που υπερίσχυσαν ποιοτικά και από την απλή εφαρµογή του JPEG, για δύο περιπτώσεις του βαθµού συµπίεσης (µεγάλο, µεσαίο) µόνο όµως για το 1 ο επίπεδο ανακατασκευής. Στο διάγραµµα ροής που ακολουθεί, φαίνονται οι διεργασίες που επιτελούνται προκειµένου από την αρχική ασυµπίεστη εικόνα που αποτελεί την είσοδο του κωδικοποιητή να προκύψει η κατάλληλη εικόνα εξόδου, ανάλογα µε το αν επιλέχτηκε κάποιο σχήµα ανάλυσης σε πολλαπλές κλίµακες και ποιο ήταν αυτό. 92

93 Output.jpg image JPEG Output.bmp JPEG image Input.bmp image SubSample JPEG SubSample Gaussian JPEG Gaussian Leveling JPEG Leveling Adjunction JPEG Adjunction Sun-Maragos JPEG Sun-Maragos Morphological Haar JPEG Morphological Haar Αποτελέσµατα trui.bmp, All Rights Reserved Εικόνα 4-2 trui.bmp, 1 η εικόνα του σετ ελέγχου 93

94 PSNR of JPEG adv anced decoded image in relevance to the original BMP image, as a f unction of Compression Ratio JPEG SubSample Gaussian Leveling Adjunction Sun-Maragos Morphological Haar 60 PSNR that was achieved Compression Ratio that was achieved Εικόνα 4-3 PSNR συναρτήσει του CR για L1 ανακατασκευή PSNR of JPEG advanced decoded image in relevance to the original BMP image, as a f unction of Compression Ratio JPEG SubSample Gaussian Lev eling Adjunction Sun-Maragos Morphological Haar 60 PSNR that was achieved Compression Ratio that was achieved Εικόνα 4-4 PSNR συναρτήσει του CR για L2 ανακατασκευή 94

95 Εικόνα 4-5 Original JPEG συµπίεση, CR=101 Εικόνα 4-6 L1 ανακατασκευή µε Gaussian πυραµίδα, CR=101 Εικόνα 4-7 L1 ανακατασκευή µε Leveling πυραµίδα, CR=101 95

96 Εικόνα 4-8 Original JPEG συµπίεση, CR=59 Εικόνα 4-9 L1 ανακατασκευή µε Gaussian πυραµίδα, CR=59 Εικόνα 4-10 L1 ανακατασκευή µε Leveling πυραµίδα, CR=59 96

97 lena.bmp, All Rights Reserved Εικόνα 4-11 lena.bmp, 2 η εικόνα του σετ ελέγχου 97

98 60 55 PSNR of JPEG advanced decoded image in relevance to the original BMP image, as a f unction of Compression Ratio JPEG SubSample Gaussian Lev eling Adjunction Sun-Maragos Morphological Haar 50 PSNR that was achieved Compression Ratio that was achieved Εικόνα 4-12 PSNR συναρτήσει του CR για L1 ανακατασκευή PSNR of JPEG advanced decoded image in relevance to the original BMP image, as a f unction of Compression Ratio JPEG SubSample Gaussian Lev eling Adjunction Sun-Maragos Morphological Haar PSNR that was achieved Compression Ratio that was achieved Εικόνα 4-13 PSNR συναρτήσει του CR για L2 ανακατασκευή 98

99 Εικόνα 4-14 Original JPEG συµπίεση, CR=137 Εικόνα 4-15 L1 ανακατασκευή µε Gaussian πυραµίδα, CR=137 99

100 Εικόνα 4-16 L1 ανακατασκευή µε Leveling πυραµίδα, CR=137 Εικόνα 4-17 Original JPEG συµπίεση, CR=81 100

101 Εικόνα 4-18 L1 ανακατασκευή µε Gaussian πυραµίδα, CR=81 Εικόνα 4-19 L1 ανακατασκευή µε Leveling πυραµίδα, CR=81 101

102 chania.bmp, All Rights Reserved Εικόνα 4-20 chania.bmp, 3 η εικόνα του σετ ελέγχου 102

103 55 50 PSNR of JPEG advanced decoded image in relevance to the original BMP image, as a f unction of Compression Ratio JPEG SubSample Gaussian Lev eling Adjunction Sun-Maragos Morphological Haar 45 PSNR that was achieved Compression Ratio that was achieved Εικόνα 4-21 PSNR συναρτήσει του CR για L1 ανακατασκευή PSNR of JPEG advanced decoded image in relevance to the original BMP image, as a f unction of Compression Ratio JPEG SubSample Gaussian Lev eling Adjunction Sun-Maragos Morphological Haar PSNR that was achieved Compression Ratio that was achieved Εικόνα 4-22 PSNR συναρτήσει του CR για L2 ανακατασκευή 103

104 Εικόνα 4-23 Original JPEG συµπίεση, CR=138 Εικόνα 4-24 L1 ανακατασκευή µε Gaussian πυραµίδα, CR=

105 Εικόνα 4-25 L1 ανακατασκευή µε Leveling πυραµίδα, CR=138 Εικόνα 4-26 Original JPEG συµπίεση, CR=82 105

106 Εικόνα 4-27 L1 ανακατασκευή µε Gaussian πυραµίδα, CR=82 Εικόνα 4-28 L1 ανακατασκευή µε Leveling πυραµίδα, CR=82 106

107 bottles.bmp, All Rights Reserved Εικόνα 4-29 bottles.bmp, 4 η εικόνα του σετ ελέγχου 107

108 PSNR of JPEG adv anced decoded image in relev ance to the original BMP image, as a f unction of Compression Ratio JPEG SubSample Gaussian Lev eling Adjunction Sun-Maragos Morphological Haar 65 PSNR that was achieved Compression Ratio that was achiev ed Εικόνα 4-30 PSNR συναρτήσει του CR για L1 ανακατασκευή PSNR of JPEG adv anced decoded image in relev ance to the original BMP image, as a f unction of Compression Ratio JPEG SubSample Gaussian Lev eling Adjunction Sun-Maragos Morphological Haar 60 PSNR that was achieved Compression Ratio that was achiev ed Εικόνα 4-31 PSNR συναρτήσει του CR για L2 ανακατασκευή 108

109 Εικόνα 4-32 Original JPEG συµπίεση, CR=124 Εικόνα 4-33 L1 ανακατασκευή µε Gaussian πυραµίδα, CR=

110 Εικόνα 4-34 L1 ανακατασκευή µε Leveling πυραµίδα, CR=124 Εικόνα 4-35 Original JPEG συµπίεση, CR=75 110

111 Εικόνα 4-36 L1 ανακατασκευή µεgaussian πυραµίδα, CR=75 Εικόνα 4-37 L1 ανακατασκευή µε Leveling πυραµίδα, CR=75 111

112 elcap.bmp, All Rights Reserved Εικόνα 4-38 elcap.bmp, 5 η εικόνα του σετ ελέγχου 112

113 PSNR of JPEG adv anced decoded image in relev ance to the original BMP image, as a f unction of Compression Ratio JPEG SubSample Gaussian Lev eling Adjunction Sun-Maragos Morphological Haar 50 PSNR that was achieved Compression Ratio that was achiev ed Εικόνα 4-39 PSNR συναρτήσει του CR για L1 ανακατασκευή PSNR of JPEG adv anced decoded image in relev ance to the original BMP image, as a f unction of Compression Ratio JPEG SubSample Gaussian Lev eling Adjunction Sun-Maragos Morphological Haar 50 PSNR that was achieved Compression Ratio that was achiev ed Εικόνα 4-40 PSNR συναρτήσει του CR για L2 ανακατασκευή 113

114 Εικόνα 4-41 Original JPEG συµπίεση, CR=116 Εικόνα 4-42 L1 ανακατασκευή µεgaussian πυραµίδα, CR=

115 Εικόνα 4-43 L1 ανακατασκευή µε Leveling πυραµίδα, CR=116 Εικόνα 4-44 Original JPEG συµπίεση, CR=67 115

116 Εικόνα 4-45 L1 ανακατασκευή µεgaussian πυραµίδα, CR=67 Εικόνα 4-46 L1 ανακατασκευή µε Leveling πυραµίδα, CR=67 116

117 gates.bmp, All Rights Reserved Εικόνα 4-47 gates.bmp, 6 η εικόνα του σετ ελέγχου 117

118 55 50 PSNR of JPEG adv anced decoded image in relev ance to the original BMP image, as a f unction of Compression Ratio JPEG SubSample Gaussian Lev eling Adjunction Sun-Maragos Morphological Haar 45 PSNR that was achieved Compression Ratio that was achiev ed Εικόνα 4-48 PSNR συναρτήσει του CR για L1 ανακατασκευή PSNR of JPEG adv anced decoded image in relev ance to the original BMP image, as a f unction of Compression Ratio JPEG SubSample Gaussian Lev eling Adjunction Sun-Maragos Morphological Haar PSNR that was achieved Compression Ratio that was achiev ed Εικόνα 4-49 PSNR συναρτήσει του CR για L2 ανακατασκευή 118

119 Εικόνα 4-50 Original JPEG συµπίεση, CR=147 Εικόνα 4-51 L1 ανακατασκευή µε Gaussian πυραµίδα, CR=

120 Εικόνα 4-52 L1 ανακατασκευή µε Leveling πυραµίδα, CR=147 Εικόνα 4-53 Original JPEG συµπίεση, CR=84 120

121 Εικόνα 4-54 L1 ανακατασκευή µε Gaussian πυραµίδα, CR=84 Εικόνα 4-55 L1 ανακατασκευή µε Leveling πυραµίδα, CR=84 121

122 people.bmp, All Rights Reserved Εικόνα 4-56 people.bmp, 7 η εικόνα του σετ ελέγχου 122

123 50 45 PSNR of JPEG advanced decoded image in relevance to the original BMP image, as a f unction of Compression Ratio JPEG SubSample Gaussian Leveling Adjunction Sun-Maragos Morphological Haar 40 PSNR that was achieved Compression Ratio that was achieved Εικόνα 4-57 PSNR συναρτήσει του CR για L1 ανακατασκευή PSNR of JPEG advanced decoded image in relevance to the original BMP image, as a f unction of Compression Ratio JPEG SubSample Gaussian Lev eling Adjunction Sun-Maragos Morphological Haar 40 PSNR that was achieved Compression Ratio that was achieved Εικόνα 4-58 PSNR συναρτήσει του CR για L2 ανακατασκευή 123

124 Εικόνα 4-59 Original JPEG συµπίεση, CR=121 Εικόνα 4-60 L1 ανακατασκευή µε Gaussian πυραµίδα, CR=

125 Εικόνα 4-61 L1 ανακατασκευή µε Leveling πυραµίδα, CR=121 Εικόνα 4-62 Original JPEG συµπίεση, CR=72 125

126 Εικόνα 4-63 L1 ανακατασκευή µε Gaussian πυραµίδα, CR=72 Εικόνα 4-64 L1 ανακατασκευή µε Leveling πυραµίδα, CR=72 126

127 sanfran.bmp, All Rights Reserved Εικόνα 4-65 sanfran.bmp, 8 η εικόνα του σετ ελέγχου 127

128 50 45 PSNR of JPEG advanced decoded image in relevance to the original BMP image, as a f unction of Compression Ratio JPEG SubSample Gaussian Lev eling Adjunction Sun-Maragos Morphological Haar 40 PSNR that was achieved Compression Ratio that was achieved Εικόνα 4-66 PSNR συναρτήσει του CR για L1 ανακατασκευή PSNR of JPEG advanced decoded image in relevance to the original BMP image, as a f unction of Compression Ratio JPEG SubSample Gaussian Lev eling Adjunction Sun-Maragos Morphological Haar 40 PSNR that was achieved Compression Ratio that was achieved Εικόνα 4-67 PSNR συναρτήσει του CR για L2 ανακατασκευή 128

129 Εικόνα 4-68 Original JPEG συµπίεση, CR=144 Εικόνα 4-69 L1 ανακατασκευή µε Gaussian πυραµίδα, CR=

130 Εικόνα 4-70 L1 ανακατασκευή µε Leveling πυραµίδα, CR=144 Εικόνα 4-71 Original JPEG συµπίεση, CR=81 130

131 Εικόνα 4-72 L1 ανακατασκευή µε Gaussian πυραµίδα, CR=81 Εικόνα 4-73 L1 ανακατασκευή µε Leveling πυραµίδα, CR=81 131

132 protein.bmp, All Rights Reserved Εικόνα 4-74 protein.bmp, 9 η εικόνα του σετ ελέγχου 132

133 60 55 PSNR of JPEG advanced decoded image in relevance to the original BMP image, as a f unction of Compression Ratio JPEG SubSample Gaussian Lev eling Adjunction Sun-Maragos Morphological Haar 50 PSNR that was achieved Compression Ratio that was achieved Εικόνα 4-75 PSNR συναρτήσει του CR για L1 ανακατασκευή PSNR of JPEG advanced decoded image in relevance to the original BMP image, as a f unction of Compression Ratio JPEG SubSample Gaussian Lev eling Adjunction Sun-Maragos Morphological Haar 48 PSNR that was achieved Compression Ratio that was achieved Εικόνα 4-76 PSNR συναρτήσει του CR για L2 ανακατασκευή 133

134 Εικόνα 4-77 Original JPEG συµπίεση, CR=134 Εικόνα 4-78 L1 ανακατασκευή µε Gaussian πυραµίδα, CR=

135 Εικόνα 4-79 L1 ανακατασκευή µε Morphological Haar Wavelet, CR=134 Εικόνα 4-80 Original JPEG συµπίεση, CR=78 135

136 Εικόνα 4-81 L1 ανακατασκευή µε Gaussian πυραµίδα, CR=78 Εικόνα 4-82 L1 ανακατασκευή µε Morphological Haar Wavelet, CR=78 136

137 tmax.bmp, All Rights Reserved Εικόνα 4-83 tmax.bmp, 10 η εικόνα του σετ ελέγχου 137

138 PSNR of JPEG advanced decoded image in relevance to the original BMP image, as a f unction of Compression Ratio JPEG SubSample Gaussian Lev eling Adjunction Sun-Maragos Morphological Haar 50 PSNR that was achieved Compression Ratio that was achieved Εικόνα 4-84 PSNR συναρτήσει του CR για L1 ανακατασκευή PSNR of JPEG advanced decoded image in relevance to the original BMP image, as a f unction of Compression Ratio JPEG SubSample Gaussian Lev eling Adjunction Sun-Maragos Morphological Haar 50 PSNR that was achieved Compression Ratio that was achieved Εικόνα 4-85 PSNR συναρτήσει του CR για L2 ανακατασκευή 138

139 Εικόνα 4-86 Original JPEG συµπίεση, CR=64 Εικόνα 4-87 L1 ανακατασκευή µε Gaussian πυραµίδα, CR=64 139

140 Εικόνα 4-88 L1 ανακατασκευή µε Leveling πυραµίδα, CR=64 Εικόνα 4-89 Original JPEG συµπίεση, CR=36 140

141 Εικόνα 4-90 L1 ανακατασκευή µε Gaussian πυραµίδα, CR=36 Εικόνα 4-91 L1 ανακατασκευή µε Leveling πυραµίδα, CR=36 141

142 Κεφ. 5 Συµπεράσµατα και µελλοντική έρευνα 5.1 Σχόλια πάνω στα αποτελέσµατα Παρατηρώντας τα διαγράµµατα του PSNR συναρτήσει του βαθµού συµπίεσης που προέκυψαν από τις µετρήσεις µε βάση το σετ ελέγχου των δέκα εικόνων που χρησιµοποιήθηκε, προκύπτει το προφανές και αναµενόµενο εξαρχής συµπέρασµα πως οι έξι διαφορετικές προσεγγίσεις που βασίζονται σε σχήµατα ανάλυσης σε πολλαπλές κλίµακες εµφανίζονται αποδοτικότερες της απλής συµπίεσης µε βάση το πρότυπο JPEG, σε υψηλούς βαθµούς συµπίεσης. Πιο συγκεκριµένα, προκύπτει ο εξής πίνακας, που συγκεντρώνει τις τιµές του βαθµού συµπίεσης ανά προσέγγιση και επίπεδο αποδόµησης πάνω από τις οποίες αξίζει όσον αφορά το PSNR να εφαρµοστεί το κάθε σχήµα ανάλυσης σε πολλαπλές κλίµακες, αν και δεν αποκλείεται όσο αυξάνεται ο βαθµός συµπίεσης να καταστεί και πάλι ασύµφορη η επιλογή κάποιου σχήµατος σε σχέση µε την απλή εφαρµογή του JPEG. Για λόγους κανονικοποίησης, αντί του βαθµού συµπίεσης αυτού καθαυτού, σηµειώνεται η ένδειξη που αντιστοιχεί στο επίπεδο κβάντισης της κλίµακας του βαθµού συµπίεσης.(βλ. Παράγραφο 4.1). Πίνακας 5-1, βαθµοί συµπίεσης για τους οποίους αξίζει να προτιµηθεί κάποιο σχήµα ανάλυσης σε πολλαπλές κλίµακες, έναντι της απλής εφαρµογής του προτύπου JPEG Σχήµα ανάλυσης σε πολλαπλές κλίµακες Μέσος όρος bottles.bmp chania.bmp elcap.bmp gates.bmp lena.bmp people.bmp protein.bmp sanfran.bmp tmax.bmp trui.bmp Επίπεδο αποδόµησης SubSample 6, Gaussian 4,5 7, Leveling 4,2 7, Adjunction 6,2 8, Sun-Maragos 7 8, Morphological Haar 7,1 9, Από τον πίνακα και συγκεκριµένα από τη στήλη του µέσου όρου προκύπτει πως τόσο για αποδόµηση και ανακατασκευή 1 ου όσο και 2 ου επιπέδου, τα σχήµατα Gaussian και Leveling προσφέρουν καλύτερη ποιότητα από το απλό JPEG για µεγαλύτερο εύρος βαθµών συµπίεσης, από ότι τα υπόλοιπα σχήµατα. Μάλιστα, έστω και µε µικρή διαφορά (όσον αφορά το εύρος) φαίνεται να προηγείται το σχήµα αποδόµησης µε χρήση Leveling. 142

143 Το δεύτερο συµπέρασµα που προκύπτει από την απλή παρατήρηση, είναι πως οι καµπύλες της απόδοσης είναι σχετικά οµαλές (δεδοµένης της όχι και τόσο λεπτοµερούς αναγκαστικά κβάντισης του εύρους τιµών του βαθµού συµπίεσης) σε όλες τις εικόνες εκτός από τις: protein.bmp tmax.bmp Το φαινόµενο αυτό εξηγείται, αν ληφθεί υπόψη πως αυτές οι δύο εικόνες είναι και οι µόνες που δεν προέρχονται µέσω κάποιου ADC από το φυσικό κόσµο. Αυτές παρουσιάζουν σαφώς µεγαλύτερο συχνοτικό περιεχόµενο από όλες τις υπόλοιπες και από το µέσο όρο, πράγµα που όχι µόνο προκύπτει από την ανθρώπινη αντίληψη µα και επαληθεύτηκε και µε εφαρµογή του DCT µετασχηµατισµού στο σύνολο της κάθε εικόνας. Το υψηλό συχνοτικό περιεχόµενο εξηγεί και τις απότοµες µεταπτώσεις της καµπύλης της απόδοσης του JPEG, που γενικά αναµένεται να είναι περισσότερο οµαλή από τις υπόλοιπες χωρίς αυτό να αποτελεί κανόνα. Πάντως, οι παραπάνω παρατηρήσεις φαίνεται πως συµβαδίζουν µε το θεωρητικό υπόβαθρο της JPEG κωδικοποίησης, το οποίο υπαγορεύει πως όσο µεγαλύτερες συχνότητες εµφανίζονται σε µία εικόνα, τόσο λιγότερο αποδοτική και προβλέψιµη είναι η κωδικοποίηση. Εξαιτίας των όσων αναφέρθηκαν παραπάνω, οι δύο αυτές εικόνες του σετ ελέγχου µπορούν να θεωρηθούν εξαιρέσεις και δε θα ληφθούν υπόψη στα συµπεράσµατα που εξάγονται στη συνέχεια. Άλλωστε, το ίδιο το πρότυπο JPEG που αποτελεί τη βάση της διπλωµατικής εργασίας είναι προσανατολισµένο σε συµπίεση ψηφιακών εικόνων του φυσικού κόσµου και όχι ακραίων περιπτώσεων εικόνων µε πολύ µεγάλο φασµατικό περιεχόµενο. Αντιπαραβάλλοντας τα διαγράµµατα ανακατασκευής 1 ου και 2 ου επιπέδου ανά εικόνα, εξάγεται το συµπέρασµα πως οι κλίσεις (σε απόλυτη τιµή) των καµπυλών απόδοσης στην αποδόµηση επιπέδου ένα είναι µεγαλύτερες από ότι στην αποδόµηση επιπέδου δύο. Μάλιστα στην αποδόµηση 2 ου επιπέδου και για χαµηλούς βαθµούς συµπίεσης η κλίση είναι µηδενική, κάτι αναµενόµενο εφόσον ο βαθµός συµπίεσης που επιτυγχάνεται είναι σταθερός και µικρότερος του κάτω ορίου του κβαντισµένου διαστήµατος τιµών (βλ. Παράγραφο 4.2), για ένα σχετικά µεγάλο αριθµό βαθµών συµπίεσης που επιδιώκονται. Απλούστερα, επειδή στην αποδόµηση επιπέδου δύο η προς JPEG συµπίεση εικόνα είναι πολύ µικρότερου (υποδεκαεξαπλάσιου) µεγέθους σε σχέση µε την αρχική, είναι δυνατό για τις πρώτες τιµές του βαθµού συµπίεσης που επιδιώκεται και που επιλέγεται µε βάση την αρχική εικόνα, τα σχήµατα ανάλυσης σε πολλαπλές κλίµακες να παρέχουν σταθερή συµπίεση ίση µε τη µικρότερη δυνατή δεδοµένων των συνθηκών. 143

144 Έτσι, σε γενικές γραµµές οι αποδόσεις όλων των σχηµάτων είναι µεγαλύτερες σε χαµηλούς βαθµούς συµπίεσης στην αποδόµηση 1 ου επιπέδου, ενώ όσο αυξάνεται ο βαθµός συµπίεσης οι αποδόσεις για τις αποδοµήσεις και των δύο επιπέδων τείνουν να εξισωθούν, συχνά µε ένα µικρό προβάδισµα στην αποδόµηση 1 ου επιπέδου. Αυτό το γεγονός συνδυαζόµενο µε την επιβάρυνση όσον αφορά την υπολογιστική πολυπλοκότητα που συνεπάγεται η αποδόµηση υψηλότερου επιπέδου καθιστούν την αποδόµηση 1 ου επιπέδου µονόδροµο όσον αφορά τις εφαρµογές συµπίεσης όπου το ζητούµενο είναι η διατήρηση καλής σχετικά ποιότητας. Αξίζει εδώ να σηµειωθεί πως οι εξαιρετικά απότοµες (σχετικά µιλώντας πάντοτε) µεταπτώσεις στην αποδόµηση επιπέδου δύο, µπορεί να οφείλονται στο γεγονός ότι µπορεί ανάλογα µε το βαθµό συµπίεσης να θολώνει σε πολύ µεγάλο βαθµό η εικόνα, να εξαφανίζονται διάφορα δοµικά της στοιχεία ή και να εµφανίζονται νέα µε τη µορφή artifacts. Ολοκληρώνοντας το σχολιασµό των αποτελεσµάτων, όσον αφορά το σχήµα ανάλυσης που υπερισχύει, αυτό είναι αναµφισβήτητα το σχήµα αποδόµησης σε πολλαπλές κλίµακες µε τη χρήση της leveling πυραµίδας, το οποίο παρέχει τα καλύτερα αποτελέσµατα µε κέρδος στο PSNR από 0,2 ως και 5 db σε σχέση µε το αµέσως επόµενο στην απόδοση σχήµα, που είναι αυτό που βασίζεται στη Gaussian πυραµίδα. Μάλιστα, στις µετρήσεις που λήφθηκαν παρατηρείται το φαινόµενο η διαφορά αυτή στην απόδοση να παραµένει γενικά σταθερή ανάµεσα στις δύο µεθόδους, για συγκεκριµένη εικόνα ελέγχου και επίπεδο αποδόµησης. Αυτή η παρατήρηση θα µπορούσε ίσως να εξηγηθεί αν ο αναγνώστης ανατρέξει στην παράγραφο 3.6.5, όπου παρουσιάζεται η υλοποίηση της leveling πυραµίδας στα πλαίσια της διπλωµατικής εργασίας. Η leveling πυραµίδα χρησιµοποιεί ως reference τα αποτελέσµατα της Gaussian πυραµίδας, την οποία και προσπαθεί να προσεγγίσει µε τη βοήθεια µιας αυθαίρετα αλλά όχι τυχαία επιλεγµένης εικόνας marker. υστυχώς, αυτή η προσέγγιση στο ζήτηµα της βελτίωσης της απόδοσης του JPEG, παρουσιάζει και τη µεγαλύτερη υπολογιστική πολυπλοκότητα. Ωστόσο, σύµφωνα µε το όλο πνεύµα της διπλωµατικής εργασίας, αυτό δε µπορεί να θεωρηθεί ως πρόβληµα εφόσον η όλη απόπειρα είχε καθαρά διερευνητικό χαρακτήρα. 5.2 Εφαρµογή σε συµπίεση VLBR και XLBR Τα σχήµατα ανάλυσης σε πολλαπλές κλίµακες που αξιολογήθηκαν προηγούµενα, θα µπορούσαν να χρησιµοποιηθούν σε εφαρµογές που απαιτούν πολύ υψηλό βαθµό συµπίεσης, όπου η απλή εφαρµογή του JPEG δε θα µπορούσε να ανταποκριθεί. 144

145 Με διάθεση εντελώς αναγνωριστική, µετά το πέρας των µετρήσεων της εργασίας έγινε µία δοκιµή για αποδόµηση και ανακατασκευή επιπέδων τρία και τέσσερα µε τη βοήθεια της 2 ης εικόνας του σετ ελέγχου και του σχήµατος ανάλυσης σε πολλαπλές κλίµακες µε χρήση της leveling πυραµίδας, η οποία όπως προκύπτει από την προηγούµενη παράγραφο παρουσιάζει σε γενικές γραµµές τις καλύτερες αποδόσεις. Προέκυψαν λοιπόν τα ακόλουθα αποτελέσµατα: Εικόνα 5-1 L3 ανακατασκευή µε Leveling πυραµίδα, CR 203, PSNR= db 145

146 Εικόνα 5-2 L3 ανακατασκευή µε Leveling πυραµίδα, CR 409, PSNR=+39.09dB Εικόνα 5-3 L4 ανακατασκευή µε Leveling πυραµίδα, CR 439, PSNR= db 146

Περιεχόµενα. ΕΠΛ 422: Συστήµατα Πολυµέσων. Βιβλιογραφία. Εισαγωγή. Συµπίεση εικόνων: Το πρότυπο JPEG. Εισαγωγή. Ευθύς µετασχηµατισµός DCT

Περιεχόµενα. ΕΠΛ 422: Συστήµατα Πολυµέσων. Βιβλιογραφία. Εισαγωγή. Συµπίεση εικόνων: Το πρότυπο JPEG. Εισαγωγή. Ευθύς µετασχηµατισµός DCT Περιεχόµενα ΕΠΛ : Συστήµατα Πολυµέσων Συµπίεση εικόνων: Το πρότυπο JPEG Εισαγωγή Ο µετασχηµατισµός DCT Το πρότυπο JPEG Προετοιµασία εικόνας / µπλοκ Ευθύς µετασχηµατισµός DCT Κβαντισµός Κωδικοποίηση ηµιουργία

Διαβάστε περισσότερα

ΒΕΣ 04: Συµπίεση και Μετάδοση Πολυµέσων. Περιεχόµενα. Βιβλιογραφία. Συµπίεση εικόνων: Το πρότυπο JPEG. Εισαγωγή. Ευθύς µετασχηµατισµός DCT

ΒΕΣ 04: Συµπίεση και Μετάδοση Πολυµέσων. Περιεχόµενα. Βιβλιογραφία. Συµπίεση εικόνων: Το πρότυπο JPEG. Εισαγωγή. Ευθύς µετασχηµατισµός DCT ΒΕΣ : Συµπίεση και Μετάδοση Πολυµέσων Συµπίεση εικόνων: Το πρότυπο JPEG Περιεχόµενα Εισαγωγή Ο µετασχηµατισµός DCT Το πρότυπο JPEG Προετοιµασία εικόνας / µπλοκ Ευθύς µετασχηµατισµός DCT Κβαντισµός Κωδικοποίηση

Διαβάστε περισσότερα

Συµπίεση Εικόνας: Το πρότυπο JPEG

Συµπίεση Εικόνας: Το πρότυπο JPEG ΒΕΣ : Συµπίεση και Μετάδοση Πολυµέσων ΒΕΣ Συµπίεση και Μετάδοση Πολυµέσων Συµπίεση Εικόνας: Το πρότυπο JPEG ΒΕΣ : Συµπίεση και Μετάδοση Πολυµέσων Εισαγωγή Σχεδιάστηκε από την οµάδα Joint Photographic Experts

Διαβάστε περισσότερα

Κωδικοποίηση εικόνων κατά JPEG

Κωδικοποίηση εικόνων κατά JPEG Κωδικοποίηση εικόνων κατά JPEG Εισαγωγή Προετοιµασία της εικόνας ρυθµός Ακολουθιακός απωλεστικός ρυθµός Εκτεταµένος απωλεστικός ρυθµός Μη απωλεστικός ρυθµός Ιεραρχικός ρυθµός Τεχνολογία Πολυµέσων 09-1

Διαβάστε περισσότερα

Συµπίεση Ψηφιακών Εικόνων: Συµπίεση µε Απώλειες. Πρότυπα Συµπίεσης Εικόνων

Συµπίεση Ψηφιακών Εικόνων: Συµπίεση µε Απώλειες. Πρότυπα Συµπίεσης Εικόνων ΤΨΣ 5: Ψηφιακή Επεξεργασία Εικόνας ΤΨΣ 5 Ψηφιακή Επεξεργασία Εικόνας Συµπίεση Ψηφιακών Εικόνων: Συµπίεση µε απώλειες Πρότυπα Συµπίεσης Εικόνων Τµήµα ιδακτικής της Τεχνολογίας και Ψηφιακών Συστηµάτων Πανεπιστήµιο

Διαβάστε περισσότερα

Τεχνολογία Πολυμέσων. Ενότητα # 11: Κωδικοποίηση εικόνων: JPEG Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής

Τεχνολογία Πολυμέσων. Ενότητα # 11: Κωδικοποίηση εικόνων: JPEG Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής Τεχνολογία Πολυμέσων Ενότητα # 11: Κωδικοποίηση εικόνων: JPEG Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής Χρηματοδότηση Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου

Διαβάστε περισσότερα

Συμπίεση Δεδομένων

Συμπίεση Δεδομένων Συμπίεση Δεδομένων 2013-2014 JPEG 2000 Δρ. Ν. Π. Σγούρος 2 JPEG 2000 Βασικά χαρακτηριστικά Επιτρέπει συμπίεση σε εξαιρετικά χαμηλούς ρυθμούς όπου η συμπίεση με το JPEG εισάγει μεγάλες παραμορφώσεις Ενσωμάτωση

Διαβάστε περισσότερα

Επεξεργασία Χαρτογραφικής Εικόνας

Επεξεργασία Χαρτογραφικής Εικόνας Επεξεργασία Χαρτογραφικής Εικόνας ιδάσκων: Αναγνωστόπουλος Χρήστος Αρχές συµπίεσης δεδοµένων Ήδη συµπίεσης Συµπίεση εικόνων Αλγόριθµος JPEG Γιατί χρειαζόµαστε συµπίεση; Τα σηµερινά αποθηκευτικά µέσα αδυνατούν

Διαβάστε περισσότερα

Group (JPEG) το 1992.

Group (JPEG) το 1992. Μέθοδοι Συμπίεσης Εικόνας Πρωτόκολλο JPEG Συμπίεση Εικόνας: Μείωση αποθηκευτικού χώρου Ευκολία στη μεταφορά αρχείων Δημιουργήθηκε από την ομάδα Joint Photographic Experts Group (JPEG) το 1992. Ονομάστηκε

Διαβάστε περισσότερα

χωρίςναδηµιουργείταιαίσθησηαπώλειαςτηςποιότηταςτηςανακατασκευασµένηςεικόνας.

χωρίςναδηµιουργείταιαίσθησηαπώλειαςτηςποιότηταςτηςανακατασκευασµένηςεικόνας. Το πρότυπο JPEG για κωδικοποίησηση εικόνας Το JPEG, που υιοθετήθηκε από την Joint Photographic Experts Group, είναι ένα πρότυπο που χρησιµοποιείταιευρέωςγιατησυµπίεσηακίνητωνεικόνων, µε µέσο λόγο συµπίεσης

Διαβάστε περισσότερα

Συστήματα Πολυμέσων. Ενότητα 7: Συμπίεση Εικόνας κατά JPEG. Θρασύβουλος Γ. Τσιάτσος Τμήμα Πληροφορικής ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

Συστήματα Πολυμέσων. Ενότητα 7: Συμπίεση Εικόνας κατά JPEG. Θρασύβουλος Γ. Τσιάτσος Τμήμα Πληροφορικής ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΧΤΑ ΑΚΑΔΗΜΑΙΚΑ ΜΑΘΗΜΑΤΑ Ενότητα 7: Συμπίεση Εικόνας κατά JPEG Θρασύβουλος Γ. Τσιάτσος Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative

Διαβάστε περισσότερα

Συμπίεση Πολυμεσικών Δεδομένων

Συμπίεση Πολυμεσικών Δεδομένων Συμπίεση Πολυμεσικών Δεδομένων Εισαγωγή στο πρόβλημα και επιλεγμένες εφαρμογές Παράδειγμα 2: Συμπίεση Εικόνας ΔΠΜΣ ΜΥΑ, Ιούνιος 2011 Εισαγωγή (1) Οι τεχνικές συμπίεσης βασίζονται στην απόρριψη της πλεονάζουσας

Διαβάστε περισσότερα

DIP_06 Συμπίεση εικόνας - JPEG. ΤΕΙ Κρήτης

DIP_06 Συμπίεση εικόνας - JPEG. ΤΕΙ Κρήτης DIP_06 Συμπίεση εικόνας - JPEG ΤΕΙ Κρήτης Συμπίεση εικόνας Το μέγεθος μιας εικόνας είναι πολύ μεγάλο π.χ. Εικόνα μεγέθους Α4 δημιουργημένη από ένα σαρωτή με 300 pixels ανά ίντσα και με χρήση του RGB μοντέλου

Διαβάστε περισσότερα

Ψηφιακή Επεξεργασία και Ανάλυση Εικόνας Ενότητα 6 η : Συμπίεση Εικόνας. Καθ. Κωνσταντίνος Μπερμπερίδης Πολυτεχνική Σχολή Μηχανικών Η/Υ & Πληροφορικής

Ψηφιακή Επεξεργασία και Ανάλυση Εικόνας Ενότητα 6 η : Συμπίεση Εικόνας. Καθ. Κωνσταντίνος Μπερμπερίδης Πολυτεχνική Σχολή Μηχανικών Η/Υ & Πληροφορικής Ψηφιακή Επεξεργασία και Ανάλυση Εικόνας Ενότητα 6 η : Συμπίεση Εικόνας Καθ. Κωνσταντίνος Μπερμπερίδης Πολυτεχνική Σχολή Μηχανικών Η/Υ & Πληροφορικής Σκοποί ενότητας Εισαγωγή στη συμπίεση εικόνας Μη απωλεστικες

Διαβάστε περισσότερα

Μάθημα 7 ο. Συμπίεση Εικόνας ΤΜΗΥΠ / ΕΕΣΤ 1

Μάθημα 7 ο. Συμπίεση Εικόνας ΤΜΗΥΠ / ΕΕΣΤ 1 Μάθημα 7 ο Συμπίεση Εικόνας ΤΜΗΥΠ / ΕΕΣΤ 1 Εισαγωγή (1) Οι τεχνικές συμπίεσης βασίζονται στην απόρριψη της πλεονάζουσας πληροφορίας Ανάγκες που καλύπτονται Εξοικονόμηση μνήμης Ελάττωση χρόνου και εύρους

Διαβάστε περισσότερα

Συστήματα Πολυμέσων. Ενότητα 3: Εισαγωγικά θέματα Συμπίεσης. Θρασύβουλος Γ. Τσιάτσος Τμήμα Πληροφορικής ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

Συστήματα Πολυμέσων. Ενότητα 3: Εισαγωγικά θέματα Συμπίεσης. Θρασύβουλος Γ. Τσιάτσος Τμήμα Πληροφορικής ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΧΤΑ ΑΚΑΔΗΜΑΙΚΑ ΜΑΘΗΜΑΤΑ Ενότητα 3: Εισαγωγικά θέματα Συμπίεσης Θρασύβουλος Γ. Τσιάτσος Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative

Διαβάστε περισσότερα

Τεράστιες ανάγκες σε αποθηκευτικό χώρο

Τεράστιες ανάγκες σε αποθηκευτικό χώρο ΣΥΜΠΙΕΣΗ Τεράστιες ανάγκες σε αποθηκευτικό χώρο Παράδειγμα: CD-ROM έχει χωρητικότητα 650MB, χωρά 75 λεπτά ασυμπίεστου στερεοφωνικού ήχου, αλλά 30 sec ασυμπίεστου βίντεο. Μαγνητικοί δίσκοι χωρητικότητας

Διαβάστε περισσότερα

3. ΤΕΧΝΙΚΕΣ ΣΥΜΠΙΕΣΗΣ ΠΟΛΥΜΕΣΩΝ

3. ΤΕΧΝΙΚΕΣ ΣΥΜΠΙΕΣΗΣ ΠΟΛΥΜΕΣΩΝ 3. ΤΕΧΝΙΚΕΣ ΣΥΜΠΙΕΣΗΣ ΠΟΛΥΜΕΣΩΝ ΑΝΑΓΚΗ ΣΥΜΠΙΕΣΗΣ ΔΕΔΟΜΕΝΩΝ Local Multimedia Π.χ. Μία ταινία 90 min απαιτεί 120 GB, και τα σημερινά μέσα αποθήκευσης < 25 GB. Άρα σήμερα είναι αδύνατη η αποθήκευση και η

Διαβάστε περισσότερα

Ψηφιακή Επεξεργασία Εικόνας

Ψηφιακή Επεξεργασία Εικόνας ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Ανώτατο Εκπαιδευτικό Ίδρυμα Πειραιά Τεχνολογικού Τομέα Ψηφιακή Επεξεργασία Εικόνας Ενότητα 6 : Κωδικοποίηση & Συμπίεση εικόνας Ιωάννης Έλληνας Τμήμα Η/ΥΣ Άδειες Χρήσης Το παρόν εκπαιδευτικό

Διαβάστε περισσότερα

Συστήµατα και Αλγόριθµοι Πολυµέσων

Συστήµατα και Αλγόριθµοι Πολυµέσων Συστήµατα και Αλγόριθµοι Πολυµέσων Ιωάννης Χαρ. Κατσαβουνίδης Οµιλία #5: Αρχές Επεξεργασίας Σηµάτων Πολυµέσων 7 Νοεµβρίου 2005 Επανάληψη Θεωρία Πληροφορίας Εντροπία: H ( P) i= 0 Κωδικοποίηση Huffman 3

Διαβάστε περισσότερα

Μετάδοση Πολυμεσικών Υπηρεσιών Ψηφιακή Τηλεόραση

Μετάδοση Πολυμεσικών Υπηρεσιών Ψηφιακή Τηλεόραση Χειμερινό Εξάμηνο 2013-2014 Μετάδοση Πολυμεσικών Υπηρεσιών Ψηφιακή Τηλεόραση 5 η Παρουσίαση : Ψηφιακή Επεξεργασία Εικόνας Διδάσκων: Γιάννης Ντόκας Σύνθεση Χρωμάτων Αφαιρετική Παραγωγή Χρώματος Χρωματικά

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ,

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ, ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ, ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΕΠΛ 4: ΣΥΣΤΗΜΑΤΑ ΠΟΛΥΜΕΣΩΝ Ακαδηµαϊκό Έτος 004 005, Χειµερινό Εξάµηνο Καθ.: Νίκος Τσαπατσούλης ΤΕΛΙΚΗ ΕΞΕΤΑΣΗ Η εξέταση αποτελείται από δύο µέρη. Το πρώτο περιλαµβάνει

Διαβάστε περισσότερα

Κωδικοποίηση βίντεο (H.261 / DVI)

Κωδικοποίηση βίντεο (H.261 / DVI) Κωδικοποίηση βίντεο (H.261 / DVI) Αρχές κωδικοποίησης βίντεο Εισαγωγή στο H.261 Κωδικοποίηση βίντεο Ροή δεδοµένων Εισαγωγή στο DVI Κωδικοποίηση ήχου και εικόνων Κωδικοποίηση βίντεο Ροή δεδοµένων Τεχνολογία

Διαβάστε περισσότερα

Αρχές κωδικοποίησης. Τεχνολογία Πολυµέσων 08-1

Αρχές κωδικοποίησης. Τεχνολογία Πολυµέσων 08-1 Αρχές κωδικοποίησης Απαιτήσεις κωδικοποίησης Είδη κωδικοποίησης Βασικές τεχνικές κωδικοποίησης Κωδικοποίηση Huffman Κωδικοποίηση µετασχηµατισµών Κβαντοποίηση διανυσµάτων ιαφορική κωδικοποίηση Τεχνολογία

Διαβάστε περισσότερα

Πολυμέσα. Συμπίεση δεδομένων Κωδικοποίηση JPEG. Δρ. Γεώργιος Π. Παυλίδης ΔΗΜΟΚΡΙΤΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΡΑΚΗΣ

Πολυμέσα. Συμπίεση δεδομένων Κωδικοποίηση JPEG. Δρ. Γεώργιος Π. Παυλίδης ΔΗΜΟΚΡΙΤΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΡΑΚΗΣ Πολυμέσα Συμπίεση δεδομένων Δρ. Γεώργιος Π. Παυλίδης Συμπίεση Δεδομένων Περιεχόμενα Γνωστοίαλγόριθμοισυμπίεσης JPEG, Οικογένεια H.26x, H.32x Χρησιμοποίηση Εφαρμογές Εκμάθηση Σχεδίαση Διασύνδεση χρήστη

Διαβάστε περισσότερα

Ψηφιακή Επεξεργασία και Ανάλυση Εικόνας. Παρουσίαση Νο. 1. Εισαγωγή

Ψηφιακή Επεξεργασία και Ανάλυση Εικόνας. Παρουσίαση Νο. 1. Εισαγωγή Ψηφιακή Επεξεργασία και Ανάλυση Εικόνας Ακαδημαϊκό Έτος 2015-16 Παρουσίαση Νο. 1 Εισαγωγή Τι είναι η εικόνα; Οτιδήποτε μπορούμε να δούμε ή να απεικονίσουμε Π.χ. Μια εικόνα τοπίου αλλά και η απεικόνιση

Διαβάστε περισσότερα

Συµπίεση Δεδοµένων: Συµπίεση Ψηφιακού Βίντεο

Συµπίεση Δεδοµένων: Συµπίεση Ψηφιακού Βίντεο Συµπίεση Δεδοµένων: Συµπίεση Ψηφιακού Βίντεο Αλέξανδρος Ελευθεριάδης Αναπ. Καθηγητής & Marie Curie Chair Τµήµα Πληροφορικής και Τηλεπικοινωνιών Εθνικό και Καποδιστριακό Πανεπιστήµιο Αθηνών eleft@di.uoa.gr,

Διαβάστε περισσότερα

Συστήµατα και Αλγόριθµοι Πολυµέσων

Συστήµατα και Αλγόριθµοι Πολυµέσων Συστήµατα και Αλγόριθµοι Πολυµέσων Ιωάννης Χαρ. Κατσαβουνίδης Οµιλία #3: Αρχές Επεξεργασίας Σηµάτων Πολυµέσων 10 Οκτωβρίου 005 Επανάλειψη (1) ειγµατοληψία επανα-δειγµατοληψία Τεχνικές φίλτρων (συνέλειξη)

Διαβάστε περισσότερα

19/3/2007 Πολυµέσα και Συµπίεση εδοµένων

19/3/2007 Πολυµέσα και Συµπίεση εδοµένων ΓΤΠ 61 Ηλεκτρονικοί Υπολογιστές στις Γραφικές Τέχνες Πολυµέσα και Συµπίεση εδοµένων Εισαγωγή Βασικές Έννοιες Ταξινόµηση Τεχνικών Συµπίεσης Συµπίεση Κειµένου Συµπίεση Εικόνας Συµπίεση Ήχου Συµπίεση Video

Διαβάστε περισσότερα

DIP_01 Εισαγωγήστην ψηφιακήεικόνα. ΤΕΙ Κρήτης

DIP_01 Εισαγωγήστην ψηφιακήεικόνα. ΤΕΙ Κρήτης DIP_01 Εισαγωγήστην ψηφιακήεικόνα ΤΕΙ Κρήτης Ψηφιακήεικόνα Ψηφιακή εικόνα = αναλογική εικόνα µετά από δειγµατοληψία στο χώρο (x και y διευθύνσεις) Αναπαριστάνεται από έναν ή περισσότερους 2 πίνακες Μπορεί

Διαβάστε περισσότερα

Συστήματα Πολυμέσων. Ενότητα 8: Συμπίεση Εικόνας κατά JPEG Θρασύβουλος Γ. Τσιάτσος Τμήμα Πληροφορικής ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

Συστήματα Πολυμέσων. Ενότητα 8: Συμπίεση Εικόνας κατά JPEG Θρασύβουλος Γ. Τσιάτσος Τμήμα Πληροφορικής ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΧΤΑ ΑΚΑΔΗΜΑΙΚΑ ΜΑΘΗΜΑΤΑ Ενότητα 8: Συμπίεση Εικόνας κατά JPEG 2000 Θρασύβουλος Γ. Τσιάτσος Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης

Διαβάστε περισσότερα

Τμήμα Επιστήμης Υπολογιστών ΗΥ-474. Ψηφιακή Εικόνα. Χωρική ανάλυση Αρχεία εικόνων

Τμήμα Επιστήμης Υπολογιστών ΗΥ-474. Ψηφιακή Εικόνα. Χωρική ανάλυση Αρχεία εικόνων Ψηφιακή Εικόνα Χωρική ανάλυση Αρχεία εικόνων Ψηφιοποίηση εικόνων Δειγματοληψία περιοδική, ορθογώνια (pixel = picture element) πυκνότητα ανάλογα με τη λεπτομέρεια (ppi) Κβαντισμός τιμών διακριτές τιμές,

Διαβάστε περισσότερα

DIP_01 Εισαγωγή στην ψηφιακή εικόνα. ΤΕΙ Κρήτης

DIP_01 Εισαγωγή στην ψηφιακή εικόνα. ΤΕΙ Κρήτης DIP_01 Εισαγωγή στην ψηφιακή εικόνα ΤΕΙ Κρήτης Πληροφορίες Μαθήματος ιαλέξεις Πέμπτη 12:15 15:00 Αιθουσα Γ7 ιδάσκων:. Κοσμόπουλος Γραφείο: Κ23-0-15 (ισόγειο( κλειστού γυμναστηρίου) Ωρες γραφείου Τε 16:00

Διαβάστε περισσότερα

ΒΕΣ 04: Συµπίεση και Μετάδοση Πολυµέσων. Περιεχόµενα. Βιβλιογραφία. Εικόνες και Πολυµεσικές Εφαρµογές. Ψηφιακή Επεξεργασία Εικόνας.

ΒΕΣ 04: Συµπίεση και Μετάδοση Πολυµέσων. Περιεχόµενα. Βιβλιογραφία. Εικόνες και Πολυµεσικές Εφαρµογές. Ψηφιακή Επεξεργασία Εικόνας. ΒΕΣ 04: Συµπίεση και Μετάδοση Πολυµέσων Εικόνα και Πολυµεσικές Εφαρµογές Περιεχόµενα Ψηφιακή Επεξεργασία Εικόνας Σηµειακές µέθοδοι Φίλτρα γειτνίασης Γεωµετρικές µέθοδοι Εικόνες και Πολυµεσικές Εφαρµογές

Διαβάστε περισσότερα

Εφαρμογές Πληροφορικής

Εφαρμογές Πληροφορικής Εφαρμογές Πληροφορικής Κεφάλαιο 11 Πολυμέσα ΜΕΡΟΣ Α 1. Υπερκείμενο Ποιός είναι ο κόμβος, ποιός ο σύνδεσμος και ποιά η θερμή λέξη; 1 2. Υπερμέσα Χαρακτηριστικά Κόμβος (Node) Αποτελεί τη βάση πληροφοριών

Διαβάστε περισσότερα

Αρχές κωδικοποίησης. Τεχνολογία Πολυμέσων και Πολυμεσικές Επικοινωνίες 08-1

Αρχές κωδικοποίησης. Τεχνολογία Πολυμέσων και Πολυμεσικές Επικοινωνίες 08-1 Αρχές κωδικοποίησης Απαιτήσεις κωδικοποίησης Είδη κωδικοποίησης Κωδικοποίηση εντροπίας Διαφορική κωδικοποίηση Κωδικοποίηση μετασχηματισμών Στρωματοποιημένη κωδικοποίηση Κβαντοποίηση διανυσμάτων Τεχνολογία

Διαβάστε περισσότερα

Συστήματα Επικοινωνιών ΙI

Συστήματα Επικοινωνιών ΙI + Διδάσκων: Δρ. Κ. Δεμέστιχας e-mail: cdemestichas@uowm.gr Συστήματα Επικοινωνιών ΙI Διαφορική Παλμοκωδική Διαμόρφωση + Ιστοσελίδα nιστοσελίδα του μαθήματος: n https://eclass.uowm.gr/courses/icte302/ +

Διαβάστε περισσότερα

Τι είναι το JPEG2000?

Τι είναι το JPEG2000? JPEG 2000 Τι είναι το JPEG2000? Νέο εξελιγµένο σχήµα συµπίεσης για ακίνητη εικόνα Αναπτύχθηκε από: ISO (International Standardization Organization) και IEC (International Electrotechnical Committee) Καθιερώθηκε

Διαβάστε περισσότερα

Ακαδηµαϊκό Έτος , Χειµερινό Εξάµηνο ιδάσκων Καθ.: Νίκος Τσαπατσούλης

Ακαδηµαϊκό Έτος , Χειµερινό Εξάµηνο ιδάσκων Καθ.: Νίκος Τσαπατσούλης ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΙΡΑΙΩΣ, ΤΜΗΜΑ Ι ΑΚΤΙΚΗΣ ΤΗΣ ΤΕΧΝΟΛΟΓΙΑΣ ΚΑΙ ΨΗΦΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ ΤΨΣ 50: ΨΗΦΙΑΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΕΙΚΟΝΑΣ Ακαδηµαϊκό Έτος 005 006, Χειµερινό Εξάµηνο Καθ.: Νίκος Τσαπατσούλης ΤΕΛΙΚΗ ΕΞΕΤΑΣΗ Η εξέταση

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ, ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ, ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ, ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΕΠΛ 4: ΣΥΣΤΗΜΑΤΑ ΠΟΛΥΜΕΣΩΝ Θεωρητικές Ασκήσεις (# ): ειγµατοληψία, κβαντοποίηση και συµπίεση σηµάτων. Στην τηλεφωνία θεωρείται ότι το ουσιαστικό περιεχόµενο της

Διαβάστε περισσότερα

Συμπίεση Δεδομένων

Συμπίεση Δεδομένων Συμπίεση Δεδομένων 2014-2015 Στοιχεία Επεξεργασίας Σήματος Δρ. Ν. Π. Σγούρος 2 Εργοδικές Διαδικασίες Η μέση τιμή διαφόρων στιγμιότυπων της διαδικασίας (στατιστική μέση τιμή) ταυτίζεται με τη χρονική μέση

Διαβάστε περισσότερα

Συστήματα Επικοινωνιών

Συστήματα Επικοινωνιών Συστήματα Επικοινωνιών Ενότητα 9: Παλμοκωδική Διαμόρφωση (PCM) Μιχαήλ Λογοθέτης Πολυτεχνική Σχολή Τμήμα Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών Σκοποί ενότητας Περιγραφή της μεθόδου παλμοκωδικής

Διαβάστε περισσότερα

ΕΙΔΗ ΠΛΑΙΣΙΩΝ Ενδο-πλαισιακή κωδικοποίηση (Intra- frame Coding): Δια-πλαισιακή κωδικοποίηση (Inter-frame Coding):

ΕΙΔΗ ΠΛΑΙΣΙΩΝ Ενδο-πλαισιακή κωδικοποίηση (Intra- frame Coding): Δια-πλαισιακή κωδικοποίηση (Inter-frame Coding): ΕΙΔΗ ΠΛΑΙΣΙΩΝ Ενδο-πλαισιακή κωδικοποίηση (Intraframe Coding): κάθε εικόνα αντιμετωπίζεται και κωδικοποιείται ανεξάρτητα από τις υπόλοιπες (όπως στο JPEG) Δια-πλαισιακή κωδικοποίηση (Inter-frame Coding):

Διαβάστε περισσότερα

Θέματα Συστημάτων Πολυμέσων. Ενότητα # 7: JPEG Διδάσκων: Γεώργιος Πολύζος Τμήμα: Μεταπτυχιακό Πρόγραμμα Σπουδών Επιστήμη των Υπολογιστών

Θέματα Συστημάτων Πολυμέσων. Ενότητα # 7: JPEG Διδάσκων: Γεώργιος Πολύζος Τμήμα: Μεταπτυχιακό Πρόγραμμα Σπουδών Επιστήμη των Υπολογιστών Θέματα Συστημάτων Πολυμέσων Ενότητα # 7: JPEG Διδάσκων: Γεώργιος Πολύζος Τμήμα: Μεταπτυχιακό Πρόγραμμα Σπουδών Επιστήμη των Υπολογιστών Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης

Διαβάστε περισσότερα

ΕΡΕΥΝΗΤΙΚΑ ΠΡΟΓΡΑΜΜΑΤΑ ΑΡΧΙΜΗΔΗΣ ΕΝΙΣΧΥΣΗ ΕΡΕΥΝΗΤΙΚΩΝ ΟΜΑΔΩΝ ΣΤΟ ΤΕΙ ΣΕΡΡΩΝ. Ενέργεια. 2.2.3.στ ΘΕΜΑ ΕΡΕΥΝΑΣ: ΔΙΑΡΘΡΩΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΕΧΡΩΜΩΝ ΕΓΓΡΑΦΩΝ

ΕΡΕΥΝΗΤΙΚΑ ΠΡΟΓΡΑΜΜΑΤΑ ΑΡΧΙΜΗΔΗΣ ΕΝΙΣΧΥΣΗ ΕΡΕΥΝΗΤΙΚΩΝ ΟΜΑΔΩΝ ΣΤΟ ΤΕΙ ΣΕΡΡΩΝ. Ενέργεια. 2.2.3.στ ΘΕΜΑ ΕΡΕΥΝΑΣ: ΔΙΑΡΘΡΩΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΕΧΡΩΜΩΝ ΕΓΓΡΑΦΩΝ ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ (Τ.Ε.Ι.) ΣΕΡΡΩΝ Τμήμα ΠΛΗΡΟΦΟΡΙΚΗΣ & ΕΠΙΚΟΙΝΩΝΙΩΝ ΕΡΕΥΝΗΤΙΚΑ ΠΡΟΓΡΑΜΜΑΤΑ ΑΡΧΙΜΗΔΗΣ ΕΝΙΣΧΥΣΗ ΕΡΕΥΝΗΤΙΚΩΝ ΟΜΑΔΩΝ ΣΤΟ ΤΕΙ ΣΕΡΡΩΝ Ενέργεια. 2.2.3.στ ΘΕΜΑ ΕΡΕΥΝΑΣ: ΔΙΑΡΘΡΩΣΗ

Διαβάστε περισσότερα

Επεξεργασία Πολυµέσων. Δρ. Μαρία Κοζύρη Π.Μ.Σ. «Εφαρµοσµένη Πληροφορική» Τµήµα Ηλεκτρολόγων Μηχανικών & Μηχανικών Υπολογιστών Πανεπιστήµιο Θεσσαλίας

Επεξεργασία Πολυµέσων. Δρ. Μαρία Κοζύρη Π.Μ.Σ. «Εφαρµοσµένη Πληροφορική» Τµήµα Ηλεκτρολόγων Μηχανικών & Μηχανικών Υπολογιστών Πανεπιστήµιο Θεσσαλίας Π.Μ.Σ. «Εφαρµοσµένη Πληροφορική» Τµήµα Ηλεκτρολόγων Μηχανικών & Μηχανικών Υπολογιστών Πανεπιστήµιο Θεσσαλίας Ενότητα 4: Συµπίεση Εικόνας 2 Συµπίεση Εικόνας Μείωση Πλεονασµού: Το σήµα εικόνας παρουσιάζει

Διαβάστε περισσότερα

Δ10. Συμπίεση Δεδομένων

Δ10. Συμπίεση Δεδομένων Συμπίεση Δεδομένων 203-204 Κωδικοποίηση εικονοροής (Video) Δρ. Ν. Π. Σγούρος 2 Ανάλυση Οθονών Δρ. Ν. Π. Σγούρος 3 Πρωτόκολλα μετάδοσης εικονοροών Πρωτόκολλο Ρυθμός (Hz) Φίλμ 23.976 ATSC 24 PAL,DVB-SD,DVB-HD

Διαβάστε περισσότερα

Ανάκτηση πολυμεσικού περιεχομένου

Ανάκτηση πολυμεσικού περιεχομένου Ανάκτηση πολυμεσικού περιεχομένου Ανίχνευση / αναγνώριση προσώπων Ανίχνευση / ανάγνωση κειμένου Ανίχνευση αντικειμένων Οπτικές λέξεις Δεικτοδότηση Σχέσεις ομοιότητας Κατηγοριοποίηση ειδών μουσικής Διάκριση

Διαβάστε περισσότερα

Η κωδικοποίηση των συντελεστών DC

Η κωδικοποίηση των συντελεστών DC Η κωδικοποίηση των συντελεστών DC Γιακάθευποπίνακαηδιαφορά, d,του DC συντελεστήτουαπότοσυντελεστή DC τουπροηγούµενουυποπίνακαοδηγούνταιστονκωδικοποιητήεντροπίας (variable length coding VLC). Στονκωδικοποιητήηδιαφοράκατατάσσεταιανάλογαµετοµέγεθόςτηςστοακόλουθοπίνακα,

Διαβάστε περισσότερα

DIP_06 Συµπίεσηεικόνας - JPEG. ΤΕΙ Κρήτης

DIP_06 Συµπίεσηεικόνας - JPEG. ΤΕΙ Κρήτης DIP_06 Συµπίεσηεικόνας - JPEG ΤΕΙ Κρήτης Συµπίεσηεικόνας Το µέγεθος µιας εικόνας είναι πολύ µεγάλο π.χ. ΕικόναµεγέθουςΑ4 δηµιουργηµένηαπόένασαρωτήµε 300 pixels ανά ίντσα και µε χρήση του RGB µοντέλου (24

Διαβάστε περισσότερα

Τεχνολογία Πολυμέσων. Ενότητα # 8: Αρχές κωδικοποίησης Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής

Τεχνολογία Πολυμέσων. Ενότητα # 8: Αρχές κωδικοποίησης Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής Τεχνολογία Πολυμέσων Ενότητα # 8: Αρχές κωδικοποίησης Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής Χρηματοδότηση Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του

Διαβάστε περισσότερα

Ψηφιακή Επεξεργασία και Ανάλυση Εικόνας Ενότητα 1 η : Εισαγωγή. Καθ. Κωνσταντίνος Μπερμπερίδης Πολυτεχνική Σχολή Μηχανικών Η/Υ & Πληροφορικής

Ψηφιακή Επεξεργασία και Ανάλυση Εικόνας Ενότητα 1 η : Εισαγωγή. Καθ. Κωνσταντίνος Μπερμπερίδης Πολυτεχνική Σχολή Μηχανικών Η/Υ & Πληροφορικής Ψηφιακή Επεξεργασία και Ανάλυση Εικόνας Ενότητα 1 η : Εισαγωγή Καθ. Κωνσταντίνος Μπερμπερίδης Πολυτεχνική Σχολή Μηχανικών Η/Υ & Πληροφορικής Σκοποί ενότητας Βασικά στοιχεία της ψηφιακής επεξεργασίας και

Διαβάστε περισσότερα

Συστήµατα Πολυµέσων Ενδιάµεση Εξέταση: Οκτώβριος 2004

Συστήµατα Πολυµέσων Ενδιάµεση Εξέταση: Οκτώβριος 2004 Ενδιάµεση Εξέταση: Οκτώβριος 4 ΜΕΡΟΣ Β: ΑΣΚΗΣΕΙΣ Άσκηση (25 µονάδες): Μια εικόνα αποχρώσεων του γκρι και διαστάσεων 25 x pixel έχει κωδικοποιηθεί κατά PCM µε βάθος χρώµατος 3 bits /pixel. Οι τιµές φωτεινότητας

Διαβάστε περισσότερα

Συστήματα Πολυμέσων. Ενότητα 6: Συμπίεση Ψηφιακής Εικόνας. Θρασύβουλος Γ. Τσιάτσος Τμήμα Πληροφορικής ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

Συστήματα Πολυμέσων. Ενότητα 6: Συμπίεση Ψηφιακής Εικόνας. Θρασύβουλος Γ. Τσιάτσος Τμήμα Πληροφορικής ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΧΤΑ ΑΚΑΔΗΜΑΙΚΑ ΜΑΘΗΜΑΤΑ Ενότητα 6: Συμπίεση Ψηφιακής Εικόνας Θρασύβουλος Γ. Τσιάτσος Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative

Διαβάστε περισσότερα

Ασκήσεις Επεξεργασίας Εικόνας

Ασκήσεις Επεξεργασίας Εικόνας Ασκήσεις Επεξεργασίας Εικόνας. Εύρεση στοιχείων μιας περιοχής με ιδιότητα συγκεκριμένης γειτονιάς Άσκηση. Έστω δύο υποσύνολα πίνακα εικόνας S και S2 η οποία φαίνεται στο σχήμα παρακάτω. Για σύνολο τιμών

Διαβάστε περισσότερα

ΤΕΙ ΚΡΗΤΗΣ ΤΜ. ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡ/ΚΗΣ & ΠΟΛΥΜΕΣΩΝ ΔΙΔΑΣΚΩΝ: Δρ. Γ. ΓΑΡΔΙΚΗΣ. Κωδικοποίηση εικόνας

ΤΕΙ ΚΡΗΤΗΣ ΤΜ. ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡ/ΚΗΣ & ΠΟΛΥΜΕΣΩΝ ΔΙΔΑΣΚΩΝ: Δρ. Γ. ΓΑΡΔΙΚΗΣ. Κωδικοποίηση εικόνας ΤΕΙ ΚΡΗΤΗΣ ΤΜ. ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡ/ΚΗΣ & ΠΟΛΥΜΕΣΩΝ ΔΙΔΑΣΚΩΝ: Δρ. Γ. ΓΑΡΔΙΚΗΣ 2 Κωδικοποίηση εικόνας Ακολουθία από ψηφιοποιημένα καρέ (frames) που έχουν συλληφθεί σε συγκεκριμένο ρυθμό frame rate (π.χ. 10fps,

Διαβάστε περισσότερα

Τμήμα Επιστήμης Υπολογιστών ΗΥ-474. Ψηφιακό βίντεο. Αναλογικό βίντεο / ψηφιοποίηση Διεπαφές Εκτίμηση κίνησης μπλοκ

Τμήμα Επιστήμης Υπολογιστών ΗΥ-474. Ψηφιακό βίντεο. Αναλογικό βίντεο / ψηφιοποίηση Διεπαφές Εκτίμηση κίνησης μπλοκ Ψηφιακό βίντεο Αναλογικό βίντεο / ψηφιοποίηση Διεπαφές Εκτίμηση κίνησης μπλοκ Αναλογικό βίντεο SECAM PAL NTSC Ρυθμός πλεγμάτων (Hz) 50 50 59,94 Αριθμός ενεργών γραμμών ανά καρέ 576 576 480 Σχήμα εικονοστοιχείου

Διαβάστε περισσότερα

Επεξεργασία Χαρτογραφικής Εικόνας

Επεξεργασία Χαρτογραφικής Εικόνας Επεξεργασία Χαρτογραφικής Εικόνας ιδάσκων: Αναγνωστόπουλος Χρήστος Αλγόριθµος JPEG για έγχρωµες εικόνες Είδη αρχείων εικόνων Συµπίεση video και ήχου Μπλόκ x Τιµές - 55 Αρχική πληροφορία, 54 54 75 6 7 75

Διαβάστε περισσότερα

Μεταπτυχιακό Πρόγραμμα «Γεωχωρικές Τεχνολογίες» Ψηφιακή Επεξεργασία Εικόνας. Εισηγητής Αναστάσιος Κεσίδης

Μεταπτυχιακό Πρόγραμμα «Γεωχωρικές Τεχνολογίες» Ψηφιακή Επεξεργασία Εικόνας. Εισηγητής Αναστάσιος Κεσίδης Μεταπτυχιακό Πρόγραμμα «Γεωχωρικές Τεχνολογίες» Ψηφιακή Επεξεργασία Εικόνας Εισηγητής Αναστάσιος Κεσίδης Εισαγωγή Τι είναι η εικόνα; Μια οπτική αναπαράσταση με την μορφή μιας συνάρτησης f(x, y) όπου η

Διαβάστε περισσότερα

Δομές Δεδομένων και Αλγόριθμοι

Δομές Δεδομένων και Αλγόριθμοι Δομές Δεδομένων και Αλγόριθμοι Χρήστος Γκόγκος ΤΕΙ Ηπείρου Χειμερινό Εξάμηνο 2014-2015 Παρουσίαση 20 Huffman codes 1 / 12 Κωδικοποίηση σταθερού μήκους Αν χρησιμοποιηθεί κωδικοποίηση σταθερού μήκους δηλαδή

Διαβάστε περισσότερα

Εισαγωγή στην επιστήμη των υπολογιστών. Υπολογιστές και Δεδομένα Κεφάλαιο 2ο Αναπαράσταση Δεδομένων

Εισαγωγή στην επιστήμη των υπολογιστών. Υπολογιστές και Δεδομένα Κεφάλαιο 2ο Αναπαράσταση Δεδομένων Εισαγωγή στην επιστήμη των υπολογιστών Υπολογιστές και Δεδομένα Κεφάλαιο 2ο Αναπαράσταση Δεδομένων 1 2.1 Τύποι Δεδομένων Τα δεδομένα σήμερα συναντώνται σε διάφορες μορφές, στις οποίες περιλαμβάνονται αριθμοί,

Διαβάστε περισσότερα

Συστήματα Επικοινωνιών ΙI

Συστήματα Επικοινωνιών ΙI + Διδάσκων: Δρ. Κ. Δεμέστιχας e-mail: cdemestichas@uowm.gr Συστήματα Επικοινωνιών ΙI Παλμοκωδική διαμόρφωση (PCM) I + Ιστοσελίδα nιστοσελίδα του μαθήματος: n https://eclass.uowm.gr/courses/icte302/ + Περιεχόμενα

Διαβάστε περισσότερα

Δ13b. Συμπίεση Δεδομένων

Δ13b. Συμπίεση Δεδομένων Συμπίεση Δεδομένων 2014-2015 Εκτίμηση ποιότητας Εικόνας Ι Αντικειμενική Αξιολόγηση Χρήση μετρικών εκτίμησης ποιότητας Βασίζονται στη σύγκριση μεταξύ εικονοστοιχείων αρχικής και ανασυσταμένης εικόνας Υποκειμενική

Διαβάστε περισσότερα

Ψηφιακή Επεξεργασία Εικόνας

Ψηφιακή Επεξεργασία Εικόνας ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Ανώτατο Εκπαιδευτικό Ίδρυμα Πειραιά Τεχνολογικού Τομέα Ψηφιακή Επεξεργασία Εικόνας Ενότητα 8 : Πρότυπο συμπίεσης JPEG2000 Ιωάννης Έλληνας Τμήμα Η/ΥΣ Άδειες Χρήσης Το παρόν εκπαιδευτικό

Διαβάστε περισσότερα

Βίντεο και κινούµενα σχέδια

Βίντεο και κινούµενα σχέδια Βίντεο και κινούµενα σχέδια Περιγραφή του βίντεο Ανάλυση του βίντεο Κωδικοποίηση των χρωµάτων Μετάδοση τηλεοπτικού σήµατος Συµβατικά τηλεοπτικά συστήµατα Τεχνολογία Πολυµέσων 06-1 Περιγραφή του βίντεο

Διαβάστε περισσότερα

ITU-T : H.261 (1990), H.262 (1996), H.263 (1995) MPEG-1, MPEG-2, MPEG-4. Αποθήκευση, Μετάδοση, Επικοινωνίες, ίκτυα

ITU-T : H.261 (1990), H.262 (1996), H.263 (1995) MPEG-1, MPEG-2, MPEG-4. Αποθήκευση, Μετάδοση, Επικοινωνίες, ίκτυα Συµπίεση/κωδικοποίηση βίντεο ITU-T : H.261 (1990), H.262 (1996), H.263 (1995) Συνδιάσκεψη : ISDN, ATM, LANs, Internet, PSTN MPEG-1, MPEG-2, MPEG-4 Αποθήκευση, Μετάδοση, Επικοινωνίες, ίκτυα 1 H.261 : εισαγωγή

Διαβάστε περισσότερα

Ψηφιακή Επεξεργασία Εικόνας

Ψηφιακή Επεξεργασία Εικόνας ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Ανώτατο Εκπαιδευτικό Ίδρυμα Πειραιά Τεχνολογικού Τομέα Ψηφιακή Επεξεργασία Εικόνας Ενότητα 9 : Κωδικοποίηση βίντεο Πρότυπο συμπίεσης MPEG Ιωάννης Έλληνας Τμήμα Η/ΥΣ Άδειες Χρήσης Το

Διαβάστε περισσότερα

Ψηφιακή Επεξεργασία Σημάτων

Ψηφιακή Επεξεργασία Σημάτων Ψηφιακή Επεξεργασία Σημάτων Ενότητα 7: Μετατροπή Σήματος από Αναλογική Μορφή σε Ψηφιακή Δρ. Μιχάλης Παρασκευάς Επίκουρος Καθηγητής 1 Μετατροπή Αναλογικού Σήματος σε Ψηφιακό Είδη Δειγματοληψίας: Ιδανική

Διαβάστε περισσότερα

ΠΛΗΡΟΦΟΡΙΚΗ I. 7 η ΔΙΑΛΕΞΗ Γραφικά με Υπολογιστή

ΠΛΗΡΟΦΟΡΙΚΗ I. 7 η ΔΙΑΛΕΞΗ Γραφικά με Υπολογιστή ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΚΑΙ ΟΙΚΟΝΟΜΙΑΣ - ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΣΑΓΩΓΙΚΗ ΚΑΤΕΥΘΥΝΣΗ ΤΟΥΡΙΣΤΙΚΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ ΚΑΙ ΕΠΙΧΕΙΡΗΣΕΩΝ ΦΙΛΟΞΕΝΙΑΣ ΠΛΗΡΟΦΟΡΙΚΗ I 7 η ΔΙΑΛΕΞΗ Γραφικά με Υπολογιστή ΧΑΣΑΝΗΣ ΒΑΣΙΛΕΙΟΣ

Διαβάστε περισσότερα

Συμπίεση Δεδομένων

Συμπίεση Δεδομένων Συμπίεση Δεδομένων 2014-2015 Ρυθμός κωδικοποίησης Ένας κώδικας που απαιτεί L bits για την κωδικοποίηση μίας συμβολοσειράς N συμβόλων που εκπέμπει μία πηγή έχει ρυθμό κωδικοποίησης (μέσο μήκος λέξης) L

Διαβάστε περισσότερα

Παλμοκωδική Διαμόρφωση. Pulse Code Modulation (PCM)

Παλμοκωδική Διαμόρφωση. Pulse Code Modulation (PCM) Παλμοκωδική Διαμόρφωση Pulse Code Modulation (PCM) Pulse-code modulation (PCM) Η PCM είναι ένας στοιχειώδης τρόπος διαμόρφωσης που δεν χρησιμοποιεί φέρον! Το μεταδιδόμενο (διαμορφωμένο) σήμα PCM είναι

Διαβάστε περισσότερα

ΗΜΥ 100 Εισαγωγή στην Τεχνολογία

ΗΜΥ 100 Εισαγωγή στην Τεχνολογία ΗΜΥ 100 Εισαγωγή στην Τεχνολογία Δρ. Στέλιος Τιμοθέου ΤΜΗΜΑ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΑ ΘΕΜΑΤΑ ΜΑΣ ΣΗΜΕΡΑ Αναλογικά και ψηφιακά συστήματα Μετατροπή

Διαβάστε περισσότερα

Ψηφιακή Επεξεργασία Εικόνας

Ψηφιακή Επεξεργασία Εικόνας ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Ανώτατο Εκπαιδευτικό Ίδρυμα Πειραιά Τεχνολογικού Τομέα Ψηφιακή Επεξεργασία Εικόνας Ενότητα 7 : Πρότυπο συμπίεσης JPEG Ιωάννης Έλληνας Τμήμα Η/ΥΣ Άδειες Χρήσης Το παρόν εκπαιδευτικό

Διαβάστε περισσότερα

Κωδικοποίηση βίντεο (MPEG)

Κωδικοποίηση βίντεο (MPEG) (MEG) Εισαγωγή στο MEG-1 Κωδικοποίηση βίντεο οµή βίντεο Κωδικοποίηση ήχου Ροή δεδοµένων Τεχνολογία Πολυµέσων 11-1 Εισαγωγή στο MEG-1 MEG (Motion ictures Experts Group) ίντεο και ήχος υψηλής ποιότητας ιανοµή

Διαβάστε περισσότερα

Τηλεπικοινωνιακά Συστήματα ΙΙ

Τηλεπικοινωνιακά Συστήματα ΙΙ Τηλεπικοινωνιακά Συστήματα ΙΙ Διάλεξη 1: Χωρητικότητα Καναλιών Το θεώρημα Shannon - Hartley Δρ. Μιχάλης Παρασκευάς Επίκουρος Καθηγητής 1 Ατζέντα 1. Δυαδική σηματοδοσία 2. Μορφές δυαδικής σηματοδοσίας 3.

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΛΟΠΟΝΝΗΣΟΥ, ΤΜΗΜΑ ΤΕΧΝΟΛΟΓΙΑΣ ΤΗΛΕΠΙΚΟΙΝΩΝΙΩΝ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΛΟΠΟΝΝΗΣΟΥ, ΤΜΗΜΑ ΤΕΧΝΟΛΟΓΙΑΣ ΤΗΛΕΠΙΚΟΙΝΩΝΙΩΝ ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΛΟΠΟΝΝΗΣΟΥ, ΤΜΗΜΑ ΤΕΧΝΟΛΟΓΙΑΣ ΤΗΛΕΠΙΚΟΙΝΩΝΙΩΝ ΒΕΣ 04: ΣΥΜΠΙΕΣΗ ΚΑΙ ΜΕΤΑ ΟΣΗ ΠΟΛΥΜΕΣΩΝ Ακαδηµαϊκό Έτος 2007 2008, Χειµερινό Εξάµηνο 6 Νοεµβρίου 2007 Φροντιστηριακή Άσκηση 2: (I) Εντροπία,

Διαβάστε περισσότερα

Παλμοκωδική Διαμόρφωση. Pulse Code Modulation (PCM)

Παλμοκωδική Διαμόρφωση. Pulse Code Modulation (PCM) Παλμοκωδική Διαμόρφωση Pulse Code Modulation (PCM) Pulse-code modulation (PCM) Η PCM είναι ένας στοιχειώδης τρόπος διαμόρφωσης που δεν χρησιμοποιεί φέρον! Το μεταδιδόμενο (διαμορφωμένο) σήμα PCM είναι

Διαβάστε περισσότερα

ΒΙΟΜΗΧΑΝΙΚΑ ΗΛΕΚΤΡΟΝΙΚΑ

ΒΙΟΜΗΧΑΝΙΚΑ ΗΛΕΚΤΡΟΝΙΚΑ ΒΙΟΜΗΧΑΝΙΚΑ ΗΛΕΚΤΡΟΝΙΚΑ Συµπληρωµατικές Σηµειώσεις Προχωρηµένο Επίπεδο Επεξεργασίας Εικόνας Σύνθεση Οπτικού Μωσαϊκού ρ. Γ. Χ. Καρράς Εθνικό Μετσόβιο Πολυτεχνείο Σχολή Μηχανολόγων Μηχανικών Τοµέας Μηχανολογικών

Διαβάστε περισσότερα

Ειδικά Θέµατα Υπολογιστικής Όρασης & Γραφικής. Εµµανουήλ Ζ. Ψαράκης & Αθανάσιος Τσακαλίδης Πολυτεχνική Σχολή Τµήµα Μηχανικών Η/Υ & Πληροφορικής

Ειδικά Θέµατα Υπολογιστικής Όρασης & Γραφικής. Εµµανουήλ Ζ. Ψαράκης & Αθανάσιος Τσακαλίδης Πολυτεχνική Σχολή Τµήµα Μηχανικών Η/Υ & Πληροφορικής Ειδικά Θέµατα Υπολογιστικής Όρασης & Γραφικής Εµµανουήλ Ζ. Ψαράκης & Αθανάσιος Τσακαλίδης Πολυτεχνική Σχολή Τµήµα Μηχανικών Η/Υ & Πληροφορικής Επεξεργασία Εικόνας Εµµανουήλ Ζ. Ψαράκης Πολυτεχνική Σχολή

Διαβάστε περισσότερα

Ενότητα 2: Οι Θεµελιώδεις Αρχές των Ψηφιακών Εικόνων

Ενότητα 2: Οι Θεµελιώδεις Αρχές των Ψηφιακών Εικόνων Ενότητα 2: Οι Θεµελιώδεις Αρχές των Ψηφιακών Εικόνων Δειγµατοληψία και Κβαντισµός: Μια εικόνα (µπορεί να) είναι συνεχής τόσο ως προς τις συντεταγµένες x, y όσο και ως προς το πλάτος. Για να τη µετατρέψουµε

Διαβάστε περισσότερα

Επεξεργασία Πολυµέσων. Δρ. Μαρία Κοζύρη Π.Μ.Σ. «Εφαρµοσµένη Πληροφορική» Τµήµα Ηλεκτρολόγων Μηχανικών & Μηχανικών Υπολογιστών Πανεπιστήµιο Θεσσαλίας

Επεξεργασία Πολυµέσων. Δρ. Μαρία Κοζύρη Π.Μ.Σ. «Εφαρµοσµένη Πληροφορική» Τµήµα Ηλεκτρολόγων Μηχανικών & Μηχανικών Υπολογιστών Πανεπιστήµιο Θεσσαλίας Π.Μ.Σ. «Εφαρµοσµένη Πληροφορική» Τµήµα Ηλεκτρολόγων Μηχανικών & Μηχανικών Υπολογιστών Πανεπιστήµιο Θεσσαλίας Ενότητα 3: Επισκόπηση Συµπίεσης 2 Θεωρία Πληροφορίας Κωδικοποίηση Θεµελιώθηκε απο τον Claude

Διαβάστε περισσότερα

MPEG-4: Βασικά Χαρακτηριστικά

MPEG-4: Βασικά Χαρακτηριστικά MPEG-4 MPEG-4: Βασικά Χαρακτηριστικά Σχεδιάστηκε ώστε να καλύπτει ευρύ φάσμα ρυθμών, από 5 kbps εώς 10 Mbps Εκτός από τη συμπίεση δίνει έμφαση και στην αλληλεπίδραση με το χρήστη Χρησιμοποιεί αντικείμενα

Διαβάστε περισσότερα

Τεχνολογία Πολυμέσων. Ενότητα # 12: Κωδικοποίηση βίντεο: H.26x Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής

Τεχνολογία Πολυμέσων. Ενότητα # 12: Κωδικοποίηση βίντεο: H.26x Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής Τεχνολογία Πολυμέσων Ενότητα # 12: Κωδικοποίηση βίντεο: H.26x Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής Χρηματοδότηση Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου

Διαβάστε περισσότερα

Εικόνες και γραφικά. Τεχνολογία Πολυµέσων 05-1

Εικόνες και γραφικά. Τεχνολογία Πολυµέσων 05-1 Εικόνες και γραφικά Περιγραφή στατικών εικόνων Αναπαράσταση γραφικών Υλικό γραφικών Dithering και anti-aliasing Σύνθεση εικόνας Ανάλυση εικόνας Μετάδοση εικόνας Τεχνολογία Πολυµέσων 05-1 Περιγραφή στατικών

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ, ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ, ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ, ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΕΠΛ 4: ΣΥΣΤΗΜΑΤΑ ΠΟΛΥΜΕΣΩΝ Ακαδηµαϊκό Έτος 004 005, Χειµερινό Εξάµηνο Θεωρητικές Ασκήσεις (# 3): 1. Ο διακριτός µετασχηµατισµός συνηµίτονου (Discrete Cosine Transform)

Διαβάστε περισσότερα

Κεφάλαιο 5 Διασύνδεση Αναλογικών & Ψηφιακών Συστηµάτων

Κεφάλαιο 5 Διασύνδεση Αναλογικών & Ψηφιακών Συστηµάτων Κεφάλαιο 5 Διασύνδεση Αναλογικών & Ψηφιακών Συστηµάτων Αναλογικές & Ψηφιακές Διατάξεις Control Systems Laboratory Τα διάφορα μεγέθη των φυσικών διεργασιών τα μετράμε με αισθητήρες που ουσιαστικά παρέχουν

Διαβάστε περισσότερα

Αναλογικά & Ψηφιακά Κυκλώματα ιαφάνειες Μαθήματος ρ. Μηχ. Μαραβελάκης Εμ.

Αναλογικά & Ψηφιακά Κυκλώματα ιαφάνειες Μαθήματος ρ. Μηχ. Μαραβελάκης Εμ. Αναλογικά & Ψηφιακά Κυκλώματα ιαφάνειες Μαθήματος ρ. Μηχ. Μαραβελάκης Εμ. 1 Εισαγωγή Αναλογικό σήμα (analog signal): συνεχής συνάρτηση στην οποία η ανεξάρτητη μεταβλητή και η εξαρτημένη μεταβλητή (π.χ.

Διαβάστε περισσότερα

Χρήση του RAW ORF. Κείμενο, παρουσίαση, έρευνα: Ιορδάνης Σταυρίδης DNG ARW X3F DCR NEF CRW RAW RAF CR2 SRF MRW

Χρήση του RAW ORF. Κείμενο, παρουσίαση, έρευνα: Ιορδάνης Σταυρίδης DNG ARW X3F DCR NEF CRW RAW RAF CR2 SRF MRW 8 Χρήση του RAW Κείμενο, παρουσίαση, έρευνα: Ιορδάνης Σταυρίδης DNG X3F ARW ORF DCR NEF CRW RAW RAF CR2 SRF MRW 9 Ένα ακατέργαστο αρχείο εικόνας RAW περιέχει ελάχιστα επεξεργασμένα στοιχεία από τον αισθητήρα

Διαβάστε περισσότερα

2. Ανάλυση και Σύνθεση κυματομορφών με την μέθοδο Fourier

2. Ανάλυση και Σύνθεση κυματομορφών με την μέθοδο Fourier 2.1 2. Ανάλυση και Σύνθεση κυματομορφών με την μέθοδο Fourier 2.1 Εισαγωγή Η βασική ιδέα στην ανάλυση των κυματομορφών με την βοήθεια της μεθόδου Fourier συνίσταται στο ότι μία κυματομορφή μιας οποιασδήποτε

Διαβάστε περισσότερα

Κεφάλαιο 3 Συμπίεση Βίντεο

Κεφάλαιο 3 Συμπίεση Βίντεο Κεφάλαιο 3 Συμπίεση Βίντεο Σύνοψη Στο κεφάλαιο αυτό εξετάζουμε τους βασικούς τρόπους με τους οποίους το πρότυπο MPEG (και συγκεκριμένα το MPEG-2) προβλέπει τη συμπίεση του σήματος βίντεο. Η ανάγκη για

Διαβάστε περισσότερα

Διαδικασία Ψηφιοποίησης (1/2)

Διαδικασία Ψηφιοποίησης (1/2) Διαδικασία Ψηφιοποίησης (1/2) Η διαδικασία ψηφιοποίησης περιλαμβάνει: Φιλτράρισμα και δειγματοληψία Κβαντισμό και κωδικοποίηση Φιλτράρισμα και δειγματοληψία Κβαντισμός και κωδικοποίηση Κβαντισμός Τα αναλογικά

Διαβάστε περισσότερα

ιαφορική εντροπία Σεραφείµ Καραµπογιάς

ιαφορική εντροπία Σεραφείµ Καραµπογιάς ιαφορική εντροπία Σεραφείµ Καραµπογιάς Για πηγές διακριτού χρόνου µε συνεχές αλφάβητο, των οποίων οι έξοδοι είναι πραγµατικοί αριθµοί, ορίζεται µια άλλη ποσότητα που µοιάζει µε την εντροπία και καλείται

Διαβάστε περισσότερα

Βίντεο. Τεχνολογία Πολυμέσων και Πολυμεσικές Επικοινωνίες 06-1

Βίντεο. Τεχνολογία Πολυμέσων και Πολυμεσικές Επικοινωνίες 06-1 Βίντεο Εισαγωγή Χαρακτηριστικά του βίντεο Απόσταση θέασης Μετάδοση τηλεοπτικού σήματος Συμβατικά τηλεοπτικά συστήματα Ψηφιακό βίντεο Εναλλακτικά μορφότυπα Τηλεόραση υψηλής ευκρίνειας Κινούμενες εικόνες

Διαβάστε περισσότερα

ΗΜΥ 100 Εισαγωγή στην Τεχνολογία ιάλεξη 18

ΗΜΥ 100 Εισαγωγή στην Τεχνολογία ιάλεξη 18 ΗΜΥ 100 Εισαγωγή στην Τεχνολογία ιάλεξη 18 14 Νοεµβρίου, 2006 Γεώργιος Έλληνας Επίκουρος Καθηγητής ΤΜΗΜΑ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΑ ΘΕΜΑΤΑ

Διαβάστε περισσότερα

Περιεχόµενα. ΕΠΛ 422: Συστήµατα Πολυµέσων. Βιβλιογραφία. Κατηγορίες τεχνικών συµπίεσης. Τεχνικές Συµπίεσης

Περιεχόµενα. ΕΠΛ 422: Συστήµατα Πολυµέσων. Βιβλιογραφία. Κατηγορίες τεχνικών συµπίεσης. Τεχνικές Συµπίεσης Περιεχόµενα ΕΠΛ : Συστήµατα Πολυµέσων Συµπίεση εδοµένων: Τεχνικές Συµπίεσης Βιβλιογραφία Κατηγορίες Τεχνικών Συµπίεσης Τεχνικές Εντροπίας Τεχνικές Μήκους ιαδροµής Στατιστικές Κωδικοποίηση Πηγής Μετασχηµατισµού

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 5. Κύκλος Ζωής Εφαρμογών ΕΝΟΤΗΤΑ 2. Εφαρμογές Πληροφορικής. Διδακτικές ενότητες 5.1 Πρόβλημα και υπολογιστής 5.2 Ανάπτυξη εφαρμογών

ΚΕΦΑΛΑΙΟ 5. Κύκλος Ζωής Εφαρμογών ΕΝΟΤΗΤΑ 2. Εφαρμογές Πληροφορικής. Διδακτικές ενότητες 5.1 Πρόβλημα και υπολογιστής 5.2 Ανάπτυξη εφαρμογών 44 Διδακτικές ενότητες 5.1 Πρόβλημα και υπολογιστής 5.2 Ανάπτυξη εφαρμογών Διδακτικοί στόχοι Σκοπός του κεφαλαίου είναι οι μαθητές να κατανοήσουν τα βήματα που ακολουθούνται κατά την ανάπτυξη μιας εφαρμογής.

Διαβάστε περισσότερα

4. ΚΕΦΑΛΑΙΟ ΕΦΑΡΜΟΓΕΣ ΤΟΥ ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΥ FOURIER

4. ΚΕΦΑΛΑΙΟ ΕΦΑΡΜΟΓΕΣ ΤΟΥ ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΥ FOURIER 4. ΚΕΦΑΛΑΙΟ ΕΦΑΡΜΟΓΕΣ ΤΟΥ ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΥ FOURIER Σκοπός του κεφαλαίου είναι να παρουσιάσει μερικές εφαρμογές του Μετασχηματισμού Fourier (ΜF). Ειδικότερα στο κεφάλαιο αυτό θα περιγραφούν έμμεσοι τρόποι

Διαβάστε περισσότερα

ΠΡΟΓΡΑΜΜΑ ΕΞΕΤΑΣΕΩΝ. Εφαρμοσμένος & Υπολογιστικός Ηλεκτρομαγνητισμός Ηλ. Αιθ. 012, 013. Στοχαστικά Συστήματα & Επικοινωνίες Ηλ. Αμφ.

ΠΡΟΓΡΑΜΜΑ ΕΞΕΤΑΣΕΩΝ. Εφαρμοσμένος & Υπολογιστικός Ηλεκτρομαγνητισμός Ηλ. Αιθ. 012, 013. Στοχαστικά Συστήματα & Επικοινωνίες Ηλ. Αμφ. ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ & ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ Ακαδημαϊκό Έτος 2014-2015 Περίοδος Ιουνίου 2015 ΠΡΟΓΡΑΜΜΑ ΕΞΕΤΑΣΕΩΝ ΗΜΕΡΟΜΗΝΙΑ ΩΡΑ 1ο-2ο ΕΞΑΜΗΝΟ 3ο-4ο ΕΞΑΜΗΝΟ 5ο-6ο ΕΞΑΜΗΝΟ

Διαβάστε περισσότερα

ΠΡΟΓΡΑΜΜΑ ΕΞΕΤΑΣΕΩΝ. Εφαρμοσμένος & Υπολογιστικός Ηλεκτρομαγνητισμός Ηλ. Αιθ. 012, 013. Εργαστήριο Ψηφιακών Συστημάτων Ηλ. Εργ.

ΠΡΟΓΡΑΜΜΑ ΕΞΕΤΑΣΕΩΝ. Εφαρμοσμένος & Υπολογιστικός Ηλεκτρομαγνητισμός Ηλ. Αιθ. 012, 013. Εργαστήριο Ψηφιακών Συστημάτων Ηλ. Εργ. ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ & ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ Ακαδημαϊκό Έτος 2014-2015 Περίοδος Ιουνίου 2015 ΠΡΟΓΡΑΜΜΑ ΕΞΕΤΑΣΕΩΝ ΗΜΕΡΟΜΗΝΙΑ ΩΡΑ 1ο-2ο ΕΞΑΜΗΝΟ 3ο-4ο ΕΞΑΜΗΝΟ 5ο-6ο ΕΞΑΜΗΝΟ

Διαβάστε περισσότερα

Υπολογιστικές μέθοδοι για την ανάλυση της πληροφορίας των εικόνων και την κατανόηση του περιεχομένου

Υπολογιστικές μέθοδοι για την ανάλυση της πληροφορίας των εικόνων και την κατανόηση του περιεχομένου Ανάλυση Εικόνων Εικόνα : μορφή πληροφορίας Ανάλυση : εξαγωγή γνώσης Υπολογιστικές μέθοδοι για την ανάλυση της πληροφορίας των εικόνων και την κατανόηση του περιεχομένου Θέματα ειδίκευσης Υπολογιστική Όραση

Διαβάστε περισσότερα