ΣΥΓΧΡΟΝΕΣ ΤΕΧΝΙΚΕΣ ΣΥΜΠΙΕΣΗΣ ΕΙΚΟΝΑΣ Ιωάννης Έλληνας Επίκουρος Καθηγητής Τ.Ε.Ι Πειραιά - Τμήμα Υπολογιστικών Συστημάτων Π. Ράλλη & Θηβών 250, 12244 Αιγάλεω email: jellin@teipir.gr Μανώλης Σαγκριώτης Επίκουρος Καθηγητής Εθνικό και Καποδιστριακό Παν/μιο Αθηνών Τμήμα Πληροφορικής Πανεπιστημιούπολη - Ιλίσια 157 84 Αθήνα email: sagri@di.uoa.gr ΠΕΡΙΛΗΨΗ Η παρούσα εργασία, με αφορμή την υιοθέτηση του JPEG2000, περιγράφει δύο χαρακτηριστικούς αλγόριθμους για την συμπίεση εικόνων. Οι αλγόριθμοι αυτοί βασίζονται στο μετασχηματισμό με wavelets και γενικά είτε ενεργούν στη μορφολογία και συσχέτιση των παραγομένων συντελεστών είτε στην εύρεση ενός βέλτιστου συνδυασμού ρυθμού δεδομένων (bit rate) και παραμόρφωσης (distortion). Στην εργασία αυτή γίνεται αρχικά μία αναφορά στον χρησιμοποιούμενο μετασχηματισμό και στη συνέχεια αναλύονται οι τεχνικές συμπίεσης. Στη συνέχεια παρουσιάζονται πειραματικά δεδομένα από την εφαρμογή αυτών των τεχνικών και γίνεται σύγκριση. Τέλος γίνεται αναφορά στη τρέχουσα ερευνητική δραστηριότητα σχετικά με την συμπίεση εικόνων. ΕΙΣΑΓΩΓΗ Το πρότυπο JPEG χρησιμοποιείται από το 1992 και αποδείχτηκε ένα πολύ χρήσιμο εργαλείο για την επεξεργασία της ψηφιακής εικόνας. Σήμερα, όπου η ψηφιακή εικόνα είναι ενσωματωμένη δυνατότητα στο διαδίκτυο, στη τηλεομοιοτυπία, σε εμπορικές συσκευές φωτογραφίας και video, στην τηλεϊατρική κλπ, το νέο πρότυπο JPEG2000 έρχεται να συμπληρώσει με νέες δυνατότητες το ήδη υπάρχον πρότυπο. Μερικές από τις δυνατότητες του νέου προτύπου είναι, [1]: Πολύ καλά χαρακτηριστικά εικόνας για χαμηλούς ρυθμούς μετάδοσης π.χ μικρότερους από 0.25 bits/pixel. Δυναμική συμπεριφορά για την επεξεργασία εικόνων με διαφορετικά χαρακτηριστικά π.χ από εικόνες με ομαλή εναλλαγή τόνου μέχρι εικόνες με έντονες μεταβολές (bilevel or binary images). Λειτουργία συμπίεσης με ή χωρίς απώλειες. Σταδιακή μετάδοση, η οποία εξασφαλίζει μεταβλητή ανάλυση της λαμβανομένης εικόνας. Κωδικοποίηση μέρους μίας εικόνας με διαφορετική ανάλυση. Συμπαγής συμπεριφορά σε σφάλματα μετάδοσης. Το Σχ. 1 δίνει το μπλόκ διάγραμμα ενός συστήματος JPEG 2000. Διακρίνονται τα τμήματα κωδικοποίησης και αποκωδικοποίησης. 1
Μετασχ/σμός Κβαντιστής Κωδικοποιητής εντροπίας Συμπιεσμένα δεδομένα Εικόνα Ανασχηματισμένη Εικόνα Αποθήκευση ή Μετάδοση Αντίστροφος Μετασχ/σμός Αντίστροφη κβάντιση Αποκωδικοποίηση εντροπίας Συμπιεσμένα δεδομένα Σχ. 1 Μπλόκ διάγραμμα συστήματος JPEG 2000 Η εργασία αυτή επικεντρώνεται στην καρδιά αυτού του προτύπου, που είναι ο μετασχηματισμός ενός σήματος με wavelets. ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΣ WAVELETS Μία συνάρτηση f(t) μπορεί να αναλυθεί γραμμικά με την σχέση: f ( t) = alψ l ( t) (1) l όπου α l είναι οι συντελεστές ανάλυσης της συνάρτησης και ψ l είναι οι συναρτήσεις ανάλυσης, οι οποίες καλούνται βάση, εαν η παραπάνω ανάλυση είναι μοναδική. Εαν οι συναρτήσεις βάσης είναι ορθογώνιες συναρτήσεις δηλ. ψ ( t), ψ ( t) = ψ ( t) ψ ( t) dt = 0 για l (2) l οι συντελεστές μπορούν να υπολογισθούν από τη σχέση: a l = f ( t), ψ ( t) = f ( t) ψ ( t dt (3) ) όπου η f(t) δίνεται από τη σχέση (1). Εαν οι συναρτήσεις βάσης δεν είναι ορθογώνιες, τότε υπάρχει μία άλλη βάση, ~ ψ ( t ), η οποία δίνει τους συντελεστές μετασχηματισμού με τη σχέση (3). Για τη σειρά Fourier, οι ορθογώνιες συναρτήσεις είναι οι sin(ω 0 t) και cos(ω 0 t). Ο διακριτός μετασχηματισμός wavelets (DWT) δίνεται από τους συντελεστές της σχέσης: f ( α j, ψ j, t j t) = ( ) (4) όπου α j, και ψ j, είναι οι συντελεστές και οι συναρτήσεις ανάλυσης με wavelets, η δε σχέση (4) είναι ο αντίστροφος μετασχηματισμός. 2
Συμπερασματικά η συνάρτηση f(t) μπορεί να αντιπροσωπευθεί από αυτούς τους συντελεστές, οι οποίοι προκύπτουν σαν εσωτερικό γινόμενο της συνάρτησης με την ορθογώνια βάση συναρτήσεων. Αντίστροφα η επιθυμητή συνάρτηση μπορεί να αναπαραχθεί από αυτούς τους συντελεστές και τις συναρτήσεις βάσης. Οι συναρτήσεις βάσεις ή wavelets παράγονται από μία αρχική συνάρτηση, η οποία καλείται mother wavelet, εαν μεταβληθεί το εύρος της (scaling) και μετατοπισθεί στο χρόνο (translation) [2], [3], [4]. Οι συντελεστές ανάλυσης είναι δύο διαστάσεων, (j =μεταβολή διάρκειας ή scaling, =χρονική μετατόπιση ή translation), γιατί προέρχονται από ανάλογες συναρτήσεις βάσης. Έτσι ο μετασχηματισμός αυτός έχει το πλεονέκτημα σε σύγκριση με τον Fourier, να αναλύει ένα σήμα τόσο στο χρόνο όσο και στη συχνότητα. Μία σημαντική δυνατότητα είναι να προσδιορίζει με ακρίβεια μία ασυνέχεια στο πεδίο του χρόνου. V3 V2 V1 V0 Ανάλυση Μέση τιμή Λεπτομέρεια 4 [9 7 3 5] 2 [8 4] [1-1] 1 [6] [2] W 2 W 1 W 0 V 0 Μετασχηματισμός [ 6 2 1 1] (α) Σχ. 2 (α) Τα διαστήματα ορισμού των συναρτήσεων βάσης προσέγγισης (scaling) και λεπτομέρειας (detail ή wavelet). Αριθμητικό παράδειγμα μετασχηματισμού ενός διανύσματος [9 7 3 5]. Στο Σχ. 2(α) ένα σήμα μπορεί να αναλυθεί σε ένα διάστημα V j με την βοήθεια συναρτήσεων βάσης που μπορούν να ανήκουν σε αυτό σύμφωνα με την (4) ή μπορεί να αναλυθεί με μία συνάρτηση προσέγγισης (scaling function) η οποία ανήκει στο βασικό διάσημα V 0 ή σε άλλο και με μία συνάρτηση λεπτομέρειας (wavelet function) η οποία ανήκει στη διαφορά των διαστημάτων. Το Σχ. 2 δίνει ένα χαρακτηριστικό αριθμητικό παράδειγμα αυτής της προσέγγισης, στο οποίο φαίνεται πως ένα σήμα [9 7 3 5] μπορεί να μετασχηματισθεί σε μία ομάδα συντελεστών [6 2 1 1], η οποία αποτελείται από μία προσέγγιση (χαμηλή συχνότητα) και τις λεπτομέρειες (υψηλή συχνότητα). Το αρχικό σήμα μπορεί να ανακτηθεί από αυτούς τους συντελεστές στην επιθυμητή ανάλυση, με το πλεονέκτημα όμως ότι τα μεγέθη των συντελεστών είναι μικρότερα του αρχικού σήματος (κυρίως των συντελεστών λεπτομέρειας) και επομένως η μετάδοση μπορεί να γίνει με λιγότερα bits. Ακόμα η παράλειψη κάποιου συντελεστή λεπτομέρειας δεν δημιουργεί μεγάλο σφάλμα. Έτσι ένα σήμα μπορεί να αναλυθεί σε ένα διάστημα με την σχέση: f ( t) = c( ) φ ( t) + d( j, ) ψ ( ) (5) = j= 0 = j, t 3
Σήμα (α) Wavelet Χρονική μετατόπιση (Translation) (γ) (δ) Αλλαγή διάρκειας (Scaling) Σχ. 3 Διαδικασία ανάλυσης σήματος με μετασχηματισμό wavelet Πρακτικά, όπως φαίνεται από το Σχ. 3, επιλέγεται ένα wavelet και υπολογίζεται ο συντελεστής ο οποίος μαζί με αυτό δείχνει πόσο κοντά είναι στο σήμα. Όσο μεγαλύτερο μέγεθος έχει ο συντελεστής, τόσο πιο πιστή είναι η ανάλυση του σήματος. Το ίδιο επαναλαμβάνεται με χρονική ολίσθηση του wavelet μέχρι την κάλυψη όλου του σήματος. Τέλος το wavelet μεταβάλλεται στο χρόνο (scaled), έτσι ώστε να δώσει διαφορετική ανάλυση (resolution), και η διαδικασία επαναλαμβάνεται. ΚΩΔΙΚΟΠΟΙΗΣΗ ΖΩΝΗΣ ΚΑΙ WAVELETS Μία άλλη θεώρηση της παραπάνω ανάλυσης είναι η θεωρία της κωδικοποίησης ζωνών (subband coding) [5], σύμφωνα με την οποία το σήμα περνά μέσα από διαδοχικά ζευγάρια φίλτρων (φίλτρα ανάλυσης), τα οποία παράγουν τους συντελεστές ανάλυσης. Αυτοί με τη σειρά τους στο δέκτη μπορούν να αναπαράγουν το αρχικό σήμα εαν περάσουν από διαδοχικά ζευγάρια φίλτρων (φίλτρα σύνθεσης), τα οποία πρέπει να έχουν ειδική σχέση με τα φίλτρα ανάλυσης έτσι ώστε το αρχικό σήμα να αναπαράγεται χωρίς απώλεια των χαρακτηριστικών του. Το σύνολο αυτών των φίλτρων λέγεται PRB (Perfect Reconstruction Ban) και βασική τους ιδιότητα είναι ότι είναι μεταξύ τους ορθογώνια. Η ορθογώνια συνθήκη, η οποία τέθηκε και στην προηγούμενη ανάλυση, πρέπει να διέπει τον μετασχηματισμό έτσι ώστε η ενέργεια του αρχικού σήματος να είναι ίδια με την ενέργεια των παραγομένων συντελεστών (Θεώρημα Parseval). Το Σχ. 4 (α) δείχνει την μέθοδο ανάλυσης ενός σήματος με την θεωρία των ζωνών. Τα φίλτρα χαμηλής συχνότητας αντιπροσωπεύουν την προσέγγιση ή approximation και τα φίλτρα υψηλής συχνότητας την λεπτομέρεια ή detail της προηγούμενης ανάλυσης. Η ανάλυση μόνο της χαμηλής συχνότητας, Σχ. 4, καλείται ανάλυση wavelet ή wavelet decomposition, ενώ η ανάλυση και των δύο περιοχών συχνοτήτων, Σχ. 4(γ), καλείται ανάλυση πακέτου με wavelet ή wavelet pacet decomposition. Οι δειγματολήπτες χρησιμοποιούνται έτσι ώστε οι παραγόμενοι συντελεστές μετά από τα φίλτρα να είναι ίδιου πλήθους με την ανάλυση του σήματος εισόδου. 4
(α) Υποδειγματοληψία (Downsampling) (Downsampling) Υπερδειγματοληψία (Upsampling) Ανάλυση (Decomposition) Σύνθεση (Reconstruction) (γ) Σχ. 4 (α) Δυαδικός μετασχηματισμός με την χρήση φίλτρων Χ.Σ και Υ.Σ Wavelet decomposition (γ) Wavelet pacet decomposition Έτσι ένα σήμα εισόδου S, μπορεί να αναλυθεί σαν: S=A 3 +D 3 +D 2 +D 1 ή S=A 2 +D 2 +D 1 ή S=A 1 +D 1. Όμοια μπορεί να αναλυθεί σαν: S=A 1 +AAD 3 +DAD 3 +ADD 3 +DDD 3 δίνοντας την επιθυμητή προσέγγιση και τις λεπτομέρειες. Το δέντρο που σχηματίζεται καλείται wavelet tree και η δομή του μεταφέρεται μαζί με τους συντελεστές στο δέκτη και αποκωδικοποιητή για την ανασύσταση του αρχικού σήματος. ΣΥΜΠΙΕΣΗ ΕΙΚΟΝΑΣ Το Σχ. 4(γ) είναι ο μετασχηματισμός ενός μονοδιάστατου σήματος σε τρία επίπεδα. Η ανάλυση ενός δισδιάστατου σήματος, όπως η εικόνα, περιλαμβάνει την ανάλυση πρώτα των σειρών και μετά των στηλών της και επομένως κάθε επίπεδο μετασχηματισμού αποτελείται απο ομάδα τεσσάρων φίλτρων. Οι παραγόμενοι συντελεστές ενός επιπέδου αντιπροσωπεύουν την προσέγγιση και τις λεπτομέρειες (Οριζόντια-Κάθετη-Διαγώνια) και είναι: ca= Approximation coefficient ch=horizontal detail cv=vertical detail cd=diagonal detail Το Σχ. 5 δείχνει τον μετασχηματισμό μίας εικόνας, (α), μετά από ένα ή δύο επίπεδα, και (γ). 5
ca1 (LL) cv1(hl) (α) ch1(lh) cd1(hh) ca1 (γ) Σχ. 5 (α) Αρχική εικόνα (Barbara). Απεικόνιση των συντελεστών μετασχηματισμού ενός επιπέδου. (γ) Μετασχηματισμός δευτέρου επιπέδου της προσέγγισης του πρώτου. Είναι φανερό ότι οι συντελεστές προσέγγισης, οι οποίοι προέρχονται από τα φίλτρα χαμηλής συχνότητας (LowLow ή LL), δίνουν την πλησιέστερη εκδοχή της εικόνας ή πληροφορίες για περιοχές με ομαλή μεταβολή φωτεινότητας, ενώ οι συντελεστές λεπτομέρειας, οι οποίοι προέρχονται από τα φίλτρα υψηλής συχνότητας (LH, HL, HH), δίνουν πληροφορίες για τις ακμές της και για περιοχές όπου υπάρχει σημαντική μεταβολή στη φωτεινότητα. Η συμπίεση των δεδομένων ήδη έχει δημιουργηθεί με τον μετασχηματισμό, αλλά μπορεί να γίνει μεγαλύτερη με τους εξής τρόπους: Με την χρήση ομοιόμορφου κβαντιστή με μηδενική περιοχή, έτσι ώστε οι συντελεστές μικρού πλάτους να μηδενισθούν (μέθοδος WSQ Wavelet Scalar Quantization) [6]. Με την ανάπτυξη του βέλτιστου δέντρου μετασχηματισμού χρησιμοποιώντας την εντροπία σαν κριτήριο, όπου ένας κλάδος μετασχηματισμού (Parent) μπορεί να αναλυθεί στο επόμενο επίπεδο (Children) μόνο εαν έχει μεγαλύτερη εντροπία ( Sum(children entropies)<parent entropy) [7]. Στη παρούσα εργασία εξετάζονται δύο σημαντικοί αλγόριθμοι συμπίεσης εικόνας από τους πολλούς που έχουν αναπτυχθεί. ΑΛΓΟΡΙΘΜΟΣ ΣΥΜΠΙΕΣΗΣ ΕΖW Ο αλγόριθμος EZW (Embedded Zero-tree Wavelet), [8], μία βελτιωμένη εκδοχή του οποίου έχει υιοθετηθεί στο JPEG 2000, παρουσιάζει καλύτερη απόδοση από το JPEG σε χαμηλούς ρυθμούς μετάδοσης. 6
(α) Σχ. 6 (α) Η pdf μίας ζώνης υψηλών συχνοτήτων Μηδενικά δέντρα (zero-trees) Η ενέργεια του σήματος εισόδου τείνει να συγκεντρωθεί σε ένα σχετικά μικρό αριθμό συντελεστών του μετασχηματισμού. Σε ένα επίπεδο, η ενέργεια συγκεντρώνεται κυρίως στη ζώνη χαμηλών συχνοτήτων LL και σε ορισμένους συντελεστές των υπολοίπων ζωνών υψηλών συχνοτήτων LH, HL, HH της ίδιας ζώνης και των αντιστοίχων ζωνών (children) χαμηλοτέρων επιπέδων. Αυτή η συγκέντρωση φαίνεται στην pdf των συντελεστών των ζωνών υψηλών συχνοτήτων και η οποία έχει μορφή Laplacian, Σχ. 6 (a). Η καμπύλη αυτή δείχνει μία συγκέντρωση συντελεστών με μικρό μέγεθος γύρω από το μηδέν και την ύπαρξη λίγων συντελεστών με μεγαλύτερο μέγεθος οι οποίοι όμως συγκεντρώνουν και το μεγαλύτερο ποσοστό ενέργειας της ζώνης. Στις εικόνες του Σχ. 5 φαίνεται ότι οι σημαντικού μεγέθους συντελεστές, σε κάθε ζώνη, είναι συγκεντρωμένοι σε ορισμένες περιοχές (clusters) και οι περιοχές αυτές είναι ίδιες σε κάθε ζώνη (spatial interband dependency). Η ιδέα είναι να χρησιμοποιηθεί η πληροφορία της θέσης των σημαντικών συντελεστών σε μία ζώνη, για παράδειγμα της ζώνης χαμηλών συχνοτήτων LL, για την πρόβλεψη της θέσης των σημαντικών συντελεστών στις άλλες ζώνες (interband prediction), Σχ. 6. Η λειτουργία του αλγορίθμου EZW συνοψίζεται στα εξής: Σχηματίζεται ένας χάρτης σπουδαιότητας (significance map) που δείχνει εαν ένας συντελεστής είναι μεγαλύτερος (significant) ή μικρότερος (non-significant) ενός κατωφλίου (threshold) T. Επειδή τα σύνολα αυτών των μηδενικών συντελεστών είναι ιεραρχικά δομημένα στο χώρο και στη συχνότητα, λόγω του μετασχηματισμού των wavelets, ονομάζονται zero-trees. Η ταξινόμηση των bits γίνεται κατά τρόπο, ώστε τα πιό σημαντικά να μεταδίδονται πρώτα (embedded code stream). Το τελευταίο σημαίνει ότι η παραγωγή μίας εικόνας καλύτερης ποιότητας μπορεί να γίνει με την προσθήκη bits σε εικόνα χειρότερης ποιότητας ή το bit stream μίας εικόνας μπορεί να τερματισθεί και να παραχθεί μια εικόνα χειρότερης ποιότητας από εκείνη που θα παραγόταν εαν έφτανε ολόκληρο το bit stream στον δέκτη. Συμπερασματικά, ο αλγόριθμος EZW δεν απαιτεί πολύπλοκες διαδικασίες, δεν απαιτεί εκπαίδευση (training), ούτε κωδικοσελίδες όπως στις τεχνικές με διανυσματική κβάντιση (vector quantization), ούτε προηγούμενη γνώση της εικόνας. 7
ΑΛΓΟΡΙΘΜΟΣ ΒΕΛΤΙΣΤΟΥ ΔΕΝΤΡΟΥ ΩΣ ΠΡΟΣ R/D (Rate/Distortion) Ο αλγόριθμος αυτός, [9], αποτελεί την πρώτη προσέγγιση μίας σειράς τεχνικών οι οποίες βασίζονται στην κωδικοποίηση του βέλτιστου δέντρου που προκύπτει από την χωρική ή/και χρονική ανάπτυξη του πλήρους δέντρου, έτσι ώστε για μία δεδομένη ταχύτητα (bit rate budget) να προκύπτει η ελάχιστη δυνατή παραμόρφωση (distortion). Στο Σχ. 7 φαίνεται η ανάπτυξη ενός πλήρους δέντρου δύο επιπέδων, (α), και το βέλτιστο δέντρο το οποίο προκύπτει για ένα δεδομένo αριθμό bits, R b. Βέλτιστο δέντρο (Distortion=min R=R b ) (α) Σχ. 7 (α) 2-D wavelet pacet tree δύο επιπέδων. Βέλτιστο δέντρο. Το σήμα εισόδου αναλύεται σε διαδοχικά επίπεδα, τα οποία αποτελούνται από ομάδες συντελεστών που καλούνται κόμβοι (nodes). Κάθε κόμβος (parent node) αναλύεται στο επόμενο επίπεδο σε άλλους κόμβους (children nodes). Ο αλγόριθμος αυτός κλαδεύει (pruning) το αρχικό δέντρο, για να παραχθεί το βέλτιστο, με κριτήριο την ελάχιστη δυνατή συνολική παραμόρφωση για δεδομένο αριθμό bits. Η ανάλυση αυτή γίνεται με την βοήθεια του πολλαπλασιαστή Lagrange, λ, με την σχέση J=D+λR. Ο αλγόριθμος αυτός, bisection algorithm, προσπαθεί με διαδοχικές τιμές του λ, να επιτύχει την ελάχιστη παραμόρφωση. Οι κβαντιστές που χρησιμοποιούνται είναι ομοιόμορφοι και κοινοί για όλο το δέντρο. Η λειτουργία αυτού του αλγορίθμου συνοψίζεται στα εξής: Αναπτύσσεται όλο το δέντρο και υπολογίζεται το ελάχιστο κόστος κβάντισης J=D+λR για κάθε κόμβο και για μία αρχική τιμή του λ. Ξεκινώντας από τους τερματικούς κόμβους του δέντρου, εαν J parent > J children τότε ορθώς υπάρχει η ανάλυση του parent σε children, ενώ εαν J parent < J children οι κόμβοι children κλαδεύονται. Η διαδικασία συνεχίζεται μέχρι τον πρώτο κόμβο και επαναλαμβάνεται με άλλη τιμή του λ, έτσι ώστε να υπάρξει σύγκλιση προς την επιθυμητή τιμή των bits, R b. Ο αλγόριθμος αυτός εξαρτάται από το σήμα εισόδου και έχει καλή απόδοση σε στατικά σήματα εισόδου. Σε περιπτώσεις όπου το σήμα εισόδου μεταβάλλεται χρονικά, όπως στην εικόνα, η προσέγγιση πρέπει να γίνει με χωρική κατάτμηση του σήματος (spatial segmentation) και προσαρμογή του WP δέντρου-συχνότητας σε κάθε τμήμα. Αυτή η προσέγγιση λέγεται χωρική προσαρμογή των WP (spatial adaptive WP) και τέτοια είναι η προσέγγιση του αλγορίθμου διπλού δέντρου (double tree algorithm), [10], και η κατάτμηση χρόνου συχνότητας (space frequency algorithm), [11]. 8
ΣΥΓΚΡΙΣΗ ΤΩΝ ΔΥΟ ΤΕΧΝΙΚΩΝ Ο Πίνακας 1, περιέχει τα συγκριτικά στοιχεία των δύο αυτών τεχνικών. Το μέγεθος (Pea Signal to Noise Ratio) ορίζεται σαν: = 10log10 (255* 255 / MSE), MSE 1 H * W H 1W 1 = h= 0 w= 0 x or ( h, w) x rec ( h, w) 2 (6) όπου το MSE (Mean Square Error), είναι η παραμόρφωση που υφίσταται η εικόνα μετά την ανασύστασή της στο δέκτη και τον αντίστροφο μετασχηματισμό. ΠΙΝΑΚΑΣ 1 Lena Barbara Lena Barbara Lena Barbara Rate (b/p) Rate (b/p) Rate (b/p) Wavelet 1.0 39.24 34.35 0.5 36.16 29.67 0.25 33.04 26.02 EZW 1.0 39.55 35.14 0.5 36.28 30.53 0.25 33.17 26.77 Best Tree 1.0 39.32 36.28 0.5 36.26 31.67 0.25 33.24 28.06 Είναι φανερή η διαφορά της απόδοσης των δύο αλγορίθμων σε σχέση με τον αμιγή μετασχηματισμό. Η απόδοση ενός αλγορίθμου δεν μπορεί να κρίνεται μόνο από το, γιατί είναι μία έκφραση του τετραγώνου του σφάλμτος, αλλά και από την υποκειμενική αντίληψη της ποιότητας της αναπαραγόμενης εικόνας (perceptual criterion). ΠΡΟΟΠΤΙΚΕΣ ΣΤΗ ΣΥΜΠΙΕΣΗ ΕΙΚΟΝΑΣ Η ανάλυση μονοδιάστατων σημάτων με την τεχνική των wavelets έχει δείξει ότι οι συναρτήσεις βάσης που αποτελούν την προσέγγιση του σήματος ή τα φίλτρα διέλευσης χαμηλών συχνοτήτων παρέχουν συντελεστές οι οποίοι περιγράφουν τις ομαλές μεταβολές του σήματος, ενώ οι συναρτήσεις βάσης που αποτελούν την λεπτομέρεια του σήματος ή τα φίλτρα διέλευσης υψηλών συχνοτήτων παρέχουν συντελεστές οι οποίοι περιγράφουν τις σημειακές απότομες μεταβολές του σήματος. Η συγκέντρωση όλων των μη μηδενικών συντελεστών που δημιουργούνται από μία ασυνέχεια του σήματος καλείται ίχνος (footprint), ενώ ο συνδυασμός αυτών των συντελεστών που προκαλούνται από μία ακμή εικόνας καλείται ίχνος ακμής (edgeprint), [12]. Με αυτό το τρόπο συνδυασμού των συντελεστών, έχουν αναπτυχθεί αλγόριθμοι για την αντιμετώπιση των αδυναμιών που έχουν τα wavelets να περιγράψουν με μεγάλη ακρίβεια τα δισδιάστατα σήματα. Μία άλλη θεώρηση, Σχ. 8 (α), είναι η ανάπτυξη δισδιάστατων συναρτήσεων βάσης οι οποίες καλούνται συναρτήσεις ακμής ή ridgelets, [13]. Η ιδέα είναι, με τη βοήθεια του μετασχηματισμού Radon, να μετατραπεί η μονοδιάστατη ασυνέχεια μίας ακμής σε σημειακή στους δύο άξονες, όπου θα εφαρμοσθεί ο μετασχηματισμός με wavelets. Ακόμα μπορούν να δημιουργηθούν συναρτήσεις βάσεις, οι οποίες να προέρχονται από φίλτρα με κατευθυντικές ιδιότητες (Directional Filter Ban), Σχ. 8, ή γενικότερα συναρτήσεις οι οποίες να παράγουν συντελεστές που θα περικλείουν και χαρακτηριστικά κατεύθυνσης (Curvelet Transform), [12][14]. 9
(α) Σχ. 8 (α) Δισδιάστατη συνάρτηση βάσης, ridgelet (b) Ομάδα 8 φίλτρων με κατευθυντικές ιδιότητες ΑΝΑΦΟΡΕΣ [1] A.Sodras, C.Christopoulos, T.Ebrahimi, The JPEG 2000 Still Image Compression Standard, IEEE Signal Processing Magazine, Sept. 2001, pp. 36-58. [2] C.S.Burrus, R.A.Gopinath, H.Guo, Introduction to Wavelets and Wavelet Transforms, Prentice Hall, 1998, pp. 2-18. [3] M. Vetterli, J. Kovacevic, Wavelets and Subband Coding, Prentice Hall. [4] G. Strang, T. Nguyen, Wavelets and Filter Bans, Wellesley,1997. [5] S. Mallat, A theory for multiresolution signal decomposition: the wavelet representation, IEEE Trans. PAMI, vol. 11, no. 7, pp. 674-693. [6] J.N.Bradley, C.M.Brislawn, T.Hopper, The FBI wavelet/scalar quantization standard for gray-scale fingerprint image compression, Proc. SPIE Conf. Visual Communication and Image Procesing, Orlando, FL, Apr. 1993. [7] R.R.Coifman, M.V.Wicerhauser, Entropy-based algorithms for best basis selection, IEEE Trans. on Inf. Theory, vol. 38, 2, pp. 713-718. [8] J. Shapiro, Embedded image coding using zerotrees of wavelet coefficients, IEEE Trans. Signal Processing, vol. 41, pp. 3445-3462, Dec. 1993. [9] K.Ramchandran, M.Vetterli, Best Wavelet Pacet Bases in a Rate-Distortion Sense, IEEE Trans. Image Processing,vol. 2, pp. 160-176, April 1993. [10] C.Herley, J.Kovacevic, K.Ramchandran, M.Vetterli, Tilings of the Time- Frequency Plane: Construction of Arbitrary Orthogonal Bases and Fast Tiling Algorithms, IEEE Trans. Signal Processing, vol. 41, No. 12, pp. 3341-3359. [11] C.Herley, Z.Xiong, K.Ramchandran, M.T.Orchard, Joint Space-Frequency Segmentation Using Balanced Wavelet pacet trees for Least-Cost Image Representation, IEEE Trans. Image Processing, vol. 6, pp. 1213-1230, Sept. 1997. [12] M.Vetterli, Wavelets, Approximation and Compression, IEEE Signal Processing Magazine, Sept 2001, pp. 59-73. [13] E.Candes, D.L.Donoho, Ridgelets: A ey to higher-dimensional intermittency?, Phil. Trans. R. Soc. London A., 1999, pp. 2495-2509. [14] D.L. Donoho, M.R. Duncan, Digital Curvelet Transform: Strategy, Implementation and Experiments, Stanford University, Nov. 1999. 10