ΣΥΓΧΡΟΝΕΣ ΤΕΧΝΙΚΕΣ ΣΥΜΠΙΕΣΗΣ ΕΙΚΟΝΑΣ

Σχετικά έγγραφα
Ψηφιακή Επεξεργασία Εικόνας

Συμπίεση Δεδομένων

Συστήματα Πολυμέσων. Ενότητα 8: Συμπίεση Εικόνας κατά JPEG Θρασύβουλος Γ. Τσιάτσος Τμήμα Πληροφορικής ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

Ψηφιακή Επεξεργασία Εικόνας

Ψηφιακή Επεξεργασία Σημάτων

Τι είναι το JPEG2000?

Ψηφιακή Επεξεργασία Εικόνας

Επεξεργασία Πολυµέσων. Δρ. Μαρία Κοζύρη Π.Μ.Σ. «Εφαρµοσµένη Πληροφορική» Τµήµα Ηλεκτρολόγων Μηχανικών & Μηχανικών Υπολογιστών Πανεπιστήµιο Θεσσαλίας

Κωδικοποίηση ήχου. Σύστημα ακοής MP3 / MP4 Κωδικοποίηση φωνής

ΕΡΕΥΝΗΤΙΚΑ ΠΡΟΓΡΑΜΜΑΤΑ ΑΡΧΙΜΗΔΗΣ ΕΝΙΣΧΥΣΗ ΕΡΕΥΝΗΤΙΚΩΝ ΟΜΑΔΩΝ ΣΤΟ ΤΕΙ ΣΕΡΡΩΝ. Ενέργεια στ ΘΕΜΑ ΕΡΕΥΝΑΣ: ΔΙΑΡΘΡΩΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΕΧΡΩΜΩΝ ΕΓΓΡΑΦΩΝ

3. ΤΕΧΝΙΚΕΣ ΣΥΜΠΙΕΣΗΣ ΠΟΛΥΜΕΣΩΝ

Μετάδοση πληροφορίας - Διαμόρφωση

Συμπίεση Δεδομένων

Ψηφιακή Επεξεργασία και Ανάλυση Εικόνας Ενότητα 2 η : Δισδιάστατα Σήματα & Συστήματα Μέρος 2

Ήχος. Τεχνολογία Πολυμέσων και Πολυμεσικές Επικοινωνίες 04-1

Παλμοκωδική Διαμόρφωση. Pulse Code Modulation (PCM)

Ψηφιακές Τηλεπικοινωνίες. Θεωρία Ρυθμού Παραμόρφωσης

Συμπίεση Δεδομένων

Μετάδοση πληροφορίας - Διαμόρφωση

Παλμοκωδική Διαμόρφωση. Pulse Code Modulation (PCM)

Συμπίεση Πολυμεσικών Δεδομένων

Τεχνολογία Πολυμέσων. Ενότητα # 4: Ήχος Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής

ΕΡΓΑΣΤΗΡΙΑΚΗ ΑΣΚΗΣΗ 4 ΠΑΛΜΟΚΩΔΙΚΗ ΔΙΑΜΟΡΦΩΣΗ - PCM (ΜΕΡΟΣ Α)

Τηλεπικοινωνιακά Συστήματα ΙΙ

ΘΕΩΡΙΑ ΠΛΗΡΟΦΟΡΙΑΣ. Κεφάλαιο 3 : Πηγές Πληροφορίας Χρήστος Ξενάκης. Πανεπιστήμιο Πειραιώς, Τμήμα Ψηφιακών Συστημάτων

ιαφορική εντροπία Σεραφείµ Καραµπογιάς

Ψηφιακές Τηλεπικοινωνίες

Τηλεπικοινωνίες. Ενότητα 5: Ψηφιακή Μετάδοση Αναλογικών Σημάτων. Μιχάλας Άγγελος Τμήμα Μηχανικών Πληροφορικής ΤΕ

Ψηφιακή Επεξεργασία Σηµμάτων

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΛΟΠΟΝΝΗΣΟΥ

Μετάδοση Πολυμεσικών Υπηρεσιών Ψηφιακή Τηλεόραση

Συµπίεση Δεδοµένων: Συµπίεση Ψηφιακού Βίντεο

Ψηφιακές Τηλεπικοινωνίες. Διαμόρφωση Παλμών κατά Πλάτος

Τεχνολογία Πολυμέσων. Ενότητα # 11: Κωδικοποίηση εικόνων: JPEG Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Ανώτατο Εκπαιδευτικό Ίδρυμα Πειραιά Τεχνολογικού Τομέα ΕΠΕΞΕΡΓΑΣΙΑ ΕΙΚΟΝΑΣ. Ενότητα 4: Δειγματοληψία και Κβάντιση Εικόνας

Τμήμα Μηχανικών Η/Υ και Πληροφορικής

Ψηφιακή Επεξεργασία Εικόνας

Αρχές κωδικοποίησης. Τεχνολογία Πολυμέσων και Πολυμεσικές Επικοινωνίες 08-1

Ψηφιακή Επεξεργασία και Ανάλυση Εικόνας. Παρουσίαση Νο. 3. Δισδιάστατα σήματα και συστήματα #2

χωρίςναδηµιουργείταιαίσθησηαπώλειαςτηςποιότηταςτηςανακατασκευασµένηςεικόνας.

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Ανώτατο Εκπαιδευτικό Ίδρυμα Πειραιά Τεχνολογικού Τομέα ΣΗΜΑΤΑ & ΣΥΣΤΗΜΑΤΑ

Μάθημα 7 ο. Συμπίεση Εικόνας ΤΜΗΥΠ / ΕΕΣΤ 1

Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών Τμήμα Φυσικής Εισαγωγή στα Συστήματα Τηλεπικοινωνιών Συστήματα Παλμοκωδικής Διαμόρφωσης

Εισαγωγή στις Τηλεπικοινωνίες

Ψηφιακή Επεξεργασία και Ανάλυση Εικόνας Ενότητα 6 η : Συμπίεση Εικόνας. Καθ. Κωνσταντίνος Μπερμπερίδης Πολυτεχνική Σχολή Μηχανικών Η/Υ & Πληροφορικής

Συμπίεση Δεδομένων

ΗΜΥ 100 Εισαγωγή στην Τεχνολογία

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΛΟΠΟΝΝΗΣΟΥ

Συστήµατα και Αλγόριθµοι Πολυµέσων

MPEG-4: Βασικά Χαρακτηριστικά

Ψηφιακές Τηλεπικοινωνίες. Πιθανότητα Σφάλματος για Δυαδική Διαμόρφωση

Αρχές Τηλεπικοινωνιών

Θεώρημα κωδικοποίησης πηγής

Ψηφιακή Επεξεργασία Εικόνας

Διάλεξη 3. Δειγματοληψία και Ανακατασκευή Σημάτων. Δειγματοληψία και Ανακατασκευή Σημάτων. (Κεφ & 4.6,4.8)

ΕΡΓΑΣΤΗΡΙΟ ΑΝΑΛΟΓΙΚΩΝ & ΨΗΦΙΑΚΩΝ ΕΠΙΚΟΙΝΩΝΙΩΝ

Ψηφιακές Τηλεπικοινωνίες. Δισδιάστατες Κυματομορφές Σήματος

Μελέτη και Προσομοίωση n πομπού για ασύρματη πρόσβαση ΦΟΙΤΗΤΗΣ: ΛΑΖΑΡΙΔΗΣ ΚΩΝΣΤΑΝΤΙΝΟΣ ΕΠΙΒΛΕΠΩΝ ΚΑΘΗΓΗΤΗΣ: ΕΥΣΤΑΘΙΟΥ ΔΗΜΗΤΡΙΟΣ

Ιατρικά Ηλεκτρονικά. Χρήσιμοι Σύνδεσμοι. ΙΑΤΡΙΚΑ ΗΛΕΚΤΡΟΝΙΚΑ - ΔΙΑΛΕΞΗ 5α. Σημειώσεις μαθήματος: E mail:

Συμπίεση Δεδομένων

Συστήματα Επικοινωνιών ΙI

Συµπίεση Ψηφιακών Εικόνων: Συµπίεση µε Απώλειες. Πρότυπα Συµπίεσης Εικόνων

Συστήματα Πολυμέσων. Ενότητα 2: Εισαγωγικά θέματα Ψηφιοποίησης. Θρασύβουλος Γ. Τσιάτσος Τμήμα Πληροφορικής ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

Τεράστιες ανάγκες σε αποθηκευτικό χώρο

Συµπίεση Εικόνας: Το πρότυπο JPEG

ΚΕΦΑΛΑΙΟ ΠΕΜΠΤΟ ΜΕΤΑΤΡΟΠΗ ΑΝΑΛΟΓΙΚΟΥ ΣΗΜΑΤΟΣ ΣΕ ΨΗΦΙΑΚΟ

ΒΕΣ 04: Συµπίεση και Μετάδοση Πολυµέσων. Περιεχόµενα. Βιβλιογραφία. Συµπίεση εικόνων: Το πρότυπο JPEG. Εισαγωγή. Ευθύς µετασχηµατισµός DCT

Τεχνολογία Πολυμέσων. Ενότητα # 8: Αρχές κωδικοποίησης Διδάσκων: Γεώργιος Ξυλωμένος Τμήμα: Πληροφορικής

Περιεχόµενα. ΕΠΛ 422: Συστήµατα Πολυµέσων. Βιβλιογραφία. Εισαγωγή. Συµπίεση εικόνων: Το πρότυπο JPEG. Εισαγωγή. Ευθύς µετασχηµατισµός DCT

Αναλογικά & Ψηφιακά Κυκλώματα ιαφάνειες Μαθήματος ρ. Μηχ. Μαραβελάκης Εμ.

Συστήματα Πολυμέσων. Ενότητα 3: Εισαγωγικά θέματα Συμπίεσης. Θρασύβουλος Γ. Τσιάτσος Τμήμα Πληροφορικής ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

Επεξεργασία Πολυµέσων. Δρ. Μαρία Κοζύρη Π.Μ.Σ. «Εφαρµοσµένη Πληροφορική» Τµήµα Ηλεκτρολόγων Μηχανικών & Μηχανικών Υπολογιστών Πανεπιστήµιο Θεσσαλίας

ΕΡΓΑΣΤΗΡΙΟ ΑΝΑΛΟΓΙΚΩΝ & ΨΗΦΙΑΚΩΝ ΕΠΙΚΟΙΝΩΝΙΩΝ

Digital Image Processing

Χρήστος Ξενάκης. Πανεπιστήμιο Πειραιώς, Τμήμα Ψηφιακών Συστημάτων

Διαδικασία Ψηφιοποίησης (1/2)

Τμήμα Μηχανικών Η/Υ και Πληροφορικής

Δ13b. Συμπίεση Δεδομένων

Αρχές κωδικοποίησης. Τεχνολογία Πολυµέσων 08-1

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Ανώτατο Εκπαιδευτικό Ίδρυμα Πειραιά Τεχνολογικού Τομέα ΕΠΕΞΕΡΓΑΣΙΑ ΕΙΚΟΝΑΣ. Ενότητα 5: Μετασχηματισμοί Εικόνας.

Α.Τ.Ε.Ι. ΜΑΚΕΔΟΝΙΑΣ Τμήμα πληροφορικής και επικοινωνιών. Συμπίεση ψηφιακών εικόνων με ανάλυση κύριων συνιστωσών και χρήση νευρωνικού δικτύου.

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Ανώτατο Εκπαιδευτικό Ίδρυμα Πειραιά Τεχνολογικού Τομέα ΕΠΕΞΕΡΓΑΣΙΑ ΕΙΚΟΝΑΣ. Ενότητα 6: Κωδικοποίηση & Συμπίεση Εικόνας

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΛΟΠΟΝΝΗΣΟΥ

Μία μέθοδος προσομοίωσης ψηφιακών κυκλωμάτων Εξελικτικής Υπολογιστικής

Σταθερή περιβάλλουσα (Constant Envelope)

Παράμετροι σχεδίασης παλμών (Μορφοποίηση παλμών)

Ψηφιακές Τηλεπικοινωνίες

Εισαγωγή στις Τηλεπικοινωνίες / Εργαστήριο

Συστήματα Επικοινωνιών ΙI

Κινητά Δίκτυα Επικοινωνιών. Συμπληρωματικό υλικό. Προσαρμοστική Ισοστάθμιση Καναλιού

Εισαγωγή στα Σήματα. Κυριακίδης Ιωάννης 2011

Θέματα Συστημάτων Πολυμέσων. Ενότητα # 7: JPEG Διδάσκων: Γεώργιος Πολύζος Τμήμα: Μεταπτυχιακό Πρόγραμμα Σπουδών Επιστήμη των Υπολογιστών

Ιατρικά Ηλεκτρονικά. Δρ. Π. Ασβεστάς Εργαστήριο Επεξεργασίας Ιατρικού Σήματος & Εικόνας Τμήμα Τεχνολογίας Ιατρικών Οργάνων

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΛΟΠΟΝΝΗΣΟΥ

DIP_06 Συμπίεση εικόνας - JPEG. ΤΕΙ Κρήτης

HMY 429: Εισαγωγή στην Επεξεργασία Ψηφιακών

Επεξεργασία Πολυµέσων. Δρ. Μαρία Κοζύρη Π.Μ.Σ. «Εφαρµοσµένη Πληροφορική» Τµήµα Ηλεκτρολόγων Μηχανικών & Μηχανικών Υπολογιστών Πανεπιστήµιο Θεσσαλίας

4. ΚΕΦΑΛΑΙΟ ΕΦΑΡΜΟΓΕΣ ΤΟΥ ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΥ FOURIER

Δ10. Συμπίεση Δεδομένων

Ο μετασχηματισμός wavelet (Discrete Wavelet Transform, DWT) έχει χρησιμοποιηθεί με επιτυχία στη συμπίεση εικόνας6

Transcript:

ΣΥΓΧΡΟΝΕΣ ΤΕΧΝΙΚΕΣ ΣΥΜΠΙΕΣΗΣ ΕΙΚΟΝΑΣ Ιωάννης Έλληνας Επίκουρος Καθηγητής Τ.Ε.Ι Πειραιά - Τμήμα Υπολογιστικών Συστημάτων Π. Ράλλη & Θηβών 250, 12244 Αιγάλεω email: jellin@teipir.gr Μανώλης Σαγκριώτης Επίκουρος Καθηγητής Εθνικό και Καποδιστριακό Παν/μιο Αθηνών Τμήμα Πληροφορικής Πανεπιστημιούπολη - Ιλίσια 157 84 Αθήνα email: sagri@di.uoa.gr ΠΕΡΙΛΗΨΗ Η παρούσα εργασία, με αφορμή την υιοθέτηση του JPEG2000, περιγράφει δύο χαρακτηριστικούς αλγόριθμους για την συμπίεση εικόνων. Οι αλγόριθμοι αυτοί βασίζονται στο μετασχηματισμό με wavelets και γενικά είτε ενεργούν στη μορφολογία και συσχέτιση των παραγομένων συντελεστών είτε στην εύρεση ενός βέλτιστου συνδυασμού ρυθμού δεδομένων (bit rate) και παραμόρφωσης (distortion). Στην εργασία αυτή γίνεται αρχικά μία αναφορά στον χρησιμοποιούμενο μετασχηματισμό και στη συνέχεια αναλύονται οι τεχνικές συμπίεσης. Στη συνέχεια παρουσιάζονται πειραματικά δεδομένα από την εφαρμογή αυτών των τεχνικών και γίνεται σύγκριση. Τέλος γίνεται αναφορά στη τρέχουσα ερευνητική δραστηριότητα σχετικά με την συμπίεση εικόνων. ΕΙΣΑΓΩΓΗ Το πρότυπο JPEG χρησιμοποιείται από το 1992 και αποδείχτηκε ένα πολύ χρήσιμο εργαλείο για την επεξεργασία της ψηφιακής εικόνας. Σήμερα, όπου η ψηφιακή εικόνα είναι ενσωματωμένη δυνατότητα στο διαδίκτυο, στη τηλεομοιοτυπία, σε εμπορικές συσκευές φωτογραφίας και video, στην τηλεϊατρική κλπ, το νέο πρότυπο JPEG2000 έρχεται να συμπληρώσει με νέες δυνατότητες το ήδη υπάρχον πρότυπο. Μερικές από τις δυνατότητες του νέου προτύπου είναι, [1]: Πολύ καλά χαρακτηριστικά εικόνας για χαμηλούς ρυθμούς μετάδοσης π.χ μικρότερους από 0.25 bits/pixel. Δυναμική συμπεριφορά για την επεξεργασία εικόνων με διαφορετικά χαρακτηριστικά π.χ από εικόνες με ομαλή εναλλαγή τόνου μέχρι εικόνες με έντονες μεταβολές (bilevel or binary images). Λειτουργία συμπίεσης με ή χωρίς απώλειες. Σταδιακή μετάδοση, η οποία εξασφαλίζει μεταβλητή ανάλυση της λαμβανομένης εικόνας. Κωδικοποίηση μέρους μίας εικόνας με διαφορετική ανάλυση. Συμπαγής συμπεριφορά σε σφάλματα μετάδοσης. Το Σχ. 1 δίνει το μπλόκ διάγραμμα ενός συστήματος JPEG 2000. Διακρίνονται τα τμήματα κωδικοποίησης και αποκωδικοποίησης. 1

Μετασχ/σμός Κβαντιστής Κωδικοποιητής εντροπίας Συμπιεσμένα δεδομένα Εικόνα Ανασχηματισμένη Εικόνα Αποθήκευση ή Μετάδοση Αντίστροφος Μετασχ/σμός Αντίστροφη κβάντιση Αποκωδικοποίηση εντροπίας Συμπιεσμένα δεδομένα Σχ. 1 Μπλόκ διάγραμμα συστήματος JPEG 2000 Η εργασία αυτή επικεντρώνεται στην καρδιά αυτού του προτύπου, που είναι ο μετασχηματισμός ενός σήματος με wavelets. ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΣ WAVELETS Μία συνάρτηση f(t) μπορεί να αναλυθεί γραμμικά με την σχέση: f ( t) = alψ l ( t) (1) l όπου α l είναι οι συντελεστές ανάλυσης της συνάρτησης και ψ l είναι οι συναρτήσεις ανάλυσης, οι οποίες καλούνται βάση, εαν η παραπάνω ανάλυση είναι μοναδική. Εαν οι συναρτήσεις βάσης είναι ορθογώνιες συναρτήσεις δηλ. ψ ( t), ψ ( t) = ψ ( t) ψ ( t) dt = 0 για l (2) l οι συντελεστές μπορούν να υπολογισθούν από τη σχέση: a l = f ( t), ψ ( t) = f ( t) ψ ( t dt (3) ) όπου η f(t) δίνεται από τη σχέση (1). Εαν οι συναρτήσεις βάσης δεν είναι ορθογώνιες, τότε υπάρχει μία άλλη βάση, ~ ψ ( t ), η οποία δίνει τους συντελεστές μετασχηματισμού με τη σχέση (3). Για τη σειρά Fourier, οι ορθογώνιες συναρτήσεις είναι οι sin(ω 0 t) και cos(ω 0 t). Ο διακριτός μετασχηματισμός wavelets (DWT) δίνεται από τους συντελεστές της σχέσης: f ( α j, ψ j, t j t) = ( ) (4) όπου α j, και ψ j, είναι οι συντελεστές και οι συναρτήσεις ανάλυσης με wavelets, η δε σχέση (4) είναι ο αντίστροφος μετασχηματισμός. 2

Συμπερασματικά η συνάρτηση f(t) μπορεί να αντιπροσωπευθεί από αυτούς τους συντελεστές, οι οποίοι προκύπτουν σαν εσωτερικό γινόμενο της συνάρτησης με την ορθογώνια βάση συναρτήσεων. Αντίστροφα η επιθυμητή συνάρτηση μπορεί να αναπαραχθεί από αυτούς τους συντελεστές και τις συναρτήσεις βάσης. Οι συναρτήσεις βάσεις ή wavelets παράγονται από μία αρχική συνάρτηση, η οποία καλείται mother wavelet, εαν μεταβληθεί το εύρος της (scaling) και μετατοπισθεί στο χρόνο (translation) [2], [3], [4]. Οι συντελεστές ανάλυσης είναι δύο διαστάσεων, (j =μεταβολή διάρκειας ή scaling, =χρονική μετατόπιση ή translation), γιατί προέρχονται από ανάλογες συναρτήσεις βάσης. Έτσι ο μετασχηματισμός αυτός έχει το πλεονέκτημα σε σύγκριση με τον Fourier, να αναλύει ένα σήμα τόσο στο χρόνο όσο και στη συχνότητα. Μία σημαντική δυνατότητα είναι να προσδιορίζει με ακρίβεια μία ασυνέχεια στο πεδίο του χρόνου. V3 V2 V1 V0 Ανάλυση Μέση τιμή Λεπτομέρεια 4 [9 7 3 5] 2 [8 4] [1-1] 1 [6] [2] W 2 W 1 W 0 V 0 Μετασχηματισμός [ 6 2 1 1] (α) Σχ. 2 (α) Τα διαστήματα ορισμού των συναρτήσεων βάσης προσέγγισης (scaling) και λεπτομέρειας (detail ή wavelet). Αριθμητικό παράδειγμα μετασχηματισμού ενός διανύσματος [9 7 3 5]. Στο Σχ. 2(α) ένα σήμα μπορεί να αναλυθεί σε ένα διάστημα V j με την βοήθεια συναρτήσεων βάσης που μπορούν να ανήκουν σε αυτό σύμφωνα με την (4) ή μπορεί να αναλυθεί με μία συνάρτηση προσέγγισης (scaling function) η οποία ανήκει στο βασικό διάσημα V 0 ή σε άλλο και με μία συνάρτηση λεπτομέρειας (wavelet function) η οποία ανήκει στη διαφορά των διαστημάτων. Το Σχ. 2 δίνει ένα χαρακτηριστικό αριθμητικό παράδειγμα αυτής της προσέγγισης, στο οποίο φαίνεται πως ένα σήμα [9 7 3 5] μπορεί να μετασχηματισθεί σε μία ομάδα συντελεστών [6 2 1 1], η οποία αποτελείται από μία προσέγγιση (χαμηλή συχνότητα) και τις λεπτομέρειες (υψηλή συχνότητα). Το αρχικό σήμα μπορεί να ανακτηθεί από αυτούς τους συντελεστές στην επιθυμητή ανάλυση, με το πλεονέκτημα όμως ότι τα μεγέθη των συντελεστών είναι μικρότερα του αρχικού σήματος (κυρίως των συντελεστών λεπτομέρειας) και επομένως η μετάδοση μπορεί να γίνει με λιγότερα bits. Ακόμα η παράλειψη κάποιου συντελεστή λεπτομέρειας δεν δημιουργεί μεγάλο σφάλμα. Έτσι ένα σήμα μπορεί να αναλυθεί σε ένα διάστημα με την σχέση: f ( t) = c( ) φ ( t) + d( j, ) ψ ( ) (5) = j= 0 = j, t 3

Σήμα (α) Wavelet Χρονική μετατόπιση (Translation) (γ) (δ) Αλλαγή διάρκειας (Scaling) Σχ. 3 Διαδικασία ανάλυσης σήματος με μετασχηματισμό wavelet Πρακτικά, όπως φαίνεται από το Σχ. 3, επιλέγεται ένα wavelet και υπολογίζεται ο συντελεστής ο οποίος μαζί με αυτό δείχνει πόσο κοντά είναι στο σήμα. Όσο μεγαλύτερο μέγεθος έχει ο συντελεστής, τόσο πιο πιστή είναι η ανάλυση του σήματος. Το ίδιο επαναλαμβάνεται με χρονική ολίσθηση του wavelet μέχρι την κάλυψη όλου του σήματος. Τέλος το wavelet μεταβάλλεται στο χρόνο (scaled), έτσι ώστε να δώσει διαφορετική ανάλυση (resolution), και η διαδικασία επαναλαμβάνεται. ΚΩΔΙΚΟΠΟΙΗΣΗ ΖΩΝΗΣ ΚΑΙ WAVELETS Μία άλλη θεώρηση της παραπάνω ανάλυσης είναι η θεωρία της κωδικοποίησης ζωνών (subband coding) [5], σύμφωνα με την οποία το σήμα περνά μέσα από διαδοχικά ζευγάρια φίλτρων (φίλτρα ανάλυσης), τα οποία παράγουν τους συντελεστές ανάλυσης. Αυτοί με τη σειρά τους στο δέκτη μπορούν να αναπαράγουν το αρχικό σήμα εαν περάσουν από διαδοχικά ζευγάρια φίλτρων (φίλτρα σύνθεσης), τα οποία πρέπει να έχουν ειδική σχέση με τα φίλτρα ανάλυσης έτσι ώστε το αρχικό σήμα να αναπαράγεται χωρίς απώλεια των χαρακτηριστικών του. Το σύνολο αυτών των φίλτρων λέγεται PRB (Perfect Reconstruction Ban) και βασική τους ιδιότητα είναι ότι είναι μεταξύ τους ορθογώνια. Η ορθογώνια συνθήκη, η οποία τέθηκε και στην προηγούμενη ανάλυση, πρέπει να διέπει τον μετασχηματισμό έτσι ώστε η ενέργεια του αρχικού σήματος να είναι ίδια με την ενέργεια των παραγομένων συντελεστών (Θεώρημα Parseval). Το Σχ. 4 (α) δείχνει την μέθοδο ανάλυσης ενός σήματος με την θεωρία των ζωνών. Τα φίλτρα χαμηλής συχνότητας αντιπροσωπεύουν την προσέγγιση ή approximation και τα φίλτρα υψηλής συχνότητας την λεπτομέρεια ή detail της προηγούμενης ανάλυσης. Η ανάλυση μόνο της χαμηλής συχνότητας, Σχ. 4, καλείται ανάλυση wavelet ή wavelet decomposition, ενώ η ανάλυση και των δύο περιοχών συχνοτήτων, Σχ. 4(γ), καλείται ανάλυση πακέτου με wavelet ή wavelet pacet decomposition. Οι δειγματολήπτες χρησιμοποιούνται έτσι ώστε οι παραγόμενοι συντελεστές μετά από τα φίλτρα να είναι ίδιου πλήθους με την ανάλυση του σήματος εισόδου. 4

(α) Υποδειγματοληψία (Downsampling) (Downsampling) Υπερδειγματοληψία (Upsampling) Ανάλυση (Decomposition) Σύνθεση (Reconstruction) (γ) Σχ. 4 (α) Δυαδικός μετασχηματισμός με την χρήση φίλτρων Χ.Σ και Υ.Σ Wavelet decomposition (γ) Wavelet pacet decomposition Έτσι ένα σήμα εισόδου S, μπορεί να αναλυθεί σαν: S=A 3 +D 3 +D 2 +D 1 ή S=A 2 +D 2 +D 1 ή S=A 1 +D 1. Όμοια μπορεί να αναλυθεί σαν: S=A 1 +AAD 3 +DAD 3 +ADD 3 +DDD 3 δίνοντας την επιθυμητή προσέγγιση και τις λεπτομέρειες. Το δέντρο που σχηματίζεται καλείται wavelet tree και η δομή του μεταφέρεται μαζί με τους συντελεστές στο δέκτη και αποκωδικοποιητή για την ανασύσταση του αρχικού σήματος. ΣΥΜΠΙΕΣΗ ΕΙΚΟΝΑΣ Το Σχ. 4(γ) είναι ο μετασχηματισμός ενός μονοδιάστατου σήματος σε τρία επίπεδα. Η ανάλυση ενός δισδιάστατου σήματος, όπως η εικόνα, περιλαμβάνει την ανάλυση πρώτα των σειρών και μετά των στηλών της και επομένως κάθε επίπεδο μετασχηματισμού αποτελείται απο ομάδα τεσσάρων φίλτρων. Οι παραγόμενοι συντελεστές ενός επιπέδου αντιπροσωπεύουν την προσέγγιση και τις λεπτομέρειες (Οριζόντια-Κάθετη-Διαγώνια) και είναι: ca= Approximation coefficient ch=horizontal detail cv=vertical detail cd=diagonal detail Το Σχ. 5 δείχνει τον μετασχηματισμό μίας εικόνας, (α), μετά από ένα ή δύο επίπεδα, και (γ). 5

ca1 (LL) cv1(hl) (α) ch1(lh) cd1(hh) ca1 (γ) Σχ. 5 (α) Αρχική εικόνα (Barbara). Απεικόνιση των συντελεστών μετασχηματισμού ενός επιπέδου. (γ) Μετασχηματισμός δευτέρου επιπέδου της προσέγγισης του πρώτου. Είναι φανερό ότι οι συντελεστές προσέγγισης, οι οποίοι προέρχονται από τα φίλτρα χαμηλής συχνότητας (LowLow ή LL), δίνουν την πλησιέστερη εκδοχή της εικόνας ή πληροφορίες για περιοχές με ομαλή μεταβολή φωτεινότητας, ενώ οι συντελεστές λεπτομέρειας, οι οποίοι προέρχονται από τα φίλτρα υψηλής συχνότητας (LH, HL, HH), δίνουν πληροφορίες για τις ακμές της και για περιοχές όπου υπάρχει σημαντική μεταβολή στη φωτεινότητα. Η συμπίεση των δεδομένων ήδη έχει δημιουργηθεί με τον μετασχηματισμό, αλλά μπορεί να γίνει μεγαλύτερη με τους εξής τρόπους: Με την χρήση ομοιόμορφου κβαντιστή με μηδενική περιοχή, έτσι ώστε οι συντελεστές μικρού πλάτους να μηδενισθούν (μέθοδος WSQ Wavelet Scalar Quantization) [6]. Με την ανάπτυξη του βέλτιστου δέντρου μετασχηματισμού χρησιμοποιώντας την εντροπία σαν κριτήριο, όπου ένας κλάδος μετασχηματισμού (Parent) μπορεί να αναλυθεί στο επόμενο επίπεδο (Children) μόνο εαν έχει μεγαλύτερη εντροπία ( Sum(children entropies)<parent entropy) [7]. Στη παρούσα εργασία εξετάζονται δύο σημαντικοί αλγόριθμοι συμπίεσης εικόνας από τους πολλούς που έχουν αναπτυχθεί. ΑΛΓΟΡΙΘΜΟΣ ΣΥΜΠΙΕΣΗΣ ΕΖW Ο αλγόριθμος EZW (Embedded Zero-tree Wavelet), [8], μία βελτιωμένη εκδοχή του οποίου έχει υιοθετηθεί στο JPEG 2000, παρουσιάζει καλύτερη απόδοση από το JPEG σε χαμηλούς ρυθμούς μετάδοσης. 6

(α) Σχ. 6 (α) Η pdf μίας ζώνης υψηλών συχνοτήτων Μηδενικά δέντρα (zero-trees) Η ενέργεια του σήματος εισόδου τείνει να συγκεντρωθεί σε ένα σχετικά μικρό αριθμό συντελεστών του μετασχηματισμού. Σε ένα επίπεδο, η ενέργεια συγκεντρώνεται κυρίως στη ζώνη χαμηλών συχνοτήτων LL και σε ορισμένους συντελεστές των υπολοίπων ζωνών υψηλών συχνοτήτων LH, HL, HH της ίδιας ζώνης και των αντιστοίχων ζωνών (children) χαμηλοτέρων επιπέδων. Αυτή η συγκέντρωση φαίνεται στην pdf των συντελεστών των ζωνών υψηλών συχνοτήτων και η οποία έχει μορφή Laplacian, Σχ. 6 (a). Η καμπύλη αυτή δείχνει μία συγκέντρωση συντελεστών με μικρό μέγεθος γύρω από το μηδέν και την ύπαρξη λίγων συντελεστών με μεγαλύτερο μέγεθος οι οποίοι όμως συγκεντρώνουν και το μεγαλύτερο ποσοστό ενέργειας της ζώνης. Στις εικόνες του Σχ. 5 φαίνεται ότι οι σημαντικού μεγέθους συντελεστές, σε κάθε ζώνη, είναι συγκεντρωμένοι σε ορισμένες περιοχές (clusters) και οι περιοχές αυτές είναι ίδιες σε κάθε ζώνη (spatial interband dependency). Η ιδέα είναι να χρησιμοποιηθεί η πληροφορία της θέσης των σημαντικών συντελεστών σε μία ζώνη, για παράδειγμα της ζώνης χαμηλών συχνοτήτων LL, για την πρόβλεψη της θέσης των σημαντικών συντελεστών στις άλλες ζώνες (interband prediction), Σχ. 6. Η λειτουργία του αλγορίθμου EZW συνοψίζεται στα εξής: Σχηματίζεται ένας χάρτης σπουδαιότητας (significance map) που δείχνει εαν ένας συντελεστής είναι μεγαλύτερος (significant) ή μικρότερος (non-significant) ενός κατωφλίου (threshold) T. Επειδή τα σύνολα αυτών των μηδενικών συντελεστών είναι ιεραρχικά δομημένα στο χώρο και στη συχνότητα, λόγω του μετασχηματισμού των wavelets, ονομάζονται zero-trees. Η ταξινόμηση των bits γίνεται κατά τρόπο, ώστε τα πιό σημαντικά να μεταδίδονται πρώτα (embedded code stream). Το τελευταίο σημαίνει ότι η παραγωγή μίας εικόνας καλύτερης ποιότητας μπορεί να γίνει με την προσθήκη bits σε εικόνα χειρότερης ποιότητας ή το bit stream μίας εικόνας μπορεί να τερματισθεί και να παραχθεί μια εικόνα χειρότερης ποιότητας από εκείνη που θα παραγόταν εαν έφτανε ολόκληρο το bit stream στον δέκτη. Συμπερασματικά, ο αλγόριθμος EZW δεν απαιτεί πολύπλοκες διαδικασίες, δεν απαιτεί εκπαίδευση (training), ούτε κωδικοσελίδες όπως στις τεχνικές με διανυσματική κβάντιση (vector quantization), ούτε προηγούμενη γνώση της εικόνας. 7

ΑΛΓΟΡΙΘΜΟΣ ΒΕΛΤΙΣΤΟΥ ΔΕΝΤΡΟΥ ΩΣ ΠΡΟΣ R/D (Rate/Distortion) Ο αλγόριθμος αυτός, [9], αποτελεί την πρώτη προσέγγιση μίας σειράς τεχνικών οι οποίες βασίζονται στην κωδικοποίηση του βέλτιστου δέντρου που προκύπτει από την χωρική ή/και χρονική ανάπτυξη του πλήρους δέντρου, έτσι ώστε για μία δεδομένη ταχύτητα (bit rate budget) να προκύπτει η ελάχιστη δυνατή παραμόρφωση (distortion). Στο Σχ. 7 φαίνεται η ανάπτυξη ενός πλήρους δέντρου δύο επιπέδων, (α), και το βέλτιστο δέντρο το οποίο προκύπτει για ένα δεδομένo αριθμό bits, R b. Βέλτιστο δέντρο (Distortion=min R=R b ) (α) Σχ. 7 (α) 2-D wavelet pacet tree δύο επιπέδων. Βέλτιστο δέντρο. Το σήμα εισόδου αναλύεται σε διαδοχικά επίπεδα, τα οποία αποτελούνται από ομάδες συντελεστών που καλούνται κόμβοι (nodes). Κάθε κόμβος (parent node) αναλύεται στο επόμενο επίπεδο σε άλλους κόμβους (children nodes). Ο αλγόριθμος αυτός κλαδεύει (pruning) το αρχικό δέντρο, για να παραχθεί το βέλτιστο, με κριτήριο την ελάχιστη δυνατή συνολική παραμόρφωση για δεδομένο αριθμό bits. Η ανάλυση αυτή γίνεται με την βοήθεια του πολλαπλασιαστή Lagrange, λ, με την σχέση J=D+λR. Ο αλγόριθμος αυτός, bisection algorithm, προσπαθεί με διαδοχικές τιμές του λ, να επιτύχει την ελάχιστη παραμόρφωση. Οι κβαντιστές που χρησιμοποιούνται είναι ομοιόμορφοι και κοινοί για όλο το δέντρο. Η λειτουργία αυτού του αλγορίθμου συνοψίζεται στα εξής: Αναπτύσσεται όλο το δέντρο και υπολογίζεται το ελάχιστο κόστος κβάντισης J=D+λR για κάθε κόμβο και για μία αρχική τιμή του λ. Ξεκινώντας από τους τερματικούς κόμβους του δέντρου, εαν J parent > J children τότε ορθώς υπάρχει η ανάλυση του parent σε children, ενώ εαν J parent < J children οι κόμβοι children κλαδεύονται. Η διαδικασία συνεχίζεται μέχρι τον πρώτο κόμβο και επαναλαμβάνεται με άλλη τιμή του λ, έτσι ώστε να υπάρξει σύγκλιση προς την επιθυμητή τιμή των bits, R b. Ο αλγόριθμος αυτός εξαρτάται από το σήμα εισόδου και έχει καλή απόδοση σε στατικά σήματα εισόδου. Σε περιπτώσεις όπου το σήμα εισόδου μεταβάλλεται χρονικά, όπως στην εικόνα, η προσέγγιση πρέπει να γίνει με χωρική κατάτμηση του σήματος (spatial segmentation) και προσαρμογή του WP δέντρου-συχνότητας σε κάθε τμήμα. Αυτή η προσέγγιση λέγεται χωρική προσαρμογή των WP (spatial adaptive WP) και τέτοια είναι η προσέγγιση του αλγορίθμου διπλού δέντρου (double tree algorithm), [10], και η κατάτμηση χρόνου συχνότητας (space frequency algorithm), [11]. 8

ΣΥΓΚΡΙΣΗ ΤΩΝ ΔΥΟ ΤΕΧΝΙΚΩΝ Ο Πίνακας 1, περιέχει τα συγκριτικά στοιχεία των δύο αυτών τεχνικών. Το μέγεθος (Pea Signal to Noise Ratio) ορίζεται σαν: = 10log10 (255* 255 / MSE), MSE 1 H * W H 1W 1 = h= 0 w= 0 x or ( h, w) x rec ( h, w) 2 (6) όπου το MSE (Mean Square Error), είναι η παραμόρφωση που υφίσταται η εικόνα μετά την ανασύστασή της στο δέκτη και τον αντίστροφο μετασχηματισμό. ΠΙΝΑΚΑΣ 1 Lena Barbara Lena Barbara Lena Barbara Rate (b/p) Rate (b/p) Rate (b/p) Wavelet 1.0 39.24 34.35 0.5 36.16 29.67 0.25 33.04 26.02 EZW 1.0 39.55 35.14 0.5 36.28 30.53 0.25 33.17 26.77 Best Tree 1.0 39.32 36.28 0.5 36.26 31.67 0.25 33.24 28.06 Είναι φανερή η διαφορά της απόδοσης των δύο αλγορίθμων σε σχέση με τον αμιγή μετασχηματισμό. Η απόδοση ενός αλγορίθμου δεν μπορεί να κρίνεται μόνο από το, γιατί είναι μία έκφραση του τετραγώνου του σφάλμτος, αλλά και από την υποκειμενική αντίληψη της ποιότητας της αναπαραγόμενης εικόνας (perceptual criterion). ΠΡΟΟΠΤΙΚΕΣ ΣΤΗ ΣΥΜΠΙΕΣΗ ΕΙΚΟΝΑΣ Η ανάλυση μονοδιάστατων σημάτων με την τεχνική των wavelets έχει δείξει ότι οι συναρτήσεις βάσης που αποτελούν την προσέγγιση του σήματος ή τα φίλτρα διέλευσης χαμηλών συχνοτήτων παρέχουν συντελεστές οι οποίοι περιγράφουν τις ομαλές μεταβολές του σήματος, ενώ οι συναρτήσεις βάσης που αποτελούν την λεπτομέρεια του σήματος ή τα φίλτρα διέλευσης υψηλών συχνοτήτων παρέχουν συντελεστές οι οποίοι περιγράφουν τις σημειακές απότομες μεταβολές του σήματος. Η συγκέντρωση όλων των μη μηδενικών συντελεστών που δημιουργούνται από μία ασυνέχεια του σήματος καλείται ίχνος (footprint), ενώ ο συνδυασμός αυτών των συντελεστών που προκαλούνται από μία ακμή εικόνας καλείται ίχνος ακμής (edgeprint), [12]. Με αυτό το τρόπο συνδυασμού των συντελεστών, έχουν αναπτυχθεί αλγόριθμοι για την αντιμετώπιση των αδυναμιών που έχουν τα wavelets να περιγράψουν με μεγάλη ακρίβεια τα δισδιάστατα σήματα. Μία άλλη θεώρηση, Σχ. 8 (α), είναι η ανάπτυξη δισδιάστατων συναρτήσεων βάσης οι οποίες καλούνται συναρτήσεις ακμής ή ridgelets, [13]. Η ιδέα είναι, με τη βοήθεια του μετασχηματισμού Radon, να μετατραπεί η μονοδιάστατη ασυνέχεια μίας ακμής σε σημειακή στους δύο άξονες, όπου θα εφαρμοσθεί ο μετασχηματισμός με wavelets. Ακόμα μπορούν να δημιουργηθούν συναρτήσεις βάσεις, οι οποίες να προέρχονται από φίλτρα με κατευθυντικές ιδιότητες (Directional Filter Ban), Σχ. 8, ή γενικότερα συναρτήσεις οι οποίες να παράγουν συντελεστές που θα περικλείουν και χαρακτηριστικά κατεύθυνσης (Curvelet Transform), [12][14]. 9

(α) Σχ. 8 (α) Δισδιάστατη συνάρτηση βάσης, ridgelet (b) Ομάδα 8 φίλτρων με κατευθυντικές ιδιότητες ΑΝΑΦΟΡΕΣ [1] A.Sodras, C.Christopoulos, T.Ebrahimi, The JPEG 2000 Still Image Compression Standard, IEEE Signal Processing Magazine, Sept. 2001, pp. 36-58. [2] C.S.Burrus, R.A.Gopinath, H.Guo, Introduction to Wavelets and Wavelet Transforms, Prentice Hall, 1998, pp. 2-18. [3] M. Vetterli, J. Kovacevic, Wavelets and Subband Coding, Prentice Hall. [4] G. Strang, T. Nguyen, Wavelets and Filter Bans, Wellesley,1997. [5] S. Mallat, A theory for multiresolution signal decomposition: the wavelet representation, IEEE Trans. PAMI, vol. 11, no. 7, pp. 674-693. [6] J.N.Bradley, C.M.Brislawn, T.Hopper, The FBI wavelet/scalar quantization standard for gray-scale fingerprint image compression, Proc. SPIE Conf. Visual Communication and Image Procesing, Orlando, FL, Apr. 1993. [7] R.R.Coifman, M.V.Wicerhauser, Entropy-based algorithms for best basis selection, IEEE Trans. on Inf. Theory, vol. 38, 2, pp. 713-718. [8] J. Shapiro, Embedded image coding using zerotrees of wavelet coefficients, IEEE Trans. Signal Processing, vol. 41, pp. 3445-3462, Dec. 1993. [9] K.Ramchandran, M.Vetterli, Best Wavelet Pacet Bases in a Rate-Distortion Sense, IEEE Trans. Image Processing,vol. 2, pp. 160-176, April 1993. [10] C.Herley, J.Kovacevic, K.Ramchandran, M.Vetterli, Tilings of the Time- Frequency Plane: Construction of Arbitrary Orthogonal Bases and Fast Tiling Algorithms, IEEE Trans. Signal Processing, vol. 41, No. 12, pp. 3341-3359. [11] C.Herley, Z.Xiong, K.Ramchandran, M.T.Orchard, Joint Space-Frequency Segmentation Using Balanced Wavelet pacet trees for Least-Cost Image Representation, IEEE Trans. Image Processing, vol. 6, pp. 1213-1230, Sept. 1997. [12] M.Vetterli, Wavelets, Approximation and Compression, IEEE Signal Processing Magazine, Sept 2001, pp. 59-73. [13] E.Candes, D.L.Donoho, Ridgelets: A ey to higher-dimensional intermittency?, Phil. Trans. R. Soc. London A., 1999, pp. 2495-2509. [14] D.L. Donoho, M.R. Duncan, Digital Curvelet Transform: Strategy, Implementation and Experiments, Stanford University, Nov. 1999. 10