-- ΒΕΛΤΙΩΣΗ ΕΙΚΟΝΑΣ (ΦΙΛΤΡΑΡΙΣΜΑ) 3. Εισαγωγή Η βελτίωση εικόνας είναι συνήθως διαδικασία φιλτραρίσµατος δηλ. συνέλιξης µε συγκεκριµµένη διδιάσταση µάσκα και στοχεύει στην ανάδειξη χαρακτηριστικών ή ελάττωση θορύβου κλπ ανεπιθυµήτων χαρακτηριστικών. Στη διαδικασία βελτίωσης εικόνας το αποτέλεσµα είναι επίσης εικόνα και όχι κάποιο χαρακτηριστικό. Στο φιλτράρισµα εικόνας σπανιώτατα χρησιµοποιούµε ΙΙR φίλτρα ενώ αντιθετα FIR φίλτρα είναι η συνήθως χρησιµοποιούµενη διαδικασία. Εποµένως το φιλτράρισµα εικόνας είναι ουσιαστικά η πράξη συνέλιξης µεταξύ της αρχικής εικόνας και ενός συνόλου συντελεστών για το οποίο χρησιµοποιούνται οι όροι : παράθυρο, µάσκα (window, mask, template, kernel). Συνήθως τα παράθυρα είναι τετραγωνικά και οι συντελεστές συµµετρικοί. ύο τέτοια παράθυρα είναι τα Α, Β που δεικνύονται παρακάτω. Α= 0-0 - - 5 - Β= - - 5-0 - 0 ]Aν θεωρήσουµε µία εικόνα x(n,n ) διαστάσεως ΝxΝ pixels και ένα παράθυρο h(n,n ) τότε η συνέλιξη y(n,n ) = x(n,n )* h(n,n ) oρίζεται ως εξής: y(n,n ) = N N k k x(k,k )* h(n -k,n -k ) (3.) Η πράξη αυτή επειδή το h(n,n ) είναι πεπερασµένου µήκους (3x3, 5x5 κλπ) ουσιαστικά εκφράζει το άθροισµα των γινοµένων που προέρχεται απο την τιµή των pixels της εικόνας µε τους αντίστοιχους συντελεστές του παραθύρου. Το παράθυρο διατρέχει την εικόνα και κάθε φορά υπολογίζεται η παραπάνω τιµή για διαφορετικό σηµείο της εικόνας. ηλαδή: H συνέλιξη είναι απλά ένα σταθµικό άθροισµα (weighted sum) των στοιχείων της εικόνας (pixel) σε µία περιοχή γύρω απο το στοιχείο αναφοράς. Στο επόµενο σχήµα 3. δεικνύεται ένα παράδειγµα συνέλιξης όπου h(n,n ) είναι οι τιµές p, p κλπ. και τα αντίστοιχα σηµεία της εικόνας x(n,n ) είναι Α,Β,C κλπ.
-- A B C D E F G H I p p p 3 p 4 p 5 p 6 p 7 p 8 p Σχήµα 3. To αποτέλεσµα της συνέλιξης για την τιµή της εικόνας στη θέση n,n που έχει τιµή Ε. y(n,n )=Ap +Bp +Cp 3 +Dp 4 +Ep 5 +Fp 6 Gp 7 +Hp 8 +Ip Αξίζει να αναφέρουµε ότι πολλές µάσκες είναι διαχωρίσιµες. ηλαδή η συνέλιξη µε µία διδιάστατη µάσκα µπορεί να εκτελεσθεί µε δύο µάσκες ας διάστασης. Τέτοια µάσκα είναι η εξής: 0 0 0 - - - η οποία διαχωρίζεται στις εξής 0 και - Τέλος πρέπει να αναφέρουµε ότι τα παραπάνω αναφέρονται σε εικόνες γκρίζες (gray scale). Για έγχρωµες εικόνες θα αναφερθούµε ιδιαιτέρως στο τέλος του παρόντος κεφαλαίου Μετασχηµατισµός Fourier Ο µετσχηµατισµός Fourier F(u,v) µίας εικόνας f(k,l) ορίζεται ως εξής: F(u,v)= n k= m l= f(k,l)e -jku e -jlv (3.) Oι τιµές u,v κοντά στο 0,0 αντιστοιχούν σε χαµηλές συχνότητες. Η F(u,v) είναι συνεχής συνάρτηση. Μπορούµε να χρησιµοποιήσουµε τον ιακριτό Μετασχηµατισµό Fourier (DFT) ή καλύτερα τον ταχύ µετασχηµατισµό Fourier (FFT) για να εκτελέσουµε την πράξη της συνέλιξης στο πεδίο των συχνοτήτων. 3. Βαθυπερατά φίλτρα Τα βαθυπερατά φίλτρα φιλτράρουν τις υψηλές συχνότητες που βασικά είναι ανεπιθύµητα σήµατα - θόρυβος. Εκτός όµως απο τον θόρυβο "λειαίνουν " απότοµες
-3- µεταβολές στην ένταση. Η διαδικασία αυτή συνεπάγεται την θόλωση της εικόνας (blurring). Τρείς βασικές κατηγορίες βαθυπερατών φίλτρων διακρίνουµε: Φίλτρα µέσης τιµής (mean filter) Φίλτρα µορφής Gaussian (Gaussian filter) Φίλτρα διάµεσης τιµής (median filter) Τα φίλτρα διάµεσης τιµής δεν είναι γραµµικά. 3.. Φίλτρα µέσης τιµής H πιό απλή µορφή αυτών είναι τα ονοµαζόµενα φίλτρα µέσης τιµής (mean filters, average filters). Μία µάσκα φίλτρου µέσης τιµής σηµείων είναι η εξής: h (i, j) = = (3.3) O βαθυπερατός χαρακτήρας των φίλτρων αυτών φάινεται απο τον υπολογισµό του µετασχηµατισµού Fourier που δεικνύεται στο σχήµα 3. Σχήµα 3. Απόκριση συχνότητας ( διαστάσεων) για το φίλτρο µέσης τιµής (3.3). Στις χαµηλές συχνότητες - γύρω απο το σηµείο (0,0) το πλάτος είναι µεγάλο. Οι συχνότητες - και αντιστοιχούν στο f s / Θόλωση (Blurring) Ας δούµε στο επόµενο σχήµα 3.3 το αποτέλεσµα του συνέλιξης µε το παράθυρο (3.3). Σαν βασικό οπτικό αποτέλεσµα όλων των βαθυπερατών φίλτρων είναι η θόλωση της αρχικής εικόνας λόγω λείανσης των µεταβολών εντάσεως.
-4- Αρχική εικόνα Εφαρµογή φίλτρου 3x3 Εφαρµογή φίλτρου 7x7 Σχήµα 3. 3 Η αρχική εικόνα και η φιλτραρισµένη έξοδος µάσκα µέσης τιµής 3x3 και 7x7. Είναι εµφανής η θόλωση καθώς και η επίδραση του µήκους της µάσκας Ελάττωση θορύβου Τό φίλτρο µέσης τιµής εξασθενεί τον θόρυβο δηλ. ελαττώνει την σταθερή απόκλιση του αρχικού θορύβου. Η ελάττωση αυτή είναι αντίστροφη του µήκους του παραθύρου (µάσκας) Αρχική εικόνα Εικόνα µε θόρυβο Ν(0,0.05) Εφαρµογή averager 3x3 Σχήµα 3. 4 Εξασθένηση του θορύβου µε 3x3 µάσκα µέσης τιµής Αλλα βαθυπερατά φίλτρα παρόµοια µε αυτά της µέσης τιµής µπορούν να σχεδιασθούν λαµβάνοντας υπόψη ότι το κεντρικό σηµείο πρέπει να έχει το µεγαλυτερο βάρος, να είναι συµµετρικά και θετικά και να έχουν άθροισµα συντελεστών = Ενα τέτοιο παράθυρο είναι και το επόµενο 3.. Φίλτρα Gaussian µορφής Α. Σχεδιασµός Τα Gaussian φίλτρα είναι γραµµικά φίλτρα µε συντελεστές που επιλέγονται απο το σχήµα της Gaussian συνάρτησης µηδενικής µέσης τιµής και σ τυπικής απόκλισης που (σε µία διάσταση) έχει την µορφή: 6 8 6 8 4 8 6 8 6
-5- x σ = e (3.4) g(x) πσ Για την επεξεργασία εικόνας και για εύρεση των συντελεστών του παραθύρου χρησιµοποιούµε την αντίστοιχη (διακριτή) σχέση: g(i, j) i + j σ = e (3.5) όπου i,j είναι οι συντεταγµένες των σηµείων του παραθύρου. Εάν θεωρήσουµε σ= και i,j µεταξύ - και λαµβάνουµε την εξής Gaussian µάσκα: 3.0 0.353 0.367 0.353 0.367.0000 0.367 0.353 0.367 0.353 Ενας απλός προσεγγιστικός τρόπος για να σχεδιάσουµε µία Gausssian µασκα µε ακέραιους συντελεστές είναι η χρήση του τρίγωνου του Πασκάλ, ή ισοδύναµα οι συντελεστές του διωνύµου: n n n n ( 0 n πχ για n=4 έχουµε το εξής µονοδιάστατο, gaussian παράθυρο: 4 6 4 (3.6) n n + x) = + x + x +... + x (3.7) Πως θα χρησιµοποιηθεί αυτό για Gaussian φιλτράρισµα; Αρκεί να σκεφθούµε ότι οι δισδιάστατες Gaussian µάσκες είναι διαχωρίσιµες. ηλαδή η συνέλιξη µε ορθογώνια Gaussian µάσκα αντιστοιχεί µε συνέλιξη µε µονοδιάστατη οριζόντια και στη συνέχεια µε την αντίστοιχη κατακόρυφη. Β. Ιδιότητες Οι Gaussian µάσκα είναι ιδιαίτερα χρήσιµη στην επεξεργασία σηµάτων και εικόνας διότι έχει πολύ ελκυστικές ιδιότητες. Οι βασικώτερες απο αυτές είναι οι εξής: Είναι ανεξάρτητη της διεύθυνσης g(i, j) i + j σ σ = e = e ρ = g( ρ, θ) = g( ρ) όπου ρ =i +j (3.8) Εχει ένα λοβό. ηλαδή οι συντελεστές ελαττώνονται µονότονα µε την απόσταση και είναι πάντα θετικοί. Αυτό έχει µεγάλη σηµασία στη διαδικασία φιλτραρίσµατος, διότι η έµφαση δίνεται στο κεντρικό pixel και επηρεάζει πολύ λίγο τις (γειτονικές) ακµές. Ο µετασχηµατισµός Fourier της Gaussian συνάρτησης είναι επίσης Gaussian.
-6- I{g(x)} = g(x) e jωx dx = e x σ e jωx dx =... = π σ e ω v ό που v = (3.) σ H σχέση (3.) εκφράζει και την σχέση µεταξύ των δύο πεδίων: χώρου και συχνότητας. H Gaussian συνάρτηση είναι διαχωρίσιµη. ηλαδή η συνέλιξη µίας εικόνας µε τετραγωνική Gaussian µάσκα ισοδυναµεί µε δύο διαδοχικές συνελίξεις ας διάστασης (οριζόντια και κάθετη). ιαδοχική εφαρµογή της Gaussian µάσκας ισοδυναµεί µε Gaussian µάσκα µεγαλύτερης διακύµανσης (τεχνικές scale-space) Σε µία διάσταση έχουµε: g(x)* g(x) = e χ χ χ ξ (xξ) ( +ξ) ( ξ) χ (ξ + ) ξ=ξ+ σ σ σ σ σ e dξ = e e dξ = e dξ = πσe x ( σ) (3.0) 3..3 Φίλτρα διάµεσης τιµής Τα φίλτρα αυτά είναι µή γραµµικά. Μερικά απο τα βασικά χαρακτηριστικά τους είναι η διατήρηση των ακµών (στη πράξη γίνεται µικρή λείανση) και η πλήρης εξάλειψη του κρουστικού θορύβου (impulsive, salt and pepper noise). Εποµένως έχουν συµπεριφορά βαθυπερατού φίλτρου οσον αφορά την εξάλειψη του θορύβου και ταυτόχρονα συµπεριφορά υψιπερατού φίλτρου αφού διατηρούν τα χαρακτηριστικά των µεταβολών εντάσεως όπως είναι οι ακµές - περιγράµµατα (edges). Συνήθως εφαρµόζονται σε µία εικόνα επαναληπτικά. ιαδοχική επφαρµογή καταλήγει σε µία εικόνα που δεν επιδέχεται επιπλέον µεταβολές. Αυτή είναι σήµα - ρίζα για το συγκεκριµµένο φίλτρο διάµεσο τιµής. Η υλοποίηση των γίνεται µε καθορισµό ενός παραθύρου - µάσκας. Εχει µόνο µήκος και όχι συντελεστές. Το παράθυρο αυτό διατρέχει όλη την εικόνα όπως και στα γραµµικά φίλτρα (µεσης τιµής κλπ) και τα pixels που περικλείονται απο το παράθυρο σε κάθε θέση της εικόνας διατάσσονται κατα σειρά µεγέθους και επιλέγεται ως έξοδος η µεσαία (median) τιµή. Στο επόµενο σχήµα 3.5 δεικνύεται ο τρόπος εξαγωγής της µεσαίας τιµής για ένα παράθυρο 3x3. Στο επόµενο σχήµα 3.6 δίνεται ένα παράδειγµα εφαρµογής του φίλτρου σε εικόνα.
-7-0 5 0 50 30 60 7 5 0 5 0 50 30 60 7 5 ιάταξη σύµφωνα µε την τιµή του pixel 0 5 7 0 διάµεση 5 τιµή 30 50 60 Σχήµα 3. 5 Η έξοδος του φίλτρου διάµεσης τιµής είναι=0. Και προκύπτει ως η 5η τιµή στη αύξουσα διάταξη των τιµών των pixel του παραθύρου. Εάν εφαρµόζαµε φίλτρο µέσης τιµής (3.3) η έξοδος θα ήταν /(0++5+7+0+5+30+50+60)=6.55 Aρχική εικόνα I Εικόνα µε κρουστικό θόρυβο 0% Εξοδος median φίλτρου Εξοδος φίλτρου µέσης τιµής Σχήµα 3. 6 Εξοδος median φίλτρου. Ο κρουστικός θόρυβος είναι 0% και εξαλείφεται εντελώς. Αντίστοιχα το φίλτρο µέσης τιµής έχει πολύ φτωχή συµπεριφορά. 3.3 Ηψιπερατά φίλτρα Τα υψιπερατά φίλτρα εξασθενούν τις χαµηλές και τονίζουν τις υπάρχουσες υψηλές συχνότητες σε µία εικόνα. ηλαδή έχουν αντίθετο αποτέλεσµα απο τα βαθυπερατά φίλτρα (µεσης τιµής, Gaussian κλπ). Εποµένως τονίζουν τις µεταβολές της εικόνας (contrast), δίνουν έµφαση, στις λεπτοµέρειες και ταυτόχρονα ενισχύουν τον θόρυβο. Τα αντίστοιχα παράθυρα έχουν µία θετική τιµή στο κέντρο και στην πλειοψηφία αρνητικούς τους υπόλοιπους συντελεστές. Μερικές χαρακτηριστικές µάσκες για παράθυρα 3x3 είναι οι εξής: 0 0 5 0 ( α) 0 ( β) 5 ( γ) 8 ( δ) Σχήµα 3. 7 Μερικές υψιπερατές µάσκες
-8- Η τελευταία (δ) απο τις παραπάνω µάσκες είναι η πλέον συνηθισµένη και έχει το επι πλέον χαρακτηριστικό ότι δεν ενισχύει (ούτε εξασθενεί) σταθερές περιοχές αφού το άθροισµα των συντελεστών είναι = 0. Αξίζει να επισηµάνουµε ότι σε µερικές περιπτώσεις εφαρµογής υψιπερατού φίλτρου µπορεί να προκύψουν και αρνητικές τιµές, οπότε χρειάζεται σχετική διόρθωση. Σχήµα 3. 8 Για την τελευταία µάσκα απο τις παραπάνω του σχ3.7 η απόκριση συχνότητας δεικνύεται στο σχήµα 3.8. εικόνα εισόδου (α) (β) (γ) Σχήµα 3. Η εικόνα εξόδου (α) έχει προέλθει µε εφαρµογή του υψιπερατού φίλτρου (3.7δ) στην αρχική εικόνα. Επίσης έχει γίνει κλιµάκωση ώστε και οι αρνητικές τιµές να µετατοπισθούν στο διάστηµα 0-. Η (β) έχει προέλθει µε εφαρµογή αντίστοιχα του φίλτρου (3.7γ) χωρίς καµµία κλιµάκωση των τιµών, εµώ στο (γ) έχει γίνει κλιµάκωση. 3.3 Uksharp masking Στη διαδικασία αυτή γίνεται ψηφιακή εξοµοίωση επεξεργασίας που κάποτε γινότανε απο φωτογράφους στα φιλµς. Αναλυτικώτερα από ένα κλάσµα α της αρχικής εικόνας f(k,k ) αφαιρείται το αποτέλεσµα εξόδου βαθυπερατού φίλτρου f L (k,k ). Και η έξοδος g(k,k ) είναι: g(k,k )=a f(k,k ) f L (k,k ) (3.) Aν θεωρήσουµε ότι η αρχική εικόνα f(k,k ) αναλύεται σε ένα τµήµα υψιπερατό f H (k,k ) και ένα άλλο βαθυπερατό f L (k,k ) τότε η εικόνα g(k,k ) : εάν α= είναι ένα ηψιπερατό φίλτρο, ενώ εάν είναι α> τότε ένα βαθυπερατό τµήµα της εικόνας προστίθεται στο αποτέλεσµα και αναδεικνύει χαµηλές συχνότητες µαζί µε τις υψηλές που προέρχονται απο το υψιπερατό φίλτρο f H (k,k )
-- Οι δύο διαδικασίες που περιλαµβάνονται στην (3.) υλοποιούνται απο την ακόλουθη µάσκα w ό που w = α Σχήµα 3. 0 Μάσκα 3x3 για unsharp masking. Γιά α= ταυτίζεται µε το υψιπερατό φίλτρο του σχ.3.7δ. Εικόνα εισόδου Εικόνα εξόδου Σχήµα 3. Η εικόνα εξόδου υλοποιεί την (3.) µε α> 3.4 Επεξεργασία έγχρωµης εικόνας Οι επεξεργασία έγχρωµης εικόνας γίνεται είτε µε βαθµωτές είτε µε διανυσµατικές διαδικασίες. Στις βαθµωτές διαδικασίες επεξεργασίας εφαρµόζονται οι µέθοδοι που περιεγράφησαν προηγούµενα για γκρίζες (gray scale) εικόνες µε δύο τρόπους: α) ξεχωριστά σε κάθε κανάλι της εικόνας β) στη συνιστώσα φωτεινότητας (Υ) αφού διαχωρισθεί η εικόνα σε συνιστώσες φωτεινότητας (Y) - χρωµατικότητας (Ι,Q). Ο πλέον γνωστός µετασχηµατισµός είναι ο RGB--> YIQ. Μπορεί επίσης να χρησιµοποιηθεί και ο µετασχηµατισµός RGB-->HSI (βλ.κεφ. ). Το µειονέκτηµα της (α) διαδικασίας είναι η παραγωγή τυχαίων χρωµάτων που δεν υπάρχουν στην αρχική εικόνα που είναι όµως αρκετά κοντα (στον RGB χώρο) σε χρώµατα που υπάρχουν στην εικόνα. Τα µειονεκτήµατα αυτά δεν εµφανίζονται στη (β) διαδικασία. Στις διανυσµατικές διαδικασίες οι τρείς τιµές R,G,B θεωρούνται συνιστώσες ενός διανύσµατος και οι µέθοδοι που χρησιµοποιούνται είναι βέβαια µεθοδοι διανυσµατικής ανάλυσης. Μία κλασική τέτοια µέθοδος είναι η διαδικασία του διανυσµατικού διάµεσου.
-0-3.5 Oµοµορφική επεξεργασία (Homomorphic Processing) Η διαδικασία αυτή που περιγράφεται στο επόµενο σχήµα 3. χρησιµοποιείται στην περίπτωση που µία εικόνα µε µεγάλη δυναµική περιοχή αποτυπώνεται σε ένα µέσο (film, χαρτί) µε µικρή δυναµική περιοχή. Αποτέλεσµα είναι η ελάττωση της αντίθεσης, ιδιαίτερα στις σκοτεινές ή στις πολύ φωτεινές περιοχές. Η διαδικασία που περιγράφεται στη συνέχεια ουσιαστικά ελαττώνει την αρχική δυναµική περιοχή και αυξάνει την τοπική αντίθεση πρίν αρχίση η επεξεργασία ή η αποτύπωση. Σύµφωνα µε ένα απλοποιηµένο µοντέλο µία εικόνα f(n,n ) σχηµατίζεται σε δύο στάδια: παραγωγή από την φωτεινή πηγή και ανάκλαση από το αντικείµενο. Εποµένως µπορεί να θεωρήσουµε ότι η εικόνα f(n,n ) έχει δύο συνιστώσες που αντιστοιχούν στην φωτεινή πηγή- i(n,n ) και στην ανάκλαση-r(n,n ): f(n,n )=i(n,n ) r(n,n ) από τις δύο αυτές συνιστώσες θεωρούµε ότι η µεγάλη δυναµική περιοχή οφείλεται βασικά στο i(n,n ) και έχει µικρές εναλλαγές αντιθεση. Αντίθετα ο όρος r(n,n ) δηµιουργεί τις λεπτοµέρειες της εικόνας. Εποµένως επιδιώκουµε µείωση του i(n,n ) και αύξηση του r(n,n ). Σαν πρώτο βήµα γίνεται διαχωρισµός των δύο συνιστωσών µε λογαριθµηση. Στη συνέχεια φιλτράρεται η έξοδος µε βαθυπερατό και υψιπερατό φίλτρο. Επειδή η συνιστώσα i(n,n ) έχει φασµατικό περιεχόµενο στις χαµηλές συχνότητες θεωρούµε ότι θα αποτελεί το κύριο τµήµα της εξόδου του βαθυπερατού φίλτρου. Αντίστοιχα η r(n,n ) θα είναι η έξοδος του υψιπερατού φίλτρου. Μετά τον διαχωρισµό αυτό µπορούµε να ενισχύσουµε την µία συνιστώσα πολλαπλασιάζοντες µε συντελεστή β>. Η τελική έξοδος γίνεται µε άθροιση των δύο συνιστωσών και αντιστροφή της λογαριθµικής συνάρτησης (εκθετική συνάρτηση). Το τελικό αποτέλεσµα είναι άυξηση της αντίθεσης στην εικόνα. f(n,n ) log βαθυπερατό φίλτρο logi(n,n ) α< exp p(n,n ) Υψιπερατό φίλτρο logr(n,n ) β> Σχήµα 3. Η αρχική εικόνα f(n,n ) λογαριθµείται και µε τα δύο φίλτρα ξεχωρίζονται οι δύο συνιστώσες. Στο τέλος γίνεται η αντίστροφη πράξη µε την εκθετική συνάρτηση.