Επεξεργασία και ανάλυση εικόνας: Βασικές αρχές
Εισαγωγή. Βασικές έννοιες επεξεργασίας δισδιάστατων σηµάτων. Αναπαράσταση ψηφιακής εικόνας. Ψηφιοποίηση. Χωρική επεξεργασία εικόνων (σηµειακοί τελεστές, συνέλιξη, µη γραµµικά φίλτρα) Βελτίωση και αποκατάσταση εικόνων, εξάλειψη θορύβου Ανίχνευση ακµών Μετασχηµατισµοί εικόνων (Γεωµετρικοί Μετασχηµατισµοί, FT, Radon, DT). Επεξεργασία εικόνων στο χώρο των συχνοτήτων Βελτίωση και αποκατάσταση εικόνων, εξάλειψη θορύβου Ανίχνευση ακµών 2
Κατάτµηση εικόνων (ανάπτυξη περιοχών, ενεργά περιγράµµατα κλπ). Τεχνικές περιγραφής και αναγνώρισης προτύπων Υφή εικόνας Τεχνικές κωδικοποίησης για επεξεργασία και µεταφορά και αποθήκευση. Εφαρµογές ψηφιακής επεξεργασίας εικόνων στην βιοµηχανία, στο περιβάλλον, στην ιατρική κ.α. 3
Βιβλιογραφία. «Digital Image Processing», R. Gonzalez, R. Woods, 2 nd ed. 2002. 2. «Practical Algorithms for Image Analysis: Descriptions, Examples, and Code», M. Seul, L. O'Gorman, M. Sammon. 3. «Fundamentals of Digital Image Processing», A. Jain. 4. «Ψηφιακή Επεξεργασία Εικόνας», Ι. Πήττας. 5. «Ψηφιακή επεξεργασία και ανάλυση εικόνας», Ν. Παπαµάρκος 4
Ορισµοί Ψηφιακή Εικόνα I(i,j): το αποτέλεσµα της δειγµατοληψίας µίας διδιάστατης συνάρτησης f(x,y) (αναλογική πληροφορία) Η εικόνα f αποτελεί µετασχηµατισµό που αντιστοιχεί ζεύγος ακέραιων συντεταγµένων στο σύνολο των πραγµατικών αριθµών: f ( ) 2 x, y : N R Η Εικόνα ψηφιοποιείται σε πίνακα γραµµών (rows) - πρώτη µεταβλητή- και στηλών (columns) -δεύτερη µεταβλητή. Η αρχή του συστήµατος αναφοράς (0,0) θεωρείται η πάνω αριστερή γωνία της εικόνας. 5
Χωρική Αναπαράσταση Εικόνων Οι εικόνες αποτελούνται από ένα σύνολο στοιχειωδών πληροφοριών: Αντιστοιχούν στην τιµή ακτινοβολίας ή µίας µετρούµενης παραµέτρου Οργανώνονται σε ορθογωνικές περιοχές Ανάλογα µε τη διάσταση των εικόνων, η στοιχειώδης πληροφορία ορίζεται: 2D Εικόνες: Εικονοστοιχείο ή Pixel (Picture Element) 3D Εικόνες: Χωροστοιχείο ή Voxel (Volume Element) 4D Εικόνες: Υπερ-χωροστοιχείο ή Hypervoxel (Hyper Volume Element) Ως τέταρτη διάσταση θεωρείται ο χρόνος (t) 6
Συλλογή Εικόνων Εικόνες προέρχονται από φωτογραφικό φιλµ, video κάµερες, ψηφιακές κάµερες (CCD) µε χρήση κατάλληλων ανιχνευτών Εικόνες ψηφιοποιούνται µε κατάλληλες διατάξεις (σαρωτής (scanner), ψηφιοποιητής (grabber)) ή απευθείας (ψηφιακές κάµερες) Η απευθείας λήψη ψηφιακών εικόνων παρέχει αυξηµένη ποιότητα εικόνων Τα περισσότερα Ιατρικά Απεικονιστικά Συστήµατα παρέχουν απευθείας ψηφιακή έξοδο 7
Συλλογή Ψηφιακής Εικόνας Φωτεινή πηγή (Ενέργεια) Απεικονιστικό Σύστηµα Ψηφιακή Εικόνα Αντικείµενο Επίπεδο Εικόνας (Προβολή) 8
Οι έννοιες δειγµατοληψίας και κβαντισµού τιµών στην ψηφιακή εικόνα 9
(0,0) j i 0
Χωρική Αναπαράσταση Εικόνων γραµµή στήλη Επίπεδο / τοµή γραµµή στήλη 2D Εικόνα: Pixels 3D Εικόνα: Voxels
Οι τιµές της ψηφιακής εικόνας συνήθως κυµαίνονται σε ακτίνα: [0-255] : byte [0 - (2 6 -)]: 2 bytes Η κάθε θέση (i,j) αποτελεί το στοιχείo της εικόνας -picture element -PIXEL 2
Παράδειγµα pixels j j+ i i+ 6x 3
Χρωµατική Κωδικοποίηση της πληροφορίας Η περίπτωση της χρήσης αποχρώσεων του γκρίζου -gray scale: 0 Μέγιστη τιµή Κωδικοποίηση της πληροφορίας µε χρώµα υαδική εικόνα -Binary Image: Ειδική περίπτωση gray scale: εικόνα δύο τιµών (0 και ). Προκύπτει συνήθως µετά από επεξεργασία. 4
Φωτεινότητα Το ανθρώπινο µάτι µπορεί να διακρίνει περίπου 50 διαφορετικές διαβαθµίσεις του γκρι (µαύρο έως λευκό) Μαύρο: 0 gray level Άσπρο: 255 gray level Αντιλαµβανόµενη Φωτεινότητα Πραγµατική Φωτεινότητα 5
Τµήµα ψηφιακής ραδιογραφίας 2x Γραφική παράσταση τιµών τµήµατος ψηφιακής ραδιογραφίας 2x 6
(α) (β) Κύµα συνηµίτονου σαν γραφική παράσταση (α) και πληροφορία κωδικοποιηµένη µε αποχρώσεις του γκρίζου (β). 7
Χαρακτηριστικά Ψηφιακών Εικόνων Χωρική ιακριτική Ανάλυση (spatial resolution): Αντιπροσωπεύει το πόσο καλά µπορούν να διακρίνονται τα γειτονικά pixels Μετρούµενο µέγεθος: περιοχή εικόνας στο πραγµατικό χώρο Εφαρµόσιµο σε συγκεκριµένες κατηγορίες εικόνων (ιατρικές, remote sensing κλπ). Καθορίζει τη διάσταση του φυσικού χώρου που απεικονίζεται σε κάθε pixel. 8
Χωρική ιακριτική Ανάλυση 52x52 28x28 32x32 9
Κβαντισµός (Quantization) βάθος χρώµατος: Αντιπροσωπεύει το πόσο καλά µπορούν να διακρίνονται διαφορές έντασης σε µία εικόνα (διακριτική ικανότητας αντίθεσης) Συνδέεται µε τον αριθµό των διακριτικών τιµών στάθµες στις οποίες αποθηκεύεται κάθε pixel της εικόνας Χαµηλός αριθµός από στάθµες µείωση ακµών Στην Ιατρική, οι συνηθέστερος αριθµός σταθµών είναι 256, 52 και 024 256Στάθµες log2 (256) = 8bit /04
Κβαντισµός 2 bits/pixel 4 bits/pixel 2 bits/pixel 2
Χαρακτηριστικά Ψηφιακών Εικόνων Χωρική διακριτική ικανότητα (spatial resolution), ή Μέγεθος pixel: εφαρµόσιµο σε συγκεκριµένες κατηγορίες εικόνων (ιατρικές, remote sensing κλπ). Καθορίζει τη διάσταση του φυσικού χώρου που απεικονίζεται σε κάθε pixel Αντιπροσωπεύει το πόσο καλά µπορούν να διακρίνονται τα γειτονικά απεικονιζόµενα σηµεία σε 2D ιατρικές εικόνες µετριέται σε mm x mm, ή µm x µm 22
Παράµετροι Συλλογής Εικόνων Ιατρικών Απεικονιστικών Συστηµάτων CT MRI US Pixels/Εικόνα 52x52 256x256 52x52 Bits/pixel 2 0 8 Χωρική ευκρίνεια µέτρια χαµηλή µέτρια Ευκρίνεια αντίθεσης υψηλή υψηλή χαµηλή Ακτινοβόληση µέτρια - - Φυσιολογική λειτουργία όχι ναι Ναι Μέγεθος pixel/voxel ~ x x mm ~ x x mm x cm
Η έννοια της γειτονιάς του pixel (neighborhood) 2D Εικόνες: Γειτονικά (neighbors) Pixels θεωρούνται όσα έχουν κοινή ακµή ή τουλάχιστον µία κοινή γωνία Pixels µπορούν να έχουν 4 ή 8 γείτονες (4-connected και 8- connected- ) 3D Εικόνες: Voxels µπορούν να έχουν 6 ή 8 ή 26 γείτονες σε κυβικό πλέγµα 24
Γειτονιά Pixels σε 2D Εικόνες Τετραγωνικό πλέγµα 4 γειτόνων Τετραγωνικό πλέγµα 8 γειτόνων 25
Γειτονιά Pixels σε 3D Εικόνες Κυβικό πλέγµα 6 γειτόνων Κυβικό πλέγµα 8 γειτόνων Κυβικό πλέγµα 26 γειτόνων 26
Μετρική της απόστασης σε εικόνες Έστω τα pixels p και p2 της εικόνας Ι Ευκλείδεια απόσταση D 4 µετρική απόστασης (city block distance): D ( p p2) = x x2 + y 2 D4, y p ( x, y), p2( x2, y2) I ( p p ) = ( x x 2 ) + ( y ) 2, y 2 2 2 D 4 o o o o o o o o o o o o o o o p 2 p o o o o o o o o o o Ευκλείδεια 27
Αριθµητικοί τελεστές εικόνων Πρόσθεση / Αφαίρεση: I ± I 2 x, y = I x, y ± I 2 x, y, x, y I, I Γραµµικός µετασχηµατισµός: Πολλαπλασιασµός: ( )( ) ( ) ( ) ( ) 2 ( I I 2)( x, y) = I( x, y) I 2( x, y),( x, y) I, I 2 Η εικόνα Ι 2 συχνά είναι δυαδική οπότε ο τελεστής του πολλαπλασιασµού καλείται masking. 28
Παράδειγµα εφαρµογής τελεστών Ι Ι +Ι 2 Ι 2 Ι -Ι 2 /04
Παράδειγµα εφαρµογής masking Ι mask I x mask 30
Λογικοί τελεστές εικόνων (Boolean operators) Εφαρµόζονται σε δυαδικές εικόνες, σε κάθε pixel (pixel by pixel ή pixelwise). Θεωρούµε ότι η τιµή του pixel είναι TRUE και η τιµή 0 είναι FALSE: AND: OR: οµοίως NOT (ΑΝΤΙΘΕΤΟΣ) µε χρήση των παραπάνω µπορούµε να παράγουµε οποιαδήποτε λογική έκφραση I ( x, y) = I AND I 2 = I( x, y) AND I 2( x, y), ( x, y) I, I 2 3
Χώρος του χρόνου και χώρος των συχνοτήτων Όπως και στα σήµατα, ο µετασχηµατισµός Fourier (FT) επεκτείνεται σε δύο (ή περισσότερες) διαστάσεις για εφαρµογή σε εικόνες. Ο χώρος του χρόνου -time domain- αναφέρεται στη δειγµατοληπτηµένη ψηφιακή εικόνα. Ο χώρος των χωρικών συχνοτήτων -spatial frequency domainαναφέρεται στο FT της ψηφιακής εικόνας. 32
Επεξεργασία εικόνας στο χώρο του χρόνου Σκοπός: Εµπλουτισµός εικόνας (έκταση, συµπίεση ακτίνας τιµών, επεξεργασία ιστογράµµατος κλπ) Εξοµάλυνση εικόνας Συµπίεση θορύβου Όξυνση εικόνας Ανεύρεση ακµών Μέθοδοι επεξεργασίας: Σηµειακοί Τελεστές Φίλτρα το αποτέλεσµα των οποίων εξαρτάται από τη γειτονιά κάθε pixel: Γραµµικά φίλτρα: Συνέλιξη Μη γραµµικά φίλτρα 33
Σηµειακοί τελεστές (Point operators) Τελεστές οι οποίοι δρουν σε ένα pixel χωρίς να λαµβάνουν υπόψη πληροφορία από τη γειτονιά του pixel. ( i, j) f( I( i j) ) I ' =, Το αποτέλεσµα της δράσης του τελεστή σε ένα pixel εξαρτάται από την τιµή του Pixel αυτού και όχι από την τιµή των γειτονικών του pixels. Το αποτέλεσµα της επεξεργασίας µπορεί να αποθηκευτεί και στην ίδια εικόνα. 34
Φωτεινότητα και αντίθεση (Brightness, Contrast) Η φωτεινότητα και η αντίθεση αποτελούν σηµειακό τελεστή, ως ακολούθως: I' ( x, y) ( x, y) + b, 0 ai( x, y) max, ai( x, y) + b> 0, ai( x, y) + b< ai + b max = max,, 0 όπου a η τιµή της αντίθεσης και b της φωτεινότητας ( x y) I 35
Αντίθεση Το κεντρικό τετράγωνο στις τρεις περιπτώσεις έχει την ίδια φωτεινότητα αλλά εµφανίζεται διαφορετικό καθώς η φωτεινότητα του υποβάθρου γίνεται πιο υψηλή 36
Έκταση αντίθεσης Ο σηµειακός αυτός τελεστής δρα σε κάθε pixel και µετασχηµατίζει την τιµή του σε µία νέα τιµή µε γραµµικό ή µη γραµµικό τρόπο. max Μετασχηµατισµένες τιµές pixel α β max Αρχικές τιµές pixel Τα pixel της εικόνας µε τιµές στο διάστηµα (α,β) στο οποίο ο µετασχηµατισµός τιµών έχει απότοµη κλίση απεικονίζονται µε µεγάλη αντίθεση. Το αντίθετο συµβαίνει για τα pixel µε τιµές στις οποίες ο µετασχηµατισµός έχει µικρή κλίση (στο παράδειγµα αυτό (0,α) και (β,max]. Τα α και β µετακινούνται από το χρήστη. Όταν το (α,β) βρίσκεται στις µεσαίες τιµές λέγεται «παράθυρο µαλακών µορίων», ενώ όταν βρίσκεται στις υψηλές τιµές λέγεται «οστικό παράθυρο» 37
Παράδειγµα έκτασης αντίθεσης Αρχική εικόνα Μετασχηµατισµένη εικόνα Ακτίνα τιµών ενδιαφέροντος /04
Άλλοι µετασχηµατισµοί τιµών εικόνας Εκθετικός µετασχηµατισµός (Gamma correction): Ι (x,y)=255(ι(x,y)/255) γ Αν το πεδίο ορισµού είναι [0,255], τότε το πεδίο τιµών είναι [0,255] (θεωρώντας ότι 255 είναι η µέγιστη τιµή της εικόνας δηλ byte/ pixel). Αρνητική εικόνα: Αποτελεί απλό γραµµικό µετασχηµατισµό. Αν το πεδίο τιµών είναι [0 255], τότε I (x,y)=255-i(x,y) 300 250 new image values 200 50 00 50 γ=/3 γ=0.5 γ=2 γ=3 0 0 50 00 50 200 250 300 image values 39
Λογαριθµικός µετασχηµατισµός: εφαρµόζεται σε περιπτώσεις που τα pixel της εικόνας έχουν τιµές που παρουσιάζουν πολύ µεγάλες διαφορές, µε αποτέλεσµα χαµηλή αντίθεση µεταξύ των pixel µε χαµηλές τιµές. Ι (x,y)=c log(+ι(x,y)) c: σταθερά ώστε το πεδίο τιµών του µετασχηµατισµού να ταυτίζεται µε το πεδίο ορισµού του. Το + εµφανίζεται ώστε να µην µηδενίζεται το όρισµα του λογαρίθµου. 40
Παράδειγµα εφαρµογής σηµειακών µετασχηµατισµών Αρχική εικόνα 2 3 4 0 0 0 0 2 255 99 99 99 3 9 9 9 9 4 0 0 0 0 Εκθετικός μετασχηματισμός γ=,5 2 3 4 0 0 0 0 2 255 62 62 62 3,7,7,7,7 4 0 0 0 0 Λογαριθμικός μετασχηματισμός 2 3 4 0 0 0 0 2 255 22 22 22 3 06 06 06 06 4 0 0 0 0 Σημειακός μετασχ. Έκτασης αντίθεσης 2,5*Ι+0 2 3 4 0 0 0 0 2 255 255 255 255 3 33 33 33 33 4 0 0 0 0 Εκθετικός μετασχηματισμός γ=0,5 2 3 4 0 0 0 0 2 255 59 59 59 3 48 48 48 48 4 0 0 0 0 4
Αρχική εικόνα Μετασχηµατισµένη εικόνα /04
Ορισµός του ιστογράµµατος εικόνας Εστω εικόνα Ι µε Ν pixel και τιµές στο διάστηµα [0,L-]. Το ιστόγραµµα -Histogram- Η της εικόνας Ι καθορίζει για κάθε µία από τις διακριτές τιµές της εικόνας τον αριθµό εµφάνισης της (τιµής): H ( n) = #{ I( i, j) : I( i, j) = n}, ( i, j) I Αν το Η(n) διαιρεθεί µε τον αριθµό των pixel της εικόνας Ν, προκύπτει η πιθανότητα εµφάνισης κάποιας τιµής στη συγκεκριµένη εικόνα. Είναι προφανές ότι ( n) p = H( n) N L L ( ) ( ) H n = N p n = n= 0 n= 0 43
Ιστόγραµµα ψηφιακής ραδιογραφίας Αριθµός εµφάνισης τιµών εικόνας Τιµές εικόνας /04
Εξίσωση ιστογράµµατος - Histogram equalization Έστω εικόνα Ν pixels µε ακτίνα τιµών [0,maxval]. O σκοπός της εξίσωσης του ιστογράµµατος είναι σε κάθε pixel µε τιµή k να αναθέσει µία νέα τιµή s(k), ώστε το νέο ιστόγραµµα: να καλύψει όλη την ακτίνα τιµών να είναι όσο το δυνατό πιο οµοιογενές Αποδεικνύεται ότι ο µετασχηµατισµός s(k) είναι: s max val N ( k) = H( i) k i= 0 Όπου Η το ιστόγραµµα της εικόνας και maxval η µέγιστη τιµή της εικόνας. 45
Παράδειγµα Έστω εικόνα µε 8 διακριτές τιµές: Αρχικές τιµές Πιθανότητα εµφάνισης s(k) Νέες τιµές Προσεγγί σεις τιµών 0 0,9 0,9 42,56 32 32 0,25 0,44 98,56 96 64 0,2 0,65 45,6 28 96 0,6 0,8 8,44 92 28 0,08 0,89 99,36 224 60 0,06 0,95 22,8 224 92 0,03 0,98 29,52 224 224 0,02 224 224 s(k),2 0,8 0,6 0,4 0,2 0 2 3 4 5 6 7 8 Αριθµός διακριτών τιµών
Πιθανότητα εµφάνισης 0,3 0,25 0,2 0,5 0, 0,05 0 0 50 00 50 200 250 Τιµή pixel Αρχικό ιστόγραµµα Ιστόγραµµα µετά την εξίσωση /04
Τιμές Ιστόγραμμα Κανονικοποιημένο Ιστόγραμμα Αθροιστικό Κανονικοποιημένο Ιστόγραμμα Νέες τιμές Αρχική εικόνα Ι 2 3 4 5 6 7 8 3 3 5 5 0 0 0 0 2 3 3 5 5 0 0 0 0 3 2 2 0 0 0 4 2 2 2 0 0 0 5 2 2 2 7 7 7 6 4 4 4 4 0 6 6 7 4 4 4 0 0 0 6 6 8 4 4 4 0 0 0 6 6 0 2 0,328 0,328 2 8 0,25 0,453 3 2 8 0,25 0,578 4 3 4 0,063 0,64 4 4 0 0,56 0,797 6 5 4 0,063 0,859 6 6 6 0,094 0,953 7 7 3 0,047,000 7 8 64 Νέες τιμές Νέο Ιστόγραμμα 2 2 3 8 4 2 5 0 6 4 7 9 /04
Αρχική εικόνα Εικόνα µε εξισωµένο ιστόγραµµα Εξίσωση ιστογράµµατος Ιστόγραµµα Ιστόγραµµα 49
Ο µετασχηµατισµός της εξίσωσης ιστογράµµατος εφαρµόζεται και σε περιοχές της εικόνας. 50
kj Προσαρµοσµένη εξίσωση ιστπγράµµατος Adaptive Histogram Equalization 5
Τελεστές που εφαρµόζονται σε περιοχές εικόνας - Neighborhood operators Οι τελεστές αυτοί χρησιµοποιούν τον γενικό αλγόριθµο της κυλιόµενης (ή κινητής) µάσκας moving mask. Εφαρµογή για εικόνα I Ν x M (γραµµές x στήλες) και τετραγωνική περιοχή (µάσκα) 2n+ x 2m+ pixels και αποθήκευση του αποτελέσµατος στην εικόνα I 2 Για κάθε γραµµή x από n+ ως Ν x -(n+) Για κάθε στήλη y από m+ ως Ν y -(m+) Υπολόγισε την τιµή a του τελεστή στην περιοχή γύρω από το (x,y); I 2 (x,y)=a; 52
Αρχή y y x x Ι(x,y) Αρχική εικόνα Τέλος Ι 2 (x,y) Φιλτραρισµένη εικόνα 53
Συνέλιξη εικόνων Έστω εικόνα Ι(x,y), x=0..n-, y=0..m- και µάσκα Μ µε περιττό αριθµό γραµµών και στηλών (2n+)x(2m+): Μ(k,l), k=-n..n, l=-m..m. Η συνέλιξη Ι * M, στη θέση (x,y) ορίζεται (κατ αναλογία µε την µονοδιάστατη περίπτωση των σηµάτων) ως εξής: n ( x, y) = I( x k, y l) M( k l) I * M = c, m k= nl= m Στον ορισµό αυτό οι δείκτες m και n διατρέχουν τη µάσκα Μ. Στην υπολογιστική υλοποίηση της συνέλιξης πρέπει να ληφθεί µέριµνα ώστε οι δείκτες να µην έχουν αρνητικές τιµές 54
Έστω εικόνα f(x,y) και µάσκα m(i,j) 3x3. Ο υπολογισµός της συνέλιξης τους στο σηµείο (x 0,y 0 ) γίνεται ως εξής: Το κεντρικό pixel της m τοποθετείται «πάνω» από το pixel (x 0,y 0 ) της f. Υπολογίζεται το άθροισµα των γινοµένων «χιαστί» στις 2 διαστάσεις, µε τρόπο ανάλογο της µίας διάστασης (σήµατα). Το αποτέλεσµα (άθροισµα των γινοµένων) αποθηκεύεται στο pixel (x 0,y 0 ) µίας νέας εικόνας f 2. Η µάσκα m κινείται ώστε το κεντρικό pixel της m να βρεθεί πάνω από το επόµενο pixel της f και επαναλαµβάνεται η διαδικασία. m(i,j) + 0 - - 0 + y 0 - Y 0 + y 0 x0,y0 f(x,y) x 0 - x 0 + x 0 55
Παραδειγµατικές εφαρµογές της συνέλιξης στην χωρική επεξεργασία εικόνας 56
Εξοµάλυνση εικόνας µε χρήση συνέλιξης µε Μήτρα µέσου όρου (averaging) Το φίλτρο µέσου όρου στην απλή µορφή είναι ένας πίνακας περιττού αριθµού Pixel σε κάθε διάσταση, µε ίδια τιµή σε κάθε στοιχείο: 9 49 Μήτρα 3x3 Μήτρα 7x7 57
Παράδειγµα συνέλιξης µε µήτρα µέσου όρου -averaging * 9 Μήτρα 3x3 58
59
/04
Η Γκαουσιανή σαν φίλτρο εξοµάλυνσης Η γκαουσιανή σαν επιφάνεια µπορεί να οριστεί χρησιµοποιώντας την κανονική κατανοµή σε 2 διαστάσεις, σύµφωνα µε τον παρακάτω τύπο Η επιφάνεια έχει διασπορά σ, και κορυφή (δηλ. εµφανίζει µέγιστο) στο σηµείο (µ x, µ y ). Μεγαλύτερο σ πιο ανοικτή και πιο κοντή επιφάνεια, έτσι ώστε ο όγκος που περικλείεται από την επιφάνεια και το επίπεδο xy να είναι ίσος µε. Η 2D γκαουσιανή υπολογίζεται σε διακριτή µορφή ως εξής: καθορίζεται το σ της γκαουσιανής (δηλ. το πλάτος της) Υπολογίζονται οι τιµές σε ένα πίνακα συµµετρικό γύρω από το (0,0). Η πλευρά του πίνακα πρέπει να είναι τουλάχιστον 6σ+. ηλ [-3σ 3σ]x[-3σ 3σ], ώστε ο διακριτός πίνακας να περιλαµβάνει την επιφάνεια µέχρι και πολύ χαµηλές τιµές. Όσο µεγαλύτερο το σ, τόσο ισχυρότερη η εξοµάλυνση που προκαλείται από τη συνέλιξη της εικόνας µε την γκαουσιανή. (, ) P x y = 2 2πσ e 2 ( x µ ) + ( y µ ) 2 x 2σ 2 y 6
Η Γκαουσιανή σαν φίλτρο εξοµάλυνσης /04
Σε περίπτωση που απαιτείται µικρός πίνακας φίλτρου (πχ 3x3) χρησιµοποιούνται προ-υπολογισµένες ακέραιες τιµές. Για ακρίβεια και σε πίνακες µεγαλύτερων διαστάσεων χρησιµοποιούνται τιµές απευθείας από τον µαθηµατικό ορισµό, σύµφωνα µε όσα περιγράφτηκαν σε προηγούµενη διαφάνεια 6 2 2 4 2 2 Παράδειγµα γκαουσιανής 3x3
ιαχωρίσιµα φίλτρα (Separable filters) το παράδειγµα της γκαουσιανής ιαχωρίσιµο είναι ένα φίλτρο όταν µπορεί να εκφραστεί σαν γινόµενο µίας γραµµής και µίας στήλης. Αν ένα 2D φίλτρο είναι διαχωρίσιµο, τότε η συνέλιξη του µε µία εικόνα µπορεί να γίνει σαν 2 διαδοχικές µονοδιάστατες συνελίξεις κατά γραµµές και κατά στήλες (η σειρά δεν έχει σηµασία). Η 2D γκαουσιανή είναι διαχωρίσιµο φίλτρο και µπορεί να εκφραστεί σαν γινόµενο (στήλη επί γραµµή) δύο µονοδιάσταστων (D) γκαουσιανών καµπύλων. 64
Παράδειγµα διαχωρισιµότητας του φίλτρου της γκαουσιανής (α) (β) (γ) Αρχική εικόνα (α), συνέλιξη µε 9x Gaussian σ=3 κατά στήλες (β), συνέλιξη της (β) µε 9x Gaussian σ=3 κατά γραµµές (γ). 65
Εξοµάλυνση εικόνας µε χρήση συνέλιξης µε Γκαουσιανή 66
Παράδειγµα µη γραµµικής επεξεργασίας Φίλτρο ενδιάµεσης τιµής Έστω κατανοµή X πραγµατικών αριθµών. Η ενδιάµεση τιµή m της κατανοµής Χ είναι αυτή για την οποία: P(X<=m)<=/2 και P(X>=m)>=/2 Για πεπερασµένο πλήθος αριθµών: #{X: X<=m} = #{X: X>=m}, δηλ. το πλήθος των στοιχείων µε τιµή >= m είναι ίσο µε το πλήθος των στοιχείων µε τιµή <= m. Αν το πλήθος των στοιχείων της Χ είναι άρτιο, τότε το m δεν ορίζεται µονοσήµαντα. Παρατήρηση: Για µη συµµετρικές κατανοµές, η µεσαία τιµή και ο µέσος όρος της κατανοµής διαφέρουν. 67
Το φίλτρο εικόνων ενδιάµεσης τιµής -median filter Μη γραµµική επεξεργασία: συνήθως χρησιµοποιείται ο γενικός αλγόριθµος της κυλιόµενης µάσκας, αλλά ΕΝ υλοποιείται µε συνέλιξη Ορίζεται το παράθυρο του φίλτρου (πχ 3x3) Το κεντρικό pixel του παραθύρου τοποθετείται πάνω στο pixel της εικόνας που θέλουµε να φιλτράρουµε I(x 0,y 0 ) Οι τιµές των pixel της εικόνας µέσα στο παράθυρο ταξινοµούνται σε αύξουσα ή φθίνουσα διάταξη Επιλέγεται η ενδιάµεση τιµή των µεσαίων ταξινοµηµένων pixel Τοποθετείται στο αντίστοιχο κεντρικό pixel της φιλτραρισµένης εικόνας I (x 0,y 0 ) 68
Μέσος όρος: 77,7=78 25 37 42 44 8 36 255 28 38 42 58 4 255 27 94 3 27 43 2 36 78 76 29 93 49 2 θορυβώδη pixel 25 37 42 44 8 36 255 28 38 42 58 4 255 27 94 3 27 255 2 36 78 76 29 93 49 3 θορυβώδη pixel Median:28 Μέσος όρος: 0 Median:28 69
Εφαρµογή σε συµπίεση θορύβου Φίλτρο µέσου όρου 7x7 Φίλτρο µέσου όρου 5x5 70
Φίλτρο απόριψης A-trim Το φίλτρο A-trim ορίζεται ως εξής: όπου: y = n ( 2a) j= an+ j= N ο δείκτης των pixel που βρίσκονται εντός του παραθύρου του φίλτρου. x j : η τιµή της εικόνας στο pixel j διατεταγµένη σε αύξουσα σειρά. 0<=α<0.5 το ποσοστό των pixel που απορίπτονται Το φίλτρο A-trim αποτελεί ένα συνδυασµό του φίλτρου µέσης τιµής και του φίλτρου ενδιάµεσης τιµής. α=0 το φίλτρο γίνεται κινητού µέσου όρου α τείνει 0.5 το φίλτρο γίνεται ενδιάµεσης τιµής n an x j 7
Η έννοια του γκαουσιανού θορύβου Εστω εικόνα Ι η οποία αποτελεί την ιδανική εικόνα όπως θα καταγραφόταν χωρίς θόρυβο. Ο γκαουσιανός θόρυβος προσθέτει στην τιµή του κάθε pixel (x0,y0) ένα τυχαίο αριθµό που παράγεται ακολουθώντας τη γκαουσιανή κατανοµή µε µέση τίµη την τιµη της εικόνας Ι(x0,y0) και διασπορά σ η οποία καθορίζεται από τη διαδικασία του θορύβου. Οσο µεγαλύτερο το σ, τόσο µεγαλύτερη η επίδραση του θορύβου. 72
Παραδείγµατα γκαουσιανού θορύβου Αρχική εικόνα 400 Γκαουσιανός θόρυβος σ=0.0 Γκαουσιανός θόρυβος σ=0. 200 800 Number of pixels 7000 6000 5000 4000 3000 Number of pixels 000 800 600 400 Number of pixels 700 600 500 400 300 2000 200 000 200 00 0 0 0 image values image values Image values 0 0. 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 0 0. 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 0 0. 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 Εστω εικόνα µε τρεις διαφορετικές τιµές, όπως αυτή του σχήµατος. 73
Παραδείγµατα συµπίεσης γκαουσιανού θορύβου κδφκη Φίλτρο µέσου όρου 3x3 Φίλτρο ενδιάµεσης τιµής 3x3 Γκαουσιανό φίλτρο 5x5, σ= Φίλτρο µέσου όρου 3x3 Φίλτρο ενδιάµεσης τιµής 7x7 Γκαουσιανό φίλτρο 3x3, σ=2 74
Θόρυβος Salt and pepper Μη συσχετισµένος θόρυβος που προκύπτει από τη µετάδοση των δεδοµένων. Ένα ποσοστό των pixel αποκτά τιµή η οποία είναι τυχαίος αριθµός µε οµογενή κατανοµή σε όλο το εύρος τιµών της εικόνας. Το φίλτρο ενδιάµεσης τιµής είναι ιδανικό για τέτοιο τύπο θορύβου, αφού εξαφανίζει τα θορυβώδη pixel και διατηρεί τη λεπτοµέρεια της εικόνας. Τα φίλτρα µέσου όρου δεν αποτελούν µία κατάλληλη επιλογή. 75
Αρχική εικόνα µε πραγµατικό θόρυβο salt and pepper (α) και εφαρµογή του φίλτρου ενδιάµεσης τιµής 5x5 (β) και φίλτρου µέσου όρου 5x5 (γ). 76
Θόρυβος Poisson Ο θόρυβος Poisson σε σήµατα και εικόνες αντιστοιχεί σε διακυµάνσεις του καταγραφόµενου αριθµού των φωτονίων που προσπίπτουν στον ανιχνευτή που παράγει το σήµα ή την εικόνα. Η κατανοµή poisson δίνει την πιθανότητα να καταγραφούν x φωτόνια, όταν ο µέσος καταγραφόµενος όρος στη µονάδα του χρόνου είναι µ: x µ e µ p( x, µ ) =, µ, x x! Η παραπάνω κατανοµή ισχύει για κάθε περίπτωση διακριτών, ανεξάρτητων γεγονότων, πχ.: Ποια η πιθανότητα σε ένα parking να µπουν σήµερα 00 αυτοκίνητα, όταν ο ηµερήσιος µέσος όρος είναι 85? Όταν µ>00, η κατανοµή Poisson προσεγγίζεται από την κανονική κατανοµή, µε σ = µ 77
Κβαντοµηχανικός θόρυβος εικόνας και δόση ασθενούς Έστω περιοχή µε εµβαδόν ίσο µε pixel (πχ 0x0µm 2 ). Η πιθανότητα να καταγράψει x φωτόνια, ενώ ο αναµενόµενος µέσος αριθµός καταγεγραµµένων φωτονίων είναι µ, δίνεται από την κατανοµή Poisson P(x,µ). Το σ της Poisson είναι µ 0.5 µε πιθανότητα 98%, η τιµή ενός Pixel θα είναι εντός του διαστήµατος [µ-3σ, µ+3σ]. p ( x, µ ) x µ x! Κβαντοµηχανικός θόρυβος: διαταραχές του αριθµού των φωτονίων γ που καταγράφονται στη µονάδα εµβαδού, στη µονάδα του χρόνου. Ο θόρυβος της εικόνας υπολογίζεται από το σηµατοθορυβικό λόγο Signal to Noise Ratio (SNR). Μπορούµε να χρησιµοποιήσουµε έναν από τους δύο ορισµούς: Στην περίπτωση του θορύβου Poisson: signal noise = = e µ = σ µ signal SNR= 0log ( db) signal SNR= ( καθαρόςαριθµ ός ) noise noise µ 78
Θεωρείστε δύο γειτονικά Pixel εκ των οποίων το ένα ανήκει σε αντικείµενο και το άλλο στο υπόβαθρο (background) της εικόνας. Το pixel του αντικειµένου έχει διπλάσια τιµή από το Pixel background. Σε ποια από τις περιπτώσεις η αντίθεση του αντικειµένου είναι µεγαλύτερη: Α) τιµές pixel 5 και 0 Β) τιµές pixel 50,00 (α) Κατανοµή Poisson για µ=0 (α), µ=20 (β), µ=50 (γ) και µ=00 (δ). (β) (γ) (δ) 79
Θόρυβος Poisson σε συνθετικές εικόνες 25 20 5 0 5 0 0 50 00 50 200 250 35 30 25 20 5 0 5 0 0 50 0 50 00 50 200 250 200 250 2500 2000 500 000 500 0 00 50 80
Παράδειγµα θορύβου Poisson σε ραδιογραφία phantom µεγάλος αριθµός Χ στο σχηµατισµό εικόνας µ µεγάλο µικρός αριθµός φωτονίων Χ µ µικρό. 8
(α) (β) (γ) (δ) (α) Εικόνα µε θόρυβο poisson. (β) Εφαρµογή φίλτρου ενδιάµεσης τιµής 5x5. (γ) Εφαρµογή φίλτρου µέσου όρου 5x5. (δ) Εφαρµογή φίλτρου γκαουσιανής 5x5, σ=2. 82
Ανεύρεση ακµών µε χρήση συνέλιξης Ακµή -Edge- καλείται µία µεταβολή της φωτεινότητας της εικόνας. Είναι ιδιότητα του pixel, υπολογίζεται στην περιοχή του pixel και είναι διανυσµατικό µέγεθος έχει µέτρο mag και διεύθυνση Φ. Αν Ι(x,y) εικόνα τότε το διάνυσµα της παραγώγου της εικόνας g(x,y) υπολογίζεται ως εξής: I x mag ( g( x, y) ) = g( x, y) = + Φ( g( x, y) ) 2 I y Για απλοποίηση των υπολογισµών: 2 I y = arctan I x mag ( g( x, y) ) = g( x, y) = I x + I y 83
Οι µερικές παράγωγοι υπολογίζονται διακριτά: ( ) ( ) ( ) ( ) ( ) ( ),,,, 0 0 0 0, 0 0 0 0, 0 0 0 0 + = + = y x I y x I y I y x I y x I x I y x y x y x m I y I m I x I * * = = Υλοποίηση µε χρήση συνέλιξης: Παραδείγµατα των µασκών m x, m y δίνονται στην επόµενη διαφάνεια 84
Prewitt Gradient µάσκες Sobel Gradient µάσκες = 0 0 0 3 m x = 0 0 0 3 m y = 0 2 0 2 0 4 m x = 2 0 0 0 2 4 m y 85
Απλός αλγόριθµος για τον υπολογισµό ακµών βάσει µερικών παραγώγων: Υπολογίζεται η συνέλιξη της εικόνας I µε τις µάσκες παραγώγισης κατά γραµµές και κατά στήλες Υπολογίζεται το µέτρο της παραγώγου σε κάθε pixel και χρησιµοποιείται η τεχνική της κατωφλίωσης (thresholding): Ένα pixel (x,y) είναι pixel ακµής, αν το µέτρο της παραγώγου στο σηµείο αυτό g(x,y)>=t, όπου Τ κατώφλι µέτρου παραγώγου 86
Παράδειγµα εφαρµογής µασκών Sobel για ανίχνευση ακµών Αρχική εικόνα Ι 2 3 4 5 6 7 8 0 0 0 0 0 0 0 0 2 0 0 0 0 0 0 0 0 3 0 0 0 0 4 0 0 0 0 5 0 0 0 0 6 0 0 0 0 7 0 0 0 0 0 0 0 0 8 0 0 0 0 0 0 0 0 Sobel row 2 3 2 2 0 0 0 3 - -2 - Sobel column 2 3 0-2 2 0-2 3 0 - Συνέλιξη Ι*Sobel_row 2 3 4 5 6 7 8 0 0 0 0 0 0 0 0 2 0 3 4 4 3 0 3 0 3 4 4 3 0 4 0 0 0 0 0 0 0 0 5 0 0 0 0 0 0 0 0 6 0 - -3-4 -4-3 - 0 7 0 - -3-4 -4-3 - 0 8 0 0 0 0 0 0 0 0 abs(ι*sobel_row)+abs(ι*sobel_column) 2 3 4 5 6 7 8 0 0 0 0 0 0 0 0 2 0 2 6 4 4 4 2 0 3 0 2 6 4 4 6 4 0 4 0 4 4 0 0 4 4 0 5 0 4 4 0 0 4 4 0 6 0 2 6 4 4 6 2 0 7 0 2 6 4 4 6 2 0 8 0 0 0 0 0 0 0 0 Συνέλιξη Ι*Sobel_column 2 3 4 5 6 7 8 0 0 0 0 0 0 0 0 2 0 3 0 0 - - 0 3 0 3 0 0-3 -3 0 4 0 4 4 0 0-4 -4 0 5 0 4 4 0 0-4 -4 0 6 0 - -3 0 0-3 - 0 7 0 - -3 0 0-3 - 0 8 0 0 0 0 0 0 0 0 87
Παράδειγµα εφαρµογής των προηγούµενων µασκών 88
Ανεύρεση ακµών µε χρήση συνέλιξης µε παράγωγο της γκαουσιανής Εστω D ακµή µε µη συσχετισµένο προσθετικό λευκό θόρυβο. Εφαρµόζουµε την συνέλιξη µε τις µονοδιάστατες µάσκες Sobel και τις µονοδιάστατες γκαουσιανές παραγώγους, µε διάφορετικό πλήθος στοιχείων. 2 0 8 6 4 2 0-5 -0-5 0 5 0 5 /04
.5 2 0.5 0-0.5 0-0 50 00 50 200 250 300 2.5 Συνέλιξη µε [,-] - 0 50 00 50 200 250 300 Συνέλιξη µε η παράγωγο γκαουσιανής, σ= 4 2.5 3 2 0.5 0-0.5-0 50 00 50 200 250 300 0 Συνέλιξη µε [,0,-] 0-0 50 00 50 200 250 300 Συνέλιξη µε η παράγωγο γκαουσιανής, σ=2 8 5 0 6 4 2 0-5 0 50 00 50 200 250 300 Συνέλιξη µε [,,,,0,-,-,-,-] -2 0 50 00 50 200 250 300 350 Συνέλιξη µε η παράγωγο γκαουσιανής, σ=5 90
Ακµές βάσει παραγώγων 2ης τάξης Μαθηµατικός ορισµός παραγώγου 2ης τάξης 2D συνάρτησης Ο τελεστής L καλείται λαπλασιανή. Παρατηρείστε ότι η L δεν επιστρέφει διανυσµατικό µέγεθος. Αποδεικνύεται ότι η λαπλασιανή µπορεί να προσεγγιστεί µε συνέλιξη µε πίνακα 3x3: ( ) 2 2 2 2 y I x I I L + = = 0 0 4 0 0 L = 8 L 2 9
Η Συνέλιξη µίας εικόνας µε τους πίνακες της Λαπλασιανής L ή L 2 εντοπίζει pixel ακµών, αλλά ταυτόχρονα ενισχύει το θόρυβο. Αρχικά δεδοµένα (Raw data) 92
Αντί του προηγούµενου χρησιµοποιείται η Λαπλασιανή (L) της συνέλιξης της εικόνας I µε την Γκαουσιανή G -Laplacian of Gaussian LoG: ( G * I) = L( G) I L * Λόγω γραµµικότητας Ο LoG υπολογίζεται αναλυτικά παραγωγίζοντας την µαθηµατική έκφραση της γκαουσιανής G: Για µάσκα Μ(m,n), m,n=-n N ισχύει: LG 2 2 ( ) ( m + n ) m, n c 2 m + n exp 2σ = 2 2 σ ( m, n) LG = c : m n 2 93
Μπορεί να επαληθευτεί ότι η συνέλιξη µίας γκαουσιανής µε τον πίνακα L ή τον L 2 προσεγγίζει την αναλυτική έκφραση της LoG. 94
95
Εφαρµογή LoG σε µία διάσταση Η συνέλιξη της εικόνας Ι σε pixel ακµών µε την LoG παράγει µηδενισµό του αποτελέσµατος στα σηµεία των ακµών. Ετσι όπου παρατηούµε 0 τιµές στα αποτελέσµατα της συνέλιξης LoG*I εντοπίζουµε σηµεία ακµής. συνέλιξη Μηδενισµός LoG: σηµείο ακµής /04
Το πρόβληµα της εύρεσης των σηµείων µηδενισµού της LoG Εν γένει, η συνέλιξη της LoG µε την εικόνα Ι δεν δίνει ακριβώς µηδενικό αποτέλεσµα στα σηµεία των ακµών. Εντοπίζουµε τα σηµεία ακµών προσδιορίζοντας τα σηµεία της εναλλαγής του προσήµου της Ι*LoG: Έστω Ι 2 =Ι*LoG Για κάθε pixel (i,j) της Ι 2 Το pixel (i,j) της Ι χαρακτηρίζεται ως ακµή της Ι αν Ι 2 (i,j)<0 AND ένα τουλάχιστον από τα [Ι 2 (i,j+), Ι 2 (i,j-), Ι 2 (i-,j), Ι 2 (i+,j)] είναι >0 AND Ι 2 (i,j)-max([ι 2 (i,j+), Ι 2 (i,j-), Ι 2 (i-,j), Ι 2 (i+,j)) >κατώφλι 97
+: I*LoG >0 -: I*LoG<0?: οτιδήποτε Ποιά από τα παρακάτω pixel ανήκουν σε ακµές? - -? +?? -?? -? - -? + - - + + - - -? +?? -?? - /04
Εφαρµογή LoG σε δύο διαστάσεις Αποτέλεσµα για σ= Αποτέλεσµα για σ=7 /04
Παράδειγµα ανίχνευσης ακµών εικόνας Ι µε χρήση της Λαπλασιανής µάσκας Λ καξηκ Αρχική εικόνα Ι 2 3 4 5 6 7 8 0 0 0 0 0 0 0 0 2 0 0 0 0 0 0 0 0 3 0 0 0 0 4 0 0 0 0 5 0 0 0 0 6 0 0 0 0 7 0 0 0 0 0 0 0 0 8 0 0 0 0 0 0 0 0 Αποτέλεσμα της συνέλιξης με Λαπλασιανή 2 3 4 5 6 7 8 0 0 0 0 0 0 0 0 2 0 0 0 0 3 0-2 - - -2 0 4 0-0 0-0 5 0-0 0-0 6 0-2 - - -2 0 7 0 0 0 0 8 0 0 0 0 0 0 0 0 Λαπλασιανή 2 3 0 0 2-4 3 0 0 Αποτέλεσμα της ανίχνευσης ακμών 2 3 4 5 6 7 8 0 0 0 0 0 0 0 0 2 0 0 0 0 0 0 0 0 3 0 0 0 0 4 0 0 0 0 0 0 5 0 0 0 0 0 0 6 0 0 0 0 7 0 0 0 0 0 0 0 0 8 0 0 0 0 0 0 0 0 /04
Ανίχνευση ακµών µε τον τελεστή Canny Canny edge detector Τα βήµατα του τελεστή ανίχνευσης ακµών Canny είναι τα ακόλουθα: Υπολογισµός της κλίσης (gradient) της εικόνας µέσω συνέλιξης µε την αναλυτικά υπολογισµένη παράγωγο της Gaussian για συµίεση θορύβου ( I g) ( ) g x, y = I * ( x, y ) = I ( x, y ) x ( I g) g ( x, y ) = I * ( x, y ) = I ( x, y ) (, ) g x y = x y y 2 2πσ G I I G e ( x y ) + Gx Gy 2 2 2 /2σ I 2 2 Gy = Gx + Gy, Θ = tan IGx 0
Καταστολή των µη µέγιστων τιµών, ώστε νε µην συνυπολογίζονται ψευδοακµές: Για κάθε pixel ελέγχεται αν το µέτρο του διανύσµατος κλίσης είναι µεγαλύτερο από το µέτρο του διανύσµατος κλίσης στα δύο pixel εκατέρωθεν αυτού, σε διεύθυνση κάθετη στην διεύθυνση του διανύσµατος κλίσης (έχει υπολογιστεί στο προηγούµενο βήµα). Αν η παραπάνω συνθήκη δεν πληρείται, το pixel δεν θεωρείται pixel ακµής. Κατωφλίωση υστέρησης (Hysterisis thresholding) Τα προηγούµενα βήµατα έχουν δηµιουργήσει ένα αριθµό από υποψήφια pixel ακµών. Ορίζονται δύο κατώφλια (thresholds), T L, T H (T L < T H ) Εντοπίζεται ένα (αρχικό) pixel ακµής µε µέτρο κλίσης G > T H Εντοπιζονται όλα τα pixel ακµής µε µέτρο κλίσης G > T L τα οποία είναι συνδεδεµένα µε το (αρχικό) pixel ακµής.
Τα προηγούµενα δύο βήµατα επαναλαµβάνονται όσο υπάρχουν pixel ακµής µε µέτρο κλίσης G > T H. Οσα pixel έχουν µέτρο κλίσης G > T L. ή Τ Η > G > T L και δεν είναι συνδεδεµένα µε αρχικό pixel ακµής µε µέτρο κλίσης G > T H δεν θεωρούνται pixel ακµής. Ο τελεστής ανίχνευσης ακµών Canny αποτελεί έναν από τους πλέον ισχυρούς τελεστές και χρησιµοποιείται σε πολλές εφαρµογές. 03
Παράδειγµα εφαρµογής του τελεστή Canny για ανίχνευση αγγείων Αρχική εικόνα Ακµές µετά την καταστολή των µη µέγιστων τιµών Ακµές µετά την κατωφλίωση υστέρησης
Μορφολογικοί τελεστές: ιαστολή (Dilation) Ορίζουµε το δοµικό στοιχείο (structuring element -Β) σαν µία δυαδική µάσκα και λαµβάνοµε το συµµετρικό του ως προς το κεντρικό του pixel. B ˆz Το αποτέλεσµα του Dilation της δυαδικής εικόνας Α µε το Β είναι µία δυαδική εικόνα της οποίας κάθε pixel p έχει τιµή, αν και µόνο αν: το κεντρικό pixel του συµµετρικού (ως προς το κεντρικό pixel) Β τοποθετηθεί στο p και ένα τουλάχιστον από τα επικαλυπτόµενα pixels έχει τιµή τόσο στο συµµετρικό SE, όσο και στην δυαδική εικόνα. { : ˆ } z A B= z B A 2 3 4 5 6 7 8 9 0 2 3 4 5 6 7 8 9 0 2 3 4 5 6 7 8 9 0 2 3 4 5 6 7 8 9 0 05
Μορφολογικοί τελεστές: ιάβρωση (Erosion) Ορίζουµε το δοµικό στοιχείο (structuring element -Β) σαν µία δυαδική µάσκα και δεν λαµβάνουµε το συµµετρικό του ως προς το κεντρικό του pixel. Το αποτέλεσµα του Dilation της δυαδικής εικόνας Α µε το Β είναι µία δυαδική εικόνα της οποίας κάθε pixel p έχει τιµή, αν και µόνο αν: το κεντρικό pixel του B τοποθετηθεί στο p και όλα τα µη µηδενικά pixels του Β p βρίσκονται σε επικαλυπτόµενα pixels µη µηδενικά pixels της δυαδικής εικόνας Α. { : p } A B= p B A 2 3 4 5 6 7 8 9 0 2 3 4 5 6 7 8 9 0 2 3 4 5 6 7 8 9 0 2 3 4 5 6 7 8 9 0 06
Συνδυασµός Μορφολογικών τελεστών: Ανοιγµα (opening) Κλείσιµο (closing) εικόνας Εστω εικόνα Ι και δοµικό στοιχείο Β. Ορίζονται οι ακόλουθοι τελεστές: Κλείσιµο εικόνας: Ανοιγµα εικόνας: ( ) ( ) I = I B B I = I B B 07
Μορφολογικός αλγόριθµος εξαγωγής περιγράµµατος Εισοδος: Ι δυαδική εικόνα µε συµπαγή περιοχή µη µηδενικών pixel (8-connected) Εξοδος: Ι δυαδική εικόνα µε επισηµασµένα τα pixel του περιγράµµατος της περιοχής 0 0 B= 0 0 ( ) I = I I B 08
Αλγόριθµος Μορφολογικό γέµισµα περιοχής (region filling) Εισοδος: Ι δυαδική εικόνα µε κλειστό περίγραµµα (8- connected) Συνταταγµένες σηµείου p εντός περιγράµµατος Εξοδος: Ι δυαδική εικόνα µε επισηµασµένα τα pixel εντός του περιγράµµατος k=0 X 0 : δυαδική εικόνα While end X k X k ( ) X k = X k B I k=k+ I = X k I c X 0 ( q) = 0 q= q p p 0 0 B= 0 0 09
Παράδειγµα µορφολογικού γεµίσµατος περιοχής Εστω η αρχική εικόνα Ι και ένα αρχικό pixel εντός του περιγράµµατος (επισηµαίνεται µε το βέλος). Η εξέλιξη του αλγόριθµου του µορφολογικού γεµίσµατος περιοχής είναι η ακόλουθη: 2 3 4 5 6 7 8 0 0 0 0 0 0 0 0 2 0 0 0 3 0 0 0 0 0 0 4 0 0 0 0 5 0 0 0 0 0 0 6 0 0 0 0 0 0 7 0 0 0 0 0 8 0 0 0 0 0 0 0 0 Αρχική εικόνα Ι 2 3 0 0 2 3 0 0 οµικό στοιχείο Β 0
2 3 4 5 6 7 8 0 0 0 0 0 0 0 0 2 0 0 0 0 0 0 0 0 3 0 0 0 0 0 0 0 4 0 0 0 0 0 0 0 0 5 0 0 0 0 0 0 0 0 6 0 0 0 0 0 0 0 0 7 0 0 0 0 0 0 0 0 8 0 0 0 0 0 0 0 0 2 3 4 5 6 7 8 0 0 0 0 0 0 0 0 2 0 0 0 0 0 0 0 3 0 0 0 0 0 4 0 0 0 0 0 0 0 5 0 0 0 0 0 0 0 0 6 0 0 0 0 0 0 0 0 7 0 0 0 0 0 0 0 0 8 0 0 0 0 0 0 0 0 2 3 4 5 6 7 8 0 0 0 0 0 0 0 0 2 0 0 0 0 0 0 0 0 3 0 0 0 0 0 0 4 0 0 0 0 0 0 0 5 0 0 0 0 0 0 0 0 6 0 0 0 0 0 0 0 0 7 0 0 0 0 0 0 0 0 8 0 0 0 0 0 0 0 0 Εικόνα Χ0 ιαστολή της Χ0 µε το Β Χ=τοµή της ( ιαστολή της Χ0 µε το Β) µε την Ι c Συµπλήρωµα αρχικής εικόνας Ι c 2 3 4 5 6 7 8 2 0 0 0 0 0 3 0 0 4 0 0 0 0 5 0 0 6 0 0 7 0 0 0 8 2 3 0 0 2 3 0 0 οµικό στοιχείο Β
2 3 4 5 6 7 8 0 0 0 0 0 0 0 0 2 0 0 0 0 0 0 3 0 0 0 0 4 0 0 0 0 0 5 0 0 0 0 0 0 0 6 0 0 0 0 0 0 0 0 7 0 0 0 0 0 0 0 0 8 0 0 0 0 0 0 0 0 ιαστολή της Χ µε το Β 2 3 4 5 6 7 8 0 0 0 0 0 0 0 0 2 0 0 0 0 0 0 0 0 3 0 0 0 0 0 4 0 0 0 0 0 0 0 5 0 0 0 0 0 0 0 6 0 0 0 0 0 0 0 0 7 0 0 0 0 0 0 0 0 8 0 0 0 0 0 0 0 0 Χ2=τοµή της ( ιαστολή της Χ µε το Β) µε την Ι c 2 3 4 5 6 7 8 0 0 0 0 0 0 0 0 2 0 0 0 0 0 3 0 0 0 4 0 0 0 0 5 0 0 0 0 0 6 0 0 0 0 0 0 0 7 0 0 0 0 0 0 0 0 8 0 0 0 0 0 0 0 0 ιαστολή της Χ2 µε το Β Συµπλήρωµα αρχικής εικόνας Ι c 2 3 4 5 6 7 8 2 0 0 0 0 0 3 0 0 4 0 0 0 0 5 0 0 6 0 0 7 0 0 0 8 2 3 0 0 2 3 0 0 οµικό στοιχείο Β 2
2 3 4 5 6 7 8 0 0 0 0 0 0 0 0 2 0 0 0 0 0 0 0 0 3 0 0 0 0 0 4 0 0 0 0 0 0 0 5 0 0 0 0 0 0 0 6 0 0 0 0 0 0 0 7 0 0 0 0 0 0 0 0 8 0 0 0 0 0 0 0 0 2 3 4 5 6 7 8 0 0 0 0 0 0 0 0 2 0 0 0 3 0 0 0 4 0 0 0 5 0 0 0 0 0 6 0 0 0 0 0 7 0 0 0 0 0 8 0 0 0 0 0 0 0 0 Χ2=τοµή της ( ιαστολή της Χ µε το Β) µε την Ι c Ενωση της Χ2 µε την Ι. Συµπλήρωµα αρχικής εικόνας Ι c 2 3 4 5 6 7 8 2 0 0 0 0 0 3 0 0 4 0 0 0 0 5 0 0 6 0 0 7 0 0 0 8 Αρχική εικόνα Ι 2 3 4 5 6 7 8 0 0 0 0 0 0 0 0 2 0 0 0 3 0 0 0 0 0 0 4 0 0 0 0 5 0 0 0 0 0 0 6 0 0 0 0 0 0 7 0 0 0 0 0 8 0 0 0 0 0 0 0 0 3
Λέπτυνση Εξαγωγή κεντρικού άξονα Thinning Για κάθε pixel p, θεωρείστε την ακολουθία των pixels {x,x2,x3,x4,x5,x6,x7,x8,x} Ορίζουµε ως Connectivity το πλήθος των µεταβάσεων 0, καθώς διατρέχουµε τη ακολουθία των pixel. Εντοπίζουµε τα pixel p που πληρούν τη συνθήκη T, τα pixel p2 που πληρούν τη συνθήκη T2 τα pixel p3 που πληρούν τη συνθήκη T3 τα pixel p4 που πληρούν τη συνθήκη T4 2 3 x8 x x2 2 x7 p x3 3 x6 x5 x4 4
Εντοπίζουµε τα pixel p που πληρούν τη συνθήκη T AND πλήθος γειτόνων> AND connectivity(p)= I(p)=0 Επανυπολογίζουµε πλήθος γειτόνων και connectivity Εντοπίζουµε τα pixel p που πληρούν τη συνθήκη T2 AND πλήθος γειτόνων> AND connectivity(p)= I(p)=0 Επανυπολογίζουµε πλήθος γειτόνων και connectivity Εντοπίζουµε τα pixel p που πληρούν τη συνθήκη T3 AND πλήθος γειτόνων> AND connectivity(p)= I(p)=0 Επανυπολογίζουµε πλήθος γειτόνων και connectivity 5
Εντοπίζουµε τα pixel p που πληρούν τη συνθήκη T4 AND πλήθος γειτόνων> AND connectivity(p)= I(p)=0 6
7
Απαρίθµηση αντικειµένων Component labelling Είσοδος: δυαδική εικόνα I Εξοδος: εικόνα L µε διαστάσεις ίσες µε την είσοδο και τιµές [0,n], 0: υπόβαθρο, n: πλήθος µη συνεδεµένων στοιχείων 2 3 4 5 6 7 8 0 0 0 0 0 0 0 0 2 0 0 0 3 0 0 0 0 0 4 0 0 0 5 0 0 0 0 0 0 0 6 0 0 0 0 0 0 7 0 0 0 0 0 8 0 0 0 0 0 0 0 0 Είσοδος αλγορίθµου 2 3 0 p2 0 2 p p0 0 3 0 0 0 2 3 4 5 6 7 8 0 0 0 0 0 0 0 0 2 0 0 2 2 0 3 0 0 0 0 2 2 0 4 0 0 2 2 0 5 0 0 0 0 0 0 0 6 0 3 0 0 0 4 0 0 7 0 3 0 0 4 4 0 0 8 0 0 0 0 0 0 0 0 Εξοδος αλγορίθµου 8
Μεταβλητές I: binary image L: label image Equiv_table: πίνακας ισοδυναµίας label Ο αλγόριθµος εκτελείται σε 2 περάσµατα: Σε κάθε τρέχον pixel ελέγχονται τα pixel που έχουν ήδη επεξεργαστεί. Αν όλα έχουν Label=0, τότε Αν έχουν κοινό Label>0 τότε Αν έχουν διαφορετικά Label>0 τότε 9
current_label=0 for each pixel p of I end if I(p)<>0 end if L(p)==0 AND L(p2)==0 current_label= current_label+ L(p)=current_label else if L(p)==L(p2) AND L(P)>0 current_label=current_label+ L(p)=current_label else if L(p)>0 AND L(p2)>0 AND L(p)<>L(p2) end L(p)=min(L(p),L(p2)) equiv_table(l(p),l(p2))= 20
Παράδειγµα εφαρµογής Component labelling 2 3 4 5 6 7 8 0 0 0 0 0 0 0 0 2 0 0 3 0 0 0 0 0 0 4 0 0 5 0 0 0 0 0 0 6 0 0 7 0 0 0 0 0 0 0 0 8 0 0 0 0 0 0 0 0 Αρχική δυαδική εικόνα 2 3 4 5 6 7 8 0 0 0 0 0 0 0 0 2 0 0 2 2 2 3 0 0 0 0 0 0 2 4 0 3 3 0 4 4 2 5 0 0 0 0 0 0 2 6 0 5 5 0 6 6 2 7 0 0 0 0 0 0 0 0 8 0 0 0 0 0 0 0 0 Component labelling (πρώτο πέρασµα) Παρατηρούµε ότι το label είναι ισοδύναµο µε το 3 και το label 3 είναι ισοδύναµο µε το label 5. Οµοίως το label 2 είναι ισοδύναµο µε το 4 και το label 4 είναι ισοδύναµο µε το label 6. Ο πίνακας ισοδυναµίας Α έχει την ακόλουθη µορφή: Label Label 2 3 4 5 6 0 0 0 0 2 0 0 0 0 3 0 0 0 0 4 0 0 0 0 5 0 0 0 0 0 6 0 0 0 0 0 2
Ο πίνακας Α*Α υπολογίζει το κάθε χρώµα µε ποια label είναι ισοδύναµο µε έως και 2 βήµατα ισοδυναµίας. Στον πίνακα που ακολουθεί φαίενεται ότι το label είναι απευθείας ισοδύναµο µε το label 5 και επίσης ισοδύναµο µε το label 3 µε 2 βήµατα (µεσω του label 5). Γενικά ο Α n δείχνει αν υπάρχει σύνδεση µεταξύ 3 label µέσω n βηµάτων. Label Label 2 3 4 5 6 0 2 0 0 2 0 0 2 0 3 0 0 0 2 0 4 0 0 0 0 2 5 0 0 0 0 0 6 0 0 0 0 0 2 3 4 5 6 7 8 0 0 0 0 0 0 0 0 2 0 0 2 2 2 3 0 0 0 0 0 0 2 4 0 0 2 2 2 5 0 0 0 0 0 0 2 6 0 0 2 2 2 7 0 0 0 0 0 0 0 0 8 0 0 0 0 0 0 0 0 Component labelling (2 ο πέρασµα) µετά την εφαρµγή του πίνακα ισοδυναµίας 22
Μορφολογικός αλγόριθµος ανεύρεσης αντικειµένου σε δυαδική εικόνα (Hit and Miss) Εισοδος: Ι δυαδική εικόνα µε πολλά αντικείµενα (τιµή pixel αντικειµένου, τιµή υποβάθρου 0 Εξοδος: Ι δυαδική εικόνα µε επισηµασµένα το pixel θέσης του αντικειµένου Εστω Β το δοµικό στοιχείο που ταυτίζεται µε το αντικείµενο που αναζητούµε. Εστω Β2 το δοµικό στοιχείο που είναι τουλάχιστον 2 pixel µεγαλύτερης διάστασης από το Β και το περίγραµµα του έχει τιµή ενώ το εσωτερικό του έχει τιµή 0. Αν πχ αναζητούµε τη θέση ενός τετράγωνου αντικειµένου 3x3, τότε B 0 0 0 =, B = 0 0 0 0 0 0 2 23
Ο µετασχηµατισµός Hit and Miss εντοπίζει τη θέση του ζητούµενου αντικειµένου κάνοντας διάβρωση της Ι µε το Β, διάβρωση της Ι c µε το Β 2 και υπολογίζοντας την τοµή των δύο αποτελεσµάτων. (Θυµηθείτε ότι η τοµή δύο δυαδικών εικόνων υπολογίζεται ως ο λογικός τελεστής ΚΑΙ pixel προς pixel. c ( ) ( ) I = I B I B 2 24
Παράδειγµα εφαρµογής Hit and Miss Εστω η εικόνα Ι στην οποία αναζητούµε τετράγωνο 3x3 αποτελούµενο από τιµές =. Αρχική εικόνα Ι 2 3 4 5 6 7 8 9 0 0 0 0 0 0 0 0 0 0 2 0 0 0 0 0 0 0 0 0 3 0 0 0 0 0 0 4 0 0 0 0 0 0 5 0 0 0 0 0 0 6 0 0 0 0 0 0 0 0 0 0 7 0 0 0 0 0 0 8 0 0 0 0 0 0 9 0 0 0 0 0 0 0 0 0 0 0 0 0 Δομικό στοιχείο Β Δομικό στοιχείο Β 2 0 0 0 0 0 0 0 0 0 25
Αντίθετο της Ι, Ι c 2 3 4 5 6 7 8 9 0 0 2 0 3 0 0 0 0 4 0 0 0 0 5 0 0 0 0 6 7 0 0 0 0 8 0 0 0 0 9 0 0 0 0 0 0 0 0 0 Διάβρωση της Ιμε το Β 2 3 4 5 6 7 8 9 0 0 0 0 0 0 0 0 0 0 0 2 0 0 0 0 0 0 0 0 0 0 3 0 0 0 0 0 0 0 0 0 0 4 0 0 0 0 0 0 0 0 0 5 0 0 0 0 0 0 0 0 0 0 6 0 0 0 0 0 0 0 0 0 0 7 0 0 0 0 0 0 0 0 0 0 8 0 0 0 0 0 0 0 0 9 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 Διάβρωση της Ι c με το Β 2 2 3 4 5 6 7 8 9 0 0 0 0 0 0 0 0 0 0 0 2 0 0 0 0 0 0 0 0 0 0 3 0 0 0 0 0 0 0 0 0 0 4 0 0 0 0 0 0 0 0 0 5 0 0 0 0 0 0 0 0 0 0 6 0 0 0 0 0 0 0 0 0 0 7 0 0 0 0 0 0 0 8 0 0 0 0 0 0 0 9 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 (Διάβρωση της Ιμε το Β ) τομή (Διάβρωση της Ι c με το Β 2 ) 2 3 4 5 6 7 8 9 0 0 0 0 0 0 0 0 0 0 0 2 0 0 0 0 0 0 0 0 0 0 3 0 0 0 0 0 0 0 0 0 0 4 0 0 0 0 0 0 0 0 0 5 0 0 0 0 0 0 0 0 0 0 6 0 0 0 0 0 0 0 0 0 0 7 0 0 0 0 0 0 0 0 0 0 8 0 0 0 0 0 0 0 0 0 0 9 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 26
Εξαγωγή διατεταγµένου περιγράµµατος (contour tracing) Εστω δυαδική εικόνα I, η οποία περιέχει αντικείµενο τα pixel του οποίου έχουν τιµή (ενώ του υποβάθρου έχουν τιµή 0). Άναζητούνται τα pixel που περικλείουν το αντικείµενο σε µορφή διατεταγµένου περιγράµµατος. Ο όρος διατεταγµένο περίγραµµα αναφέρεται σε ακολουθία pixel µε σειρά που τηρεί τη γειτονεία τους στην εικόνα Ι. Ετσι είναι δυνατός ο υπολογισµός κάθετων διανυσµάτων και άλλων γεωµετρικών χαρακτηριστικών του περιγράµµατος. Παρατηρείστε ότι ο Μορφολογικός αλγόριθµος εξαγωγής περιγράµµατος που παρουσιάστηκε σε προηγούµενη διαφάνεια παράγει ως έξοδο τα pixel του περιγράµµατος αλλά όχι διατεταγµένα. Θα περιγραφεί ο αλγόριθµος εξαγωγής περιγράµµατος Teo Pavlidis (Algorithms for Graphics and Image Processing, 982 Κεφ. 7). 27
Βασικές αρχές του αλγόριθµου του Pavlidi εξαγωγής διατεταγµένου περιγράµµατος Είσοδος: δυαδική εικόνα Εξοδος: διατεταγµένο περίγραµµα Ο αλγόριθµος θεωρεί µία γραφίδα η οποία κινείται στα pixel της εικόνας και θέτει σε αυτά την τιµή ή 0 ανάλογα αν αυτά ανήκουν ή όχι στο περίγραµµα. Αρχικοποίηση της θέσης της γραφίδας: ένα pixel p του αντικειµένου (τιµή ) στα αριστερά του οποίου υπάρχει pixel του υποβάθρου (τιµή 0). Ο αλγόριθµος χρησιµοποιεί µία µεταβλητή για να καθορίζει την «κατεύθυνση» την οποία έχει η γραφίδα. Ορίζουµε 4 κατευθύνσεις: Κ=: η γραφίδα βρίσκεται στο p=(i,j) και «κοιτάζει» στο (i-,j) Κ=2: η γραφίδα βρίσκεται στο p=(i,j) και «κοιτάζει» στο (i,j+) Κ=3: η γραφίδα βρίσκεται στο p=(i,j) και «κοιτάζει» στο (i+,j) Κ=4: η γραφίδα βρίσκεται στο p=(i,j) και «κοιτάζει» στο (i,j-) 28
Για κάθε τρέχον pixel p στο οποίο βρίσκεται η γραφίδα, ο αλγόριθµος ελέγχει τα εξής τρία pixel: το pixel p που βρίσκεται µπροστά και αριστερά από τη γραφίδα το pixel p2 που βρίσκεται µπροστά από τη γραφίδα και το pixel p3 που βρίσκεται µπροστά και δεξιά από τη γραφίδα p p2 p3 p p3 p p p2 p p2 p p3 p3 p2 p p Κατεύθυνση Κ= Κατεύθυνση Κ=2 Κατεύθυνση Κ=3 Κατεύθυνση Κ=4 29
.Αποθήκευσε το τρέχον pixel p. 2.IF I(p)==. p=p 2.ενηµέρωσε την µεταβλητή Κ (κατεύθυνση) 3.ELSEIF I(p2)==. p=p2 2.% H µεταβλητή Κ (κατεύθυνση) δεν αλλάζει 4.ELSEIF I(p3)==. p=p3 2.% H µεταβλητή Κ (κατεύθυνση) δεν αλλάζει 5.ELSE % δηλ αν και τα 3 pixel p, p2, p3 είναι 0.Κ=Κ+ % περιστροφή 90 0 κατεύθυνσης clockwise 6.END Συνθήκη τερµατισµού του αλγόριθµου: αν η γραφίδα συναντήσει το αρχικό pixel στο οποίο αρχικοποιήθηκε η θέση της γραφίδας, ή αν το αρχικό pixel δεν έχει µη µηδενικούς γείτονες (είναι αποµονωµένο). 30
Η ενηµέρωση της µεταβλητής Κ (γραµµές.2, 2.2, 3.2) γίνεται ως εξής: Αρχική Κατεύθυνση Κ Νέα Κατεύθυση Κ µετά την ενηµέρωση του τρέχοντος pixel p σε: p p2 p3 4 2 2 2 3 2 3 3 4 3 4 4 p p2 p3 p p3 p p p2 p p2 p p3 p3 p2 p p Κατεύθυνση Κ= Κατεύθυνση Κ=2 Κατεύθυνση Κ=3 Κατεύθυνση Κ=4 3
Παράδειγµα εφαρµογής του αλγόριθµου εξαγωγής διατεταγµένου περιγράµµατος Αρχική εικόνα Pixels περιγράµµατος Γραµµή / στήλη Pixels διατεταγµένου περιγράµµατος 8 20 7 9 6 9 5 8 4 7 3 7 2 6 6 0 6 9 5 8 4 8 4 8 3 8 2 7 7 8 0 8 9 8 8 9 7 0 6 0 6 6 2 6 3 6 4 7 5 7 6 7 7 8 8 9 8 9 8 0 9 9 9 2 20 3 2 4 22 4 23 4 24 5 24 5 24 6 24 7 24 8 24 9 24 9 23 9 22 20 22 20 2 20 20 20 9 20 32
2 3 4 5 6 7 8 9 0 (8,4) 0 0 0 0 0 0 0 0 0 0 2 0 0 0 0 0 0 0 0 0 0 3 0 0 0 0 0 0 0 0 0 4 0 0 0 0 0 0 0 0 5 0 0 0 0 0 6 0 0 0 0 0 0 0 7 0 0 0 0 0 0 8 0 0 0 0 0 0 0 9 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 Κατεύθυνση= Επιλογή αρχικού σηµείου 33
2 3 4 5 6 7 8 9 0 (8,4) (7,4) 0 0 0 0 0 0 0 0 0 0 2 0 0 0 0 0 0 0 0 0 0 3 0 0 0 0 0 0 0 0 0 4 0 0 0 0 0 0 0 0 5 0 0 0 0 0 6 0 0 0 0 0 0 0 7 0 0 0 0 0 0 8 0 0 0 0 0 0 0 9 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 Κατεύθυνση= 34
2 3 4 5 6 7 8 9 0 (8,4) (7,4) (6,4) 0 0 0 0 0 0 0 0 0 0 2 0 0 0 0 0 0 0 0 0 0 3 0 0 0 0 0 0 0 0 0 4 0 0 0 0 0 0 0 0 5 0 0 0 0 0 6 0 0 0 0 0 0 0 7 0 0 0 0 0 0 8 0 0 0 0 0 0 0 9 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 Κατεύθυνση= /04
2 3 4 5 6 7 8 9 0 (8,4) (7,4) (6,4) (5,3) 0 0 0 0 0 0 0 0 0 0 2 0 0 0 0 0 0 0 0 0 0 3 0 0 0 0 0 0 0 0 0 4 0 0 0 0 0 0 0 0 5 0 0 0 0 0 6 0 0 0 0 0 0 0 7 0 0 0 0 0 0 8 0 0 0 0 0 0 0 9 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 Κατεύθυνση=4 Αποµωνοµένο σηµείο 36
2 3 4 5 6 7 8 9 0 (8,4) (7,4) (6,4) (5,3) 0 0 0 0 0 0 0 0 0 0 2 0 0 0 0 0 0 0 0 0 0 3 0 0 0 0 0 0 0 0 0 4 0 0 0 0 0 0 0 0 5 0 0 0 0 0 6 0 0 0 0 0 0 0 7 0 0 0 0 0 0 8 0 0 0 0 0 0 0 9 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 Κατεύθυνση= Αποµωνοµένο σηµείο 37
σγδξ (8,4) (7,4) (6,4) (5,3) (5,4) 2 3 4 5 6 7 8 9 0 0 0 0 0 0 0 0 0 0 0 2 0 0 0 0 0 0 0 0 0 0 3 0 0 0 0 0 0 0 0 0 4 0 0 0 0 0 0 0 0 5 0 0 0 0 0 6 0 0 0 0 0 0 0 7 0 0 0 0 0 0 8 0 0 0 0 0 0 0 9 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 Κατεύθυνση=2 38
σγδξ (8,4) (7,4) (6,4) (5,3) (5,4) 2 3 4 5 6 7 8 9 0 0 0 0 0 0 0 0 0 0 0 2 0 0 0 0 0 0 0 0 0 0 3 0 0 0 0 0 0 0 0 0 4 0 0 0 0 0 0 0 0 5 0 0 0 0 0 6 0 0 0 0 0 0 0 7 0 0 0 0 0 0 8 0 0 0 0 0 0 0 9 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 Κατεύθυνση=2 39
σγδξ (8,4) (7,4) (6,4) (5,3) (5,4) (5,5) 2 3 4 5 6 7 8 9 0 0 0 0 0 0 0 0 0 0 0 2 0 0 0 0 0 0 0 0 0 0 3 0 0 0 0 0 0 0 0 0 4 0 0 0 0 0 0 0 0 5 0 0 0 0 0 6 0 0 0 0 0 0 0 7 0 0 0 0 0 0 8 0 0 0 0 0 0 0 9 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 Κατεύθυνση= 40
Μορφολογικός αλγόριθµος: Λέπτυνση (Thinning) Εισοδος: Ι δυαδική εικόνα µε πολλά αντικείµενα (τιµή pixel αντικειµένου, τιµή υποβάθρου 0 Εξοδος: Ι δυαδική εικόνα µε επισηµασµένα τα pixel θέσης του αντικειµένου c=0 while c>0 find pixels p: that satisfy condition_ I(p)=0 c=number of {p} if c==0 break else find pixels p: that satisfy condition_2 I(p)=0 c=number of {p} end
Condition_ for current pixel p:.p has from 2 to 6 neighbours with value 2. I(p)= 3.Transversing the 8- neighbours of p there is only 0 value transition 4.At least one of the North, East and South neighbours of p has 0 value 5.At least one of the East, South and West neighbours of p has 0 value Condition_2 for current pixel p: Conditions, 2 and 3 same.at least one of the North, East and West neighbours of p has 0 value 2.At least one of the North, South and West neighbours of p has 0 value 42
Παράδειγµα µετασχηµατισµού λέπτυνσης 43
Τµηµατοποίηση εικόνας - Segmentation Τµηµατοποίηση: ανεύρεση του αντικειµένου ενδιαφέροντος Πρόβληµα άλυτο στη γενική του µορφή λόγω: ποικιλίας αντικειµένων διαφορετικές συνθήκες φωτεινότητας - αντίθεσης σχετικής γεωµετρίας αντικειµένου - ανιχνευτή 44
Τµηµατοποίηση µε ολική κατωφλίωση total thresholding Η µέθοδος βασίζεται στην ύπαρξη 2 κλάσεων pixels µε διαφορετικές τιµές που κατανέµονται γύρω από διαφορετικές µέσες τιµές. Επιλέγεται κατώφλι (threshold) Τ και εφαρµόζεται κατωφλίωση (thresholding): Για κάθε pixel (i,j) ελέγχεται η τιµή του Αν είναι I(i,j) >=Τ, τότε θεωρείται ότι ανήκει στο αντικείµενο Α, αλλιώς στα άλλα αντικείµενα της εικόνας ή το υπόβαθρο (background). 45
Τµηµατοποίηση Ιατρικών Εικόνων Παράδειγµα ολικής Κατωφλίωσης 46
Τµηµατοποίηση Ιατρικών Εικόνων Παράδειγµα Κατωφλίωσης 47 Κατώφλι 35 Κατώφλι 35
Παράδειγµα εικόνας µε δύο κατανοµές pixel: αντικείµενο (πνεύµονες) και υπόβαθρο Αρχική εικόνα Ιστόγραµµα /04
Ολική Κατωφλίωση της προηγούµενης εικόνας και εξαγωγή του αντικειµένου ενδιαφέροντος (πνεύµονες) για τρεις διαφορετικές φθίνουσες τιµές του ολικού κατωφλίου. 49
Τµηµατοποίηση µε Κατωφλίωση: Η µέθοδος Ridler Calvard Επιλέγεται ως κατώφλι η µέση τιµή της εικόνας Ι. Επανάλαβε Υπολογίζονται οι µέσες τιµές µ 0 και µ των 2 κλάσεων pixel που δηµιουργούνται από το κατώφλι. Ενηµερώνεται η τιµή του κατωφλίου: τ = µ 0+ µ 2 ( ) Όσο η τιµή του κατωφλίου είναι διάφορη της προηγούµενης τιµής κατωφλίου
Τµηµατοποίηση µε την µέθοδο Ridler Calvard: Επανάληψη Τρέχον κατόφλι 3.5625 Μέση τιµή pixels>τρέχον κατόφλι 6.667 Μέση τιµή pixels<=τρέχον κατόφλι.7 Νέο κατόφλι 4.833 2 3 4 6 8 2 8 0 2 4 3 5
Τµηµατοποίηση µε την µέθοδο Ridler Calvard: Επανάληψη 2 Τρέχον κατόφλι 4.833 Μέση τιµή pixels>τρέχον κατόφλι 8 Μέση τιµή pixels<=τρέχον κατόφλι 2.083 Νέο κατόφλι 5.047 2 3 4 6 8 2 8 0 2 4 3
Τµηµατοποίηση µε την µέθοδο Ridler Calvard: Επανάληψη 3 Τρέχον κατόφλι 5.047 Μέση τιµή pixels>τρέχον κατόφλι 8 Μέση τιµή pixels<=τρέχον κατόφλι 2.083 Νέο κατόφλι 5.047 2 3 4 6 8 2 8 0 2 4 3
Τµηµατοποίηση µε την µέθοδο Ridler Calvard: Επανάληψη 3 Τρέχον κατόφλι 5.047 Μέση τιµή pixels>τρέχον κατόφλι 8 Μέση τιµή pixels<=τρέχον κατόφλι 2.083 Νέο κατόφλι 5.047 2 3 4 6 8 2 8 0 2 4 3
Παρατηρείστε ότι ο ουρανός δεν έχει τµηµατοποιηθεί σωστά. 0 05 Threshold 00 95 2 3 4 5 6 7 8 Iterartions Εφαρµογή του προηγούµενου αλγόριθµου και η εξέλιξη της αριθµητικής τιµής του κατωφλίου σα συνάρτηση των επαναλήψεων. 55
Τµηµατοποίηση µε Κατωφλίωση: Η µέθοδος Otsu Εστω εικόνα µε L δυνατές τιµές, ιστόγραµµα n και κανονικοποιηµένο ιστόγραµµα p. Η εικόνα περιέχει δύο κατανοµές pixel που αντιστοιχούν στο αντικείµενο προς τµηµατοποίηση και στο υπόβαθρο. Οι δύο κατανοµές C 0, C χωρίζονται από ένα κατώφλι k. Πιθανότητα να ανήκει ένα pixelστις κλάσεις C, C : k ( ), ( ) ω = p = ω k ω = p = ω k 0 i i= i= k+ Μέση τιµή των pixel των κλάσεων C, C : ( k) ( k) 0 i 0 i= i= k+ 0 k L µ µ L µ µ = ip =, µ = ipi = ω ω ω ω L i 0 ( k) ( k) 56
ιασπορά των pixel των κλάσεων C, C : k σ = µ ( i ) 0 0 ω0 i= L σ = µ ( i ) ω i= k+ Αθροισµα της διασποράς των δύο κλάσεων (ξεχωριστά) ιασπορά µεταξύ των δύο κλάσεων w 2 2 p i p σ = ωσ + ωσ i, 2 2 0 0 0 ( ) ( ) ( ) 2 2 2 2 σ B = ω 0 µ 0 µ T + ω µ µ T = ωω 0 µ µ 0 Ως κατόφλι επιλέγεται η τιµή του k που µεγιστοποιεί την ποσότητα σ 2 Β. 57
Παράδειγµα εκτέλεσης της µεθόδου Otsu Τιµή ω 0 ω µ 0 µ σ Β 0.325 0.6875.0000 4.7273 2.9847 2 0.5000 0.5000.3750 5.7500 4.7852 3 0.6250 0.3750.7000 6.6667 5.785 4 0.7500 0.2500 2.0833 8.0000 6.5638 5 0.7500 0.2500 2.0833 8.0000 6.5638 6 0.825 0.875 2.3846 8.6667 6.02 7 0.825 0.875 2.3846 8.6667 6.02 8 0.9375 0.0625 3.333 0.000 2.7628 9 0.9375 0.0625 3.333 0.000 2.7628 Μέγιστο σ Β για κατόφλι=4 2 3 4 6 8 2 8 0 2 4 3 58
Initial Image 6 x 04 Histogram 4 2 0 0 00 200 300.8 x 04 sigmab thresholded image.6.4.2 0 00 200 300 Παράδειγµα κατωφλίωσης µε τη µέθοδο Otsu. 59
υναµικός υπολογισµός κατωφλίου Σε περίπτωση που το υπόβαθρο µεταβάλλεται, είναι αδύνατο να βρεθεί ένα κατώφλι που αν εφαρµοστεί σε όλη την εικόνα να τµηµατοποιεί το αντικείµενο. Σε αυτή την περίπτωση: Ορίζεται µία περιοχή µεγέθους (2w+)x(2w+). Για κάθε pixel p της εικόνας Υπολογίζεται το κατώφλι ως συνάρτηση ενός ή περισσοτέρων στατιστικών µεγεθών των τιµών της εικόνας εντός του τρέχοντος παραθύρου, όπως: µέση τιµή (mean), ενδιάµεση τιµή (median), µέγιστη (max), ελάχιστη τιµή (min), τυπική απόκλιση (σ), υπολογισµένων τοπικά. Ενδεικτικοί τρόποι υπολογισµού του κατωφλίου: ( R) + min( R) max T = 2 T = mean R + w R ( ) σ( ) Αν I(p)>T I (p)= ELSE I (p)=0 60
Initial Image υναµική κατωφλίωση µε διαφορετικά µεγέθη παραθύρου (2w+)x(2w+). Το µέγεθος w πρέπει να είναι ανάλογο του µεγέθους του αντικειµένου που πρέπει να τµηµατοποιηθεί. Αποτέλεσµα κατωφλίωσης µε µικρό µέγεθος παραθύρου (w). Αποτέλεσµα κατωφλίωσης µε κατάλληλο µέγεθος παραθύρου (w). Παρατηρείστε ότι ο ουρανός έχει τµηµατοποιηθεί σωστά. 6
Initial Image Εφαρµογή δυναµικής κατωφλίωσης σε εικόνα µε ανοµοιογενή φωτισµό, w=9. Η εικόνα αυτή δεν είναι δυνατό να τµηµατοποιηθεί µε την ίδια αποτελεσµατικότητα µε ολική κατωφλίωση. Υπολογισµός Κατωφλίου: Τ=mean(περιοχής)-σ(περιοχής)
Τµηµατοποίηση Ιατρικών Εικόνων Μέθοδος ανάπτυξης περιοχών (region growing): Έστω εικόνα I(x,y) και σηµείο (x s,y s ) Στόχος: εύρεση pixels που ανήκουν στην ίδια περιοχή µε το (x s,y s ) Κριτήριο: pixels που ανήκουν στην ίδια περιοχή έχουν παρόµοιο χρώµα 63
Υλοποίηση της µεθόδου ανάπτυξης περιοχών Η µέθοδος ανάπτυξης περιοχών τµηµατοποιεί ένα αντικείµενο σε µία εικόνα υπό την προυπόθεση ότι: ίδεται ένα pixel εντός του αντικειµένου (x0,y0) Καθορίζεται ένα κριτήριο οµοιότητας των pixel του αντικειµένου Ο αλγόριθµος χρησιµοποιεί µία ουρά Q η οποία αρχικοποιείται µε το (x0,y0). 64
Αλγόριθµος RGROW Είσοδος: Ι, x0, y0, tolerance Εξοδος: BW. BW=zeros(size(I)) 2. Αρχικοποίησε Q µε (x0,y0) 3. Χαρακτήρισε το (x0,y0) ως αντικείµενο: BW(x0,y0)= 4. Αρχικοποίησε τη µεταβλητή µέση_τιµη_αντικειµένου 5. ΟΣΟ η Q δεν είναι άδεια.εξαγωγή του ου pixel από την Q και ανάθεση των συντεταγµένων του στο τρέχον pixel (x0,y0) 2.Ενηµέρωση της µεταβλητής µέση_τιµή_αντικειµένου 3.ΓΙΑ κάθε γειτονικό pixel p του (x0,y0) ΤΕΛΟΣ.ΑΝ p βρίσκεται εντός της I ΚΑΙ ΤΕΛΟΣ abs(ι(p)- µέση_τιµη_αντικειµένου)<=tolerance ΚΑΙ το BW(p)==0 ΤΟΤΕ Τοποθέτησε το p στην Q ΤΕΛΟΣ Χαρακτήρισε το p αντικείµενο: BW(p)=
Συνήθως το κριτήριο F(p) ορίζεται ως εξής: Το p δεν έχει ήδη επιλεγεί και δεν περιέχεται στην ουρά Η τιµή I(p) ικανοποιεί κάποια συνθήκη, όπως µία από τις ακόλουθες: abs(i(p)-i(p0))<t. Η απολύτη τιµή της διαφοράς του I(p) και της µέσης τιµής των pixel που περιέχονται στην ουρά Q είναι µικρότερη από ένα κατώφλι που είναι ανάλογο της τυπικής απόκλισης των τιµών της Q.
Q στήλη Q γραµµή Μέση τιµή pixel αντικειµένου 0 Πλήθος pixel αντικειµένου 0 2 3 4 5 6 7 8 0 0 0 0 0 0 0 0 2 0 2 4 3 2 0 2 0 3 0 0 8 0 0 0 3 0 4 0 0 9 9 9 0 0 5 0 0 0 0 8 0 2 0 6 0 0 0 0 0 7 0 0 2 0 2 0 0 8 0 0 0 0 0 67
Q στήλη 4 4 Q γραµµή Μέση τιµή pixel αντικειµένου 9 Πλήθος pixel αντικειµένου 2 3 4 5 6 7 8 0 0 0 0 0 0 0 0 2 0 2 4 3 2 0 2 0 3 0 0 8 0 0 0 3 0 4 0 0 9 9 9 0 0 5 0 0 0 0 8 0 2 0 6 0 0 0 0 0 7 0 0 2 0 2 0 0 8 0 0 0 0 0 68
Q στήλη Q γραµµή 4 4 3 4 4 5 Μέση τιµή pixel αντικειµένου 9 Πλήθος pixel αντικειµένου 4 3 5 4 2 3 4 5 6 7 8 0 0 0 0 0 0 0 0 2 0 2 4 3 2 0 2 0 3 0 0 8 0 0 0 3 0 4 0 0 9 9 9 0 0 5 0 0 0 0 8 0 2 0 6 0 0 0 0 0 7 0 0 2 0 2 0 0 8 0 0 0 0 0 69
Q στήλη Q γραµµή 3 4 4 5 4 3 Μέση τιµή pixel αντικειµένου 9,5 Πλήθος pixel αντικειµένου 2 5 4 3 3 3 5 2 3 4 5 6 7 8 0 0 0 0 0 0 0 0 2 0 2 4 3 2 0 2 0 3 0 0 8 0 0 0 3 0 4 0 0 9 9 9 0 0 5 0 0 0 0 8 0 2 0 6 0 0 0 0 0 7 0 0 2 0 2 0 0 8 0 0 0 0 0 70
Q στήλη Q γραµµή 3 4 4 5 4 3 Μέση τιµή pixel αντικειµένου 9,33 Πλήθος pixel αντικειµένου 3 5 4 3 3 3 5 5 5 2 3 4 5 6 7 8 0 0 0 0 0 0 0 0 2 0 2 4 3 2 0 2 0 3 0 0 8 0 0 0 3 0 4 0 0 9 9 9 0 0 5 0 0 0 0 8 0 2 0 6 0 0 0 0 0 7 0 0 2 0 2 0 0 8 0 0 0 0 0 7
Q στήλη Q γραµµή 3 4 4 5 4 3 Μέση τιµή pixel αντικειµένου 9,25 Πλήθος pixel αντικειµένου 4 5 4 3 3 3 5 5 5 5 3 4 2 2 3 4 5 6 7 8 0 0 0 0 0 0 0 0 2 0 2 4 3 2 0 2 0 3 0 0 8 0 0 0 3 0 4 0 0 9 9 9 0 0 5 0 0 0 0 8 0 2 0 6 0 0 0 0 0 7 0 0 2 0 2 0 0 8 0 0 0 0 0 72
Q στήλη Q γραµµή 3 4 4 5 4 3 Μέση τιµή pixel αντικειµένου 9,40 Πλήθος pixel αντικειµένου 5 5 4 3 3 3 5 5 5 5 3 4 2 2 3 4 5 6 7 8 0 0 0 0 0 0 0 0 2 0 2 4 3 2 0 2 0 3 0 0 8 0 0 0 3 0 4 0 0 9 9 9 0 0 5 0 0 0 0 8 0 2 0 6 0 0 0 0 0 7 0 0 2 0 2 0 0 8 0 0 0 0 0 73
Q στήλη Q γραµµή 3 4 4 5 4 3 Μέση τιµή pixel αντικειµένου 9,667 Πλήθος pixel αντικειµένου 6 5 4 3 3 3 5 5 5 5 3 4 2 2 3 4 5 6 7 8 0 0 0 0 0 0 0 0 2 0 2 4 3 2 0 2 0 3 0 0 8 0 0 0 3 0 4 0 0 9 9 9 0 0 5 0 0 0 0 8 0 2 0 6 0 0 0 0 0 7 0 0 2 0 2 0 0 8 0 0 0 0 0 74
Q στήλη Q γραµµή 3 4 4 5 4 3 Μέση τιµή pixel αντικειµένου 9,2857 Πλήθος pixel αντικειµένου 7 5 4 3 3 3 5 5 5 5 3 4 2 2 5 2 3 4 5 6 7 8 0 0 0 0 0 0 0 0 2 0 2 4 3 2 0 2 0 3 0 0 8 0 0 0 3 0 4 0 0 9 9 9 0 0 5 0 0 0 0 8 0 2 0 6 0 0 0 0 0 7 0 0 2 0 2 0 0 8 0 0 0 0 0 75
Q στήλη Q γραµµή 3 4 4 5 4 3 Μέση τιµή pixel αντικειµένου 9,25 Πλήθος pixel αντικειµένου 8 5 4 3 3 3 5 5 5 5 3 4 2 2 5 2 3 4 5 6 7 8 0 0 0 0 0 0 0 0 2 0 2 4 3 2 0 2 0 3 0 0 8 0 0 0 3 0 4 0 0 9 9 9 0 0 5 0 0 0 0 8 0 2 0 6 0 0 0 0 0 7 0 0 2 0 2 0 0 8 0 0 0 0 0 76
Q στήλη Q γραµµή 3 4 4 5 4 3 Μέση τιµή pixel αντικειµένου 9,66 Πλήθος pixel αντικειµένου 9 5 4 3 3 3 5 5 5 5 3 4 2 2 5 2 3 4 5 6 7 8 0 0 0 0 0 0 0 0 2 0 2 4 3 2 0 2 0 3 0 0 8 0 0 0 3 0 4 0 0 9 9 9 0 0 5 0 0 0 0 8 0 2 0 6 0 0 0 0 0 7 0 0 2 0 2 0 0 8 0 0 0 0 0 77
Q στήλη Q γραµµή 3 4 4 5 4 3 Μέση τιµή pixel αντικειµένου 9,66 Πλήθος pixel αντικειµένου 0 5 4 3 3 3 5 5 5 5 3 4 2 2 5 2 3 4 5 6 7 8 0 0 0 0 0 0 0 0 2 0 2 4 3 2 0 2 0 3 0 0 8 0 0 0 3 0 4 0 0 9 9 9 0 0 5 0 0 0 0 8 0 2 0 6 0 0 0 0 0 7 0 0 2 0 2 0 0 8 0 0 0 0 0 78
Q στήλη Q γραµµή 3 4 4 5 4 3 Μέση τιµή pixel αντικειµένου 9,66 Πλήθος pixel αντικειµένου 5 4 3 3 3 5 5 5 5 3 4 2 2 5 2 3 4 5 6 7 8 0 0 0 0 0 0 0 0 2 0 2 4 3 2 0 2 0 3 0 0 8 0 0 0 3 0 4 0 0 9 9 9 0 0 5 0 0 0 0 8 0 2 0 6 0 0 0 0 0 7 0 0 2 0 2 0 0 8 0 0 0 0 0 79
Το αποτέλεσµα της τµηµατοποίησης 2 3 4 5 6 7 8 0 0 0 0 0 0 0 0 2 0 0 0 0 0 0 0 3 0 0 0 0 0 4 0 0 0 0 5 0 0 0 0 0 6 0 0 0 0 0 0 0 0 7 0 0 0 0 0 0 0 0 8 0 0 0 0 0 0 0 0 80
Εφαρµογή του αλγόριθµού ανάπτυξης περιοχών σε συνθετική εικόνα 8
Εφαρµογή του αλγόριθµού ανάπτυξης περιοχών σε πραγµατική εικόνα Αρχική Εικόνα CT 82 Μέθοδος Ανάπτυξης Περιοχών Τµηµατοποίηση Ήπατος
Τµηµατοποίηση γνωστών γεωµετρικών σχηµάτων σε εικόνες: Μετασχηµατισµός Hough (HT) Εστω ότι αναζητούµε σχήµα µε γνωστή εξίσωση, πχ ευθεία µε εξίσωση: y= mx+ c Ο HT ανιχνεύει γραµµές µε τον ακόλουθο τρόπο: Κατασκευάζεται ένας πίνακας (Accumulator) µε διάσταση ίση µε τον αριθµό παραµέτρων της εξίσωσης του υπό αναζήτηση σχήµατος (πχ 2D πίνακας) Ανιχνεύονται τα pixel ακµών p της εικόνας για κάθε ένα από τα οποία: Κατασκευάζεται το αντίστοιχο σχήµα στον παραµετρικό χώρο (για ευθεία, κατασκευάζεται η ευθεία στον παραµετρικό χώρο m, c που ικανοποιεί τη σχέση της ευθείας) και κάθε pixel του Accumulator από όπου περνά η ευθεία αυξάνει την τιµή του κατά Η θέση του pixel µε τη µέγιστη τιµή καθορίζει τις παραµέτρους της εξίσωσης του σχήµατος που αναζητείται /04
Μετασχηµατισµός Hough (HT): η περίπτωση της ευθείας Εστω εινόνα Ι ΝxM στην οποία αναζητάµε ευθείες µε εξίσωση y= mx+ c Επειδή ο Accumulator αποτελεί πίνακα µε όλες τις δυνατές τιµές των παραµέτρων της ευθείας m, c, καθίσταται απαραίτητη µία αναπαράσταση της ευθείας µε παραµέτρους που έχουν φραγµένες τιµές (πχ η παράµετρος m δεν είναι φραµένη, γιατί αν η κλίση της ευθείας π/2, τότε η m απειρίζεται. Εναλλακτική αναπαράσταση ευθείας σε πολικές συντεταγµένες: ρ = xcosθ + ysinθ Ορίζουµε τον αριθµό των τιµών της γωνίας θ από π ως π. Αυτός αποτελεί τις στήλες του Accumulator. Οι γραµµές του πίνακα Accumulator ορίζονται από δ ως δ, όπου δ η µέγιστη δυνατή τιµή της 2 2 παραµέτρου ρ: δ = ceil N + M ( )
για κάθε pixel (x,y) της Ι: I(x,y)>0 end για κάθε θ end Υπολόγισε το ρ(θ)=xcos(θ)+ysin(θ) A(ρ,θ)=A(ρ,θ)+ Κατά συνέπεια: ένα σηµείο ακµής στην Ι παράγει µία καµπύλη στον πίνακα Α. Αν υπάρχουν k συνευθειακά σηµεία, τότε παράγονται k καµπύλες οι οποίες τέµνονται σε ένα σηµείο του Α. Το σηµείο αυτό θα έχει τη µέγιστη τιµή από όλα τα pixel του Α και οι συντεταγµένες του καθορίζουν τις παραµέτρους της ευθείας που διέρχεται από τα σηµεία της Ι.
Input image x ρ Accumulator Αρχική εικόνα µε σηµείο >0 και η αναπαράσταση του στον Accumulator y Input image x ρ Accumulator θ Αρχική εικόνα µε 2 και 4 συνευθειακά σηµεία >0 και η αναπαράσταση τους στον Accumulator. Η τοµή των αντίστοιχων ηµιτονοειδών καµπύλων ορίζει το pixel µε y µέγιστη τιµή=2 και 4<αντίστοιχα. Οι συντεταγµένες του ορίζουν τις παραµέτρους της ευθείας που περνά από τα σηµεία. Input image x ρ Accumulator θ y θ
Input image x ρ Accumulator y θ
Μέθοδος ιαχωρισµού Συνένωσης Περιοχών ιαχωρισµός (split): (Split & Merge) Η εικόνα διαχωρίζετ αι σε µη επικαλυπτόµενες τετραγωνικές περιοχές συγκεκριµένου µεγέθους (π.χ. 64 64) Αν µια περιοχή δεν έχει οµοιογενή κατανοµή επιπέδων του γκρι, διαχωρίζεται σε 4 νέες τετραγωνικές περιοχές του µισού µεγέθους (32 32) Η διαδικασία συνεχίζεται µέχρι να δηµιουργηθούν είτε οµοιόµορφες περιοχές ή το µέγεθος των περιοχών να λάβει µια προκαθορισµένη ελάχιστη τιµή (π.χ. 4 4) 88
Μέθοδος ιαχωρισµού Συνένωσης Περιοχών (Split & Merge) Συνένωση (merge) Γειτονικές περιοχές µε παρόµοια επίπεδα του γκρι συνενώνονται για το σχηµατισµό µεγαλύτερων περιοχών Η διαδικασία σταµατάει αν δεν µπορούν να γίνουν άλλες συνενώσεις περιοχών 89
Μέθοδος ιαχωρισµού Συνένωσης Περιοχών (Spilt & Merge) 90
Παρεµβολή εικόνας Παρεµβολή ονοµάζεται η διαδικασία µεταβολής του αριθµού των γραµµών και στηλών της εικόνας µε ταυτόχρονη µεταβολή των τιµών τους. Εστω ότι δεδοµένης µίας εικόνας Ι NxM θέλουµε να δηµιουργήσουµε εικόνα Ι2 διαστάσεων 2Nx2M. Οι τιµές των νέων pixel της Ι2 υπολογίζονται βάσει των τιµών των pixel της Ι. ύο είναι οι απλούστεροι τρόποι υπολογισµού των τιµών pixel της Ι2: αναδιπλασιασµό (replication) τιµών (zero order hold κράτηση µηδενικής τάξης) γραµµική παρεµβολή linear interpolation- τιµών (first order hold κράτηση πρώτης τάξης)
Μεταβολή αριθµού pixel της εικόνας µε αντιγραφή (replication) των τιµών Έστω διπλασιασµός της διάστασης της εικόνας: Ι : MxN I 2 : 2Mx2N: ιπλασιάζουµε τις διαστάσεις της εικόνας συµπληρώνοντας τα νέα pixel µε µηδενικές τιµές, δηλ. θέτουµε: I 2 ( i j) i j I,, iκαι j : άρτια = 0 i ή j : περιττ ό, 2 2 Για κάθε ένα από τα 3 µηδενικά γειτονικά pixel του (i,j) µε i,j άρτια, θέτουµε τιµή ίση µε Ι (i,j), σύµφωνα µε τον παρακάτω ψευδοκώδικα: for i=0:m- for j=0:n- I2(2i,2j)=I(i,j) I2(2i+,2j)=I(i,j) I2(2i,2j+)=I(i,j) I2(2i+,2j+)=I(i,j) end end Ο συγκεκριµένος αλγόριθµος γενικεύεται για νέα διάσταση τυχαίο ακέραιο πολλαπλάσιο των ΜxΝ. 92
Ισοδύναµα, τα προηγούµενα βήµατα ισοδυναµούν µε συνέλιξη της I 2 µε την µάσκα H, όπου Παράδειγµα: 0 0 0 H= 0 0 4 H = 2 4 2 2 4 2 4 I 2 3 = 4 5 6 I 2 0 2 0 3 0 0 0 0 0 0 0 = 4 0 5 0 6 0 0 0 0 0 0 0 I 2 2 2 3 3 2 2 3 3 = 4 4 5 5 6 6 4 4 5 5 6 6 93
Η έννοια της γραµµικής παρεµβολής σε εικόνες Εστω ότι επιθυµούµε να υπολογίσουµε την τιµή µίας δεδοµένης εικόνας σε ένα σηµείο της µε µη ακέραιες συντεταγµένες (y,x)=([y]+α,[x]+β), όπου [x], [y] το ακέραιο µέρος των x,y και α, β το κλασµατικό τους µέρος. x= x + b [ ] [ ] [ ] [ ] y= y + a + x, y N, a, b,0 < a, b< Η τιµή της Ι στη θέση (y,x) είναι ο µέσος όρος των 4 γειτονικών pixel που το περικλείουν, σταθµισµένος µε τον αντίστροφο της απόστασης του (y,x) από τα κέντρα τους: ([ ] [ ] ) ( )( ) [ ] [ ] ( ) [ ] [ ] ( ) ( ) ([ ] [ ] ) ( ) ([ ] [ ] ) I y + a, x + b = a b I y, x + a b I y, x + + a bi y +, x + abi y +, x + ([y],[x]) ([y],[x]+) ([y]+,[x]) ([y]+,[x]+) 94
Μεταβολή αριθµού pixel της εικόνας µε γραµµική παρεµβολή linear interpolation- τιµών Βήµα : ηµιουργείται µία νέα εικόνα µε το ζητούµενο µέγεθος, σύµφωνα µε τα προηγούµενα. Τα επιπλέον pixel έχουν τιµή 0. I 2 ( i j) i j I,, iκαι j : άρτια = 0 i ή j : περιττ ό, 2 2 Βήµα 2: Γραµµική παρεµβολή κατά γραµµές: I2 i j I i j I i j 2 ( ) ( 2 +,2 ) = ( +, ) + (, ) Βήµα 3: Γραµµική παρεµβολή κατά στήλες: Προσοχή: η παρεµβολή κατά στήλες γίνεται και για τις νέες στήλες που δηµιουργήθηκαν από το βήµα. I2( 2 i,2 j+ ) = ( I( i, j+ ) + I( i, j) ) 2 Ισοδύναµα, τα βήµατα και 2 αντικαθίστανται από συνέλιξη της Ι µε µάσκα Η όπου: 4 H = 2 4 2 2 4 2 4 Ο συγκεκριµένος αλγόριθµος γενικεύεται για νέα διάσταση τυχαίο ακέραιο πολλαπλάσιο των ΜxΝ. 95
Η έννοια της γραµµικής παρεµβολής 0 0 2 0 0 2 Αρχική τιµή εικόνας Τιµή εικόνας από παρεµβολή /04
Παράδειγµα γραµµικής παρεµβολής I 2 3 = 4 5 6 Εισαγωγή κενών pixel I 2 0 2 0 3 0 0 0 0 0 0 0 = 4 0 5 0 6 0 0 0 0 0 0 0 Παρεµβολή κατά γραµµές I 2.5 2 2.5 3.5 0 0 0 0 0 0 = 4 4.5 5 5.5 6 3 0 0 0 0 0 0 Παρεµβολή κατά στήλες I 2.5 2 2.5 3.5 2.5 3 3.5 4 4.5 2.25 = 4 4.5 5 5.5 6 3 2 2.25 2.5 2.75 3.5 /04
Η χρήση ψευδοχρώµατος (false color) Το ψευδοχρώµα ορίζεται µε ένα µετασχηµατισµό Τ που αντιστοιχεί τιµές pixel µε τριάδες τιµών (Red, Green, Blue): Αν ως είσοδος δοθεί στο µετασχηµατισµό κάθε δυνατή τιµή ενός pixel µίας εικόνας, τότε η έξοδος του µετασχηµατισµού Τ καλείται ψευδοχρωµατική κλίµακα -colormap. Χρησιµότητα: αύξηση της αντίθεσης µεταξύ περιοχών Αλγόριθµος: ( x, y) = [ R( x, y), G( x, y), B( x, y) ] = T( I( x y) ) c, Για κάθε pixel (x,y) της εικόνας I Υπολογίζεται η τιµή της κόκκινης, πράσινης και µπλε συνιστώσας του χρώµατος: R(x,y)=T r (I(x,y)) G(x,y)=T g (I(x,y)) B(x,y)=T b (I(x,y)) Το αποτέλεσµα στέλνεται στο σύστηµα απεικόνισης
Απεικόνιση ψευδοχρώµατος θερµού σώµατος (α). (R,G,B) R G B (α) Τιµές pixel Γεωγραφική απεικόνιση ψευδοχρώµατος (β). (R,G,B) B G R, G R (β) Τιµές pixel /04
(α) (β) (γ) Απεικόνιση θυρεοειδούς µε αποχρώσεις του γκρι (α), απεικόνιση θερµού σώµατος (β) και γεωγραφική απεικόνιση (γ). /04
Μετασχηµατισµός Fourier (FT) σε δύο διαστάσεις (2D) Κάθε γραµµικός µετασχηµατισµός χρησιµοποιεί µία βάση συναρτήσεων για να υπολογίσει την προβολή της µετασχηµατισµένης συνάρτησης σε κάθε µία από τις συναρτήσεις της Βάσης. Η Βάση συναρτήσεων που χρησιµοποιεί ο DFT 2D είναι τριγωνοµετρικές συναρτήσεις, επέκταση αυτών σε D. Αν η συνάρτηση (εικόνα) που θα µετασχηµατιστεί έχει διαστάσεις ΝxM, τότε το πλήθος των συναρτήσεων της βάσης είναι ΝxM. Οι συναρτήσεις της βάσης είναι ορθογώνιες Κάθε εικόνα ΝxM µπορεί να παρασταθεί σαν γραµµικός συνδυασµός των συναρτήσεων της βάσης. Οι συντελεστές του γραµµικού συνδυασµού αποτελούν το φάσµα της εικόνας. Οι τριγωνοµετρικές συµαρτήσεις βάσης του DFT για εικόνα ΝxM είναι: c s ( x y) uv ux vy M N j2π + M N, Buv( x, y) = cuv( x, y) + jsuv( x, y) = e uv ux vy, = cos 2π + ux vy, = sin 2π + M N ( x y)
Παραδείγµατα συναρτήσεων Τριγωνοµετρικής Βάσης σε 2 διαστάσεις για ΝxM=64x64 c uv ux vy, = cos 2 π +, M N ( x y) u v = = s uv ux vy, = sin 2 π +, M N ( x y) u= v= 0 /04
c uv ux vy u= 0, = cos 2 π +, M N v= 2 ( x y) 203
Η έννοια της χωρικής συχνότητας Η χωρική συχνότητα αποτελεί µέτρο του πόσο γρήγορα µεταβάλλονται οι τιµές µίας εικόνας. Παρατηρείστε ότι για η τριγωνοµετρική συνάρτηση βάσης c 0,2 (x,y) παρουσιάζει γρήγορη µεταβολή κατά τον άξονα Χ (0 πλήρεις περιόδους) και αργή µεταβολή κατά τον άξονα Υ (2 περιόδους). Οι ακµές µίας εικόνας αποτελούν γρήγορες µεταβολές της τιµής της και αντιστοιχούν σε υψηλές χωρικές συχνότητες του φάσµατος της. Μία εικόνα µε ισχυρές ακµές παράλληλες µε τον Χ άξονα θα εµφανίζει υψηλές τιµές στο φάσµα στις υψηλές χωρικές συχνότητες u. 204
ιακριτός Μετασχηµατισµός Fourier (DFT) σε 2 διαστάσεις (2D) Ο διακριτός µετασχηµατισµός µίας δισδιάστασης συνάρτησης f(x, y), για x = 0,, 2 M- και y = 0,,2 N-, F(u, v), ορίζεται ως εξής: M N = F( u, v) f ( x, y) e x= 0 y= 0 j2 π ( ux/ M+ vy/ N ) όπου u = 0,, 2 M- and v = 0,, 2 N-. Χρησιµοποιώντας την σχέση του Euler exp(jθ)=cosθ+jsinθ M N ux vy ux vy F( u, v) = f ( x, y) cos 2π + sin 2π + x= 0 y= 0 M N M N 205
Το φάσµα F(u,v) µίας πραγµατικής συνάρτησης είναι µιγαδικό και αποτελείται από συντελεστές συνηµιτόνων (πραγµατικό µέρος - REAL) και ηµιτόνων (µιγαδικό -IMAGINARY): α uv =REAL(F(u,v)) β uv =IMAGINARY(F(u,v)) Οι συντελεστές του φάσµατος αποτελούν την προβολή (ή ισοδύναµα εσωτερικό γινόµενο) της εικόνας στις τριγωνοµετρικές συναρτήσεις της βάσης Β uv (x,y). 206
Το φάσµα F(u,v) παρουσιάζει µιγαδική συµµετρία, δηλ.: REAL(F(u,v))=REAL(M-u,N-v) IMAGINARY(F(u,v))= - IMAGINARY(M-u,N-v). Αν θεωρήσουµε την µηδενική συχνότητα (0,0) πάνω αριστερά στο φάσµα, η συνήθης συµµετρία που παρουσιάζεται για άρτιο αριθµό στηλών και γραµµών είναι όπως στο σχήµα 0 v Τα ζεύγη πράσινων και µπλε pixel µε τους ίδιους αριθµούς αποτελούν συζηγή ζεύγη. Τα κίτρινα pixel είναι πραγµατικοί αριθµοί. Το DC σηµείο (µηδενικής συχνότητας) είναι η πάνω αριστερή γωνία (µε αριθµό 0). u 207
Αντίστροφος διακριτός µετασχηµατισµός Fourier Inverse DFT- IDFT O IFT ανακατασκευάζει την εικόνα f(x,y) από το φάσµα της F(u,v). M N ux vy j 2π + M N f ( x, y) = F( u, v) e = NM u= 0 v= 0 M N ux vy ux vy real( F( u, v) ) cos 2 π + + imaginary( F( u, v) ) sin 2π + NM u= 0 v= 0 M N M N ηλ/ παρατηρούµε ότι κάθε εικόνα µπορεί να γραφτεί ως άθροισµα των συναρτήσεων της Βάσης, πολλαπλασιασµένων µε το πραγµατικό µέρος (συνηµιτονικές βάσεις) και το φανταστικό µέρος του φάσµατος (ηµιτονικές βάσεις). Η ανακατασκευή βασίζεται στο γεγονός ότι η f(x,y) µπορεί να εκφραστεί σαν γραµµικός συνδυασµός των συναρτήσεων της βάσης, οι συντελεστές του οποίου έχουν υπολογιστεί κατά τον ευθύ DFT. 208
Αριθµητικό παράδειγµα FT σε 2D Εστω εικόνα f(x,y) διαστάσεων 2x2 f ( x, y) Το σύνολο των συναρτήσεων βάσης είναι { Buv( x, y) } B00( x, y), B0( x, y), B0 ( x, y), B( x, y) B= = 2 = 3 4 { } ux vy 0x 0 y j2π 2 * + j π + 2 2 2 2 u= 0, v= 0 B00( x, y) = e = e = ux vy 0x y j2π j2 * + π + 2 2 2 2 u= 0, v= B0( x, y) = e = e = ux vy x 0 y j2π + j2π + * 2 2 2 2 u=, v= 0 B0 ( x, y) = e = e = ux vy x y j2π 2 * + j π + 2 2 2 2 u=, v= B( x, y) = e = e = Παρατηρείστε ότι οι συναρτήσεις της βάσης είναι ορθοκανονικές 209
Το φάσµα της f(x,y), F(u,v), υπολογίζεται ως εξής: M N ux vy ux vy F( u, v) = f ( x, y) cos 2π + j sin 2π + = x= 0 y= 0 M N M N M N ux vy j2π + M N M N * f ( x, y) e = f ( x, y) Buv NM x= 0 y= 0 x= 0 y= 0 2 5 F( 0,0) = SUM( fb00) = SUM = 3 4 2 ( 0,) = ( ) F SUM fb 0 2 = SUM = 3 4 2 F(,0) = SUM( fb0) = SUM = 3 4 2 2 F(,) = SUM( fb) = SUM = 0 3 4 Παρατηρήσεις: Ο συντελεστής της συχνότητας (0,0) είναι ίσος µε την µέση τιµή της f. Ολες οι τιµές του φάσµατος της f είναι πραγµατικοί αριθµοί, διότι Ν=Μ=2 (βλ. επεξήγηση για συζυγή συµµετρία). 20
Η ανακατασκευή της εικόνας γίνεται µε χρήση του αντίστροφου FT: M N ux vy 2π + M N M N f ( x, y) = F( u, v) e = F( u, v) Buv NM u= 0 v= 0 u= 0 v= 0 ( 0, 0) (, 0) ( 0,) (,) f = F B + F B + F B + F B = 00 0 0 5 + 0 = 2 2 2 3 4 2
Αρχή της επεξεργασίας εικόνας στο χώρο της συχνότητας Η επεξεργασία εικόνας στο χώρο της συχνότητας βασίζεται στο θεώρηµα υλοποίησης της συνέλιξης FFT F(u,v) Φάσµα εικόνας H(u,v).F(u,v) Φάσµα Φιλτραρισµένης εικόνας IFFT Αρχική εικόνα Ι(i,j) g(i,j) επεξεργασµένη εικόνα 22
Υπολογισµός απόκρισης συχνότητας του φίλτρου τρέχουσας µέσης τιµής σε D Η µάσκα τρέχοντος µέσου όρου συµπεριφέρεται σαν χαµηλοπερατό µε µειούµενους λοβούς στις υψηλές συχνότητες. Για διευκόλυνση των υπολογισµών, θεωρούµε αρχικά την µονοδιάστατη περίπτωση. M M y( n) = x( n k) h( n) = δ( n k) M + M + k= 0 k= 0 k= 0 n= k= 0 ( M+ ) ( M+ ) ( M+ ) ( M + ) ( ) M M j M+ ω jω jnω jkω e H( e ) = δ( n k) e = e = = jω M + M + M + e j ω + j ω j ω 2 2 2 e e e sin M ω j ω 2 2 = e M + jω + jω jω M + ω 2 2 2 e e e sin 2 23
( M ) ( M ) + + sin sin M ω ω 2 2 j 2 ( ) j ω ω jω H e = e H( e ) = M + ω M + ω sin sin 2 2 0.8 0.8 0.6 0.6 Frequency Response 0.4 0.2 0 Frequency response 0.4 0.2 0-0.2-0.2-0.4-4 -3-2 - 0 2 3 4 Frequency, M=3 απόκρισης συχνότητας του φίλτρου τρέχουσας µέσης τιµής 3 σηµείων -0.4-4 -3-2 - 0 2 3 4 Frequency, M=9 απόκρισης συχνότητας του φίλτρου τρέχουσας µέσης τιµής 5 σηµείων 24
jkjd Η απόκριση συχνότητας για το τετραγωνικό παράθυρο τρέχουσας µέσης τιµής 5 4.5 4 3.5 Frequency response 3 2.5 2.5 Square pulse 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0. 0 0 0 20 30 40 50 60 70 Sample Μάσκα x5, µε zero padding έως 64 σηµεία FFT Frequency response 0.5 0 0 0 20 30 40 50 60 70 Frequency Απόκριση συχνότητας µε τη µηδενική συχνότητα στα άκρα (πάνω σχήµα) και στο κέντρο (κάτω σχήµα) 5 4.5 4 3.5 3 2.5 2.5 0.5 25 0 0 0 20 30 40 50 60 70 Frequency (0 frequency at the centre)
0.9 0.8 mask = 25 V frequency 0.7 0.6 0.5 0.4 0.3 0.2 0. U frequency Το φάσµα της µάσκας µε zero-padding σε διάσταση 256x256. Η µηδενική συχνότητα (DC) βρίσκεται στο κέντρο. Παρατηρούµε ότι πρόκειται για ένα βαθυπερατό φίλτρο µε λοβούς µειούνενου ύψους στις υψηλές συχνότητες. 26
Laplacian = 8 v frequency SobelX 2 = 0 0 0 2 u frequency Απόκριση συχνότηατς της Λαπλασιανής µάσκας και της Sobel X µε zero- u frequency padding σε διάσταση 256x256. Η DC συχνότητα στο κέντρο βρίσκεται στο κέντρο. Παρατηρούµε ότι πρόκειται για υψιπερατά φίλτρα. 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0. 27
O FT της γκαουσιανής µάσκας Ας θεωρήσουµε τον D συνεχή FT και ας τον εφαρµόσουµε σε µία D gaussian. + + + 2 2 2 2 ω g( x) = e G( ω) = e e dx= e cos( ωx) dx j e sin( ωx) dx= e x ax ax j x ax ax a Παρατηρούµε ότι ο FT µίας γκαουσιανής είναι µία νέα γκαουσιανή µε αντίστροφη διασπορά σ. Παρακάτω δίνεται το µέτρο του φάσµατος γκαουσιανών µε σ=, 2 και 4, αρχικού µεγέθους µάσκας 7x7, 3x3 και 25x25 µε zero padding σε 256x256. Frequency Response, sigma= Gaussian Frquency Response, sigma=2 Frequency Response Gaussian, sigma=4 a 2 u frequency 28
Το φίλτρο Butterworth Το φίλτρο Butterworth µπορεί να υλοποιηθεί ως χαµηλοπερατό και υψιπερατό. Η τιµή της συχνότητας αποκοπής C εµφανίζει απόκριση συχνότητας ίση µε 0,5. Ο εκθέτης n ονοµάζεται τάξη του φίλτρου και καθορίζει το εύρος της ζώνης διάβασης B( u, v) = : Χαµηλοπερατ ό 2n 2 2 ( ) 2 u + v + C B( u, v) = : Υψιπερατ ό 2n C + 2 2 ( u + v ) 2 Frequency response 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0. Butterworth filter n= n=2 0 0 50 00 50 200 250 300 frequency 29
300 250 0.9 0.8 0.7 200 50 0.6 0.5 0.4 00 0.3 0.2 50 0. 0.5 0 0 0 50 00 50 200 250 300 Βαθυπερατό Butterworth Τάξη=, DC στο κέντρο, αποκοπή=32 220
Το ιδανικό χαµηλοπερατό φίλτρο συχνοτήτων Το ιδανικό χαµηλοπερατό φίλτρο µε συχνότητα αποκοπής ω c έχει απόκριση συχνότητας H(e jω ) H(e jω ) 0.25 j H( e ω ) -ω c ω ω c ω < ωc = 0 ω ωc h(n) 0.2 0.5 0. 0.05 0-0.05-0. -0.5-0.2-50 -40-30 -20-0 0 0 20 30 40 50 samples Η κρουστική απόκριση h(n) για ω c =π/4 jω jnω h( n) = X( e ) e dω= 2π ω c jnω jnω ωc e dω e 2π = = 2π nj ωc ω c π π jnω sin c jnωc ( e e ) = π n 2 j nπ ( nω ) c 22
Μηδενισµός χαµηλών συχνοτήτων Ιδανικό highpass φίλτρο σε 2D Ορισµός ζώνης χαµηλών (low frequency) και υψηλών συχνοτητων (high frequency) στο φάσµα της εικόνας MxN. Μηδενική συχνότητα στην πάνω αριστερή γωνία του φάσµατος. (0,0) (0,Ν/2) (0,Ν-) Low Low (Μ/2,0) Low Low (Μ-,0)
2ος εναλλακτικός ορισµός Μηδενική συχνότητα στο κέντρο του φάσµατος -Μ/2,-Ν/2 0 -Μ/2, Ν/2 0 Low Μ/2, -Ν/2 Μ/2, Ν/2 /04
Ιδανικό υψηπερατό φίλτρο σε 2 διαστάσεις (0,0) (0,Ν/2) (0,Ν-) 0 0 (Μ/2,0) 0 0 (Μ-,0) Μηδενική συχνότητα στην πάνω αριστερή γωνία του φάσµατος.
Παράδειγµα Bandstop φίλτρου για συµπίεση περιοδικού θορύβου Ο περιοδικός θόρυβος εµφανίζεται συχνά σαν περιοδική µεταβολή της τιµής των pixel. Στο φάσµα της εικόνας θα εµφανίζεται σαν κορυφές σε υψηλές συχνότητες. FFT Φάσµα (λογάριθµος µέτρου) IFFT Αρχική εικόνα µε περιοδικό θόρυβο Επεξεργασµένη εικόνα Bandstop φίλτρο
Λεπτοµέρειες υλοποίησης Συνέλιξης στο πεδίο των συχνοτήτων y = x* h Y = X H Αν x: NxΝ, h: MxΜ τότε x*h: (Ν+Μ-)x(Ν+Μ-) Συνήθως: Ν>Μ Για να υπάρξει χώρος για την επιπλέον πληροφορία στο φάσµα Fourier, οι εικόνες συµπληρώνονται µε «0» (zero padding), ως εξής: x: NxΝ σε (Ν+Μ-)x(Ν+Μ-) (*) h: MxΜ σε (Ν+Μ-)x(Ν+Μ-) (*) (*) Σε περίπτωση που εφαρµόζεται FFT το (Ν+Μ-) αντικαθίσταται από τον πρώτο ακέραιο, δύναµη του 2, µεγαλύτερο του (Ν+Μ-) 226
Παράδειγµα Συνέλιξης (µία διάσταση D) στο πεδίο του χρόνου και των συχνοτήτων 0.4 0.2 signal gaussian mask 0.08 0.06 0.04 0.02 0-0 -8-6 -4-2 0 2 4 6 8 0 samples 0.8 0.6 0.4 0.2 0-0.2-0.4-0.6-0.8 0. Μάσκα x9 0.8 0.6 0.4 0.2 0-0.2-0.4-0.6-0.8-0 50 00 50 Αποτέλεσµα Συνέλιξης (Σήµα * Μάσκα) - 0 0. 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 samples Σήµα x28
signal 0.8 0.6 0.4 0.2 0-0.2-0.4-0.6-0.8-0 0. 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 samples Σήµα x28 signal padded 0.8 0.6 0.4 0.2 0-0.2-0.4-0.6-0.8-0 50 00 50 200 250 300 samples Σήµα x256 zero padding 800 Padded signal frequency response 30 25 20 5 0 5 0 0 50 00 50 200 250 300 Samples Φάσµα σήµατος x256 0.8 0.6 0.4 0.2 0-0.2-0.4-0.6-0.8 IFFT Product of spectrum of padded signal and mask 700 600 500 400 300 200 00 gaussian mask 0.4 0.2 0. 0.08 0.06 0.04 0.02-0 50 00 50 200 250 300 Αποτέλεσµα Συνέλιξης (Σήµα * Μάσκα) 0-0 -8-6 -4-2 0 2 4 6 8 0 samples Μάσκα x9 mask padded 0.4 0.2 0. 0.08 0.06 0.04 0.02 0 0 50 00 50 200 250 300 samples Μάσκα x256 zero padding 0 0 50 00 50 200 250 300 Samples Φάσµα σήµατος x Φάσµα µάσκας x256 Padded mask frwquenct response 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0. 0 0 50 00 50 200 250 300 Frequency Φάσµα µάσκας x256
Log µετασχηµατισµός Log µετασχηµατισµός µε το DC στο κέντρο Συχνά ο συντελεστής της µηδενικής συχνότητας (DC) είναι πολύ µεγαλύτερος από τις άλλες συχνότητες του φάσµατος. Για το λόγο αυτό εφαρµόζουµε το λογαριθµικό µετασχηµατισµό, µόνο για εποπτικούς λόγους: ( u, v) = log( + mag( u v) ) mag,
Παράδειγµα FT σε εικόνα MRI DC u FFT Αρχική εικόνα v Μέτρο Φάσµατος
FFT IFFT Βαθυπερατό φίλτρο 8x8 συχνότητες από 52x52 FFT IFFT Υψιπερατό φίλτρο /04
FFT IFFT Βαθυπερατό φίλτρο 6x6 συχνότητες από 52x52 FFT IFFT Υψιπερατό φίλτρο /04
FFT IFFT Βαθυπερατό φίλτρο 32x32 συχνότητες από 52x52 FFT IFFT Υψιπερατό φίλτρο /04
FFT IFFT Βαθυπερατό φίλτρο 64x64 συχνότητες από 52x52 FFT IFFT Υψιπερατό φίλτρο /04
FFT IFFT Βαθυπερατό φίλτρο 28x28 συχνότητες από 52x52 FFT IFFT Υψιπερατό φίλτρο /04