Ψηφιακή Επεξεργασία Εικόνας ΚΕΦ4 -1- ΑNIΧΝΕΥΣΗ ΑΚΜΩΝ (EDGE DETECTION)

Σχετικά έγγραφα
Νοέμβριος 2005 Σ. Φωτόπουλος ΨΕΕ κεφ.4 ΑΝΙΧΝΕΥΣΗ ΑΚΜΩΝ ΔΠΜΣ ΗΕΠ 1/53

Νοέμβριος 2013 Σ. Φωτόπουλος ΨΕΕ κεφ.4 ΑΝΙΧΝΕΥΣΗ ΑΚΜΩΝ ΔΠΜΣ ΗΕΠ 1/57

Μεταπτυχιακό Πρόγραμμα «Γεωχωρικές Τεχνολογίες» Ψηφιακή Επεξεργασία Εικόνας. Εισηγητής Αναστάσιος Κεσίδης

6-Aνίχνευση. Ακμών - Περιγράμματος

ΕΠΕΞΕΡΓΑΣΙΑ ΕΙΚΟΝΑΣ ΜΕ ΙΣΤΟΓΡΑΜΜΑ

ΙΑΤΡΙΚΗ ΑΠΕΙΚΟΝΙΣΗ & ΨΗΦΙΑΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΙΑΤΡΙΚΗΣ ΕΙΚΟΝΑΣ

Κατάτµηση Εικόνων: Ανίχνευση Ακµών και Κατάτµηση µε Κατωφλίωση

Μάθημα 8 ο. Ανίχνευση Ακμών ΤΜΗΥΠ / ΕΕΣΤ 1

Μάθημα 8 ο. Ανίχνευση Ακμών ΤΜΗΥΠ / ΕΕΣΤ 1

Ενότητα 3: Μετασχηµατισµοί Έντασης & Χωρικό Φιλτράρισµα

Ειδικά Θέµατα Υπολογιστικής Όρασης & Γραφικής. Εµµανουήλ Ζ. Ψαράκης & Αθανάσιος Τσακαλίδης Πολυτεχνική Σχολή Τµήµα Μηχανικών Η/Υ & Πληροφορικής

ΚΕΣ 03: Αναγνώριση Προτύπων και Ανάλυση Εικόνας. KEΣ 03 Αναγνώριση Προτύπων και Ανάλυση Εικόνας. Κατάτµηση Εικόνων:

Α.Τ.Ε.Ι. Κ ΑΒΑΛΑΣ ΤΜΗΜΑ ΒΙΟΜ ΗΧΑΝΙΚΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ "ΑΝΙΧΝΕΥΤΕΣ ΑΚ Μ Ω Ν ΤΑΣΟΣ ΕΥΑΓΓΕΛΟΣ ΕΠΙΒΛΕΠΩΝ ΚΑΘΗΓΗΤΗΣ ΚΡΙΝΙΔΗΣ ΣΤΕΛΛΙΟΣ

Ψηφιακή Επεξεργασία Εικόνας. Σ. Φωτόπουλος ΨΕΕ

ΒΕΛΤΙΩΣΗ ΕΙΚΟΝΑΣ (ΦΙΛΤΡΑΡΙΣΜΑ)

7.5 Ενδιάμεσο επίπεδο επεξεργασίας εικόνας

Digital Image Processing

Μεταπτυχιακό Πρόγραμμα «Γεωχωρικές Τεχνολογίες» Ψηφιακή Επεξεργασία Εικόνας. Εισηγητής Αναστάσιος Κεσίδης

Ειδικά Θέµατα Υπολογιστικής Όρασης & Γραφικής. Εµµανουήλ Ζ. Ψαράκης & Αθανάσιος Τσακαλίδης Πολυτεχνική Σχολή Τµήµα Μηχανικών Η/Υ & Πληροφορικής

Μάθημα: Μηχανική Όραση

11 Το ολοκλήρωµα Riemann

Μετάδοση Πολυμεσικών Υπηρεσιών Ψηφιακή Τηλεόραση

1.i) 1.ii) v 2. v 1 = (2) (1) + ( 2) ( 1) + (-2) (2) + (0) (-4) v 3. Βρίσκουµε πρώτα µία ορθογώνια βάση: u 1. . u 1 u. u 2

ΣΥΝΤΕΤΑΓΜΕΝΕΣ ΙΑΝΥΣΜΑΤΟΣ

ΚΕΦΑΛΑΙΟ 4 ΑΡΙΘΜΗΤΙΚΕΣ ΜΕΘΟ ΟΙ ΕΥΡΕΣΗΣ ΠΡΑΓΜΑΤΙΚΩΝ Ι ΙΟΤΙΜΩΝ. 4.1 Γραµµικοί µετασχηµατισµοί-ιδιοτιµές-ιδιοδιανύσµατα

οµή δικτύου ΣΧΗΜΑ 8.1

Όρια συναρτήσεων. ε > υπάρχει ( ) { } = ± ορίζονται αναλόγως. Η διατύπωση αυτών των ορισµών αφήνεται ως άσκηση. x y = +. = και για κάθε (, ) ( 0,0)

Μέθοδοι Τμηματοποίησης Ψηφιακής Εικόνας με Εφαρμογή στην Ανάλυση Βιοϊατρικών Εικόνων

x 2 = x x 2 2. x 2 = u 2 + x 2 3 Χρησιµοποιώντας το συµβολισµό του ανάστροφου, αυτό γράφεται x 2 = x T x. = x T x.

Διδάσκων: Καθηγητής Νικόλαος Μαρμαρίδης, Καθηγητής Ιωάννης Μπεληγιάννης

Κεφάλαιο M4. Κίνηση σε δύο διαστάσεις

α) Κύκλος από δύο δοσµένα σηµεία Α, Β. Το ένα από τα δύο σηµεία ορίζεται ως κέντρο αν το επιλέξουµε πρώτο. β) Κύκλος από δοσµένο σηµείο και δοσµένο ευ

Διανύσµατα στο επίπεδο

ΓΡΑΜΜΙΚΗ ΑΛΓΕΒΡΑ ΙΙ (ΠΕΡΙΤΤΟΙ) Ασκησεις - Φυλλαδιο 5

4. ΚΕΦΑΛΑΙΟ ΕΦΑΡΜΟΓΕΣ ΤΟΥ ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΥ FOURIER

ΚΕΦΑΛΑΙΟ 6 ΕΛΑΧΙΣΤΑ ΤΕΤΡΑΓΩΝΑ

Όρια συναρτήσεων. ε > υπάρχει ( ) { } = ± ορίζονται αναλόγως. Η διατύπωση αυτών των ορισµών αφήνεται ως άσκηση. x y = +. = και για κάθε (, ) ( 0,0)

Παρουσίαση 1 ΙΑΝΥΣΜΑΤΑ

Βελτίωση Ποιότητας Εικόνας: Επεξεργασία στο πεδίο της Συχνότητας

ΚΕΦΑΛΑΙΟ 3 ΑΡΙΘΜΗΤΙΚΗ ΕΠΙΛΥΣΗ ΓΡΑΜΜΙΚΩΝ ΣΥΣΤΗΜΑΤΩΝ. nn n n

Συνεχείς συναρτήσεις πολλών µεταβλητών. ε > υπάρχει ( ) ( )

ΕΡΓΑΣΤΗΡΙΟ ΦΥΣΙΚΗΣ ΟΠΤΙΚΗΣ - ΟΠΤΟΗΛΕΚΤΡΟΝΙΚΗΣ & LASER ΤΜΗΜΑ ΦΥΣΙΚΗΣ ΧΗΜΕΙΑΣ & Τ/Υ ΑΣΚΗΣΗ ΝΟ7 ΟΠΤΙΚΗ FOURIER. Γ. Μήτσου

ΜΕΛΕΤΗ ΣΥΝΑΡΤΗΣΗΣ. Άρτια και περιττή συνάρτηση. Παράδειγµα: Η f ( x) Παράδειγµα: Η. x R και. Αλγεβρα Β Λυκείου Πετσιάς Φ.- Κάτσιος.

Συστήµατα τα οποία χαρακτηρίζονται από γραµµικές εξισώσεις διαφορών µε σταθερούς συντελεστές

Κλασικη ιαφορικη Γεωµετρια

11. Η έννοια του διανύσµατος 22. Πρόσθεση & αφαίρεση διανυσµάτων 33. Βαθµωτός πολλαπλασιασµός 44. Συντεταγµένες 55. Εσωτερικό γινόµενο

ΓΡΑΜΜΙΚΗ ΑΛΓΕΒΡΑ ΙΙ (ΑΡΤΙΟΙ) Ασκησεις - Φυλλαδιο 4

Συστήµατα τα οποία χαρακτηρίζονται από γραµµικές εξισώσεις διαφορών µε σταθερούς συντελεστές

1.1.1 Εσωτερικό και Εξωτερικό Γινόμενο Διανυσμάτων

Αριθµητική Ανάλυση 1 εκεµβρίου / 43

Συστήµατα τα οποία χαρακτηρίζονται από γραµµικές εξισώσεις διαφορών µε σταθερούς συντελεστές

Τι είναι βαθμωτό μέγεθος? Ένα μέγεθος που περιγράφεται μόνο με έναν αριθμό (π.χ. πίεση)

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ

ΕΝΝΟΙΑ ΤΟΥ ΙΑΝΥΣΜΑΤΟΣ

ΓΡΑΜΜΙΚΗ ΑΛΓΕΒΡΑ ΙΙ (ΑΡΤΙΟΙ) Προτεινοµενες Ασκησεις - Φυλλαδιο 6

ΓΡΑΜΜΙΚΗ ΑΛΓΕΒΡΑ ΙΙ (ΠΕΡΙΤΤΟΙ) Προτεινοµενες Ασκησεις - Φυλλαδιο 6

ΦΙΛΤΡΟ KALMAN ΔΙΑΚΡΙΤΟΥ ΧΡΟΝΟΥ

II.6 ΙΣΟΣΤΑΘΜΙΚΕΣ. 1. Γραφήματα-Επιφάνειες: z= 2. Γραμμική προσέγγιση-εφαπτόμενο επίπεδο. 3. Ισοσταθμικές: f(x, y) = c

ΙΑΝΥΣΜΑΤΑ ΘΕΩΡΙΑ ΘΕΜΑΤΑ ΘΕΩΡΙΑΣ. Τι ονοµάζουµε διάνυσµα; αλφάβητου επιγραµµισµένα µε βέλος. για παράδειγµα, Τι ονοµάζουµε µέτρο διανύσµατος;

Μεταπτυχιακό Πρόγραμμα «Γεωχωρικές Τεχνολογίες» Ψηφιακή Επεξεργασία Εικόνας. Εισηγητής Αναστάσιος Κεσίδης

Ψηφιακή Επεξεργασία Εικόνας

Ψηφιακή Επεξεργασία Εικόνας

13 ΙΑΝΥΣΜΑΤΙΚΗ ΑΝΑΛΥΣΗ

Στροφορµή. υο παρατηρήσεις: 1) Η στροφορµή ενός υλικού σηµείου, που υπολογίζουµε µε βάση τα προηγούµενα, αναφέρεται. σε µια ορισµένη χρονική στιγµή.

Ακαδηµαϊκό Έτος , Χειµερινό Εξάµηνο ιδάσκων Καθ.: Νίκος Τσαπατσούλης

1.4 Λύσεις αντιστρόφων προβλημάτων.

Διδάσκων: Καθηγητής Νικόλαος Μαρμαρίδης, Καθηγητής Ιωάννης Μπεληγιάννης

4. Ο αισθητήρας (perceptron)

Ακαδημαϊκό Έτος , Χειμερινό Εξάμηνο Διδάσκων Καθ.: Νίκος Τσαπατσούλης

A2. ΠΑΡΑΓΩΓΟΣ-ΚΛΙΣΗ-ΜΟΝΟΤΟΝΙΑ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ

Ενότητα 4: Φιλτράρισµα στο Πεδίο Συχνοτήτων (ΙΙ)

Γραµµική Αλγεβρα. Ενότητα 4 : Ορθογωνιότητα. Ευστράτιος Γαλλόπουλος Τµήµα Μηχανικών Η/Υ & Πληροφορικής

Μπερδέματα πάνω στην κεντρομόλο και επιτρόχια επιτάχυνση.

4 Συνέχεια συνάρτησης

ΠΡΟΓΡΑΜΜΑ ΣΠΟΥ ΩΝ ΣΤΗΝ ΠΛΗΡΟΦΟΡΙΚΗ ΜΑΘΗΜΑΤΙΚΑ Ι (ΘΕ ΠΛΗ 12) ΕΡΓΑΣΙΑ 1 η Ηµεροµηνία Αποστολής στον Φοιτητή: 12 Οκτωβρίου 2007

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥ ΩΝ ΣΤΗΝ ΠΛΗΡΟΦΟΡΙΚΗ ΜΑΘΗΜΑΤΙΚΑ Ι (ΘΕ ΠΛΗ 12)

1)Βρείτε την εξίσωση για το επίπεδο που περιέχει το σηµείο (1,-1,3) και είναι παράλληλο προς το επίπεδο 3x+y+z=a όπου a ένας αριθµός.

14 Εφαρµογές των ολοκληρωµάτων

ΙΕΡΕΥΝΗΣΗ ΚΑΙ ΑΝΑΛΥΤΙΚΗ ΠΑΡΟΥΣΙΑΣΗ ΥΠΟΛΟΓΙΣΜΩΝ ΚΛΩΘΟΕΙ ΟΥΣ, Ι ΙΑΙΤΕΡΑ ΣΕ ΜΗ ΤΥΠΙΚΕΣ ΕΦΑΡΜΟΓΕΣ.

Κεφάλαιο M3. Διανύσµατα

Παρουσίαση Νο. 6 Αποκατάσταση εικόνας

Κεφάλαιο 4. Ευθέα γινόµενα οµάδων. 4.1 Ευθύ εξωτερικό γινόµενο οµάδων. i 1 G 1 G 1 G 2, g 1 (g 1, e 2 ), (4.1.1)

Ενότητα 2: Οι Θεµελιώδεις Αρχές των Ψηφιακών Εικόνων

============================================================== Σχηµατίζουµε τον πίνακα µε στήλες τα διανύσµατα v1,v2,v3,u1,u2:

Παράρτηµα Β. Στοιχεία Θεωρίας Τελεστών και Συναρτησιακής Ανάλυσης [ ) ( )

Μετασχηµατισµοί 2 &3

Μηχανισµοί & Εισαγωγή στο Σχεδιασµό Μηχανών Ακαδηµαϊκό έτος: Ε.Μ.Π. Σχολή Μηχανολόγων Μηχανικών - Εργαστήριο υναµικής και Κατασκευών - 3.

Εργαστήριο ADICV2. Image filtering. Κώστας Μαριάς

ETY-202 ΤΑ ΜΑΘΗΜΑΤΙΚΑ ΕΡΓΑΛΕΙΑ ΤΗΣ ΚΒΑΝΤΟΜΗΧΑΝΙΚΗΣ ETY-202 ΎΛΗ & ΦΩΣ 02. ΜΑΘΗΜΑΤΙΚΑ ΕΡΓΑΛΕΙΑ. Στέλιος Τζωρτζάκης 1/11/2013

Ψηφιακή Επεξεργασία Εικόνας. Σ. Φωτόπουλος ΨΕΕ ΒΕΛΤΙΩΣΗ ΕΙΚΟΝΑΣ ΜΕ ΙΣΤΟΓΡΑΜΜΑ ΔΠΜΣ ΗΕΠ 1/46

ΥΟ ΒΑΣΙΚΟΙ ΝΟΜΟΙ ΑΠΟ ΤΗΝ ΤΡΙΓΩΝΟΜΕΤΡΙΑ

Κεφάλαιο 3 Κίνηση σε 2 και 3 διαστάσεις, Διανύσµατα. Copyright 2009 Pearson Education, Inc.

Οι πράξεις που χρειάζονται για την επίλυση αυτών των προβληµάτων (αφού είναι απλές) µπορούν να τεθούν σε µια σειρά και πάρουν µια αλγοριθµική µορφή.

Matlab command: corner

Ε.Α.Υ. Υπολογιστική Όραση. Κατάτμηση Εικόνας

Σ. Φωτόπουλος -1- ΨΕΣ- AΣΚΗΣΕΙΣ-ΛΥΣΕΙΣ- Κεφάλαιο 2 ο

4 Συνέχεια συνάρτησης

Μηχανική ΙI Ροή στο χώρο των φάσεων, θεώρηµα Liouville

Σύνολα. 1) Με αναγραφή των στοιχείων π.χ. 2) Με περιγραφή των στοιχείων π.χ.

Transcript:

-- ΑNIΧΝΕΥΣΗ ΑΚΜΩΝ (EDGE DETECTION) 4. Εισαγωγικά Ακµή ή περίγραµµα (edge) σε µια εικόνα Χ ij ορίζεται ως το σύνολο των σηµείων στη θέση i,j της εικόνας, όπου παρατηρείται µία σηµαντική αλλαγή της έντασης ή του χρώµατος της εικόνας. Το µέγεθος της µεταβολής αυτής αποτελεί το ύψος της ακµής. Ανιχνευτής ακµής (Edge detector) είναι ο αλγόριθµος που βρίσκει σε µία εικόνα το σύνολο των σηµείων Χ ij Το αποτέλεσµα της ανίχνευσης ακµών είναι η δηµιουργία ενός χάρτη (edge map) που συνήθως παρουσιάζεται σαν µια καινούργια εικόνα µε ένταση (συνήθως) ανάλογη του ύψους της ακµής. Στο χάρτη ακµών υπάρχουν πραγµατικές και λανθασµένες ακµές. Οι βασικές µέθοδοι ευρεσης των ακµών - περιγραµµάτων είναι οι εξής Με την πρώτη παράγωγο ( Βάθµωση - Gradient) Με την Laplacian Με την Laplacian of Gaussian - LoG Mε άλλες µεθόδους (Difference of Gaussian - DoG κλπ) Ιδανικές και πραγµατικές ακµές Στο επόµενο σχήµα 4. δεικνύεται το προφίλ τριών χαρακτηριστικών περιπτώσεων ιδανικών ακµών. Στην πραγµατικότητα οι ιδανικές ακµές έχουν πολύ περισσότερες µορφές µε βασικό χαρακτηριστικό την απότοµη µεταβολή της έντασης ή του χρώµατος. (α) (β) (γ) Σχήµα 4. (α) ιδανική βηµατική ακµή (step), (β) ράµπα (ramp), (γ) ακµή τύπου οροφής (roof)

-- Εάν όµως δούµε µία πραγµατική ακµή θα διαπιστώσουµε ότι δεν υφίστανται τόσο καλά οργανωµένες και µε τέτοια οξύτητα ακµές. Πραγµατικές ακµές δεικνύονται στο σχήµα 4.(β) και προέρχονται απο µία οριζόντια γραµµή της εικόνας του σχ. 4.(α) τιµή έντασης.5 3 4 5 απόσταση σε pixels Σχήµα 4. (α) Η εικόνα και η γραµµή της οποίας το προφίλ δεικνύεται στο (β) (α) (β) 4. Μια πρώτη προσέγγιση της διαδικασίας ανίχνευσης ακµών Η ανίχνευση ακµής βασίζεται στην εύρεση των σηµείων που η παράγωγος της έντασης ως προς την απόσταση είναι µέγιστη. Η διαδικασία αυτή γίνεται σε δύο στάδια: πρώτα υπολογίζεται η παράγωγος και στη συνέχεια ανιχνεύονται τα σηµεία µεγάλης τιµής µε ένα κατώφλιο. Σε µία δεύτερη προσέγγιση ανιχνεύονται ως ακµές τα σηµεία που η δεύτερη παράγωγος µεταβάλλεται από θετικές σε αρνητικές τιµές (ή αντίστροφα) και λαµβάνει µηδενική τιµή. f(x) x o f'(x) Κατώφλιο και παχος f''(x) Σχήµα 4. 3 Η συνάρτηση εντάσεως f(x) έχει πρώτη παράγωγο f'(x) και δεύτερη f''(x). Oλα τα σηµεία f'(x) πάνω απο το κατώφλιο θεωρούνται σηµεία ακµής. Αντίθετα ένα µόνο σηµείο υπάρχει όπου f''(x)

-3- Eνα τυπικό σύστηµα ανίχνευσης ακµής που υλοποιεί την διαδικασία ευρέσεως ακµής µε παράγωγο (Gradient) και κατώφλιο δεικνύεται στο επόµενο σχήµα 4.4 f(x) [.] [f(x)] >κατωφλιο Ναι Edge Χαρτης στο(x ο,y o ) ακµών Όχι (x ο,y o ) εν είναι σηµείο ακµής Σχήµα 4. 4 Στον αρχικό υπολογισµό του Gradient υπολογίζεται η απόλυτητιµή και στη συνέχεια θεωρείται σηµείο ακµής εάν η τιµή f(x) είναι µεγαλύτερη απο ένα κατώφλιο 4.3 Α µέθοδος η παράγωγος (Βάθµωση - Gradient) Το gradient (βαθµωση) G υπολογίζεται ως το διάνυσµα µε συνιστώσες τις µερικές παραγώγους της εντάσεως f(x,y) ως προς την οριζόντια και κάθετη µετατόπιση. G G{f (x,y)} G x y f x f y Το µέτρο του G υπολογίζεται ως : [ ] / R x y (4.) G G + G (4.) και µία καλή προσέγγιση είναι: G G + G (4.3) A x y Aποδεικνύεται εύκολα ότι G R G A G R (4.4) Η γωνία του G υπολογίζεται ως : G G x θ tan (4.5) y

-4- Στο προηγούµενο σχήµα δεικνύεται ο υπολογισµός του Gradient G f (f x,f y ) για ένα τµήµα της εικόνας που περικλείεται στο παράθυρο 3x3 και που το κεντρικό pixel βρίσκεται ακριβώς επάνω στην ακµή. H υλοποίηση των παραγώγων (4.) γίνεται µε διαφόρους τρόπους (αριθµητικές µεθόδους) και κάθε τρόπος υπολογισµού αντιστοιχεί σε µία µάσκα συνέλιξης (παράθυρο ή τελεστής). Πρίν υπεισέλθουµε στους διαφόρους τύπους των µασκών - παραθύρων θα πρέπει να τονισθεί ότι κάθε µέθοδος ευρέσεως παραγώγου θα πρέπει να ακολουθείται απο κατωφλιοποίηση. Και επίσης ότι υψηλή τιµή κατωφλίου δίνει λεπτές γραµµές περιγραµµάτων αλλά παραλείπει και την ανίχνευση µικρών ακµών (χαµηλής αντίθεσης - low contrast). Επίσης θα πρέπει να υπενθυµίσουµε ότι κάθε µάσκα υπολογίζει την µερική παράγωγο G x ή G y απο τις οποίες θα υπολογισθεί η συνολική τιµή G µε την (4.) ή συνηθέστερα µε την (4.3). Στον πίνακα 4. δίνονται οι πιό χαρακτηριστικές µάσκες για παράθυρο 3x3 και στο σχήµα 4.5 που ακολουθεί γίνεται εφαρµογή µερικών εξ αυτών σε εικόνα. Είδος τελεστού - µάσκας ΠΙΝΑΚΑΣ 4. G x Roberts - Prewitt - - - Sobel - - - Frei-Chen - - - G y - - - - - - - - - - Για τον τελεστή Sobel η υλοποίηση του Gradient G βασίζεται στίς σχέσεις: G x [f(x-,y+)+ f(x,y+)+ f(x+,y+)] -[f(x-,y-)+ f(x,y-)+ f(x+,y-)] (4.6) G y [f(x+,y-)+ f(x+,y)+ f(x+,y+)] -[f(x-,y-)+ f(x-,y)+ f(x-,y+)] (4.7) Με παρόµοιες σχέσεις υλοποιούνται και οι υπόλοιπες µάσκες.

-5- Στούς τελεστές που δεικνύονται στον πάνακα 4. παρατηρούµε ότι το άθροισµα των στοιχείων των µασκών είναι. Αυτό έχει σαν συνέπεια ότι σε σταθερές περιοχές η έξοδος είναι επίσης. H εύρεση του βέλτιστου κατωφλίου δεν είναι εύκολη διαδικασία και µία απλή επιλογή είναι ο µέσος όρος των G για όλη την εικόνα Ενα άλλο θέµα που αξίζει να επισηµάνουµε είναι ότι οι τελεστές του πίνακα 4. βρίσκουν ακµές σε οριζόντιες και κάθετες διευθύνσεις. Εάν θέλουµε να έχουµε και την κατεύθυνση τότε πρέπει σε κάθε σηµείο να χρησιµοποιούµε την (4.5). Μπορούµε όµως να δηµιουργήσουµε και επιπλέον µάσκες που να υπολογίζουν παραγώγους και εποµένως ακµές σε άλλες διευθύνσεις. Ετσι για τον τελεστή Prewitt αντί των µασκών τού παραπάνω πίνακα 4. χρησιµοποιούµε τις 8 µάσκες του πίνακα 4. ΠΙΝΑΚΑΣ 4. East Northeast North Nortwest West Southwest South Southeast - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - α β γ δ ε ζ Σχήµα 4. 5 Η αρχική εικόνα α) επεξεργασµένη µε τελεστή β) Roberts γ) Prewitt δ) Sobel. Στο ε) η οριζόντια συνιστώσα του Τελεστή Sobel και στο ζ) η κατακόρυφη

-6- Eνα βασικό χαρακτηριστικό των τελεστών που αναφέρθηκαν για αναγνώριση ακµών και που βασίζονται στην η παράγωγο, είναι οι µεγάλου εύρους γραµµές που εµφανίζονται σαν έξοδος των ανιχνευτών ακµής. Το µεγάλο εύρος οφείλεται στην επιλογή του κατωφλίου και στην βραδεία µεταβολή της έντασης σε ορισµένες περιπτώσεις. Σπανίως όµως η πληροφορία του πλάτους των ακµών επιδιώκεται στην επεξεργασία ενώ αντίθετα ο εντοπισµός της ακµής (localization) είναι αυτό που συνήθως επιζητείται. Ο εντοπισµός µίας ακµής απαιτεί την εύρεση ενός σηµείου που θα είναι και το κέντρο της ακµής. Βελτίωση στο πρόβληµα του παχους των ακµών µπορεί να γίνει βέβαια µε µεθόδους ελάττωσης thinning. 4.4 Β µέθοδος η παράγωγος (Laplacian) Η δεύτερη κατηγορία ευρέσεως ακµών βασίζεται στην εύρεση της ης παραγώγου και δεν παρουσιάζει τα προβλήµατα του µεγάλου εύρους ακµών που αναφέρθησαν προηγούµενα, αφού η έξοδος των τελεστών αυτών είναι τα σηµεία µηδενισµού της ης παραγώγου (σχήµα 4.3). Αξίζει να επισηµάνουµε ότι τα σηµεία µηδενισµού αντιστοιχούν σε σηµεία ακµών εφόσον αναφέρονται σε µετάβαση από θετικές σε αρνητικές τιµές και αντίστροφα (zero crossing points) H Laplacian είναι η χαρακτηριστική συνάρτηση που υλοποιείται στη κατηγορία αυτή. Για µία συνάρτηση f(x,y) ορίζεται ως εξής: f x f y f(x,y) + (4.8) Μία αριθµητική προσέγγιση της παραπάνω σχέσεως γίνεται απο την εξής σχέση f(x,y)f(x+,y)+f(x-,y)+f(x,y+)+f(x,y-)-4f(x,y) (4.9) που υλοποιείται απο την ακόλουθη µάσκα 4 + (4.) Όπως φαίνεται είναι δυνατή η διάσπαση σε δύο µάσκες οριζόντια και κατακόρυφη που είναι βέβαια µονοδιάστατες. Η απόδειξη της σχέσεως αυτής για τον ένα όρο της (4.8) είναι η εξής: f x f x x x [ f (i, j + ) f(i, j) ] [ f (i, j + ) ] [ f (i, j) ] [ f (i, j + ) f(i, j + ) ] [ f(i, j + ) f (i, j) ] f(i +, j) f (i, j) + f (i, j) x x

-7- Εκτός από την (4.) µία ακόµη µάσκα υλοποίησης της Laplacian είναι και η εξής 8 (4.) Οι (4.9)-(4.) δεικνύουν ότι η τιµή της Laplacian είναι ανάλογη του f(x,y)-mean[f(x,y)] Μπορεί επίσης να προσεγγισθεί και ως median[f(x,y)]- mean[f(x,y)]. Σε όλες τις διαδικασίες του τελεστού αυτού χρησιµοποιείται η απόλυτη τιµή και η εύρεση των ακµών γίνεται µε την εύρεση των µηδενικών τιµών (zero crossing) ύο παραδείγµατα απόκρισης του τελεστού της Laplacian δίνονται στο παρακάτω σχήµα 4.6 όπου παρατίθενται δύο περιοχές εικόνας. Οι µηδενισµοί των (α) και (β)δίνονται στην (γ) και (δ) αντίστοιχα. Στο (α) η µετάβαση είναι απότοµη και τα σηµεία µηδενισµού (zero crossing) δεν αποτυπώνονται στην έξοδο (γ). 8 8 8 8 8 5 8 8 8 8 8 8 8 8 8 5 8 8 8 8 8 8 8 8 8 8 8 8 8 8 (α) 5 8 8 8 8 5 8 8 8 8 (β) 8 8 8 8 8 5 8 8 8 8 8 8 8 8 8 5 8 8 8 8 6-6 3-3 6-6 6-6 (γ) 3-3 3-3 (δ) 6-6 3-3 Σχήµα 4. 6 Το (γ) είναι η απόκριση του (α) σε Laplacian. Ο µηδενισµός δεν εµφανίζεται αλλα φαίνεται καθαρά η θέση του λόγω του θετικού και αρνητικου σηµείου. Στο (δ) που αντιστοιχεί στη ράµπα (β) φαίνεται το σηµείο µηδενισµού. Mερικές ιδιότητες του τελεστού αυτού (της Laplacian) είναι οι εξής:. Σε σταθερές περιοχές έχει απόκριση µηδενική. Oι τιµές αυτές δεν αποτελούν σηµεία ακµών διότι δεν είναι σηµεία zero crossing.. Τα ανιχνευόµενα περιγράµµατα είναι πάντα κλειστές γραµµές. 3. Είναι ανεξάρτητη της διεύθυνσης. 4. Εχει µεγάλη ευαισθησία στο θόρυβο και αναδεικνύει ακµές που δεν αντιστοιχούν σε χαρακτηριστικά της εικόνας.

-8- Λόγω της παραπάνω ιδιότητας και για να βελτιώσουµε την συµπεριφορά στο θόρυβο συνήθως η µέθοδος αυτή συνδυάζεται µε κατώφλια που υπολογίζουν τον τοπικό θόρυβο. Στο διάγραµµα του σχήµατος 4.7 δεικνύεται µία µέθοδος όπου για την υπαρξη ακµής δεν αρκούν τα σηµεία µηδενισµού (zero crossing) αλλά πρέπει να εξασφαλίζεται ότι η τοπική διακύµανση είναι µεγαλύτερη απο ένα κατώφλιο Τ που θεωρείται ότι αντιστοιχεί στο θόρυβο. f(x,y) Υπολογισµός διακύµανσης σ f(x,y) Υπάρχει σηµείο Ναι zero crossing ; σ >Τ Ναί Οχι Οχι Σχήµα 4. 7 Χρησιµοποίηση της διακύµανσης σ (variance) σε συνδυασµό µε τον τελεστή της Laplacian γιά ανίχνευση ακµής 4.5 Laplacian of Gaussian (LoG) Με την µέθοδο αυτή γίνεται υλοποίηση δύο τελεστών : της Laplacian και της Gaussian. ηλαδή στην αρχική εικόνα εφαρµόζεται Gaussian µάσκα για να φιλτράρει τον θόρυβο και στη συνέχεια εφαρµόζεται Laplacian µάσκα για εύρεση των σηµείων µηδενισµού και εποµένως των ακµών. Αν και οι διαδικασίες αυτές µπορούν να γίνουν σε δύο διαδοχικά στάδια επειδή η συνέλιξη είναι γραµµική πράξη γίνονται ταυτόχρονα σε ένα βήµα όπως περιγράφεται στη συνέχεια. H σχέση που εκφράζει τις δύο διαδικασίες είναι η εξής: x + y x + y σ G e (4.) 4 πσ ύο µάσκες (3x3) και (5x5) που υλοποιούν την (4.) είναι οι ακόλουθες: σ 4 6 (4.3) Απόδειξη της (4.) Η εικόνα εξόδου h(x,y) είναι h(x, y) [ G(x, y)* f (x, y) ] [ G(x, y) ]* f(x,y) [ G (x, y )] x,y e x + y σ r e r σ σ r σ e r σ πσ 4 x + y σ e x + y σ

-9- Γενικά η υλοποίηση του LoG απαιτεί µεγάλες µάσκες ώστε να εµφανισθούν θετικές και αρνητικές τιµές που εκφράζουν την µορφή στην (4.) -3σ 3σ (α) (β) w 3w (γ) Σχήµα 4. 8 Η συναρτήσεις Gaussian (α) και η -LoG (β) σε τοµή. Η σχέση µεταξύ w και σ συνήθως λαµβάνεται w σ. Το µήκος του παραθύρου είναι 3wx3w. Για παράθυρο 3x3 έχουµε w και σ/( ). Στο (γ) δεικνύεται η µορφή της LoG στον (τρισδιάστατο) χώρο. Οι άξονες x,y είναι βαθµολογηµένοι µε τιµές της σ. σ.5 σ σ Σχήµα 4. 9 Εφαρµογή LoG µε τρείς διαφορετικές τιµές του σ. Η αρχική εικόνα είαι η ίδια µε αυτήν του σχ.4.5 Μία καλή προσέγγιση της LoG γίνεται µε διαφορά δύο Gaussian που έχουν διαφορετικές τυπικές αποκλίσεις σ (Difference of Gaussian - DoG). Η µέθοδος αυτή µειώνει το υπολογιστικό κόστος της LoG. DoG(x, y) x + y σ e πσ x + y σ e πσ Η ακόλουθη µάσκα 7x7 υλοποιεί τον τελεστή DoG για λόγο σ /σ.6 (4.4)

-- 3 3 3 3 5 5 5 3 3 5 6 5 3 3 5 5 5 3 (4.5) 4.6 Ανιχνευστής ακµής µε την µέθοδο Canny H ανίχνευση µε την µέθοδο Canny είναι µία ολοκληρωµένη µέθοδος που βασίζεται στην η παράγωγο αλλα περιλαµβάνει και άλλα βήµατα µε κυριώτερα, το διπλό κατώφλιο και την διαγραφή των σηµείων απο ον χάρτη ακµών που δεν αντιστοιχούν στο µεγιστο της βάθµωσης (nonmaxima supression). Ο αλγόριθµος υλοποίησης περιλαµβάνει τα παρακάτω βήµατα:. Η αρχική εικόνα Ι(i,j) λειαίνεται µε Gaussian φίλτρο S(i,j)G(i,j,σ)*I(i,j). Γίνεται ο υπολογισµός του Gradient σε πολική µορφή P(i,j) x S(i,j) Μ(i,j) P + Q Q(i,j) y S(i,j) θ(i,j) tan (P,Q) 3. ιαγραφή των σηµείων M(i,j) που δεν ειναι µέγιστα (nonmaxima supression) Ν(i,j)nms[M(i,j), θ(i.j)] 4. Eφαρµογή διπλού κατωφλίου για ανίχνευση και σύνδεση ακµών. Συνήθως το ένα κατώφλιο είναι διπλάσιο του αλλου. Στη διαδικασία αυτή είσοδος είναι η εικόνα Ν(i,j). Mε βάση το µεγάλο κατώφλιο ελέγχονται οι ακµές συλλέγωντας σηµε'ια απο το χάρτη ακµών του µικρού κατωφλίου. Στο επόµενο σχήµα δεικνύεται το αποτέλεσµα ανιχνευτού Canny σε συγκριση µε LoG. LoG σ Canny σ Canny σ Σχήµα 4. Ανιχνευση ακµών µε τήν µέθοδο Canny και αντίστοιχη εφαρµογή του LoG.

-- 4.7 Ανίχνευση ακµών σε έγχρωµη εικόνα Η ανίχνευση ακµών σε έγχρωµη εικόνα µπορεί nνα γίνει µε διαφόρους τρόπους. Χρησιµοποιώντας το κανάλι της εντάσεως αφού γίνει µετασχηµατισµός RGB-- >YIQ ή µετασχηµατισµός RGB-->HSI ή άλλος µετασχηµατισµός που εµφανίζεται η συνιστώσα της φωτεινότητας αποσυσχετισµένη απο την χρωµατικότητα Χρησιµοποιώντας τα τρία κανάλια R,G,B χωριστά. Ο χάρτης ακµών G(x,y) θα προέλθει απο τους τρείς επιµέρους χάρτες G R, G B, G G ως εξής: G(x, y) G + G G (4.6α) R G + ή G(x,y)max(G R,G G,G B ) B (4.6β) Να γίνει µε διανυσµατικές διαδικασίες θεωρώντας τα pixel της εικόνας ως διανύσµατα στον τριδιάστατο RGB χώρο. Aξίζει στο σηµείο αυτό να τονίσουµε ότι όπως έχει παρατηρηθεί, ο µεγαλύτερος αριθµός ακµών σε µία έγχρωµη εικόνα ανιχνεύεται µε την φωτεινότητα και ένας πολύ µικρός αριθµός (χρωµατικών) ακµών εµφανίζεται στις συνιστώσες της χρωµατικότητας και ιδιαίτερα σε περιπτώσεις µικρής αντίθεσης (low contrast). 4.8 Κριτήρια σωστής ανίχνευσης ακµών Τα σφάλµατα στην ανίχνευση των ακµών είναι τα εξής: Παράλειψη σηµείων ακµής Λανθασµένη αναγνώριση σηµείων που δεν είναι πραγµατικές ακµές Μετατόπιση σηµείων ακµής Ενα κριτήριο (FOM -figure of merit) σωστής ανίχνευσης που έχει προταθεί απο τον Pratt και περιλαµβάνει τις παραπάνω περιπτώσεις είναι το εξής I R A max[i,i ] d (4.7) I A i + α όπου Ι Ι ιδανικός αριθµός σηµείων, Ι Α ο αριθµός σηµείων που ανίχνευσε η µέθοδος, απαράγοντας κλιµάκωσης και dη µετατόπιση του σηµείου ακµής απο την πραγµατική του θέση. Η τιµή του R ευρίσκεται µε εικόνες όπου οι πραγµατικές ακµές είναι γνωστές. Συνήθως προστίθεται θόρυβος και µετριέται το R σαν συνάρτηση του SNR (signal to noise ratio). Στο επόµενο σχήµα δεικνύονται τα σφάλµατα στην αναγνώριση ακµών.

-- (α) (β) (γ) (δ) Σχήµα 4. (α) τµήµα εικόνας µε ακµή (β) ιδανική ανίχνευση ακµής (γ) Ενα σηµείο που δεν ανιχνεύτηκε και (δ) ανίχνευση σηµείων ακµής µε µετατόπιση 4.9. O ιανυσµατικός χώρος των σηµάτων που αποτελούνται από n σηµεία µίας εικόνας 4.9. Εισαγωγικά Σε όλες τις προηγούµενες διαδικασίες επεξεργαζόµαστε σηµεία µίας εικόνας που ανήκουν σε ένα παράθυρο 3x3 ή 5x5 κλπ. Τα σηµεία αυτά µπορούµε να θεωρήσουµε ότι αποτελούν τις συντεταγµένες ενός διανύσµατος σε ένα χώρο n διαστάσεων (πχ. n9 ή n5 κλπ). Tο µήκος του διανύσµατος αυτού σχετίζεται µε την ενέ του σήµατος που ορίζεται σαν το τετράγωνο του µήκους του ή ισοδύναµα µε το άθροισµα των τετραγώνων των συνιστωσών του. Εάν το διάνυσµα είναι S[s,s, s n ] τότε η ενέ αυτού είναι: S s + s + s +... + (4.8) 3 sn Στη διαδικασία αυτή θεωρούµε εµµέσως ότι η βάση ανάλυσης είναι η standard ορθοκανονική βάση. Με την ονοµασία standard εννοούµε τον διανυσµατικό χώρο όπου τα διανύσµατα βάσεως πχ. για n3 έχουν την µορφή w ( ), w ( ), w 3 ( ). Το πρόβληµα που ανακύπτει στη θεώρηση αυτή είναι η επιλογή µίας ορθοκανονικής βάσης πέρα από την standard βάση που κάθε άξονας να έχει µία συγκεκριµένη ερµηνεία Στη θεώρηση αυτή η συνολική ενέ του διανύσµατος σήµατος θα είναι σταθερή (αφου πρόκειται για ορθοκανονική βάση) αλλα η κατανοµή στις διάφορες συνιστώσες θα αποκαλύπτει κάποια χαρακτηριστικά της εικόνας.

-3- Ας δούµε στην συνέχεια την παρακάτω ορθοκανονική βάση Roberts που αναφέρεται στο χώρο των 4 διαστάσεων: W W W W 3 4 Αρχικά διαπιστώνεται εύκολα ότι είναι ορθογώνια διότι το εσωτερικό γινόµενο δύο οποιονδήποτε διανυσµάτων είναι Επίσης είναι κανονική διότι το µέτρο κάθε διανύσµατος βάσης είναι. πχ. W W 4 4 Στη βάση αυτή παρατηρούµε ότι µία σταθερή περιοχή θα έχει µη µηδενική συνιστώσα µόνο στον άξονα W. 5 5 πχ. Για την σταθερή περιοχή έχουµε: 5 5 5 5 W W W W3 4 5 5 ηλ. έχει µία µόνο συνιστώσα την W. Αντίθετα η περιοχή που αντιστοιχεί σε µία ακµή στην οριζόντια διεύθυνση Αναλύεται ως W W W3 4 δηλ. έχει τις δύο συνιστώσες που W αντιστοιχούν στις W και W 3. Ουσιαστικά το µέγεθος της προβολής (κάθε συνιστώσα) δεικνύει το βαθµό οµοιότητας µε το συγκεκριµένο διάνυσµα βάσεως. 4.9. Η βάση Frei-Chen για περιοχές 3x3 Πρίν µελετήσουµε την βάση Frei-Chen ας δούµε την standard βάση για διανύσµατα 3x3. Ευκολα βρίσκεται ότι η βάση αυτή αποτελείται από τα ακόλουθα 9 διανύσµατα:... Τα διανύσµατα αυτά είναι ορθογώνια (άρα ανεξάρτητα) και έχουν µέτρο, δηλ αποτελούν µία ορθοκανονική βάση. Η αναπαράσταση στη βάση αυτή ενός οποιουδήποτε διανύσµατος 3x3 είναι εύκολη και άµεση. Ένα παράδειγµα δεικνύεται στη συνέχεια.

-4-3 4 5 3 + 4 + 5 Η αναπαράσταση ενός διανύσµατος πίνακα 3x3 στη παραπάνω standard βαση δεν δίνει καµµία πληροφορία για το περιεχόµενο του. Σε αντίθεση µε αυτό η βάση Frei-Chen που θα δούµε στη συνέχεια επιτρέπει την ερµηνεία του πίνακα-διάνυσµα σύµφωνα µε τις τιµές των συνιστωσών του. Ας δούµε τα διανύσµατα βάσεως της βάσης αυτής για το σύνολο των πινάκων 3x3. Κάθε πίνακας διάνυσµα της βάσης αυτής αντιστοιχεί ουσιαστικά σε ένα τµήµα εικόνας Στο επόµενο σχήµα δηλώνεται και το είδος της εικόνας περιοχής πού αντιπροσωπεύει κάθε διάνυσµα της βάσεως. βά θµωση W 8 κυµ ά τωση W3 8 γραµµ ή W5 Laplacian W7 4 6 σταθερ ή περιοχ ή W9 3 W 8 W4 8 W6 W8 4 6 Σχήµα4. Τα 9 διανύσµατα βάσεως Frei-Chen. Κάθε ένα από αυτά αντιστοιχεί σε ένα συγκεκριµένο τύπο της περιοχής της εικόνας. Είναι φανερό ότι για κάθε µία περιοχή 3x3 της εικόνας όταν γίνει αναπαράστασή της στη βάση αυτή η τιµή της κάθε συνιστώσας δίνει ουσιαστική πληροφορία γιατί εκφράζει την οµοιότητα µε το συγκεκριµένο διάνυσµα βάσεως. Η πληροφορία αυτή γίνεται εµφανέστερη αν βρεθεί η ενέ που αντιστοιχεί σε κάθε συνιστώσα. Επειδή η βάση είναι ορθοκανονική η συνολική ενέ παραµένει η ίδια όπως και στη standard βάση. Αλλάζει όµως η κατανοµή στις διάφορες συνιστώσες.

-5- Στο επόµενο παράδειγµα δίνεται ένα τµήµα εικόνας Ν που όπως φαίνεται αποτελεί τµήµα ακµής µε κατεύθυνση την κύρια διαγώνιο. N 5 5 5 Η συνολική ενέ είναι Ν Ν + + + + + +5 +5 +5 675 Βρίσκουµε τις προβολές (εσωτερικά γινόµενα) στα διανύσµατα της βάσεως Frei-Chen Εχουµε: 5 + 5 N o W 4.3 Eνέ 4.3 8 8 5 + 5 N o W 4.3 Eνέ 4.3 8 8 N o W3 Eνέ 5 N o W4 8 Eνέ N o W5 Eνέ N o W6.5 Eνέ 6.5 N o W7.5 Eνέ 6.5 N o W8 Eνέ N o W9 5 Eνέ 65 Απο την συνολική ενέ 675 στην W 9 δηλαδή στη σταθερή περιοχή, αντιστοιχεί ένα µεγάλο τµήµα ενές 65. Το υπόλοιπο ποσό είναι 5. Από αυτό ένα ποσό 36 δηλ το 7% αντιστοιχεί στις συνιστώσες W και W που εκφράζουν την ύπαρξη της ακµής.