ΠΑΡΑΜΕΤΡΙΚΗ ΑΝΤΙΣΤΟΙΧΙΣΗ ΕΙΚΟΝΩΝ ΣΤΗΝ ΥΠΟΛΟΓΙΣΤΙΚΗ ΟΡΑΣΗ

Σχετικά έγγραφα
Ειδικά Θέµατα Υπολογιστικής Όρασης & Γραφικής. Εµµανουήλ Ζ. Ψαράκης & Αθανάσιος Τσακαλίδης Πολυτεχνική Σχολή Τµήµα Μηχανικών Η/Υ & Πληροφορικής

Ειδικά Θέματα Υπολογιστικής Όρασης & Γραφικής. Εμμανουήλ Ζ. Ψαράκης & Αθανάσιος Τσακαλίδης Πολυτεχνική Σχολή Τμήμα Μηχανικών Η/Υ & Πληροφορικής

Ειδικά Θέµατα Υπολογιστικής Όρασης & Γραφικής. Εµµανουήλ Ζ. Ψαράκης & Αθανάσιος Τσακαλίδης Πολυτεχνική Σχολή Τµήµα Μηχανικών Η/Υ & Πληροφορικής

Οπτική Μοντελοποίηση Ανθρώπινου Προσώπου με Εφαρμογές σε Αναγνώριση

Αναγνώριση Προτύπων Ι

Συνήθεις διαφορικές εξισώσεις προβλήματα οριακών τιμών

Παρουσίαση 2 η : Αρχές εκτίμησης παραμέτρων Μέρος 1 ο

Ειδικά Θέµατα Υπολογιστικής Όρασης & Γραφικής. Εµµανουήλ Ζ. Ψαράκης & Αθανάσιος Τσακαλίδης Πολυτεχνική Σχολή Τµήµα Μηχανικών Η/Υ & Πληροφορικής

Τα περισσότερα προβλήματα βελτιστοποίησης είναι με περιορισμούς, αλλά οι μέθοδοι επίλυσης χωρίς περιορισμούς έχουν γενικό ενδιαφέρον.

Βασίλειος Μαχαιράς Πολιτικός Μηχανικός Ph.D.

ΣΤΟΧΑΣΤΙΚΑ ΣΗΜΑΤΑ ΚΑΙ ΕΦΑΡΜΟΓΕΣ

Μετάδοση Πολυμεσικών Υπηρεσιών Ψηφιακή Τηλεόραση

Αριθμητική εύρεση ριζών μη γραμμικών εξισώσεων

4. ΚΕΦΑΛΑΙΟ ΕΦΑΡΜΟΓΕΣ ΤΟΥ ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΥ FOURIER

Ειδικά Θέµατα Υπολογιστικής Όρασης & Γραφικής. Εµµανουήλ Ζ. Ψαράκης & Αθανάσιος Τσακαλίδης Πολυτεχνική Σχολή Τµήµα Μηχανικών Η/Υ & Πληροφορικής

Q 12. c 3 Q 23. h 12 + h 23 + h 31 = 0 (6)

Τεχνικές Μείωσης Διαστάσεων. Ειδικά θέματα ψηφιακής επεξεργασίας σήματος και εικόνας Σ. Φωτόπουλος- Α. Μακεδόνας

ΠΡΟΣΑΡΜΟΣΤΙΚΟΣ ΕΛΕΓΧΟΣ ΡΟΜΠΟΤΙΚΟΥ ΒΡΑΧΙΟΝΑ ΜΕ ΕΞΑΣΦΑΛΙΣΗ ΠΡΟΚΑΘΟΡΙΣΜΕΝΗΣ ΕΠΙΔΟΣΗΣ ΣΤΟ ΣΦΑΛΜΑ ΠΑΡΑΚΟΛΟΥΘΗΣΗΣ ΤΡΟΧΙΑΣ ΣΤΙΣ ΑΡΘΡΩΣΕΙΣ.

Υπολογιστικές μέθοδοι για την ανάλυση της πληροφορίας των εικόνων και την κατανόηση του περιεχομένου

Εισαγωγή Αλγόριθµοι Αποτελέσµατα Επίλογος Ορισµός του Προβλήµατος Ευθυγράµµιση : Εύρεση ενός γεωµετρικού µετασχηµατισµού που ϕέρνει κοντά δύο τρισδιάσ

Αναγνώριση Προτύπων Ι

2.1 Αριθμητική επίλυση εξισώσεων

Ασκήσεις Φροντιστηρίου «Υπολογιστική Νοημοσύνη Ι» 4 o Φροντιστήριο

Βασίλειος Μαχαιράς Πολιτικός Μηχανικός Ph.D.

ΒΙΟΜΗΧΑΝΙΚΑ ΗΛΕΚΤΡΟΝΙΚΑ

ΕΙΣΑΓΩΓΗ ΣΤΗ ΒΕΛΤΙΣΤΟΠΟΙΗΣΗ ΣΥΣΤΗΜΑΤΩΝ

Αναγνώριση Προτύπων Ι

Το μοντέλο Perceptron

Μεταπτυχιακό Πρόγραμμα «Γεωχωρικές Τεχνολογίες» Ψηφιακή Επεξεργασία Εικόνας. Εισηγητής Αναστάσιος Κεσίδης

Ειδικά Θέµατα Υπολογιστικής Όρασης & Γραφικής. Εµµανουήλ Ζ. Ψαράκης & Αθανάσιος Τσακαλίδης Πολυτεχνική Σχολή Τµήµα Μηχανικών Η/Υ & Πληροφορικής

ΓΡΑΜΜΙΚΟΣ & ΔΙΚΤΥΑΚΟΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ

II.6 ΙΣΟΣΤΑΘΜΙΚΕΣ. 1. Γραφήματα-Επιφάνειες: z= 2. Γραμμική προσέγγιση-εφαπτόμενο επίπεδο. 3. Ισοσταθμικές: f(x, y) = c

Εισαγωγή στις Τηλεπικοινωνίες. Δομή της παρουσίασης

ΣΧΕΔΙΑΣΗ ΜΗΧΑΝΟΛΟΓΙΚΩΝ ΚΑΤΑΣΚΕΥΩΝ ΜΕ Η/Υ (Computer Aided Design)

Γραφικά με Η/Υ Αλγόριθμοι σχεδίασης βασικών 22D D σχημάτων (ευθεία

Κεφ. 6Β: Συνήθεις διαφορικές εξισώσεις (ΣΔΕ) - προβλήματα αρχικών τιμών

5/3/2010. A. Στη δηµιουργία του στερεοσκοπικού µοντέλουέ B. Στη συσχέτισή του µε το γεωδαιτικό σύστηµα

HMY 799 1: Αναγνώριση Συστημάτων

Διαχείριση Υδατικών Πόρων Πολυκριτηριακή ανάλυση

ΣΧΕΔΙΑΣΜΟΣ ΚΙΝΗΣΗΣ ΚΑΙ ΧΡΟΝΟΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ ΕΡΓΑΣΙΩΝ ΣΕ ΒΙΟΜΗΧΑΝΙΚΑ ΠΕΡΙΒΑΛΛΟΝΤΑ

ΕΠΕΞΕΡΓΑΣΙΑ & ΑΝΑΛΥΣΗ ΙΑΤΡΙΚΩΝ ΣΗΜΑΤΩΝ

Στην ουσία η Φωτογραµµετρία: Χ, Υ, Ζ σηµείων Γραµµικό σχέδιο Εικονιστικό προϊόν

ΑΡΙΘΜΗΤΙΚΕΣ ΜΕΘΟΔΟΙ ΓΙΑ ΠΡΟΒΛΗΜΑΤΑ ΜΗΧΑΝΙΚΗΣ ΕΦΑΡΜΟΓΕΣ ΜΕ ΧΡΗΣΗ MATLAB ΔΕΥΤΕΡΗ ΕΚΔΟΣΗ [ΒΕΛΤΙΩΜΕΝΗ ΚΑΙ ΕΠΑΥΞΗΜΕΝΗ]

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2

Γραμμικός Προγραμματισμός Μέθοδος Simplex

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ ΣΤΟΙΧΕΙΑ ΘΕΩΡΙΑΣ ΣΥΝΟΛΩΝ ΚΑΙ ΣΥΝΔΥΑΣΤΙΚΗΣ ΑΝΑΛΥΣΗΣ

III.9 ΑΚΡΟΤΑΤΑ ΣΕ ΠΕΡΙΟΧΗ

ΕΡΕΥΝΗΤΙΚΑ ΠΡΟΓΡΑΜΜΑΤΑ ΑΡΧΙΜΗΔΗΣ ΕΝΙΣΧΥΣΗ ΕΡΕΥΝΗΤΙΚΩΝ ΟΜΑΔΩΝ ΣΤΟ ΤΕΙ ΣΕΡΡΩΝ. Ενέργεια στ ΘΕΜΑ ΕΡΕΥΝΑΣ: ΔΙΑΡΘΡΩΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΕΧΡΩΜΩΝ ΕΓΓΡΑΦΩΝ

Ψηφιακή Επεξεργασία και Ανάλυση Εικόνας Ενότητα 2 η : Δισδιάστατα Σήματα & Συστήματα Μέρος 2

Κεφ. 7: Συνήθεις διαφορικές εξισώσεις (ΣΔΕ) - προβλήματα αρχικών τιμών

Θεωρία Αλγόριθμοι Γραμμικής Βελτιστοποίησης

ΦΩΤΟΓΡΑΜΜΕΤΡΙΑ ΙΙ ΕΠΑΝΑΛΗΨΗ. Ανδρέας Γεωργόπουλος Καθηγητής Ε.Μ.Π.

ΣΥΣΤHΜΑΤΑ ΑΠΟΦAΣΕΩΝ ΣΤΗΝ ΠΑΡΑΓΩΓH

ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΙΑΣ ΤΜΗΜΑ ΠΟΛΙΤΙΚΩΝ ΜΗΧΑΝΙΚΩΝ ΤΟΜΕΑΣ ΥΔΡΑΥΛΙΚΗΣ ΚΑΙ ΠΕΡΙΒΑΛΛΟΝΤΙΚΗΣ ΤΕΧΝΙΚΗΣ. Διάλεξη 3: Περιγραφή αριθμητικών μεθόδων (συνέχεια)

Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 5: Εύρεση σημείων ισορροπίας σε παίγνια μηδενικού αθροίσματος. Ε. Μαρκάκης. Επικ. Καθηγητής

Ψηφιακή Επεξεργασία Εικόνας. Σ. Φωτόπουλος ΨΕΕ

(sensitivity analysis, postoptimality analysis).

Στόχος της εργασίας και ιδιαιτερότητες του προβλήματος

z = c 1 x 1 + c 2 x c n x n

Μέθοδοι πολυδιάστατης ελαχιστοποίησης

ΔΕΙΓΜΑ ΠΡΙΝ ΤΙΣ ΔΙΟΡΘΩΣΕΙΣ - ΕΚΔΟΣΕΙΣ ΚΡΙΤΙΚΗ

EΦΑΡΜΟΓΕΣ ΤΗΣ ΨΗΦΙΑΚΗΣ ΕΠΕΞΕΡΓΑΣΙΑΣ ΣΗΜΑΤΩΝ. Γραµµική Εκτίµηση Τυχαίων Σηµάτων

Κεφάλαιο Τοπολογικές απεικονίσεις Αζιμουθιακή ισόχρονη απεικόνιση

21 a 22 a 2n. a m1 a m2 a mn

ΚΕΦΑΛΑΙΟ 3 ο ΣΥΝΑΡΤΗΣΕΙΣ, ΤΡΙΓΩΝΟΜΕΤΡΙΑ( FUNCTIONS,TRIGONOMETRY)

HY213. ΑΡΙΘΜΗΤΙΚΗ ΑΝΑΛΥΣΗ

ΜΕΜ251 Αριθμητική Ανάλυση

Θεωρία μετασχηματισμών

ΔΙΑΧΕΙΡΙΣΗ ΥΔΑΤΙΚΩΝ ΠΟΡΩΝ

ΚΑΤΑΓΡΑΦΗ ΤΟΥ ΙΧΝΟΥΣ ΤΗΣ ΟΠΤΙΚΗΣ ΑΝΑΖΗΤΗΣΗΣ: ΜΙΑ ΜΕΘΟΔΟΣ ΔΙΕΡΕΥΝΗΣΗΣ ΤΗΣ ΕΠΙΛΕΚΤΙΚΟΤΗΤΑΣ ΤΗΣ ΟΠΗΣ ΩΣ ΒΑΣΙΚΟΥ ΧΑΡΑΚΤΗΡΙΣΤΙΚΟΥ ΤΟΥ ΣΧΗΜΑΤΟΣ

Ψηφιακή Επεξεργασία και Ανάλυση Εικόνας. Παρουσίαση Νο. 1. Εισαγωγή

Θέση και Προσανατολισμός

Επαναληπτικές μέθοδοι

Μέθοδοι Μηχανών Μάθησης για Ευφυή Αναγνώριση και ιάγνωση Ιατρικών εδοµένων

ΑΣΚΗΣΕΙΣ. 1. Στο ομοπαραλληλικό επίπεδο δίνεται το σύστημα συντεταγμένων S { A, A, A }.

Ανάκτηση πολυμεσικού περιεχομένου

ΤΟΠΟΓΡΑΦΙΚΑ ΔΙΚΤΥΑ ΚΑΙ ΥΠΟΛΟΓΙΣΜΟΙ ΑΝΑΣΚΟΠΗΣΗ ΘΕΩΡΙΑΣ ΣΥΝΟΡΘΩΣΕΩΝ

ΑΠΟΓΡΑΦΙΚΟ ΔΕΛΤΙΟ ΠΤΥΧΙΑΚΗΣ ΕΡΓΑΣΙΑΣ ΤΙΤΛΟΣ

(a) = lim. f y (a, b) = lim. (b) = lim. f y (x, y) = lim. g g(a + h) g(a) h g(b + h) g(b)

E[ (x- ) ]= trace[(x-x)(x- ) ]

Ανάλυση σχημάτων βασισμένη σε μεθόδους αναζήτησης ομοιότητας υποακολουθιών (C589)

Αριθμητική Ανάλυση και Εφαρμογές

3. ΕΠΙΛΥΣΗ ΓΡΑΜΜΙΚΟΥ ΑΝΤΙΣΤΡΟΦΟΥ ΠΡΟΒΛΗΜΑΤΟΣ ΜΕ ΤΗ ΜΕΘΟΔΟ ΜΗΚΩΝ

Ο Μετασχηματισμός Ζ. Ανάλυση συστημάτων με το μετασχηματισμό Ζ

ΣΗΜΑΤΑ ΚΑΙ ΣΥΣΤΗΜΑΤΑ Ι

3. Γραμμικά Συστήματα

Μεταπτυχιακό Πρόγραμμα «Γεωχωρικές Τεχνολογίες» Ψηφιακή Επεξεργασία Εικόνας. Εισηγητής Αναστάσιος Κεσίδης

Ανδρέας Γεωργόπουλος Καθηγητής Ε.Μ.Π.

Περιπτώσεις συνοριακών συνθηκών σε προβλήματα γεωτεχνικής μηχανικής

ΒΑΣΙΚΑ ΣΤΟΙΧΕΙΑ ΘΕΩΡΙΑΣ ΤΗΣ ΜΕΘΟΔΟΥ SIMPLEX

Κεφάλαιο 4: Στοιχεία της εκδοχής hp της ΜΠΣ στις 2- διαστάσεις

6. ΚΕΦΑΛΑΙΟ ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΣ LAPLACE

Ακαδημαϊκό Έτος , Χειμερινό Εξάμηνο Διδάσκων Καθ.: Νίκος Τσαπατσούλης

Πιο συγκεκριμένα, η χρήση του MATLAB προσφέρει τα ακόλουθα πλεονεκτήματα.

Μέθοδοι μονοδιάστατης ελαχιστοποίησης

Συστήματα Επικοινωνιών

ΔΙΑΦΟΡΙΚΟΣ ΛΟΓΙΣΜΟΣ. Όταν θα έχετε ολοκληρώσει τη μελέτη αυτού του κεφαλαίου, θα πρέπει να μπορείτε: Να κάνετε πράξεις με συναρτήσεις.

Συστήματα συντεταγμένων

Κεφ. 2: Επίλυση συστημάτων αλγεβρικών εξισώσεων. 2.1 Επίλυση απλών εξισώσεων

Συστήµατα Μη-Γραµµικών Εξισώσεων Μέθοδος Newton-Raphson

Transcript:

ΠΑΡΑΜΕΤΡΙΚΗ ΑΝΤΙΣΤΟΙΧΙΣΗ ΕΙΚΟΝΩΝ ΣΤΗΝ ΥΠΟΛΟΓΙΣΤΙΚΗ ΟΡΑΣΗ Γεώργιος Δ. Ευαγγελίδης και Εμμανουήλ Ζ. Ψαράκης Εργαστήριο Επεξεργασίας Σημάτων & Τηλεπικοινωνιών, Τμήμα Μηχανικών Η/Υ & Πληροφορικής, Πανεπιστήμιο Πατρών, 26504, Ρίο, Πάτρα ΠΕΡΙΛΗΨΗ Το πρόβλημα της παραμετρικής αντιστοίχισης εικόνων αποτελεί ένα από τα κυριότερα προβλήματα στο πεδίο της υπολογιστικής όρασης. Η επίλυσή του απαίτει τον καθορισμό ενός μοντέλου μετασχηματισμών και ενός κριτηρίου ομοιότητας, από τη βελτιστοποίηση του οποίου προκύπτει η εκτίμηση των παραμέτρων του μοντέλου. Δύο απαραίτητα χαρακτηριστικά των κριτηρίων που χρησιμοποιούνται σε προβλήματα αντίστοιχισης είναι η ακρίβεια υπο-εικονοστοιχείου και η αμεταβλητότητά τους σε φωτομετρικές παραμορφώσεις. Στο άρθρο αυτό, ένα πρόσφατα προταθέν κριτήριο που διαθέτει τα παραπάνω χαρακτηριστικά, χρησιμοποιείται σε αλγορίθμους αντιστοίχισης εικόνων και αναδεικνύεται η υπεροχή του έναντι άλλων γνωστών στη βιβλιογραφία κριτηρίων. Λέξεις κλειδιά: Ευθυγράμμιση εικόνων, αντιστοίχιση εικόνων, συντελεστής συσχέτισης, μη-γραμμική βελτιστοποίηση, ακρίβεια υπο-εικονοστοιχείου 1 ΕΙΣΑΓΩΓΗ Τα τελευταία χρόνια τα ρομποτικά ή/και υπολογιστικά συστήματα εξοπλίζονται με αισθητήρες όρασης, με σκοπό να αποκτήσουν την (ψευδ)αίσθηση της όρασης και της αντίληψης του χώρου ή την ικανότητα να εξάγουν πληροφορίες από πραγματικές εικόνες. Η λειτουργία των συστημάτων αυτών απαιτεί πολύ συχνά την επίλυση προβλημάτων αντιστοίχισης εικόνων. Στα προβλήματα αυτά αναζητούνται σημεία σε δύο ή περισσότερες εικόνες, τα οποία αποτελούν προβολές του ίδιου σημείου της σκηνής. Το πρόβλημα αντιστοίχισης ανάγεται συνήθως σε ένα ή περισσότερα επιμέρους προβλήματα ευθυγράμμισης εικόνων. Συνεπώς, το πρόβλημα ευθυγράμμισης αποτελεί το θεμελιώδες πρόβλημα αντιστοίχισης. Το παραμετρικό πρόβλημα ευθυγράμμισης απαιτεί την εύρεση ενός μέλους μιας οικογένειας γεωμετρικών μετασχηματισμών, το οποίο στοιχίζει, με κάποια βέλτιστη έννοια, δύο εικόνες που η μία αποτελεί γεωμετρικά παραμορφωμένη εκδοχή της άλλης. Είναι προφανές ότι η χρήση παραμετρικού μοντέλου ανάγει το πρόβλημα ευθυγράμμισης σε ένα πρόβλημα εκτίμησης παραμέτρων, ενώ η ποιότητα των βέλτιστων εκτιμήσεων και το κόστος επίλυσης του προβλήματος εξαρτώνται από το εκάστοτε κριτήριο που χρησιμοποιείται για την εκτίμηση των παραμέτρων. Σημαντικές προϋποθέσεις για την καταλληλότητα χρήσης ενός κριτηρίου σε έναν αλγόριθμο ευθυγράμμισης αποτελούν η δυνατότητα αντιστοιχίσεων μεγάλης ακρίβειας και η αμεταβλητότητά του σε φωτομετρικές παραμορφώσεις (Baker, 2003), (Psarakis, 2005). Στο παρόν άρθρο, για την επίλυση του εν λόγω προβλήματος, χρησιμοποιείται ένα πρόσφατα προταθέν κριτήριο, το οποίο βασίζεται σε μια μορφή του συντελεστή συσχέτισης (Psarakis, 2005), γεγονός που το καθιστά αμετάβλητο σε γραμμικές φωτομετρικές παραμορφώσεις. Στο κριτήριο αυτό έχει καταλλήλα ενσωματωθεί το 1ο Πανελλήνιο Συνέδριο Ρομποτικής, ΤΕΕ, Αθήνα, 23-24 Φεβρουαρίου, 2009 1

παραμετρικό μοντέλο του γεωμετρικού μετασχηματισμού. Για τη λύση του προκύπτοντος μη γραμμικού προβλήματος βελτιστοποίησης, προτείνεται ένα επαναληπτικό σχήμα που χρησιμοποιεί κλειστού τύπου λύση σε κάθε επανάληψη. Η εφαρμογή του σχήματος στα προβλήματα της ευθυγράμμισης εικόνων και της στερεοσκοπικής αντιστοίχισης αναδεικύει τα πλεονεκτήματά του έναντι σχημάτων που αποτελούν σημεία αναφοράς στη βιβλιογραφία. 2 ΔΙΑΤΥΠΩΣΗ ΠΡΟΒΛΗΜΑΤΟΣ ΚΑΙ ΠΡΟΤΕΙΝΟΜΕΝΟ ΚΡΙΤΗΡΙΟ Έστω ότι δίνονται δύο εικόνες I r (x), I (y) μιας σκηνής, όπου x=[x 1,x 2 ] t, y=[y 1,y 2 ] t, είναι οι συντεταγμένες των εικονοστοιχείων τους αντίστοιχα. Η εικόνα I r (x) καλείται εικόνα αναφοράς (reference-template image) ενώ η εικόνα I (y) καλείται μετασχηματισμένη εικόνα (arped image). Έστω επίσης ότι το σύνολο σημείων T r ={x k, k=1,...,k} της εικόνας αναφοράς ορίζει την περιοχή ενδιαφέροντος. Το πρόβλημα της αντιστοίχισης εικόνων ουσιαστικά αποσκοπεί στην εύρεση του αντίστοιχου συνόλου σημείων T ={y k, k=1,...,k} στην μετασχηματισμένη εικόνα. Για αυτόν το σκοπό θεωρούμε ότι η αντιστοίχιση των παραπάνω συνόλων μπορεί να μοντελοποιηθεί από τη σχέση y=φ(x;p) όπου φ: R 2 R 2 μια καλώς ορισμένη διανυσματική συνάρτηση και p=[p 1,,p N ] t ένα διάνυσμα άγνωστων παραμέτρων. Σύμφωνα με την υπόθεση σταθερής φωτεινότητας (Anandan, 1989), το πρόβλημα της αντιστοίχισης ανάγεται στο πρόβλημα εκτίμησης των παραμέτρων p, έτσι ώστε Ir( x) = I( φ( x; p)), x T. r (1) Η πλειοψηφία των αλγορίθμων αποσκοπεί στην ελαχιστοποίηση της ανομοιότητας μεταξύ των δύο προφίλ. Η ανομοιότητα ορίζεται με τη βοήθεια μιας αντικειμενικής συνάρτησης (μετρικής) E(p), η οποία τις περισσότερες φορές είναι η l 2 νόρμα των διαφορών έντασης φωτεινότητας των δύο εικόνων (Anandan, 1989), (Baker, 2003). Επιπλέον, για την αντιστάθμιση φωτομετρικών παραμορφώσεων, η παραπάνω μετρική εμπλουτίζεται συχνά με κατάλληλες φωτομετρικές παραμέτρους (Baker, 2003). Στη συνέχεια, για λόγους ευκολίας, θα αντιμετωπίζουμε τις εικόνες ως διανύσματα. Για το σκοπό αυτόν, αν y k (p)=φ(x k ;p), k=1,,k είναι τα σημεία του συνόλου T (αντίστοιχα των σημείων x k του συνόλου T r ), τότε τα διανύσματα i r =[I r (x 1 ),, I r (x K )] t, i (p)=[i (y 1 (p)),, I (y K (p))] t θα αποτελούν τις διανυσματικές αναπαραστάσεις των αντίστοιχων εικόνων στο χώρο R K. Η συνάρτηση κόστους που προτείνεται για την ποσοτικοποίηση απόδοσης της εφαρμογής του γεωμετρικού μετασχηματισμού, είναι η ακόλουθη ρ ( p) = ˆi t r i ( p) i ( p) όπου x, x και x^ συμβολίζουν το μηδενικής μέσης τιμής διάνυσμα x, την ευκλείδεια νόρμα του και το κανονικοποιημένο διάνυσμα. Η παραπάνω συνάρτηση καλείται τροποποιημένος συντελεστής συσχέτισης (Enhanced Correlation Coefficient-ECC). Για τη σχέση του ECC με άλλες πολύ γνωστές στη βιβλιογραφία συναρτήσεις κόστους που χρησιμοποιούνται στο πρόβλημα της αντιστοίχισης, ο ενδιαφερόμενος αναγνώστης παραπέμπεται στην (Evangelidis, 2008). Συνεπώς, στόχος είναι η επίλυση του ακόλουθου προβλήματος βελτιστοποίησης: max ρ ( p ). (3) p (2) 1ο Πανελλήνιο Συνέδριο Ρομποτικής, ΤΕΕ, Αθήνα, 23-24 Φεβρουαρίου, 2009 2

Από τη (2) επιβεβαιώνεται εύκολα η αμεταβλητότητα της συνάρτησης ρ(p) σε γραμμικούς μετασχηματισμούς της φωτεινότητας των εικόνων, κάτι που σημαίνει ότι η προτεινόμενη συνάρτηση κόστους μας επιτρέπει να επικεντρωθούμε σε γεωμετρικές παραμορφώσεις, αγνοώντας την εκτίμηση φωτομετρικών παραμέτρων. 2.1 ΛΥΣΗ ΠΡΟΒΛΗΜΑΤΟΣ ΒΕΛΤΙΣΤΟΠΟΙΗΣΗΣ Το πρόβλημα βελτιστοποίησης της Σχέσης (3) αποτελεί ένα μη-γραμμικό πρόβλημα. Η προσέγγιση που προτείνεται για την επίλυσή του ανήκει στην κατηγορία των αλγορίθμων διαφορικής αντιστοίχισης (Baker, 2003), οι οποίοι από τη φύση τους είναι επαναληπτικοί και απαιτούν τον υπολογισμό των πρώτων τάξεων παραγώγων της αντικειμενικής συνάρτησης ως προς τις παραμέτρους του γεωμετρικού μετασχηματισμού. Συγκεκριμένα, το αρχικό πρόβλημα βελτιστοποίησης αντικαθίσταται από μια ακολουθία υπο-προβλημάτων, με την επίλυση του καθενός να βασίζεται στο αποτέλεσμα του προηγούμενου. Κάθε υπο-πρόβλημα αποσκοπεί στη βελτιστοποίηση μιας προσέγγισης της αντικειμενικής συνάρτησης, η οποία επιλέγεται έτσι ώστε η βελτιστοποίησή της να είναι υπολογιστικά αποδοτική. Για το σκοπό αυτόν, ας υποθέσουμε ότι έχουμε στη διάθεσή μας μια προσέγγιση p του διανύσματος p, δηλαδή p= p +Δp, όπου Δp το διάνυσμα των άγνωστων διορθώσεων. Τότε, μια προσέγγιση της μετασχηματισμένης εικόνας είναι η ακόλουθη: i ( p) = i ( p + Δp) i ( p ) + G( p ) Δp, (4) όπου το K N μητρώο Ḡ(p ) ορίζει τη μηδενικής μέσης τιμής Ιακωβιανή μήτρα του i ως προς το διάνυσμα παραμέτρων p, υπολογισμένη στη θέση p. Για την αναλυτική μορφή του μητρώου ο ενδιαφερόμενος αναγνώστης παραπέμπεται στις (Baker, 2003), (Evangelidis, 2008). Αντικαθιστώντας την (4) στην (3) και παραλείποντας, για απλότητα στους συμβολισμούς μας, την εξάρτηση των ποσοτήτων από το p, λαμβάνουμε την ακόλουθη προσέγγιση της συνάρτησης κόστους ir i + irgδp ρ( p) = ρ( p + Δp) ρ( Δ p; p ) =. 2 t t t i + 2 i GΔ p + Δp G GΔp Αν και η προσέγγιση του διανύσματος ī (p) της Σχέσης (4) είναι γραμμική ως προς τις διορθώσεις Δp των παραμέτρων, η συνάρτηση ρ(δp;p ) παραμένει μη γραμμική ως προς αυτές. Ωστόσο η μεγιστοποίησή της, όπως προκύπτει από το θεώρημα που ακολουθεί, οδηγεί σε μια κλειστού τύπου λύση (Evangelidis, 2008). t 1 t Θεώρημα 1: Έστω Δp( λ) = ( G G) G ( λˆir i ) η ευθεία του χώρου R K με παράμετρο τη βαθμωτή ποσότητα λ, Ρ G =Ḡ(Ḡ t Ḡ) -1 Ḡ t το K Κ μητρώο προβολής και I K το K Κ μοναδιαίο μητρώο. Τότε η συνάρτηση ρ(δp;p ): i. Αν î t r (I K -P G )ī >0, έχει ολικό μέγιστο στο Δp(λ o ) όπου o λ = 2 G i i i i t i P i P i r r G ii. Aν î t r (I K -P G )ī 0, έχει ελάχιστο άνω φράγμα το οποίο, καθώς κινούμαστε πάνω στην ευθεία Δp(λ), όσο μεγαλύτερη η τιμή της παραμέτρου λ τόσο καλύτερα προσεγγίζεται. Επιπλέον, το ελάχιστο άνω φράγμα της λ, το οποίο εξασφαλίζει συγχρόνως ότι ρ(δp(λ o );p )>ρ(0;p) και ρ(δp(λ o );p ) 0, είναι το t o i PG i irpg i ir i λ = max,. ip r G ir ip r G ir. (5) 1ο Πανελλήνιο Συνέδριο Ρομποτικής, ΤΕΕ, Αθήνα, 23-24 Φεβρουαρίου, 2009 3

Εφόσον ενημερωθεί το διάνυσμα των παραμέτρων, η προσέγγιση της Σχέσης (5) μπορεί να εφαρμοστεί επαναληπτικά μέχρι το μέτρο του διανύσματος διορθώσεων να εκφυλιστεί. Συνεπώς, τα αποτελέσματα του Θεωρήματος 1 μπορούμε να τα προσαρμόσουμε κατάλληλα σε επαναληπτικούς (ή μη) αλγορίθμους για τη λύση προβλημάτων αντιστοίχισης, όπως θα διαπιστώσουμε στην επόμενη ενότητα. 3 ΕΦΑΡΜΟΓΗ ΤΟΥ ECC ΣΕ ΠΡΟΒΛΗΜΑΤΑ ΑΝΤΙΣΤΟΙΧΙΣΗΣ Το σχήμα που παρουσιάστηκε στην προηγούμενη ενότητα δύναται να προσαρμοστεί κατάλληλα και να χρησιμοποιηθεί σε οποιαδήποτε εφαρμογή της υπολογιστικής/ρομποτικής όρασης που εμπεριέχει το πρόβλημα της αντιστοίχισης. Αυτό θα επιχειρήσουμε στη συνέχεια για το θεμελιώδες πρόβλημα της ευθυγράμμισης εικόνων και το πρόβλημα της στερεοσκοπικής αντιστοίχισης. 3.1 ΕΥΘΥΓΡΑΜΜΙΣΗ ΕΙΚΟΝΩΝ Το πρόβλημα της παραμετρικής ευθυγράμμισης εικόνων, όπως αναφέραμε, απαιτεί την εύρεση ενός μέλους μιας οικογένειας μετασχηματισμών, το οποίο «στοιχίζει» δύο εικόνες. Η πιο ευρεία οικογένεια μετασχηματισμών που μπορεί να χρησιμοποιηθεί για ένα δισδιάστατο παραμετρικό μοντέλο φ(x;p) είναι αυτή των ομογραφιών. Η οικογένεια αυτή ουσιαστικά περιλαμβάνει ως υποσύνολα γνωστές οικογένειες μετασχηματισμών όπως συγγένειας, ομοιότητας κ.α. Βάσει των αποτελεσμάτων του Θεωρήματος 1 αναπτύχθηκαν δύο διαφορετικά επαναληπτικά σχήματα, ο αλγόριθμος FA-ECC (Forards Additive ECC) του οποίου η πολυπλοκότητα είναι O(KN 2 ) και ο αποδοτικός υπολογιστικά (O(KN)) αλγόριθμος IC- ECC (Inverse Compositional ECC), ο οποίος βασίζεται στην αντίστροφη λογική (εναλλαγή των ρόλων των δύο εικόνων) και στη σύνθεση μετασχηματισμών για την ενημέρωση των παραμέτρων (Evangelidis, 2008). Οι προτεινόμενοι αλγόριθμοι συγκρίνονται με τα αντίστοιχα σχήματα του αλγορίθμου των Lucas και Kanade, FA-LK και SIC (Baker, 2003), τα οποία αντισταθμίζουν επίσης γραμμικές φωτομετρικές παραμορφώσεις και η πολυπλοκότητά τους είναι O(KN 2 ) και O(Κ(Ν+2) 2 ) αντίστοιχα. Το μοντέλο μετασχηματισμού που χρησιμοποιήθηκε στις προσομοιώσεις είναι αυτό του μετασχηματισμού συγγένειας έξι παραμέτρων (affine transformation), ενώ το πλαίσιο διεξαγωγής των πειραμάτων καθώς και τα μέτρα αξιολόγησης της απόδοσης των αλγορίθμων είναι πανομοιότυπα με αυτά που αναφέρονται στο άρθρο (Baker, 2003). Συνοπτικά αναφέρουμε ότι δημιουργούνται ζεύγη εικόνων έτσι ώστε να είναι διαθέσιμος ο πραγματικός γεωμετρικός μετασχηματισμός, έστω φ(x;p r ). Αν p j είναι η εκτίμηση του p r στη j-οστή επανάληψη, όπου j=1,,j max, τότε το σφάλμα αντιστοίχισης είναι η μέση τιμή της τετραγωνικής απόστασης φ(x;p r )-φ(x;p j ) 2 (Mean Square Distance) για αντιπροσωπευτικά σημεία της περιοχής ενδιαφέροντος. Για την αξιολόγηση των αλγορίθμων απεικονίζουμε τις καμπύλες μάθησης (αφορούν σε ένα υποσύνολο από 5000 συνολικά προσομοιώσεις για το οποίο όλοι οι αλγόριθμοι συγκλίνουν) καθώς και το ποσοστό σύγκλισης των αλγορίθμων ως προς την παράμετρο σ p, η οποία καθορίζει το μέγεθος της γεωμετρικής παραμόρφωσης που έχει προκληθεί. Συγκλίνων αλγόριθμος θεωρείται αυτός για τον οποίο ισχύει MSD(j max )<1pixel 2. Για κάθε ζεύγος εικόνων, πριν την εφαρμογή των αλγορίθμων, η εικόνα αναφοράς παραμορφώνεται φωτομετρικά με βάση το μετασχηματισμό I r (I r +20) 0.9 και στη συνέχεια προστίθεται και στις δύο εικόνες λευκός θόρυβος κατανομής N(0,σ 2 i ), με σ i =8. Από τα αποτελέσματα των προσομοιώσεων (Σχήμα 1) αναδεικνύεται η υπεροχή του FA-ECC αλγορίθμου έναντι των υπολοίπων τριών. Οι FΑ 1ο Πανελλήνιο Συνέδριο Ρομποτικής, ΤΕΕ, Αθήνα, 23-24 Φεβρουαρίου, 2009 4

αλγόριθμοι συγκλίνουν σε χαμηλότερο επίπεδο σε σχέση με τους IC αλγορίθμους, γεγονός το οποίο οφείλεται στην παρουσία θορύβου (Evangelidis, 2008). Ωστόσο, αν και οι αλγόριθμοι IC-ECC και SIC έχουν παρόμοια συμπεριφορά (με υπολογιστικά αποδοτικότερο τον IC-ECC), ο αλγόριθμος FA-ECC υπερέχει σημαντικά έναντι του FA-LK, αφού συγκλίνει ταχύτερα και με μεγαλύτερη πιθανότητα. Αν και για ήπιες γεωμετρικές παραμορφώσεις (σ p <3) η απόδοση των αλγορίθμων δε διαφέρει σημαντικά, για εντονότερες παραμορφώσεις, ενδείκνυται η χρήση του FA-ECC αλγορίθμου. MSD (in db) 15 10 5 0-5 -10-15 -20-25 -30 0 5 10 15 20 25 30 Iteration SIC FA-LK FA-ECC IC-ECC MSD (in db) 20 15 10 5 0-5 -10-15 -20-25 -30 0 5 10 15 20 25 30 Iteration (α) (β) (γ) Σχήμα 1: Καμπύλες μάθησης των αλγορίθμων για (α) σ p =6, (β) σ p =10 και (γ) Ποσοστά σύγκλισης για 1 σ p 10 (j max =30). SIC FA-LK FA-ECC IC-ECC Percentage of Convergence (%) 100 90 80 70 60 50 40 30 20 10 0 SIC FA-LK FA-ECC IC-ECC 1 2 3 4 5 6 7 8 9 10 σ p 3.2 ΣΤΕΡΕΟΣΚΟΠΙΚΗ ΑΝΤΙΣΤΟΙΧΙΣΗ Η στερεοσκοπική αντιστοίχιση αποτελεί την κύρια και πιο απαιτητική υπολογιστικά διαδικασία, αφού απαιτείται η αντιστοίχιση όλων των σημείων του ζεύγους των εικόνων, για την τρισδιάστατη ανακατασκευή μιας σκηνής, της οποίας η καταγραφή γίνεται από δύο αισθητήρες (αριστερός-δεξιός) που αποτελούν ένα κανονικό σύστημα λήψης (Scharstein, 2002). Έτσι, για κάθε σημείο της αριστερής εικόνας (που θεωρούμε συνήθως ως εικόνα αναφοράς) και με κέντρο το σημείο αυτό, ορίζουμε ένα παράθυρο αναφοράς T r ={x k, k=1,...,k} και «αναζητούμε» το «αντίστοιχο» παράθυρο σε ένα υποσύνολο σημείων T ={y k, k=1,...,r} της δεξιάς εικόνας, όπου βέβαια R K. Αυτό διαφοροποιεί κάπως το πρόβλημα της στερεοσκοπικής αντιστοίχισης από το πρόβλημα της ευθυγράμμισης. Ο πληθικός αριθμός του συνόλου T r που ορίζει την περιοχή ενδιαφέροντος της αριστερής εικόνας είναι πολύ μικρότερος από αυτόν του συνόλου T στη δεξιά εικόνα. Η λύση του παραπάνω προβλήματος μπορεί να προκύψει από τη βέλτιστη λύση ενός αριθμού στοιχειωδών προβλημάτων ευθυγράμμισης. Επιπλέον, εξαιτίας της ειδικής γεωμετρίας του συστήματος λήψης, οι προβολές οποιουδήποτε σημείου της σκηνής στις δύο εικόνες έχουν την ίδια τεταγμένη στα συστήματα συντεταγμένων των εικόνων και επομένως το παραμετρικό μοντέλο απλοποιείται σε αυτό της μετατόπισης κατά τον άξονα των τετμημένων. Δηλαδή, φ(x;p)=[x 1 x 2 -p 0 ] t. Επιπροσθέτως, επειδή οι μετατοπίσεις περιορίζονται σε μικρά μεγέθη, δεν απαιτείται επαναληπτική διαδικασία, αφού δε συνεισφέρει αισθητά στη βελτίωση της εκτίμησης της παραμέτρου. Τέλος θα πρέπει να αναφέρουμε ότι σε κάθε στοιχειώδες πρόβλημα ευθυγράμμισης, περιοριζόμαστε στα αποτελέσματα της περίπτωσης-i του Θεωρήματος 1, αφού τα αποτελέσματα της περίπτωσης-ii του θεωρήματος μπορούν να χρησιμοποιηθούν στην αναγνώριση προβληματικών περιοχών, όπως είναι οι αποκλεισμένες και οι ασυνεχούς βάθους περιοχές. Τα αποτελέσματα του προτεινόμενου αλγορίθμου συγκρίνονται με τον αλγόριθμο της παραβολικής παρεμβολής (Anandan, 2005), ο οποίος εδώ συνδυάζεται με τη συνάρτηση κόστους του κλασικού συντελεστή συσχέτισης (NCC-PF). Ο αλγόριθμος αυτός χρησιμοποιείται ευρέως με σκοπό την εκτίμηση ανομοιότητας με ακρίβεια 1ο Πανελλήνιο Συνέδριο Ρομποτικής, ΤΕΕ, Αθήνα, 23-24 Φεβρουαρίου, 2009 5

μικρότερη του εικονοστοιχείου (subpixel accuracy). Οι εικόνες που χρησιμοποιούνται αποτελούν εικόνες αναφοράς για την αποτίμηση της απόδοσης αλγορίθμων στερεοσκοπικής αντιστοίχισης (Scharstein, 2002). Κριτήριο σύγκρισης των αλγορίθμων στο εν λόγω πρόβλημα αποτελεί το ποσοστό αντιστοιχίσεων, για τις οποίες το σφάλμα είναι μεγαλύτερο από ένα κατώφλι δ, όπου δ 1. Τονίζεται ότι, εφόσον στόχος είναι η ακρίβεια της αντιστοίχισης, η τιμή της μετρικής αξιολόγησης αφορά μη αποκλεισμένα και συνεχούς βάθους σημεία της εικόνας αναφοράς. Επίσης, πριν την εφαρμογή των αλγορίθμων οι εικόνες παραμορφώνονται φωτομετρικά με μη γραμμικό τρόπο. Ποσοστά (%) εσφαλμένων αντιστοιχίσεων δ=0,25 δ=0,50 δ=0,75 δ=1,00 NCC-PF ECC NCC-PF ECC NCC-PF ECC NCC-PF ECC Map 24,82 20,18 3,42 3,23 1,35 1,20 1,01 0,82 Satooth 29,69 28,58 9,74 9,40 4,96 4,54 3,07 2,72 Venus 18,13 15,44 6,54 5,72 4,54 4,31 4,02 3,75 Πίνακας 1: Ποσοστά εσφαλμένων αντιστοιχίσεων Τα αποτελέσματα της εφαρμογής των αλγορίθμων παρουσιάζονται στον Πίνακα 1, από όπου επιβεβαιώνεται η υπεροχή του αλγορίθμου ECC. Το μέγεθος παραθύρου που χρησιμοποιήθηκε είναι 7 7 (Map) και 11 11 (Satooth, Venus). Αξίζει να σημειωθεί ότι, εκτός της βελτιωμένης ακρίβειας αντιστοίχισης που επιτυγχάνει ο προτεινόμενος αλγόριθμος, φαίνεται επίσης να μην υποφέρει από το φαινόμενο pixel locking, σε αντίθεση με τον αλγόριθμο παραβολικής παρεμβολής (Psarakis, 2005). 4 ΣΥΜΠΕΡΑΣΜΑΤΑ Στο άρθρο αυτό παρουσιάσαμε έναν αλγόριθμο παραμετρικής διαφορικής αντιστοίχισης, ο οποίος κάνει χρήση του τροποποιημένου συντελεστή συσχέτισης (ECC) ως συνάρτησης κόστους. Αν και η συνάρτηση αυτή είναι μη γραμμική ως προς το διάνυσμα των παραμέτρων, η βελτιστοποίησή της οδηγεί σε κλειστού τύπου λύση. Ο προτεινόμενος αλγόριθμος εφαρμόστηκε, κατάλληλα προσαρμοσμένος, σε προβλήματα ευθυγράμμισης εικόνων και στερεοσκοπικής αντιστοίχισης. Από τα αποτελέσματα των προσομοιώσεων διαπιστώθηκε η υπεροχή του έναντι των πιο διαδεδομένων στη διεθνή βιβλιογραφία αλγορίθμων, των οποίων οι αποδόσεις αποτελούν σημεία αναφοράς στα αντίστοιχα πεδία της υπολογιστικής όρασης. 5 ΒΙΒΛΙΟΓΡΑΦΙΑ Anandan, P. (1989), A computational frameork and an algorithm for the measurement of visual motion, Int. J. of Computer Vision, vol. 2. no. 3.pp. 283-310. Baker, S. et al (2003), Lukas-Kanade 20 years on: A unifying frameork: Part3 Carnegie Mellon University, Tech. Rep. CMU-RI-TR-03-35. Evangelidis, G.D, Psarakis, E.Z. (2008), Parametric image alignment algorithm based on correlation coefficient maximization, IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 30, no. 10, pp. 1858-1865 Psarakis, E.Z., Evangelidis, G.D. (2005) An enhanced Correlation-Based Method for Stereo Correspondence ith Subpixel Accuracy 10 th IEEE International Conference on Computer Vision, Beijing, China. D. Scharstein and R. Szeliski. (2002) A taxonomy and evaluation of dence toframe stereo correspondence algorithms Int. J. of Computer Vision, vol. 47, no. 1-3, pp. 7-42 1ο Πανελλήνιο Συνέδριο Ρομποτικής, ΤΕΕ, Αθήνα, 23-24 Φεβρουαρίου, 2009 6