ΠΑΡΑΜΕΤΡΙΚΗ ΑΝΤΙΣΤΟΙΧΙΣΗ ΕΙΚΟΝΩΝ ΣΤΗΝ ΥΠΟΛΟΓΙΣΤΙΚΗ ΟΡΑΣΗ Γεώργιος Δ. Ευαγγελίδης και Εμμανουήλ Ζ. Ψαράκης Εργαστήριο Επεξεργασίας Σημάτων & Τηλεπικοινωνιών, Τμήμα Μηχανικών Η/Υ & Πληροφορικής, Πανεπιστήμιο Πατρών, 26504, Ρίο, Πάτρα ΠΕΡΙΛΗΨΗ Το πρόβλημα της παραμετρικής αντιστοίχισης εικόνων αποτελεί ένα από τα κυριότερα προβλήματα στο πεδίο της υπολογιστικής όρασης. Η επίλυσή του απαίτει τον καθορισμό ενός μοντέλου μετασχηματισμών και ενός κριτηρίου ομοιότητας, από τη βελτιστοποίηση του οποίου προκύπτει η εκτίμηση των παραμέτρων του μοντέλου. Δύο απαραίτητα χαρακτηριστικά των κριτηρίων που χρησιμοποιούνται σε προβλήματα αντίστοιχισης είναι η ακρίβεια υπο-εικονοστοιχείου και η αμεταβλητότητά τους σε φωτομετρικές παραμορφώσεις. Στο άρθρο αυτό, ένα πρόσφατα προταθέν κριτήριο που διαθέτει τα παραπάνω χαρακτηριστικά, χρησιμοποιείται σε αλγορίθμους αντιστοίχισης εικόνων και αναδεικνύεται η υπεροχή του έναντι άλλων γνωστών στη βιβλιογραφία κριτηρίων. Λέξεις κλειδιά: Ευθυγράμμιση εικόνων, αντιστοίχιση εικόνων, συντελεστής συσχέτισης, μη-γραμμική βελτιστοποίηση, ακρίβεια υπο-εικονοστοιχείου 1 ΕΙΣΑΓΩΓΗ Τα τελευταία χρόνια τα ρομποτικά ή/και υπολογιστικά συστήματα εξοπλίζονται με αισθητήρες όρασης, με σκοπό να αποκτήσουν την (ψευδ)αίσθηση της όρασης και της αντίληψης του χώρου ή την ικανότητα να εξάγουν πληροφορίες από πραγματικές εικόνες. Η λειτουργία των συστημάτων αυτών απαιτεί πολύ συχνά την επίλυση προβλημάτων αντιστοίχισης εικόνων. Στα προβλήματα αυτά αναζητούνται σημεία σε δύο ή περισσότερες εικόνες, τα οποία αποτελούν προβολές του ίδιου σημείου της σκηνής. Το πρόβλημα αντιστοίχισης ανάγεται συνήθως σε ένα ή περισσότερα επιμέρους προβλήματα ευθυγράμμισης εικόνων. Συνεπώς, το πρόβλημα ευθυγράμμισης αποτελεί το θεμελιώδες πρόβλημα αντιστοίχισης. Το παραμετρικό πρόβλημα ευθυγράμμισης απαιτεί την εύρεση ενός μέλους μιας οικογένειας γεωμετρικών μετασχηματισμών, το οποίο στοιχίζει, με κάποια βέλτιστη έννοια, δύο εικόνες που η μία αποτελεί γεωμετρικά παραμορφωμένη εκδοχή της άλλης. Είναι προφανές ότι η χρήση παραμετρικού μοντέλου ανάγει το πρόβλημα ευθυγράμμισης σε ένα πρόβλημα εκτίμησης παραμέτρων, ενώ η ποιότητα των βέλτιστων εκτιμήσεων και το κόστος επίλυσης του προβλήματος εξαρτώνται από το εκάστοτε κριτήριο που χρησιμοποιείται για την εκτίμηση των παραμέτρων. Σημαντικές προϋποθέσεις για την καταλληλότητα χρήσης ενός κριτηρίου σε έναν αλγόριθμο ευθυγράμμισης αποτελούν η δυνατότητα αντιστοιχίσεων μεγάλης ακρίβειας και η αμεταβλητότητά του σε φωτομετρικές παραμορφώσεις (Baker, 2003), (Psarakis, 2005). Στο παρόν άρθρο, για την επίλυση του εν λόγω προβλήματος, χρησιμοποιείται ένα πρόσφατα προταθέν κριτήριο, το οποίο βασίζεται σε μια μορφή του συντελεστή συσχέτισης (Psarakis, 2005), γεγονός που το καθιστά αμετάβλητο σε γραμμικές φωτομετρικές παραμορφώσεις. Στο κριτήριο αυτό έχει καταλλήλα ενσωματωθεί το 1ο Πανελλήνιο Συνέδριο Ρομποτικής, ΤΕΕ, Αθήνα, 23-24 Φεβρουαρίου, 2009 1
παραμετρικό μοντέλο του γεωμετρικού μετασχηματισμού. Για τη λύση του προκύπτοντος μη γραμμικού προβλήματος βελτιστοποίησης, προτείνεται ένα επαναληπτικό σχήμα που χρησιμοποιεί κλειστού τύπου λύση σε κάθε επανάληψη. Η εφαρμογή του σχήματος στα προβλήματα της ευθυγράμμισης εικόνων και της στερεοσκοπικής αντιστοίχισης αναδεικύει τα πλεονεκτήματά του έναντι σχημάτων που αποτελούν σημεία αναφοράς στη βιβλιογραφία. 2 ΔΙΑΤΥΠΩΣΗ ΠΡΟΒΛΗΜΑΤΟΣ ΚΑΙ ΠΡΟΤΕΙΝΟΜΕΝΟ ΚΡΙΤΗΡΙΟ Έστω ότι δίνονται δύο εικόνες I r (x), I (y) μιας σκηνής, όπου x=[x 1,x 2 ] t, y=[y 1,y 2 ] t, είναι οι συντεταγμένες των εικονοστοιχείων τους αντίστοιχα. Η εικόνα I r (x) καλείται εικόνα αναφοράς (reference-template image) ενώ η εικόνα I (y) καλείται μετασχηματισμένη εικόνα (arped image). Έστω επίσης ότι το σύνολο σημείων T r ={x k, k=1,...,k} της εικόνας αναφοράς ορίζει την περιοχή ενδιαφέροντος. Το πρόβλημα της αντιστοίχισης εικόνων ουσιαστικά αποσκοπεί στην εύρεση του αντίστοιχου συνόλου σημείων T ={y k, k=1,...,k} στην μετασχηματισμένη εικόνα. Για αυτόν το σκοπό θεωρούμε ότι η αντιστοίχιση των παραπάνω συνόλων μπορεί να μοντελοποιηθεί από τη σχέση y=φ(x;p) όπου φ: R 2 R 2 μια καλώς ορισμένη διανυσματική συνάρτηση και p=[p 1,,p N ] t ένα διάνυσμα άγνωστων παραμέτρων. Σύμφωνα με την υπόθεση σταθερής φωτεινότητας (Anandan, 1989), το πρόβλημα της αντιστοίχισης ανάγεται στο πρόβλημα εκτίμησης των παραμέτρων p, έτσι ώστε Ir( x) = I( φ( x; p)), x T. r (1) Η πλειοψηφία των αλγορίθμων αποσκοπεί στην ελαχιστοποίηση της ανομοιότητας μεταξύ των δύο προφίλ. Η ανομοιότητα ορίζεται με τη βοήθεια μιας αντικειμενικής συνάρτησης (μετρικής) E(p), η οποία τις περισσότερες φορές είναι η l 2 νόρμα των διαφορών έντασης φωτεινότητας των δύο εικόνων (Anandan, 1989), (Baker, 2003). Επιπλέον, για την αντιστάθμιση φωτομετρικών παραμορφώσεων, η παραπάνω μετρική εμπλουτίζεται συχνά με κατάλληλες φωτομετρικές παραμέτρους (Baker, 2003). Στη συνέχεια, για λόγους ευκολίας, θα αντιμετωπίζουμε τις εικόνες ως διανύσματα. Για το σκοπό αυτόν, αν y k (p)=φ(x k ;p), k=1,,k είναι τα σημεία του συνόλου T (αντίστοιχα των σημείων x k του συνόλου T r ), τότε τα διανύσματα i r =[I r (x 1 ),, I r (x K )] t, i (p)=[i (y 1 (p)),, I (y K (p))] t θα αποτελούν τις διανυσματικές αναπαραστάσεις των αντίστοιχων εικόνων στο χώρο R K. Η συνάρτηση κόστους που προτείνεται για την ποσοτικοποίηση απόδοσης της εφαρμογής του γεωμετρικού μετασχηματισμού, είναι η ακόλουθη ρ ( p) = ˆi t r i ( p) i ( p) όπου x, x και x^ συμβολίζουν το μηδενικής μέσης τιμής διάνυσμα x, την ευκλείδεια νόρμα του και το κανονικοποιημένο διάνυσμα. Η παραπάνω συνάρτηση καλείται τροποποιημένος συντελεστής συσχέτισης (Enhanced Correlation Coefficient-ECC). Για τη σχέση του ECC με άλλες πολύ γνωστές στη βιβλιογραφία συναρτήσεις κόστους που χρησιμοποιούνται στο πρόβλημα της αντιστοίχισης, ο ενδιαφερόμενος αναγνώστης παραπέμπεται στην (Evangelidis, 2008). Συνεπώς, στόχος είναι η επίλυση του ακόλουθου προβλήματος βελτιστοποίησης: max ρ ( p ). (3) p (2) 1ο Πανελλήνιο Συνέδριο Ρομποτικής, ΤΕΕ, Αθήνα, 23-24 Φεβρουαρίου, 2009 2
Από τη (2) επιβεβαιώνεται εύκολα η αμεταβλητότητα της συνάρτησης ρ(p) σε γραμμικούς μετασχηματισμούς της φωτεινότητας των εικόνων, κάτι που σημαίνει ότι η προτεινόμενη συνάρτηση κόστους μας επιτρέπει να επικεντρωθούμε σε γεωμετρικές παραμορφώσεις, αγνοώντας την εκτίμηση φωτομετρικών παραμέτρων. 2.1 ΛΥΣΗ ΠΡΟΒΛΗΜΑΤΟΣ ΒΕΛΤΙΣΤΟΠΟΙΗΣΗΣ Το πρόβλημα βελτιστοποίησης της Σχέσης (3) αποτελεί ένα μη-γραμμικό πρόβλημα. Η προσέγγιση που προτείνεται για την επίλυσή του ανήκει στην κατηγορία των αλγορίθμων διαφορικής αντιστοίχισης (Baker, 2003), οι οποίοι από τη φύση τους είναι επαναληπτικοί και απαιτούν τον υπολογισμό των πρώτων τάξεων παραγώγων της αντικειμενικής συνάρτησης ως προς τις παραμέτρους του γεωμετρικού μετασχηματισμού. Συγκεκριμένα, το αρχικό πρόβλημα βελτιστοποίησης αντικαθίσταται από μια ακολουθία υπο-προβλημάτων, με την επίλυση του καθενός να βασίζεται στο αποτέλεσμα του προηγούμενου. Κάθε υπο-πρόβλημα αποσκοπεί στη βελτιστοποίηση μιας προσέγγισης της αντικειμενικής συνάρτησης, η οποία επιλέγεται έτσι ώστε η βελτιστοποίησή της να είναι υπολογιστικά αποδοτική. Για το σκοπό αυτόν, ας υποθέσουμε ότι έχουμε στη διάθεσή μας μια προσέγγιση p του διανύσματος p, δηλαδή p= p +Δp, όπου Δp το διάνυσμα των άγνωστων διορθώσεων. Τότε, μια προσέγγιση της μετασχηματισμένης εικόνας είναι η ακόλουθη: i ( p) = i ( p + Δp) i ( p ) + G( p ) Δp, (4) όπου το K N μητρώο Ḡ(p ) ορίζει τη μηδενικής μέσης τιμής Ιακωβιανή μήτρα του i ως προς το διάνυσμα παραμέτρων p, υπολογισμένη στη θέση p. Για την αναλυτική μορφή του μητρώου ο ενδιαφερόμενος αναγνώστης παραπέμπεται στις (Baker, 2003), (Evangelidis, 2008). Αντικαθιστώντας την (4) στην (3) και παραλείποντας, για απλότητα στους συμβολισμούς μας, την εξάρτηση των ποσοτήτων από το p, λαμβάνουμε την ακόλουθη προσέγγιση της συνάρτησης κόστους ir i + irgδp ρ( p) = ρ( p + Δp) ρ( Δ p; p ) =. 2 t t t i + 2 i GΔ p + Δp G GΔp Αν και η προσέγγιση του διανύσματος ī (p) της Σχέσης (4) είναι γραμμική ως προς τις διορθώσεις Δp των παραμέτρων, η συνάρτηση ρ(δp;p ) παραμένει μη γραμμική ως προς αυτές. Ωστόσο η μεγιστοποίησή της, όπως προκύπτει από το θεώρημα που ακολουθεί, οδηγεί σε μια κλειστού τύπου λύση (Evangelidis, 2008). t 1 t Θεώρημα 1: Έστω Δp( λ) = ( G G) G ( λˆir i ) η ευθεία του χώρου R K με παράμετρο τη βαθμωτή ποσότητα λ, Ρ G =Ḡ(Ḡ t Ḡ) -1 Ḡ t το K Κ μητρώο προβολής και I K το K Κ μοναδιαίο μητρώο. Τότε η συνάρτηση ρ(δp;p ): i. Αν î t r (I K -P G )ī >0, έχει ολικό μέγιστο στο Δp(λ o ) όπου o λ = 2 G i i i i t i P i P i r r G ii. Aν î t r (I K -P G )ī 0, έχει ελάχιστο άνω φράγμα το οποίο, καθώς κινούμαστε πάνω στην ευθεία Δp(λ), όσο μεγαλύτερη η τιμή της παραμέτρου λ τόσο καλύτερα προσεγγίζεται. Επιπλέον, το ελάχιστο άνω φράγμα της λ, το οποίο εξασφαλίζει συγχρόνως ότι ρ(δp(λ o );p )>ρ(0;p) και ρ(δp(λ o );p ) 0, είναι το t o i PG i irpg i ir i λ = max,. ip r G ir ip r G ir. (5) 1ο Πανελλήνιο Συνέδριο Ρομποτικής, ΤΕΕ, Αθήνα, 23-24 Φεβρουαρίου, 2009 3
Εφόσον ενημερωθεί το διάνυσμα των παραμέτρων, η προσέγγιση της Σχέσης (5) μπορεί να εφαρμοστεί επαναληπτικά μέχρι το μέτρο του διανύσματος διορθώσεων να εκφυλιστεί. Συνεπώς, τα αποτελέσματα του Θεωρήματος 1 μπορούμε να τα προσαρμόσουμε κατάλληλα σε επαναληπτικούς (ή μη) αλγορίθμους για τη λύση προβλημάτων αντιστοίχισης, όπως θα διαπιστώσουμε στην επόμενη ενότητα. 3 ΕΦΑΡΜΟΓΗ ΤΟΥ ECC ΣΕ ΠΡΟΒΛΗΜΑΤΑ ΑΝΤΙΣΤΟΙΧΙΣΗΣ Το σχήμα που παρουσιάστηκε στην προηγούμενη ενότητα δύναται να προσαρμοστεί κατάλληλα και να χρησιμοποιηθεί σε οποιαδήποτε εφαρμογή της υπολογιστικής/ρομποτικής όρασης που εμπεριέχει το πρόβλημα της αντιστοίχισης. Αυτό θα επιχειρήσουμε στη συνέχεια για το θεμελιώδες πρόβλημα της ευθυγράμμισης εικόνων και το πρόβλημα της στερεοσκοπικής αντιστοίχισης. 3.1 ΕΥΘΥΓΡΑΜΜΙΣΗ ΕΙΚΟΝΩΝ Το πρόβλημα της παραμετρικής ευθυγράμμισης εικόνων, όπως αναφέραμε, απαιτεί την εύρεση ενός μέλους μιας οικογένειας μετασχηματισμών, το οποίο «στοιχίζει» δύο εικόνες. Η πιο ευρεία οικογένεια μετασχηματισμών που μπορεί να χρησιμοποιηθεί για ένα δισδιάστατο παραμετρικό μοντέλο φ(x;p) είναι αυτή των ομογραφιών. Η οικογένεια αυτή ουσιαστικά περιλαμβάνει ως υποσύνολα γνωστές οικογένειες μετασχηματισμών όπως συγγένειας, ομοιότητας κ.α. Βάσει των αποτελεσμάτων του Θεωρήματος 1 αναπτύχθηκαν δύο διαφορετικά επαναληπτικά σχήματα, ο αλγόριθμος FA-ECC (Forards Additive ECC) του οποίου η πολυπλοκότητα είναι O(KN 2 ) και ο αποδοτικός υπολογιστικά (O(KN)) αλγόριθμος IC- ECC (Inverse Compositional ECC), ο οποίος βασίζεται στην αντίστροφη λογική (εναλλαγή των ρόλων των δύο εικόνων) και στη σύνθεση μετασχηματισμών για την ενημέρωση των παραμέτρων (Evangelidis, 2008). Οι προτεινόμενοι αλγόριθμοι συγκρίνονται με τα αντίστοιχα σχήματα του αλγορίθμου των Lucas και Kanade, FA-LK και SIC (Baker, 2003), τα οποία αντισταθμίζουν επίσης γραμμικές φωτομετρικές παραμορφώσεις και η πολυπλοκότητά τους είναι O(KN 2 ) και O(Κ(Ν+2) 2 ) αντίστοιχα. Το μοντέλο μετασχηματισμού που χρησιμοποιήθηκε στις προσομοιώσεις είναι αυτό του μετασχηματισμού συγγένειας έξι παραμέτρων (affine transformation), ενώ το πλαίσιο διεξαγωγής των πειραμάτων καθώς και τα μέτρα αξιολόγησης της απόδοσης των αλγορίθμων είναι πανομοιότυπα με αυτά που αναφέρονται στο άρθρο (Baker, 2003). Συνοπτικά αναφέρουμε ότι δημιουργούνται ζεύγη εικόνων έτσι ώστε να είναι διαθέσιμος ο πραγματικός γεωμετρικός μετασχηματισμός, έστω φ(x;p r ). Αν p j είναι η εκτίμηση του p r στη j-οστή επανάληψη, όπου j=1,,j max, τότε το σφάλμα αντιστοίχισης είναι η μέση τιμή της τετραγωνικής απόστασης φ(x;p r )-φ(x;p j ) 2 (Mean Square Distance) για αντιπροσωπευτικά σημεία της περιοχής ενδιαφέροντος. Για την αξιολόγηση των αλγορίθμων απεικονίζουμε τις καμπύλες μάθησης (αφορούν σε ένα υποσύνολο από 5000 συνολικά προσομοιώσεις για το οποίο όλοι οι αλγόριθμοι συγκλίνουν) καθώς και το ποσοστό σύγκλισης των αλγορίθμων ως προς την παράμετρο σ p, η οποία καθορίζει το μέγεθος της γεωμετρικής παραμόρφωσης που έχει προκληθεί. Συγκλίνων αλγόριθμος θεωρείται αυτός για τον οποίο ισχύει MSD(j max )<1pixel 2. Για κάθε ζεύγος εικόνων, πριν την εφαρμογή των αλγορίθμων, η εικόνα αναφοράς παραμορφώνεται φωτομετρικά με βάση το μετασχηματισμό I r (I r +20) 0.9 και στη συνέχεια προστίθεται και στις δύο εικόνες λευκός θόρυβος κατανομής N(0,σ 2 i ), με σ i =8. Από τα αποτελέσματα των προσομοιώσεων (Σχήμα 1) αναδεικνύεται η υπεροχή του FA-ECC αλγορίθμου έναντι των υπολοίπων τριών. Οι FΑ 1ο Πανελλήνιο Συνέδριο Ρομποτικής, ΤΕΕ, Αθήνα, 23-24 Φεβρουαρίου, 2009 4
αλγόριθμοι συγκλίνουν σε χαμηλότερο επίπεδο σε σχέση με τους IC αλγορίθμους, γεγονός το οποίο οφείλεται στην παρουσία θορύβου (Evangelidis, 2008). Ωστόσο, αν και οι αλγόριθμοι IC-ECC και SIC έχουν παρόμοια συμπεριφορά (με υπολογιστικά αποδοτικότερο τον IC-ECC), ο αλγόριθμος FA-ECC υπερέχει σημαντικά έναντι του FA-LK, αφού συγκλίνει ταχύτερα και με μεγαλύτερη πιθανότητα. Αν και για ήπιες γεωμετρικές παραμορφώσεις (σ p <3) η απόδοση των αλγορίθμων δε διαφέρει σημαντικά, για εντονότερες παραμορφώσεις, ενδείκνυται η χρήση του FA-ECC αλγορίθμου. MSD (in db) 15 10 5 0-5 -10-15 -20-25 -30 0 5 10 15 20 25 30 Iteration SIC FA-LK FA-ECC IC-ECC MSD (in db) 20 15 10 5 0-5 -10-15 -20-25 -30 0 5 10 15 20 25 30 Iteration (α) (β) (γ) Σχήμα 1: Καμπύλες μάθησης των αλγορίθμων για (α) σ p =6, (β) σ p =10 και (γ) Ποσοστά σύγκλισης για 1 σ p 10 (j max =30). SIC FA-LK FA-ECC IC-ECC Percentage of Convergence (%) 100 90 80 70 60 50 40 30 20 10 0 SIC FA-LK FA-ECC IC-ECC 1 2 3 4 5 6 7 8 9 10 σ p 3.2 ΣΤΕΡΕΟΣΚΟΠΙΚΗ ΑΝΤΙΣΤΟΙΧΙΣΗ Η στερεοσκοπική αντιστοίχιση αποτελεί την κύρια και πιο απαιτητική υπολογιστικά διαδικασία, αφού απαιτείται η αντιστοίχιση όλων των σημείων του ζεύγους των εικόνων, για την τρισδιάστατη ανακατασκευή μιας σκηνής, της οποίας η καταγραφή γίνεται από δύο αισθητήρες (αριστερός-δεξιός) που αποτελούν ένα κανονικό σύστημα λήψης (Scharstein, 2002). Έτσι, για κάθε σημείο της αριστερής εικόνας (που θεωρούμε συνήθως ως εικόνα αναφοράς) και με κέντρο το σημείο αυτό, ορίζουμε ένα παράθυρο αναφοράς T r ={x k, k=1,...,k} και «αναζητούμε» το «αντίστοιχο» παράθυρο σε ένα υποσύνολο σημείων T ={y k, k=1,...,r} της δεξιάς εικόνας, όπου βέβαια R K. Αυτό διαφοροποιεί κάπως το πρόβλημα της στερεοσκοπικής αντιστοίχισης από το πρόβλημα της ευθυγράμμισης. Ο πληθικός αριθμός του συνόλου T r που ορίζει την περιοχή ενδιαφέροντος της αριστερής εικόνας είναι πολύ μικρότερος από αυτόν του συνόλου T στη δεξιά εικόνα. Η λύση του παραπάνω προβλήματος μπορεί να προκύψει από τη βέλτιστη λύση ενός αριθμού στοιχειωδών προβλημάτων ευθυγράμμισης. Επιπλέον, εξαιτίας της ειδικής γεωμετρίας του συστήματος λήψης, οι προβολές οποιουδήποτε σημείου της σκηνής στις δύο εικόνες έχουν την ίδια τεταγμένη στα συστήματα συντεταγμένων των εικόνων και επομένως το παραμετρικό μοντέλο απλοποιείται σε αυτό της μετατόπισης κατά τον άξονα των τετμημένων. Δηλαδή, φ(x;p)=[x 1 x 2 -p 0 ] t. Επιπροσθέτως, επειδή οι μετατοπίσεις περιορίζονται σε μικρά μεγέθη, δεν απαιτείται επαναληπτική διαδικασία, αφού δε συνεισφέρει αισθητά στη βελτίωση της εκτίμησης της παραμέτρου. Τέλος θα πρέπει να αναφέρουμε ότι σε κάθε στοιχειώδες πρόβλημα ευθυγράμμισης, περιοριζόμαστε στα αποτελέσματα της περίπτωσης-i του Θεωρήματος 1, αφού τα αποτελέσματα της περίπτωσης-ii του θεωρήματος μπορούν να χρησιμοποιηθούν στην αναγνώριση προβληματικών περιοχών, όπως είναι οι αποκλεισμένες και οι ασυνεχούς βάθους περιοχές. Τα αποτελέσματα του προτεινόμενου αλγορίθμου συγκρίνονται με τον αλγόριθμο της παραβολικής παρεμβολής (Anandan, 2005), ο οποίος εδώ συνδυάζεται με τη συνάρτηση κόστους του κλασικού συντελεστή συσχέτισης (NCC-PF). Ο αλγόριθμος αυτός χρησιμοποιείται ευρέως με σκοπό την εκτίμηση ανομοιότητας με ακρίβεια 1ο Πανελλήνιο Συνέδριο Ρομποτικής, ΤΕΕ, Αθήνα, 23-24 Φεβρουαρίου, 2009 5
μικρότερη του εικονοστοιχείου (subpixel accuracy). Οι εικόνες που χρησιμοποιούνται αποτελούν εικόνες αναφοράς για την αποτίμηση της απόδοσης αλγορίθμων στερεοσκοπικής αντιστοίχισης (Scharstein, 2002). Κριτήριο σύγκρισης των αλγορίθμων στο εν λόγω πρόβλημα αποτελεί το ποσοστό αντιστοιχίσεων, για τις οποίες το σφάλμα είναι μεγαλύτερο από ένα κατώφλι δ, όπου δ 1. Τονίζεται ότι, εφόσον στόχος είναι η ακρίβεια της αντιστοίχισης, η τιμή της μετρικής αξιολόγησης αφορά μη αποκλεισμένα και συνεχούς βάθους σημεία της εικόνας αναφοράς. Επίσης, πριν την εφαρμογή των αλγορίθμων οι εικόνες παραμορφώνονται φωτομετρικά με μη γραμμικό τρόπο. Ποσοστά (%) εσφαλμένων αντιστοιχίσεων δ=0,25 δ=0,50 δ=0,75 δ=1,00 NCC-PF ECC NCC-PF ECC NCC-PF ECC NCC-PF ECC Map 24,82 20,18 3,42 3,23 1,35 1,20 1,01 0,82 Satooth 29,69 28,58 9,74 9,40 4,96 4,54 3,07 2,72 Venus 18,13 15,44 6,54 5,72 4,54 4,31 4,02 3,75 Πίνακας 1: Ποσοστά εσφαλμένων αντιστοιχίσεων Τα αποτελέσματα της εφαρμογής των αλγορίθμων παρουσιάζονται στον Πίνακα 1, από όπου επιβεβαιώνεται η υπεροχή του αλγορίθμου ECC. Το μέγεθος παραθύρου που χρησιμοποιήθηκε είναι 7 7 (Map) και 11 11 (Satooth, Venus). Αξίζει να σημειωθεί ότι, εκτός της βελτιωμένης ακρίβειας αντιστοίχισης που επιτυγχάνει ο προτεινόμενος αλγόριθμος, φαίνεται επίσης να μην υποφέρει από το φαινόμενο pixel locking, σε αντίθεση με τον αλγόριθμο παραβολικής παρεμβολής (Psarakis, 2005). 4 ΣΥΜΠΕΡΑΣΜΑΤΑ Στο άρθρο αυτό παρουσιάσαμε έναν αλγόριθμο παραμετρικής διαφορικής αντιστοίχισης, ο οποίος κάνει χρήση του τροποποιημένου συντελεστή συσχέτισης (ECC) ως συνάρτησης κόστους. Αν και η συνάρτηση αυτή είναι μη γραμμική ως προς το διάνυσμα των παραμέτρων, η βελτιστοποίησή της οδηγεί σε κλειστού τύπου λύση. Ο προτεινόμενος αλγόριθμος εφαρμόστηκε, κατάλληλα προσαρμοσμένος, σε προβλήματα ευθυγράμμισης εικόνων και στερεοσκοπικής αντιστοίχισης. Από τα αποτελέσματα των προσομοιώσεων διαπιστώθηκε η υπεροχή του έναντι των πιο διαδεδομένων στη διεθνή βιβλιογραφία αλγορίθμων, των οποίων οι αποδόσεις αποτελούν σημεία αναφοράς στα αντίστοιχα πεδία της υπολογιστικής όρασης. 5 ΒΙΒΛΙΟΓΡΑΦΙΑ Anandan, P. (1989), A computational frameork and an algorithm for the measurement of visual motion, Int. J. of Computer Vision, vol. 2. no. 3.pp. 283-310. Baker, S. et al (2003), Lukas-Kanade 20 years on: A unifying frameork: Part3 Carnegie Mellon University, Tech. Rep. CMU-RI-TR-03-35. Evangelidis, G.D, Psarakis, E.Z. (2008), Parametric image alignment algorithm based on correlation coefficient maximization, IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 30, no. 10, pp. 1858-1865 Psarakis, E.Z., Evangelidis, G.D. (2005) An enhanced Correlation-Based Method for Stereo Correspondence ith Subpixel Accuracy 10 th IEEE International Conference on Computer Vision, Beijing, China. D. Scharstein and R. Szeliski. (2002) A taxonomy and evaluation of dence toframe stereo correspondence algorithms Int. J. of Computer Vision, vol. 47, no. 1-3, pp. 7-42 1ο Πανελλήνιο Συνέδριο Ρομποτικής, ΤΕΕ, Αθήνα, 23-24 Φεβρουαρίου, 2009 6