1 ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΚΕΝΤΡΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ ΕΔΡΑ ΣΕΡΡΕΣ ΣΧΟΛΗ ΤΕΧΝΟΛΟΓΙΚΩΝ ΕΦΑΡΜΟΓΩΝ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΠΛΗΡΟΦΟΡΙΚΗΣ Τ.Ε. ΑΝΑΠΤΥΞΗ ΣΥΣΤΗΜΑΤΟΣ ΜΗΧΑΝΙΚΗΣ ΟΡΑΣΗΣ ΜΕ ΔΥΟ ΚΑΜΕΡΕΣ ΚΑΙ ΑΝΙΧΝΕΥΣΗ ΒΑΘΟΥΣ ΜΕ ΤΗ ΒΟΗΘΕΙΑ ΣΤΕΡΕΟΣΚΟΠΙΚΟΥ ΑΛΓΟΡΙΘΜΟΥ Πτυχιακή εργασία του Παναγιώτη Λάζου (2370) Επιβλέπων: Δρ. Ι. Καλόμοιρος, Επίκουρος Καθηγητής ΣΕΡΡΕΣ, ΜΑΙΟΣ 2015
2 Υπεύθυνη δήλωση Υπεύθυνη δήλωση: Βεβαιώνω ότι είμαι συγγραφέας αυτής της πτυχιακής εργασίας και ότι κάθε βοήθεια την οποία είχα για την προετοιμασία της, είναι πλήρως αναγνωρισμένη και αναφέρεται στην πτυχιακή εργασία. Επίσης έχω αναφέρει τις όποιες πηγές, από τις οποίες έκανα χρήση δεδομένων, ιδεών ή λέξεων, είτε αυτές αναφέρονται ακριβώς είτε παραφρασμένες. Επίσης, βεβαιώνω ότι αυτή η πτυχιακή εργασία προετοιμάστηκε από εμένα προσωπικά ειδικά για τις απαιτήσεις του προγράμματος σπουδών του τμήματος Μηχανικών Πληροφορικής του Τ.Ε.Ι Κεντρικής Μακεδονίας με έδρα τις Σέρρες.
3 Σύνοψη Η εξέλιξη της τεχνολογίας συνετέλεσε στην βελτίωση της αποδοτικότητας της καθημερινής μας εργασίας, μέσα από τον καλύτερο και μικρότερο σε κόστος εξοπλισμό που έχουμε προς χρήση. Ένα πεδίο, στο οποίο έγιναν αξιόλογα βήματα, είναι το πεδίο της φωτογραφίας, με την ωρίμανση της τεχνολογίας και των ψηφιακών μέσων. Είναι γνωστό, ότι κατά την καταγραφή μιας φυσικής σκηνής, χάνεται η πληροφορία του βάθους, μια πληροφορία που ενδεχομένως για εμάς θα ήταν χρήσιμη. Το πρόβλημα της απώλειας της πληροφορίας του βάθους ήρθε να μας το λύσει ένα ερευνητικό πεδίο της ρομποτικής όρασης, η στερεοσκοπική όραση, η οποία βασίζεται στην ύπαρξη δύο καμερών και στην χρήση αυτών, για την εύρεση του βάθους των σημείων της σκηνής. Στη συγκεκριμένη πτυχιακή εργασία έχει αναπτυχθεί ένα στερεοσκοπικό σύστημα δύο καμερών, με τη βοήθεια του οποίου είναι δυνατή η ανάπλαση της σκηνής. Για την στήριξη των καμερών χρειάστηκε να αναπτυχθεί κατάλληλη οπτική τράπεζα στήριξης, με τη δυνατότητα μικρομετρικών ρυθμίσεων, για την σωστή τοποθέτηση των καμερών. Επίσης έχει υλοποιηθεί στο Matlab ένας από τους πιο βασικούς στερεοσκοπικούς αλγορίθμους για την εύρεση αντιστοιχιών, με την βοήθεια του οποίου δοκιμάστηκε το στερεοσκοπικό σύστημα για τη σωστή λειτουργία του. Το οπτικό σύστημα αυτό συνδέθηκε σε υπολογιστή, με τη βοήθεια κατάλληλης κάρτας σύλληψης πλαισίων, και πραγματοποιήθηκε επεξεργασία σε μία σειρά από στερεοσκοπικά ζεύγη για την παραγωγή του χάρτη βάθους αυτών.
4 ΠΕΡΙΕΧΟΜΕΝΑ Υπεύθυνη δήλωση 2 Σύνοψη 3 Ευχαριστίες 6 1 Μηχανική όραση 7 1.1 Ο ορισμός της μηχανικής όρασης 7 1.2 Ιστορική αναδρομή της μηχανικής όρασης 7 2 Ανασκόπηση των αρχών της στερεοσκοπικής όρασης 10 2.1 Κάμερα οπής και σχηματισμός της εικόνας 10 2.2 Προοπτική προβολή 11 2.3 Στερεοσκοπική όραση-ορισμός 12 2.4 Ιστορική αναδρομή της στερεοσκοπίας 15 2.5 Το πρόβλημα της αντιστοιχίας 16 2.6 Επιπολική γεωμετρία 18 2.7 Η απλούστερη στερεοσκοπική γεωμετρία 19 2.8 Ανόρθωση 20 3 Αλγόριθμοι στερεοσκοπικής αντιστοίχισης 23 3.1 Κατηγορίες στερεοσκοπικών αλγορίθμων 23 3.2 Διάκριση με βάση των χώρο παραλλάξεων 24 3.3 Μέθοδοι τοπικής αντιστοίχισης (Local Matching) 26 3.4 Καθολικές μέθοδοι (global methods) 26 3.5 Δυναμικός προγραμματισμός 27 3.6 Ο αλγόριθμος SAD (Άθροισμα απόλυτων διαφορών) 27 3.7 Ο αλγόριθμος SSD (άθροισμα τετραγωνικών διαφορών).29 4 Η κατασκευή της στερεοσκοπικής διάταξης 32 4.1 Η γεωμετρία που ικανοποιεί η στερεοσκοπική διάταξη 32 4.2 Οι προδιαγραφές των καμερών της διάταξης. 32 4.3 Σχεδιασμός της στερεοσκοπικής διάταξης. 34 4.4 Το βασικό σχέδιο της στερεοσκοπικής διάταξης... 34 4.5 Περιγραφή του βασικού τμήματος που απαρτίζεται η βάση. 36
4.6 Περιγραφή των Plexiglass τοποθέτησης των καμερών.. 37 4.7 Συσκευές που απαιτούνται για την σύλληψη των στερεοεικόνων. 42 4.8 Δημιουργία της στερεοσκοπικής σκηνής... 44 5 Στερεοσκοπικός αλγόριθμος 46 5.1 Ο στερεοσκοπικός αλγόριθμος που χρησιμοποιήθηκε για την πειραματική διαδικασία.. 46 5.2 Σχολιασμός του στερεοσκοπικού αλγορίθμου... 48 6 Συμπεράσματα 52 6.1 Αντιμέτωποι με την κατασκευή της στερεοσκοπικής διάταξης..52 6.2 Δυσκολίες κατά τη λήψη των στερεοσκοπικών εικόνων 52 6.3 Αλγόριθμοι και χάρτης βάθους.. 53 7 Βιβλιογραφία 54 5
6 Ευχαριστίες Πριν ξεκινήσει η παρουσίαση της πτυχιακής εργασίας, θα ήθελα να ευχαριστήσω των επιβλέποντα καθηγητή μου κύριο Δρ. Ιωάννη Καλόμοιρο που χωρίς την βοήθεια του, η οποία ήταν καθοριστική και πολύτιμη, δεν θα είχα καταφέρει να ολοκληρώσω επιτυχημένα την εργασία αυτή. Επίσης, θα ήθελα να τον ευχαριστήσω και για τις γνώσεις που μου μετέδωσε κατά την διάρκεια των σπουδών μου. Επιπλέον, θα ήθελα να ευχαριστήσω του γονείς μου Γεώργιο και Αθανασία για την υποστήριξη που μου παρείχαν στις σπουδές μου.
7 Κεφάλαιο 1 Μηχανική όραση 1.1 Ο ορισμός της μηχανικής όρασης Η μηχανική όραση (Computer Vision) είναι το επιστημονικό πεδίο της τεχνικής νοημοσύνης, το οποίο προσπαθεί να αναπαράγει αλγοριθμικά την αίσθηση της όρασης για την χρήση αυτής σε ηλεκτρονικό υπολογιστή ή για κάποιο ρομπότ. Ασχολείται με την αυτοματοποιημένη απεικόνιση και την αυτοματοποιημένη επεξεργασία εικόνων, με απώτερο σκοπό την εξαγωγή πληροφοριών από τις εικόνες αυτές. Η εξαγωγή της τρισδιάστατης δομής της σκηνής από στερεοσκοπικές εικόνες αποτελεί ένα πρόβλημα, το οποίο μελετάται από την κοινότητα της υπολογιστικής όρασης επί δεκαετίες. Οι αρχικές μελέτες εστιάστηκαν στις βασικές αρχές της εικόνας, την αντιστοιχία μεταξύ των εικόνων και την γεωμετρία τους. 1.2 Ιστορική αναδρομή της μηχανικής όρασης Η «γέννηση» της μηχανικής όρασης πραγματοποιήθηκε το 1960, με την πρώτη επεξεργασμένη ψηφιακή εικόνα που επιτεύχθηκε με την χρήση του ηλεκτρονικού υπολογιστή. Οι πρώτες δημοσιεύσεις από τους επιστήμονες που ασχολήθηκαν με αυτόν τον τομέα δεν άργησαν να έρθουν. Μάλιστα σημειώνονται δύο σημαντικές δημοσιεύσεις κατά τα έτη 1968 και 1969, εκ των οποίων η πρώτη αφορά αναγνώριση προτύπων (pattern recognition) και η δεύτερη δημοσίευση φέρει τον τίτλο «Επεξεργασία εικόνας από ηλεκτρονικό υπολογιστή» με την σφραγίδα του Α.Rosenfeld.
8 H ανάδειξη της μηχανικής όρασης πραγματοποιήθηκε το 1980. Με την συμβολή της, επεκτάθηκε ένα πεδίο της Πληροφορικής, η Ψηφιακή Επεξεργασία Εικόνας, μέσα από τους αλγόριθμους ανάλυσης και κατανόησης εικόνων. Είχε προηγηθεί η μαθηματική μοντελοποίηση της φυσικής όρασης μέχρι ένα σημείο και οι πρώτες απόπειρες να δοθεί η αίσθηση της όρασης σε αυτόνομο ρομπότ. Μέχρι τότε, σε βιομηχανικό πλαίσιο, ο όρος μηχανική όραση συσχετιζόταν με την ηλεκτρολογία και τη ρομποτική. Την περίοδο της δεκαετίας του 1980, ύστερα από την εμφάνιση στο προσκήνιο και της υπολογιστικής όρασης, οι δύο αυτοί όροι, μηχανική όραση και υπολογιστική όραση, βαθμιαία άρχισαν να φέρουν ομοιότητες ως προς την εξέλιξη. Αυτό είχε ως επακόλουθο, την ένωσή τους ως επιστημονικά πεδία σαν ένας πολύ ξεχωριστός και σημαντικός τομέας της τεχνητής νοημοσύνης με πολλές εφαρμογές στη ρομποτική αλλά και σε πολλούς άλλους επιστημονικούς κλάδους. Η έρευνα της μηχανικής όρασης, από την δεκαετία του 1990 και μετά, έχει ωριμάσει σημαντικά και έχει σημειωθεί σημαντική πρόοδος. Συνδέθηκε με το γνωστικό πεδίο της μηχανικής μάθησης, και έχει δώσει σημαντικά χειροπιαστά παραδείγματα μέσα από τους αλγόριθμους όρασης πραγματικού χρόνου, η χρήση των οποίων πραγματοποιείται και σε χαμηλού κόστους συσκευές κινητής τηλεφωνίας, που διαθέτουν κάμερα. Το μεγαλύτερο παράδειγμα χρήσης της μηχανικής όρασης, η οποία μπήκε ακόμα και στις ζωές των μικρών παιδιών, είναι το Kinect της εταιρείας Microsoft. Πρόκειται για μια περιφερειακή συσκευή, η οποία συνδέεται στην παιχνιδοκονσόλα XBOX. Η λειτουργία του βασίζεται στις δύο στερεοσκοπικές κάμερες που διαθέτει και σε έναν αισθητήρα. Καθώς ο χρήστης παίζει το εκάστοτε βιντεοπαιχνίδι, το Kinect δημιουργεί έναν ψηφιακό σκελετό του εαυτού μας βασισμένο σε δεδομένα ενός χάρτη βάθους. Έτσι, όταν κινείται ο χρήστης αριστερά ή δεξιά ή χοροπηδάει προς οποιαδήποτε κατεύθυνση, ο επιπλέον αισθητήρας που διαθέτει σε συνδυασμό με τις στερεοσκοπικές κάμερες που υπάρχουν, ανιχνεύει την κίνηση και βάζει τον ίδιο τον χρήστη μέσα στο παιχνίδι.
9 Εικόνα 1.1 KINECT: Συσκευή ανίχνευσης κίνησης της Microsoftγια το XBOX360 Ύστερα από την ευρύτατη διάδοση του Kinect και την άνθιση του τρισδιάστατου οπτικού περιεχομένου (κινηματογραφικές ταινίες 3D), μετά την επιτυχημένη κινηματογραφική προβολή της ταινίας Avatar το 2009, η όραση μηχανής εξετάζει αδιάλειπτα την παραπάνω αξιοποίηση των δεδομένων του βάθους για την επίτευξη νέων στόχων.
10 Κεφάλαιο 2 Ανασκόπηση των αρχών της στερεοσκοπικής όρασης 2.1 Κάμερα οπής και σχηματισμός της εικόνας Μια εικόνα δημιουργείται προβάλλοντας κάθε σημείο της σκηνής πάνω στο επίπεδο της εικόνας, ακολουθώντας μια ευθεία γραμμή, που περνά από το κέντρο της προβολής, το εστιακό σημείο. Σε αυτό ακριβώς βασίζεται το μοντέλο της κάμερας οπής (pinhole camera model σχ. 2.1). Φανταστείτε, ότι βρίσκεστε σε έναν χώρο με απαλό φωτισμό και έχετε ένα κουτί σε σχήμα κύβου, το οποίο έχει μία μικρή οπή στη μία από τις πλευρές του και στην ακριβώς απέναντι πλευρά του κύβου έχει τοποθετηθεί μια ημιδιαφανής επιφάνεια. Το φως που ξεκινά από ένα σημείο της σκηνής, περνάει μέσα από την μικρή οπή του κουτιού και σχηματίζει την αντεστραμμένη εικόνα της σκηνής στην ημιδιαφανή επιφάνεια. Στην πραγματικότητα, η οπή έχει ένα πεπερασμένο (αν και μικρό) μέγεθος, και κάθε σημείο του επιπέδου της εικόνας συλλέγει φως από έναν κώνο ακτινών που υποτείνουν σε μια πεπερασμένη στερεά γωνία. Ωστόσο, αυτό το εξιδανικευμένο και εξαιρετικά απλό μοντέλο της γεωμετρικής απεικόνισης δεν εφαρμόζεται απόλυτα. Παρόλα αυτά το μοντέλο της κάμερας οπής πλησιάζει πολύ τη λειτουργία της πραγματικής κάμερας. Οι πραγματικές κάμερες είναι εξοπλισμένες με φακούς αντί απλής οπής και η επιφάνεια απεικόνισης αποτελείται από οπτικούς αισθητήρες. Επίσης, οι φακοί εισάγουν γεωμετρικές παραμορφώσεις, που δεν λαμβάνονται υπόψη στο απλό μοντέλο της κάμερας οπής. Επιπλέον, το μοντέλο της κάμερας οπής δεν μοντελοποιεί τα σφάλματα των φακών και την ασάφεια που προκαλεί το περιορισμένο βάθος πεδίου.
11 Εικόνα 2.1 Μοντέλο της κάμερας οπής (pinhole camera) 2.2 Προοπτική προβολή Η προοπτική προβολή (perspective projection) είναι συνήθως το γεωμετρικό μοντέλο για τον σχηματισμό της εικόνας. Χρησιμοποιώντας τις ομογενείς συντεταγμένες, που αποκαλούνται επίσης προβολικές συντεταγμένες (projective coordinates), μπορούμε να περιγράψουμε μαθηματικά την προοπτική προβολή. Στις ομογενείς συντεταγμένες, κάθε σημείο επεκτείνεται με τη βοήθεια μιας ψευδόσυντεταγμένης (dummy coordinate) w 0, που απεικονίζει το σημείο σε μια γραμμή που διέρχεται από την αρχή σε έναν χώρο με διάσταση μεγαλύτερη κατά ένα σε σχέση με τον αρχικό χώρο. Για να γίνει κατανοητό, ένα σημείο μιας δισδιάστατης εικόνας με συντεταγμένες (x,y) παρίσταται σε ομογενείς συντεταγμένες από το διάνυσμα [wx,wy,w] T, με w 0. Ένα τρισδιάστατο σημείο της σκηνής (x,y,z) παρίσταται σε ομογενείς συντεταγμένες [wx,wy,wz] T. Η χρησιμότητα των ομογενών συντεταγμένων είναι πάρα πολύ μεγάλη, καθώς μας επιτρέπουν να εκφράσουμε μη-γραμμικούς μετασχηματισμούς με γραμμικό τρόπο. Για παράδειγμα, η προοπτική προβολή ενός τρισδιάστατου σημείου στο δισδιάστατο επίπεδο της εικόνας γράφεται με τον ακόλουθο τόπο:
12 [ ] [ ]. [ ]. σχ. 2.1 Τα (X,Y,Z) στην εξίσωση αυτή είναι οι συντεταγμένες ενός σημείου της σκηνής σε τυχαίο τρισδιάστατο σύστημα συντεταγμένων και (x,y)=(u/w, v/w) είναι οι συντεταγμένες του σημείο σε τυχαίο διδιάστατο σύστημα συντεταγμένων πάνω στο επίπεδο της εικόνας. Ο πίνακας P ονομάζεται πίνακας προβολής (projection matrix), έχει διαστάσεις 3x4 και τα στοιχεία του ορίζονται από τις εξωτερικές αλλά και από τις εσωτερικές παραμέτρους της κάμερας. Οι εξωτερικές παράμετροι καθορίζουν τον προσανατολισμό και τη θέση της κάμερας σε σχέση με το σύστημα των συντεταγμένων της σκηνής, ενώ οι εσωτερικές παράμετροι καθορίζουν την εστιακή απόσταση, τον λόγο των πλευρών της εικόνας και τη θέση της αρχής του συστήματος αναφοράς της εικόνας. Αν ο πίνακας P είναι γνωστός, δηλαδή γνωρίζουμε εξωτερικές και εσωτερικές παράμετροι, τότε η κάμερα θα είναι βαθμονομημένη (calibrated). 2.3 Στερεοσκοπική όραση-ορισμός Ο ανθρώπινος οργανισμός όπως και πολλοί άλλοι οργανισμοί στο ζωικό βασίλειο είναι εφοδιασμένος με δύο μάτια. Το κάθε μάτι βρίσκεται σε μια απόσταση, κοντινή μεν από το άλλο. Εξαιτίας αυτής της διάταξης το κάθε μάτι λαμβάνει από διαφορετική οπτική γωνία (ελαφρώς μετατοπισμένη) μια όψη της ίδιας περιοχής του περιβάλλοντα χώρου. Αυτό έχει ως αποτέλεσμα, τα στοιχεία που συνθέτουν την εικόνα, να μην πέφτουν σε ακριβώς ίδιες τοποθεσίες του αμφιβληστροειδούς χιτώνα, πράγμα που σημαίνει ότι το κάθε μάτι μπορεί να συλλέγει μια οπτική περιοχή πληροφοριών που το άλλο δεν μπορεί να συλλέξει. Ο εγκέφαλος με την σειρά του αντιστοιχίζει τις ομοιότητες των δύο εικόνων σε μία και ταυτόχρονα προσθέτει και
13 τις διαφοροποιήσεις στη νέα εικόνα και έτσι γεννιέται η έννοια του βάθους της εικόνας. Η διαδικασία εκτίμησης του βάθους των σημείων της σκηνής με βάση την αλλαγή της θέσης τους ανάμεσα σε δύο εικόνες ονομάζεται στερεοσκοπική όραση. Η διαφορά ανάμεσα στη θέσης ενός σημείου στη μία και στην άλλη εικόνα ονομάζεται παράλλαξη (disparity).η εικόνα 2.2 είναι κατατοπιστική για το πως η παράλλαξη ενός σημείου συνδέεται με το βάθος, με την προϋπόθεση ότι έχουμε δύο όμοιες αλλά και παράλληλες κάμερες. Το σημείο Ρ είναι ένα σημείο της σκηνής και οι p L και p R είναι οι δύο απεικονίσεις του στην αριστερή και δεξιά εικόνα αντίστοιχα. Το f αποτελεί την εστιακή απόσταση, η οποία είναι η απόσταση του εστιακού σημείου από το επίπεδο της εικόνας. Η απόσταση ανάμεσα στις δύο κάμερες ονομάζεται βασική γραμμή και συμβολίζεται με το γράμμα b (baseline). Ας υποθέσουμε ότι το σημείο Ρ, απέχει απόσταση Ζ και είναι μετατοπισμένο κατά Χ σε σχέση με την αριστερή κάμερα και οι απεικονίσεις p L και p R του σημείου έχουν συντεταγμένες x L και x R στο σύστημα συντεταγμένων της εικόνας. Με θεώρηση όμοιων τριγώνων φτάνουμε στις σχέσεις: = και = σχ. 2.2 = Έτσι καταλήγουμε στο συμπέρασμα ότι η παράλλαξη d, δηλαδή η διαφορά στη θέση του σημείου στις δύο εικόνες δίνεται από τη σχέση: d= σχ. 2.3
14 Εικόνα 2.2 Στερεοσκοπική γεωμετρία. Το σχήμα δείχνει δύο όμοιες παράλληλες κάμερες με εστιακή απόσταση f και μεταξύ τους απόσταση b (baseline). Η παράλλαξη ενός σημείου P της σκηνής, που βρίσκεται σε βάθος Ζ δίνεται από τη σχέση d=x R -x L =fb/z. Το συμπέρασμα, στο οποίο οδηγούμαστε, είναι ότι η παράλλαξη του σημείου είναι ανάλογη της εστιακής απόστασης f και της βασικής γραμμής b και αντιστρόφως ανάλογη του βάθους. Ο χάρτης παραλλάξεων μας δίνει μια άμεση, αλλά αντίστροφη κωδικοποίηση του βάθους των σημείων της σκηνής, λόγω του ότι η βασική γραμμή και η εστιακή απόσταση είναι μεγέθη σταθερά. Επομένως, όσο πιο κοντά είναι ένα αντικείμενο στο φακό, τόσο μεγαλύτερη θα είναι η παράλλαξη στις δύο εικόνες. Ο πίνακας που σχηματίζεται από τις ανομοιότητες των εικονοστοιχείων, ονομάζεται χάρτης παραλλάξεων (disparity map).
15 2.4 Ιστορική αναδρομή της στερεοσκοπίας Ο όρος στερεοσκοπική όραση προέρχεται από την ελληνική λέξη στέρεο, που σημαίνει συμπαγής ή στερεός και στην λέξη όψη. Ο Charles Wheatstone το 1883 ήταν αυτός, που πρώτος παρατήρησε, ότι ο άνθρωπος βλέπει από διαφορετική οπτική γωνία, λόγω των δύο ματιών, το περιεχόμενο της σκηνής. Διαπίστωσε ακριβώς τον ορισμό της στερεοσκοπίας. Λόγω της απόστασης που υπάρχει ανάμεσα στα μάτια του ανθρώπου, προβάλλονται σε αυτά η ίδια ακριβώς εικόνα μετατοπισμένη κατά μία κατεύθυνση. Έτσι, όρισε αυτομάτως την έννοια του βάθους. Ο Wheatstone ήταν μάλιστα αυτός, που κατασκεύασε το πρώτο στερεοσκόπιο, το οποίο, ενώ στην αρχή ήταν ιδιαίτερα δημοφιλές, στη συνέχεια μπήκε στο περιθώριο λόγω της έλλειψης εργαλείων μελέτης της στερεοσκοπίας. Εικόνα 2.3 Το στερεοσκόπιο του Charles Wheatstone Με την εφεύρεση του πρισματικού στερεοσκοπίου από τον David Brewster η στερεοσκοπική όραση επέστρεψε ξανά στο προσκήνιο κατά την βικτοριανή περίοδο. Σε συνδυασμό με την φωτογραφία μπορούσε να φτιάξει χιλιάδες στερεογράμματα, δηλαδή έφτιαχνε την οπτική ψευδαίσθηση του βάθους.
16 Το 1960 με εφευρέτη τον Bela Julesz, εφευρέθηκε το στερεόγραμμα τυχαίων σημείων. Μέσω αυτού του στερεογράμματος τονίστηκε για πρώτη φορά ένα πολύ σημαντικό πρόβλημα της στερεοσκοπικής όρασης, γνωστό και ως πρόβλημα της αντιστοίχησης. Σε αυτό το στερεόγραμμα, η κάθε όψη εμπεριέχει ένα τετραγωνικό πίνακα περίπου 1000 σημείων, με το καθένα από αυτά να μπορεί να είναι μαύρο ή άσπρο. Πρόκειται για δύο εικόνες μετατοπισμένες κατά μια κατεύθυνση σε σχέση με την άλλη. Στο κενό που προκύπτει από την μεταξύ τους μετατόπιση, προστίθενται τυχαία νέα σημεία. Όταν προβάλλεται η καθεμία από τις εικόνες στο κάθε μάτι, η περιοχή που διαφέρει, γίνεται αμέσως αντιληπτή ως πιο μακρινή ή κοντινή σε σχέση με το υπόλοιπο φόντο. Επίσης, το 1960, οι Horace Barlow, Colin Blackemore και Jack Pettigrew ανακάλυψαν στον εγκεφαλικό φλοιό της γάτας νευρώνες, οι οποίοι είχαν τα αισθητήρια πεδία σε διαφορετικές οριζόντιες περιοχές για τα δύο μάτια. Η ανακάλυψη αυτή κατοχύρωσε τη νευρωνική βάση της στερεοσκοπικής όρασης. Το 1980 ο Gian Poggio ανακάλυψε νευρώνες στον εγκέφαλο του πιθήκου, που ανταποκρίνονται στο βάθος του στερεογράμματος τυχαίων σημείων. Τέλος, το 1990 ο Christopher Tyler εφηύρε το αυτοστερεόγραμμα, στερεόγραμμα τυχαίων σημείων που μπορούμε να το δούμε χωρίς στερεοσκόπιο. 2.5 Το πρόβλημα της αντιστοιχίας Το δυσκολότερο κομμάτι και το βασικό πρόβλημα σε κάθε στερεοσκοπικό σύστημα αποτελεί η επίλυση του προβλήματος της αντιστοιχίας, δηλαδή η εύρεση των σημείων στις δύο εικόνες, που αποτελούν προβολές του ίδιου σημείου P της φυσικής σκηνής μας. Το πρόβλημα της αντιστοίχησης δημιουργείται από την γεωμετρία του συστήματος και τις ιδιαιτερότητες της φυσικής σκηνής που μπορούν να προκύψουν. Τα πιο σημαντικά προβλήματα είναι τα ακόλουθα:
17 1. Αποκλεισμένα σημεία. Υπάρχουν σημεία τα οποία λόγω της γεωμετρίας του συστήματος (η μια κάμερα είναι μετατοπισμένη είτε αριστερά είτε δεξιά σε σχέση με την άλλη) δεν εμφανίζονται και στις δύο εικόνες. Τα σημεία αυτά ονομάζονται αποκλεισμένα σημεία και οι περιοχές που δημιουργούνται λόγω αυτών, ονομάζονται αποκλεισμένες περιοχές. 2. Περιοχές με περιορισμένη υφή. Οι περιοχές με περιορισμένη υφή, όχι μόνο παρουσιάζουν μεγάλη ομοιότητα, αλλά έχουν και μικρό λόγο σήματος σε σχέση με τον θόρυβο, γεγονός που μπορεί και επηρεάζει την σωστή απόφαση αντιστοίχισης, λόγω της μεγάλης ισχύς του θορύβου που υπάρχει στις περιοχές αυτές. 3. Ύπαρξη όμοιων περιοχών στη φυσική σκηνή. Αν η φυσική σκηνή έχει πολλές όμοιες περιοχές, τότε ο εκάστοτε αλγόριθμος αντιστοίχησης θα κάνει πολλές λάθος αντιστοιχήσεις ειδικά αν οι περιοχές αυτές είναι μεγάλες σε έκταση. Έτσι, για να επιλυθούν όλα αυτά τα προβλήματα αντιστοίχησης των κοινών σημείων, υπάρχουν κάποιοι περιορισμοί ιδιότητες των δύο στερεοσκοπικών εικόνων, οι οποίοι πρέπει να λαμβάνονται υπόψη κατά την υλοποίηση ενός στερεοσκοπικού αλγορίθμου. Μερικοί σημαντικοί περιορισμοί άξιοι αναφοράς είναι: Ο περιορισμός της μοναδικότητας ενός αντίστοιχου σημείου: Ένα σημείο της μίας εικόνας αντιστοιχεί σε ένα μοναδικό σημείο της άλλης εικόνας. Ο περιορισμός αυτός δημιουργεί δύο προβλήματα, την αντιστοίχηση των σημείων στις αποκλεισμένες περιοχές και την ανίχνευση δύο ή και περισσότερων όμοιων σημείων, τα οποία υπάρχουν λόγω επαναλαμβανόμενων περιοχών. Ο περιορισμός σύμφωνης αντιστοίχησης: Αν ένα αντικείμενο βρίσκεται πιο αριστερά από κάποιο άλλο στην αριστερή εικόνα, που σημαίνει ότι θα το συναντήσουμε πρώτο σε σχέση με το άλλο, τότε θα πρέπει να το συναντήσουμε και πρώτο στη δεξιά εικόνα. Ο περιορισμός των ακμών: Αν τα εικονοστοιχεία της αριστερής εικόνας ορίζουν μια ακμή τότε και τα αντίστοιχα εικονοστοιχεία θα πρέπει να ορίζουν την ομόλογη ακμή.
18 Αν αφήσουμε στην άκρη το πρόβλημα των σημείων απόκρυψης και γενικότερα το θέμα των αποκλεισμένων περιοχών, τότε ο βασικός λόγος που η εύρεση των αντιστοιχιών αποτελεί ένα δύσκολο θέμα, είναι ότι η ποσότητα της πληροφορίας που είναι διαθέσιμη για καθένα από τα εικονοστοιχεία (δηλαδή η έντασή του), συνήθως δεν είναι αρκετή, ώστε να βρεθεί αναμφισβήτητη αντιστοιχία. Έτσι,για να λύσουμε αυτό το πρόβλημα, θεωρούμε τοπικές περιοχές του κάθε εικονοστοιχείου στη μια εικόνα και το συγκρίνουμε με τις τοπικές περιοχές των υποψήφιων εικονοστοιχείων της άλλης εικόνας. Το εικονοστοιχείο ενδιαφέροντος είναι το κεντρικό εικονοστοιχείο της τοπικής περιοχής. Η τοπική περιοχή ονομάζεται παράθυρο. Ακόμα και έτσι είναι δυνατό να βρεθούν αξιόπιστες αντιστοιχίες μόνο σε περιοχές της εικόνας με μεγάλη ποσότητα πληροφορίας, όπως ακμές και γωνίες. Οι προσεγγίσεις για το θέμα είναι δύο. Στη πρώτη προσέγγιση ασχολούμαστε μόνο με σημεία, τα οποία αντιστοιχίζονται χωρίς αμφιβολία. Η ιδέα αυτή βασίζεται σε αλγόριθμους βασισμένους σε χαρακτηριστικά, οι οποίοι πρώτα εξάγουν χαρακτηριστικά με υψηλή ποσότητα πληροφορίας και στη συνέχεια περιορίζουν την εύρεση αντιστοιχιών σε αυτά τα χαρακτηριστικά. Το μειονέκτημα αυτής της προσέγγισης είναι, ότι το αποτέλεσμα είναι ένας αραιός χάρτης παραλλάξεων. Η δεύτερη προσέγγιση ονομάζεται αντιστοιχία βασισμένη σε περιοχές. Σε αυτή τη προσέγγιση επιλέγουμε μεγαλύτερες περιοχές της εικόνας, μεγάλα παράθυρα, ώστε να μας παρέχεται μεγαλύτερη ποσότητα πληροφορίας και να οδηγηθούμε σε αναμφισβήτητες πληροφορίες. Το πλεονέκτημα της προσέγγισης αυτής είναι ένας πυκνός χάρτης παραλλάξεων. 2.6 Επιπολική γεωμετρία Έχοντας συζητήσει παραπάνω για το πως θα βρεθούν οι αντιστοιχίες ανάμεσα στα εικονοστοιχεία των δύο στερεοσκοπικών εικόνων, αμέσως γεννιέται το ερώτημα για το που θα πρέπει να αναζητήσουμε αυτές τις αντιστοιχίες. Το ερώτημα αυτό ήρθε να μας το λύσει η επιπολική γεωμετρία, η χρήση της οποίας μας βοηθάει εξαιρετικά στο να απαντηθεί το ερώτημα αυτό. Η επιπολική γεωμετρία είναι ουσιαστικά η γεωμετρία της διατομής των επιπέδων των δύο εικόνων με το σύνολο των επιπολικών επιπέδων, τα οποία έχουν ως άξονα περιστροφής τη βασική γραμμή (baseline). Η βασική γραμμή είναι αυτή, η οποία ενώνει τα κέντρα των δύο καμερών. Υποθέτουμε, ότι ένα σημείο Χ της σκηνής απεικονίζεται στα δύο επίπεδα των καμερών, στα σημεία x και x αντίστοιχα. Όπως παρατηρούμε στην εικόνα 2.4, τα σημεία x και x, το σημείο Χ της σκηνής καθώς και τα κέντρα των δύο καμερών είναι
19 συνεπίπεδα. Το συγκεκριμένο επίπεδο αυτό το ονομάζουμε π. Παρατηρώντας το σχήμα, οι ημιευθείες που σχηματίζονται από την προβολή των σημείων x και x στα αντίστοιχα επίπεδα τέμνονται με το Χ και βρίσκονται στο ίδιο επίπεδο π. Η ιδιότητα αυτή είναι πολύ σημαντική για την εύρεση των αντιστοιχιών. Υποθέτοντας τώρα ότι γνωρίζουμε μόνο το x, αναρωτιόμαστε για το πού βρίσκεται το αντίστοιχο σημείο x. Ο ορισμός ενός επιπέδου γίνεται από δύο ευθείες. Επομένως, το επίπεδο π ορίζεται από τη βασική γραμμή b και την ημιευθεία του σημείου x. Από τα παραπάνω γνωρίζουμε ότι η ημιευθεία που αντιστοιχεί στο x βρίσκεται πάνω στο π και επομένως το x θα βρίσκεται πάνω στη γραμμή τομής του επιπέδου π με το επίπεδο της 2 ης κάμερας. Αυτή η γραμμή ονομάζεται επιπολική γραμμή και στην εικόνα 2.4(β) συμβολίζεται με l. Η επιπολική γραμμή αποτελεί όλες τις πιθανές θέσεις του x. (α) (β) Εικόνα 2.4: Γεωμετρία αντιστοίχισης σημείων (α). Οι δύο εικόνες δηλώνονται με τα κέντρα τους C και C και τα επίπεδα των εικόνων. Τα κέντρα αυτά, το σημείο Χ το οποίο είναι σημείο της σκηνής και οι απεικονίσεις του x και x βρίσκονται στο ίδιο συνεπίπεδο π. (β) Το σημείο x βρίσκεται πάνω σε μια ευθεία στον τρισδιάστατο κόσμο, η οποία καθορίζεται από το κέντρο της 1 ης κάμερας C και το x. Η ημιευθεία αυτή προβάλλεται με το γράμμα l στη 2 η όψη. Το σημείο X του τρισδιάστατου χώρου, το οποίο προβάλλεται στο x, πρέπει να βρίσκεται σε αυτή την ημιευθεία, ώστε η εικόνα του X στη δεύτερη όψη να βρίσκεται πάνω στη l. 2.7 Η απλούστερη στερεοσκοπική γεωμετρία Η απλούστερη στερεοσκοπική γεωμετρία προκύπτει με δύο όμοιες, παράλληλες κάμερες, που τα επίπεδα των εικόνων συμπίπτουν και των οποίων οι άξονες x είναι παράλληλοι στη βασική γραμμή. Στην περίπτωση αυτή οι αντίστοιχες επιπολικές γραμμές είναι οριζόντιες και έχουν την ίδια συντεταγμένη y.
20 Το γεγονός αυτό κάνει το πρόβλημα της αντιστοιχίας ακόμα πιο απλό, καθώς τα αντίστοιχα σημεία θα έχουν ίδιες συντεταγμένες στον άξονα τον y, με αποτέλεσμα να μην υπάρχει η ανάγκη να γίνει αναλυτικός υπολογισμός των επιπολικών γραμμών. Στην απλή αυτή γεωμετρία το βάθος ενός σημείου της σκηνής είναι η απόσταση από το επίπεδο που περνά από τα οπτικά κέντρα των δύο καμερών και είναι παράλληλο προς το κοινό επίπεδο της εικόνας. Η παράλλαξη ενός σημείου είναι η διαφορά των συντεταγμένων της εικόνας, εφόσον χρησιμοποιούμε δύο ίδια συστήματα συντεταγμένων εικόνας, που το ένα είναι μετατοπισμένο σε σχέση με το άλλο κατά απόσταση ίση με τη βασική γραμμή b. Στη πτυχιακή αυτή εργασία η στεροσκοπική μας διάταξη υποστηρίζει την απλή αυτή γεωμετρία. Οι δύο στεροσκοπικές κάμερες έχουν τοποθετηθεί και ρυθμιστεί με τέτοιο τρόπο, ώστε να είναι απόλυτα παράλληλες μεταξύ τους. Παρόλα αυτά, ακόμη και για δύο κάμερες οι οποίες βρίσκονται σε γενική θέση, είναι δυνατό να πετύχουμε την απλή γεωμετρία με μια διαδικασία, η οποία ονομάζεται ανόρθωση. 2.8 Ανόρθωση Όπως αναφέραμε παραπάνω, ακόμα και για δύο κάμερες οι οποίες δεν είναι παράλληλες μεταξύ τους αλλά βρίσκονται σε γενική θέση, είναι δυνατό να πετύχουμε την απλή γεωμετρία, που περιγράψαμε με την διαδικασία της ανόρθωσης. Ο ορισμός της ανόρθωσης είναι η διαδικασία της επαναπροβολής των δύο στερεοσκοπικών εικόνων σε κοινό επίπεδο εικόνας, το οποίο είναι παράλληλο με τη βασική γραμμή. Με την χρήση ενός μετασχηματισμού για την κάθε εικόνα, τα ζευγάρια των συζυγών επιπολικών γραμμών γίνονται συνευθειακά και παράλληλα σε έναν από τους άξονες της εικόνας, συνήθως τον οριζόντιο. Η γεωμετρία της σκηνής δεν επηρεάζει την διαδικασία αυτή, καθώς το μόνο που αλλάζει, είναι το επίπεδο των εικόνων. Η διαδικασία της ανόρθωσης καθίσταται ιδιαίτερα σημαντική, λόγω της εφαρμογής της πριν την διαδικασία της επίλυσης του προβλήματος της αντιστοίχισης και αυτό γιατί μετά το στάδιο της ανόρθωσης η αναζήτηση της εύρεσης του αντίστοιχου εικονοστοιχείου από 2D ανάγεται σε 1D και πραγματοποιείται κατά μήκος της αντίστοιχης επιπολικής γραμμής. Με λίγα λόγια, ένα εικονοστοιχείο της
21 δεξιάς εικόνας με συντεταγμένες (i 1,j 1 ) για να βρεθεί, αρκεί να εξετάσουμε όλα τα πιθανά σημεία της δεξιάς εικόνας που το j= j 1. Μαθηματικά, κάθε επαναπροβολή των δύο εικόνων μπορεί να περιγραφεί με τη βοήθεια ενός πίνακα προβολής 3x3, που αποκαλείται ομογραφία και συμβολίζεται με Η. Ο πίνακας αυτός αποτελεί έναν μετασχηματισμό συντεταγμένων σε ομογενείς συντεταγμένες, από την αρχική εικόνα στην επαναπροβολή της. Εικόνα 2.5:Ανόρθωση ενός στερεοσκοπικού ζεύγους εικόνων. Επαναπροβολή σε επίπεδο παράλληλο προς τη βασική γραμμή. Επομένως, η ανόρθωση ενός στερεοσκοπικού ζεύγους εικόνων μπορεί να επιτευχθεί χρησιμοποιώντας δύο ομογραφίες H L και H R. στις δύο εικόνες. Τα H L και H R σε ένα βαθμονομημένο σύστημα μπορούν να βρεθούν από τις γνωστές θέσεις και τον προσανατολισμό των καμερών. Γενικά το Η έχει δύο μέρη: τον φυσικό μετασχηματισμό, ο οποίος εντοπίζει το επίπεδο του αντικειμένου που βλέπουμε και την προβολή, η οποία παρουσιάζει τον πίνακα των εσωτερικών παραμέτρων της κάμερας. Όσον αφορά τον φυσικό μετασχηματισμό, είναι το άθροισμα των αποτελεσμάτων κάποιας περιστροφής R και της μετατόπισης t, που σχετίζει το επίπεδο που βλέπουμε με το επίπεδο της εικόνας. Τέλος, η αναλυτική ανόρθωση τους στερεοσκοπικού ζεύγους απαιτεί την εκ νέου δειγματοληψία των εικόνων. Για κάθε εικονοστοιχείο (x, y ) της ανορθωμένης εικόνας, υπολογίζεται η αντίστοιχη θέση (x, y) στην αρχική εικόνα, μέσω της ομογραφίας H -1. Η τιμή της έντασης υπολογίζεται με παρεμβολή, χρησιμοποιώντας
22 τα τέσσερα κοντινότερα pixels. Αυτή η διαδικασία μπορεί να γίνει απλά με γραμμική παρεμβολή ή και με κυβικές splines.
23 Κεφάλαιο 3 Αλγόριθμοι στερεοσκοπικής αντιστοίχισης 3.1 Κατηγορίες στερεοσκοπικών αλγορίθμων Όλοι οι στερεοσκοπικοί αλγόριθμοι έχουν κύρια αρμοδιότητα, να επιλύσουν το βασικότερο πρόβλημα της στερεοσκοπίας, το πρόβλημα της αντιστοίχησης, την εύρεση εκείνων των σημείων στις δύο εικόνες τα οποία αντιστοιχούν στο ίδιο σημείο της σκηνής. Το αποτέλεσμα είναι η έξοδος ενός στερεοσκοπικού αλγορίθμου, ο χάρτης βάθους, ο οποίος περιγράφει την σχετική μετατόπιση των αντίστοιχων σημείων ανάμεσα στις δύο εικόνες. Κατά κανόνα, οι αλγόριθμοι στερεοσκοπικής αντιστοίχισης αποτελούν τεχνικές εξαντλητικής αναζήτησης. Η αναζήτηση η οποία εκτελείται, μπορεί να είναι βασισμένη στην πληροφορία της φωτεινότητας εκτιμώντας την ανομοιότητα για κάθε εικονοστοιχείο αναφοράς, είτε να βασίζεται σε κάποια χαρακτηριστικά των εικόνων παρέχοντας έναν σχετικά πιο αραιό χάρτη ανομοιότητας. Το πρόβλημα της στεροσκοπικής αντιστοιχίας έχει λίγους περιορισμούς, που μπορούν να βοηθήσουν στην επίλυσή του, όμως περιπλέκεται περισσότερο, λόγω του θορύβου που περιέχουν οι εικόνες. Αυτό έχει ως αποτέλεσμα τον υπολογισμό ενός υποσυνόλου αντιστοιχιών και οι υπόλοιπες να γίνονται κάνοντας κάποιες υποθέσεις. Η πρώτη κατηγορία αλγορίθμων περιλαμβάνει τους αποκαλούμενους αλγόριθμους χαρακτηριστικών (feature based algorithms), που αντιστοιχούν μόνο τοπικά χαρακτηριστικά στις δύο εικόνες, όπως γραμμές, ακμές, γωνίες. Αυτού του είδους οι αλγόριθμοι εξάγουν έναν αραιό χάρτη βάθους. Η δεύτερη κατηγορία αλγορίθμων βασίζεται σε περιοχές (area based algorithms)και ταυτοποιεί μικρές περιοχές ανάμεσα στις δύο εικόνες. Τα κοντινά εικονοστοιχεία έχουν την ίδια παράλλαξη ανάμεσα στις δύο εικόνες. Η έξοδος αυτής της κατηγορίας αλγορίθμων, δηλαδή ο υπολογισμός του χάρτη βάθους πιθανόν να έχει σφάλματα σε περιοχές με ασυνέχεια βάθους, επειδή εκείνα τα εικονοστοιχεία δεν έχουν την ίδια παράλλαξη. Ένα άλλο είδος διάκρισης με το οποίο μπορούμε να κατηγοριοποιήσουμε τους αλγορίθμους είναι: α) σε αυτούς που αναφέρονται σε έναν μικρό αριθμό εικονοστοιχείων β) σε αυτούς που εφαρμόζονται σε ολόκληρη την εικόνα γ) σε ολόκληρες γραμμές σάρωσης. Οι περιοσμοί που επιβάλλονται σε ένα μικρό αριθμό εικονοστοιχείων, γύρω από το εξεταζόμενο εικονοστοιχείο ονομάζονται τοπικοί περιορισμοί (local constrains) και οι αλγόριθμοι που τους αντιπροσωπεύουν, ονομάζονται αλγόριθμοι τοπικής αντιστοίχισης (local correspondence methods). Αντίστοιχα,περιορισμοί που αναφέρονται σε μεγαλύτερη περιοχή ή σε ολόκληρη την εικόνα ονομάζονται
24 καθολικοί περιορισμοί (global constrains) και οι σχετικοί αλγόριθμοι ονομάζονται αλγόριθμοι καθολικής αντιστοίχισης (global correspondence methods). Παρόλο που οι τοπικές μέθοδοι είναι πολύ αποτελεσματικές, παρουσιάζουν μια ευαισθησία σε περιοχές απόκρυψης (occlusion regions) και σε περιοχές με ομογενή υφή, όπου υπάρχει αμφιβολία στην αντιστοίχιση, σε αντίθεση με τις καθολικές μέθοδοι, όπου παρουσιάζεται λιγότερη ευαισθησία σε τέτοια προβλήματα, αφού οι καθολικοί περιορισμοί δημιουργούν επιπρόσθετη υποστήριξη στην επίλυση του προβλήματος στις περιοχές που δεν μπορούν να αντιστοιχούν τοπικά. Όμως το υπολογιστικό κόστος αυτών των αλγορίθμων είναι μεγάλο. 3.2 Διάκριση με βάση τον χώρο των παραλλάξεων Ακόμα μια διάκριση ανάμεσα στους στερεοσκοπικούς αλγορίθμους γίνεται με βάση τη χρήση της έννοιας του «χώρου των παραλλάξεων». Οι στρατηγικές που ακολουθεί ο εκάστοτε αλγόριθμος είναι δύο και αυτή η στρατηγική είναι που χαρακτηρίζει τον κάθε αλγόριθμο. Έτσι,έχουμε τον αλγόριθμο που είναι προσανατολισμένος στα σημεία (point-oriented), ο οποίος για κάθε θέση σε μια εικόνα, βρίσκει τη μετατόπιση που ευθυγραμμίζει αυτή τη θέση με την καλύτερη αντιστοίχιση στην άλλη εικόνα. Στη δεύτερη στρατηγική, ο αλγόριθμος είναι προσανατολισμένος στη μετατόπιση (displacement-oriented).στη περίπτωση αυτή, έχοντας μια δεδομένη μετατόπιση, βρίσκει όλες τις θέσεις που ταιριάζουν μεταξύ τους. Κάθε στερεοσκοπικός αλγόριθμος γενικά περιέχει δύο εμφωλευμένους βρόγχους, «για όλα τα σημεία» και «για όλες τις παραλλάξεις». Η δόμηση των βρόγχων αυτών μπορεί να γίνει με δύο διαφορετικούς τρόπους. Για έναν αλγόριθμο βασισμένο στα σημεία, ο εξωτερικός βρόγχος είναι «για όλα τα σημεία». Κάθε σημείο στην μια εικόνα συγκρίνεται με σημεία στην άλλη εικόνα («για όλες τις παραλλάξεις») προκειμένου να βρεθεί η καλύτερη αντιστοίχιση. Η κάθε σύγκριση περιλαμβάνει την αθροιστική συσσώρευση ενός μέτρου ομοιότητας στα όρια μιας περιοχής, η οποία επιτυγχάνεται με έναν τρίτο βρόγχο «για κάθε θέση στην περιοχή του σημείου». Έτσι, για κάθε αλγόριθμο προσανατολισμένο στα σημεία ο αριθμός των υπολογισμών που απαιτούνται είναι Ο(Ndw 2 ), όπου Ν είναι ο αριθμός των pixel (70000-300000), d ο αριθμός των επιπέδων παράλλαξης που θεωρούμε (10-100) και w είναι το μέγεθος του παραθύρου. Η δομή των βρόγχων σε έναν αλγόριθμο βασισμένο στη μετατόπιση, αντιστρέφεται. Εδώ, ο εξωτερικός βρόγχος είναι «για όλες τις παραλλάξεις». Για κάθε σταθερή μετατόπιση ανάμεσα στις δύο εικόνες υπολογίζεται το μέτρο ομοιότητας «για όλα τα σημεία» και τέλος αθροίζεται «για όλες τις περιοχές, όλων των σημείων». Τέλος, για κάθε σημείο επιλέγεται η καλύτερη αντιστοίχιση ανάμεσα σε όλες τις παραλλάξεις.
25 Αυτή η αλλαγή στη σειρά εκτέλεσης των βρόγχων δεν επηρεάζει καθόλου το υπολογιστικό κόστος, όμως το βήμα της συσσώρευσης της συνάρτησης κόστους για κάθε επίπεδο παράλλαξης μπορεί να υλοποιηθεί ταχύτερα. Τις περισσότερες περιπτώσεις ο συνολικός αλγόριθμος καταλήγει να απαιτεί Ο(Νd) υπολογισμούς. Έχει διαπιστωθεί, ότι χρησιμοποιώντας έναν αλγόριθμο προσανατολισμένο στην μετατόπιση μπορούμε με μεγαλύτερη ευκολία να υπολογίσουμε έναν πυκνό χάρτη βάθους. Γενικά ο χώρος των παραλλάξεων πριν τη συσσώρευση της συνάρτησης κόστους ορίζεται ως ένας τρισδιάστατος χώρος δεδομένων, ως εξής: Ε 0 (x,y,d)=ρ(i L (x+d,y)-i R (x,y))σχ. 3.1 Τα I L και I R είναι οι συναρτήσεις έντασης της αριστερής και της δεξιάς εικόνας αντίστοιχα και η συνάρτηση ρ μετρά την ομοιότητα ανάμεσα στις δύο εντάσεις. Για παράδειγμα: ρ(l-r)=(l-r) 2 σχ. 3.2 Αφού γίνει η συσσώρευση του κόστος μέσα σε ένα παράθυρο, καταλήγουμε στην τελική συνάρτηση κόστους Ε(x,y,d), από την οποία είναι δυνατό να υπολογίσουμε την παράλλαξη ως μία συνάρτηση d(x,y): d(x,y)=arg min E(x,y,d).σχ. 3.3 Εικόνα 3.1 Σύγκριση παραθύρων στον χώρο των παραλλάξεων. (α) Ένας αλγόριθμος προσανατολισμένος στα σημεία συγκρίνει ένα παράθυρο στη μία εικόνα με πολλά παράθυρα στη δεύτερη. (b) Ο ίδιος υπολογισμός στον χώρο των παραλλάξεων. Αφού γίνει η συνέλιξη κάθε στρώσης
26 με ένα τετραγωνικό παράθυρο, η καλύτερη αντιστοίχηση επιλέγεται σε μια κάθετη στήλη παραλλάξεων Η ερμηνεία της παραπάνω προσέγγισης είναι, ότι για όλα τα σημεία της εικόνας βρίσκουμε τη συνάρτηση Ε, για κάθε τιμή της παράλλαξης, μέσα στα όρια dmin, dmax που γίνεται η αναζήτηση. Έτσι δημιουργείται μια στήλη επιφανειών Ε στον τρισδιάστατο χώρο, (βλέπε εικόνα 3.1) που η κάθε μια αντιστοιχεί σε διαφορετική παράλλαξη. Για κάθε σημείο (x,y) αναζητούμε την παράλλαξη d σε μια στήλη παραλλάξεων, εκεί που ελαχιστοποιείται το Ε βρίσκεται το αντίστοιχο σημείο. 3.3 Μέθοδοι τοπικής αντιστοίχισης (Local Matching) Ταύτιση περιοχών (block matching) Οι μέθοδοι ταύτισης περιοχών εκτιμούν την παράλλαξη σε ένα σημείο συγκρίνοντας μια περιοχή-παράθυρο που έχει ως κέντρο του το σημείο αυτό με μια σειρά από παράθυρα ίδιου μεγέθους της άλλης εικόνας. Η αναζήτηση ανάγεται σε 1D λόγω του επιπολικού περιορισμού. Η ταύτιση των περιοχών γίνεται με την χρήση τριών μετρικών: η συσχέτιση, η διαφορά των εντάσεων και οι μετρικές βαθμίδες (rank metrics). Η κανονικοποιημένη συσχέτιση διασταύρωσης (normalized crosscorrelation ή NCC) είναι η τυπική στατιστική μέθοδος για την εύρεση ομοιότητας. Η μετρική αυτή ορίζεται ως ακολούθως: u, v u, v ( I ( u, v) I ( I ( u, v) I ) 1 1 1 1 ) ( I 2 2 ( I ( u d, v) I ) 2 2 ( u d, v) I ) 2 2 σχ. 3.4 H μετρική ορίζεται στα όρια ενός παραθύρου όπου τρέχουν οι δείκτες u και v. Στο ίδιο παράθυρο ορίζεται και η μέση τιμή των εντάσεων. Για παράδειγμα, σε παράθυρο 5x5 οι δείκτες θα τρέχουν από -2+x έως 2+x και από -2+y έως 2+y γύρω από το εικονοστοιχείο (x,y) του οποίου αναζητάμε την αντιστοιχία. Στην περίπτωση της συσχέτισης διασταύρωσης ο υπολογισμός της μετρικής συμπεριλαμβάνει και το βήμα της συσσώρευσης (aggregation) των τιμών της στα όρια της περιοχής γύρω από το εικονοστοιχείο που μας ενδιαφέρει. I 3.4 Καθολικές μέθοδοι (global methods) Οι μέθοδοι της καθολικής αντιστοίχισης εκμεταλλεύονται μη τοπικούς περιορισμούς προκειμένου να αντιμετωπιστούν προβλήματα, όπως η απόκρυψη
27 (occlusion), η ομογενής υφή κ.λ.π. Γίνεται αντιληπτό, ότι η χρήση τέτοιων περιορισμών συνεπάγεται αυξημένο υπολογιστικό κόστος. 3.5 Δυναμικός προγραμματισμός Ο δυναμικός προγραμματισμός είναι μια υποκατηγορία των καθολικών μεθόδων. Αποτελεί μια τεχνική βελτιστοποίησης και χρησιμοποιείται για τον υπολογισμό μιας καθολικής βέλτιστης λύσης σε διάφορα προβλήματα, που για να λυθούν, απαιτούν πολλά επίπεδα αποφάσεων. Ο δυναμικός προβληματισμός διαιρεί το πρόβλημα σε απλούστερα μικρότερα προβλήματα, δημιουργώντας επίπεδα. Για να γνωρίζουμε σε πιο επίπεδο βρισκόμαστε, χρησιμοποιούμε μια μεταβλητή επιπέδων. Στη συνέχεια μεταβαίνουμε ακολουθιακά από το ένα επίπεδο στο άλλο χρησιμοποιώντας αποφάσεις (αποθηκεύουμε τα αποτελέσματα των αποφάσεων στις μεταβλητές απόφασης), οι οποίες στηρίζονται σε τιμές συναρτήσεων. Οι συναρτήσεις αυτές συνήθως εκτιμούν το κόστος κάθε πιθανής λύσης. Καταλαβαίνουμε λοιπόν, ότι η διαδικασία αυτή, έχει μεγάλη πολυπλοκότητα αν χρησιμοποιηθεί στο πρόβλημα της αντιστοίχισης των εικόνων, όμως με τη χρήση των περιορισμών επιτυγχάνεται η μείωση της. Με την εφαρμογή τους μειώνονται οι πιθανές καταστάσεις-αποφάσεις σε κάθε επίπεδο του δυναμικού προγραμματισμού. Ο δυναμικός προγραμματισμός, στο πρόβλημα της αντιστοίχισης λειτουργεί ως εξής: Για κάθε επιπολική γραμμή αναζητούμε ένα βέλτιστο μονοπάτι σε ένα γράφημα. Το γράφημα για την k επιπολική γραμμή ορίζεται από έναν πίνακα D k, ο οποίος ονομάζεται πίνακας δυναμικού προγραμματισμού για τη γραμμή k. Το κάθε στοιχείο D k (i,j) του πίνακα αυτού έχει τιμή το κόστος της ακμής e ij.η οποία συνδέει τους κόμβους iκαι j. Το κόστος της ακμής είναι η τιμή του μέτρου ομοιότητας μεταξύ του i-οστού εικονοστοιχείου της γραμμής k της αριστερής εικόνας και του j-οστού της γραμμής k της δεξιάς εικόνας. Τα σημεία αυτά ανήκουν στην ίδια γραμμή της εικόνας. 3.6 Ο αλγόριθμος SAD (Άθροισμα απόλυτων διαφορών) Ο αλγόριθμος Sum of Absolute Differences-SAD αποτελεί περίπτωση αλγορίθμου τοπικών αντιστοιχιών. Είναι ένας αλγόριθμος που χρησιμοποιείται για τη μέτρηση της ομοιότητας μεταξύ μπλοκ περιοχών ανάμεσα σε δύο στερεοσκοπικές εικόνες. Η βασική του λειτουργία είναι η λήψη της απόλυτης διαφοράς μεταξύ κάθε εικονοστοιχείου του αρχικού μπλοκ της πρώτης εικόνας,με το αντίστοιχο εικονοστοιχείο στο μπλοκ της δεύτερης εικόνας που συγκρίνουμε. Αυτές οι διαφορές αθροίζονται και δημιουργούν μια απλή μετρική του μπλοκ ομοιότητας.
28 σχ. 3.5 Ο αλγόριθμος του αθροίσματος των απόλυτων διαφορών μπορεί να χρησιμοποιηθεί για διάφορους σκοπούς, όπως η αναγνώριση αντικειμένου και η δημιουργία του χάρτη παραλλάξεων για δύο στερεοσκοπικές εικόνες. Ακολουθεί ένα παράδειγμα για την καλύτερη κατανόηση της λειτουργίας του αλγορίθμου SAD. Χρησιμοποιώντας τον αλγόριθμο του αθροίσματος των απόλυτων διαφορών προσδιορίζουμε ποιο μέρος μιας αναζήτησης της έντασης σε μια εικόνα, συνταυτίζεται με μια δεύτερη εικόνα που έχουμε ως πρότυπο. Έστω ότι το παράθυρο εικόνας που έχουμε ως πρότυπο, είναι μεγέθους 3x3 εικονοστοιχεία, ενώ η εικόνα αναζήτησης είναι μεγέθους 3x5 εικονοστοιχεία και κάθε εικονοστοιχείο αντιπροσωπεύεται με ακέραια τιμή έντασης, από 0 έως 9. Πρότυπο Παράθυρο Εικόνα Αναζήτησης 2 5 5 2 7 5 8 6 4 0 7 1 7 4 2 7 7 5 9 8 4 6 8 5 Εικόνα 3.2 Το παράθυρο εικόνας 3x3 που έχουμε ως πρότυπο για την αναζήτηση και η εικόνα αναζήτησης 3x5 στην οποία θα αναζητήσουμε περιοχή αντιστοίχησης. Παρατηρούμε, ότι υπάρχουν ακριβώς τρία μοναδικά σημεία μέσα στην εικόνα αναζήτησης, όπου το πρότυπο μπορεί να χωρέσει: η αριστερή πλευρά της εικόνας, το κέντρο της εικόνας, και η δεξιά πλευρά της εικόνας. Για τον υπολογισμό των τιμών SAD χρησιμοποιείται η απόλυτη τιμή της διαφοράς μεταξύ κάθε αντίστοιχου ζεύγους των pixels: η διαφορά μεταξύ των 2 και 2 είναι 0, 4 και 1 είναι 3, 7 και 8 είναι 1, και ούτω καθεξής. Υπολογίζοντας τις τιμές SAD (απόλυτες διαφορές) για κάθε μία από αυτές τις τρεις θέσεις, έχουμε το παρακάτω αποτέλεσμα: Left Center Right 0 2 0 5 0 3 3 3 1 3 7 3 3 4 5 0 2 0 1 1 3 3 1 11 3 4 Εικόνα 3.3 Πίνακες τιμών της απόλυτης τιμής της διαφοράς μεταξύ κάθε αντίστοιχου ζεύγους των pixels του πρότυπου παραθύρου και των τριών περιοχών της εικόνας αντιστοίχησης.
29 Για καθεμία από αυτές τις τρείς περιοχές, οι απόλυτες διαφορές προστίθενται μαζί, δίνοντας την τιμή SAD. SAD 1 =0+2+0+3+7+3+1+1+3=20. SAD 2 =5+0+3+3+4+5+3+1+1=25. SAD 3 =3+3+1+0+2+0+1+3+4=17. d(a,b)= ( ) ( ) Από αυτές τις τελικές τιμές SAD είναι προφανές, ότι η δεξιά πλευρά της εικόνας της αναζήτησης είναι η πιο παρόμοια με την εικόνα πρότυπο, επειδή έχει τη μικρότερη διαφορά σε σύγκριση με τις άλλες θέσεις. Το άθροισμα των απόλυτων διαφορών SAD παρέχει έναν απλό τρόπο, για να αυτοματοποιήσει την αναζήτηση για τα αντίστοιχα σημεία μέσα σε μια εικόνα. Ωστόσο, μπορεί το αποτέλεσμα να είναι αναξιόπιστο λόγω των επιπτώσεων συναφών παραγόντων, όπως οι αλλαγές στο φωτισμό, το χρώμα, η κατεύθυνση προβολής, το μέγεθος ή το σχήμα. Έτσι, ο αλγόριθμος SAD χρησιμοποιείται σε συνδυασμό με άλλες μεθόδους, όπως η ανίχνευση ακμών, για να βελτιωθεί η αξιοπιστία των αποτελεσμάτων. Ωστόσο, ο αλγόριθμος SAD είναι ένας εξαιρετικά γρήγορος σε ταχύτητα αλγόριθμος λόγω της απλότητάς του. Είναι ουσιαστικά η απλούστερη δυνατή μετρική,που λαμβάνει υπόψη κάθε pixel του παραθύρου-μπλοκ. Ως εκ τούτου, είναι πολύ αποτελεσματικός για μια ευρεία αναζήτηση κίνησης πολλών διαφορετικών μπλοκ. Τέλος,ο αλγόριθμος αθροίσματος απόλυτων διαφορών είναι επίσης εύκολα παραλληλίσιμος, αφού αναλύει κάθε pixel ξεχωριστά, καθιστώντας τον εύκολα υλοποιήσιμο. 3.7 Ο αλγόριθμος SSD (άθροισμα τετραγωνικών διαφορών) Κλείνοντας αυτή την αναφορά στους αλγόριθμους στερεοσκοπίας έρχεται η σειρά,να αναφερθεί ένας τυπικός αλγόριθμος εύρεσης αντιστοιχιών. Πρόκειται για τον τυπικό αλγόριθμο εύρεσης του αθροίσματος των τετραγωνικών διαφορών (Sum of Squared Differences-SSD). Αποτελεί ένα απλό παράδειγμα αλγορίθμου βασισμένου σε περιοχές (area based). Η καλύτερη αντιστοίχηση για ένα σημείο βρίσκεται συγκρίνοντας ένα τετραγωνικό παράθυρου συγκεκριμένου μεγέθους επικεντρωμένο γύρω από το εικονοστοιχείο ενδιαφέροντος στην εικόνα αναφοράς, με παράθυρα ίδιου μεγέθους, που έχουν ως κέντρο τους τα σημεία της ίδιας επιπολικής γραμμής στην εικόνα-στόχος. Το άθροισμα των τετραγωνικών διαφορών ανάμεσα σε αυτά τα παράθυρα χρησιμοποιείται ως μέτρο ανομοιότητας. Το σημείο που ελαχιστοποιεί το μέτρο αυτό, επιλέγεται ως η καλύτερη αντιστοιχία και εκεί υπολογίζεται η παράλλαξη.
30 Ο αλγόριθμος αθροίσματος τετραγωνικών διαφορών βασίζεται στην εξής σχέση διαφοράς έντασης για κάθε pixel του παραθύρου: ( I1 ( x, y) I ( x, y)) 2 2 σχ. 3.6 Χρησιμοποιώντας ένα παράθυρο συσσώρευσης για καλύτερη υποστήριξη της μετρικής καταλήγουμε στη σχέση: u, v ( I1 ( u, v) I ( u d, v)) 2 2 σχ. 3.7 Ακολουθεί ένας ψευδοκώδικας, που υλοποιεί τον αλγόριθμο SSD. Ο αλγόριθμος αυτός δεν μπορεί να χειριστεί τα όρια της εικόνας, αφού τα παράθυρο θα αφήνει πάντα μια περιοχή ίση με το μισό του, όπου δεν μπορούν να υπολογιστούν οι παραλλάξεις. Έτσι, είναι αναγκαίο, η εικόνα να επεκτείνεται πέρα από την περιοχή όπου μπορεί να υπολογιστεί ο χάρτης παραλλάξεων. SSD Εικόνα 3.4 Ψευδοκώδικας υλοποίησης του αλγόριθμου SSD.
31 Η επιλογή του μεγέθους του παραθύρου παίζει καθοριστικότατο ρόλο στο αποτέλεσμα, που δεν είναι άλλο από τον χάρτη παραλλάξεων. Ένα μικρό παράθυρο έχει σαν αποτέλεσμα πολλές κακές αντιστοιχίσεις, λόγω θορύβου, όμως διατηρεί το σχήμα των αντικειμένων με σχετική ακρίβεια. Η επιλογή ενός μεγάλου παραθύρου έχει σαν αποτέλεσμα λιγότερες λανθασμένες αντιστοιχίσεις, όμως αρχίζει να παραμορφώνεται το σχήμα των αντικειμένων. Εικόνα 3.5 Χάρτες παραλλάξεων υπολογισμένοι με τον αλγόριθμο SSD. Οι δύο επάνω εικόνες είναι το στερεοσκοπικό ζεύγος, ενώ οι δύο κάτω είναι οι χάρτες παραλλάξεων για παράθυρο 3x3 και 7x7 αντίστοιχα. Οι παραλλάξεις κωδικοποιούνται με αποχρώσεις του γκρι.
32 Κεφάλαιο 4 Η κατασκευή της στερεοσκοπικής διάταξης 4.1 Η γεωμετρία που ικανοποιεί η στερεοσκοπική διάταξη Η στερεοσκοπική διάταξη που κατασκευάστηκε για τον σκοπό της εργασίας αυτής, ικανοποιεί την πιο απλή στερεοσκοπική γεωμετρία, η οποία βασίζεται και προκύπτει με δύο εντελώς όμοιες, παράλληλες κάμερες, που τα επίπεδα της εικόνας τους συμπίπτουν και των οποίων οι άξονες x είναι παράλληλοι στη βασική γραμμή (τη γραμμή που ενώνει τα εστιακά τους σημεία). Σε αυτή την απλή γεωμετρία, όπως αναφέραμε σε προηγούμενο κεφάλαιο της εργασίας αυτής, οι επιπολικές γραμμές είναι οριζόντιες και έχουν την ίδια συντεταγμένη y. Επίσης οι επιπολικές γραμμές αντιστοιχούν με τις γραμμές της κάμερας, scan lines, πράγμα που αυτομάτως σημαίνει ευκολότερη αντιστοίχηση των παραθύρων αναζήτησης. 4.2 Οι προδιαγραφές των καμερών της διάταξης Οι δύο κάμερες που χρησιμοποιούνται στη στερεοσκοπική διάταξη είναι απόλυτα όμοιες μεταξύ τους. Η κατηγορία στην οποία ανήκουν είναι τύπου Dome, είναι έγχρωμες αναλογικές και διαθέτουν τα εξής χαρακτηριστικά: 1. Ο αισθητήρας της εικόνας είναι μάρκας Sony και διάστασης 1/3 inches. 2. Η ανάλυση της εικόνας σε γραμμές είναι 600 TVL. 3. Η ανάλυση της εικόνας σε pixels είναι 720(H) x 480(V). 4. Ο φακός έχει τα εξής χαρακτηριστικά 3,6mm / F 2.0. 5. Η ελάχιστη φωτεινότητα 0.0005 Lux / F 2.0. 6. Η χρήση της κάμερας μπορεί να είναι εσωτερική και εξωτερική. 7. S/N Ratio: 48dB. 8. Video Out: Σύνθετο σήμα (1V p-p, 75Ω). 9. Ο χρόνος του κλείστρου: PAL 1/50-1/100, 000Sec, NTSC 1/60Sec- 1/100, 000Sec. 10. Η θερμοκρασία λειτουργίας μπορεί να είναι από -10 ο C έως +50 ο C. 11. Η ισορροπία του λευκού χρώματος είναι αυτόματη. 12. Η τροφοδοσία της κάμερας γίνεται με 12Volt DC τάσης και 500mA ένταση ρεύματος. 13. Το βάρος της είναι τα 300gr.
Εικόνα 4.1 Dome camera η οποία χρησιμοποιήθηκε για την υλοποίηση της στερεοσκοπικής διάταξης. 33
34 4.3 Σχεδιασμός της στερεοσκοπικής διάταξης. Ο σχεδιασμός της στερεοσκοπικής διάταξης που θα χρησιμοποιηθεί και η κατασκευή της, θα πρέπει να ικανοποιεί όπως έχει προαναφερθεί την απλή στερεοσκοπική γεωμετρία των δύο όμοιων παράλληλων καμερών, επομένως η διάταξη θα πρέπει να είναι τέτοια ώστε να εξασφαλίζει αυτό το γεγονός. Ο πρώτος παράγοντας που θα πρέπει να ικανοποιείται είναι η ακέραιη τοποθέτηση των δύο καμερών και η ευχέρεια των μικρομετρικών ρυθμίσεων που θα πρέπει να διακατέχει η διάταξή μας ώστε να επιτυγχάνεται η ρύθμιση των καμερών για τον απόλυτο παραλληλισμό των δύο στερεοσκοπικών καμερών. Ένας δεύτερος παράγοντας που θα πρέπει να ικανοποιείται είναι η στήριξη της στερεοσκοπικής μας διάταξης η οποία με την σειρά της θα μας δίνει το δικαίωμα της ρύθμισης, μια ρύθμιση η οποία θα γίνεται ώστε ο χειριστής της στερεοσκοπικής διάταξης να μπορεί να τοποθετεί την διάταξη σε οποιοδήποτε σημείο και να επιτυγχάνει τον παραλληλισμό με το έδαφος - επίπεδο τοποθέτησης της στερεοσκοπικής διάταξης, πράγμα σημαντικό για την ευστοχία των αποτελεσμάτων που θα έχει. Τρίτος παράγοντας αποτελεί η προσεκτική τοποθέτηση και στήριξη των στερεοσκοπικών καμερών στην διάταξη, μια τοποθέτηση η οποία δεν θα δημιουργεί υπερθέρμανση της πλακέτας των καμερών και δεν θα επιτρέπει την άμεση επαφή με οποιοδήποτε σημείο της διάταξης 4.4 Το βασικό σχέδιο της στερεοσκοπικής διάταξης. Η στερεοσκοπική βάση απαρτίζεται από τέσσερα ορθογώνια plexiglass, τα δύο μεγαλύτερα από αυτά αποτελούν τον κορμό της κατασκευής, το σχήμα της κόλληση τους είναι κάθετο μεταξύ τους και σχηματίζουν το ανάποδο Τ. Το κάτω μέρος προορίζεται για την τοποθέτηση της βάσης της διάταξης και το πάνω μέρος αποτελεί την «πλάτη ραχοκοκαλιά» των καμερών. Στα άλλα δύο κατά πολύ μικρότερα plexiglass θα τοποθετηθούν οι δύο στερεοσκοπικές κάμερες και θα διαθέτουν τέτοιο σχεδιασμό ο οποίος θα δίνει την δυνατότητα των μικρομετρικών ρυθμίσεων που έχουμε αναφέρει παραπάνω, αυτά με την σειρά τους θα τοποθετηθούν στο μεγαλύτερο διαστάσεων plexiglass που ορίσαμε παραπάνω ως τη «ραχοκοκαλιά» της στερεοσκοπικής βάσης.
Εικόνα 4.2 Γενικός σχεδιασμός της στερεοσκοπικής διάταξης 35
36 4.5 Περιγραφή του βασικότερου τμήματος που απαρτίζεται η βάση. Το πιο σημαντικό τμήμα της στερεοσκοπικής διάταξης είναι το Plexiglass το οποίο αποτελεί την «ραχοκοκαλιά» της κατασκευής μας. Οι διαστάσεις που το διακατέχουν είναι 21εκ. μήκος και 5,5εκ πλάτος, επομένως έχει ένα εμβαδό της τάξεως των 115,5 τ.εκ.. Είναι το πιο σημαντικό καθώς μέσω του κατάλληλου σχεδιασμού που διαθέτει, ο χρήστης της στερεοσκοπικής κατασκευής έχει την δυνατότητα να πραγματοποιήσει κάποιες μικρομετρικές ρυθμίσεις μέσω των οποίων να πετύχει την απόλυτη στερεοσκοπική γεωμετρία των παράλληλων στερεοσκοπικών καμερών. H αριστερή πλευρά του plexiglass διαθέτει δύο τρύπες εσοχές διαστάσεων 3 χιλιοστών, για την παράλληλη μετατόπιση της αριστερής στερεοσκοπικής κάμερας, με αυτή τη ρύθμιση έχουμε δύο διαφορετικά baseline μεταξύ των καμερών μας για περαιτέρω πειραματισμό. Στη δεξιά πλευρά του plexiglass υπάρχουν τρείς τρύπες-εσοχές διαστάσεων 3χιλιοστών οι οποίες βρίσκονται στις γωνίες ενός ισόπλευρου τριγώνου με την κάθε πλευρά του να είναι 2,9εκ, πράγμα που αυτομάτως γίνεται αντιληπτό ότι η κάθε τρύπα βρίσκεται σε αυτή την απόσταση από τις άλλες δύο αντίστοιχα. Αυτές οι τρύπες-εσοχές μας δίνουν την δυνατότητα μιας πολύ σημαντικής κίνησης που θα αποκτήσει κατά την τοποθέτηση της η δεξιά στερεοσκοπική κάμερα. Στη μέση του ύψους που άγεται από την κορυφή του ισόπλευρου τριγώνου που ορίστηκε παραπάνω δημιουργήσαμε δύο τρύπες των 1,5χιλιοστών μέσα από της οποίες θα περνάει λαστιχάκι μέσω του οποίου θα επιτυγχάνεται η συγκράτηση της δεξιάς κάμερας. Τέλος θα πρέπει να αναφερθεί ότι σε αυτό το κομμάτι του plexiglass υπάρχουν 3 τρύπες των 0,9εκ ώστε να μπορούν να περάσουν τα καλώδια λειτουργίας των καμερών ανάλογα με την τοποθέτηση που έχει πραγματοποιηθεί στις δύο στέρεοκάμερες. Εικόνα 4.3 Σχέδιο του βασικότερου plexiglass της στερεοσκοπικής διάταξης.
37 4.6 Περιγραφή των δύο plexiglass τοποθέτησης των δύο καμερών. Ένα πρόβλημα που θα έπρεπε να λυθεί κατά την κατασκευή της στερεοσκοπικής διάταξης αποτελεί ο τρόπος στήριξης των δύο στερεοσκοπικών καμερών, γνωρίζοντας ότι ο τρόπος στήριξης δύο πλακετών θέτει δυσκολίες στην άμεση τοποθέτηση. Την επίλυση αυτού το προβλήματος έρχονται να λύσουν τα δύο plexiglass διαστάσεων 6cm μήκους και 4,5cm πλάτους. Η κύρια δουλειά τους είναι η προσαρμογή των δύο καμερών στην υπόλοιπη στερεοσκοπική βάση. Το κάθε ένα από αυτά έχει σχεδιαστεί έτσι ώστε η τοποθέτηση του και μόνο να παρέχει στις δύο στερεοκάμερες την δυνατότητα της κίνησης σε συγκεκριμένες θέσεις και σε συγκεκριμένα όρια ώστε να επιτυγχάνεται μέσω των μικρομετρικών ρυθμίσεων, η απόλυτη παραλληλία των δύο στερεοσκοπικών καμερών για την επίτευξη της απλούστερης στερεοσκοπικής γεωμετρίας. Τα δύο plexiglass έχουν διαφορετικό τρόπο στήριξης και τοποθέτησης πάνω στην υπόλοιπη στερεοσκοπική βάση και κυρίως πάνω στο plexiglass που έχει αναφερθεί σε προηγούμενη αναφορά για αυτό ως η ραχοκοκαλιά της βάσης μας. Επίσης διαθέτουν τρύπα διαστάσεων 0,9εκ για την έξοδο των καλωδίων τροφοδοσίας και εξόδου του σήματος των καμερών. Το ένα από αυτά, το οποίο προορίζεται για την στήριξη της αριστερής κάμερας διαθέτει στο κέντρο ακριβώς μια διατομή μήκους 1,2εκ. και πάχους 3χιλ. Η διατομή αυτή πραγματοποιήθηκε ώστε να δώσει στον χρήστη της στερεοσκοπικής βάσης την δυνατότητα της μετατόπισης της κάμερας μέσα σε αυτή την διατομή, την πάνω - κάτω κίνηση. Το πάχος έχει ρυθμιστεί σε αυτό το μέγεθος έτσι ώστε να περνάει βίδα αυτών των διαστάσεων και με την χρήση ενός παξιμαδιού να γίνεται εφικτή η στήριξη της αριστερής κάμερας. Εικόνα 4.4 Plexiglass στήριξης της αριστερής στερεοσκοπικής κάμερας