Ειδική Επιστημονική Εργασία ΦΑΚΑ ΣΟΦΙΑ Α.Μ: 83. Επιβλέπων καθηγητής: Φωτόπουλος Σπυρίδων



Σχετικά έγγραφα
I. ΜΙΓΑΔΙΚΟΙ ΑΡΙΘΜΟΙ. math-gr

Συστήματα συντεταγμένων

Στόχος της εργασίας και ιδιαιτερότητες του προβλήματος

ΜΙΓΑΔΙΚΟΙ ΑΡΙΘΜΟΙ ΕΠΙΜΕΛΕΙΑ : ΑΥΓΕΡΙΝΟΣ ΒΑΣΙΛΗΣ

V (F ) = {(u 1, u 2, u 3 ) P 2 K F (u 1, u 2, u 3 ) = 0}

ΧΡΗΣΗ ΝΕΩΝ ΟΠΤΙΚΩΝ ΚΑΙ ΨΗΦΙΑΚΩΝ ΜΕΘΟΔΩΝ ΓΙΑ ΤΗΝ ΑΝΤΙΓΡΑΦΗ ΤΡΙΣΔΙΑΣΤΑΤΩΝ ΑΝΤΙΚΕΙΜΕΝΩΝ ΣΤΕΦΑΝΙΑ ΧΛΟΥΒΕΡΑΚΗ 2014

ισδιάστατοι μετασχηματισμοί ΚΕΦΑΛΑΙΟ 4: ισδιάστατοι γεωμετρικοί μετασχηματισμοί

ΔΕΙΓΜΑ ΠΡΙΝ ΤΙΣ ΔΙΟΡΘΩΣΕΙΣ - ΕΚΔΟΣΕΙΣ ΚΡΙΤΙΚΗ

Κεφάλαιο 8. Οπτικοποίηση Απαλοιφή

Κεφάλαιο 5. Το Συμπτωτικό Πολυώνυμο

Μαθηματική Εισαγωγή Συναρτήσεις

Μαθηματική Εισαγωγή Συναρτήσεις

1. Ιδιότητες φακών. 1 Λεπτοί φακοί. 2 Απριλίου Βασικές έννοιες

1 x m 2. degn = m 1 + m m n. a(m 1 m 2...m k )x m 1

Βαθμονόμηση Κάμερας με τη Χρήση των Σημείων Φυγής στις Τρεις Διαστάσεις

Φυσική για Μηχανικούς

Τι είναι βαθμωτό μέγεθος? Ένα μέγεθος που περιγράφεται μόνο με έναν αριθμό (π.χ. πίεση)

ΜΑΘΗΜΑΤΑ ΜΑΘΗΜΑΤΙΚΑ ΘΕΤΙΚΟΥ ΠΡΟΣΑΝΑΤΟΛΙΣΜΟΥ Β ΛΥΚΕΙΟΥ

Περιεχόμενα. Κεφάλαιο 3 Οι ιδιότητες των αριθμών Αριθμητικά σύνολα Ιδιότητες Περισσότερες ιδιότητες...

Η ΓΕΝΙΚΕΥΜΕΝΗ ΓΕΩΜΕΤΡΙΑ

ΜΑΘΗΜΑΤΙΚΑ ΘΕΤΙΚΗΣ & ΤΕΧΝΟΛΟΓΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ Γ ΛΥΚΕΙΟΥ ΜΙΓΑΔΙΚΟΙ ΑΡΙΘΜΟΙ ΛΥΜΕΝΕΣ & ΑΛΥΤΕΣ ΑΣΚΗΣΕΙΣ. Επιμέλεια: Γ. Π. Βαξεβάνης (Γ. Π. Β.

Οδηγίες σχεδίασης στο περιβάλλον Blender

Στ Τάξη. Α/Α Μαθηματικό περιεχόμενο Δείκτες Επιτυχίας Ώρες Διδ. 1 ENOTHTA 1

Χωρικές σχέσεις και Γεωμετρικές Έννοιες στην Προσχολική Εκπαίδευση

Οδηγίες για το Geogebra Μωυσιάδης Πολυχρόνης Δόρτσιος Κώστας

Μηχανολογικό Σχέδιο με τη Βοήθεια Υπολογιστή. Γεωμετρικός Πυρήνας Προβολικοί Μετασχηματισμοί

Η Γεωμετρία της Αντιστροφής Η βασική θεωρία. Αντιστροφή

4. ΚΕΦΑΛΑΙΟ ΕΦΑΡΜΟΓΕΣ ΤΟΥ ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΥ FOURIER

ΘΕΩΡΙΑ Α ΓΥΜΝΑΣΙΟΥ. Η διαίρεση καλείται Ευκλείδεια και είναι τέλεια όταν το υπόλοιπο είναι μηδέν.

Κεφάλαιο 4 Διανυσματικοί Χώροι

Από το Γυμνάσιο στο Λύκειο Δειγματικός χώρος Ενδεχόμενα Εύρεση δειγματικού χώρου... 46

ΣΗΜΕΙΩΣΕΙΣ. Από προηγούμενες τάξεις γνωρίζουμε ότι το τετράγωνο οποιουδήποτε πραγματικού αριθμού

Μελέτη συστήματος φακών με τη Μέθοδο του Newton

Οι διαθέσιμες μέθοδοι σε γενικές γραμμές είναι:

Φυσική για Μηχανικούς

5/3/2010. A. Στη δηµιουργία του στερεοσκοπικού µοντέλουέ B. Στη συσχέτισή του µε το γεωδαιτικό σύστηµα

ΕΝΝΟΙΑ ΤΟΥ ΜΙΓΑΔΙΚΟΥ ΑΡΙΘΜΟΥ ΠΡΑΞΕΙΣ ΣΤΟ ΣΥΝΟΛΟ ΤΩΝ ΜΙΓΑΔΙΚΩΝ

Στην ουσία η Φωτογραµµετρία: Χ, Υ, Ζ σηµείων Γραµµικό σχέδιο Εικονιστικό προϊόν

2 Ο ΚΕΦΑΛΑΙΟ Ενότητα 5.

Περιεχόμενα. Κεφάλαιο 3 Οι ιδιότητες των αριθμών Αριθμητικά σύνολα Ιδιότητες Περισσότερες ιδιότητες...

από t 1 (x) = A 1 x A 1 b.

ΘΕΩΡΙΑ Β ΓΥΜΝΑΣΙΟΥ. Μια παράσταση που περιέχει πράξεις με μεταβλητές (γράμματα) και αριθμούς καλείται αλγεβρική, όπως για παράδειγμα η : 2x+3y-8

Από το Γυμνάσιο στο Λύκειο Δειγματικός χώρος Ενδεχόμενα Εύρεση δειγματικού χώρου... 46

Κεφάλαιο 4 Διανυσματικοί Χώροι

ΑΛΓΕΒΡΑ Β ΓΕΝΙΚΟΥ ΛΥΚΕΙΟΥ

ΑΛΓΕΒΡΑ Α Τάξης Ημερησίου ΓΕΛ

ΜΑΘΗΜΑΤΙΚΑ ΘΕΤΙΚΗΣ & ΤΕΧΝΟΛΟΓΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ Γ ΛΥΚΕΙΟΥ ΜΙΓΑΔΙΚΟΙ ΑΡΙΘΜΟΙ ΛΥΜΕΝΕΣ & ΑΛΥΤΕΣ ΑΣΚΗΣΕΙΣ

ΘΕΩΡΙΑ ΜΑΘΗΜΑΤΙΚΑ ΠΡΟΣΑΝΑΤΟΛΙΣΜΟΥ Β ΛΥΚΕΙΟΥ

ΕΡΓΑΣΤΗΡΙΟ ΠΟΛΥΜΕΣΩΝ ΚΑΙ ΓΡΑΦΙΚΩΝ

Ενδεικτική Οργάνωση Ενοτήτων. E Τάξη. Α/Α Μαθηματικό περιεχόμενο Δείκτες Επιτυχίας Ώρες Διδ. 1 ENOTHTA 1

Μετασχηματισμοί Μοντελοποίησης (modeling transformations)

Μεθοδολογία Παραβολής

Ανάκλαση Είδωλα σε κοίλα και κυρτά σφαιρικά κάτοπτρα. Αντώνης Πουλιάσης Φυσικός M.Sc. 12 ο ΓΥΜΝΑΣΙΟ ΠΕΡΙΣΤΕΡΙΟΥ

ΜΑΘΗΜΑΤΙΚΑ Θετικής & Τεχνολογικής Κατεύθυνσης Β ΜΕΡΟΣ (ΑΝΑΛΥΣΗ) ΚΕΦ 1 ο : Όριο Συνέχεια Συνάρτησης

Στο προοπτικό ανάγλυφο για τη ευθεία του ορίζοντα χρησιμοποιούμε ένα δεύτερο κατακόρυφο επίπεδο Π 1

Τμήμα Φυσικής, Παν/μιο Ιωαννίνων, Ειδική Σχετικότητα, Διάλεξη 5 Οι Μετασχηματισμοί του Lorentz και η Συστολή του μήκους

t : (x, y) x 2 +y 2 y x

Απαραίτητες αφού 3Δ αντικείμενα απεικονίζονται σε 2Δ συσκευές. Θέση παρατηρητή. 3Δ Μετασχ/σμός Παρατήρησης

ΓΡΑΜΜΙΚΗ ΑΛΓΕΒΡΑ (ΗΥ-119)

Φωτογραμμετρία ΙΙ Προσανατολισμοί φωτογραμμετρικώνεικόνων (Υπενθύμιση βασικών εννοιών- Αλγοριθμική προσέγγιση)

Μεθοδολογία Έλλειψης

7.1 ΜΕΤΡΗΣΗ ΤΗΣ ΕΣΤΙΑΚΗΣ ΑΠΟΣΤΑΣΗΣ ΦΑΚΩΝ

Μαθηματικά Θετικής και Τεχνολογικής Κατεύθυνσης Γ Λυκείου Η ΕΝΝΟΙΑ ΤΟΥ ΜΙΓΑΔΙΚΟΥ ΑΡΙΘΜΟΥ

ΤΡΙΣΔΙΑΣΤΑΤΗ ΑΝΑΚΑΤΑΣΚΕΥΗ ΧΩΡΟΥ ΑΠΟ ΕΝΑ ΜΙΚΡΟ ΑΡΙΘΜΟ ΦΩΤΟΓΡΑΦΙΩΝ

x y z d e f g h k = 0 a b c d e f g h k

ΕΠΑΝΑΛΗΨΗ ΜΑΘΗΜΑΤΙΚΑ ΚΑΤΕΥΘΥΝΣΗΣ Β ΛΥΚΕΙΟΥ ( α μέρος )

Αρχιτεκτονική σχεδίαση με ηλεκτρονικό υπολογιστή

1.3 ΠΟΛΛΑΠΛΑΣΙΑΣΜΟΣ ΑΡΙΘΜΟΥ ΜΕ ΔΙΑΝΥΣΜΑ

ΣΗΜΕΙΩΣΕΙΣ. Η έννοια του μιγαδικού Το σύνολο των μιγαδικών. Από προηγούμενες τάξεις γνωρίζουμε ότι το τετράγωνο οποιουδήποτε πραγματικού αριθμού

Θέση και Προσανατολισμός

ΕΝΟΤΗΤΑ 1: ΟΡΙΣΜΟΣ ΠΕΔΙΟ ΟΡΙΣΜΟΥ ΠΡΑΞΕΙΣ ΣΥΝΑΡΤΗΣΕΩΝ ΓΡΑΦΙΚΕΣ ΠΑΡΑΣΤΑΣΕΙΣ ΒΑΣΙΚΩΝ ΣΥΝΑΡΤΗΣΕΩΝ ΛΥΜΕΝΑ ΘΕΜΑΤΑ ΘΕΜΑ Α

Μαθηματικό υπόβαθρο. Κεφάλαιο 3. Μαθησιακοί στόχοι. 3.1 Εισαγωγή. 3.2 Σημεία και διανύσματα

Γραφικά Υπολογιστών. Τμήμα Μηχανικών Πληροφορικής ΤΕΙ Ανατολικής Μακεδονίας και Θράκης. Γραφικά Υπολογιστών ΣΤ Εξάμηνο. Δρ Κωνσταντίνος Δεμερτζής

ΕΠΑΝΑΛΗΨΗ Α ΓΥΜΝΑΣΙΟΥ

Κεφάλαιο 7. Τρισδιάστατα Μοντέλα

1.5 ΕΣΩΤΕΡΙΚΟ ΓΙΝΟΜΕΝΟ ΔΙΑΝΥΣΜΑΤΩΝ

ΣΧΕΔΙΑΣΗ ΜΗΧΑΝΟΛΟΓΙΚΩΝ ΚΑΤΑΣΚΕΥΩΝ ΜΕ Η/Υ (Computer Aided Design)

Μετασχηµατισµοί 2 &3

Αριθμητική Ανάλυση και Εφαρμογές

ΠΡΟΔΙΑΓΡΑΦΕΣ - ΟΔΗΓΙΕΣ ΔΙΑΜΟΡΦΩΣΗΣ ΘΕΜΑΤΩΝ ΓΙΑ ΤΟ ΜΑΘΗΜΑ

Ψηφιοποίηση και Ψηφιακή Επεξεργασία Εικόνας

Βρέντζου Τίνα Φυσικός Μεταπτυχιακός τίτλος: «Σπουδές στην εκπαίδευση» ΜEd stvrentzou@gmail.com

Τεχνικές Μείωσης Διαστάσεων. Ειδικά θέματα ψηφιακής επεξεργασίας σήματος και εικόνας Σ. Φωτόπουλος- Α. Μακεδόνας

Μιγαδικοί Αριθμοί. Μαθηματικά Γ! Λυκείου Θετική και Τεχνολογική Κατεύθυνση. Υποδειγματικά λυμένες ασκήσεις Ασκήσεις προς λύση

ΚΑΤΑΓΡΑΦΗ ΤΟΥ ΙΧΝΟΥΣ ΤΗΣ ΟΠΤΙΚΗΣ ΑΝΑΖΗΤΗΣΗΣ: ΜΙΑ ΜΕΘΟΔΟΣ ΔΙΕΡΕΥΝΗΣΗΣ ΤΗΣ ΕΠΙΛΕΚΤΙΚΟΤΗΤΑΣ ΤΗΣ ΟΠΗΣ ΩΣ ΒΑΣΙΚΟΥ ΧΑΡΑΚΤΗΡΙΣΤΙΚΟΥ ΤΟΥ ΣΧΗΜΑΤΟΣ

Μαθηματικά Κατεύθυνσης (Προσανατολισμού)

Ταξινόμηση καμπυλών και επιφανειών με τη βοήθεια των τετραγωνικών μορφών.

ΜΑΘΗΜΑΤΙΚΑ ΘΕΤΙΚΗΣ & ΤΕΧΝΟΛΟΓΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ Β ΛΥΚΕΙΟΥ

1,y 1) είναι η C : xx yy 0.

ΕΠΑΝΑΛΗΠΤΙΚΑ ΘΕΜΑΤΑ ΚΕΦΑΛΑΙΟ

Αντικείμενα και γεωμετρικοί μετασχηματισμοί

ΜΑΘΗΜΑΤΙΚΑ ΘΕΤΙΚΗΣ-ΤΕΧΝΟΛΟΓΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ. ΜΕΡΟΣ Α : Άλγεβρα. Κεφάλαιο 2 ο (Προτείνεται να διατεθούν 12 διδακτικές ώρες) Ειδικότερα:

Εισόδημα Κατανάλωση

Η ΚΛΑΣΙΚΗ ΘΕΩΡΗΣΗ ΤΟΥ ΧΩΡΟΥ ΚΑΙ ΤΟΥ ΧΡΟΝΟΥ

Μηχανολογικό Σχέδιο με τη Βοήθεια Υπολογιστή. Αφφινικοί Μετασχηματισμοί Αναπαράσταση Γεωμετρικών Μορφών

ΦΩΤΟΓΡΑΜΜΕΤΡΙΑ ΙΙ ΕΠΑΝΑΛΗΨΗ. Ανδρέας Γεωργόπουλος Καθηγητής Ε.Μ.Π.

ΜΑΘΗΜΑΤΙΚΑ ΘΕΤΙΚΟΥ ΠΡΟΣΑΝΑΤΟΛΙΣΜΟΥ

Η ΚΙΝΗΣΗ ΣΩΜΑΤΙΟ Ή ΥΛΙΚΟ ΣΗΜΕΙΟ Ή ΣΗΜΕΙΑΚΟ ΑΝΤΙΚΕΙΜΕΝΟ

Transcript:

Ειδική Επιστημονική Εργασία Τρισδιάστατη ανακατασκευή αντικειμένων από φωτογραφίες (με χρήση Matlab) ΦΑΚΑ ΣΟΦΙΑ Α.Μ: 83 Επιβλέπων καθηγητής: Φωτόπουλος Σπυρίδων ΠΑΤΡΑ ΔΕΚΕΜΒΡΙΟΣ 010

Πρόλογος Η παρούσα ειδική επιστημονική εργασία εκπονήθηκε στα πλαίσια του Προγράμματος Μεταπτυχιακών Σπουδών Ειδίκευσης "Ηλεκτρονική και Επεξεργασία της Πληροφορίας" του τμήματος Φυσικής, του Πανεπιστημίου Πατρών. Το αντικείμενο της εργασίας είναι η τρισδιάστατη ανακατασκευή ενός αντικειμένου ή ενός χώρου, μέσα από τουλάχιστο δύο φωτογραφίες του. Το θέμα της εργασίας είναι μέρος του τομέα της Υπολογιστικής Όρασης, που έχει μεγάλη άνθιση τα τελευταία χρόνια λόγω των πολλών εφαρμογών, όπου η γνώση της τρισδιάστατης δομής ενός αντικειμένου ή ενός χώρου κρίνεται απαραίτητη. Βέβαια, συνέβαλε σε αυτό και η ραγδαία εξέλιξη των ηλεκτρονικών υπολογιστών, με αποτέλεσμα να είναι δυνατή η ακριβής και ποιοτική απεικόνιση σύνθετων τρισδιάστατων σκηνών σε πραγματικό χρόνο, μέσω κατάλληλων αλγορίθμων. Η τρισδιάστατη ανακατασκευή ενός αντικειμένου ή ενός χώρου, από φωτογραφίες ή βίντεο αποτελεί ένα ενδιαφέρον και εντυπωσιακό θέμα με πολλές εφαρμογές και πολύ ενθαρρυντικά αποτελέσματα. Αυτά αποτέλεσαν ουσιαστικά και το έναυσμα για την ενασχόλησή μου με τον τομέα της Υπολογιστικής Όρασης και την επιλογή του θέματος της εργασίας. Οι εφαρμογές που αναπτύσσονται στα πλαίσια της εργασίας παρέχουν οπτικά ευχάριστα αποτελέσματα και έχουν μεγάλη προσαρμοστικότητα και ευελιξία στης διάφορες συνθήκες φωτογράφησης ή λήψης βίντεο. Το σημαντικό, λοιπόν, είναι ότι δεν χρειάζεται απαραίτητα περιβάλλον εργαστηρίου για την λήψη των δεδομένων, δηλαδή των εικόνων. Προκύπτουν καλά αποτελέσματα ακόμα και με εικόνες που λήφθηκαν μέσω μίας απλής φορητής φωτογραφικής κάμερας, χωρίς τρίποδα για στήριξη. Αρκεί απλά να δημιουργήσουμε τις προϋποθέσεις για μικρή κίνηση της κάμερας μεταξύ των λήψεων των εικόνων. Στην παρούσα εργασία παρουσιάζονται και εξετάζονται διεξοδικά όλα τα θέματα που αφορούν την τρισδιάστατη οπτικοποίηση των αντικειμένων. Αρχικά, στις παραγράφους.1 έως 3., αναλύεται η θεωρία των δύο κυριότερων μεθόδων της "Δομής και Κίνησης" [1-9] και της "Στερεοσκοπικής Όρασης" [1]. Στην συνέχεια στις παραγράφους 3.3 και 3.4 αναπτύσσεται η μεθοδολογία που ακολουθείται από τις εφαρμογές της Δομής και Κίνησης [10-9], ενώ της Στερεοσκοπική Όρασης αναπτύσσεται στην 3.5 [30-33]. Στην μέθοδο της Δομής και Κίνησης περικλείονται δύο περιπτώσεις. Η πρώτη είναι η μη βαθμονομημένη περίπτωση και η δεύτερη είναι η βαθμονομημένη. Στην δεύτερη, λοιπόν, προηγείται η βαθμονόμηση της κάμερας, οπότε είναι γνωστές εκ των προτέρων οι παράμετροι της κάμερας [39]. Η υλοποίηση των αλγορίθμων γίνεται στο παράρτημα, με την βοήθεια του περιβάλλοντος αριθμητικής υπολογιστικής της προγραμματιστικής γλώσσας Matlab [34-38,40-43]. Τέλος, στο τέταρτο κεφάλαιο, δίνονται κάποια παραδείγματα ανακατασκευών που αποδεικνύουν την αποτελεσματικότητα των αλγορίθμων της υλοποίησης. Τόσο η θεωρία, όσο και οι αλγόριθμοι που παρουσιάζονται στην παρούσα εργασία καλύπτουν πλήρως τις απαραίτητες γνώσεις για την υλοποίηση της τρισδιάστατης αναπαράστασης. Συσσωρεύτηκαν πληροφορίες από δύο μεθόδους, δηλαδή της Δομής και Κίνησης αλλά και της Στερεοσκοπικής Όρασης, οι οποίες συνδυασμένες δίνουν βέλτιστα και αρτιότερα αποτελέσματα. Πρωταρχικός στόχος της εργασίας είναι η ανάδειξη των δυνατοτήτων που παρέχουν οι συγκεκριμένες μέθοδοι. Από την άλλη μεριά, η υλοποίηση των δύο μεθόδων και κατά συνέπεια των αλγόριθμων, αποτελούν μία αρκετά καλή βάση για περαιτέρω ανάπτυξη και προώθηση για μελλοντική έρευνα στον εν λόγω τομέα. Ούτως ή άλλως, τα τελευταία χρόνια, η ερεύνα που αφορά την Υπολογιστική Όραση έχει

αποδώσει και έχει δημιουργήσει ικανοποιητικότατα αποτελέσματα. Οπότε στο μέλλον αναμένονται ισχυρότεροι αλγόριθμοι, βελτιώσεις αλλά και πολλές εφαρμογές στους εξελισσόμενους τομείς της ηλεκτρονικής και όχι μόνο. Η συμβολή κάποιων ανθρώπων για την αποπεράτωση τόσο των σπουδών μου, όσο και της συγκεκριμένης εργασίας ήταν καθοριστική. Έτσι, κλείνοντας θα ήθελα να ευχαριστήσω κυρίως την οικογένεια μου, για την αμέριστη συμπαράσταση και τη ενθάρρυνση τους σε κάθε δυσκολία που αντιμετώπισα, κατά την διάρκεια των σπουδών μου. Τους καθηγητές που με βοήθησαν από το μεταπτυχιακό πρόγραμμα "Ηλεκτρονική και Επεξεργασία της Πληροφορίας", του τμήματος Φυσικής, του Πανεπιστημίου Πατρών, κατά την διάρκεια του προγράμματος, αλλά και τους καθηγητές μου από το Μαθηματικό τμήμα, του Πανεπιστημίου Κρήτης, που μου παρείχαν τις βάσεις και τις μαθηματικές γνώσεις, που αποδεικνύονται απαραίτητες σε κάθε βήμα των σπουδών. Φάκα Σοφία Πάτρα 010

v Introducton he purpose of ths thess s the three-dmensonal reconstructon of an object or a space, through at least two photos. he theme s part of the feld of Computer Vson, whch has known great development n the recent ears due to the man applcatons, where the knowledge of the three-dmensonal structure of an object or a space s necessar. Of course to ths development contrbuted also the rapd evoluton of computers, makng possble the accurate and hgh qualt dspla of complex three-dmensonal scenes n real tme, through approprate algorthms. he three-dmensonal reconstructon of an object or a space, usng photos or vdeo, s an nterestng and mpressve subject wth man applcatons and ver encouragng results. hs was bascall what ntrgued me to nvolve wth the feld of Computer Vson and choose the topc of ths thess. he applcatons n ths thess provde vsuall pleasant results and have great adaptablt and flexblt n varous condtons of shootng and makng of vdeos. What s mportant, therefore, s that a laborator envronment to obtan the data, meanng mages, s not necessar. he results are satsfactor even wth pctures taken b a smple handheld camera, wthout the use of a trpod. It s enough f we just create the proper condtons for a small camera movement between the shots. he present thess presents and dscusses thoroughl all the subjects related wth the three-dmensonal vsualzaton of objects. Frst n paragraphs.1 to 3., s analzed the theor of the two most mportant methods, of "Structure and Moton" [1-9] and of "Stereo Vson" [1]. hen n paragraphs 3.3 and 3.4 s dscussed the methodolog followed b the applcatons of Structure and Moton [10-9], and ths of Stereo Vson s dscussed n paragraph 3.5 [30-33]. he method of Structure and Moton encloses two cases. he frst s the non-calbrated case and the second s the calbrated case. In the calbrated case the calbraton of the camera comes frst, so the parameters of the camera are known n advance [39]. he mplementaton of the algorthms s n the Annex, wth the help of the numercal computng envronment of the programmng language Matlab [34-38,40-43]. Fnall, n chapter four, are gven same examples of reconstructons that demonstrate the effectveness of the algorthms of mplementaton. Both the theor and the algorthms presented n ths thess cover full the necessar knowledge for the materalzaton of the three-dmensonal representaton. he nformaton are s accumulated b two methods, ths of Structure and Moton and ths of Stereo Vson, whch combned gve the best and most complete results. Prmar objectve of ths thess s to hghlght the possbltes offered b these methods. On the other hand, the mplementaton of these two methods and thus the algorthms s a good bass for further development and promoton for future research n ths feld. Anwa, n recent ears, the research on Computer Vson has gven great results. So n the future are expected stronger algorthms, mprovements but also man applcatons relatng wth the developng sector of electroncs and more. Faka Sofa Patra 010

v

v Περιεχόμενα Κεφάλαιο 1: Εισαγωγή 1.1 Γενικές Πληροφορίες...σελ. 1 1. Παθητικές Μέθοδοι...σελ. 1.3 3D Πληροφορίες από Εικόνες...σελ. 3 Κεφάλαιο : Μαθηματικό Υπόβαθρο.1 Προβολική Γεωμετρία...σελ. 5.1.1 Βασικές Έννοιες...σελ. 5.1. Μετασχηματισμοί...σελ. 7.1.3 Ευκλείδεια από Προβολική Γεωμετρία...σελ. 10.1.4 Προβολικό Επίπεδο...σελ. 1.1.5 Προβολικός Χώρος Τριών Διαστάσεων....σελ. 1. Μοντέλο Κάμερας.... σελ. 13.3 Βαθμονόμηση Καμερών... σελ. 17.3.1 Ενδογενείς Παράμετροι... σελ. 17.3. Εξωγενείς Παράμετροι... σελ. 1.3.3 Γνωστοί Αλγόριθμοι για Camera Calbraton... σελ..4 Γεωμετρία Δύο Όψεων Θεμελιώδης Πίνακας...... σελ..5 Ομογραφία... σελ. 5.5.1 Η Σχέση Πινάκων Προβολής με τις Ομογραφίες... σελ. 5.5. Η Σχέση των Θεμελιωδών Πινάκων και Ομογραφίες... σελ. 8.6 Βασικός Πίνακας..... σελ. 8.6.1 Πίνακες Καμερών από Βασικό Πίνακα... σελ. 30.7 Γεωμετρία Τριών Όψεων Τριπλοεστιακός Τανυστής... σελ. 31.8 Γεωμετρία Πολλαπλών Όψεων... σελ. 33 Κεφάλαιο 3: Διαδικασία Ανακατασκευής 3.1 Συσχέτιση Εικόνων......σελ. 35 3.1.1 Αλγόριθμος Εξαγωγής Χαρακτηριστικών Σημείων...σελ. 35 3.1. Συσχέτιση Έντασης Μέτρα Ομοιότητας...σελ. 37 3. Υπολογισμός της Γεωμετρίας Δύο Όψεων......σελ. 39 3..1 Ο Αλγόριθμος Οχτώ Σημείων...σελ. 39 3.. Αλγόριθμος με Περισσότερα Σημεία από Οχτώ Σημεία... σελ. 41 3..3 Ο Αλγόριθμος Επτά Σημείων... σελ. 4 3..4 Ο Αλγόριθμος RANSAC... σελ. 4 3.3 Δομή και Κίνηση σε μη Βαθμονομημένες Κάμερες... σελ. 46 3.3.1 Δομή και Κίνηση σε Δύο Εικόνες (Αρχικό Πλαίσιο)...σελ. 46 3.3. Τριγωνοποίηση... σελ. 47 3.3.3 Προσθήκη Νέας Εικόνας... σελ. 47

v 3.3.4 Αυτό-βαθμονόμηση....... σελ. 50 3.3.4.1 Ομοπαραλληλική Αναδημιουργία (Καθορισμός του )...σελ. 53 3.3.4.1.1 Μέθοδος Περιορισμού Συντελεστών......σελ. 53 3.3.4.1. Μέθοδος των σημείων Φυγής...σελ. 54 3.3.4. Μετρική Ανακατασκευή.....σελ. 56 3.4 Δομή και Κίνηση σε Βαθμονομημένες Κάμερες...σελ. 61 3.4.1 Αρχικό Πλαίσιο...σελ. 61 3.4. Προσθήκη Νέας Εικόνας...σελ. 6 3.5 Στερεοσκοπική Όραση...... σελ. 6 Κεφάλαιο 4: Συμπεράσματα Αποτελέσματα 4.1 Παρατηρήσεις και Προτάσεις για Βελτιώσεις...σελ. 66 4. Αποτελέσματα με Αυτό-βαθμονόμηση... σελ. 67 4.3 Αποτελέσματα με Γνωστό Πίνακα Βαθμονόμησης......σελ. 73 4.4 Αποτελέσματα Dspart Maps...σελ. 77 4.5 Επίλογος... σελ. 81 Παράρτημα Υλοποίηση... σελ. 8 Βιβλιογραφία...σελ. 18 Χρήσιμα Εργαλεία...σελ. 19

1 Κεφάλαιο 1: Εισαγωγή 1.1 Γενικές Πληροφορίες Η τρισδιάστατη οπτικοποίηση άρχισε να αποκτά έδαφος στις πρόσφατες εξελίξεις της τεχνολογίας. Πολλές είναι οι περιπτώσεις όπου η γνώση της τρισδιάστατης δομής ενός αντικειμένου ή ενός χώρου κρίνεται απαραίτητη. Ενδεικτικά αναφέρονται οι τομείς της ρομποτικής, της ιατρικής και της ψηφιακής επεξεργασίας γενικότερα. Εφαρμογές όπως η εικονική περιήγηση σε κτίρια, τα τρισδιάστατα γραφικά στους υπολογιστές και η δημιουργία οπτικών εφέ σε ταινίες είναι κάποιες αναμενόμενες χρήσεις του τομέα που αφορά την τρισδιάστατη αναπαράσταση και ονομάζεται Όραση Υπολογιστών* (Computer Vson). Όμως η αξιοποίηση του σε συνδυασμό με την ψηφιακή επεξεργασία εικόνας δεν περιορίζεται μόνο στα προηγούμενα. Λόγω της αρκετά καλής ακρίβειας των αναπαραστάσεων που παρέχονται και της εμπλοκής του συγκεκριμένου πεδίου με άλλες επιστήμες, η Όραση Υπολογιστών έχει εισέλθει σε θέματα πολύ πιο σημαντικά και ενδιαφέροντα. Κάποια παραδείγματα που εξελίσσονται τελευταία είναι η τρισδιάστατη αναπαράσταση ιατρικών δεδομένων, παραδείγματος χάριν ενός εμβρύου, η παροχή τεχνητής οπτικής αντίληψης για τυφλούς, η χρήση στην εικονική πραγματικότητα και την επικοινωνία (πχ. τρισδιάστατη τηλεόραση, τηλεδιάσκεψη), η αυτόματη καθοδήγηση ενός ρομπότ, η βιομηχανική επίβλεψη, η αναγνώριση προσώπων για λόγους ασφάλειας ή διαδραστικής επικοινωνίας ανθρώπουυπολογιστή και πληθώρα άλλων εφαρμογών. Η ραγδαία εξέλιξη των ηλεκτρονικών υπολογιστών συνέβαλε στην επίτευξη του στόχου για ακριβής και ποιοτική αναπαράσταση αντικειμένων. Είναι δυνατό πλέον, μέσω κατάλληλων αλγορίθμων, να απεικονιστούν σύνθετες τρισδιάστατες σκηνές σε πραγματικό χρόνο, το οποίο κάποια χρόνια πριν ήταν ανέφικτο, καθώς επίσης και η επεξεργασία ψηφιακών εικόνων πολύ υψηλής ανάλυσης, που συνεπάγεται μεγάλο όγκο δεδομένων. Αυτή η εξέλιξη προκαλεί μια σημαντική αξίωση για πιο σύνθετα και ρεαλιστικά μοντέλα. Το πρόβλημα είναι ότι ακόμα κι αν τα εργαλεία που είναι διαθέσιμα γίνονται περισσότερο ισχυρά, η σύνθεση των ρεαλιστικών τρισδιάστατων μοντέλων είναι δύσκολη και χρονοβόρα, με αποτέλεσμα να είναι και ακριβή. Πάρα ταύτα η μεγάλη ερευνητική προσπάθεια έχει οδηγήσει στη δημιουργία πολλών τεχνικών, κάποιες από τις οποίες έχουν εξελιχθεί και γίνονται πλέον hardware. Οι περισσότερες τεχνικές βασίζονται συχνά σε εξειδικευμένο υλικό (π.χ. ανιχνευτές σειράς λέιζερ ή στερεοσκοπικές εγκαταστάσεις μηχανημάτων) και αυτό έχει ως συνέπεια ένα υψηλό κόστος για αυτά τα συστήματα. Οι νέες προσαρμογές αυτών των τεχνικών, όμως, απαιτούν ισχυρά συστήματα χαμηλότερου κόστους. Αυτό υποκινεί τη χρήση της φωτογραφικής μηχανής ή των βιντεοκαμερών, κάτι που διευκολύνεται από την πρόσφατη πρόοδο στην ψηφιακή απεικόνιση. Τελευταία, λόγω της σύγκλισης αυτών των διαφορετικών παραγόντων έχουν αναπτυχθεί πολλές τεχνικές, πολλές από τις οποίες απαιτούν μόνο μια κάμερα και έναν υπολογιστή, για να αποκτήσουν τα τρισδιάστατα μοντέλα των πραγματικών αντικειμένων. * Υπολογιστική Όραση είναι η περιοχή η οποία ασχολείται με την δημιουργία «έξυπνων» συστημάτων για την ανάκτηση πληροφοριών από πραγματικές εικόνες.

Καταλαβαίνουμε συνεπώς, ότι οι τεχνικές που χρησιμοποιούνται, παρουσιάζουν μεταξύ τους διαφορές, τόσο στην θεωρητική προσέγγιση του θέματος όσο και στα τεχνολογικά μέσα που χρησιμοποιούν. Δύο από τις κατηγορίες που χωρίζονται οι μέθοδοι είναι οι ενεργές και οι παθητικές. Οι ενεργές χρησιμοποιούν ειδικές συσκευές (π.χ. λέιζερ, πομπούς υπέρηχων) οι οποίες αποστέλλουν μια δέσμη ενέργειας προς το αντικείμενο, και στη συνέχεια, καταγράφουν την επιστρεφόμενη δέσμη ενέργειας, επεξεργάζονται το λαμβανόμενο σήμα και γίνεται εκτίμηση της απόστασης κάθε σημείου του αντικειμένου. Προφανώς αυτή η τεχνική απλοποιεί το πρόβλημα αλλά δεν μπορεί να εφαρμοστεί ευρέως. Στις παθητικές μεθόδους, χρησιμοποιείται ένα μέσο καταγραφής του αντικειμένου, όπως μια κάμερα, και η επεξεργασία των δεδομένων που λαμβάνονται από αυτήν οδηγεί στην τρισδιάστατη ανακατασκευή. Στην παρούσα εργασία θα επεκταθούμε μόνο σε τεχνικές με παθητική προσέγγιση. Είναι υπολογιστικά ακριβότερες (με αρκετά περιθώρια βελτίωσης) και εξαρτώμενες από την δομή της ίδιας της σκηνής αλλά είναι πολύ πιο ευέλικτες. Αυτό που επιζητούμε, μέσω της Υπολογιστικής Όρασης και της Φωτογραμμετρίας*, είναι να προσεγγίσουμε την γεωμετρία των εικόνων στον προβολικό χώρο με απώτερο στόχο την αναπαράσταση του απεικονιζόμενου αντικειμένου στον Ευκλείδειο χώρο. Στα κεφάλαια που ακολουθούν θα φανεί πώς ένα τρισδιάστατο μοντέλο μίας επιφάνειας μπορεί να ληφθεί από δύο ή περισσότερες εικόνες, ακόμα και από κάμερες γενικής χρήσης, που λαμβάνονται με ελεύθερη κίνηση γύρω από το αντικείμενο. Υπάρχουν μέθοδοι στις οποίες ούτε η κίνηση της κάμερας ούτε οι τοποθετήσεις της κάμερας δεν είναι ανάγκη να είναι γνωστές. Η γεωμετρική πληροφορία που χρησιμοποιείται είναι δυνατόν να εξαχθεί από μία ακολουθία δύο τουλάχιστο εικόνων. Από τις φωτογραφίες μπορούμε να αποκτήσουμε γνώση σχετικά με τη θέση τους στο χώρο, αλλά και να μάθουμε τις ρυθμίσεις των φωτογραφικών μηχανών από τις οποίες προέρχονται οι απεικονίσεις των αντικειμένων. Το αποκτηθέν τρισδιάστατο μοντέλο θα είναι μια κλιμακωμένη έκδοση του αρχικού αντικειμένου (δηλ. μια μετρική αναδημιουργία του). Ενδιαφέρον παρουσιάζει η προσέγγιση των εικόνων ως προβολή του αντικειμένου πάνω σε ένα επίπεδο, η οποία αφήνει χώρο στην προβολική γεωμετρία και γενικότερα στα μαθηματικά και τον προγραμματισμό, να προσαρμοστούν στο πρόβλημα, να συνδυαστούν και τελικά να επιτευχθεί η επιθυμητή λύση. 1. Παθητικές Μέθοδοι Αυτό που αποζητάμε μέσω των παθητικών τεχνικών είναι να πάρουμε μέσα από την εικόνα γεωμετρικές πληροφορίες όπως είναι το βάθος. Έχοντας ως δεδομένες εικόνες του αντικειμένου, από διαφορετικές σκοπιές, μας παρέχεται αρκετή γνώση για την τρισδιάστατη αναπαράσταση του. Αν μας παρέχεται εκ των προτέρων κάποια πληροφορία για την σκηνή τότε είμαστε σε θέση να βγάλουμε βάθος ακόμα και από μία μόνο φωτογραφία (αυτό δεν θα μας απασχολήσει εδώ). Δεδομένα που μπορεί γενικά να μας αποκαλύπτουν στοιχεία σχετικά με το βάθος και την απόσταση των αντικείμενων που απεικονίζονται είναι η υφή, οι ακμές, η σκίαση, οι μεταβολές του φωτισμού και άλλα. Ανάλογα με τα στοιχεία των εικόνων που αποφασίζουμε να *Η Φωτογραμμετρία είναι επιστήμη, συναφής, αλλά πολύ προγενέστερη της Υπολογιστικής Όρασης, η οποία σαν στόχο έχει να προσδιορίζει μέσω φωτογραφικών εικόνων, το απεικονιζόμενο αντικείμενο ή επιμέρους γεωμετρικά στοιχεία του.

3 χρησιμοποιήσουμε για την εξαγωγή της επιθυμητής πληροφορίας, οι κύριες παθητικές μέθοδοι εύρεσης απόστασης μπορούν να καταταχθούν στις εξής κατηγορίες: Στερεοσκοπική Όραση (Stereo Vson), Δομή από Κίνηση (Structure from Moton), Σχήμα από Σκίαση (Shape from Shadng), Βάθος από Εστίαση (Range from Focus), Βάθος από Μη Εστίαση (Depth from Defocus), Σχήμα από Υφή (Shape from exture). Εδώ όμως, θα μας απασχολήσουν μόνο οι δύο πρώτες μέθοδοι, εξάλλου είναι και οι πιο ισχυρές. Ένα στερεοσκοπικό ζεύγος εικόνων προκύπτει από δυο κάμερες οι οποίες έχουν καθορισμένη σχετική θέση, και συγκεκριμένα, η δεύτερη κάμερα έχει μετακινηθεί σε σχέση με την πρώτη μόνο κατά μια πλευρική μετατόπιση. Η διάταξη αυτή των καμερών, προσομοιώνει ουσιαστικά την διάταξη στην οποία είναι τοποθετημένα τα μάτια στον άνθρωπο. Αυτή η τεχνική έχει εμπνευστεί από την ικανότητα του ανθρώπου να αντιλαμβάνεται τα τρισδιάστατα χαρακτηριστικά του περιβάλλοντος. Μερικές από τις πληροφορίες που χρησιμοποιεί ο ανθρώπινος εγκέφαλος για την εκτίμηση της απόστασης αντικειμένων είναι η υφή, οι ακμές, η προοπτική της σκηνής, η απόκρυψη αντικειμένων, οι μεταβολές φωτεινότητας, οι σκιές, αλλά και η διαφορά μεταξύ του ανθρώπινου στερεοσκοπικού ζεύγους εικόνων που προκύπτει ξεχωριστά από το κάθε μάτι. Η χρήση του τελευταίου είναι καταλυτικής σημασίας στην Στερεοσκοπική Όραση. Αναγνωρίζοντας προβολές του ίδιου σημείου στις δύο εικόνες και παίρνοντας την διαφορά που προκύπτει από την θέση στην πρώτη εικόνα και την αντίστοιχη θέση στην δεύτερη έχουμε ένα στοιχείο που προδίδει το βάθος. Η διαφορά των θέσεων στις εικόνες, στις οποίες προβάλλονται αναγνωρισμένα σημεία της σκηνής, υπάρχει λόγω της διαφορετικής θέσης που έχουν οι κάμερες στον χώρο. Η στερεοσκοπική όραση είναι μία πολύ ισχυρή τεχνική λόγω κυρίως της ειδικής διάταξης των δυο καμερών που έχουμε απαίτηση. Η μόνη ατέλεια της μεθόδου αυτής, είναι η αντιστοίχηση των χαρακτηριστικών σημείων στις δύο εικόνες, που είναι προβολές του ίδιου σημείου της σκηνής. Η τεχνική της Δομής από Κίνηση είναι μία γενίκευση της Στερεοσκοπικής Όρασης. Όπως και πριν, χρησιμοποιούνται δυο τουλάχιστον κάμερες, ή μια κάμερα η οποία κινείται και καταγράφει στοιχεία της σκηνής. Όμως σε αυτήν την περίπτωση, η κίνηση της κάμερας μπορεί να είναι αυθαίρετη οπότε και προκύπτουν τυχαίες σχετικές θέσεις για την κάμερα της κάθε εικόνας. Και πάλι, το στοιχείο που θα μας δώσει την λύση είναι η μεταβολή στις θέσεις στις οποίες προβάλλονται κάποια αναγνωρισμένα χαρακτηριστικά σημεία ενδιαφέροντος της σκηνής. Η Δομή από Κίνηση είναι μία τεχνική στην οποία έχουμε πολλά πλεονεκτήματα, σε σχέση με την στερεοσκοπική όραση, επειδή δεν απαιτείται κάποια ειδική διάταξη σε κάμερες, παρά μόνο μια ελεύθερα κινούμενη κάμερα. 1.3 3D Πληροφορίες από Εικόνες Από μία μόνο εικόνα μπορούν να γίνουν γνωστές αρκετές πληροφορίες, εντούτοις αυτές δεν είναι αρκετές για να αναδημιουργηθεί η αντίστοιχη τρισδιάστατη σκηνή (τουλάχιστον όχι χωρίς να γίνει ένας σημαντικός αριθμός υποθέσεων στη δομή της σκηνής). Αυτό οφείλεται στη φύση της διαδικασίας από την οποία προκύπτει η εικόνα. Εάν λάβουμε μια προβολή της παρατηρηθείσας τρισδιάστατης σκηνής, επάνω σε μια δισδιάστατη εικόνα, αυτό έχει ως αποτέλεσμα να χαθεί το βάθος. Το τρισδιάστατο σημείο που αντιστοιχεί σε ένα συγκεκριμένο σημείο της εικόνας, είναι αναγκασμένο να

4 είναι πάνω στον οπτικό άξονα. Όμως, ενώ ξέρουμε την ευθεία πάνω στην οποία βρίσκεται το τρισδιάστατο σημείο, δεν γνωρίζουμε την ακριβή θέση του. Εάν είναι διαθέσιμες δύο (ή περισσότερες) εικόνες, από διαφορετικές όψεις, τότε το τρισδιάστατο σημείο μπορεί να ληφθεί ως τομή των δύο (ή περισσοτέρων) οπτικών αξόνων. Προφανώς, το σημείο το οποίο θέλουμε να ανακατασκευαστεί πρέπει να είναι αναγνωρίσιμο σε όλες τις εικόνες. Αυτή τη διαδικασία την ονομάζουμε τριγωνοποίηση (trangulaton), και θα αναφερθούμε σε αυτήν στα επόμενα κεφάλαια. Η σχέση μεταξύ ενός σημείου εικόνας και του οπτικού άξονα του, δίνεται από το μοντέλο καμερών (π.χ. pnhole camera) και τις παραμέτρους βαθμονόμησης. Αυτές οι παράμετροι καλούνται συχνά ενδογενείς παράμετροι (ntrnsc parameters) καμερών, ενώ η θέση και ο προσανατολισμός της κάμερας καλούνται γενικά εξωγενείς παράμετροι (extrnsc parameters). Όλα αυτά τα στοιχεία μπορούν να ανακτηθούν από τις εικόνες. Οι συσχετίσεις σημείων μεταξύ των διαθέσιμων όψεων, υπαινίσσεται ότι τα αντιστοιχισμένα σύνολα σημείων υπόκεινται σε κάποια δομή και ότι αυτή η δομή συσχετίζεται με την τοποθέτηση και τη βαθμονόμηση της κάμερας. Ο δημιουργία της εικόνας, μέσα από μία κοινή κάμερα, υπακούει στους κανόνες της προοπτικής προβολής. Η προοπτική προβολή είναι η προβολή ενός σημείου του χώρου σε ένα επίπεδο, διαμέσου ενός κέντρου προβολής. Στην περίπτωση κατά την οποία δημιουργούμε μία εικόνα, το σημείο του χώρου αντιστοιχίζεται με το σημείο της σκηνής που καταγράφηκε, το κέντρο προβολής είναι το κέντρο του φακού της κάμερας και το επίπεδο είναι το επίπεδο της εικόνας. Το προοπτικό μοντέλο προβολής που χρησιμοποιείται για τη δημιουργία της εικόνας μέσα από αισθητήρα όρασης, ονομάζεται μοντέλο κάμερας μικρής οπής (pnhole camera model). Η κάμερα που αντιστοιχεί σε αυτό το μοντέλο είναι η ιδανική κάμερα μικρής οπής. Σύμφωνα με το μοντέλο αυτό, ο οπτικός άξονας βρίσκεται κάθετος στο επίπεδο της εικόνας και διέρχεται από το κέντρο του φακού (κέντρο προβολής). Η απόσταση f του κέντρου προβολής από το επίπεδο εικόνας ονομάζεται εστιακή απόσταση (focal length) και αποτελεί μία από τις παραμέτρους της κάμερας. Οι περισσότερες κάμερες περιγράφονται αρκετά καλά από το μοντέλο μικρής οπής. Αυτός είναι ο λόγος που θα χρησιμοποιηθεί και στην συγκεκριμένη εργασία. Στη τρισδιάστατη οπτικοποίηση από εικόνες, μπορούν να προκύψουν πολλά προβλήματα. Κάποια από αυτά μπορούν να αντιμετωπισθούν, άλλα όμως περιορίζουν σημαντικά την μέθοδο που θα ακολουθηθεί. Ένα σημαντικό πρόβλημα, παραδείγματος χάριν, που μπορεί να προκύψει, προκαλείται όταν η διαδικασία απεικόνισης δεν ικανοποιεί το μοντέλο καμερών που χρησιμοποιείται. Αυτό σημαίνει ότι όταν γίνει η υπόθεση της pnhole κάμερας και αυτή, στην συγκεκριμένη περίπτωση, δεν ικανοποιείται, τότε δεν μπορεί να αποφευχθεί αρκετή παραποίηση των αποτελεσμάτων, σε σχέση με αυτό που περιμέναμε ιδανικά. Είναι εντούτοις δυνατό να επεκταθεί το μοντέλο για να λάβει υπ όψη τη παραποίηση. Αρκετά δύσκολες περιπτώσεις, επίσης, είναι οι εικόνες με παρεμβολές κινούμενων αντικειμένων, με ασυνέχειες, με αντανακλάσεις, με διαφανείς επιφάνειες, όπως επίσης και εικόνες όπου ένα σημαντικό μέρος της σκηνής δεν είναι εστιασμένο. Τα περισσότερα από αυτά τα προβλήματα μπορούν, ωστόσο, να αποφευχθούν προσέχοντας τον τρόπο με τον οποίο θα ληφθούν οι εικόνες.

5 Κεφάλαιο : Μαθηματικό Υπόβαθρο Φτασμένες οι προλήψεις σε μια καθαρότητα μαθηματική θα μας βοηθούσανε να κατανοήσουμε τη βαθύτερη δομή του κόσμου. Οδυσσέας Ελύτης, 1911-1996, Ποιητής, Νόμπελ 1979.1 Προβολική Γεωμετρία Όλοι έχουμε μία σχετική εξοικείωση με τους προβολικούς μετασχηματισμούς, επειδή τον βλέπουμε να εφαρμόζεται πολλές φορές στην καθημερινότητά μας. Μία κάμερα για να απεικονίσει την δομή ενός αντικειμένου, εκτελεί προοπτική προβολή του τρισδιάστατου προβολικού χώρου στον δισδιάστατο. Η προοπτική προβολή είναι ένας προβολικός μετασχηματισμός, που προσομοιώνει την λειτουργία της κάμερας. Έτσι καταλαβαίνουμε ότι είναι πολύ σημαντικό να γνωρίσουμε περισσότερα όσον αφορά την προβολική γεωμετρία, για να είναι δυνατή η κατανόηση των μεθόδων που αναπτύσσονται στην τρισδιάστατη όραση [1,,4]..1.1 Βασικές Έννοιες Μία εύλογη απορία είναι το γιατί να απορρίψουμε την Ευκλείδεια γεωμετρία από τις διαδικασίες της υπολογιστικής όρασης. Γνωρίζουμε ότι η Ευκλείδεια γεωμετρία είναι ιδανική για να περιγράψουμε τον τρισδιάστατο κόσμο. Είναι η πιο οικεία στον άνθρωπο γεωμετρία γιατί είναι πολύ κοντά στο τρόπο που αντιλαμβάνεται τον κόσμο, αλλά την έχει μελετήσει και από μικρή ηλικία. Αποτυπώνει τέλεια τα αντικείμενα, τις αποστάσεις και τις γωνίες που προκύπτουν από αυτά. Επιπλέον από τους Ευκλείδειους μετασχηματισμούς, δηλαδή μεταφορά και περιστροφή, δεν αλλοιώνονται οι προαναφερθείσες ιδιότητες. Εντούτοις, όταν βλέπουμε μία φωτογραφία αντιλαμβανόμαστε ότι η Ευκλείδεια γεωμετρία δεν είναι η πλέον κατάλληλη για τέτοια χρήση. Τα μήκη αλλοιώνονται, οι γωνίες δεν ανταποκρίνονται στις πραγματικές και οι παράλληλες ευθείες του τρισδιάστατου κόσμου αντιστοιχούν σε ευθείες που τέμνονται πάνω στην εικόνα. Σε αντίθεση με τους Ευκλείδειους, οι ιδιότητες της γεωμετρίας δεν συντηρούνται κατά βάση από προβολικούς μετασχηματισμούς. Το σχήμα, το μήκος, οι γωνίες, η απόσταση και οι αναλογίες των αποστάσεων είναι ιδιότητες που δεν διατηρούνται από τον μετασχηματισμό αυτόν. Από την άλλη μεριά, μία ιδιότητα που διατηρείται είναι αυτή της ευθύτητας (straghtness), δηλαδή συντηρεί τις ευθείες γραμμές. Συνεπώς, η προβολική γεωμετρία μοντελοποιεί σαφώς καλύτερα την απεικόνιση αντικειμένων μέσω κάμερας. Για να αρχίσουμε να την καταλαβαίνουμε καλύτερα, μπορούμε να προσεγγίσουμε την προβολική γεωμετρία, χρησιμοποιώντας την Ευκλείδεια γεωμετρία. Αυτό είναι λίγο ανορθόδοξο γιατί η Προβολική Γεωμετρία έχει ως υποσύνολο την Ευκλείδεια, όμως εδώ κρίνεται πιο εύκολο, λόγω της μεγαλύτερη εξοικείωσής μας με την δεύτερη. Η Ευκλείδεια είναι αυτή που περιγράφει τις γωνίες και τις μορφές των αντικειμένων. Σε αυτήν έχουμε κάνει αρκετές παραδοχές. Μία από τις σημαντικότερες είναι ότι οι παράλληλες γραμμές συναντιούνται «στο άπειρο». Εντούτοις, αυτό συγκρούεται με

6 ένα άλλο γνωμικό, ότι το άπειρο δεν υπάρχει, και είναι μόνο ένα κατάλληλο δημιούργημα της φαντασίας. Για να λύσουμε κάπως αυτό το πρόβλημα θα μπορούσαμε να πάρουμε μία ενίσχυση του Ευκλείδειου επιπέδου μέσω της προσθήκης αυτών των σημείων στο άπειρο και ονομάζοντας τα «ιδεατά σημεία». Έτσι, ο γνωστός Ευκλείδειος χώρος μετασχηματίζεται σε έναν νέο τύπο γεωμετρίας, τον Προβολικό χώρο. Αυτός είναι ένας πολύ χρήσιμος τρόπος σκέψης, δεδομένου ότι αντιλαμβανόμαστε τις ιδιότητες του Ευκλείδειου χώρου, περιλαμβάνοντας τις έννοιες όπως αποστάσεις, γωνίες, σημεία, γραμμές ως ειδική περίπτωση του Προβολικού. Καταλήγουμε, επομένως, ότι ο προβολικός χώρος είναι επέκταση του Ευκλείδειου χώρου, όπου δύο γραμμές συναντιούνται πάντα σε ένα σημείο, εντούτοις μερικές φορές αυτό γίνεται στα μυστήρια σημεία στο άπειρο. Στον προβολικό χώρο, όπως και στον Ευκλείδειο, η αντιπροσώπευση των σημείων μπορεί να γίνει με συντεταγμένες. Ένα σημείο στον Ευκλείδειο χώρο δύο διαστάσεων αντιπροσωπεύεται από ένα διατεταγμένο ζευγάρι πραγματικών αριθμών, ( x, ). Το ίδιο σημείο στο προβολικό χώρο P μπορούμε να το περιγράψουμε από το ( x,,1). Παρατηρούμε ότι πολύ εύκολα μπορούμε να περάσουμε από την μια αντιπροσώπευση του σημείου στην άλλη. Δεν είναι ανάγκη όμως η τελευταία συντεταγμένη να περιορίζεται στην τιμή 1. Ένας ορισμός της προβολικής γεωμετρίας είναι ότι δύο σημεία που αντιπροσωπεύονται από τα διανύσματα x [ x1, x,..., x 1] n και [ 1,,..., 1] n είναι ίσα, εάν και μόνο εάν, υπάρχει ένας αριθμός k διαφορετικός από το μηδέν έτσι ώστε να ισχύει x k, για κάθε 1 n 1. Όλες οι αντιπροσωπεύσεις με n+1 συντεταγμένες καλούνται ομοιογενείς συντεταγμένες του σημείου. Ο συμβολισμός που χρησιμοποιείται γενικά για τα ισοδύναμα διανύσματα είναι x~. Έτσι, για παράδειγμα, στον P έχουμε ότι το x,,1 και το kx, k, k, k 0, είναι ομοιογενείς συντεταγμένες του ίδιου σημείου. Από μία τριπλή συντεταγμένη kx, k, k, μπορούμε εύκολα να ανακτήσουμε τις αρχικές συντεταγμένες μέσω διαίρεσης με το k, και στην συνέχεια αφαίρεσης του 1, για να πάρουμε το x,. Σύμφωνα με αυτόν τον ορισμό καταλήγουμε ότι δεν υπάρχει κανένα σημείο του Ευκλείδειου επιπέδου που να μπορεί να αντιστοιχηθεί με την τριπλή συντεταγμένη (x,,0). Εάν προσπαθήσουμε να διαιρέσουμε με την τελευταία συντεταγμένη, παίρνουμε το (x/0, /0) που είναι το άπειρο. Έτσι, τα σημεία που αντιπροσωπεύονται από τις ομοιογενείς συντεταγμένες στις οποίες η τελευταία συντεταγμένη είναι μηδέν, είναι τα σημεία στο άπειρο. Φυσικά, μπορούμε να επεκτείνουμε τα προηγούμενα σε διάσταση μεγαλύτερη του. Ο Ευκλείδειος χώρος ΙR n μπορεί να επεκταθεί σε ένα n προβολικό χώρο P με την αντιπροσώπευση των σημείων ως ομοιογενή διανύσματα. Τα σημεία στο άπειρο στον P διαμορφώνουν μια γραμμή, την οποία ονομάζουμε γραμμή στο άπειρο. Αντίστοιχα στις τρεις-διαστάσεις διαμορφώνουν ένα επίπεδο, το οποίο καλούμε επίπεδο στο άπειρο. Στα προβλήματα υπολογιστικής όρασης, ο προβολικός χώρος τριών διαστάσεων χρησιμοποιείται ως ο καταλληλότερος τρόπος αναπαράστασης του πραγματικού τρισδιάστατου κόσμου και αντίστοιχα οι εικόνες αντιπροσωπεύονται ιδανικά από τον δύο διαστάσεων προβολικό χώρο. Για να είμαστε ακριβείς, ο πραγματικός κόσμος, και οι εικόνες του δεν περιέχουν τα σημεία στο άπειρο, και θα πρέπει εμείς να φανταστούμε την γραμμή που θα είναι τα φανταστικά σημεία, δηλαδή τη γραμμή στο άπειρο μίας εικόνας και το επίπεδο στο άπειρο του κόσμου. Για αυτόν τον λόγο, αν και

7 εργαζόμαστε με τους προβολικούς χώρους, συνήθως χειριζόμαστε τη γραμμή και το επίπεδο στο άπειρο σαν να είναι με κάποιο τρόπο ξεχωριστά από τα άλλα. Αυτό πηγαίνει ενάντια στο πνεύμα της καθαρής προβολικής γεωμετρίας, αλλά το καθιστά χρήσιμο πρακτικά..1. Μετασχηματισμοί Στην κλασσική Ευκλείδεια γεωμετρία όλα τα σημεία είναι ίδια, δεν υπάρχει καμία απολύτως διάκριση μεταξύ τους. Θα μπορούσαμε να υποθέσουμε ότι από την στιγμή που τα σημεία βρίσκονται πάνω σε ένα σύστημα συντεταγμένων και ένα σημείο επιλέγεται ως αρχή των αξόνων, αυτό αποτελεί μία διάκριση του σημείου αυτού. Όμως πρέπει να συνειδητοποιήσουμε ότι αυτό είναι μόνο μία σύμπτωση του ιδιαίτερου συστήματος συντεταγμένων που έχει επιλεχθεί. Θα μπορούσαμε να βρούμε έναν διαφορετικό τρόπο να συντεταγμενοποιήσουμε το επίπεδο στο οποίο ένα διαφορετικό σημείο θα θεωρείται ως αρχή των αξόνων. Θα μπορούσαμε να πάρουμε εξίσου ως σύστημα συντεταγμένων για τον ίδιο χώρο, άξονες μετατοπισμένους σε μια διαφορετική θέση και περιστραμμένους. Η προκύπτουσα πράξη είναι γνωστή ως Ευκλείδειος μετασχηματισμός. Φυσικά αυτή η πράξη δεν αφορά μόνο τους άξονες. Όταν σε ένα σημείο γίνει ο μετασχηματισμός, έχουμε x Rx t, όπου R πίνακας περιστροφής και t διάνυσμα μεταφοράς. Η πράξη αυτή δεν επιφέρει αλλαγή σε άλλο χαρακτηριστικό πέραν της θέσης και του προσανατολισμού. Ο πίνακας μετασχηματισμού έχει την μορφή: r11 r1 r13 t x r1 r r3 t ~ E r 31 r3 r33 t z 0 0 0 1 Αν στον Ευκλείδειο μετασχηματισμό, που παρουσιάστηκε στην προηγούμενη παράγραφο, προστεθεί και μία κλιμάκωση τότε ο μετασχηματισμός που προκύπτει είναι ο μετασχηματισμός ομοιότητας. Ο μετασχηματισμός αυτός μπορεί να εκφραστεί ως x srx t,όπου R πίνακας περιστροφής, t διάνυσμα μεταφοράς και s οποιοσδήποτε συντελεστής κλιμάκωσης (μεγέθυνσης/σμίκρυνσης). Η πράξη που θα προκύψει θα διατηρεί τις σχετικές γωνίες και τις αναλογίες των αποστάσεων, άλλα θα αλλάζουν η θέση, ο προσανατολισμός και τα μήκη. Ο πίνακας του μετασχηματισμού ομοιότητας έχει την μορφή: r11 r1 r13 t x ~ r1 r r3 t M. r 31 r3 r33 t z 0 0 0 1 Ο μετασχηματισμός ο οποίος επιφέρει μεταφορά, περιστροφή, κλιμάκωση αλλά και στρέβλωση (shearng) των αξόνων καλείται ομοπαραλληλικός (Affne). Ο μετασχηματισμός αυτός γίνεται πράξη από τη σχέση x ' Ax t, όπου Α είναι πίνακας που προκύπτει από των πολλαπλασιασμό τριών πινάκων. Κάτω από αυτόν τον μετασχηματισμό διατηρείται η παραλληλία των ευθειών αλλά αλλάζουν και οι γωνίες

8 εκτός από τα μήκη, την θέση και τον προσανατολισμό. Ο πίνακας του ομοπαραλληλικού μετασχηματισμού έχει την μορφή: a11 a1 a13 a14 a1 a a3 a4 A ~. a 31 a3 a33 a34 0 0 0 1 Στους τρεις μετασχηματισμούς που αναφέρθηκαν μπορούμε να κάνουμε κάποιες παρατηρήσεις. Το πρώτο που πρέπει να γίνει αντιληπτό είναι ότι τα σημεία στο άπειρο, κάτω από αυτούς τους μετασχηματισμούς, παραμένουν στο άπειρο, δηλαδή συντηρούνται τουλάχιστον ως σύνολο. Η δεύτερη σημείωση είναι ότι οι μετασχηματισμοί αυτοί είναι γραμμικοί. Από την άποψη της προβολικής γεωμετρίας, τα σημεία στο άπειρο δεν διαφέρουν από τα άλλα σημεία. Ο προβολικός χώρος είναι ομοιογενής, ακριβώς όπως γινόταν και με τον Ευκλείδειο. Η ιδιότητα που δείχνει ότι τα σημεία στο άπειρο έχουν την τελική συντεταγμένη μηδέν σε μια ομοιογενή αντιπροσώπευση δεν είναι τίποτα παραπάνω από μία σύμπτωση που επιφέρει η επιλογή του συστήματος συντεταγμένων. Ένας προβολικός μετασχηματισμός, στον προβολικό χώρο, είναι ένας πολλαπλασιασμός των ομοιογενών συντεταγμένων που αντιπροσωπεύουν ένα σημείο (δηλαδή ένα (n+1)-διάνυσμα) με ένα μη-μοναδιαίο πίνακα. Αυτό έχει ως αποτέλεσμα τα σημεία που έχουν τη τελευταία συντεταγμένη μηδέν, δηλαδή τα σημεία στο άπειρο, να μετασχηματίζονται σε άλλα αυθαίρετα σημεία. Κατά συνέπεια, ένας προβολικός n μετασχηματισμός στο προβολικό χώρο P αντιπροσωπεύεται από έναν γραμμικό μετασχηματισμό των ομοιογενών συντεταγμένων X H X. Ο ( n 1) x( n1) μετασχηματισμός αυτός αναφέρεται και ως ομογραφία. Τέλος, θα πρέπει να αναφέρουμε τα στοιχεία που διατηρούνται αμετάβλητα κάτω από ένα τέτοιο μετασχηματισμό, όμως θα πρέπει να δώσουμε πρώτα ένα ορισμό. Εάν έχουμε τέσσερα συγγραμμικά σημεία M 1, M, M 3, M 4 και κανένα δεν συμπίπτει με τα Μ και M, τότε M M. Ως cross-rato ορίζεται το M 1 3 3 M 1, M ; M 3, M 4 : 1 4 4 το οποίο δεν εξαρτάται από την επιλογή των σημείων αναφοράς Μ και M. Έτσι ένας προβολικός μετασχηματισμός διατηρεί την ευθύτητα των γραμμών, την τομή, την εφαπτότητα, το πρόσημο της καμπυλότητας, το cross-rato και έχει την μορφή: p11 p1 p13 p14 p 1 p p3 p4 P ~ p 31 p3 p33 p34 p41 p4 p43 p44 Οι μετασχηματισμοί που αναφέρθηκαν, στηρίζονται και από αντίστοιχους χώρους. Έτσι ο προβολικός μετασχηματισμός σχετίζεται με τον προβολικό χώρο, ο ομοπαραλληλικός μετασχηματισμός με τον ομοπαραλληλικό χώρο, ο μετασχηματισμός ομοιότητας έχει σχέση με τον μετρικό χώρο και τέλος ο ευκλείδειος με την ομάδα των

9 ευκλείδειων μετασχηματισμών. Η σειρά που αναφέρθηκαν οι χώροι και οι αντίστοιχες γεωμετρίες τους, δεν είναι τυχαία. Θεωρώντας τον προβολικό χώρο σαν τον πιο απλό, προχωράμε διαδοχικά στον πιο σύνθετο που είναι ο ομοπαραλληλικός, στην συνέχεια στον μετρικό και τέλος στον πιο δομημένο ο οποίος είναι ο Ευκλείδειος. Ο κάθε χώρος είναι ειδική περίπτωση -υπόχωρος- του προηγούμενου, όπως και κάθε αντίστοιχη ομάδα μετασχηματισμών είναι υποομάδα της προηγούμενης (Προβολική Ομοπαραλληλική Μετρική Ευκλείδεια). Κάθε ομάδα μετασχηματισμών χαρακτηρίζεται από τις ιδιότητες του χώρου που παραμένουν αναλλοίωτες από την εφαρμογή των μετασχηματισμών και κατ επέκταση από τις ιδιότητες αυτές, χαρακτηρίζεται και ο χώρος στον οποίο αναφέρεται η κάθε ομάδα. Όσες περισσότερες ιδιότητες παραμένουν αναλλοίωτες, τόσο πιο δομημένος είναι ο χώρος και τόσο περισσότερη πληροφορία περιέχει. ΣΧΗΜΑ.1: Συμπεριφορά ενός κύβου κάτω από τους μετασχηματισμούς Οι διαφορές όλων χώρων που αναφέρθηκαν μπορούν να προσεγγιστούν και με ένα διαφορετικό τρόπο. Αν θεωρήσουμε ότι εργαζόμαστε πάνω σε ένα μοντέλο στο κατώτερο στρώμα δηλαδή στο προβολικό, τότε προσδιορίζοντας το επίπεδο στο άπειρο μπορούμε να πάμε στο πιο αναβαθμισμένο στρώμα, δηλαδή το ομοπαραλληλικό. Το οποίο με την σειρά του αναβαθμίζεται σε μετρικό στρώμα όταν οριστεί μία οντότητα που ονομάζεται απόλυτο κωνικό (θα αναφερθούμε σε αυτό στο επόμενο κεφάλαιο). Το μετρικό υπάρχει δυνατότητα να αναβαθμιστεί και αυτό σε Ευκλείδειο έχοντας δεδομένη μία τουλάχιστον απόσταση από το πραγματικό μοντέλο, ώστε οι σχετικές αποστάσεις του μετρικού μοντέλου να γίνουν απόλυτες αποστάσεις του Ευκλείδειου. Οι πρώτες δύο αναβαθμίσεις αντιπροσωπεύονται από δύο μετασχηματισμούς οι οποίοι είναι αντίστοιχα οι και P A I A 03 3 3 0 3 1 0 3 1 (.1) 1 AM (.) όπου είναι το επίπεδο στο άπειρο και ο Α είναι ένας πίνακας 3 3 ο οποίος μπορεί να ανακτηθεί από το απόλυτο κωνικό.

10.1.3 Ευκλείδεια από Προβολική Γεωμετρία Έχουμε ήδη αναφέρει πως μπορούμε να λάβουμε τον προβολικό χώρο από τον Ευκλείδειο. Εξετάζοντας το συγκεκριμένο πρόβλημα, κυρίως επικεντρωθήκαμε τις δύο και τρεις διαστάσεις του προβολικού χώρου, οι οποίες είναι και αυτές που μας αφορούν. Έτσι ξεκινώντας από τον Ευκλείδειο χώρο δύο διαστάσεων παίρνουμε τον προβολικό με την προσθήκη μίας γραμμής στη άπειρο και αντίστοιχα στις τρεις διαστάσεις προσθέτοντας ένα επίπεδο στο άπειρο. Είναι χρήσιμο όμως να ξέρουμε και το πως προκύπτει ο Ευκλείδειος χώρος από τον προβολικό. Σε κάποιες περιπτώσεις τις προβολικής γεωμετρίας, των δύο διαστάσεων, είναι εύκολο να ξεχωρίσουμε την ευθεία στο άπειρο, που προφανώς θα μας είναι χρήσιμη αφού την χρησιμοποιήσαμε στην αντίστροφη διαδικασία. Εξετάζοντας μία φωτογραφία που έχει ληφθεί σε μία πολύ επίπεδη περιοχή της γης, παρατηρούμε ότι υπάρχει μία γραμμή, η οποία είναι γνωστή ως ορίζοντας. Αν υπήρχανε στο παγκόσμιο επίπεδο δύο παράλληλες γραμμές οι οποίες θα απεικονίζονται στην φωτογραφία, τότε σίγουρα αυτές θα συναντιόντουσαν πάνω στην γραμμή του ορίζοντα. Αυτό μας ωθεί να συμπεράνουμε ότι αυτή είναι η γραμμή στο άπειρο του συγκεκριμένου προβολικού επιπέδου. Από την άλλη μεριά αν έχουμε πάνω στο χαρτί δύο γραμμές που συναντιούνται σε μία τρίτη, για την οποία ξέρουμε ότι είναι η γραμμή στο άπειρο, τότε αυτές θα αντιστοιχούν σε παράλληλες γραμμές. Παρόλα ταύτα, με την γνώση της θέσης της γραμμής στο άπειρο πάνω σε μία φωτογραφία, μπορούμε να κερδίσουμε μόνο την αναβάθμιση της γεωμετρίας σε ομοπαραλληλική γεωμετρία και την έννοια του παραλληλισμού. Για να φτάσουμε στην Ευκλείδεια γεωμετρία πρέπει διακρίνουμε επίσης και την χαρακτηριστική δομή της γραμμής στο άπειρο. Στο σημείο αυτό πρέπει να εισάγουμε κάποιες έννοιες, οι οποίες είναι το κωνικό και το απόλυτο κωνικό. Σε ένα Ευκλείδειο επίπεδο μπορούμε να συναντήσουμε πρωτοβάθμιες καμπύλες, όπως είναι οι γραμμές αλλά και δευτεροβάθμιες καμπύλες, όπως οι παραβολές, οι κύκλοι, οι υπερβολές κτλ. Οι διαφορές που χωρίζουν την κάθε μορφή από την άλλη (στην Ευκλείδεια γεωμετρία) είναι εμφανείς και ευδιάκριτες. Όμως οι δευτεροβάθμιες κωνικές τομές μέσα από ένα προβολικό μετασχηματισμό είναι δυνατόν να μετατραπούν από μία μορφή σε κάποια άλλη. Για παράδειγμα ένας κύκλος μπορεί να πάρει την μορφή μίας έλλειψης. Για τον λόγο αυτό, στην προβολική γεωμετρία δεν κάνουμε διάκριση ανάμεσα στις κωνικές τομές αλλά αναφερόμαστε σε όλες με το όνομα κωνικά (concs). Τα κωνικά έχουν μία πολύ σημαντική ιδιότητα, η οποία θα μας χρειαστεί παρακάτω. Έστω ότι είμαστε στον Ευκλείδειο χώρο δύο διαστάσεων και παίρνουμε την πιο απλή περίπτωση κωνικού, δηλαδή τον κύκλο. Αν θέλουμε να εντοπίσουμε τα σημεία τομής δύο κύκλων, πρέπει να λύσουμε ένα σύστημα δύο τετραγωνικών εξισώσεων και συνεπώς αναμένουμε ότι θα υπάρχουν τέσσερις λύσεις. Εντούτοις δύο ευδιάκριτοι κύκλοι δεν μπορούν να τέμνονται σε περισσότερα από δύο σημεία (εκτός αν ταυτίζονται, όπου θα έχουν άπειρα κοινά σημεία- η περίπτωση αυτή είναι χωρίς ενδιαφέρον). Φυσικά, δεν υπάρχει κάποιο λάθος στον συλλογισμό μας, απλά οι δύο λύσεις που δεν φαίνονται είναι μιγαδικές. Η εξίσωση για έναν κύκλο στις ομοιογενείς συντεταγμένες x,, w είναι της μορφής ( x aw) ( bw) r w

11 με το κέντρο στις ομοιογενείς συντεταγμένες το ( x 0, 0, w0 ) ( a, b,1). Γρήγορα ελέγχεται ότι τα σημεία ( x,, w) (1,,0) βρίσκονται πάνω σε κάθε τέτοιο κύκλο. Για να επαναλάβουμε αυτό το ενδιαφέρον γεγονός, κάθε κύκλος περνά μέσω των σημείων ( 1,,0) και επομένως βρίσκονται στη τομή οποιωνδήποτε δύο κύκλων. Δεδομένου ότι η τελική συντεταγμένη τους είναι μηδέν, αυτά τα δύο σημεία βρίσκονται στη γραμμή στο άπειρο και καλούνται κυκλικά σημεία του επιπέδου. Σημειώστε ότι αν και τα δύο κυκλικά σημεία είναι μιγαδικοί, ικανοποιούν ένα ζευγάρι πραγματικών εξισώσεων οι οποίες είναι οι x 0 και w=0 (Το w=0 είναι η γραμμή στο άπειρο). Επίσης να σημειώσουμε ότι τα σημεία αυτά μένουν αμετάβλητα κάτω από οποιονδήποτε μετασχηματισμό ομοιότητας. Αυτή η ιδιότητα των κύκλων, μας δείχνει το πώς μπορούμε να ορίσουμε τη Ευκλείδεια γεωμετρία. Η Ευκλείδεια γεωμετρία προκύπτει από την προβολική γεωμετρία με το να επιλεγεί πρώτα μια γραμμή στο άπειρο και στη συνέχεια, δύο σημεία τα οποία θα είναι τα κυκλικά σημεία που βρίσκονται σε αυτήν την γραμμή. Όπως καταλαβαίνουμε μπορούμε να γενικεύσουμε για οποιοδήποτε κωνικό το οποίο είναι μια καμπύλη που ορίζεται από μια δευτέρου βαθμού εξίσωση και περνά μέσω των δύο κυκλικών σημείων. Στο τυποποιημένο Ευκλείδειο σύστημα συντεταγμένων, τα κυκλικά σημεία έχουν τις συντεταγμένες 1,, 0. Εντούτοις, όταν από το Ευκλείδειο πάμε σε ένα προβολικό επίπεδο, μπορούμε να υποδείξουμε οποιαδήποτε γραμμή ως γραμμή στο άπειρο και οποιαδήποτε δύο (μιγαδικά) σημεία ως κυκλικά σημεία. Δεν πρέπει να είναι έκπληξη ότι ως αποτέλεσμα της επιλογής δύο κυκλικών σημείων κάποιος μπορεί να λάβει την όλη την συνήθη Ευκλείδεια γεωμετρία, αφού σημαντικές έννοιες όπως οι γωνίες και οι αναλογίες μήκους, μπορούν να οριστούν από την άποψη των κυκλικών σημείων. Θα πρέπει να αναφέρουμε επίσης ότι, γενικά, για να διευκρινιστεί μοναδικά ένα οποιοδήποτε κωνικό χρειάζονται πέντε σημεία στο επίπεδο. Έτσι αν έχουμε τα δύο κυκλικά σημεία, καθώς επίσης και άλλα τρία σημεία, μπορούμε να ορίσουμε το κωνικό το οποίο μας ενδιαφέρει. Ένας κύκλος από την άλλη μεριά μπορεί να οριστεί και μόνο από τρία σημεία. Στην περίπτωση της τρισδιάστατης γεωμετρίας, μπορούμε να εφαρμόσουμε πάλι την ιδέα που χρησιμοποιήσαμε στις δύο διαστάσεις. Δύο σφαίρες κόβονται σε έναν κύκλο, και όχι σε μια καμπύλη τέταρτου-βαθμού, όπως προτείνεται από την άλγεβρα. Αυτή η γραμμή σκέψης οδηγεί στο συμπέρασμα ότι στις ομοιογενείς συντεταγμένες ( X, Y, Z, ) όλες οι σφαίρες κόβουν το επίπεδο στο άπειρο σε μια καμπύλη με εξισώσεις: X Y Z 0 και Τ=0. Αυτό είναι μια δευτέρου βαθμού καμπύλη (ένα κωνικό) που βρίσκεται στο επίπεδο στο άπειρο, αποτελείται μόνο από μιγαδικά σημεία και ονομάζεται απόλυτο κωνικό. Αυτά, βέβαια, μπορούμε και πάλι να το γενικεύσουμε για οποιαδήποτε quadrc επιφάνεια, όπως ονομάζονται οι γεωμετρικές μορφές τρίτης τάξης στον τρισδιάστατο προβολικό χώρο. Το απόλυτο κωνικό ορίζεται από τις ανωτέρω εξισώσεις μόνο στο Ευκλείδειο σύστημα συντεταγμένων. Γενικά, μπορούμε να θεωρήσουμε το τρισδιάστατο Ευκλείδειο χώρο να προέρχεται από το προβολικό χώρο με την επιλογή ενός ιδιαίτερου επιπέδου ως επίπεδο στο άπειρο και τη διευκρίνιση των ιδιαίτερων κωνικών να βρίσκονται σε αυτό το επίπεδο για να είναι απόλυτα κωνικά. Αυτές οι οντότητες μπορούν να έχουν αρκετά γενικές περιγραφές από την άποψη ενός συστήματος συντεταγμένων για το προβολικό χώρο.

1 Το απόλυτο κωνικό ( ) είναι πολύ σημαντική έννοια αφού συνδέεται με την βαθμονόμηση των καμερών αλλά και με την καθετότητα των γραμμών στο χώρο. Η καθετότητα των γραμμών μπορεί να οριστεί από την άποψη του απόλυτου κωνικού. Με την επέκταση των γραμμών έως ότου συναντήσουν το επίπεδο στο άπειρο, λαμβάνουμε δύο σημεία που ονομάζονται κατευθύνσεις των δύο γραμμών. Οι γραμμές είναι κάθετες εάν οι δύο κατευθύνσεις είναι συζευγμένα σημεία όσον αφορά το απόλυτο κωνικό. Συζευγμένα σημεία, όσον αφορά το, είναι τα d 1 και d, εάν d 1 d 0, όπου είναι ένας 3x3 συμμετρικός πίνακας που αντιπροσωπεύει το απόλυτο κωνικό και d 1, d είναι τα σημεία των κατευθύνσεων. Γενικότερα, οι γωνίες μπορούν να οριστούν από την άποψη του απόλυτου κωνικού σε οποιοδήποτε αυθαίρετο σύστημα συντεταγμένων..1.4 Προβολικό Επίπεδο Το προβολικό επίπεδο είναι ένας προβολικός χώρος Ρ. Ένα σημείο στο Ρ αντιπροσωπεύεται από ένα διάνυσμα τριών στοιχείων m [ x w]. Μία ευθεία μπορεί επίσης να αντιπροσωπευτεί από 3-διάνυσμα. Ένα σημείο m είναι τοποθετημένο πάνω σε μία ευθεία εάν και μόνο αν m 0 (.3) Αυτή η εξίσωση μπορεί ωστόσο να ερμηνευθεί πως η ευθεία περνάει διαμέσου του σημείου m. Αυτή η συμμετρία σε αυτήν την εξίσωση δείχνει ότι δεν υπάρχει κάποια τυπική διαφορά μεταξύ σημείων και γραμμών στο προβολικό επίπεδο. Αυτό είναι γνωστό ως αρχή της δυαδικότητας (dualt). Μία ευθεία που περνάει διαμέσου δύο σημείων m 1 και m δίνεται από το εξωτερικό γινόμενο m1 m. Άρα: 0 w1 1 ~ [ m ] m 1 όπου [ m 1] w1 0 x (.4) 1 0 1 x1 Η δυαδική διατύπωση του προηγούμενου δίνει τη τομή δύο γραμμών. Όλες οι γραμμές που περνούν μέσω ενός συγκεκριμένου σημείου διαμορφώνουν ένα σχέδιο από γραμμές. Εάν δύο γραμμές είναι ευδιάκριτα στοιχεία του σχεδίου, όλες οι άλλες γραμμές μπορούν να ληφθούν μέσω της ακόλουθης εξίσωσης: ~ 1 1 (.5) για κάποιους αριθμούς λ 1 και λ. Μόνο το πηλίκο 1 είναι σημαντικό..1.5 Προβολικός Χώρος Τριών Διαστάσεων Ο προβολικός χώρος τριών διαστάσεων είναι ένας προβολικός χώρος Ρ 3. Ένα σημείο του Ρ 3 αντιπροσωπεύεται από ένα διάνυσμα τεσσάρων στοιχείων M [ X Y Z W ]. Στο Ρ 3 η διπλή οντότητα ενός σημείου είναι ένα επίπεδο, το οποίο αντιπροσωπεύεται από ένα διάνυσμα τεσσάρων στοιχείων. Ένα σημείο Μ είναι τοποθετημένο σε ένα επίπεδο Π εάν και μόνο αν 0. (.6) Μία ευθεία μπορεί να δοθεί από έναν γραμμικό συνδυασμό δύο σημείων 11 ή από την τομή των δύο επιπέδων 1.

13. Μοντέλο Κάμερας Μια φωτογραφική μηχανή ή γενικότερα μία κάμερα μπορεί να μοντελοποιηθεί με πολλούς τρόπους, ανάλογα με τις ιδιότητες τις οποίες θέλουμε να περιγράψουμε, το βαθμό ακρίβειας που επιθυμούμε, και την εφαρμογή για την οποία προορίζεται το μοντέλο. Όπως έχουμε αναφέρει, το μοντέλο κάμερας το οποίο χρησιμοποιούμε συνήθως για την τρισδιάστατη μοντελοποίηση αντικειμένων και χώρων είναι το μοντέλο μικρής οπής. Στις φωτογραφίες, πολλές φορές, παρατηρούνται διάφορες στρεβλώσεις και άλλες παραμορφώσεις (πχ. θόλωση) τα οποία δεν περιλαμβάνονται στην περίπτωση του απλού μοντέλου μικρής οπής. Όλες αυτές οι παραμορφώσεις κυρίως προκαλούνται από τους φακούς που χρησιμοποιούνται. Αυτό σημαίνει ότι το μοντέλο μικρής οπής μπορεί να χρησιμοποιηθεί μόνο ως μια πρώτη προσέγγιση για την απεικόνιση μίας σκηνής 3D σε μία D εικόνα. Η ισχύς του μοντέλου εξαρτάται από την ποιότητα της κάμερας και γενικότερα μειώνεται από το κέντρο της εικόνας προς τα άκρα, αφού εκεί παρατηρείται αύξηση των στρεβλώσεων του φακού. Το pnhole μοντέλο της φωτογραφικής μηχανής, πολλές φορές, μπορεί να προσπεράσει προβλήματα που θα προκύψουν εφόσον αυτά είναι μικρά και αυτό επιτυγχάνεται κυρίως αν χρησιμοποιείται μία κάμερα υψηλής ποιότητας. Αυτό σημαίνει ότι το μοντέλο αυτό συχνά μπορεί να χρησιμοποιηθεί για να περιγράψει με αρκετά καλή ακρίβεια την λειτουργία της κάμερας στην υπολογιστική όραση. o μοντέλο μικρής οπής για την κάμερα περιγράφει τη μαθηματική σχέση μεταξύ των συντεταγμένων ενός τρισδιάστατου σημείου και της προβολής του στο επίπεδο της εικόνας, μέσω μίας ιδανικής φωτογραφικής κάμερα μικρής οπής. Σε μία τέτοια φωτογραφική μηχανή το άνοιγμα της κάμερας περιγράφεται ως ένα σημείο, απείρως μικρό, μέσω του οποίου περνάνε όλες οι γραμμές των προβολών των σημείων. Το σημείο αυτό χαρακτηρίζεται ως «μικρή οπή» και στην βιβλιογραφία αναφέρεται ως οπτικό κέντρο της κάμερας για τον τρισδιάστατο χώρο. ΣΧΗΜΑ.: Μοντέλο μικρής οπής για την κάμερα Οι οπτικές ακτίνες που προέρχονται από ένα αντικείμενο του χώρου μπροστά στην κάμερα, διέρχονται από μια μικρή οπή που υπάρχει σε μια αδιαφανή οθόνη, και προσπίπτοντας στο επίπεδο της εικόνας, δημιουργούν ένα ανεστραμμένο είδωλο του αντικειμένου. Για να πάρουμε την απεικόνιση m στο επίπεδο ενός συγκεκριμένου σημείου Μ, του τρισδιάστατου χώρου P 3, παίρνουμε τη τομή της οπτικής ακτίνας με το επίπεδο της εικόνας. Η οπτική ακτίνα είναι η φανταστική γραμμή η οποία διέρχεται από τα σημεία M και C (πράσινη γραμμή), όπου το C είναι το οπτικό κέντρο, ή αλλιώς εστία της κάμερας, και αντιστοιχεί στο σημείο το οποίο βρίσκεται η υποτιθέμενη «μικρή οπή», δια μέσου της οποίας διέρχονται οι οπτικές ακτίνες για να αποτυπωθούν

14 στο επίπεδο της εικόνας. Έτσι το C είναι η αρχή των συντεταγμένων του τρισδιάστατου χώρου και το Ο είναι η αρχή του συστήματος συντεταγμένων της εικόνας και λέγεται κύριο σημείο. H απόσταση του C από το επίπεδο της εικόνας ή αλλιώς η απόσταση του C από το O, ονομάζεται εστιακή απόσταση, και συμβολίζεται με f. Η απόσταση αυτή είναι σταθερή και προφανώς δεν εξαρτάται από τα Μ και m. Το επίπεδο το οποίο περιέχει το σημείο C και είναι παράλληλο στο επίπεδο της εικόνας ονομάζεται εστιακό επίπεδο, και τέλος η ευθεία η οποία είναι κάθετη στα δυο αυτά επίπεδα και διέρχεται από το C ονομάζεται οπτικός άξονας. ΣΧΗΜΑ.3: Προβολή ενός σημείου Αυτό το μοντέλο έτσι όπως παρουσιάστηκε είναι πολύ απλουστευμένο. Μία πραγματική κάμερα όπως αναφέραμε παραπάνω, περιέχει συστοιχίες φακών, οι οποίες, εκτός των άλλων, εισάγουν και μη-γραμμικές παραμορφώσεις, που έχουν σαν αποτέλεσμα τα σημεία M, C, m να μην είναι συνευθειακά. Όμως, εφόσον παρακαμφθούν τα προβλήματα που μπορεί να προκύψουν μπορούμε να περιγράψουμε με αυτό το απλό μοντέλο πλειάδα περιπτώσεων. Κύριο χαρακτηριστικό του pnhole μοντέλου είναι ότι αν συνδυαστεί με την προβολική γεωμετρία μας δίνει πολύ απλές γραμμικές εξισώσεις που περιγράφουν τη λειτουργία της κάμερας, δηλαδή τον προβολικό μετασχηματισμό από τον χώρο P 3 στον P. Αν χρησιμοποιούσαμε ευκλείδεια γεωμετρία τότε οι σχέσεις των ευκλείδειων συντεταγμένων ενός σημείου στον τρισδιάστατο χώρο με αυτές της προβολής του στην εικόνα, θα ήταν μη γραμμικές. Έστω ότι έχουμε ένα σημείο Μ(x 1,x,x 3 ) στο τρισδιάστατο ευκλείδειο σύστημα συντεταγμένων με αρχή αξόνων το C και το σημείο που προκύπτει από την προβολή του Μ είναι το m( 1, ) στο επίπεδο της εικόνας. Αν δούμε το σχήμα.3 από ψηλά και με τον άξονα των Χ να έχει την αρνητική κατεύθυνση προς τα κάτω, θα προκύψει το σχήμα.4. Oι μη-γραμμικές σχέσεις που θα προκύψουν από την ομοιότητα των τριγώνων είναι οι x1 x 1 f και f. x x Αυτά μπορούμε επίσης να τα συνοψίσουμε στο 1 f x1 x x 3 3 3 (.7)

15 ΣΧΗΜΑ.4: Η γεωμετρία της pnhole κάμερας όπως φαίνεται από τον Χ άξονα Οι σχέσεις αυτές είναι μη γραμμικές, και ως αποτέλεσμα, αν χρησιμοποιηθούν στην περαιτέρω μαθηματική ανάλυση, καθιστούν την επίλυση των συστημάτων που προκύπτουν δύσκολη τόσο αριθμητικά όσο και στην ανάλυσή τους. Από την άλλη μεριά, αν γίνει χρήση των προβολικών συντεταγμένων προκύπτουν γραμμικές σχέσεις. Οπότε από τη σχέση.7 μέσω ομογενών συντεταγμένων και θεωρώντας την ισότητα ως ισότητα μέχρι ένα μη μηδενικό παράγοντα κλιμάκωσης προκύπτει ότι 1 x 1 x 1 f x ~ x x3 x x 1 3 3 f f (.8) Επίσης, οι 3D συντεταγμένες του Χ μπορούν να εκφραστούν σε ομοιογενείς συντεταγμένες και αυτό έχει ως αποτέλεσμα το x1 1 1 0 0 0 x m ~ 0 1 0 0 PM (.9) x 1 3 1 0 0 f 0 1 όπου M είναι οι (κανονικοποιημένες) ομοιογενείς συντεταγμένες του πραγματικού σημείο στο P 3 και όπου m οι (κανονικοποιημένες) ομοιογενείς συντεταγμένες του σημείου στο επίπεδο της εικόνας (P ). Επίσης ισχύει ότι 1 0 0 0 f 0 0 0 P 0 1 0 0 ~ 0 f 0 0 1 0 0 f 0 0 0 1 0 οπότε μπορεί να γίνει αντικατάσταση του πίνακα P που προέκυψε στην σχέση.9. x1 1 f 0 0 0 x ~ 0 f 0 0 (.10) x 3 1 0 0 1 0 1 Ο πίνακας Ρ ονομάζεται προβολικός πίνακας της κάμερας (projecton matrx) ή πίνακας της κάμερας και στην γενική του μορφή, περιέχει όλες τις πληροφορίες που χρειαζόμαστε για να προσδιορίσουμε την προβολή οποιουδήποτε σημείου του χώρου