ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ. Πολυτεχνική Σχολή Τμήμα Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ. Πολυτεχνική Σχολή Τμήμα Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών"

Transcript

1 ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ Πολυτεχνική Σχολή Τμήμα Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών Σύστημα Άργος Σύστημα εντοπισμού ανθρώπου και αναγνώρισης πόζας,βασιζόμενο σε δεδομένα RGB-D Argus System Human detection and pose estimation system,based on RGB-D data Μιλτιάδης-Αλέξιος Παπαδόπουλος AEM: 6714 Επιβλέπων καθηγητής: Αναστάσιος Ντελόπουλος 30 Απριλίου 2013

2 Περίληψη Ο εντοπισμός του ανθρώπου και η αναγνώριση της πόζας του είναι ένα πολύπλοκο πρόβλημα που καλείται να λύσει η επιστήμη της Όρασης Υπολογιστών, ιδιαίτερα στη σύγχρονη εποχή που ακμάζει η 3D όραση και η αγορά αναζητά εναλλακτικές λύσεις διεπαφής με τα υπολογιστικά συστήματα. Το σύστημα Άργος αξιοποιεί αλγορίθμους όρασης υπολογιστών για να εντοπίσει και να απομονώσει τον χρήστη, βασιζόμενος σε χαρακτηριστικά του όπως το σχήμα σώματος, η ύπαρξη προσώπου και δέρματος. Στη συνέχεια αναζητά τη βέλτιστη πόζα που ταιριάζει σε αυτόν, μέσω του αλγορίθμου αναζήτησης βέλτιστων λύσεων PSO και γνωστού ανθρώπινου 3D μοντέλου. Το 3D μοντέλο λαμβάνει πόζες κατά βούληση και αποδίδεται από τη κάρτα γραφικών. Τέλος, το σύστημα παρακολουθεί την κίνηση του χρήστη, βασιζόμενο σε μια εκτίμηση αυτής και στην εξελικτική λογική του αλγορίθμου PSO. 2

3 3 Abstract Human detection and pose recognition is a complicated problem, often needed to be solved by Computer Vision, especially in modern times, when 3D vision is thriving and the marker is seeking alternative computer interface solutions. Argus System uses computer vision algorithms to detect and isolate the user, based on features like body shape, face and skin visibility. Next, it searches for the best matching pose, through the best solution searching algorithm PSO and a predetermined human 3D model. The 3D model takes poses on demand and it is rendered by the GPU. Finally, the system tracks the user s movement, based on estimation and PSO s evolutionary logic.

4 4 ΕΥΧΑΡΙΣΤΙΕΣ Η παρούσα εργασία δε θα μπορούσε ποτέ να ολοκληρωθεί χωρίς τη συμβολή και καθοδήγηση του καθηγητή Α.Ντελόπουλου, ο οποίος προσέφερε συνεχώς τις πλούσιες γνώσεις του στο τομέα της τεχνητής όρασης. Θα ήθελα επίσης να ευχαριστήσω τους γονείς και τη γιαγιά μου που με ανέχτηκαν κατά τη περίοδο της συγγραφής, μια περίοδο ιδιαίτερα αγχωτική. Εκτιμώ ιδιαίτερα τις συμβουλές του αδερφού και συναδέλφου μου σε θέματα λογισμικού, παρά τα διαφορετικά μας αντικείμενα, όπως επίσης και τη τεχνική υποστήριξη της κοινότητας της OpenCV και Ogre3D. Αποδίδω ευχαριστίες σε όλη την ομάδα ρομποτικής PANDORA, οι οποίοι με ενέπνευσαν το τελευταίο χρόνο σχετικά με το θέμα της εργασίας. Ένα μεγάλο ευχαριστώ στο sensei K.Ματζάρα και όλους τους aikidoka που γνώρισα και με βοήθησαν να αποβάλω το άγχος μου δημιουργικά. Τέλος θέλω να ευχαριστήσω τους φίλους μου Αλέξανδρο- Σάββα, Θεοδόση, Ραφαήλα και φυσικά Δάφνη, για τις υπέροχες στιγμές και συμβουλές που μου χάρισαν, όταν η εργασία έμοιαζε να φτάνει σε αδιέξοδο....αφιερώνω αυτή την εργασία στον καθηγητή Νικόλαο Ι. Μάργαρη που απεβίωσε λίγες μέρες πριν την ολοκλήρωσή της...

5 ΠΕΡΙΕΧΟΜΕΝΑ 5 Περιεχόμενα I Εισαγωγή 12 1 Ανάλυση προβλήματος 13 2 Υπάρχουσες λύσεις MoCap Μονο-Στερεο-Πολυσκοπική όραση Ενεργά συστήματα Παθητικά συστήματα Υβριδικά συστήματα Λογισμικά Διάρθρωση εργασίας 19 II Διάταξη καμερών 20 4 Απαιτήσεις 21 5 Κατασκευή Κάμερες Περίβλημα III Αρχιτεκτονική του συστήματος 24 6 Απαιτήσεις Γενική εικόνα του συστήματος Λήψη εικόνας και βάθους σκηνής Βαθμονόμηση διάταξης (Calibration) Θεωρία βαθμονόμησης Διαδικασία βαθμονόμησης Υπολογισμός βάθους σκηνής Θεωρία επιπολικής γεωμετρίας Διαθέσιμοι αλγόριθμοι Εικόνα διασποράς

6 ΠΕΡΙΕΧΟΜΕΝΑ 6 9 Εντοπισμός και αποκοπή χρήστη Εντοπισμός ανθρώπων Εντοπισμός χρήστη Εντοπισμός προσώπου Εντοπισμός δέρματος Εντοπισμός markers Παρακολούθηση χρήστη Αναγνώριση πόζας Μοντελοποιητής Δημιουργία μοντέλου Κύριος μοντελοποιητής Αλγόριθμος εύρεσης λύσης Μέθοδοι εκτίμησης πόζας που χρησιμοποιούνται Μετευρετικός αλγόριθμος PSO Αξιολόγηση πόζας Παρακολούθηση κίνησης Παρακολούθηση με PSO Υποβοήθηση παρακολούθησης με προηγούμενη γνώση Μορφή φίλτρου Kalman Προσαρμογή φίλτρου Kalman Υποβοήθηση παρακολούθησης με σημεία του χρήστη IV Υλοποίηση του συστήματος Χρησιμοποιηθέντα εργαλεία Συνολικό σύστημα Renderers Ogre3D OpenCV Boost Προβλήματα συστήματος και βιβλιοθηκών Προβλήματα υλικού Προβλήματα λογισμικού Πειραματικά αποτελέσματα Ενδογενείς και εξωγενείς παράμετροι κάμερας Ενδογενείς παράμετροι Εξωγενείς παράμετροι

7 ΠΕΡΙΕΧΟΜΕΝΑ Μετρήσεις βάθους με τη 3D κάμερα Εντοπισμός/Παρακολούθηση markers Παρακολούθηση χρήστη PSO συναρτήσεις σκορ Εύρεση πόζας Παραλληλοποίηση κώδικα Αξιολόγηση συστήματος Ταχύτητα Ακρίβεια Συμβατότητα V Επίλογος Συμπεράσματα και συνεισφορά Προτάσεις περαιτέρω έρευνας 90

8 ΚΑΤΑΛΟΓΟΣ ΣΧΗΜΑΤΩΝ 8 Κατάλογος Σχημάτων 1 Τα συστήματα εντοπισμού χρηστών μέσω δεδομένων RGB- D βρίσκουν εφαρμογή στη διασκέδαση Η ταινία Avatar έφερε επανάσταση στη βιομηχανία του θεάματος αξιοποιώντας τεχνολογίες 3D εικόνας και motion capture MoCap με πηγές φωτός MoCap με αισθητήρες Πολυσκοπική όραση 128 καμερών του ιδρύματος Stanford 16 6 O αισθητήρας Kinect χρησιμοποιεί δομημένο φωτισμό Κάμερα τεχνολογίας ToF Στέρεο κάμερα Bumblebee Συνδυασμός ToF και stereo Το λογισμικό Skeltrack του Joaquim Rocha PS3 Eye κάμερα της Sony Η μπροστινή όψη της κάμερας που χρησιμοποιήθηκε κατά τη διάρκεια της εργασίας Μια πιο στιβαρή κατασκευή τοποθετήθηκε στο όχημα της ομάδας ρομποτικής PANDORA του ΑΠΘ Η μπροστινή όψη της κάμερας που χρησιμοποιήθηκε κατά τη διάρκεια της εργασίας Λειτουργικά τμήματα του συστήματος Άργος Διάγραμμα ροής του τμήματος λογικής του Άργος Βαρελοειδής παραμόρφωση και στρέβλωση Μοτίβο σκακιέρας, συμμετρικών και μη-συμμετρικών κύκλων Επιπολική γεωμετρία Το pinhole μοντέλο που είναι ευρέως αποδεκτό Τα αποτελέσματα των αλγορίθμων var, bm και sgbm αντίστοιχα για μια δεδομένη σκηνή σε colormap jet παλέτα Παράδειγμα διασποράς του ζεύγους εικόνων Tsukuba. Κάτω δεξιά είναι το ground truth Δείγμα διασποράς όπως επιστρέφεται και η 3D απεικόνισή του. Είναι εμφανής η κλίση που δίνεται στο πάτωμα Διάγραμμα ροής εντοπισμού χρήστη Το τελικό αποτέλεσμα με τον εντοπισμένο χρήστη και την εικόνα διασποράς που του αντιστοιχεί. Οι markers έχουν εντοπιστεί επιτυχώς Παράδειγμα προσανατολισμένων παραγώγων εικόνας.. 38

9 ΚΑΤΑΛΟΓΟΣ ΣΧΗΜΑΤΩΝ 9 27 Παράδειγμα εντοπισμού ανθρώπων με HOG. Ο αλγόριθμος επιστρέφει τα τετράγωνα εντοπισμού Εντοπισμός προσώπου στη Lena Η κατανομή απόχρωσης δέρματος στο χρωματοχώρο YCrCb Οι markers είναι χρώματος πράσινου και κόκκινου και φοριούνται στους καρπούς των χεριών Παράδειγμα επαναπροβολής ιστογράμματος δέρματος Διάγραμμα ροής εντοπισμού και παρακολούθησης markers Διάγραμμα ροής παρακολούθησης χρήστη Το αποτέλεσμα του αλγορίθμου floodfill Η σχεδίαση του μοντέλου είναι απλή υπόθεση, πρέπει όμως να δοθεί προσοχή στη τοποθέτηση των αρθρώσεων Διάγραμμα ροής μοντελοποιητή Τα όρια αρθρώσεων σε συνδυασμό με τη εξελικτική λογική του PSO επιφέρουν αποτελέσματα που μοιάζουν με έργα τέχνης! Κίνηση σωματιδίου βάσει τυχαίας, βέλτιστης προσωπικής και γενικής θέσης Το kinect γνωρίζει τη θέση διάφορων σημείων του ανθρώπου σε κάθε καρέ της εικόνας διασποράς Συνάρτηση κέρδους για την επίδραση της θέσης των χεριών στο κέρδος του σωματιδίου Σχέση διασποράς και απόστασης από τη κάμερα, για μέγιστη διασπορά 32 pixels Η επιφάνεια που χρησιμοποιήθηκε για τις μετρήσεις είναι μια σκακιέρα, καθώς φέρει έντονη υφή Σχέση πραγματικής απόστασης από τη κάμερα και απόστασης που αυτή υπολογίζει σε cm Απόλυτο ποσοστιαίο σφάλμα απόστασης % ως προς την απόσταση από τη κάμερα Οι markers εντοπίζονται και στη συνέχεια παρακολουθείται η κίνησή τους. Μερικές φορές όμως η πρόβλεψη δεν είναι σωστή! Καθώς ο χρήστης κινείται στο χώρο, το τετράγωνο εντοπισμού τον ακολουθεί Τα αποτελέσματα που δίνουν διάφορες συναρτήσεις κέρδους για τις ίδιες λύσεις του μοντελοποιητή Δοκιμάστηκαν διαφορετικές εκδόσεις σε fuzzy λογική Εξετάστικαν και άλλοι ορισμοί του fuzzy AND και OR Σύνολο 21 λύσεων του μοντελοποιητή για σύγκριση με μια δεδομένη εικόνα διασποράς

10 ΚΑΤΑΛΟΓΟΣ ΣΧΗΜΑΤΩΝ καρέ εικόνας βάθους χρήστη και η λύση που προτείνει το σύστημα Τυχαίνει το σύστημα να μην ακολουθεί πάντα τη κίνηση του ανθρώπου Σύγκριση μεταξύ μερικής παράλληλης και σειριακής επεξεργασίας Κέρδος παράλληλης εκτέλεσης Κατανομή χρόνου σε κάθε εξέλιξη του σμήνους

11 ΚΑΤΑΛΟΓΟΣ ΠΙΝΑΚΩΝ 11 Κατάλογος Πινάκων 1 Όρια min/max αρθρώσεων ανθρώπου σε μοίρες Χαρακτηριστικά συστήματος υλοποίησης Ενδογενείς παράμετροι κάμερας Παράμετροι παραμόρφωσης κάμερας Εξωγενείς παράμετροι κάμερας

12 Μέρος I Εισαγωγή 12

13 1 Ανάλυση προβλήματος 13 1 Ανάλυση προβλήματος Η επικοινωνία ανθρώπου μηχανής αποτελεί ένα από τα σημαντικότερα ζητήματα της επιστήμης των ηλεκτρονικών υπολογιστών (ΗΥ) και ειδικότερα του τομέα της τεχνητής όρασης ή όρασης υπολογιστών (Computer Vision). Καθώς η τεχνολογία εξελίσσεται, οι επεξεργαστικές δυνατότητες των υπολογιστών βελτιώνονται ενώ οι μέθοδοι επικοινωνίας αυτών με τους χρήστες τείνουν να παραμείνουν στάσιμοι σε συμβατικά μέσα εισόδου δεδομένων και εξόδου πληροφορίας (πληκτρολόγιο, ποντίκι, οθόνη κτλ). Η βασικότερη αίσθηση του ανθρώπου είναι αναμφίβολα η όραση, οπότε, όπως ήταν άλλωστε αναμενόμενο, από τη στιγμή που ο ΗΥ εξοπλίστηκε με συσκευές λήψης εικόνας και βίντεο (κάμερες), γίνονται προσπάθειες ανάπτυξης διεπαφών ώστε να αντιλαμβάνεται ο ΗΥ το ανθρώπινο περιβάλλον αλλά κυρίως τον ίδιο τον άνθρωπο. Ο εντοπισμός ενός πιθανού χρήστη στο οπτικό πεδίο μιας κάμερας αλλά και η αναγνώριση των ενεργειών αυτού παρέχει πολύτιμη πληροφορία, που μπορεί να αξιοποιηθεί σε πληθώρα εφαρμογών, όπως είναι η τεχνητή νοημοσύνη, τα βιντεοπαιχνίδια, οι κινηματογραφικές ταινίες, ο χειρισμός αυτοματισμών, η ρομποτική κτλ. Οι περισσότερες από αυτές τις εφαρμογές απαιτούν να αναγνωριστεί ο Σχήμα 1: Τα συστήματα άνθρωπος, να αποκοπεί από το περιβάλλον που τον περιέχει και να εντοπιστεί δεδομένων RGB-D βρίσκουν εντοπισμού χρηστών μέσω η ακριβής ή προσεγγιστική του θέση στις εφαρμογή στη διασκέδαση. 2 διαστάσεις και άνω. Σίγουρα είναι πιο διασκεδαστικό αν ο ήρωας ενός βιντεοπαιχνιδιού κινείται ακριβώς όπως ο χρήστης του, ενώ αυτός τον χειρίζεται με ασφάλεια στο σαλόνι του σπιτιού του. Η βιομηχανία του θεάματος δε θα μπορούσε να μας προσφέρει σκηνές φανταστικών χαρακτήρων με τόσο φυσική κί- Σχήμα 2: Η ταινία Avatar έφερε επανάσταση στη βιομηχανία του θεάματος αξιονηση που εκπλήσσει χωρίς τις τεχνολογίες Καταγραφής Κίνησης (Motion Capture - ποιώντας τεχνολογίες 3D εικόνας και motion capture MoCap). Η ιδέα της χειραψίας ενός ρομπότ με τον άνθρωπο έχει ξεφύγει από σενάριο ταινίας επιστημονικής φαντασίας και τείνει να υλοποιηθεί. Τροχοπέδη στην επαναστατική αυτή εξέλιξη στη τεχνολογία των

14 2 Υπάρχουσες λύσεις 14 υπολογιστών αποτελεί το ίδιο το πρόβλημα. Εκ φύσεως το πρόβλημα εμφανίζεται στον τρισδιάστατο (3Δ) χώρο με 3Δ αντικείμενα να δρουν σε αυτόν (πχ ο άνθρωπος). Ακόμα και αν παραλείψουμε το γεγονός ότι οι συσκευές που επιτρέπουν τον ΗΥ να αντιλαμβάνεται το περιβάλλον με οπτικό τρόπο (κάμερες) λειτουργούν σε ένα υποσύνολο του 2Δ χώρου (μειωμένη ανάλυση, μειωμένο οπτικό πεδίο, χαμηλή προσαρμοστική ικανότητα στις αλλαγές του περιβάλλοντος κτλ), βρισκόμαστε αντιμέτωποι με τον αυξημένο χώρο του προβλήματος, ο οποίος εκτείνεται πέρα από τις 3 διαστάσεις. Ένα συμπαγές άψυχο αντικείμενο στο χώρο μπορεί να κινηθεί με 6 διαφορετικούς τρόπους στο χώρο (3 μετατοπίσεις και 3 περιστροφές) τους οποίους ονομάζουμε βαθμούς ελευθερίας (degrees of freedom - DoF). Ένα αντικείμενο με αρθρώσεις, όπως ο άνθρωπος, εκτός από τους 6 DoF, διαθέτει και DoF για κάθε του άρθρωση. Αν και για έναν άνθρωπο είναι πολύ εύκολο να αναγνωρίσει έναν άλλον άνθρωπο αλλά και τη θέση αυτού στο περιβάλλον με σχετική (ποιοτική) ακρίβεια, ο ΗΥ δε διαθέτει τη νοημοσύνη για να επιφέρει το ίδιο αποτέλεσμα στο ίδιο πρόβλημα, με την ανάλογη ακρίβεια και ταχύτητα. Αντί αυτού, στοχεύουμε στον απόλυτο προσδιορισμό των μεγεθών που χαρακτηρίζουν τη θέση του ανθρώπου, βασιζόμενοι πολλές φορές σε συστήματα που παρέχουν περισσότερη πληροφορία από αυτή που παρέχει η ανθρώπινη όραση. Μπορούμε λοιπόν να φανταστούμε γιατί η αναγνώριση της πόζας του ανθρώπου είναι ένα από τα μεγαλύτερα προβλήματα του τομέα της τεχνητής όρασης. 2 Υπάρχουσες λύσεις Αν και το πρόβλημα της αναγνώρισης της ανθρώπινης πόζας είναι ιδιαίτερα δύσκολο, υπάρχουν λύσεις που προσεγγίζουν τη λύση σε ικανοποιητικό βαθμό, χρησιμοποιώντας διαφορετικές μεθόδους. Όπως και σε κάθε άλλο πρόβλημα, υπάρχουν λύσεις που διαθέτουν έναν συνδυασμό χαρακτηριστικών όπως ταχύτητα, ακρίβεια, αντοχή σε εξωγενείς θορύβους, χαμηλή υπολογιστική πολυπλοκότητα, χαμηλό χρηματικό κόστος κτλ, αλλά λίγες από αυτές συνδυάζουν τα απαραίτητα χαρακτηριστικά ώστε να ξεχωρίσουν ανάμεσα στις άλλες και να ικανοποιήσουν τις απαιτήσεις της αντίστοιχης αγοράς υπολογιστικών συστημάτων, είτε αυτοί είναι οι τελικοί καταναλωτές είτε βιομηχανίες. Ανάμεσα σαυτές διακρίνουμε 2 κυρίως κατηγορίες, τη κατηγορία του MoCap και τη κατηγορία της στερεοσκοπικής όρασης. Οι δυο κατηγορίες δεν είναι απόλυτα ορισμένες καθώς πολλές φορές εμφανίζεται επικάλυψη μεταξύ τους.

15 2.1 MoCap MoCap Ως Καταγραφή Κίνησης ορίζεται η διαδικασία κατά την οποία μετρούμε με άμεσο τρόπο την κίνηση του χρήστη, καθώς αυτός φοράει κάποιον ειδικό εξοπλισμό που το επιτρέπει. Ο εξοπλισμός αυτός συνήθως είναι κάποιας μορφής στολή, με ανακλαστήρες ή πηγές φωτός σε γνωστά στρατηγικά σημεία, την μετατόπιση των οποίων -άρα και τη παραμόρφωση του σώματος- μετράμε μέσω κάμερας κατά τη διάρκεια της κίνησης. Η παραμόρφωση αυτή μετατρέπεται στη συνέχεια σε μετασχηματισμούς σημείων ενός μοντέλου το οποίο αποτελεί και το κινηματικό μοντέλο για παράδειγμα του ανθρώπου. Σε πιο απαιτητικές εφαρμογές, η στολή φέρει αισθητήρες προσανατολισμού και επιτάχυνσης ή ακόμα και μέτρησης σχετικής θέσης αρθρώσεων (σχήμα 4). Σχήμα 3: MoCap με πηγές φωτός Σχήμα 4: MoCap με αισθητήρες Κύριο πλεονέκτημα αυτής της κατηγορίας είναι η ακρίβεια των μετρήσεων και η ταχύτητα λήψης αυτών, καθώς απαιτούνται ελάχιστοι

16 2.2 Μονο-Στερεο-Πολυσκοπική όραση 16 υπολογισμοί για να προκύψει χρήσιμη πληροφορία. Το μειονέκτημα αυτής της κατηγορίας είναι ότι απαιτεί ελεγχόμενο, συνήθως κλειστό, περιβάλλον και συμβιβασμό του χρήστη ως προς την ένδυσή του, καθώς πρέπει να φοράει την απαραίτητη στολή. Η μέθοδος αυτή ενδείκνυται για εμπορικές εφαρμογές αλλά όχι για καταναλωτικές λύσεις. Για το καταναλωτικό κοινό, εφαρμόζονται μέθοδοι μονοσκοπικής, στερεοσκοπικής και πολυσκοπικής όρασης. Έχοντας 2Δ και 3Δ πληροφορία για μια δεδομένη σκηνή, μπορούμε να εκτιμήσουμε την πόζα του χρήστη, όπως ακριβώς θα έκανε ένας άνθρωπος για έναν άλλον άνθρωπο, βασιζόμενος στη κυρίαρχη αίσθηση, την όραση. 2.2 Μονο-Στερεο-Πολυσκοπική όραση Σε αυτό το είδος συστήματος, στόχος είναι ο υπολογισμός του βάθους της σκηνής, με εξαίρεση την μονοσκοπική όραση, η οποία παίρνει στοιχεία από την προαναφερθείσα κατηγορία MoCap. Οι διαφορές ανάμεσα στη μονοσκοπική, τη στερεοσκοπική και τη πολυσκοπική όραση εντοπίζονται κυρίως στον αριθμό καμερών που χρησιμοποιούνται για τη συλ5: Πολυσκοπική λογή δεδομένων. Σε γενικές γραμμές η Σχήμα όραση 128 καμερών του μονοσκοπική όραση προσφέρει 2Δ πληροφορία, η στερεοσκοπική 3Δ ενώ η πο- ιδρύματος Stanford λυσκοπική είτε πιο ακριβή 3Δ πληροφορία είτε 3Δ πληροφορία σημείων που δεν είναι ορατά από μια οπτική γωνία, με εξαιρετική περίπτωση αυτή της πλήρους αναπαράστασης του πραγματικού μοντέλου στο 3D κόσμο. Ανεξάρτητα του αριθμού καμερών που θα χρησιμοποιηθούν, μπορούμε να χωρίσουμε εκ νέου τη κατηγορία σε 2 υποκατηγορίες, τα ενεργά και τα παθητικά συστήματα Ενεργά συστήματα Σχήμα 6: O αισθητήρας Kinect χρησιμοποιεί δομημένο φωτισμό Ως ενεργά συστήματα ορίζουμε τα συστήματα όρασης που μεταβάλλουν χαρακτηριστικά του περιβάλλοντός τους, κυρίως οπτικής φύσεως, ώστε να μπορέσουν να λάβουν 3Δ δεδομένα της σκηνής που έχουν στο οπτικό τους πεδίο. Τα συστήματα αυτά διαθέτουν μια πηγή δομη-

17 2.2 Μονο-Στερεο-Πολυσκοπική όραση 17 μένου φωτισμού (structured lighting) [1] η οποία προβάλλει στη σκηνή ένα γνωστό μοτίβο και μετράει την παραμόρφωση αυτού όταν παρατηρείται από διαφορετική οπτική γωνία. Η πηγή αυτή μπορεί να χρησιμοποιεί μήκος κύματος που ανήκει στο ορατό πεδίο αλλά συνηθέστερα επιλέγεται το πεδίο των υπερύθρων. Χαρακτηριστικό παράδειγμα ενεργού συστήματος στερεοσκοπικής όρασης, που χρησιμοποιεί την τεχνολογία δομημένου φωτισμού για να υπολογίσει βάθος σκηνής ώστε να εντοπίσει τον χρήστη και τη πόζα του, είναι το Kinect της εταιρίας Microsoft. Σχήμα 7: Κάμερα τεχνολογίας ToF Άλλα, πιο εξελιγμένα συστήματα, εφαρμόζουν τη τεχνική του Time of Flight (ToF), στην οποία μετριέται η χρονική διάρκεια που κάνει για να επιστρέψει ένας παλμός φωτός ύστερα από ανάκλαση από κάποιο αντικείμενο της σκηνής. Τα ενεργά συστήματα τείνουν να εμφανίζουν καλύτερα αποτελέσματα από τα παθητικά, κυρίως σε θέματα ακρίβειας μέτρησης. Όπως όμως και τα MoCap συστήματα, απαιτούν λειτουργία σε ελεγχόμενο περιβάλλον, κυρίως εσωτερικού χώρου, χωρίς άμεσο φωτισμό προς το σύστημα ή τον χρήστη. Οι κάμερες αυτές επιτρέπουν μέτρηση βάθους σκηνής από μερικά μέτρα μέχρι μερικές δεκάδες μέτρα, διακριτικής ικανότητας 1cm και ταχύτητας λήψης 100fps (frames per second). Το υψηλό τους κόστος και η χαμηλή ανάλυση που προσφέρουν (μόλις 320x240 για εμπορικές εφαρμογές) είναι από τα βασικότερα μειονεκτήματά τους Παθητικά συστήματα Η αρχή λειτουργίας των παθητικών Σχήμα 8: Στέρεο κάμερα συστημάτων βασίζεται κυρίως στον τρόπο με τον οποίο λειτουργεί η ανθρώπινη όραση. Το περιβάλλον εμφανίζεται όπως θα το έβλεπε ένας άνθρωπος, πιθανώς με ισχυρότερο φωτισμό, αλλά ομοιόμορφο και όχι δομημένο, όπως στη προηγούμενη κατηγορία. Το σύστημα Bumblebee 2 που χρησιμοποιεί μία κάμερα εφαρμόζει τεχνικές MoCap ή ευριστικές, σύμφωνα με τις οποίες επιδιώκεται η οπτική προσαρμογή ενός γνωστού 3D μο-

18 2.2 Μονο-Στερεο-Πολυσκοπική όραση 18 ντέλου ώστε η 2D προβολή του να μοιάζει με την 2D εικόνα εισόδου. Το σύστημα που χρησιμοποιεί δύο κάμερες σε στερεοσκοπική διάταξη, προσεγγίζει περισσότερο την ανθρώπινη όραση και έχει αντίστοιχους περιορισμούς. Τέλος, το σύστημα πολλών καμερών επιτρέπει καλύτερη αντίληψη του 3Δ χώρου από διάφορες οπτικές γωνίες, περιορίζοντας όμως το περιβάλλον στη τομή των οπτικών πεδίων του συνόλου των καμερών Υβριδικά συστήματα Σχήμα 9: Συνδυασμός ToF και stereo Ο συνδυασμός ενός παθητικού με έναν ενεργό σύστημα, μας δίνει ένα υβριδικό σύστημα το οποίο συνδυάζει τα καλύτερα των δύο τεχνολογιών. Μια ToF κάμερα μπορεί να συνδυαστεί με μια στερεοσκοπική κάμερα [2] ενώ μια kinect συσκευή μπορεί να αξιοποιήσει τις δύο διαθέσιμες κάμερες ως παθητική διάταξη [3] καλύπτοντας έτσι αδυναμίες του ενεργού συστήματος. Η όλη κατασκευή είναι σαφώς ανώτερη σε δυνατότητες, ακρίβεια αλλά και σε κόστος και βάρος κατασκευής. Ένα βασικό πρόβλημα είναι η ένωση (fusion) της πληροφορίας βάθους που προσφέρει η ToF κάμερα και η στέρεο κάμερα, καθώς πρέπει για κάθε περιοχή της εικόνας βάθους να επιλεγεί η σωστή τιμή αυτού από τα δύο υποσυστήματα. Τα συστήματα αυτά θεωρούνται ως η ιδανική επιλογή για ρομποτικές εφαρμογές, καθώς επιτρέπουν στο σύστημα να έχει πλήρη αντίληψη του περιβάλλοντος χώρου, ώστε να μπορεί να δράσει ανάλογα Λογισμικά Δυστυχώς δεν υπάρχουν πολλές λύσεις υπό μορφή λογισμικού. Ο τομέας της αναγνώρισης και παρακολούθησης πόζας ήταν πάντοτε άμεσα συνδεδεμένος με την τεχνητή όραση, όμως ενθαρρυντικά αποτελέσματα άρχισαν να εμφανίζονται τα τελευταία χρόνια, με την θριαμβευτική είσοδο του kinect στην καταναλωτική αγορά. Αν και η κυκλοφορία του kinect χρονολογείται από το 2010, ελάχιστες κινήσεις έχουν γίνει για την δημιουργία συστημάτων εύρεσης πόζας και παρακολούθησης αυτής. Μεγάλο μέρος της έρευνας έχει αφοσιωθεί στην ερμηνεία της συμπεριφοράς του ανθρώπου και στη χρήση της αξιόπιστης εικόνας βάθους που

19 3 Διάρθρωση εργασίας 19 προσφέρει ένα σύστημα χαμηλού κόστους όπως το kinect. Σχήμα 10: Το λογισμικό Skeltrack του Joaquim Rocha Κατά τη διάρκεια της αναζήτησης πριν από τη συγγραφή της παρούσας εργασίας εντοπίστηκαν δύο πακέτα λογισμικού τα οποία κινούνται στο χώρο της αναγνώρισης πόζας βασιζόμενα σε πληροφορία χρώματος και βάθους. Το skeltrack του Joaquim Rocha link δημιουργεί τον άνω σκελετό του ανθρώπινου σώματος, βασιζόμενο σε μαθηματικές εξισώσεις και περιορισμούς (ακρότατα 3D μοντέλου, αναλογίες ανθρώπινων άκρων κτλ) και στην εικόνα βάθους που προσφέρει μια συσκευή τύπου kinect, εφόσον αυτή περιέχει μόνο το βάθος εντός της σιλουέτας του ανθρώπου. Επίσης, η βιβλιοθήκη Point Cloud Library - PCL link προσφέρει ένα υποσύστημα αναγνώρισης πόζας -παρόμοιο του kinect- το οποίο όμως απαιτεί τη χρήση κάρτας γραφικών με υποστήριξη CUDA. 3 Διάρθρωση εργασίας Στη παρούσα εργασία θα παρουσιάσουμε ένα παθητικό σύστημα στερεοσκοπικής όρασης με στοιχεία MoCap. Με το σύστημα αυτό γίνεται μια απόπειρα προσέγγισης της αποτελεσματικότητας εμπορικών συστημάτων, χρησιμοποιώντας εργαλεία ανοικτού κώδικα, με απώτερο στόχο τη δημιουργία ενός συστήματος ανοικτού επίσης κώδικα αλλά και χαμηλού τελικού κόστους. Στην ενότητα II θα αναφερθούμε εν συντομία στη κατασκευή της στερεοσκοπικής διάταξης που χρησιμοποιήθηκε για τις ανάγκες της παρούσας εργασίας. Περνώντας στην ενότητα III, όπου παρουσιάζεται η αρχιτεκτονική του συστήματος, θα εξετάσουμε πως λειτουργεί μια στερεοσκοπική διάταξη (κεφ.7 & 8) ώστε να υπολογιστεί το βάθος της σκηνής που αυτή παρατηρεί. Στη συνέχεια στα κεφάλαια 9, 10 και 11, θα παρουσιάσουμε τη διαδικασία που μπορεί να ακολουθήσει κανείς για να ερμηνεύσει τη πληροφορία χρώματος και βάθους που διαθέτει ώστε να ερμηνεύσει την πόζα οποιουδήποτε αντικειμένου ενδιαφέροντος στο χώρο. Τέλος στην ενότητα IV, αναγράφουμε επιμέρους και τελικά αποτελέσματα του συστήματος Άργος, όπως αυτό υλοποιήθηκε για τις ανάγκες της παρούσας εργασίας, καθώς επίσης και τα προβλήματα και περιορισμούς που συναντήσαμε, τόσο στο υλικό όσο και στο λογισμικό.

20 Μέρος II Διάταξη καμερών 20

21 4 Απαιτήσεις 21 4 Απαιτήσεις Ο σχεδιασμός ενός συστήματος εντοπισμού ανθρώπου και αναγνώρισης της πόζας του, βασιζόμενο σε δεδομένα RGB-D, απαιτεί τη χρήση μιας διάταξης ικανής να φέρει τουλάχιστον δύο διακριτές κάμερες, σε παράλληλη διάταξη. Η διάταξη αυτή θα πρέπει να είναι τέτοιας μορφής ώστε να επιτρέπει στη κατασκευή, σύμφωνα με τη θεωρία της στερεοσκοπικής όρασης, να υπολογίζει το βάθος της σκηνής (depth) και, σε συνδυασμό με την υπάρχουσα χρωματική πληροφορία RGB (red-greenblue), να παρέχει στο σύστημα Άργος πληροφορία RGB-depth (RGB- D). Η θεωρία της στερεοσκοπικής όρασης απαιτεί μια στερεοσκοπική κατασκευή (stereo rig) η οποία διατηρεί τις δύο κάμερες σε παράλληλη κάθετη ή οριζόντια διάταξη, με παράλληλες τις ευθείες που διέρχονται από τα κέντρα φακών και κέντρα προβολής των δυο καμερών. Στόχος του συστήματος Άργος είναι να προσεγγιστεί η λειτουργία ακριβών ή κλειστών συστημάτων με ανοικτό κώδικα και υλικά χαμηλού κόστους. Για το λόγο αυτό δε χρησιμοποιήθηκε έτοιμη κατασκευή στερεοσκοπικής κάμερας, με ή χωρίς προεπεξεργασία εικόνας μέσω DSP ή FPGA, καθώς μια τέτοια λύση κρίνεται ιδιαίτερα ακριβή για τους σκοπούς της παρούσας εργασίας. Αντί αυτού, επιλέχθηκαν κοινές κάμερες πρωτοκόλλου επικοινωνίας USB, οι οποίες τοποθετήθηκαν σε ένα κουτί αλουμινίου. 5 Κατασκευή 5.1 Κάμερες Χρησιμοποιήθηκαν 2 διακριτές USB κάμερες χαμηλού κόστους (<30 έκαστη) αλλά σχετικά υψηλών επιδόσεων της εταιρίας Sony, με όνομα προϊόντος Sony PS3 Eye. Οι συγκεκριμένες κάμερες έχουν σχεδιαστεί από την εταιρία SCEI για λογαριασμό της Sony για εφαρμογές τεχνητής όρασης στο σύστημα PlayStation 3 της ιδίας εταιρίας. Διαθέτουν φακούς χαμηλής παραμόρφωσης (radial distortion), εξοπλισμένους με φίλτρα IR για πιστή αναπαράσταση χρωμάτων και Σχήμα 11: PS3 Eye με οριζόντιο οπτικό εύρος (field of view-fov) 75. κάμερα της Sony Το οπτικό εύρος είναι μεγαλύτερο από αυτό των κοινών καμερών και θεωρείται απαραίτητο για εφαρμογές στερεοσκο-

22 5.2 Περίβλημα 22 πικής όρασης. Η κάμερα έχει σχεδιαστεί για εφαρμογές τεχνητής όρασης, μιας και αποτελεί συνοδευτικό του πακέτου PS3 move, με το οποίο ο χρήστης μπορεί να χρησιμοποιεί το χειριστήριό του στο 3Δ χώρο. Ο αισθητήρας OmniVision OV7720 εμφανίζει υψηλό SNR ακόμα και σε καταστάσεις χαμηλού φωτισμού. Λόγω πρωτοκόλλου επικοινωνίας USB 2.0 και αισθητήρα OmniVision, εξασφαλίζεται συμβατότητα με συστήματα WINDOWS και LINUX, ακόμα και με τους προκαθορισμένους οδηγούς συσκευής. 5.2 Περίβλημα Σχήμα 12: Η μπροστινή όψη της κάμερας που χρησιμοποιήθηκε κατά τη διάρκεια της εργασίας Για να μπορέσουν οι δύο ανεξάρτητες κάμερες να λειτουργήσουν στερεοσκοπικά, πρέπει να στερεωθούν μόνιμα σε παράλληλη διάταξη, χωρίς να υπάρχει η πιθανότητα σχετικής τους μετακίνησης. Για το λόγο αυτό υλοποιήθηκε μια πρόχειρη κατασκευή από αλουμίνιο, ικανή να διατηρήσει τις κάμερες σε παράλληλη θέση. Οφείλουμε να σημειώσουμε ότι η κατασκευή είναι πλήρως χειροποίητη ενώ για να πετύχουμε το καλύτερο δυνατό αποτέλεσμα θα έπρεπε να σχεδιαστεί μια πιο ανθεκτική κατασκευή και να κατασκευαστεί με τη βοήθεια μηχανουργικών μηχανημάτων υψηλής ακρίβειας. Η κατασκευή αποτέλεσε επίσης τον πρόγονο της νέας βελτιωμένης στερεοσκοπικής κάμερας με PS3 Eye που χρησιμοποιήθηκε στη ρομποτική πλατφόρμα Pandora για τις ανάγκες της ομάδας ρομποτικής του τμήματος Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Λόγω απαιτήσεων του λογισμικού Σχήμα 13: Μια πιο στιβαρή που θα αναφερθούν παρακάτω, οι κάμερες έπρεπε να τοποθετηθούν παράλληλα μεταξύ τους (παράλληλοι άξονες φακών), με την ελάχιστη δυνατή απόσταση που μπορούσε να επιτευχθεί. Οι αισθητήρες κατασκευή τοποθετή- τοποθετήθηκαν σε μια απόσταση 8.3εκ, ηθηκε οποία στοθεωρείται όχημα της ιδανική ομάδας για εφαρμογές μέτρησης βάθους σκηνής μέ- ρομποτικής PANDORA του ΑΠΘ

23 5.2 Περίβλημα 23 Σχήμα 14: Η μπροστινή όψη της κάμερας που χρησιμοποιήθηκε κατά τη διάρκεια της εργασίας τριας απόστασης. Η απόσταση των φακών ονομάζεται baseline της στερεοσκοπικής κάμερας και είναι γνωστή εκ κατασκευής ή μετράται αργότερα μέσω της διαδικασία της βαθμονόμησης (calibration). Εφόσον η κατασκευή δεν ακολουθεί βιομηχανικά πρότυπα, η ακριβής μέτρηση του baseline μέσω της διαδικασίας βαθμονόμησης θεωρείται απαραίτητη.

24 Μέρος III Αρχιτεκτονική του συστήματος 24

25 6 Απαιτήσεις 25 6 Απαιτήσεις Μέχρι αυτό το σημείο αναφερθήκαμε στις απαιτήσεις που έχει η διάταξη καμερών του συστήματος. Στο σημείο αυτό οφείλουμε να αναφέρουμε ορισμένες λειτουργικές απαιτήσεις του τμήματος του λογισμικού, ώστε να έχουμε μια πλήρη εποπτεία των απαιτήσεων αλλά και των δυνατοτήτων του συστήματος. Έτσι λοιπόν το σύστημα Άργος πρέπει να: μπορεί να υπολογίζει το βάθος σκηνής χρησιμοποιώντας τη στερεοσκοπική μέθοδο εντοπίζει την ύπαρξη ενός αντικειμένου ενδιαφέροντος, στη δική μας περίπτωση ενός ανθρώπινου χρήστη προτείνει μια πιθανή πόζα του αντικειμένου αυτού σε πραγματικές συντεταγμένες προσαρμόζει την πόζα αυτή στη κίνηση του αντικειμένου αξιολογεί την συμβατότητα της λύσης που προτείνει με την πραγματική σκηνή που δέχεται ως είσοδο βασίζεται σε βιβλιοθήκες ανοικτού κώδικα εκτελείται realtime ή near-realtime και να είναι παραλληλοποιήσιμο μπορεί να εκτελεστεί σε διαφορετικά περιβάλλοντα και λειτουργικά συστήματα είναι εύκολα προσαρμόσιμο στις εκάστοτε απαιτήσεις παρακολούθησης Λαμβάνοντας υπόψη τις παραπάνω λειτουργικές απαιτήσεις, θα γίνει μια απόπειρα σχεδίασης ενός ολοκληρωμένου συστήματος το οποίο αξιοποιεί τεχνικές όρασης υπολογιστών και σχεδίασης γραφικών, ώστε να επιτύχει το στόχο της αναγνώρισης της πόζας ενός ανθρώπου. 6.1 Γενική εικόνα του συστήματος Το σύστημα, που θα αναλυθεί στη συνέχεια, αποτελείται από τα ακόλουθα τμήματα: Η διαδικασία λειτουργίας που λαμβάνει χώρα, αποτελείται από τα ακόλουθα βήματα. Αρχικά λαμβάνεται μια στερεοσκοπική

26 6.1 Γενική εικόνα του συστήματος 26 Σχήμα 15: Λειτουργικά τμήματα του συστήματος Άργος εικόνα σαν είσοδος στο σύστημα. Η εικόνα αναλύεται και εντοπίζεται ο ενεργός χρήστης και το βάθος σκηνής που ανήκει σε αυτόν. Σε συνεργασία με τον μοντελοποιητή, το σύστημα αναζητά λύσεις για την εύρεση της πόζας του ανθρώπου. Ο μοντελοποιητής επικοινωνεί με τον renderer, ο οποίος εκτελεί εντολές δημιουργίας 3D μοντέλων στη κάρτα γραφικών. Η λογική του συστήματος είναι υλοποιημένη σε C++ και χρησιμοποιεί τη βιβλιοθήκη OpenCV. Οι λειτουργίες του συστήματος που θα παρουσιαστούν στη συνέχεια εμφανίζονται σε μορφή διαγράμματος ροής στο σχήμα 16. Σχήμα 16: Διάγραμμα ροής του τμήματος λογικής του Άργος.

27 7 Λήψη εικόνας και βάθους σκηνής 27 7 Λήψη εικόνας και βάθους σκηνής Το σύστημα Άργος χρησιμοποιεί οπτική πληροφορία η οποία αποτελείται από έγχρωμες συνεχόμενες λήψεις της επιθυμητής σκηνής (εικονοροή) από δύο διαφορετικές θέσεις του χώρου (στερεοσκοπική όραση). Η διαδικασία αυτή δεν είναι ικανή από μόνη της να παράγει την επιπλέον πληροφορία βάθους σκηνής που απαιτεί το σύστημα, στο οποίο επιλέξαμε να χρησιμοποιήσουμε μια στερεοσκοπική διάταξη. Μια τέτοιου είδους πληροφορία απαιτεί αφενός τη βαθμονόμηση της διάταξης καμερών, ώστε να γνωρίζουμε τις εσωτερικές και εξωτερικές παραμέτρους της διάταξης, και αφετέρου την χρήση ειδικών αλγορίθμων στερεοσκοπίας που εμφανίζουν χαρακτηριστικά λειτουργίας παρόμοια με αυτά της ανθρώπινης όρασης. Το πακέτο βιβλιοθηκών που επιλέχθηκε για χρήση στο τμήμα της επεξεργασίας εικόνας του συστήματος είναι η OpenCV [4], ένα ευρέως γνωστό API για εφαρμογές τεχνητής όρασης, με πλούσιες δυνατότητες, ενεργή κοινότητα και πολλά υποσχόμενη μελλοντική εξέλιξη. Προσφέρεται σε ποικίλα λειτουργικά συστήματα και γλώσσες προγραμματισμού, διατίθεται και σε εκδόσεις φορητών λειτουργικών συστημάτων (πχ android) ενώ κινείται προς τα πεδία της παράλληλης επεξεργασίας δεδομένων πολλών πυρήνων, μέσω της βιβλιοθήκης TBB (Thread Building Blocks) της Intel. 7.1 Βαθμονόμηση διάταξης (Calibration) Θεωρία βαθμονόμησης Όπως θα αντιληφθούμε καλύτερα στη συνέχεια, για να μπορέσουμε να υπολογίσουμε το βάθος της σκηνής, πρέπει να γνωρίζουμε τις ενδογενείς και εξωγενείς παραμέτρους τις κάμερας. Το μοντέλο της κάμερας που χρησιμοποιούμε είναι το γνωστό και ως pinhole μοντέλο κάμερας ή κάμερα οπής (pinhole camera) και εκφράζεται μαθηματικά ως: u v = 1 } {{ } συντεταγμένες εικόνας f x 0 c x 0 f y c y } {{ } εστιακή απόσταση & κέντρο προβολής (ενδογενείς) r 11 r 12 r 13 t 1 r 21 r 22 r 23 t 2 r 31 r 32 r 33 t 3 } {{ } μεταφορά & περιστροφή (εξωγενείς) X Y Z 1 } {{ } συντεταγμένες 3Δ

28 7.1 Βαθμονόμηση διάταξης (Calibration) 28 Το μοντέλο αυτό είναι ιδιαίτερα διαδεδομένο χάρη στην απλότητά του αλλά και το επίπεδο απόδοσης της λειτουργίας μιας πραγματικής κάμερας που αυτό προσφέρει. Με τον όρο ενδογενείς παράμετροι (intrinsic parameters) εννοούμε το σύνολο των αριθμητικών παραμέτρων που χαρακτηρίζουν μεγέθη μίας κάμερας και οφείλονται σε χαρακτηριστικά της κατασκευής της ή αναπόφευκτες ατέλειες, γνωστών και ως εσωτερικές παράμετροι της κάμερας. Οι παράμετροι αυτοί περιλαμβάνουν το κέντρο προβολής, την εστιακή απόσταση (focal length) και τις παραμορφώσεις του φακού. Οι παραμορφώσεις εκφράζονται με μαθηματικό τρόπο ως: Οι παραμορφώσεις αυτές είναι αποτέλεσμα των ατελειών κατασκευής. Εμφανίζονται στο καρέ ως βαρελοειδής παραμορφώσεις και στρεβλώσεις (skew). Οι παραμορφώσεις αυτές παραποιούν τη πραγματική θέση των αντικειμένων με σημείο αναφοράς τη κάμερα και αλλοιώνουν τα ευθύγραμμα τμήματα (σχήμα 17). Με τον όρο εξωγενείς παράμετροι (extrinsic parameters) εννοούμε το σύνολο των αριθμητικών παραμέτρων που χαρακτηρίζουν τη μετατόπιση και περιστροφή της στέρεο-κάμερας ως προς την σκηνή που παρατηρεί ή αντίστροφα τη μεταφορά της σκηνής σε 3Δ συντεταγμένες στέρεο-κάμερας. Συγκεκριμένα περιλαμβάνονται οι πίνακες: R:περιστροφή ανάμεσα στα συστήματα συντεταγμένων των 2 καμερών T:μεταφορά ανάμεσα στα συστήματα συντεταγμένων των 2 καμερών R1:μετασχηματισμός ανόρθωσης για την 1η κάμερα R2:μετασχηματισμός ανόρθωσης για τη 2η κάμερα P1:ανορθωμένος πίνακας προβολής 1ης κάμερας

29 7.1 Βαθμονόμηση διάταξης (Calibration) 29 P2:ανορθωμένος πίνακας προβολής 1ης κάμερας Q:πίνακας αντιστοίχισης διασποράς-βάθους (disparity-depth) Σχήμα 17: Βαρελοειδής παραμόρφωση και στρέβλωση Η χρησιμότητα των παραπάνω παραμέτρων θα φανεί στη συνέχεια, όπου παρουσιάζεται η διαδικασία υπολογισμού του βάθους σκηνής από δύο στερεοσκοπικές λήψεις (κεφ. 8.2). Τα αποτελέσματα της βαθμονόμησης της δικής μας κατασκευής αναγράφονται στο κεφάλαιο Διαδικασία βαθμονόμησης Για τη βαθμονόμηση της στερεοσκοπικής διάταξης, χρησιμοποιήθηκε η μέθοδος του Zhengyou Zhang, 1999 [5], σύμφωνα με την οποία χρησιμοποιείται ένα μοτίβο ομοεπίπεδων γεωμετρικών σχημάτων γνωστής μορφής και μεγέθους. Το πακέτο αλγορίθμων που χρησιμοποιήθηκε, διέθετε μοτίβα σκακιέρας, συμμετρικών και μη συμμετρικών κύκλων. Σχήμα 18: Μοτίβο σκακιέρας, συμμετρικών και μη-συμμετρικών κύκλων Ύστερα από δοκιμές, αποδείχθηκε ότι το μοτίβο μη-συμμετρικών κύκλων παρουσιάζει καλύτερα αποτελέσματα για τη βαθμονόμηση της στερεοσκοπικής διάταξης, μέσω του πακέτου αλγορίθμων τεχνητής όρασης που χρησιμοποιήθηκαν. Το φαινόμενο αυτό οφείλεται πιθανότατα

30 7.1 Βαθμονόμηση διάταξης (Calibration) 30 στη φύση του σχήματος, η οποία όντας κυκλική επιτρέπει τον ακριβέστερο προσδιορισμό των σημείων του μοτίβου, σε αντίθεση με τις γωνίες της σκακιέρας, οι οποίες τείνουν να παραμορφώνονται. Η αξιολόγηση έγινε λαμβάνοντας υπόψην το μέσο τετραγωνικό σφάλμα, το οπτικό αποτέλεσμα των ανορθωμένων εικόνων καθώς και τη ποιότητα της εικόνας διασποράς που προκύπτει στη συνέχεια. Η βαθμονόμηση της διάταξης έγινε με τη διάταξη σταθερή σε οριζόντια επιφάνεια, ενώ μετακινούσαμε το μοτίβο σε διαφορετικές θέσεις και προσανατολισμούς, προσέχοντας να βρίσκεται σχετικά κοντά στη διάταξη και να καλύπτει όλο το οπτικό πεδίο της κάμερας. Για βέλτιστα αποτελέσματα, επιλέξαμε να βαθμονομήσουμε πρώτα την κάθε κάμερα ξεχωριστά, ώστε να υπολογισθούν οι ενδογενείς παράμετροι, και ύστερα τη στερεοσκοπική διάταξη των 2 καμερών, ώστε να υπολογισθούν οι εξωγενείς παράμετροι. Το μέσο τετραγωνικό σφάλμα που αναφέρθηκε από τον αλγόριθμο ήταν περίπου 0.3 pixel. Οφείλουμε να σημειώσουμε ότι η βαθμονόμηση της διάταξης ορίζει τα μεγέθη που προκύπτουν από τον υπολογισμό του βάθους σκηνής. Ορίζοντας ως απόσταση κύκλου από κύκλο ίση με 17.5mm, το αποτέλεσμα του υπολογισμού του βάθους σκηνής θα είναι σε mm. Έτσι, αν ο χρήστης στέκεται στα 2.5m, το σύστημα θα εμφανίσει αριθμό Η ακρίβεια αυτή υπερκαλύπτει τις ανάγκες του συστήματος. Εκτός από τη χρήση γνωστών μοτίβων, μπορούμε να εκτελέσουμε βαθμονόμηση χρησιμοποιώντας πραγματικά πλάνα, στα οποία παρατηρούμε σημεία που ξεχωρίζουν και μετράμε τη σχετική και απόλυτη κίνησή τους. Με το τρόπο αυτό μπορούμε να αποκτήσουμε τις εσωτερικές και εξωτερικές παραμέτρους χωρίς να μπούμε στη διαδικασία της ελεγχόμενης βαθμονόμησης. Η διαδικασία αυτή θεωρείται ότι κινείται εκτός των ορίων της παρούσας εργασίας, γιαυτό και αναφέρεται μόνο εγκυκλοπαιδικά.

31 8 Υπολογισμός βάθους σκηνής 31 8 Υπολογισμός βάθους σκηνής Ως απαραίτητο στάδιο πριν τη λειτουργία του συστήματος, εμφανίζεται ο υπολογισμός του βάθους της σκηνής. Η πληροφορία αυτή, σε συνδυασμό με την χρωματική πληροφορία, θα συνθέσουν τα δεδομένα RGB-D. 8.1 Θεωρία επιπολικής γεωμετρίας Επιπολική γεωμετρία ονομάζεται η γεωμετρία της στερεοσκοπικής όρασης. Πρόκειται για τη γεωμετρία που εκφράζει μια σκηνή η οποία παρατηρείται από δύο κάμερες, τοποθετημένες σε διαφορετικές γωνίες λήψης ή πιο απλά για την ίδια κάμερα μετατοπισμένη σε διαφορετικές οπτικές γωνίες. Σχήμα 19: Επιπολική γεωμετρία Σχήμα 20: Το pinhole μοντέλο που είναι ευρέως αποδεκτό Όπως μπορεί πολύ εύκολα να αντιληφθεί κανείς, ένα σημείο που προβάλλεται στον αισθητήρα μιας κάμερας δεν μπορεί να αντιστοιχηθεί στη συνέχεια σε ένα σημείο 3Δ του χώρου. Το φαινόμενο αυτό οφείλεται στη προβολή αυτή καθαυτή, καθώς εκτελείται ο μετασχηματισμός 2Δ σε 3Δ, με την αντίστοιχη απώλεια πληροφορίας βάθους. Αν λοιπόν θεωρήσουμε ένα σημείο του χώρου P(Χ,Υ,Ζ), τότε η προβολή του στον αισθητήρα της κάμερας (και άρα οι 2Δ συντεταγμένες του στην εικόνα)στην απλοποιημένη μορφή

32 8.2 Διαθέσιμοι αλγόριθμοι 32 της θα προκύπτει από: ( x y ) = f Z ( X Y ) Η μόνη πληροφορία που μπορεί να προκύψει είναι ο υπολογισμός της ημιευθείας πάνω στην οποία βρίσκεται το εν λόγω σημείο, ημιευθείας που ξεκινάει από το κέντρο προβολής της κάμερας και εκτείνεται απομακρυνόμενη από την κάμερα, όπως φαίνεται στο Σχήμα 19. Συνεπώς, αν διαθέτουμε δεύτερη κάμερα σε διαφορετικό σημείο του χώρου, που καλύπτει την ίδια σκηνή, μπορούμε, μέσω τριγωνομετρίας, να υπολογίσουμε τις ακριβείς 3Δ συντεταγμένες του σημείου, εφόσον φυσικά γνωρίζουμε την αντιστοίχηση των σημείων της μιας κάμερας στα σημεία της άλλης (x 1 = x 2 + disparity(x)). x 1 = f Z X 1, x 2 = f Z X 2, f affine : P 1 P 2 Η επίλυση του προβλήματος είναι απλή υπόθεση καθώς χρειάζεται να επιλύσουμε ένα σύστημα τριών εξισώσεων με τρεις αγνώστους. Ως δεδομένα έχουμε την θέση του pixel στο καρέ της κάθε κάμερας, καθώς και το μετασχηματισμό affine ανάμεσα στα συστήματα συντεταγμένων των δυο καμερών. Η αντιστοίχηση των pixel σε επίπεδο καρέ γίνεται μέσω των αλγορίθμων που θα εξετάσουμε στη συνέχεια. 8.2 Διαθέσιμοι αλγόριθμοι Το πακέτο αλγορίθμων που επιλέξαμε να χρησιμοποιήσουμε για τις ανάγκες τις εργασίας, διαθέτει τους ακόλουθους αλγόριθμους αντιστοίχησης σημείων στερεοσκοπικής κάμερας: StereoVar: Stereo Variational. Τροποποιημένος αλγόριθμος του S. G. Kosov [6] StereoΒΜ: Stereo Block Matching. Αλγόριθμος ο οποίος αναζητά την αντιστοίχηση κάθε pixel της λήψης μιας κάμερας στην άλλη κάμερα, χρησιμοποιώντας μια τετράγωνη περιοχή γύρω από το pixel, για να εκτιμήσει που ανήκει στη λήψη της 2ης κάμερας, βασιζόμενος στην εντροπία της περιοχής αυτής. StereoSGΒΜ: Stereo Semi-Global Block Matching. Τροποποιημένος αλγόριθμος του H. Hirschmuller [7]. Βασίζεται στον StereoBM αλγόριθμο. Αναζητά συσχέτιση βάθους σε γειτονικά pixel στις τέσσερις ή οκτώ διευθύνσεις.

33 8.2 Διαθέσιμοι αλγόριθμοι 33 Όπως έχουμε ήδη αναφέρει, οι παραπάνω αλγόριθμοι ψάχνουν την αντιστοιχία του κάθε pixel της μιας κάμερας στα pixel της άλλης. Για να μειωθεί η πολυπλοκότητα της διαδικασίας, η αναζήτηση γίνεται μόνο κατά τη μία διάσταση της λήψης. Στη συγκεκριμένη περίπτωση που κάνουμε λόγο για στερεοσκοπική κάμερα οριζόντιας διάταξης, η αναζήτηση γίνεται στον οριζόντιο άξονα. Για το λόγο αυτό χρειαζόμαστε τους προαναφερθέντες πίνακες R1 και R2, οι οποίοι ανορθώνουν την εικόνα, επιτρέποντας αυτή τη μείωση διαστάσεων του χώρου αναζήτησης. Σχήμα 21: Τα αποτελέσματα των αλγορίθμων var, bm και sgbm αντίστοιχα για μια δεδομένη σκηνή σε colormap jet παλέτα Ο πιο διαδεδομένος αλγόριθμος είναι ο Stereo Block Matching. Πρόκειται για τον πιο απλοϊκό αλγόριθμο ως προς τη πολυπλοκότητα αλλά και τη σύλληψή του. Η διαδικασία αναζήτησης αντιστοίχησης τμημάτων (block) των εικόνων σημαίνει ότι ο αλγόριθμος βασίζεται ιδιαίτερα στις ακμές και τις έντονες χρωματικές αλλαγές των δύο λήψεων. Για το λόγο αυτό, ο συγκεκριμένος αλγόριθμος αποτυγχάνει πολλές φορές να αποδώσει το βάθος σε τμήματα ενός αντικειμένου που είναι ομοιογενούς υφής. Το πρόβλημα αυτό έρχεται να αντιμετωπίσει ο SGBM, ο οποίος καλύπτει αυτή την αδυναμία, αναζητώντας πληροφορία βάθους στα γειτονικά 4 ή 8 pixel της εικόνας, δίνοντας έτσι μια μέτρηση βάθους με λιγότερα κενά από τον απλό BM. Ο αλγόριθμος της OpenCV επιστρέφει έναν πίνακα διασποράς 16bit, πολλαπλασιασμένο με έναν παράγοντα x16. Για λόγους οπτικοποίησης, προσαρμόζουμε την εικόνα στις αποχρώσεις του γκρι [0,255] και εφαρμόζουμε την παλέτα colormap jet¹. Λόγω της φύσεως του προβλήματος, θα θέλαμε οι αλγόριθμοι αυτοί να εκτελούνται σε πραγματικό χρόνο. Πράγματι, ο ΒΜ είναι πλήρως ¹Η παλέτα colormap jet αντιστοιχεί αποχρώσεις του γκρι σε μια παλέτα θερμώνψυχρών χρωμάτων. Τα θερμότερα pixels βρίσκονται πιο κοντά από τα ψυχρότερα

34 8.2 Διαθέσιμοι αλγόριθμοι 34 παραλληλοποιήσιμος και ιδανικός για συστήματα παράλληλης επεξεργασίας όπως κάρτες γραφικών, FPGA κτλ. Αντιθέτως ο SGBM είναι μερικώς παραλληλοποιήσιμος. Τα περισσότερα ολοκληρωμένα συστήματα που κυκλοφορούν για βιομηχανικές εφαρμογές στερεοσκοπικής όρασης, κυρίως για λόγους ελέγχου της γραμμής παραγωγής, φέρουν μικροεπεξεργαστή που εκτελεί αλγορίθμους τύπου BM, πλήρως παραλληλοποιημένους. Σχήμα 22: Παράδειγμα διασποράς του ζεύγους εικόνων Tsukuba. Κάτω δεξιά είναι το ground truth. Η έξοδος των αλγορίθμων είναι ένα μέγεθος που ονομάζεται διασπορά (disparity) και εκφράζει την οριζόντια μετατόπιση της προβολής ενός σημείου του 3Δ χώρου στις δύο κάμερες. Εξορισμού, η μετατόπιση αυτή ξεκινάει από μηδενική (σημείο στο άπειρο) και φτάνει το πολύ μέχρι την οριζόντια ανάλυση της κάμερας. Οι αλγόριθμοι συνήθως σημειώνουν με μηδενική διασπορά τα σημεία των οποίων η διασπορά δε μπορεί να υπολογιστεί. Στα παθητικά συστήματα στερεοσκοπικής όρασης, τέτοια σημεία είναι συνήθως σημεία επιφανειών με ομοιογενή υφή (πχ τοίχοι, ουρανός κτλ). Το Σχήμα 22 δείχνει ένα παράδειγμα διασποράς, το οποίο έχει μετατραπεί σε εικόνα αποχρώσεων του γκρι. Η διασπορά μπορεί στη συνέχεια να μετατραπεί σε βάθος σκηνής, χρησιμοποιώντας τον πίνακα αντιστοίχισης διασποράς-βάθους Q μέσω της ακόλουθης εξίσωσης:

35 8.3 Εικόνα διασποράς 35 [X Y Z W ] T } {{ } 3Δ συντεταγμένες = Q [x y disparity(x, y) } {{ } διασπορά του pixel(x,y) Το σύνολο των σημείων που προκύπτουν από τον παραπάνω μετασχηματισμό ονομάζεται νέφος σημείων (point cloud) [8]. Μπορούμε να φανταστούμε το νέφος σημείων ως το σύνολο των κορυφών ενός 3Δ αντικειμένου, όταν από αυτό αφαιρέσουμε επιφάνειες και ακμές. Οφείλουμε να σημειώσουμε ότι δουλεύουμε με ομογενείς συντεταγμένες (homogenous coordinates) ώστε να μπορούμε να εκτελέσουμε μετασχηματισμούς Affine² (Affine transformations) με άλγεβρα πινάκων. 8.3 Εικόνα διασποράς Όπως αναφέραμε προηγουμένως, η εικόνα διασποράς εκφράζει την απόσταση σε pixel των προβολών ενός σημείου στο χώρο πάνω στις δύο κάμερες. Από μόνη της αυτή η πληροφορία δεν αποτελεί πληροφορία βάθους, καθώς το βάθος εξαρτάται -εκτός από τη διασπορά- και από τις 2D συντεταγμένες του σημείου στο καρέ. Τα σημεία που εμφανίζουν μηδενική διασπορά -τα μαύρα pixel στην εικόνα διασποράς- θεωρούνται ότι είτε βρίσκονται στο άπειρο -οπότε η προβολή τους στις δύο κάμερες δεν αλλάζει- είτε ο αλγόριθμος δε μπόρεσε να αποφανθεί για την αντιστοίχησή τους ανάμεσα στις δύο κάμερες. Συνήθως αντιμετωπίζουμε τα σημεία αυτά ως θόρυβο. Το φαινόμενο αυτό γίνεται αισθητό όταν παρατηρούμε μια σκηνή στην οποία το πάτωμα είναι παράλληλο με την κάμερα αλλά η τελευταία βρίσκεται μακριά από αυτό, όπως φαίνεται στο σχήμα 23. Λόγω προοπτικής προβολής, η μεταβολή της διασποράς δεν θα είναι απότομη στη περιοχή του πατώματος, όπως θα περίμενε κανείς, αλλά σταδιακή υπό μορφή ράμπας. Η συμπεριφορά αυτή είναι σημαντική και προκαλεί προβλήματα στην αποκοπή του χρήστη, μιας και ένας region growing αλγόριθμος θα συμπεριλάβει και το έδαφος καθώς εκτελείται. Αν όμως επιλέξουμε σαν είσοδο του αλγορίθμου το νέφος σημείων που αντιστοιχεί στην εικόνα διασποράς, η κατάσταση βελτιώνεται. ²Ως μετασχηματισμός Affine ορίζεται ο συνδυασμός μεταφοράς και περιστροφής ενός σημείου στο χώρο. 1] T

36 9 Εντοπισμός και αποκοπή χρήστη 36 Σχήμα 23: Δείγμα διασποράς όπως επιστρέφεται και η 3D απεικόνισή του. Είναι εμφανής η κλίση που δίνεται στο πάτωμα. 9 Εντοπισμός και αποκοπή χρήστη Το σύστημα Άργος δημιουργήθηκε για να αναγνωρίζει τον άνθρωπο ως χρήστη του, χωρίς βέβαια αυτό να αποτελεί κανόνα αλλά μια απλή παραδοχή σχεδίασης. Για να μπορέσει το σύστημα να απαλλαγεί από τη περιττή πληροφορία της σκηνής του οπτικού πεδίου της κάμερας, πρέπει να εντοπίσει και να αποκόψει τον πιθανό άνθρωπο-χρήστη. Η διαδικασία συνοψίζεται στο σχήμα 24. Σχήμα 24: Διάγραμμα ροής εντοπισμού χρήστη Αποκοπή δεν εκτελείται υπό μορφή αφαίρεσης της περιττής πληροφορίας και διατήρησης της σιλουέτας του ανθρώπου, το οποίο θα ήταν ιδανικό. Αντί αυτού, επιλέγουμε ουσιαστικά ένα τμήμα της εικόνας στο οποίο πιστεύουμε ότι έχουμε εντοπίσει το χρήστη και το οποίο τον περιέχει ολοκληρωτικά. Με τον τρόπο αυτό αφενός μειώνουμε την επίδραση της σκηνής στον αλγόριθμο εύρεσης πόζας και αφετέρου μειώνουμε την πολυπλοκότητα υπολογισμού του βάθους σκηνής. Η διαδικασία αυτή μας προκαλεί πρόβλημα στη περίπτωση που θέλουμε να εντοπίσουμε το χρήστη χρησιμοποιώντας και την πληροφορία βάθους,

37 9 Εντοπισμός και αποκοπή χρήστη 37 όπως θα αναφέρουμε στη συνέχεια. Ένα δείγμα του αποτελέσματος της διαδικασίας εντοπισμού και αποκοπής χρήστη φαίνεται στο σχήμα 25. Σχήμα 25: Το τελικό αποτέλεσμα με τον εντοπισμένο χρήστη και την εικόνα διασποράς που του αντιστοιχεί. Οι markers έχουν εντοπιστεί επιτυχώς.

38 9.1 Εντοπισμός ανθρώπων Εντοπισμός ανθρώπων Η μέθοδος που επιλέχθηκε είναι να εντοπιστούν αρχικά οι παρόντες άνθρωποι στο οπτικό πεδίο της στερεοσκοπικής διάταξης, με χρήση του αλγορίθμου Ιστογράμματος Προσανατολισμένων Παραγώγων (Histogram of Oriented Gradients) [9]. O HOG είναι μέλος της οικογένειας των περι- Σχήμα 26: Παράδειγμα προσανατολισμένων παραγώγων εικόνας γραφέων χαρακτηριστικών (feature descriptors) βασισμένων σε ταξινομητές SVM (Support Vector Machines). Ως εκ τούτου, έχει εκπαιδευτεί για να αναγνωρίζει συγκεκριμένα αντικείμενα, όχι απαραίτητα ανθρώπους, αν και βρίσκει συχνή εφαρμογή σε συστήματα ασφάλειας που πρέπει να αναγνωρίζουν πεζούς. Η αρχή λειτουργίας του βασίζεται στην εξαγωγή του ιστογράμματος των παραγώγων φωτεινότητας της εικόνας που μας ενδιαφέρει. Οι παράγωγοι αυτοί διαθέτουν μέτρο και κατεύθυνση (εξού και το όνομα) και στην ουσία αποτελούν περιγραφή του σχήματος μιας εικόνας με έντονες ακμές. Χωρίζοντας την παραπάνω έκφραση πληροφορίας σε μικρότερα τμήματα, τα λεγόμενα κελιά (cells), μπορεί να αποφανθεί για τη φύση του ιστογράμματος αυτών μέσω του εκπαιδευμένου SVM. Ως εκ τούτου, διαθέτει μια σχετική ανοχή σε γεωμετρικούς και φωτομετρικούς μετασχηματισμούς, εκτός του μετασχηματισμού που εκφράζει τον προσανατολισμό του αντικειμένου. Το πακέτο αλγορίθμων που επιλέχθηκε να χρησιμοποιηθεί, διαθέτει εκπαιδευμένο HOG αλγόριθμο για ανθρώπους, ο οποίος επιτυγχάνει αναγνώριση μόνο όταν ο άνθρωπος κοιτάει προς ή μακριά από τη κάμερα. Ο αλγόριθμος επιστρέφει τους εντοπισμένους ανθρώπους υπό μορφή τετραγώνων στην εικόνα, όπως φαίνεται

39 9.2 Εντοπισμός χρήστη 39 στο παράδειγμα του σχήματος 27. Όπως και με κάθε ταξινομητή τύπου SVM, υπάρχουν και false positive αποτελέσματα. Σχήμα 27: Παράδειγμα εντοπισμού ανθρώπων με HOG. Ο αλγόριθμος επιστρέφει τα τετράγωνα εντοπισμού. Η μέθοδος εντοπισμού με HOG δεν περιορίζεται αποκλειστικά και μόνο στον εντοπισμό ανθρώπων. Μια κατάλληλη εκπαίδευση του περιγραφέα μπορεί να εντοπίσει άλλες οντότητες, έμβιες και μη. Μάλιστα το HOG δεν αναφέρεται απαραίτητα στην φωτεινότητα της σκηνής ή σε κάποιο μέγεθος χρωματικότητας. Όπως φαίνεται και από την εργασία των Spinello και Arras People Detection in RGB-D Data [10], μπορούμε να εκπαιδεύσουμε έναν descriptor ώστε να εντοπίζει ανθρώπους βάσει του ιστογράμματος βάθους των, δημιουργώντας τη μέθοδο HOD (Histogram of Oriented Depths). 9.2 Εντοπισμός χρήστη Στο σημείο αυτό κάναμε μια παραδοχή, η οποία απλοποιεί κατά πολύ το σύστημα που σχεδιάζουμε. Θεωρούμε ότι, αν και οι άνθρωποι που εντοπίστηκαν στο κάδρο μπορεί να είναι περισσότεροι του ενός (ανάμεσα στους οποίους και false-positives υποψήφιων χρηστών), μπορεί να υπάρχει μόνο ένας ενεργός χρήστης του συστήματος. Αυτό φυ-

40 9.2 Εντοπισμός χρήστη 40 σικά μπορεί πολύ εύκολα να αλλάξει, αλλά αυξάνει τη πολυπλοκότητα του συστήματος. Συνεπώς, πρέπει το σύστημα να επιλέξει με κάποιο τρόπο ποιος από τους εντοπισμένους ανθρώπους του αλγορίθμου HOG είναι ο χρήστης. Κάθε εντοπισμένος άνθρωπος λαμβάνει ένα σκορ. Το σκορ αυτό υπολογίζεται με την ακόλουθη φόρμουλα: score = distance(head_center, body_center) body_height head_height skin_pixels head_pixels Όπως είναι εμφανές, οι εντοπισμένοι άνθρωποι που λαμβάνουν το μεγαλύτερο σκορ, διαθέτουν τα παρακάτω χαρακτηριστικά: Διαθέτει πρόσωπο που έχει εντοπιστεί Το πρόσωπο εμφανίζει pixels στο χρώμα του δέρματος Το πρόσωπο βρίσκεται μακριά από το κέντρο του εντοπισμένου ανθρώπου, όπως συμβαίνει και στη πραγματικότητα Έχουν εντοπιστεί markers στα χέρια του ανθρώπου Είναι εμφανές ότι εντοπισμένοι άνθρωποι που δεν διαθέτουν τα παραπάνω χαρακτηριστικά, οι οποίοι θα μπορούσαν να είναι false positives, λαμβάνουν μηδενικό σκορ. Στη συνέχεια, επιλέγεται για χρήστης ο άνθρωπος που θα επιστρέψει το υψηλότερο ακόλουθο αριθμό: Εντοπισμός προσώπου Σχήμα 28: Εντοπισμός προσώπου στη Lena final_score = body a rea (1 + score) Ο εντοπισμός του προσώπου γίνεται με προεκπαιδευμένο cascade classifier ένα συνδυασμό δηλαδή ταξινομητών, οι οποίοι βασίζονται σε Haar-Like Χαρακτηριστικά [11]. Η έξοδος του πρώτου ταξινομητή του ταξινομητή καταρράκτη οδηγείται στον δεύτερο, του δεύτερου στον τρίτο κοκ, εξού και το όνομα. Τα Haar-Like χαρακτηριστικά κωδικοποιούν την ύπαρξη και θέση προσανατολισμένων αντιθέσεων των περιοχών μιας εικόνας. Τα χαρακτηριστικά αυτά μπορούν να χρησιμοποιηθούν για να εκφράσουν τα χαρακτηριστικά του ανθρώπινου προσώπου και τις χωρικές μεταξύ τους θέσεις. Το όνομά του προέρχεται από το γεγονός ότι υπολογίζονται με παρόμοιο τρόπο με αυτό των συντελεστών του μετασχηματισμού παλμοσειράς Haar.

41 9.2 Εντοπισμός χρήστη Εντοπισμός δέρματος Σχήμα 29: Η κατανομή απόχρωσης δέρματος στο χρωματοχώρο YCrCb για αναγνώριση δέρματος ήταν: Ο εντοπισμός δέρματος είναι ένα ιδιαίτερο πρόβλημα από μόνο του. Υπάρχουν αναρίθμητες εργασίες και έρευνες σχετικές με το θέμα του εντοπισμού του δέρματος σε διαφορετικούς φωτισμούς και χρωματοχώρους (colorspaces). Στη παρούσα εργασία, η αναγνώριση δέρματος δεν αποτελεί ιδιαίτερα απαραίτητη πληροφορία αλλά κυρίως επικουρική. Συμβουλευόμενοι την εργασία Skin Detection - a Short Tutorial [12], επιλέξαμε την απλή μέθοδο αναγνώρισης δέρματος βάσει των τιμών του στο χρωματοχώρο YCrCb. Το κατόφλι που ορίσαμε (60, 130, 80) < pixel_y CrCb < (255, 170, 125) Εντοπισμός markers Σχήμα 30: Οι markers είναι χρώματος πράσινου και κόκκινου και φοριούνται στους καρπούς των χεριών. Ένας από τους στόχους του συστήματος είναι η ελάχιστη δυνατή χρήση σημαδιών (markers) στα διάφορα σημεία του σώματος. Εντούτοις, το σύστημα απαιτεί τη χρήση markers στα χέρια, καθώς αυτά έχουν την τάση να κινούνται σε μεγάλο βαθμό και ανεξάρτητα από το υπόλοιπο σώμα. Η ύπαρξη λοιπόν περικάρπιων στα χέρια του χρήστη, χρωμάτων που ξεχωρίζουν, μας επιτρέπει να εντοπίσουμε και να παρακολουθήσουμε την κίνησή τους στον 2Δ χώρο, με χρήση του αλγορίθμου CamShift [13]. Καθώς όμως το κέντρο του εντοπισμένου marker εμφανίζει άτακτη κίνηση (λόγω θορύβου αισθητήρα, διαφορετικού φωτισμού, επικάλυψής του από άλλα μέρη του σώματος) θα χρειαστεί να εφαρμόσουμε ένα φίλτρο Kalman [14], το οποίο θα αναλάβει αφενός να μειώσει την άτακτη αυτή κίνηση και αφετέρου να προβλέψει κατά κάποιο τρόπο την

42 9.2 Εντοπισμός χρήστη 42 κίνηση του marker στη περίπτωση επικάλυψης. Ο αλγόριθμος CamShift πρόκειται για έναν αλγόριθμο παρακολούθησης της κίνησης ενός αντικειμένου, βασιζόμενος στο ιστόγραμμα αυτού. Εσωτερικά αξιοποιεί τον αλγόριθμο Meanshift [15] Το ιστόγραμμα μπορεί να έχει πολλές διαστάσεις, ίσες με τον αριθμό των καναλιών³ που θέλουμε να χρησιμοποιήσουμε. Ο αλγόριθμος, λαμβάνει μια περιοχή αναζήτησης στην εικόνα που μας ενδιαφέρει και, αξιοποιώντας την πληροφορία του επαναπροβολής⁴ (back projection - link) του ιστογράμματος, προσαρμόζει την περιοχή αυτή στη κίνηση του αντικειμένου. Σχήμα 31: Παράδειγμα επαναπροβολής ιστογράμματος δέρματος Ο αλγόριθμος Camshift μας επιτρέπει να παρακολουθήσουμε τους markers, ακόμα και αν στη σκηνή εμφανιστούν αντικείμενα παρόμοιας απόχρωσης. Αποδεικνύεται επίσης χρήσιμος αργότερα, καθώς προσαρμόζουμε το τετράγωνο εντοπισμού του χρήστη, ενώ αυτός κινείται στο χώρο, ώστε να έχουμε στη συνέχεια την αποτελεσματική αποκοπή αυτού αλλά και μια στοιχειώδη πρώτη παρακολούθηση του χρήστη. Στη περίπτωση που ο marker χαθεί από το οπτικό πεδίο της στερεοσκοπικής διάταξης, ο camshift θα επιχειρήσει να παρακολουθήσει τη περιοχή της εικόνας με την αμέσως μεγαλύτερη πιθανότητα, η οποία βρίσκεται από συνδυασμό της επαναπροβολής του ιστογράμματος και της τελευταίας γνωστής θέσης της περιοχής αναζήτησης. Για το λόγο αυτό, συχνά εμφανίζεται ένα φαινόμενο έκρηξης του αλγορίθμου. Αξιολογώντας την πυκνότητα των σημείων της επαναπροβολής ως προς το μέγεθος της περιοχής αναζήτησης, μπορούμε να ξέρουμε κατά πόσο ο αλγόριθμος παρακολουθεί πραγματικά τον marker ή απλώς ακολουθεί το αμέσως επόμενο πιθανότερο μέρος της λήψης. ³Με τον όρο κανάλι εννοούμε τις διάφορες διαστάσεις μιας εικόνας. Η έγχρωμη εικόνα μπορεί να έχει 3 ή 4 κανάλια, η ασπρόμαυρη 1 κτλ ⁴Η επαναπροβολή του ιστογράμματος πρόκειται ουσιαστικά για τη πιθανότητα κάθε pixel της εικόνας να είναι ανήκει στο ιστόγραμμα που δόθηκε ως είσοδος κατά τον υπολογισμό της επαναπροβολής.

43 9.2 Εντοπισμός χρήστη 43 Η διαδικασία που ακολουθείται για τον εντοπισμό και παρακολούθηση της κίνησης των markers συνοψίζεται στο διάγραμμα ροής του σχήματος 32. Σχήμα 32: Διάγραμμα ροής εντοπισμού και παρακολούθησης markers

44 9.3 Παρακολούθηση χρήστη Παρακολούθηση χρήστη Σε κανονικές συνθήκες λειτουργίας, ο χρήστης κινείται ως προς τη κάμερα το οποίο σημαίνει ότι είτε η κάμερα κινείται είτε ο ίδιος ο χρήστης. Ως εκ τούτου πρέπει το σύστημα να διατηρεί τον εντοπισμένο χρήστη εντός του παραθύρου εντοπισμού. Η διαδικασία αυτή λειτουργεί και ως βελτιστοποίηση των ορίων του τετραγώνου που επιστρέφει ο HOG, καθώς προσαρμόζει το τετράγωνο χρησιμοποιώντας Camshift. Η διαδικασία της παρακολούθησης του χρήστη φαίνεται συνοπτικά στο σχήμα 33. Σχήμα 33: Διάγραμμα ροής παρακολούθησης χρήστη O floodfill είναι η υλοποίηση ενός region growing αλγορίθμου σε περιβάλλον OpenCV. Οι αλγόριθμοι αυτοί εκτελούν έναν δυαδικό διαχωρισμό της εικόνας, ξεκινώντας από ένα δεδομένο σημείο, το γνωστό και ως σημείο-σπόρο (seed point). Χρησιμοποιώντας τα διαθέσιμα κανάλια της εικόνας στην οποία εφαρμόζουμε τον αλγόριθμο, απαιτούμε από αυτόν να ομαδοποιήσει γειτονικά σημεία του seed point βάσει ορισμένων περιορισμών απόστασης. Οι περιορισμοί αυτοί μπορούν να αναφέρονται στο μέσο όρο της συνολικής περιοχής ή στη τιμή του τελευταίου πίξελ που περιλήφθηκε στην ομάδα. Αξιοποιώντας αυτό τον αλγόριθμο μπορούμε να ορίσουμε σε γενικές γραμμές τη σιλουέτα του ανθρώπου χρησιμοποιώντας τη πληροφορία βάθους. Η σιλουέτα αυτή δεν είναι τέλεια καθώς μπορεί να περιέχει τρύπες, περιοχές που δεν ανήκουν στον άνθρωπο αλλά έχουν παρόμοιο βάθος, να μην περιλαμβάνει άκρα που βρίσκονται σε έκταση προς την κάμερα κτλ. Εντούτοις ορίζει μια περιοχή του νέφους σημείων, της οποίας το ιστόγραμμα εκφράζει την κατανομή σημείων που ανήκουν στον άνθρωπο. Το ιστόγραμμα αυτό μπορεί να αξιοποιηθεί από τον

45 10 Αναγνώριση πόζας 45 Σχήμα 34: Το αποτέλεσμα του αλγορίθμου floodfill camshift αλγόριθμο ώστε ο τελευταίος να προσαρμόζει σε κάθε καρέ το τετράγωνο εντοπισμού χρήστη. Το ιστόγραμμα των σημείων του νέφους ανανεώνεται με μια συχνότητα σε κάθε καρέ, μιας και ο χρήστης κινείται στο χώρο. 10 Αναγνώριση πόζας Η αναγνώριση της πόζας του ανθρώπου θεωρείται η καρδιά των συστημάτων παρακολούθησης των κινήσεων του χρήστη. Με τον όρο πόζα εννοείται η θέση και προσανατολισμός του ανθρώπου στο χώρο, καθώς και η θέση των τμημάτων αυτού, ως έκφραση των γωνιών των αρθρώσεών του. Είναι λοιπόν φυσιολογικό να δοθεί η μεγαλύτερη έμφαση σε αυτό το τμήμα του συστήματος, τόσο αλγοριθμικά όσο και προγραμματιστικά. Εφόσον σχεδιάζουμε ένα σύστημα που βασίζεται στην στερεοσκοπική όραση, δηλαδή στον τρόπο με τον οποίο ο ίδιος ο άνθρωπος αντιλαμβάνεται το περιβάλλον του, πρέπει να αναλογιστούμε με ποιον τρόπο ο άνθρωπος γνωρίζει τη πόζα ενός άλλου ανθρώπου. Έτσι λοιπόν ο άνθρωπος γνωρίζει: 1. Πώς μοιάζει ένας άνθρωπος σε 3Δ μορφή στον 3Δ χώρο 2. Πώς προβάλλεται αυτός σε ένα επίπεδο, ποια είναι δηλαδή η φιγούρα του.

46 10.1 Μοντελοποιητής Ποιοι είναι οι περιορισμοί κίνησης που διαθέτει. Για παράδειγμα η άρθρωση του αγκώνα περιστρέφεται μόνο κατά ένα άξονα και για λιγότερο από Πως εκφράζεται αυτή η κίνηση, ώστε η μορφή του ανθρώπου να ταιριάζει σε αυτό που βλέπει. Το παραπάνω είναι ένα απλοϊκό μοντέλο αντίληψης του ανθρώπου από έναν άλλον άνθρωπο. Οι άνθρωποι, ως πολύπλοκα όντα, γνωρίζουν εκτός αυτών του που βρίσκεται κάθε μέλος του σώματος πάνω στο μοντέλο τους περί του ανθρώπου, πως αυτό μοιάζει, ποια θα είναι η πιθανότερη θέση αυτού δεδομένης της προηγούμενης κίνησης του συνολικού ανθρώπου, πως το 3Δ μοντέλο επιδρά στο περιβάλλον (σκιές, εκτοπισμός υγρών) και πολλά ακόμα. Το σύνολο της ανθρώπινης αντίληψης για το περιβάλλον του αλλά και η μελέτη της αντίληψης αυτή, είναι το αντικείμενο έρευνας ομάδων που ασχολούνται με τη σημασιολογία μοντέλων (model semantics). Συνεπώς, είναι δύσκολο να μοντελοποιήσουμε τη πλήρη αντίληψη του ανθρώπου για τα αντικείμενα του περιβάλλοντός του γενικότερα, γιαυτό και καταλήξαμε στο παραπάνω μοντέλο, το οποίο θα προσπαθήσουμε να εκφράσουμε αλγοριθμικά. Έτσι λοιπόν, τα 1 και 2 καλύπτονται από το μοντελοποιητή (modeler) και τα 3 και 4 από τον αλγόριθμο αναζήτησης στο χώρο κίνησης του ανθρώπου Μοντελοποιητής Κατά τη σχεδίαση του συστήματος τέθηκε σαν στόχος να δημιουργηθεί ένα σύστημα που μπορεί να προσαρμοστεί εύκολα σε διάφορες λειτουργικές απαιτήσεις. Δεν είναι απαραίτητο το αντικείμενο που παρατηρούμε να είναι άνθρωπος, θα μπορούσε να είναι οποιασδήποτε μορφής αντικείμενο, με διάφορους βαθμούς ελευθερίας, όπως για παράδειγμα ένα στερεό χωρίς αρθρώσεις, ένα αυτοκίνητο, ένα σπίτι κτλ. Έτσι λοιπόν, χρειαζόμαστε ένα μοντέλο το οποίο μπορεί να παραχθεί εύκολα από έναν γραφίστα ή κάποιον με γνώσεις τρισδιάστατου ψηφιακού μοντελισμού. Μια άλλη απαίτηση ήταν η χρήση λογισμικού και βιβλιοθηκών ανοικτού κώδικα. Ο μοντελοποιητής πρέπει να μπορεί να συνεργαστεί με κώδικα C++ και να χρησιμοποιεί τις δυνατότητες της κάρτας γραφικών, χωρίς όμως να καταφύγουμε σε κλειστές εμπορικές λύσεις.

47 10.1 Μοντελοποιητής Δημιουργία μοντέλου Το μοντέλο του ανθρώπου δημιουργήθηκε με τη βοήθεια του λογισμικού Blender. Δόθηκε ιδιαίτερη έμφαση στην απλότητα του μοντέλο, από άποψη γεωμετρίας και χρησιμοποιηθέντων τριγώνων. Σχήμα 35: Η σχεδίαση του μοντέλου είναι απλή υπόθεση, πρέπει όμως να δοθεί προσοχή στη τοποθέτηση των αρθρώσεων. Σημαντική επίσης ήταν η διαδικασία τοποθέτησης σκελετού στο μοντέλο, έτσι ώστε, παραμορφώνοντας το σκελετό του μοντέλου, να μπορέσουμε να παραμορφώσουμε το μοντέλο στο χώρο, οπότε να έχουμε και την παραγωγή της πόζας. Ο σκελετός σχεδιάστηκε και τοποθετήθηκε προσεγγιστικά με το χέρι. Στη συνέχεια ορίστηκαν τα βάρη των κοκάλων (bones) του σκελετού, βάσει των ομοίων παραμορφώνονται τα vertices του μοντέλου και κατ επέκταση η επιφάνειά του. Στη συνέχεια το μοντέλο αυτό εξήχθη στη κατάλληλη μορφή, που μπορεί να κατανοήσει ο μοντελοποιητής. Αυτό έγινε μέσω ενός εξαγωγέα αρχείων(file exporter) τύπου.mesh και.skeleton, που διατίθεται κατ επιλογή για το Blender.

48 10.1 Μοντελοποιητής Κύριος μοντελοποιητής Βάσει των παραπάνω απαιτήσεων, επιλέχθηκε η μηχανή γραφικών ανοικτού κώδικα Ogre3D (Object-Oriented Graphics Rendering Engine). Επιτρέπει την παραγωγή υψηλής ποιότητας ψηφιακών γραφικών, 2Δ και 3Δ, χωρίς ο προγραμματιστής να ασχοληθεί σε βάθος με τα API γραφικών όπως τα γνωστά DirectX της Microsoft και OpenGl. Διαθέτει ικανοποιητικό documentation και μπορεί να χρησιμοποιηθεί σε διάφορες πλατφόρμες (Unix, Windows, Mac κτλ). Ο μοντελοποιητής αναλαμβάνει να μετατρέψει τις μεταβλητές πόζας σε 3Δ μετασχηματισμό του μοντέλου, χρησιμοποιώντας τις δυνατότητες της κάρτας γραφικών μέσω των renderers. Πρόκειται ουσιαστικά για την διεπαφή που συνδέει το υψηλό επίπεδο ενός αλγορίθμου αναζήτησης στο χώρο του προβλήματος και το χαμηλότερο επίπεδο της παραγωγής του 3Δ μοντέλου μέσα στο οπτικό πεδίο μιας εικονικής κάμερας. Το Ogre3D διαθέτει πολλές δυνατότητες για την οργάνωση του χώρου της ψηφιακής αναπαράστασης. Αυτές περιλαμβάνουν μοντέλα, αρθρωτά ή μη, κάμερες, φώτα (κατευθυντικά, σημειακά, περιβάλλοντος κτλ), πηγές σωματιδίων (particle sources), εφέ μετεπεξεργασίας (post processing), πεδία, θόλους κτλ. Στο σύστημά μας, αρκεί η χρήση μιας κάμερας και του ψηφιακού μοντέλου του ανθρώπου, χωρίς τεχνητούς φωτισμούς ή πεδία. Γίνεται άμεσα αντιληπτό ότι σε ένα τέτοιο περιβάλλον προσομοίωσης μπορούμε να μετακινήσουμε είτε την κάμερα είτε το μοντέλο.επιλέξαμε να διατηρήσουμε σταθερή τη κάμερα και να μετακινούμε το μοντέλο σε σχέση με αυτήν (το WCS θεωρεί ως σημείο αναφοράς το κέντρο της κάμερας). Η περιστροφή του μοντέλου γύρω από τους 3 άξονες (pan, tilt, yaw) γίνεται ως προς το κέντρο αγκίστρωσης του μοντέλου, το οποίο ορίζεται κατά τη δημιουργία αυτού. Επιπροσθέτως, οι γωνίες κάμψης των αρθρώσεων του μοντέλου, ορίζονται με βάση το τοπικό σύστημα συντεταγμένων της κάθε άρθρωσης, έτσι μια εντολή κάμψης 90 της άρθρωσης του βραχίωνα με τον πήχη θα τους τοποθετήσει κάθετα μεταξύ τους. Θα πρέπει να σημειωθεί ότι ο μοντελοποιητής δίνει ως έξοδο μια εικόνα διασποράς του μοντέλου και μόνο αυτού. Οι παράμετροι της διασποράς αυτής, δηλαδή πόσο θα είναι το μέγιστο και ελάχιστο υπολογίσιμο βάθος, συμφωνούν με τις αντίστοιχες παραμέτρους της στερεοσκοπικής κάμερας που χρησιμοποιήθηκε αλλά και των παραμέτρων που δόθηκαν στον χρησιμοποιηθέντα αλγόριθμο στερεοσκοπίας επιπολικής γεωμετρίας. Η εικόνα αυτή παράγεται μέσω ενός τμήματος κώδικα που εκτελείται διαμέσου του Ogre3D πάνω στη κάρτα γραφικών και πιο συγκεκρι-

49 10.1 Μοντελοποιητής 49 μένα στα API γραφικών. Το τμήμα κώδικα είναι γραμμένο σε μια ειδική γλώσσα γνωστή ως Cg - C for graphics, ανεπτυγμένη από την Nvidia. Η χρήση της γλώσσας αυτής είναι απολύτως αναγκαία μιας και οι κάρτες γραφικών έχουν σχεδιαστεί με τέτοιο τρόπο ώστε να παρέχουν 2Δ οπτική πληροφορία στην οθόνη και όχι 3Δ ψηφιακή πληροφορία στη μνήμη συστήματος. Πρέπει λοιπόν να δοθεί εντολή στο σύστημα γραφικών για να μετατρέψει την πληροφορία βάθους των μοντέλων που έχει σχεδιάσει η κάρτα γραφικών σε αντίστοιχη πληροφορία διασποράς. Η πληροφορία βάθους παρέχεται από έναν ειδικό buffer των καρτών γραφικών, τον λεγόμενο Z-buffer, που αναλαμβάνει την απεικόνιση αντικειμένων σε διαφορετικό βάθος σκηνής που αλληλοκαλύπτονται μερικώς ή ολικώς. Ο συγκεκριμένος buffer σπάνια αξιοποιείται από άλλο σύστημα, πλην της κάρτας γραφικών, για το λόγο που αναφέραμε. Η λειτουργία του μοντελοποιητή περιγράφεται στο διάγραμμα ροής του σχήματος 36.

50 10.1 Μοντελοποιητής 50 Σχήμα 36: Διάγραμμα ροής μοντελοποιητή

51 10.2 Αλγόριθμος εύρεσης λύσης Αλγόριθμος εύρεσης λύσης Μέχρι το σημείο αυτό, διαθέτουμε την είσοδο του συστήματος -η οποία είναι μια περιοχή του οπτικού πεδίου μιας στερεοσκοπικής κάμερας, που παρέχει τη πληροφορία βάθους σκηνής- και ένα υποσύστημα μοντελοποιητή το οποίο είναι έτοιμο να μας παράξει μια πληροφορία βάθους μοντέλου που ελέγχεται από το σύστημα. Πρέπει επίσης να σημειώσουμε ότι ο χώρος αναζήτησης του προβλήματος αναγνώρισης πόζας ανθρώπου βασισμένου σε αρθρωτό μοντέλο είναι ιδιαίτερα μεγάλος. Συγκεκριμένα, αν αναλογιστούμε ότι το μοντέλο διαθέτει 3 dof θέσης, 3 dof προσανατολισμού μοντέλου και 19*3 dof για τις 19 επιμέρους αρθρώσεις, έχουμε στη χειρότερη περίπτωση ένα χώρο αναζήτησης 63 διαστάσεων. limb Yaw Pitch Roll head -90/90-50/90-60/60 u.torso -45/45-90/60-90/90 l.torso -45/45-20/90-20/20 r.shoulder 0-10/40-20/20 l.shoulder 0-10/40-20/20 r.hip 0-40/40-20/20 l.hip 0-40/40-20/20 r.arm -90/90-90/40-10/140 r.forearm -60/80 0 0/150 r.hand -90/90-90/90-45/45 l.arm -90/90-90/40-140/10 l.forearm -80/ /0 l.hand -90/90-90/90-45/45 r.thigh -90/90-20/100-40/20 r.calf 0-150/0 0 r.foot 0-50/20 0 l.thigh -90/90-20/100-20/40 l.calf 0-150/0 0 l.foot 0-50/20 0 Πίνακας 1: Όρια min/max αρθρώσεων ανθρώπου σε μοίρες Ευτυχώς οι διαστάσεις αυτές μειώνονται καθώς κάποιες αρθρώσεις δεν διαθέτουν 3 dof ενώ οι υπόλοιπες εμφανίζουν περιορισμούς (πχ ο αγκώνας χεριού σε έκταση δε μπορεί να καλύψει πάνω απο 150 κάμψης περίπου). Παρόλ αυτά, πρόκειται για ένα ιδιαίτερα μεγάλο πρόβλημα, το οποίο εμφανίζει αρκετά τοπικά ακρότατα, μερικά από

52 10.2 Αλγόριθμος εύρεσης λύσης 52 τα οποία βρίσκονται πολλές φορές κοντά στο ολικό ακρότατο (βέλτιστη λύση) στη τιμή αλλά όχι στη θέση στο χώρο αναζήτησης. Επιπλέον, η εισαγωγή περιορισμών στη κίνηση του μοντέλου δημιουργεί εμπόδια της κίνησης των σωματιδίων στο χώρο αναζήτησης. Σχήμα 37: Τα όρια αρθρώσεων σε συνδυασμό με τη εξελικτική λογική του PSO επιφέρουν αποτελέσματα που μοιάζουν με έργα τέχνης! Μπορούμε να φανταστούμε την κατάσταση αυτή ως ένα δωμάτιο και τη διάθεση ενός ατόμου να φτάσει σε ένα σημείο του χωρίς να έχει αίσθηση της τοποθεσίας αυτού αλλά μόνο της ιδιότητάς του (π.χ. είναι το πιο ψυχρό σημείο). Αν το δωμάτιο είναι άδειο τότε το άτομο μπορεί με τυχαίο τρόπο να φτάσει πιο γρήγορα και με μεγαλύτερη ακρίβεια στο εν λόγω σημείο σε σχέση με ένα δωμάτιο που περιέχει έπιπλα Μέθοδοι εκτίμησης πόζας που χρησιμοποιούνται Όπως έχουμε ήδη αναφέρει, η εκτίμηση της θέσης ενός αντικειμένου στον 3Δ χώρο είναι δύσκολο πρόβλημα, ειδικότερα αν αυτή περιλαμβάνει τη πόζα ενός αρθρωτού αντικειμένου. Ο επιστημονικός κλάδος της τεχνητής όρασης αναζητά συνεχώς νέες μεθόδους επίλυσης προβλημάτων αυτού του τύπου, ενώ έχει δώσει λύσεις που μπορούν να αξιοποιηθούν σε εμπορικά συστήματα. Τα συστήματα αυτά δεν περιλαμβάνουν τη τεχνολογία MoCap, καθώς αυτή προσφέρει άμεσα την πληροφορία κάμψης των αρθρώσεων ή θέσης αυτών από τους αισθητήρες, χωρίς να μεσολαβεί κάποιος αλγόριθμος εκτεταμένης αναζήτησης. Για παράδειγμα, το δημοφιλές σύστημα kinect της Microsoft, χρησιμοποιεί τη μέθοδο ταξινόμησης Τυχαίων Δασών (Random Forests), ενός δηλαδή εκτεταμένου συνόλου δέντρων απόφασης (decision trees), το οποίο έχει εκπαιδευτεί ώστε να αναγνωρίζει μέλη του ανθρώπινου σώματος χρησιμοποιώντας τη πληροφορία βάθους [16]. Στη συνέχεια,

53 10.2 Αλγόριθμος εύρεσης λύσης 53 συγχωνεύει τη πληροφορία αυτή με ένα σύνολο αποθηκευμένων προσημειωμένων θέσεων ανθρώπων (πόζες) διάφορων χαρακτηριστικών (εύσωμων, κοντών, ψηλών κτλ). Καθώς το σύστημα kinect είναι εμπορικό, δε διαθέτει την ευελιξία τροποποίησης ή παραμετροποίησης ενός συστήματος ανοικτού κώδικα, ενώ απαγορεύει την εκπαίδευση αυτού για αναγνώριση πόζας άλλων αντικειμένων (πχ ενός κινούμενου αυτοκινήτου ή ενός ζώου). Η λύση σε αυτό το πρόβλημα είναι ένα σύστημα το οποίο με ελάχιστες μετατροπές, μπορεί να δεχτεί ένα σύνολο μοντέλων, αρθρωτών ή μη, τα οποία μπορεί να αναζητήσει στην εικόνα βάθους σκηνής που δέχεται ως είσοδο, με αυτόματο ή ημιαυτόματο τρόπο. Πηγή έμπνευσης για το σύστημα Άργος αποτέλεσε η έρευνα των Οικονομίδη, Κυριαζή και Αργυρού [17], σχετικά με την αναγνώριση της πόζας ενός ανθρώπινου χεριού. Το συγκεκριμένο σύστημα χρησιμοποιεί τον μετευρετικό αλγόριθμο αναζήτησης Βελτιστοποίησης Σμήνους Σωματιδίων (PSO - metaheuristic Particle Swarm Optimization algorithm) εκτέλεσης σε πραγματικό χρόνο, χάρη στη παραλληλοποιήσιμη φύση του προβλήματος, των δεδομένων και του αλγορίθμου αναζήτησης PSO Μετευρετικός αλγόριθμος PSO Ο συγκεκριμένος αλγόριθμος έχει τις ρίζες του στη παρατήρηση της συμπεριφοράς ενός σμήνους πτηνών, στο οποίο κάθε μέλος έχει αυτόνομη συμπεριφορά στο χώρο (ένα πτηνό για παράδειγμα μπορεί να πετάξει οπουδήποτε) αλλά διαθέτει μια προσωπική βέλτιστη κατάσταση στην οποία στοχεύει (ένα συγκεκριμένο πτηνό μπορεί να θέλει να κάτσει σε μια κεραία) καθώς και επηρεάζεται από το υπόλοιπο σμήνος (ένα σμήνος πουλιών κινείται συνήθως μαζί). Παρουσιάστηκε για πρώτη φορά από τους Kennedy, Eberhart και Shi [18] [19]. Σχήμα 38: Κίνηση σωματιδίου βάσει τυχαίας, βέλτιστης προσωπικής και γενικής θέσης Ο αλγόριθμος PSO μοιάζει λειτουργικά σε έναν γενετικό αλγόριθμο. Έτσι, ενώ ένας γενετικός αλγόριθμος έχει πληθυσμό από γονιδιώματα(ή άτομα) τα οποία μεταλλάσσει σε κάθε γενιά, ο αλγόριθμος Βελτιστοποίησης Σμήνους Σωματιδίων έχει σμήνος από σωματίδια τα οποία βελτιστοποιεί σε κάθε επανάληψη(ή εξέλιξη). Όπως θα δούμε αργότερα, η διαδικασία αναζήτησης της βέλτιστης λύσης μέσω της κίνησης του σμήνους μοιάζει πολύ με τη διαδικασία αναζήτη-

54 10.2 Αλγόριθμος εύρεσης λύσης 54 σης της βέλτιστης λύσης μέσω της μετάλλαξης του πληθυσμού. Εντούτοις, γενετικός και PSO αλγόριθμος διαφέρουν κυρίως στα δεδομένα τα οποία μπορούν να χειριστούν. Ένας γενετικός αλγόριθμος βασίζεται στο γεγονός ότι τα δεδομένα είναι διακριτής φύσεως ή τουλάχιστον διακριτοποιήσιμα χωρίς σημαντική απώλεια πληροφορίας, κωδικοποιώντας τα για παράδειγμα με μια συμβολοσειρά. Αντιθέτως, ο PSO αλγόριθμος μπορεί να χειριστεί συνεχή μεγέθη, όπως αυτά μπορούν να αναπαρασταθούν σε έναν υπολογιστή χρησιμοποιώντας τη περιορισμένη ικανότητα αναπαράστασης αριθμών του [20]. Αν θεωρήσουμε ότι η θέση ενός σωματιδίου p στο χώρο R n εκφράζεται ως x i,η τρέχουσα ταχύτητα εξέλιξης ως v i, η βέλτιστη των θέσεων του ως p i και η βέλτιστη θέση που βρέθηκε σε όλο το σμήνος g, τότε προσπαθούμε να βρούμε τη βέλτιστη λύση, σύμφωνα με μια συνάρτηση κέρδους (ή κόστους αντίστοιχα) f : R n R μέσω της ακόλουθης διαδικασίας: 1. Αρχικοποίηση σωματιδίου p (αʹ) Αρχικοποίηση της θέσης x i μέσω τυχαίας μεταβλητής ομοιόμορφης κατανομής (b lo, b up ), όπου b lo και b up τα κάτω και άνω όρια της εκάστοτε διάστασης αναζήτησης. (βʹ) Όρισε p i = x i (γʹ) Αν g < p i τότε g = p i (δʹ) Αρχικοποίηση της ταχύτητας 2. Μέχρι να περάσει ένας αριθμός επαναλήψεων ή το βέλτιστο κέρδος να παραμείνει για πολλές επαναλήψεις ίδιο: (αʹ) Για κάθε σωματίδιο i = 1,..., S και για κάθε διάσταση d = 1,..., n του σωματιδίου: i. Επέλεξε τυχαίους αριθμούς r p, r g (0, 1) ii. Ενημέρωσε την ταχύτητα εξέλιξης του σωματιδίου v i,d = a v i,d + c1 r p (p i,d x i,d ) + c2 r g (p i,d x i,d ) (βʹ) Ενημέρωσε τη θέση του σωματιδίου x i = x i + v i (γʹ) Αν f(x i ) > f(p i ) τότε p i = x i (δʹ) Αν f(x i ) > f(g) τότε g = x i 3. Το g διατηρεί τη βέλτιστη λύση του αλγορίθμου.

55 10.2 Αλγόριθμος εύρεσης λύσης 55 Η χρήση του αλγορίθμου PSO για την εύρεση πόζας έχει εφαρμοστεί σε πρόσφατες εργασίες όπως για παράδειγμα στον εντοπισμό πόζας κεφαλιού [21], χεριών [17] ή ακόμα και ολόκληρου του σώματος [22] Αξιολόγηση πόζας Προηγουμένως αναφέραμε ότι η συνάρτηση κέρδους score f : R n R είναι αυτή που θα μας επιτρέψει να καθοδηγήσουμε το σμήνος προς την βέλτιστη λύση ή τουλάχιστον μια λύση που μας καλύπτει, δεδομένου του μεγάλου χώρου αναζήτησης του προβλήματος ή/και του μέγιστου δυνατού αριθμού επαναλήψεων. Είναι σημαντικό αυτή η συνάρτηση να είναι σαφώς ορισμένη και υπολογιστικά απλή, καθώς εκτελείται για κάθε έκδοση των σωματιδίων και σε κάθε επανάληψη, για όποια δεδομένα επιλέξαμε να αξιοποιήσουμε. Έτσι, ένα σμήνος 50 σωματιδίων σε λειτουργία αναζήτησης 100 επαναλήψεων, θα συγκλίνει στη λύση σε 5 δευτερόλεπτα αν η συνάρτηση κέρδους υπολογίζεται σε 1ms. Ο ορισμός αυτής της συνάρτησης δεν είναι απλή υπόθεση. Αυτό που απαιτεί ο PSO αλγόριθμος είναι μια συνάρτηση που -δεδομένης της πληροφορίας βάθους της σκηνής αλλά και των μοντέλων που επιστρέφει ο μοντελοποιητής- να μπορεί να αποφασίζει ποιο μοντέλο ταιριάζει καλύτερα στη σκηνή. Εκτός αυτού πρέπει στο σημείο αυτό να αποφασίσουμε ποια δεδομένα θα χρησιμοποιηθούν για την αξιολόγηση (βάθος, νέφος σημείων, ακμές, χρώμα κτλ). Αποφασίστηκε να κινηθούμε στα βήματα άλλων εργασιών και κυρίως σε αυτή του εντοπισμού της πόζας χεριών με PSO [17] χωρίς όμως να συμπεριλάβουμε τη πληροφορία ακμών ή χρώματος δέρματος. Η επιλογή μας αυτή μειώνει την πολυπλοκότητα αξιολόγησης κάθε μοντέλου αλλά και την ακρίβεια αυτής. Στο κεφάλαιο 13.5 γίνεται μια μελέτη διαφορετικών συναρτήσεων κέρδους πάνω σε ένα σύνολο στάσεων του μοντέλου του ανθρώπινου σώματος σε σχέση με μια δεδομένη πραγματική σκηνή. Θεωρούμε δεδομένη μια εικόνα βάθους σκηνής Α και μια εικόνα βάθους της λύσης του μοντελοποιητή Β, υπό μορφή πινάκων και εύρους τιμών [0,255]. H συνάρτηση κέρδους που αξιολογεί την ορθότητα μιας λύσης επιλέχθηκε να είναι η ακόλουθη: ( ( ) ) 2 ( bound_rect(a) bound_rect(b) mean( A B ) score f = 1 1 bound_rect(a) bound_rect(b) } {{ } σκορ μεγέθους σκηνής και μεγέθους λύσης ) } 255 {{ } σκορ κανονικοποιημένης απόλυτης διαφοράς

56 11 Παρακολούθηση κίνησης 56 ( ) mean(a B) } {{ } σκορ κανονικοποιημένου XOR lef t_marker_score } {{ } σκορ απόστασης αριστερού marker right_marker_score } {{ } σκορ απόστασης δεξιού marker όπου, και οι τελεστές AND, OR και XOR επί των πινάκων A και B αντίστοιχα. Οι συναρτήσεις bound_rect() και mean() υπολογίζουν το περιγεγραμμένο τετράγωνο και τη μέση τιμή αντίστοιχα. 11 Παρακολούθηση κίνησης Η παρακολούθηση κίνησης αποτελεί ένα ξεχωριστό λειτουργικό κομμάτι του συστήματος, παρόλο που υλοποιείται με τον υπάρχοντα αλγόριθμο Παρακολούθηση με PSO O PSO αλγόριθμος έχει την ιδιαιτερότητα να μπορεί να παρακολουθήσει εναλλαγές στη πόζα σχετικά εύκολα. Αν θεωρήσουμε ότι το μοντέλο μας έχει τοποθετηθεί σε μια αρχική πόζα η οποία ταιριάζει ικανοποιητικά με τη πόζα του χρήστη, τότε ο χώρος αναζήτησης της επόμενης πόζας μειώνεται δραματικά, καθώς δεδομένης της ταχύτητας λήψης καρέ από την στερεοσκοπική κάμερα, ο χρήστης μπορεί να βρεθεί σε διαφορετική θέση στο χώρο βάσει μιας κανονικής κατανομής. Αυτό σημαίνει ότι είναι περισσότερο πιθανό να έχει κουνήσει ελάχιστα το κεφάλι του παρά να έχει βρεθεί στην άλλη άκρη του δωματίου Υποβοήθηση παρακολούθησης με προηγούμενη γνώση Μπορούμε να βοηθήσουμε σημαντικά τον αλγόριθμο παρακολούθησης κίνησης, αν προτείνουμε στα σωματίδια μια εκτιμώμενη βέλτιστη πόζα του τρέχοντος καρέ. Γνωρίζουμε ότι όταν ο PSO εκκινεί για 1η φορά, η βέλτιστη λύση θεωρείται μια τυχαία θέση στο χώρο αναζήτησης, τόσο για κάθε σωματίδιο ξεχωριστά όσο και για το σύνολο των σωματιδίων ως σμήνος. Αν και αυτές οι θέσεις τροποποιούνται σχετικά γρήγορα, δεν μας εξασφαλίζουν ότι βρίσκονται κοντά στο ολικό βέλτιστο. Αν, σε κατάσταση παρακολούθησης κίνησης, θέσουμε στα σωματίδια μια εκτίμησης της βέλτιστης θέσης στο νέο καρέ, βρισκόμαστε πλέον με μεγαλύτερη σιγουριά κοντά στο τοπικό βέλτιστο που θέλουμε να εντοπίσουμε. Φυσικά, όλη αυτή η εκτίμηση της επόμενης βέλτιστης

57 11.2 Υποβοήθηση παρακολούθησης με προηγούμενη γνώση 57 θέσης, εξαρτάται από τη διαδικασία υπολογισμού αυτής που θα υιοθετήσουμε καθώς και τη ποιότητα της προηγούμενης λύσης που δώσαμε. Οι μέθοδοι που δοκιμάστηκαν στη παρούσα εργασία ήταν οι ακόλουθες: Η Αφελής μέθοδος (Naive): Στη μέθοδο αυτή θεωρούμε ότι η βέλτιστη πόζα του τρέχοντος καρέ είναι ίδια με τη βέλτιστη θέση του προηγούμενου καρέ. Η μέθοδος ορμής (Momentum): Στη μέθοδο αυτή θεωρούμε ότι η βέλτιστη πόζα του τρέχοντος καρέ είναι η βέλτιστη θέση του προηγούμενου καρέ, όταν σε αυτή προσθέσουμε έναν παράγοντα ορμής, που προκύπτει από τη μέχρι τώρα λειτουργία του συστήματος, με μνήμη ενός καρέ. Η μέθοδος φίλτρου Kalman: Στη μέθοδο αυτή θεωρούμε ότι η βέλτιστη πόζα του τρέχοντος καρέ είναι το αποτέλεσμα της πρόβλεψης του φίλτρου kalman. Η διόρθωση του φίλτρου kalman γίνεται χρησιμοποιώντας τη μέθοδο ορμής. Από τις παραπάνω μεθόδους, η μέθοδος του φίλτρου Kalman βρέθηκε να εμφανίζει τα καλύτερα αποτελέσματα. Οφείλουμε να τονίσουμε ότι λόγω της αργής ανθρώπινης κίνησης σε σχέση με την ανανέωση του καρέ της κάμερας και της φύσης του αλγορίθμου PSO, η πρόβλεψη της βέλτιστης πόζας δεν είναι απαραίτητη. Εντούτοις, η πρόβλεψη αυτή επιτρέπει στον αλγόριθμο να συγκλίνει γρηγορότερα στην επιθυμητή λύση, αποφεύγοντας άλλα τοπικά ακρότατα που πιθανώς να εμφανιστούν Μορφή φίλτρου Kalman Το (γραμμικό) φίλτρο Kalman λειτουργεί σε 2 στάδια, αυτό της πρόβλεψης και αυτό της διόρθωσης. Το φίλτρο λειτουργεί αναδρόμικα, προβλέποντας και στη συνέχεια διορθώνοντας το state στο οποίο βρίσκεται το σύστημα. Σε γενικές γραμμές μπορούμε να το αναπαραστήσουμε ως εξής: x k k 1 = F k x k 1 k 1 + B k 1 u k 1 + w k (1) όπου x k k 1 είναι το τρέχον predicted state, x k 1 k 1 το προηγούμενο state, u k 1 ο έλεγχος του προηγούμενου state, w k το σφάλμα (στις περισσότερες περιπτώσεις θεωρούμε ότι ακολουθεί κανονική κατανομή με μέση τιμή 0 και συμμεταβλητοτητα Q, άρα w k (0, Q k )), F k ο πίνακας μετάβασης του state και B k είναι ο πίνακας επίδρασης του ελέγχου.

58 11.2 Υποβοήθηση παρακολούθησης με προηγούμενη γνώση 58 Η μέτρηση του συστήματος μοντελοποιείται ως εξής: ẑ k = H k x k + v k (2) όπου ẑ k είναι η εκτιμώμενη μέτρηση του συστήματος, H k είναι ο πίνακας παρατήρησης και v k ο θόρυβος παρατήρησης (επίσης κανονική κατανομή v k (0, R k )). Η μέτρηση του συστήματος είναι εκείνα τα μεγέθη τα οποία μπορούμε να δειγματοληπτήσουμε ανά ορισμένο πεπερασμένο χρονικό διάστημα. Από το 1, το 2 αλλά και τα γνωστά μεγέθη του συστήματος μπορούμε να διορθώσουμε το state του συστήματος, δημιουργώντας μια νέα εκτίμηση αυτού: x estk = x k + K k (z k ẑ k ) (3) όπου K k είναι το κέρδος του φίλτρου kalman. Η εκτίμηση αυτή θα δοθεί στον PSO αλγόριθμο σαν best position. Αν αναλύσουμε τις παραπάνω εξισώσεις και εισάγουμε τους προαναφερθέντες όρους θορύβου, έχουμε τα εξής: Στην πρόβλεψη: x k k 1 = F k x k 1 k 1 + B k 1 u k 1 (4) P k k 1 = F k P k 1 k 1 F T k + Q k (5) Στην διόρθωση: y k = z k H k ŷ k k 1 (6) S k = H k P k k 1 H T k + R k (7) K k = P k k 1 H T k S 1 k (8) x k k = x k k 1 + K k y k (9) P k k 1 = (I K k H k )P k k 1 (10) όπου P k k 1 η συμμεταβλητότητα της πρόβλεψης, y k το υπόλοιπο της μέτρησης, S k η συμμεταβλητότητα του υπολοίπου, K k το βέλτιστο κέρδος Kalman, P k k 1 η συμμεταβλητότητα της εκτίμησης. Έχουμε λοιπόν P k k 1 = conv(x k x k k 1 ) και S k = conv(y k ).

59 11.2 Υποβοήθηση παρακολούθησης με προηγούμενη γνώση Προσαρμογή φίλτρου Kalman Είναι απαραίτητο να ορίσουμε την γραμμική σχέση στην οποία υπακούει το σύστημά μας. Θεωρούμε ότι όλες οι μετακινήσεις και περιστροφές είναι ανεξάρτητες μεταξύ τους και ακολουθούν ευθύγραμμη ομαλά επιταχυνόμενη κίνηση. Άρα αν p t ένα από τα μεγέθη που εξετάζονται (μετατόπιση ή γωνία), τότε: p t = p t 1 + ṗ t 1 t p t 1 t 2 (11) ṗ t = ṗ t 1 + p t 1 t (12) Σαν state του συστήματος x k ορίζουμε το σύνολο των γωνιών και συντεταγμένων όλου του μοντέλου, καθώς και το ρυθμό μεταβολής αυτών. Είναι η πληροφορία που μας διατίθεται αρχικά και είναι η πληροφορία που θέλουμε να προσαρμόσουμε βάσει της ορμής του συστήματος. Σαν state εκκίνησης θα ορίσουμε την έξοδο του SPO αλγορίθμου όταν εντοπίσει για 1η φορά τον χρήστη ενώ οι ταχύτητες θα θεωρηθούν μηδενικές, μιας και εκείνη τη στιγμή ο χρήστης όντως δε κινείται. x k = X k Ẋ k Y k Ẏk Z k Żk R k Ṙ k. (13) Σαν measurement z k ορίζουμε την έξοδο του PSO αλγορίθμου (state)στο προηγούμενο καρέ, έχοντας κάνει μια πρόβλεψη με τη μέθοδο ορμής.σε γενικές γραμμές, η εξέλιξη των σωματιδίων του αλγορίθμου είναι ελάχιστα βίαιη και αρκετά ελεγχόμενη καθώς δεν αναμένεται μεγάλη μεταβολή σε διαδοχικά καρέ αλλά απαιτείται μέγιστη ταχύτητα σύγκλισης του αλγορίθμου. Με τον τρόπο αυτό, τοποθετούμε το PSO σμήνος πιο κοντά στη λύση, οπότε μειώνουμε το χώρο αναζήτησης.

60 11.2 Υποβοήθηση παρακολούθησης με προηγούμενη γνώση 60 z k = X k 0 Y k 0 Z k 0 R k 0. (14) Θεωρούμε ότι δεν υπάρχει control u k ή τουλάχιστον δεν τον γνωρίζουμε, μιας και ευθέως ανάλογο του ελέγχου θα ήταν η ανθρώπινη σκέψη ή τουλάχιστον ένα σύστημα πρόβλεψης της ανθρώπινης συμπεριφοράς. Οι πίνακες που αναφέρθηκαν στα 1,2 και 3 πρέπει να οριστούν επακριβώς: 1 t t t 0 0 F k = t 0, t = 1 (15) t H k = (16) Σε αυτό το σημείο χρειάζεται να ορίσουμε τους πίνακες P, Q και R. Ο πίνακας P υπολογίζεται αναδρομικά. Όμως, όπως βλέπουμε από τα 6,8 και 9, μας δίνει το βαθμό εμπιστοσύνης που έχουμε στην αρχική μας πρόβλεψη. Συνεπώς το P 0 0 = [0]. Οι Q και R αφορούν κανονικές κατανομές θορύβου μέτρησης και είναι αντικείμενο εκτεταμένης έρευνας για διάφορες εφαρμογές του φίλτρου Kalman. Στη βιβλιογραφία, οι περισσότερες εργασίες χρησιμοποιούν κατανομές θορύβου που

61 11.3 Υποβοήθηση παρακολούθησης με σημεία του χρήστη 61 έχουν προσαρμόσει τυχαία με δοκιμές ή έχουν κάνει τη παραδοχή ότι ο θόρυβος πρέπει να τηρεί ορισμένα όρια και να ακολουθεί γνωστές κατανομές. Σε πραγματικές εφαρμογές, τα μεγέθη αυτά αναφέρονται σε αισθητήρες που δίνουν τιμές με συγκεκριμένες κατανομές θορύβου. Όταν αυτές δεν είναι διαθέσιμες από το κατασκευαστή, μπορεί να γίνει δειγματοληψία αυτής της κατασκευής, με καταγραφή του θορύβου υπό διαφορετικές συνθήκες του συστήματος, ώστε να δημιουργηθεί ένα αξιόπιστο μοντέλο του θορύβου μέτρησης. Σε γενικές γραμμές, το ίδιο το φίλτρο εμφανίζει ανοχές στην επιλογή του μοντέλου αυτού Υποβοήθηση παρακολούθησης με σημεία του χρήστη Η παρακολούθηση αλλά και ο εντοπισμός της πόζας είναι ευκολότερη διαδικασία αν γνωρίζουμε από πριν ορισμένα σημεία του χρήστη. Η τεχνική αυτή χρησιμοποιείται στη μέθοδο MoCap, όπου γνωρίζουμε σχεδόν όλες τις απόλυτες ή σχετικές θέσεις των αρθρώσεων που μας ενδιαφέρουν. Ο αριθμός και το είδος των μεθόδων που χρησιμοποιούμε για τον εντοπισμό αυτών των σημείων εξαρτάται από το πόσο συνεργάσιμος και διατεθειμένος είναι ο χρήστης να τοποθετήσει πάνω του σημεία αναφοράς, γνωστά και ως markers. Η τεχνική του MoCap ήταν ως επί των πλείστων βασισμένη σε χρήση markers, μιας και οι χρήστες ήταν κυρίως ηθοποιοί ή συνεργάτες σε επιστημονικές έρευνες. Ως εκ τούτου, θεωρούνται επαγγελματίες, άτομα συνεργάσιμα που βρίσκονται σε ένα ελεγχόμενο περιβάλλον, στο οποίο τόσο οι συνθήκες όσο και οι δράσεις του χρήστη είναι αυστηρώς προδιαγεγραμμένες. Η απαίτηση της μη χρήσης markers (γνωστή και ως markerless design) που εισάγεται σε ένα σύστημα, το οποίο απευθύνεται σε μη επαγγελματίες χρήστες (όπως για παράδειγμα ο χρήστης μιας κονσόλας βιντεοπαιχνιδιών) έρχεται να δυσκολέψει την ήδη απαιτητική διαδικασία αναγνώρισης πόζας ενός πολυαρθρωτού μοντέλου όπως είναι ο άνθρωπος. Στο συγκεκριμένο τομέα γίνονται ιδιαίτερες προσπάθειες, άλλες επιτυχημένες και άλλες όχι, με χρήση διαφόρων μεθόδων και υπό διαφορετικές συνθήκες λειτουργίας. Χαρακτηριστικό παράδειγμα αποτελεί το kinect και η χρήση ενός εκπαιδευμένου Random Forest, το οποίο χρησιμοποιείται για να εντοπίσει τα διαφορετικά σημεία αναφοράς ενός ανθρώπου, όπως τα χέρια, ο κορμός, το κεφάλι, σε μια διαδικασία κατάτμησης (segmentation).

62 11.3 Υποβοήθηση παρακολούθησης με σημεία του χρήστη 62 Σχήμα 39: Το kinect γνωρίζει τη θέση διάφορων σημείων του ανθρώπου σε κάθε καρέ της εικόνας διασποράς Σχήμα 40: Συνάρτηση κέρδους για την επίδραση της θέσης των χεριών στο κέρδος του σωματιδίου Στο σύστημα Άργος, ο χρήστης φοράει χρωματιστά περικάρπια, η κίνηση των οποίων παρακολουθείται σε κάθε καρέ. Έχοντας διαθέσιμη τη 2D θέση των καρπών, μπορούμε να καθοδηγήσουμε τον PSO αλγόριθμο προς μια λύση, που συμφωνεί με τη θέση αυτή. Η όλη διαδικασία εκτελείται κατά την διάρκεια του υπολογισμού του σκορ των σωματιδίων του PSO, στην οποία πολλαπλασιάζεται ένας παράγοντας κέρδους παραβολικής φύσεως, όπως φαίνεται στο διπλανό σχήμα. Επιλέξαμε αυτή τη μορφή διότι θέλαμε να δώσουμε μεγαλύτερο κόστος στη περίπτωση που το μοντέλο τοποθετεί το χέρι μακριά από τον marker του χρήστη αλλά μικρότερο κέρδος όταν ο marker βρίσκεται κοντά στο άκρο του μοντέλου, ώστε να αποτρέψουμε φαινόμενα over-fitting.

63 Μέρος IV Υλοποίηση του συστήματος 63

64 12 Χρησιμοποιηθέντα εργαλεία Χρησιμοποιηθέντα εργαλεία 12.1 Συνολικό σύστημα Σύστημα Είδος Φορητός Υπολογιστής Επεξεργαστής Intel(R)Core(TM)i3 Μνήμη DDR GB Λειτ. Σύστημα 64-bit Windows 7 Home Premium SP1 Είδος Σταθερός Υπολογιστής Επεξεργαστής AMD Phenom Μνήμη DDR GB Λειτ. Σύστημα 64-bit Windows 7 Professional SP1 Κάμερα Μοντέλο Sony s PS3 eye Τεχνολογία CMOS Ανάλυση fps, fps GPU s Σταθερός Ati HD5750 Οδηγοί Ati Catalyst 13.4 Φορητός Ati HD5450 Οδηγοί Ati Catalyst 13.4 API s OpenCV Έκδοση με ΤΒΒ 4.1 Ogre3D Boost OpenGL Πίνακας 2: Χαρακτηριστικά συστήματος υλοποίησης 12.2 Renderers Οι renderers είναι βιβλιοθήκες που επιτρέπουν τη χρήση γλώσσας υψηλού επιπέδου (π.χ. C++) για λόγους επικοινωνίας με τη κάρτα γραφικών. Λειτουργούν ως μεσολαβητές ανάμεσα στον κώδικα του προγραμματιστή, το λειτουργικό και τους οδηγούς της κάρτας γραφικών. Για τις ανάγκες του συστήματος, εξετάστηκαν δύο γνωστοί renderers: OpenGL DirectX

65 12.3 Ogre3D 65 Ύστερα από δοκιμές, βρέθηκε ότι ο OpenGL ήταν η ιδανικότερη επιλογή, καθώς ο DirectX εμφάνιζε σημαντικότερο χρόνο εκτέλεσης (περίπου 10 φορές μεγαλύτερο). Το φαινόμενο αυτό οφείλεται κυρίως στη χρήση της βιβλιοθήκης Ogre3D, η οποία δημιουργήθηκε βασισμένη στον OpenGL Ogre3D Όπως αναφέρθηκε στη παράγραφο , επιλέξαμε τη χρήση της βιβλιοθήκης Ogre3D. Πρόκειται για μηχανή γραφικών και όχι μηχανή παιχνιδιών. Η διαφορά έγκειται στο γεγονός ότι η πρώτη περιλαμβάνει αποκλειστικά και μόνο μεθόδους δημιουργίας και χειρισμού γραφικών ενώ η δεύτερη επικεντρώνεται κυρίως στις διαδικασίες που επιτρέπουν σε ένα παιχνίδι να αποκτήσει την συμπεριφορά που το διακρίνει, όπως scripting, physics, sound management, model collision, multiplayer support κτλ OpenCV Η OpenCV είναι μια πολύ διαδεδομένη βιβλιοθήκη προγραμματισμού για επεξεργασία εικόνας. Υποστηρίζει πολλές εναλλακτικές γλώσσες και περιβάλλοντα (java, c, c++, android, ios κτλ), διαθέτει γνωστούς αλγορίθμους επεξεργασίας εικόνας σε έτοιμες μεθόδους (gaussian blur, canny edge detector, watershed κτλ) αλλά και μεθόδους εξαγωγής πληροφορίας από την εικόνα (SIFT, SURF, feature detector, HuMoments, histogram calculation κτλ). Από την έκδοση 2.3 και έπειτα, προάγεται η χρήση του νέου API της OpenCV, το οποίο αναπαριστά την εικόνα σαν πίνακα τιμών και επιτρέπει την άλγεβρα πινάκων. Τέλος, από την έκδοση 2.4.4, εισάγεται η υποστήριξη της γλώσσας OpenCL, η οποία επιτρέπει την εκτέλεση υπολογισμών στη κάρτα γραφικών αντί για τη CPU, με παράλληλη επεξεργασία Boost Η βιβλιοθήκη boost διαθέτει πολλά χρήσιμα εργαλεία τα οποία μπορούν να οργανώσουν ένα πρόγραμμα σε εργασίες (tasks) και δομές (structures).

Στόχος της εργασίας και ιδιαιτερότητες του προβλήματος

Στόχος της εργασίας και ιδιαιτερότητες του προβλήματος ΑΝΑΠΤΥΞΗ ΟΠΤΙΚΟΥ ΣΥΣΤΗΜΑΤΟΣ ΠΡΟΣΑΡΜΟΣΤΙΚΟΥ ΕΛΕΓΧΟΥ ΚΑΤΕΡΓΑΣΙΑΣ ΥΛΙΚΩΝ Κουλουμέντας Παναγιώτης Σχολή Ηλεκτρονικών Μηχανικών και Μηχανικών Υπολογιστών Χανιά,Νοέμβριος 2014 Επιτροπή: Ζερβάκης Μιχάλης (επιβλέπων)

Διαβάστε περισσότερα

Συστήματα συντεταγμένων

Συστήματα συντεταγμένων Κεφάλαιο. Για να δημιουργήσουμε τρισδιάστατα αντικείμενα, που μπορούν να παρασταθούν στην οθόνη του υπολογιστή ως ένα σύνολο από γραμμές, επίπεδες πολυγωνικές επιφάνειες ή ακόμη και από ένα συνδυασμό από

Διαβάστε περισσότερα

ΡΟΜΠΟΤΙΚΗ ΟΡΑΣΗ. Όταν ένα ρομπότ κινείται σε άγνωστο χώρο ή σε χώρο που μπορεί να αλλάξει η διάταξή του τότε εμφανίζεται η ανάγκη της όρασης μηχανής.

ΡΟΜΠΟΤΙΚΗ ΟΡΑΣΗ. Όταν ένα ρομπότ κινείται σε άγνωστο χώρο ή σε χώρο που μπορεί να αλλάξει η διάταξή του τότε εμφανίζεται η ανάγκη της όρασης μηχανής. ΡΟΜΠΟΤΙΚΗ ΟΡΑΣΗ Όταν ένα ρομπότ κινείται σε άγνωστο χώρο ή σε χώρο που μπορεί να αλλάξει η διάταξή του τότε εμφανίζεται η ανάγκη της όρασης μηχανής. Αισθητήρες που χρησιμοποιούνται για να αντιλαμβάνεται

Διαβάστε περισσότερα

Ενδεικτική πολυ-εργασία 1 - εφαρμογή στην υπολογιστική όραση

Ενδεικτική πολυ-εργασία 1 - εφαρμογή στην υπολογιστική όραση Ενδεικτική πολυ-εργασία 1 - εφαρμογή στην υπολογιστική όραση Εντοπισμός ενός σήματος STOP σε μια εικόνα. Περιγράψτε τη διαδικασία με την οποία μπορώ να εντοπίσω απλά σε μια εικόνα την ύπαρξη του παρακάτω

Διαβάστε περισσότερα

ΚΑΤΑΓΡΑΦΗ ΤΟΥ ΙΧΝΟΥΣ ΤΗΣ ΟΠΤΙΚΗΣ ΑΝΑΖΗΤΗΣΗΣ: ΜΙΑ ΜΕΘΟΔΟΣ ΔΙΕΡΕΥΝΗΣΗΣ ΤΗΣ ΕΠΙΛΕΚΤΙΚΟΤΗΤΑΣ ΤΗΣ ΟΠΗΣ ΩΣ ΒΑΣΙΚΟΥ ΧΑΡΑΚΤΗΡΙΣΤΙΚΟΥ ΤΟΥ ΣΧΗΜΑΤΟΣ

ΚΑΤΑΓΡΑΦΗ ΤΟΥ ΙΧΝΟΥΣ ΤΗΣ ΟΠΤΙΚΗΣ ΑΝΑΖΗΤΗΣΗΣ: ΜΙΑ ΜΕΘΟΔΟΣ ΔΙΕΡΕΥΝΗΣΗΣ ΤΗΣ ΕΠΙΛΕΚΤΙΚΟΤΗΤΑΣ ΤΗΣ ΟΠΗΣ ΩΣ ΒΑΣΙΚΟΥ ΧΑΡΑΚΤΗΡΙΣΤΙΚΟΥ ΤΟΥ ΣΧΗΜΑΤΟΣ ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΑΓΡΟΝΟΜΩΝ ΚΑΙ ΤΟΠΟΓΡΑΦΩΝ ΜΗΧΑΝΙΚΩΝ ΤΟΜΕΑΣ ΤΟΠΟΓΡΑΦΙΑΣ ΕΡΓΑΣΤΗΡΙΟ ΧΑΡΤΟΓΡΑΦΙΑΣ ΚΑΤΑΓΡΑΦΗ ΤΟΥ ΙΧΝΟΥΣ ΤΗΣ ΟΠΤΙΚΗΣ ΑΝΑΖΗΤΗΣΗΣ: ΜΙΑ ΜΕΘΟΔΟΣ ΔΙΕΡΕΥΝΗΣΗΣ ΤΗΣ ΕΠΙΛΕΚΤΙΚΟΤΗΤΑΣ

Διαβάστε περισσότερα

Οδηγίες σχεδίασης στο περιβάλλον Blender

Οδηγίες σχεδίασης στο περιβάλλον Blender Οδηγίες σχεδίασης στο περιβάλλον Blender Στον πραγματικό κόσμο, αντιλαμβανόμαστε τα αντικείμενα σε τρεις κατευθύνσεις ή διαστάσεις. Τυπικά λέμε ότι διαθέτουν ύψος, πλάτος και βάθος. Όταν θέλουμε να αναπαραστήσουμε

Διαβάστε περισσότερα

7 ο Εργαστήριο Θόρυβος 2Δ, Μετακίνηση, Περιστροφή

7 ο Εργαστήριο Θόρυβος 2Δ, Μετακίνηση, Περιστροφή 7 ο Εργαστήριο Θόρυβος 2Δ, Μετακίνηση, Περιστροφή O θόρυβος 2Δ μας δίνει τη δυνατότητα να δημιουργίας υφής 2Δ. Στο παρακάτω παράδειγμα, γίνεται σχεδίαση γραμμών σε πλέγμα 300x300 με μεταβαλόμενη τιμή αδιαφάνειας

Διαβάστε περισσότερα

ισδιάστατοι μετασχηματισμοί ΚΕΦΑΛΑΙΟ 4: ισδιάστατοι γεωμετρικοί μετασχηματισμοί

ισδιάστατοι μετασχηματισμοί ΚΕΦΑΛΑΙΟ 4: ισδιάστατοι γεωμετρικοί μετασχηματισμοί ΚΕΦΑΛΑΙΟ 4: ισδιάστατοι γεωμετρικοί μετασχηματισμοί Πολλά προβλήματα λύνονται μέσω δισδιάστατων απεικονίσεων ενός μοντέλου. Μεταξύ αυτών και τα προβλήματα κίνησης, όπως η κίνηση ενός συρόμενου μηχανισμού.

Διαβάστε περισσότερα

Αρχιτεκτονική σχεδίαση με ηλεκτρονικό υπολογιστή

Αρχιτεκτονική σχεδίαση με ηλεκτρονικό υπολογιστή Γ Αρχιτεκτονική σχεδίαση με ηλεκτρονικό υπολογιστή Η χρήση των ηλεκτρονικών υπολογιστών στο τεχνικό σχέδιο, και ιδιαίτερα στο αρχιτεκτονικό, αποτελεί πλέον μία πραγματικότητα σε διαρκή εξέλιξη, που επηρεάζει

Διαβάστε περισσότερα

Κεφάλαιο 1: Κίνηση και γεωμετρικά σχήματα

Κεφάλαιο 1: Κίνηση και γεωμετρικά σχήματα Ασκήσεις της Ενότητας 2 : Ζωγραφίζοντας με το ΒΥΟΒ -1- α. Η χρήση της πένας Κεφάλαιο 1: Κίνηση και γεωμετρικά σχήματα Υπάρχουν εντολές που μας επιτρέπουν να επιλέξουμε το χρώμα της πένας, καθώς και το

Διαβάστε περισσότερα

Ειδικά Θέµατα Υπολογιστικής Όρασης & Γραφικής. Εµµανουήλ Ζ. Ψαράκης & Αθανάσιος Τσακαλίδης Πολυτεχνική Σχολή Τµήµα Μηχανικών Η/Υ & Πληροφορικής

Ειδικά Θέµατα Υπολογιστικής Όρασης & Γραφικής. Εµµανουήλ Ζ. Ψαράκης & Αθανάσιος Τσακαλίδης Πολυτεχνική Σχολή Τµήµα Μηχανικών Η/Υ & Πληροφορικής Ειδικά Θέµατα Υπολογιστικής Όρασης & Γραφικής Εµµανουήλ Ζ. Ψαράκης & Αθανάσιος Τσακαλίδης Πολυτεχνική Σχολή Τµήµα Μηχανικών Η/Υ & Πληροφορικής Σύνθεση Πανοράµατος Εµµανουήλ Ζ. Ψαράκης Πολυτεχνική Σχολή

Διαβάστε περισσότερα

Εισαγωγή στη σχεδίαση κινούμενων γραφικών

Εισαγωγή στη σχεδίαση κινούμενων γραφικών ΕΣΔ200 Δημιουργία Περιεχομένου ΙI Εισαγωγή στη σχεδίαση κινούμενων γραφικών Νικόλας Τσαπατσούλης Επίκουρος Καθηγητής Τμήμα Επικοινωνίας & Σπουδών Διαδικτύου Εισαγωγή Εφαρμογές Κύρια Χαρακτηριστικά Flash

Διαβάστε περισσότερα

ΣΤΕΡΕΟΣΚΟΠΙΚΕΣ ΕΙΚΟΝΕΣ

ΣΤΕΡΕΟΣΚΟΠΙΚΕΣ ΕΙΚΟΝΕΣ ΣΤΕΡΕΟΣΚΟΠΙΚΕΣ ΕΙΚΟΝΕΣ Η προοπτική εικόνα, είναι, όπως είναι γνωστό, η προβολή ενός χωρικού αντικειμένου, σε ένα επίπεδο, με κέντρο προβολής, το μάτι του παρατηρητή. Η εικόνα αυτή, θεωρούμε ότι αντιστοιχεί

Διαβάστε περισσότερα

Εικόνα. Τεχνολογία Πολυμέσων και Πολυμεσικές Επικοινωνίες 05-1

Εικόνα. Τεχνολογία Πολυμέσων και Πολυμεσικές Επικοινωνίες 05-1 Εικόνα Εισαγωγή Ψηφιακή αναπαράσταση Κωδικοποίηση των χρωμάτων Συσκευές εισόδου και εξόδου Βάθος χρώματος και ανάλυση Συμβολική αναπαράσταση Μετάδοση εικόνας Σύνθεση εικόνας Ανάλυση εικόνας Τεχνολογία

Διαβάστε περισσότερα

ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ Π ΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ Π ΕΡΙΒΑΛΛΟΝ

ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ Π ΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ Π ΕΡΙΒΑΛΛΟΝ ΥΠΟΥΡΓΕΙΟ ΕΘΝΙΚΗΣ ΠΑΙΔΕΙΑΣ ΚΑΙ ΘΡΗΣΚΕΥΜΑΤΩΝ ΠΑΙΔΑΓΩΓΙΚΟ ΙΝΣΤΙΤΟΥΤΟ ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ Π ΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ Π ΕΡΙΒΑΛΛΟΝ Κ Υ Κ Λ Ο Υ Π Λ Η Ρ Ο Φ Ο Ρ Ι Κ Η Σ Κ Α Ι Υ Π Η Ρ Ε Σ Ι Ω Ν Τ Ε Χ Ν Ο Λ Ο Γ Ι Κ Η

Διαβάστε περισσότερα

ΕΦΑΡΜΟΓΕΣ ΦΩΤΟΓΡΑΜΜΕΤΡΙΑΣ. Βασίλης Γιαννακόπουλος, Δρ. Δασολόγος

ΕΦΑΡΜΟΓΕΣ ΦΩΤΟΓΡΑΜΜΕΤΡΙΑΣ. Βασίλης Γιαννακόπουλος, Δρ. Δασολόγος ΕΦΑΡΜΟΓΕΣ ΦΩΤΟΓΡΑΜΜΕΤΡΙΑΣ Βασίλης Γιαννακόπουλος, Δρ. Δασολόγος Φωτογραμμετρία Εισαγωγή Ορισμοί Πλεονεκτήματα Μειονεκτήματα Εφαρμογές Εισαγωγή Προσδιορισμός θέσεων Με τοπογραφικά όργανα Σχήμα Μέγεθος Συντεταγμένες

Διαβάστε περισσότερα

Σχεδιασμός και κατασκευή εφαρμογής ταξινόμησης αντικειμένων σε γραμμή μεταφοράς προϊόντων με χρήση όρασης μηχανής

Σχεδιασμός και κατασκευή εφαρμογής ταξινόμησης αντικειμένων σε γραμμή μεταφοράς προϊόντων με χρήση όρασης μηχανής Πανεπιστήμιο Δυτικής Μακεδονίας Τμήμα Μηχανικών Πληροφορικής και Τηλεπικοινωνιών Σχεδιασμός και κατασκευή εφαρμογής ταξινόμησης αντικειμένων σε γραμμή μεταφοράς προϊόντων με χρήση όρασης μηχανής Λοΐζου

Διαβάστε περισσότερα

ΤΟΠΟΓΡΑΦΙΚΑ ΔΙΚΤΥΑ ΚΑΙ ΥΠΟΛΟΓΙΣΜΟΙ ΑΝΑΣΚΟΠΗΣΗ ΘΕΩΡΙΑΣ ΣΥΝΟΡΘΩΣΕΩΝ

ΤΟΠΟΓΡΑΦΙΚΑ ΔΙΚΤΥΑ ΚΑΙ ΥΠΟΛΟΓΙΣΜΟΙ ΑΝΑΣΚΟΠΗΣΗ ΘΕΩΡΙΑΣ ΣΥΝΟΡΘΩΣΕΩΝ ΤΟΠΟΓΡΑΦΙΚΑ ΔΙΚΤΥΑ ΚΑΙ ΥΠΟΛΟΓΙΣΜΟΙ ΑΝΑΣΚΟΠΗΣΗ ΘΕΩΡΙΑΣ ΣΥΝΟΡΘΩΣΕΩΝ Βασίλης Δ. Ανδριτσάνος Δρ. Αγρονόμος - Τοπογράφος Μηχανικός ΑΠΘ Επίκουρος Καθηγητής ΤΕΙ Αθήνας 3ο εξάμηνο http://eclass.teiath.gr Παρουσιάσεις,

Διαβάστε περισσότερα

ΡΟΜΠΟΤΙΚΗ ΜΕ ΧΡΗΣΗ ΤΟΥ ΠΑΚΕΤΟΥ LEGO MINDSTORMS NXT. ΚΕΦΑΛΑΙΟ 7ο. Δραστηριότητες για το ΝΧΤ-G και το Robolab

ΡΟΜΠΟΤΙΚΗ ΜΕ ΧΡΗΣΗ ΤΟΥ ΠΑΚΕΤΟΥ LEGO MINDSTORMS NXT. ΚΕΦΑΛΑΙΟ 7ο. Δραστηριότητες για το ΝΧΤ-G και το Robolab ΡΟΜΠΟΤΙΚΗ ΜΕ ΧΡΗΣΗ ΤΟΥ ΠΑΚΕΤΟΥ LEGO MINDSTORMS NXT ΚΕΦΑΛΑΙΟ 7ο Δραστηριότητες για το ΝΧΤ-G και το Robolab Α. Αποφυγή εμποδίων Θα επιδιώξουμε να προγραμματίσουμε το όχημα-ρομπότ μας ώστε να είναι σε θέση

Διαβάστε περισσότερα

Η διαδικασία Παραγωγής Συνθετικής Εικόνας (Rendering)

Η διαδικασία Παραγωγής Συνθετικής Εικόνας (Rendering) Υφή Η διαδικασία Παραγωγής Συνθετικής Εικόνας (Rendering) Θέσεις αντικειμένων και φωτεινών πηγών Θέση παρατηρητή 3D Μοντέλα 3Δ Μετασχ/σμοί Μοντέλου 3Δ Μετασχ/σμός Παρατήρησης Απομάκρυνση Πίσω Επιφανειών

Διαβάστε περισσότερα

Κατάτµηση Εικόνων: Ανίχνευση Ακµών και Κατάτµηση µε Κατωφλίωση

Κατάτµηση Εικόνων: Ανίχνευση Ακµών και Κατάτµηση µε Κατωφλίωση ΤΨΣ 50 Ψηφιακή Επεξεργασία Εικόνας Κατάτµηση Εικόνων: Ανίχνευση Ακµών και Κατάτµηση µε Κατωφλίωση Τµήµα ιδακτικής της Τεχνολογίας και Ψηφιακών Συστηµάτων Πανεπιστήµιο Πειραιώς Περιεχόµενα Βιβλιογραφία

Διαβάστε περισσότερα

21/6/2012. Μέθοδοι Κινηματικής ανάλυσης ΒΑΣΙΚΟΙ ΟΡΙΣΜΟΙ ΣΥΧΝΟΤΗΤΑ ΔΕΙΓΜΑΤΟΛΗΨΙΑΣ ΣΥΧΝΟΤΗΤΑ ΔΕΙΓΜΑΤΟΛΗΨΙΑΣ. Στόχος μεθόδων κινηματικής ανάλυσης

21/6/2012. Μέθοδοι Κινηματικής ανάλυσης ΒΑΣΙΚΟΙ ΟΡΙΣΜΟΙ ΣΥΧΝΟΤΗΤΑ ΔΕΙΓΜΑΤΟΛΗΨΙΑΣ ΣΥΧΝΟΤΗΤΑ ΔΕΙΓΜΑΤΟΛΗΨΙΑΣ. Στόχος μεθόδων κινηματικής ανάλυσης Στόχος μεθόδων κινηματικής ανάλυσης ΜΕΤΡΗΣΗ Μέθοδοι Κινηματικής ανάλυσης Ανάλυση Βάδισης ΜΕΤΑΤΟΠΙΣΗΣ ΤΑΤΗΤΑΣ ΕΠΙΤΑΝΣΗΣ Σημείου Μέλους Γωνίας ΒΑΣΙΚΟΙ ΟΡΙΣΜΟΙ ΣΝΟΤΗΤΑ ΔΕΙΓΜΑΤΟΛΗΨΙΑΣ Η συχνότητα καταγραφής

Διαβάστε περισσότερα

Μοντελοποίηση τρισδιάστατου κόσμου σε πραγματικό κόσμο: το παράδειγμα του Kinect. ιδάσκων: Φ. Αζαριάδης Φοιτήτρια: Άρτεμις-Αγγελική Σφύρη

Μοντελοποίηση τρισδιάστατου κόσμου σε πραγματικό κόσμο: το παράδειγμα του Kinect. ιδάσκων: Φ. Αζαριάδης Φοιτήτρια: Άρτεμις-Αγγελική Σφύρη Μοντελοποίηση τρισδιάστατου κόσμου σε πραγματικό κόσμο: το παράδειγμα του Kinect ιδάσκων: Φ. Αζαριάδης Φοιτήτρια: Άρτεμις-Αγγελική Σφύρη Computer graphics Μοντελοποίηση τρισδιάστατου κόσμου 2d/3d computer

Διαβάστε περισσότερα

Τα σώματα τα έχουμε αντιμετωπίσει μέχρι τώρα σαν υλικά σημεία. Το υλικό σημείο δεν έχει διαστάσεις. Έχει μόνο μάζα.

Τα σώματα τα έχουμε αντιμετωπίσει μέχρι τώρα σαν υλικά σημεία. Το υλικό σημείο δεν έχει διαστάσεις. Έχει μόνο μάζα. ΕΙΣΑΓΩΓΙΚΕΣ ΕΝΝΟΙΕΣ ΣΤΕΡΕΟΎ ΣΏΜΑΤΟΣ Τα σώματα τα έχουμε αντιμετωπίσει μέχρι τώρα σαν υλικά σημεία. Το υλικό σημείο δεν έχει διαστάσεις. Έχει μόνο μάζα. Ένα υλικό σημείο μπορεί να κάνει μόνο μεταφορική

Διαβάστε περισσότερα

Κεφάλαιο 7. Τρισδιάστατα Μοντέλα

Κεφάλαιο 7. Τρισδιάστατα Μοντέλα Κεφάλαιο 7. 7.1 ομές εδομένων για Γραφικά Υπολογιστών. Οι δομές δεδομένων αποτελούν αντικείμενο της επιστήμης υπολογιστών. Κατά συνέπεια πρέπει να γνωρίζουμε πώς οργανώνονται τα γεωμετρικά δεδομένα, προκειμένου

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 5: ΑΠΕΙΚΟΝΙΣΗ ΚΑΙ ΑΠΟΚΟΠΗ

ΚΕΦΑΛΑΙΟ 5: ΑΠΕΙΚΟΝΙΣΗ ΚΑΙ ΑΠΟΚΟΠΗ ΚΕΦΑΛΑΙΟ 5: ΑΠΕΙΚΟΝΙΣΗ ΚΑΙ ΑΠΟΚΟΠΗ Ένα γεωμετρικό μοντέλο είναι μια αριθμητική περιγραφή ενός αντικειμένου, που περιλαμβάνει το μέγεθος, το σχήμα, καθώς και άλλες ιδιότητές του. Η περιγραφή του μοντέλου

Διαβάστε περισσότερα

ΔΙΕΡΕΥΝΗΣΗ ΤΩΝ ΕΝΝΟΙΩΝ ΕΝΤΑΣΗ ΚΑΙ ΔΥΝΑΜΙΚΟ ΣΕ ΗΛΕΚΤΡΙΚΟ ΠΕΔΙΟ ΠΟΥ ΔΗΜΙΟΥΡΓΕΙΤΑΙ ΑΠΟ ΔΥΟ ΣΗΜΕΙΑΚΑ ΦΟΡΤΙΑ

ΔΙΕΡΕΥΝΗΣΗ ΤΩΝ ΕΝΝΟΙΩΝ ΕΝΤΑΣΗ ΚΑΙ ΔΥΝΑΜΙΚΟ ΣΕ ΗΛΕΚΤΡΙΚΟ ΠΕΔΙΟ ΠΟΥ ΔΗΜΙΟΥΡΓΕΙΤΑΙ ΑΠΟ ΔΥΟ ΣΗΜΕΙΑΚΑ ΦΟΡΤΙΑ 2 Ο ΣΥΝΕΔΡΙΟ ΣΤΗ ΣΥΡΟ ΤΠΕ ΣΤΗΝ ΕΚΠΑΙΔΕΥΣΗ 475 ΔΙΕΡΕΥΝΗΣΗ ΤΩΝ ΕΝΝΟΙΩΝ ΕΝΤΑΣΗ ΚΑΙ ΔΥΝΑΜΙΚΟ ΣΕ ΗΛΕΚΤΡΙΚΟ ΠΕΔΙΟ ΠΟΥ ΔΗΜΙΟΥΡΓΕΙΤΑΙ ΑΠΟ ΔΥΟ ΣΗΜΕΙΑΚΑ ΦΟΡΤΙΑ Μαστρογιάννης Αθανάσιος Εκπαιδευτικός Δευτεροβάθμιας

Διαβάστε περισσότερα

Οπτική Μοντελοποίηση Ανθρώπινου Προσώπου με Εφαρμογές σε Αναγνώριση

Οπτική Μοντελοποίηση Ανθρώπινου Προσώπου με Εφαρμογές σε Αναγνώριση Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών Τομέας Σημάτων Ελέγχου και Ρομποτικής Οπτική Μοντελοποίηση Ανθρώπινου Προσώπου με Εφαρμογές σε Αναγνώριση Επιβλέπων: καθ. Πέτρος Μαραγκός Ορισμός

Διαβάστε περισσότερα

1. Ιδιότητες φακών. 1 Λεπτοί φακοί. 2 Απριλίου Βασικές έννοιες

1. Ιδιότητες φακών. 1 Λεπτοί φακοί. 2 Απριλίου Βασικές έννοιες . Ιδιότητες φακών 2 Απριλίου 203 Λεπτοί φακοί. Βασικές έννοιες Φακός είναι ένα οπτικό σύστημα με δύο διαθλαστικές επιφάνειες. Ο απλούστερος φακός έχει δύο σφαιρικές επιφάνειες αρκετά κοντά η μία με την

Διαβάστε περισσότερα

21. ΦΥΛΛΟ ΕΡΓΑΣΙΑΣ 4 - ΔΗΜΙΟΥΡΓΩΝΤΑΣ ΜΕ ΤΟ BYOB BYOB. Αλγόριθμος Διαδικασία Παράμετροι

21. ΦΥΛΛΟ ΕΡΓΑΣΙΑΣ 4 - ΔΗΜΙΟΥΡΓΩΝΤΑΣ ΜΕ ΤΟ BYOB BYOB. Αλγόριθμος Διαδικασία Παράμετροι 21. ΦΥΛΛΟ ΕΡΓΑΣΙΑΣ 4 - ΔΗΜΙΟΥΡΓΩΝΤΑΣ ΜΕ ΤΟ BYOB BYOB Αλγόριθμος Διαδικασία Παράμετροι Τι είναι Αλγόριθμος; Οι οδηγίες που δίνουμε με λογική σειρά, ώστε να εκτελέσουμε μια διαδικασία ή να επιλύσουμε ένα

Διαβάστε περισσότερα

Σύμφωνα με το Ινστιτούτο Ρομποτικής της Αμερικής

Σύμφωνα με το Ινστιτούτο Ρομποτικής της Αμερικής ΡΟΜΠΟΤΙΚΗ: ΟΡΙΣΜΟΣ: Σύμφωνα με το Ινστιτούτο Ρομποτικής της Αμερικής, ρομπότ είναι ένας αναπρογραμματιζόμενος και πολυλειτουργικός χωρικός μηχανισμός σχεδιασμένος να μετακινεί υλικά, αντικείμενα, εργαλεία

Διαβάστε περισσότερα

Εφαρμογές Πληροφορικής στην Τοπογραφία 7η Ενότητα Μονάδες, εντολές Text, List, μετρήσεις, μετασχηματισμοί και άσκηση χάραξης

Εφαρμογές Πληροφορικής στην Τοπογραφία 7η Ενότητα Μονάδες, εντολές Text, List, μετρήσεις, μετασχηματισμοί και άσκηση χάραξης Εφαρμογές Πληροφορικής στην Τοπογραφία 7η Ενότητα Μονάδες, εντολές Text, List, μετρήσεις, μετασχηματισμοί και άσκηση χάραξης Τσιούκας Βασίλειος, Αναπληρωτής Καθηγητής Τμήμα Αγρονόμων Τοπογράφων Μηχανικών

Διαβάστε περισσότερα

ΑΠΛΗ ΑΡΜΟΝΙΚΗ ΤΑΛΑΝΤΩΣΗ - ΜΕΛΕΤΗ ΤΑΛΑΝΤΩΣΗΣ ΕΛΑΤΗΡΙΟΥ [Π. Μουρούζης, Γ. Παληός, Κ. Παπαμιχάλης, Γ. Τουντουλίδης, Ε. Τσιτοπούλου, Ι.

ΑΠΛΗ ΑΡΜΟΝΙΚΗ ΤΑΛΑΝΤΩΣΗ - ΜΕΛΕΤΗ ΤΑΛΑΝΤΩΣΗΣ ΕΛΑΤΗΡΙΟΥ [Π. Μουρούζης, Γ. Παληός, Κ. Παπαμιχάλης, Γ. Τουντουλίδης, Ε. Τσιτοπούλου, Ι. ΑΠΛΗ ΑΡΜΟΝΙΚΗ ΤΑΛΑΝΤΩΣΗ - ΜΕΛΕΤΗ ΤΑΛΑΝΤΩΣΗΣ ΕΛΑΤΗΡΙΟΥ [Π. Μουρούζης, Γ. Παληός, Κ. Παπαμιχάλης, Γ. Τουντουλίδης, Ε. Τσιτοπούλου, Ι. Χριστακόπουλος] Για τον καθηγητή Στόχοι: Με τη βοήθεια των γραφικών παραστάσεων

Διαβάστε περισσότερα

Ψηφιακά Αντικείμενα Μάθημα 1 Δραστηριότητα 2. Προγραμματισμός Φυσικών Συστημάτων. Συστήματα Πραγματικών Εφαρμογών. Νέα Ψηφιακά Αντικείμενα

Ψηφιακά Αντικείμενα Μάθημα 1 Δραστηριότητα 2. Προγραμματισμός Φυσικών Συστημάτων. Συστήματα Πραγματικών Εφαρμογών. Νέα Ψηφιακά Αντικείμενα Σκοπός Ψηφιακά Αντικείμενα Μάθημα 1 Δραστηριότητα 2 ΤΟ ΣΥΣΤΗΜΑ ΣΑΡΩΣΗΣ ΤΟΥ ΟΠΤΙΚΟΥ ΠΕΔΙΟΥ. Ψηφιακά Αντικείμενα Μικροελεγκτής Προγραμματισμός Φυσικών Συστημάτων Συστήματα Πραγματικών Εφαρμογών Νέα Ψηφιακά

Διαβάστε περισσότερα

Φυσική Θετικών Σπουδών Γ τάξη Ενιαίου Λυκείου 2 0 Κεφάλαιο

Φυσική Θετικών Σπουδών Γ τάξη Ενιαίου Λυκείου 2 0 Κεφάλαιο Φυσική Θετικών Σπουδών Γ τάξη Ενιαίου Λυκείου 0 Κεφάλαιο Περιέχει: Αναλυτική Θεωρία Ερωτήσεις Θεωρίας Ερωτήσεις Πολλαπλής Επιλογής Ερωτήσεις Σωστού - λάθους Ασκήσεις ΘΕΩΡΙΑ 4- ΕΙΣΑΓΩΓΗ Στην μέχρι τώρα

Διαβάστε περισσότερα

Ψηφιακή Επεξεργασία και Ανάλυση Εικόνας. Παρουσίαση 12 η. Θεωρία Χρώματος και Επεξεργασία Έγχρωμων Εικόνων

Ψηφιακή Επεξεργασία και Ανάλυση Εικόνας. Παρουσίαση 12 η. Θεωρία Χρώματος και Επεξεργασία Έγχρωμων Εικόνων Ψηφιακή Επεξεργασία και Ανάλυση Εικόνας Παρουσίαση 12 η Θεωρία Χρώματος και Επεξεργασία Έγχρωμων Εικόνων Εισαγωγή (1) Το χρώμα είναι ένας πολύ σημαντικός παράγοντας περιγραφής, που συχνά απλουστεύει κατά

Διαβάστε περισσότερα

ΑΣΚΗΣΗ 3 ΒΕΛΤΙΩΣΗ ΕΙΚΟΝΑΣ ΜΕΛΕΤΗ ΙΣΤΟΓΡΑΜΜΑΤΟΣ. ( ) 1, αν Ι(i,j)=k hk ( ), διαφορετικά

ΑΣΚΗΣΗ 3 ΒΕΛΤΙΩΣΗ ΕΙΚΟΝΑΣ ΜΕΛΕΤΗ ΙΣΤΟΓΡΑΜΜΑΤΟΣ. ( ) 1, αν Ι(i,j)=k hk ( ), διαφορετικά ΑΣΚΗΣΗ 3 ΒΕΛΤΙΩΣΗ ΕΙΚΟΝΑΣ ΜΕΛΕΤΗ ΙΣΤΟΓΡΑΜΜΑΤΟΣ Αντικείμενο: Εξαγωγή ιστογράμματος εικόνας, απλοί μετασχηματισμοί με αυτό, ισοστάθμιση ιστογράμματος. Εφαρμογή βασικών παραθύρων με την βοήθεια του ΜΑΤLAB

Διαβάστε περισσότερα

ΕΡΓΑΣΤΗΡΙΑΚΗ ΕΦΑΡΜΟΓΗ 1 ΤO ΡΟΜΠΟΤ INTELLITEK ER-2u

ΕΡΓΑΣΤΗΡΙΑΚΗ ΕΦΑΡΜΟΓΗ 1 ΤO ΡΟΜΠΟΤ INTELLITEK ER-2u Εφαρμογή 1: Το ρομπότ INTELITEK ER-2u Εργαστήριο Ευφυών Συστημάτων και Ρομποτικής Τμήμα Μηχανικών Παραγωγής και Διοίκησης Πολυτεχνείο Κρήτης www.robolab.tuc.gr, τηλ: 28210 37292 / 37314 e-mail: savas@dpem.tuc.gr,

Διαβάστε περισσότερα

Ενότητα 2. Ζωγραφίζοντας με το ΒΥΟΒ

Ενότητα 2. Ζωγραφίζοντας με το ΒΥΟΒ Ενότητα 2 : Ζωγραφίζοντας με το ΒΥΟΒ -1- Ενότητα 2. Ζωγραφίζοντας με το ΒΥΟΒ Κεφάλαιο 1: Κίνηση και γεωμετρικά σχήματα α. Θέση και προσανατολισμός της μορφής Η θέση της κάθε μορφής στο σκηνικό προσδιορίζεται

Διαβάστε περισσότερα

ΣΧΕΔΙΑΣΗ ΜΗΧΑΝΟΛΟΓΙΚΩΝ ΚΑΤΑΣΚΕΥΩΝ ΜΕ Η/Υ (Computer Aided Design)

ΣΧΕΔΙΑΣΗ ΜΗΧΑΝΟΛΟΓΙΚΩΝ ΚΑΤΑΣΚΕΥΩΝ ΜΕ Η/Υ (Computer Aided Design) ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Ανώτατο Εκπαιδευτικό Ίδρυμα Πειραιά Τεχνολογικού Τομέα ΣΧΕΔΙΑΣΗ ΜΗΧΑΝΟΛΟΓΙΚΩΝ ΚΑΤΑΣΚΕΥΩΝ ΜΕ Η/Υ (Computer Aided Design) Ενότητα # 2: Στερεοί Μοντελοποιητές (Solid Modelers) Δρ Κ. Στεργίου

Διαβάστε περισσότερα

Πολυτεχνείο Κρήτης Τμήμα ΗΜΜΥ Χειμερινό Εξάμηνο Intelligence Lab. Αυτόνομοι Πράκτορες. Κουσανάκης Βασίλης

Πολυτεχνείο Κρήτης Τμήμα ΗΜΜΥ Χειμερινό Εξάμηνο Intelligence Lab. Αυτόνομοι Πράκτορες. Κουσανάκης Βασίλης Πολυτεχνείο Κρήτης Τμήμα ΗΜΜΥ Χειμερινό Εξάμηνο 2012-2013 Intelligence Lab Αυτόνομοι Πράκτορες Κουσανάκης Βασίλης 2006030096 Αναφορά εργασίας εξαμήνου Mobile robots Rat s life Mapping Localization Είναι

Διαβάστε περισσότερα

ΕΝΟΤΗΤΑ 4 ΕΙΔΗ ΓΡΑΜΜΩΝ, ΕΙΔΗ ΤΡΙΓΩΝΩΝ, ΠΑΡΑΛΛΗΛΟΓΡΑΜΜΑ, ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΙ

ΕΝΟΤΗΤΑ 4 ΕΙΔΗ ΓΡΑΜΜΩΝ, ΕΙΔΗ ΤΡΙΓΩΝΩΝ, ΠΑΡΑΛΛΗΛΟΓΡΑΜΜΑ, ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΙ ΕΝΟΤΗΤΑ 4 ΕΙΔΗ ΓΡΑΜΜΩΝ, ΕΙΔΗ ΤΡΙΓΩΝΩΝ, ΠΑΡΑΛΛΗΛΟΓΡΑΜΜΑ, ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΙ ΔΕΙΚΤΕΣ ΕΠΙΤΥΧΙΑΣ ΑΡΙΘΜΟΙ Εκτίμηση και μέτρηση Μ3.6 Εκτιμούν, μετρούν, ταξινομούν και κατασκευάζουν γωνίες (με ή χωρίς τη χρήση της

Διαβάστε περισσότερα

Ψηφιοποίηση και Ψηφιακή Επεξεργασία Εικόνας

Ψηφιοποίηση και Ψηφιακή Επεξεργασία Εικόνας Ανοικτά Ακαδημαϊκά Μαθήματα στο ΤΕΙ Ιονίων Νήσων Ψηφιοποίηση και Ψηφιακή Επεξεργασία Εικόνας Ενότητα 3: Υλοποίηση Ψηφιοποίησης, Τρισδιάσταση Ψηφιοποίηση, Ψηφιοποίηση ήχου και video Το περιεχόμενο του μαθήματος

Διαβάστε περισσότερα

Επεξεργασία Χαρτογραφικής Εικόνας

Επεξεργασία Χαρτογραφικής Εικόνας Επεξεργασία Χαρτογραφικής Εικόνας Διδάσκων: Αναγνωστόπουλος Χρήστος Κώδικες μετρήσεων αντικειμένων σε εικόνα Χρωματικά μοντέλα: Munsell, HSB/HSV, CIE-LAB Κώδικες μετρήσεων αντικειμένων σε εικόνες Η βασική

Διαβάστε περισσότερα

1. Τι είναι η Κινηματική; Ποια κίνηση ονομάζεται ευθύγραμμη;

1. Τι είναι η Κινηματική; Ποια κίνηση ονομάζεται ευθύγραμμη; ΚΕΦΑΛΑΙΟ 2 ο ΚΙΝΗΣΗ 2.1 Περιγραφή της Κίνησης 1. Τι είναι η Κινηματική; Ποια κίνηση ονομάζεται ευθύγραμμη; Κινηματική είναι ο κλάδος της Φυσικής που έχει ως αντικείμενο τη μελέτη της κίνησης. Στην Κινηματική

Διαβάστε περισσότερα

Γραφικά Υπολογιστών & Εικονική Πραγματικότητα. Μετασχηματισμός απεικόνισης & Αλγόριθμοι αποκοπής

Γραφικά Υπολογιστών & Εικονική Πραγματικότητα. Μετασχηματισμός απεικόνισης & Αλγόριθμοι αποκοπής Γραφικά Υπολογιστών & Εικονική Πραγματικότητα Μετασχηματισμός απεικόνισης & Αλγόριθμοι αποκοπής Βασικές λειτουργίες απεικόνισης μετατροπή του παγκόσμιου συστήματος συντεταγμένων, ενός αντικειμένου, σε

Διαβάστε περισσότερα

> μεγαλύτερο <= μικρότερο ή ίσο < μικρότερο == ισότητα >= μεγαλύτερο ή ίσο!= διαφορετικό

> μεγαλύτερο <= μικρότερο ή ίσο < μικρότερο == ισότητα >= μεγαλύτερο ή ίσο!= διαφορετικό 5 ο Εργαστήριο Λογικοί Τελεστές, Δομές Ελέγχου Λογικοί Τελεστές > μεγαλύτερο = μεγαλύτερο ή ίσο!= διαφορετικό Οι λογικοί τελεστές χρησιμοποιούνται για να ελέγξουμε

Διαβάστε περισσότερα

Άσκηση 3 Υπολογισμός του μέτρου της ταχύτητας και της επιτάχυνσης

Άσκηση 3 Υπολογισμός του μέτρου της ταχύτητας και της επιτάχυνσης Άσκηση 3 Υπολογισμός του μέτρου της ταχύτητας και της επιτάχυνσης Σύνοψη Σκοπός της συγκεκριμένης άσκησης είναι ο υπολογισμός του μέτρου της στιγμιαίας ταχύτητας και της επιτάχυνσης ενός υλικού σημείου

Διαβάστε περισσότερα

Κίνηση ΚΕΦΑΛΑΙΟ 2 Β ΓΥΜΝΑΣΙΟΥ

Κίνηση ΚΕΦΑΛΑΙΟ 2 Β ΓΥΜΝΑΣΙΟΥ Κίνηση ΚΕΦΑΛΑΙΟ 2 Β ΓΥΜΝΑΣΙΟΥ 2.1 Περιγραφή της Κίνησης 1. Τι είναι η Κινηματική; Ποια κίνηση ονομάζεται ευθύγραμμη; Κινηματική είναι ο κλάδος της Φυσικής που έχει ως αντικείμενο τη μελέτη της κίνησης.

Διαβάστε περισσότερα

7.1 ΜΕΤΡΗΣΗ ΤΗΣ ΕΣΤΙΑΚΗΣ ΑΠΟΣΤΑΣΗΣ ΦΑΚΩΝ

7.1 ΜΕΤΡΗΣΗ ΤΗΣ ΕΣΤΙΑΚΗΣ ΑΠΟΣΤΑΣΗΣ ΦΑΚΩΝ 7.1 ΑΣΚΗΣΗ 7 ΜΕΤΡΗΣΗ ΤΗΣ ΕΣΤΙΑΚΗΣ ΑΠΟΣΤΑΣΗΣ ΦΑΚΩΝ ΘΕΩΡΙΑ Όταν φωτεινή παράλληλη δέσμη διαδιδόμενη από οπτικό μέσο α με δείκτη διάθλασης n 1 προσπίπτει σε άλλο οπτικό μέσο β με δείκτη διάθλασης n 2 και

Διαβάστε περισσότερα

ΠΑΙΖΩ ΚΑΙ ΚΑΤΑΛΑΒΑΙΝΩ ΜΑΘΗΜΑΤΙΚΑ

ΠΑΙΖΩ ΚΑΙ ΚΑΤΑΛΑΒΑΙΝΩ ΜΑΘΗΜΑΤΙΚΑ 1oς ΚΥΚΛΟΣ - ΠΑΙΖΟΥΜΕ ΚΑΙ ΜΑΘΑΙΝΟΥΜΕ ΤΟΥΣ ΑΡΙΘΜΟΥΣ Α Ενότητα Ανακαλύπτουμε τις ιδιότητες των υλικών μας, τα τοποθετούμε σε ομάδες και διατυπώνουμε κριτήρια ομαδοποίησης Οι μαθητές μαθαίνουν να αναπτύσσουν

Διαβάστε περισσότερα

Στα 1849 ο Sir David Brewster περιγράφει τη μακροσκοπική μηχανή λήψης και παράγονται οι πρώτες στερεοσκοπικές φωτογραφίες (εικ. 5,6).

Στα 1849 ο Sir David Brewster περιγράφει τη μακροσκοπική μηχανή λήψης και παράγονται οι πρώτες στερεοσκοπικές φωτογραφίες (εικ. 5,6). ΣΤΕΡΕΟΣΚΟΠΙΑ Η στερεοσκοπία είναι μια τεχνική που δημιουργεί την ψευδαίσθηση του βάθους σε μια εικόνα. Στηρίζεται στο ότι η τρισδιάστατη φυσική όραση πραγματοποιείται διότι κάθε μάτι βλέπει το ίδιο αντικείμενο

Διαβάστε περισσότερα

Μετάδοση Πολυμεσικών Υπηρεσιών Ψηφιακή Τηλεόραση

Μετάδοση Πολυμεσικών Υπηρεσιών Ψηφιακή Τηλεόραση Χειμερινό Εξάμηνο 2013-2014 Μετάδοση Πολυμεσικών Υπηρεσιών Ψηφιακή Τηλεόραση 5 η Παρουσίαση : Ψηφιακή Επεξεργασία Εικόνας Διδάσκων: Γιάννης Ντόκας Σύνθεση Χρωμάτων Αφαιρετική Παραγωγή Χρώματος Χρωματικά

Διαβάστε περισσότερα

Μορφές των χωρικών δεδομένων

Μορφές των χωρικών δεδομένων Μορφές των χωρικών δεδομένων Eάν θελήσουμε να αναπαραστήσουμε το περιβάλλον με ακρίβεια, τότε θα χρειαζόταν μιά απείρως μεγάλη και πρακτικά μη πραγματοποιήσιμη βάση δεδομένων. Αυτό οδηγεί στην επιλογή

Διαβάστε περισσότερα

University of Cyprus. Σχεδιασμός Οπτικών Συστημάτων (Απεικόνιση) ό

University of Cyprus. Σχεδιασμός Οπτικών Συστημάτων (Απεικόνιση) ό University o Cyprus Biomedical Imaging and Applied Optics Σχεδιασμός Οπτικών Συστημάτων (Απεικόνιση) ό Φακοί για Απεικόνιση Δημιουργία εικόνας με ένα φακό Ιδανικός (Ideal) λεπτός (thin) φακός 1 1 1 = +

Διαβάστε περισσότερα

Πρόταση για Ανασχηματισμό του Προγράμματος Προπτυχιακών Σπουδών της ΣΗΜΜΥ

Πρόταση για Ανασχηματισμό του Προγράμματος Προπτυχιακών Σπουδών της ΣΗΜΜΥ Πρόταση για Ανασχηματισμό του Προγράμματος Προπτυχιακών Σπουδών της ΣΗΜΜΥ Τομέας Τεχνολογίας Πληροφορικής και Υπολογιστών Περίληψη Τί προτείνουμε, πώς και γιατί με λίγα λόγια: 55 μαθήματα = 30 για ενιαίο

Διαβάστε περισσότερα

ΗΥ562 Προχωρημένα Θέματα Βάσεων Δεδομένων Efficient Query Evaluation over Temporally Correlated Probabilistic Streams

ΗΥ562 Προχωρημένα Θέματα Βάσεων Δεδομένων Efficient Query Evaluation over Temporally Correlated Probabilistic Streams ΗΥ562 Προχωρημένα Θέματα Βάσεων Δεδομένων Efficient Query Evaluation over Temporally Correlated Probabilistic Streams Αλέκα Σεληνιωτάκη Ηράκλειο, 26/06/12 aseliniotaki@csd.uoc.gr ΑΜ: 703 1. Περίληψη Συνεισφοράς

Διαβάστε περισσότερα

Τι θα απαντούσατε αλήθεια στην ίδια ερώτηση για την περίπτωση της επόμενης εικόνας;

Τι θα απαντούσατε αλήθεια στην ίδια ερώτηση για την περίπτωση της επόμενης εικόνας; Κίνηση με συντεταγμένες Στην προηγούμενη υποενότητα είδαμε πως μπορούμε να κάνουμε το χαρακτήρα σας να κινηθεί με την εντολή κινήσου...βήματα που αποτελεί και την απλούστερη εντολή της αντίστοιχης παλέτας

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 5. Κύκλος Ζωής Εφαρμογών ΕΝΟΤΗΤΑ 2. Εφαρμογές Πληροφορικής. Διδακτικές ενότητες 5.1 Πρόβλημα και υπολογιστής 5.2 Ανάπτυξη εφαρμογών

ΚΕΦΑΛΑΙΟ 5. Κύκλος Ζωής Εφαρμογών ΕΝΟΤΗΤΑ 2. Εφαρμογές Πληροφορικής. Διδακτικές ενότητες 5.1 Πρόβλημα και υπολογιστής 5.2 Ανάπτυξη εφαρμογών 44 Διδακτικές ενότητες 5.1 Πρόβλημα και υπολογιστής 5.2 Ανάπτυξη εφαρμογών Διδακτικοί στόχοι Σκοπός του κεφαλαίου είναι οι μαθητές να κατανοήσουν τα βήματα που ακολουθούνται κατά την ανάπτυξη μιας εφαρμογής.

Διαβάστε περισσότερα

ΕΡΕΥΝΗΤΙΚΑ ΠΡΟΓΡΑΜΜΑΤΑ ΑΡΧΙΜΗΔΗΣ ΕΝΙΣΧΥΣΗ ΕΡΕΥΝΗΤΙΚΩΝ ΟΜΑΔΩΝ ΣΤΟ ΤΕΙ ΣΕΡΡΩΝ. Ενέργεια. 2.2.3.στ ΘΕΜΑ ΕΡΕΥΝΑΣ: ΔΙΑΡΘΡΩΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΕΧΡΩΜΩΝ ΕΓΓΡΑΦΩΝ

ΕΡΕΥΝΗΤΙΚΑ ΠΡΟΓΡΑΜΜΑΤΑ ΑΡΧΙΜΗΔΗΣ ΕΝΙΣΧΥΣΗ ΕΡΕΥΝΗΤΙΚΩΝ ΟΜΑΔΩΝ ΣΤΟ ΤΕΙ ΣΕΡΡΩΝ. Ενέργεια. 2.2.3.στ ΘΕΜΑ ΕΡΕΥΝΑΣ: ΔΙΑΡΘΡΩΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΕΧΡΩΜΩΝ ΕΓΓΡΑΦΩΝ ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ (Τ.Ε.Ι.) ΣΕΡΡΩΝ Τμήμα ΠΛΗΡΟΦΟΡΙΚΗΣ & ΕΠΙΚΟΙΝΩΝΙΩΝ ΕΡΕΥΝΗΤΙΚΑ ΠΡΟΓΡΑΜΜΑΤΑ ΑΡΧΙΜΗΔΗΣ ΕΝΙΣΧΥΣΗ ΕΡΕΥΝΗΤΙΚΩΝ ΟΜΑΔΩΝ ΣΤΟ ΤΕΙ ΣΕΡΡΩΝ Ενέργεια. 2.2.3.στ ΘΕΜΑ ΕΡΕΥΝΑΣ: ΔΙΑΡΘΡΩΣΗ

Διαβάστε περισσότερα

Προγραμματισμός Η/Υ. Προτεινόμενα θέματα εξετάσεων Εργαστήριο. Μέρος 1 ό. ΤΕΙ Λάρισας- Σχολή Τεχνολογικών Εφαρμογών Τμήμα Πολιτικών Έργων Υποδομής

Προγραμματισμός Η/Υ. Προτεινόμενα θέματα εξετάσεων Εργαστήριο. Μέρος 1 ό. ΤΕΙ Λάρισας- Σχολή Τεχνολογικών Εφαρμογών Τμήμα Πολιτικών Έργων Υποδομής Προγραμματισμός Η/Υ Προτεινόμενα θέματα εξετάσεων Εργαστήριο Μέρος 1 ό ΤΕΙ Λάρισας- Σχολή Τεχνολογικών Εφαρμογών Τμήμα Πολιτικών Έργων Υποδομής Ιανουάριος 2011 Καλογιάννης Γρηγόριος Επιστημονικός/ Εργαστηριακός

Διαβάστε περισσότερα

ΕΛΕΓΧΟΣ ΠΑΡΑΓΩΓΙΚΩΝ ΔΙΕΡΓΑΣΙΩΝ

ΕΛΕΓΧΟΣ ΠΑΡΑΓΩΓΙΚΩΝ ΔΙΕΡΓΑΣΙΩΝ ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Ανώτατο Εκπαιδευτικό Ίδρυμα Πειραιά Τεχνολογικού Τομέα ΕΛΕΓΧΟΣ ΠΑΡΑΓΩΓΙΚΩΝ ΔΙΕΡΓΑΣΙΩΝ Ενότητα: Αναγνώριση Διεργασίας - Προσαρμοστικός Έλεγχος (Process Identification) Αλαφοδήμος Κωνσταντίνος

Διαβάστε περισσότερα

ΑΥΤΟΝΟΜΟΙ ΠΡΑΚΤΟΡΕΣ ΠΛΗ 513

ΑΥΤΟΝΟΜΟΙ ΠΡΑΚΤΟΡΕΣ ΠΛΗ 513 ΑΥΤΟΝΟΜΟΙ ΠΡΑΚΤΟΡΕΣ ΠΛΗ 513 Αναφορά Εργασίας Εξαμήνου Χειμερινό Εξάμηνο 2011-2012 Γεωργάκης Γεώργιος 2006030111 RobotStadium 2012 Εισαγωγή Το Robostadium είναι ένας διαγωνισμός στο διαδίκτυο κατά τα πρότυπα

Διαβάστε περισσότερα

Εισαγωγή Αποκοπή ευθείας σε 2Δ Αποκοπή πολυγώνου σε 2Δ Αποκοπή σε 3Δ. 3ο Μάθημα Αποκοπή. Γραφικα. Ευάγγελος Σπύρου

Εισαγωγή Αποκοπή ευθείας σε 2Δ Αποκοπή πολυγώνου σε 2Δ Αποκοπή σε 3Δ. 3ο Μάθημα Αποκοπή. Γραφικα. Ευάγγελος Σπύρου Εισαγωγή Αποκοπή ευθείας σε 2Δ Αποκοπή πολυγώνου σε 2Δ Αποκοπή σε 3Δ Γραφικα Τμήμα Πληροφορικής Πανεπιστήμιο Θεσσαλίας Ακ Έτος 2016-17 Εισαγωγή Αποκοπή ευθείας σε 2Δ Αποκοπή πολυγώνου σε 2Δ Αποκοπή σε

Διαβάστε περισσότερα

ΠΑΡΟΥΣΙΑΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ

ΠΑΡΟΥΣΙΑΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ ο Κεφάλαιο: Στατιστική ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΚΑΙ ΟΡΙΣΜΟΙ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ Πληθυσμός: Λέγεται ένα σύνολο στοιχείων που θέλουμε να εξετάσουμε με ένα ή περισσότερα χαρακτηριστικά. Μεταβλητές X: Ονομάζονται

Διαβάστε περισσότερα

ΦΥΣΙΚΗ ΠΡΟΣΑΝΑΤΟΛΙΣΜΟΥ

ΦΥΣΙΚΗ ΠΡΟΣΑΝΑΤΟΛΙΣΜΟΥ ΦΥΣΙΚΗ ΠΡΟΣΑΝΑΤΟΛΙΣΜΟΥ Β ΛΥΚΕΙΟΥ Καμπυλόγραμμες Κινήσεις Επιμέλεια: Αγκανάκης Α. Παναγιώτης, Φυσικός http://phyiccore.wordpre.com/ Βασικές Έννοιες Μέχρι στιγμής έχουμε μάθει να μελετάμε απλές κινήσεις,

Διαβάστε περισσότερα

Αλγόριθμος. Αλγόριθμο ονομάζουμε τη σαφή και ακριβή περιγραφή μιας σειράς ξεχωριστών οδηγιών βημάτων με σκοπό την επίλυση ενός προβλήματος.

Αλγόριθμος. Αλγόριθμο ονομάζουμε τη σαφή και ακριβή περιγραφή μιας σειράς ξεχωριστών οδηγιών βημάτων με σκοπό την επίλυση ενός προβλήματος. Αλγόριθμος Αλγόριθμο ονομάζουμε τη σαφή και ακριβή περιγραφή μιας σειράς ξεχωριστών οδηγιών βημάτων με σκοπό την επίλυση ενός προβλήματος. Εντολές ή οδηγίες ονομάζονται τα βήματα που αποτελούν έναν αλγόριθμο.

Διαβάστε περισσότερα

Τμήμα Μηχανικών Σχεδίασης Προϊόντων & Συστημάτων ΓΡΑΦΙΚΑ (6151) ΕΝΔΕΙΚΤΙΚΕΣ ΠΡΟΑΙΡΕΤΙΚΕΣ ΑΣΚΗΣΕΙΣ

Τμήμα Μηχανικών Σχεδίασης Προϊόντων & Συστημάτων ΓΡΑΦΙΚΑ (6151) ΕΝΔΕΙΚΤΙΚΕΣ ΠΡΟΑΙΡΕΤΙΚΕΣ ΑΣΚΗΣΕΙΣ ΓΡΑΦΙΚΑ (6151) ΕΝΔΕΙΚΤΙΚΕΣ ΠΡΟΑΙΡΕΤΙΚΕΣ ΑΣΚΗΣΕΙΣ Άσκηση 1 (Βαρύτητα 30%. Ομάδες: μέχρι 2 ατόμων): Ανάπτυξη 2Δ παιχνιδιού τύπου «ποδοσφαιράκι» το οποίο θα έχει τις παρακάτω λειτουργίες/δυνατότητες: Μπάλα:

Διαβάστε περισσότερα

Μάθημα 8 ο. Ανίχνευση Ακμών ΤΜΗΥΠ / ΕΕΣΤ 1

Μάθημα 8 ο. Ανίχνευση Ακμών ΤΜΗΥΠ / ΕΕΣΤ 1 Μάθημα 8 ο Ανίχνευση Ακμών ΤΜΗΥΠ / ΕΕΣΤ 1 Εισαγωγή (1) Οι ακμές είναι βασικά χαρακτηριστικά της εικόνας Προς το παρόν δεν υπάρχει ακόμα ένας ευρέως αποδεκτός ορισμός της ακμής. Εδώ θα θεωρούμε ως ακμή:

Διαβάστε περισσότερα

Εικόνες και γραφικά. Τεχνολογία Πολυµέσων 05-1

Εικόνες και γραφικά. Τεχνολογία Πολυµέσων 05-1 Εικόνες και γραφικά Περιγραφή στατικών εικόνων Αναπαράσταση γραφικών Υλικό γραφικών Dithering και anti-aliasing Σύνθεση εικόνας Ανάλυση εικόνας Μετάδοση εικόνας Τεχνολογία Πολυµέσων 05-1 Περιγραφή στατικών

Διαβάστε περισσότερα

ΕΙΣΑΓΩΓΗ ΣΤΗ ΔΙΑΧΕΙΡΙΣΗ ΚΑΙ ΣΤΟΝ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟ ΕΡΓΩΝ

ΕΙΣΑΓΩΓΗ ΣΤΗ ΔΙΑΧΕΙΡΙΣΗ ΚΑΙ ΣΤΟΝ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟ ΕΡΓΩΝ ΕΙΣΑΓΩΓΗ ΣΤΗ ΔΙΑΧΕΙΡΙΣΗ ΚΑΙ ΣΤΟΝ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟ ΕΡΓΩΝ 1. Διαχείριση έργων Τις τελευταίες δεκαετίες παρατηρείται σημαντική αξιοποίηση της διαχείρισης έργων σαν ένα εργαλείο με το οποίο οι διάφορες επιχειρήσεις

Διαβάστε περισσότερα

1. Τι είναι η Κινηματική; Ποια κίνηση ονομάζεται ευθύγραμμη;

1. Τι είναι η Κινηματική; Ποια κίνηση ονομάζεται ευθύγραμμη; ΚΕΦΑΛΑΙΟ 2 ο ΚΙΝΗΣΗ 2.1 Περιγραφή της Κίνησης 1. Τι είναι η Κινηματική; Ποια κίνηση ονομάζεται ευθύγραμμη; Κινηματική είναι ο κλάδος της Φυσικής που έχει ως αντικείμενο τη μελέτη της κίνησης. Στην Κινηματική

Διαβάστε περισσότερα

Περιεχόμενα. Τοπογραφικό... 9 Σκάλα... 33 Φωτορεαλισμός... 57 Αντικείμενα... 91 Ανοίγματα... 95 Γραμμές... 99 Επεξεργασία... 103 Περιβάλλον...

Περιεχόμενα. Τοπογραφικό... 9 Σκάλα... 33 Φωτορεαλισμός... 57 Αντικείμενα... 91 Ανοίγματα... 95 Γραμμές... 99 Επεξεργασία... 103 Περιβάλλον... Περιεχόμενα Τοπογραφικό... 9 Σκάλα... 33 Φωτορεαλισμός... 57 Αντικείμενα... 91 Ανοίγματα... 95 Γραμμές... 99 Επεξεργασία... 103 Περιβάλλον... 111 Πρόλογος Στο κείμενο αυτό παρουσιάζονται οι νέες δυνατότητες

Διαβάστε περισσότερα

Ηχρήση του χρώµατος στους χάρτες

Ηχρήση του χρώµατος στους χάρτες Ηχρήση του χρώµατος στους χάρτες Συµβατική χρήση χρωµάτων σε θεµατικούς χάρτες και «ασυµβατότητες» Γεωλογικοί χάρτες: Χάρτες γήινου ανάγλυφου: Χάρτες χρήσεων γης: Χάρτες πυκνότητας πληθυσµού: Χάρτες βροχόπτωσης:

Διαβάστε περισσότερα

4 ο Εργαστήριο Τυχαίοι Αριθμοί, Μεταβλητές Συστήματος

4 ο Εργαστήριο Τυχαίοι Αριθμοί, Μεταβλητές Συστήματος 4 ο Εργαστήριο Τυχαίοι Αριθμοί, Μεταβλητές Συστήματος Μεταβλητές Συστήματος Η Processing χρησιμοποιεί κάποιες μεταβλητές συστήματος, όπως τις ονομάζουμε, για να μπορούμε να παίρνουμε πληροφορίες από το

Διαβάστε περισσότερα

Ασκήσεις Φροντιστηρίου «Υπολογιστική Νοημοσύνη Ι» 5 o Φροντιστήριο

Ασκήσεις Φροντιστηρίου «Υπολογιστική Νοημοσύνη Ι» 5 o Φροντιστήριο Πρόβλημα ο Ασκήσεις Φροντιστηρίου 5 o Φροντιστήριο Δίνεται το παρακάτω σύνολο εκπαίδευσης: # Είσοδος Κατηγορία 0 0 0 Α 2 0 0 Α 0 Β 4 0 0 Α 5 0 Β 6 0 0 Α 7 0 Β 8 Β α) Στον παρακάτω κύβο τοποθετείστε τα

Διαβάστε περισσότερα

Η Μηχανική Μάθηση στο Σχολείο: Μια Προσέγγιση για την Εισαγωγή της Ενισχυτικής Μάθησης στην Τάξη

Η Μηχανική Μάθηση στο Σχολείο: Μια Προσέγγιση για την Εισαγωγή της Ενισχυτικής Μάθησης στην Τάξη 6 ο Πανελλήνιο Συνέδριο «Διδακτική της Πληροφορικής» Φλώρινα, 20-22 Απριλίου 2012 Η Μηχανική Μάθηση στο Σχολείο: Μια Προσέγγιση για την Εισαγωγή της Ενισχυτικής Μάθησης στην Τάξη Σάββας Νικολαΐδης 1 ο

Διαβάστε περισσότερα

Οδηγίες για το Geogebra Μωυσιάδης Πολυχρόνης Δόρτσιος Κώστας

Οδηγίες για το Geogebra Μωυσιάδης Πολυχρόνης Δόρτσιος Κώστας Οδηγίες για το Geogebra Μωυσιάδης Πολυχρόνης Δόρτσιος Κώστας Η πρώτη οθόνη μετά την εκτέλεση του προγράμματος διαφέρει κάπως από τα προηγούμενα λογισμικά, αν και έχει αρκετά κοινά στοιχεία. Αποτελείται

Διαβάστε περισσότερα

Περιεχόμενα. Κεφάλαιο 1 ΣΥΣΤΗΜΑΤΑ ΣΥΝΤΕΤΑΓΜΕΝΩΝ ΣΕ ΜΙΑ ΕΥΘΕΙΑ... 13 1.1 Οι συντεταγμένες ενός σημείου...13 1.2 Απόλυτη τιμή...14

Περιεχόμενα. Κεφάλαιο 1 ΣΥΣΤΗΜΑΤΑ ΣΥΝΤΕΤΑΓΜΕΝΩΝ ΣΕ ΜΙΑ ΕΥΘΕΙΑ... 13 1.1 Οι συντεταγμένες ενός σημείου...13 1.2 Απόλυτη τιμή...14 Περιεχόμενα Κεφάλαιο 1 ΣΥΣΤΗΜΑΤΑ ΣΥΝΤΕΤΑΓΜΕΝΩΝ ΣΕ ΜΙΑ ΕΥΘΕΙΑ... 13 1.1 Οι συντεταγμένες ενός σημείου...13 1.2 Απόλυτη τιμή...14 Κεφάλαιο 2 ΣΥΣΤΗΜΑΤΑ ΣΥΝΤΕΤΑΓΜΕΝΩΝ ΣΕ ΕΝΑ ΕΠΙΠΕΔΟ 20 2.1 Οι συντεταγμένες

Διαβάστε περισσότερα

Η ΣΧΕΤΙΚΟΤΗΤΑ ΚΑΙ Ο ΝΤΕΤΕΡΜΙΝΙΣΜΟΣ

Η ΣΧΕΤΙΚΟΤΗΤΑ ΚΑΙ Ο ΝΤΕΤΕΡΜΙΝΙΣΜΟΣ ΜΑΘΗΜΑ 5: Η ΣΧΕΤΙΚΟΤΗΤΑ ΚΑΙ Ο ΝΤΕΤΕΡΜΙΝΙΣΜΟΣ Salviati: Εκεί όπου δεν μας βοηθούν οι αισθήσεις πρέπει να παρέμβει η λογική, γιατί μόνο αυτή θα επιτρέψει να εξηγήσουμε τα φαινόμενα ΓΑΛΙΛΑΪΚΟΙ ΔΙΑΛΟΓΟΙ Η

Διαβάστε περισσότερα

Nao becomes a painter

Nao becomes a painter Αυτόνομοι Πράκτορες Nao becomes a painter Ομάδα εργασίας: ΚΑΤΣΑΝΙ ΜΕΡΙΕΜΕ 2011030035 Περιγραφή Στόχος της εργασίας εξαμήνου ήταν ο προγραμματισμός της συμπεριφοράς στο Aldebaran NAO ανθρωποειδές ρομπότ,

Διαβάστε περισσότερα

4.3 Δραστηριότητα: Θεώρημα Fermat

4.3 Δραστηριότητα: Θεώρημα Fermat 4.3 Δραστηριότητα: Θεώρημα Fermat Θέμα της δραστηριότητας Η δραστηριότητα αυτή εισάγει το Θεώρημα Fermat και στη συνέχεια την απόδειξή του. Ακολούθως εξετάζεται η χρήση του στον εντοπισμό πιθανών τοπικών

Διαβάστε περισσότερα

Τεχνητή Νοημοσύνη ΙΙ. Ενότητα 4: Αντίληψη. Μουστάκας Κωνσταντίνος Πολυτεχνική Σχολή Τμήμα Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών

Τεχνητή Νοημοσύνη ΙΙ. Ενότητα 4: Αντίληψη. Μουστάκας Κωνσταντίνος Πολυτεχνική Σχολή Τμήμα Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών Τεχνητή Νοημοσύνη ΙΙ Ενότητα 4: Αντίληψη Μουστάκας Κωνσταντίνος Πολυτεχνική Σχολή Τμήμα Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών Σκοποί ενότητας Αντίληψη 2 Περιεχόμενα ενότητας Αντίληψη 3 Αντίληψη

Διαβάστε περισσότερα

1. Πειραματική διάταξη

1. Πειραματική διάταξη 1. Πειραματική διάταξη 1.1 Περιγραφή της διάταξης Η διάταξη του πειράματος αποτελείται από έναν αερόδρομο και ένα ή δύο κινητά τα οποία είναι συζευγμένα μέσω ελατήριου. Η κίνηση των ταλαντωτών καταγράφεται

Διαβάστε περισσότερα

2 ΟΥ και 7 ΟΥ ΚΕΦΑΛΑΙΟΥ

2 ΟΥ και 7 ΟΥ ΚΕΦΑΛΑΙΟΥ ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ ΠΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ ΠΕΡΙΒΑΛΛΟΝ ΕΠΙΜΕΛΕΙΑ: ΜΑΡΙΑ Σ. ΖΙΩΓΑ ΚΑΘΗΓΗΤΡΙΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΘΕΩΡΙΑ 2 ΟΥ και 7 ΟΥ ΚΕΦΑΛΑΙΟΥ ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΑΛΓΟΡΙΘΜΩΝ και ΔΟΜΗ ΑΚΟΛΟΥΘΙΑΣ 2.1 Να δοθεί ο ορισμός

Διαβάστε περισσότερα

Ανάπτυξη δικτυακών εκπαιδευτικών παιχνιδιών πολλών χρηστών. Δ. Μετάφας. (Android, ipad κ.α.). Το παιχνίδι που θα επιλεγεί για την

Ανάπτυξη δικτυακών εκπαιδευτικών παιχνιδιών πολλών χρηστών. Δ. Μετάφας. (Android, ipad κ.α.). Το παιχνίδι που θα επιλεγεί για την 31 Ανάπτυξη δικτυακών εκπαιδευτικών παιχνιδιών πολλών χρηστών Δ. Μετάφας Στόχος της εργασίας είναι η ανάπτυξη δικτυακού εκπαιδευτικού παιχνιδιού πολλών χρηστών, ανεξάρτητο πλατφόρμας λειτουργικού συστήματος.

Διαβάστε περισσότερα

Κίνηση σε Ηλεκτρικό Πεδίο.

Κίνηση σε Ηλεκτρικό Πεδίο. Κίνηση σε Ηλεκτρικό Πεδίο. 3.01. Έργο κατά την μετακίνηση φορτίου. Στις κορυφές Β και Γ ενός ισοπλεύρου τριγώνου ΒΓ πλευράς α= 2cm, βρίσκονται ακλόνητα δύο σημειακά ηλεκτρικά φορτία 1 =2μC και 2 αντίστοιχα.

Διαβάστε περισσότερα

Εισαγωγή στο 3DS Max 2009

Εισαγωγή στο 3DS Max 2009 Μάθημα 1ο Εισαγωγή στο 3DS Max 2009 Σε αυτό το μάθημα πραγματοποιείται εκμάθηση του περιβάλλοντος του προγράμματος 3DS Max 2009. Το 3D Studio Max είναι ένα από τα ισχυρότερα προγράμματα δημιουργίας και

Διαβάστε περισσότερα

ΚΕΣ 03: Αναγνώριση Προτύπων και Ανάλυση Εικόνας. KEΣ 03 Αναγνώριση Προτύπων και Ανάλυση Εικόνας. Κατάτµηση Εικόνων:

ΚΕΣ 03: Αναγνώριση Προτύπων και Ανάλυση Εικόνας. KEΣ 03 Αναγνώριση Προτύπων και Ανάλυση Εικόνας. Κατάτµηση Εικόνων: KEΣ 3 Αναγνώριση Προτύπων και Ανάλυση Εικόνας Κατάτµηση Εικόνων: Ανίχνευση Ακµών Τµήµα Επιστήµης και Τεχνολογίας Τηλεπικοινωνιών Πανεπιστήµιο Πελοποννήσου Περιεχόµενα Βιβλιογραφία Περιεχόµενα Ενότητας

Διαβάστε περισσότερα

Κεφάλαιο 8. Οπτικοποίηση Απαλοιφή

Κεφάλαιο 8. Οπτικοποίηση Απαλοιφή Κεφάλαιο 8. Οπτικοποίηση Απαλοιφή Oι οπτικές επιδράσεις, που μπορεί να προκαλέσει μια εικόνα στους χρήστες, αποτελούν ένα από τα σπουδαιότερα αποτελέσματα των λειτουργιών γραφικών με Η/Υ. Τον όρο της οπτικοποίησης

Διαβάστε περισσότερα

Γραφικά & Οπτικοποίηση. Κεφάλαιο 1. Εισαγωγή. Γραφικά & Οπτικοπίηση: Αρχές & Αλγόριθμοι Κεφάλαιο 1

Γραφικά & Οπτικοποίηση. Κεφάλαιο 1. Εισαγωγή. Γραφικά & Οπτικοπίηση: Αρχές & Αλγόριθμοι Κεφάλαιο 1 Γραφικά & Οπτικοποίηση Κεφάλαιο 1 Εισαγωγή Ιστορικά Ιστορική ανασκόπηση : 2 Ιστορικά (2) Ρυθμοί ανάπτυξης CPU και GPU 3 Εφαρμογές Ειδικά εφέ για ταινίες & διαφημίσεις Επιστημονική εξερεύνηση μέσω οπτικοποίησης

Διαβάστε περισσότερα

Προγραμματισμός. Το περιβάλλον του scratch

Προγραμματισμός. Το περιβάλλον του scratch Προγραμματισμός Η τέχνη του να μπορούμε να γράφουμε τα δικά μας προγράμματα ονομάζεται προγραμματισμός. Γενικότερα ως προγραμματιστικό πρόβλημα θεωρούμε κάθε ζήτημα που τίθεται προς επίλυση, κάθε κατάσταση

Διαβάστε περισσότερα

ΣΧΕΔΙΟ ΜΑΘΗΜΑΤΟΣ: ΜΑΘΗΜΑΤΙΚΑ ΣΤ ΔΗΜΟΤΙΚΟΥ «ΤΑ ΚΛΑΣΜΑΤΑ»

ΣΧΕΔΙΟ ΜΑΘΗΜΑΤΟΣ: ΜΑΘΗΜΑΤΙΚΑ ΣΤ ΔΗΜΟΤΙΚΟΥ «ΤΑ ΚΛΑΣΜΑΤΑ» ΣΧΕΔΙΟ ΜΑΘΗΜΑΤΟΣ: ΜΑΘΗΜΑΤΙΚΑ ΣΤ ΔΗΜΟΤΙΚΟΥ «ΤΑ ΚΛΑΣΜΑΤΑ» Νικόλαος Μπαλκίζας 1. ΕΙΣΑΓΩΓΗ Σκοπός του σχεδίου μαθήματος είναι να μάθουν όλοι οι μαθητές της τάξης τις έννοιες της ισοδυναμίας των κλασμάτων,

Διαβάστε περισσότερα

Ερωτήσεις Απαντήσεις επανάληψης κεφ.9 (Πολυμέσα).

Ερωτήσεις Απαντήσεις επανάληψης κεφ.9 (Πολυμέσα). 14 ο Γυμνάσιο Περιστερίου 1 Ερωτήσεις Απαντήσεις επανάληψης κεφ.9 (Πολυμέσα). Μάθημα 9.1 Ο κόσμος των Πολυμέσων 1. Τι είναι μια Εφαρμογή Πολυμέσων. Λογισμικό στο οποίο χρησιμοποιούνται πολλά και διαφορετικά

Διαβάστε περισσότερα

ΚΑΤΑΓΡΑΦΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΣΤΗΝ ΟΔΟ ΕΡΜΟΥ (ΜΥΤΙΛΗΝΗ, Ν. ΛΕΣΒΟΥ)

ΚΑΤΑΓΡΑΦΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΣΤΗΝ ΟΔΟ ΕΡΜΟΥ (ΜΥΤΙΛΗΝΗ, Ν. ΛΕΣΒΟΥ) ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΚΑΤΑΓΡΑΦΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΣΤΗΝ ΟΔΟ ΕΡΜΟΥ (ΜΥΤΙΛΗΝΗ, Ν. ΛΕΣΒΟΥ) ΤΜΗΜΑ ΓΕΩΓΡΑΦΙΑΣ ΝΙΚΟΣ ΣΤΑΣΙΝΟΣ ΜΥΤΙΛΗΝΗ 2016 ΠΕΡΙΕΧΟΜΕΝΑ 1. ΕΙΣΑΓΩΓΗ 1.1 ΣΚΟΠΟΣ ΣΕΛ.2 2. ΜΕΘΟΔΟΛΟΓΙΑ ΣΕΛ.3 3. ΑΠΟΤΕΛΕΣΜΑΤΑ

Διαβάστε περισσότερα

ΚΑΤΑΣΚΕΥΗ ΠΡΟΟΠΤΙΚΟΥ ΣΕ ΠΛΑΓΙΟ ΠΙΝΑΚΑ ΣΕ ΠΕΡΙΒΑΛΛΟΝ CAD

ΚΑΤΑΣΚΕΥΗ ΠΡΟΟΠΤΙΚΟΥ ΣΕ ΠΛΑΓΙΟ ΠΙΝΑΚΑ ΣΕ ΠΕΡΙΒΑΛΛΟΝ CAD ΣΕ ΠΕΡΙΒΑΛΛΟΝ CAD Σύμφωνα με τους ορισμούς, το προοπτικό είναι η κεντρική προβολή (από τη θέση του ματιού του παρατηρητή) ενός σχήματος πάνω στο επίπεδο του πίνακα. Οι παράλληλες ευθείες του αρχικού σχήματος

Διαβάστε περισσότερα

Γνωστική Ψυχολογία Ι (ΨΧ32)

Γνωστική Ψυχολογία Ι (ΨΧ32) Γνωστική Ψυχολογία Ι (ΨΧ32) Διάλεξη 6 Μηχανισμοί επεξεργασίας οπτικού σήματος Οι άλλες αισθήσεις Πέτρος Ρούσσος Η αντιληπτική πλάνη του πλέγματος Hermann 1 Πλάγια αναστολή Η πλάγια αναστολή (lateral inhibition)

Διαβάστε περισσότερα

ΦΥΣΙΚΗ ΚΑΤΕΥΘΥΝΣΗΣ Γ ΛΥΚΕΙΟΥ. Η ενέργεια ταλάντωσης ενός κυλιόμενου κυλίνδρου

ΦΥΣΙΚΗ ΚΑΤΕΥΘΥΝΣΗΣ Γ ΛΥΚΕΙΟΥ. Η ενέργεια ταλάντωσης ενός κυλιόμενου κυλίνδρου A A N A B P Y A 9 5 ΦΥΣΙΚΗ ΚΑΤΕΥΘΥΝΣΗΣ Γ ΛΥΚΕΙΟΥ Η ενέργεια ταλάντωσης ενός κυλιόμενου κυλίνδρου Στερεό σώμα με κυλινδρική συμμετρία (κύλινδρος, σφαίρα, σφαιρικό κέλυφος, κυκλική στεφάνη κλπ) μπορεί να

Διαβάστε περισσότερα

Μηχανολογικό Σχέδιο με τη Βοήθεια Υπολογιστή. Γεωμετρικός Πυρήνας Παραμετρική Σχεδίαση

Μηχανολογικό Σχέδιο με τη Βοήθεια Υπολογιστή. Γεωμετρικός Πυρήνας Παραμετρική Σχεδίαση Μηχανολογικό Σχέδιο με τη Βοήθεια Υπολογιστή Γεωμετρικός Πυρήνας Παραμετρική Σχεδίαση Παραμετρική σχεδίαση Παραμετρικό αντικείμενο (2D σχήμα/3d στερεό) ονομάζουμε το αντικείμενο του οποίου η (γεωμετρική)

Διαβάστε περισσότερα

Β Γραφικές παραστάσεις - Πρώτο γράφημα Σχεδιάζοντας το μήκος της σανίδας συναρτήσει των φάσεων της σελήνης μπορείτε να δείτε αν υπάρχει κάποιος συσχετισμός μεταξύ των μεγεθών. Ο συνήθης τρόπος γραφικής

Διαβάστε περισσότερα