ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ. Πολυτεχνική Σχολή Τμήμα Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ. Πολυτεχνική Σχολή Τμήμα Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών"

Transcript

1 ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ Πολυτεχνική Σχολή Τμήμα Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών Σύστημα Άργος Σύστημα εντοπισμού ανθρώπου και αναγνώρισης πόζας,βασιζόμενο σε δεδομένα RGB-D Argus System Human detection and pose estimation system,based on RGB-D data Μιλτιάδης-Αλέξιος Παπαδόπουλος AEM: 6714 Επιβλέπων καθηγητής: Αναστάσιος Ντελόπουλος 30 Απριλίου 2013

2 Περίληψη Ο εντοπισμός του ανθρώπου και η αναγνώριση της πόζας του είναι ένα πολύπλοκο πρόβλημα που καλείται να λύσει η επιστήμη της Όρασης Υπολογιστών, ιδιαίτερα στη σύγχρονη εποχή που ακμάζει η 3D όραση και η αγορά αναζητά εναλλακτικές λύσεις διεπαφής με τα υπολογιστικά συστήματα. Το σύστημα Άργος αξιοποιεί αλγορίθμους όρασης υπολογιστών για να εντοπίσει και να απομονώσει τον χρήστη, βασιζόμενος σε χαρακτηριστικά του όπως το σχήμα σώματος, η ύπαρξη προσώπου και δέρματος. Στη συνέχεια αναζητά τη βέλτιστη πόζα που ταιριάζει σε αυτόν, μέσω του αλγορίθμου αναζήτησης βέλτιστων λύσεων PSO και γνωστού ανθρώπινου 3D μοντέλου. Το 3D μοντέλο λαμβάνει πόζες κατά βούληση και αποδίδεται από τη κάρτα γραφικών. Τέλος, το σύστημα παρακολουθεί την κίνηση του χρήστη, βασιζόμενο σε μια εκτίμηση αυτής και στην εξελικτική λογική του αλγορίθμου PSO. 2

3 3 Abstract Human detection and pose recognition is a complicated problem, often needed to be solved by Computer Vision, especially in modern times, when 3D vision is thriving and the marker is seeking alternative computer interface solutions. Argus System uses computer vision algorithms to detect and isolate the user, based on features like body shape, face and skin visibility. Next, it searches for the best matching pose, through the best solution searching algorithm PSO and a predetermined human 3D model. The 3D model takes poses on demand and it is rendered by the GPU. Finally, the system tracks the user s movement, based on estimation and PSO s evolutionary logic.

4 4 ΕΥΧΑΡΙΣΤΙΕΣ Η παρούσα εργασία δε θα μπορούσε ποτέ να ολοκληρωθεί χωρίς τη συμβολή και καθοδήγηση του καθηγητή Α.Ντελόπουλου, ο οποίος προσέφερε συνεχώς τις πλούσιες γνώσεις του στο τομέα της τεχνητής όρασης. Θα ήθελα επίσης να ευχαριστήσω τους γονείς και τη γιαγιά μου που με ανέχτηκαν κατά τη περίοδο της συγγραφής, μια περίοδο ιδιαίτερα αγχωτική. Εκτιμώ ιδιαίτερα τις συμβουλές του αδερφού και συναδέλφου μου σε θέματα λογισμικού, παρά τα διαφορετικά μας αντικείμενα, όπως επίσης και τη τεχνική υποστήριξη της κοινότητας της OpenCV και Ogre3D. Αποδίδω ευχαριστίες σε όλη την ομάδα ρομποτικής PANDORA, οι οποίοι με ενέπνευσαν το τελευταίο χρόνο σχετικά με το θέμα της εργασίας. Ένα μεγάλο ευχαριστώ στο sensei K.Ματζάρα και όλους τους aikidoka που γνώρισα και με βοήθησαν να αποβάλω το άγχος μου δημιουργικά. Τέλος θέλω να ευχαριστήσω τους φίλους μου Αλέξανδρο- Σάββα, Θεοδόση, Ραφαήλα και φυσικά Δάφνη, για τις υπέροχες στιγμές και συμβουλές που μου χάρισαν, όταν η εργασία έμοιαζε να φτάνει σε αδιέξοδο....αφιερώνω αυτή την εργασία στον καθηγητή Νικόλαο Ι. Μάργαρη που απεβίωσε λίγες μέρες πριν την ολοκλήρωσή της...

5 ΠΕΡΙΕΧΟΜΕΝΑ 5 Περιεχόμενα I Εισαγωγή 12 1 Ανάλυση προβλήματος 13 2 Υπάρχουσες λύσεις MoCap Μονο-Στερεο-Πολυσκοπική όραση Ενεργά συστήματα Παθητικά συστήματα Υβριδικά συστήματα Λογισμικά Διάρθρωση εργασίας 19 II Διάταξη καμερών 20 4 Απαιτήσεις 21 5 Κατασκευή Κάμερες Περίβλημα III Αρχιτεκτονική του συστήματος 24 6 Απαιτήσεις Γενική εικόνα του συστήματος Λήψη εικόνας και βάθους σκηνής Βαθμονόμηση διάταξης (Calibration) Θεωρία βαθμονόμησης Διαδικασία βαθμονόμησης Υπολογισμός βάθους σκηνής Θεωρία επιπολικής γεωμετρίας Διαθέσιμοι αλγόριθμοι Εικόνα διασποράς

6 ΠΕΡΙΕΧΟΜΕΝΑ 6 9 Εντοπισμός και αποκοπή χρήστη Εντοπισμός ανθρώπων Εντοπισμός χρήστη Εντοπισμός προσώπου Εντοπισμός δέρματος Εντοπισμός markers Παρακολούθηση χρήστη Αναγνώριση πόζας Μοντελοποιητής Δημιουργία μοντέλου Κύριος μοντελοποιητής Αλγόριθμος εύρεσης λύσης Μέθοδοι εκτίμησης πόζας που χρησιμοποιούνται Μετευρετικός αλγόριθμος PSO Αξιολόγηση πόζας Παρακολούθηση κίνησης Παρακολούθηση με PSO Υποβοήθηση παρακολούθησης με προηγούμενη γνώση Μορφή φίλτρου Kalman Προσαρμογή φίλτρου Kalman Υποβοήθηση παρακολούθησης με σημεία του χρήστη IV Υλοποίηση του συστήματος Χρησιμοποιηθέντα εργαλεία Συνολικό σύστημα Renderers Ogre3D OpenCV Boost Προβλήματα συστήματος και βιβλιοθηκών Προβλήματα υλικού Προβλήματα λογισμικού Πειραματικά αποτελέσματα Ενδογενείς και εξωγενείς παράμετροι κάμερας Ενδογενείς παράμετροι Εξωγενείς παράμετροι

7 ΠΕΡΙΕΧΟΜΕΝΑ Μετρήσεις βάθους με τη 3D κάμερα Εντοπισμός/Παρακολούθηση markers Παρακολούθηση χρήστη PSO συναρτήσεις σκορ Εύρεση πόζας Παραλληλοποίηση κώδικα Αξιολόγηση συστήματος Ταχύτητα Ακρίβεια Συμβατότητα V Επίλογος Συμπεράσματα και συνεισφορά Προτάσεις περαιτέρω έρευνας 90

8 ΚΑΤΑΛΟΓΟΣ ΣΧΗΜΑΤΩΝ 8 Κατάλογος Σχημάτων 1 Τα συστήματα εντοπισμού χρηστών μέσω δεδομένων RGB- D βρίσκουν εφαρμογή στη διασκέδαση Η ταινία Avatar έφερε επανάσταση στη βιομηχανία του θεάματος αξιοποιώντας τεχνολογίες 3D εικόνας και motion capture MoCap με πηγές φωτός MoCap με αισθητήρες Πολυσκοπική όραση 128 καμερών του ιδρύματος Stanford 16 6 O αισθητήρας Kinect χρησιμοποιεί δομημένο φωτισμό Κάμερα τεχνολογίας ToF Στέρεο κάμερα Bumblebee Συνδυασμός ToF και stereo Το λογισμικό Skeltrack του Joaquim Rocha PS3 Eye κάμερα της Sony Η μπροστινή όψη της κάμερας που χρησιμοποιήθηκε κατά τη διάρκεια της εργασίας Μια πιο στιβαρή κατασκευή τοποθετήθηκε στο όχημα της ομάδας ρομποτικής PANDORA του ΑΠΘ Η μπροστινή όψη της κάμερας που χρησιμοποιήθηκε κατά τη διάρκεια της εργασίας Λειτουργικά τμήματα του συστήματος Άργος Διάγραμμα ροής του τμήματος λογικής του Άργος Βαρελοειδής παραμόρφωση και στρέβλωση Μοτίβο σκακιέρας, συμμετρικών και μη-συμμετρικών κύκλων Επιπολική γεωμετρία Το pinhole μοντέλο που είναι ευρέως αποδεκτό Τα αποτελέσματα των αλγορίθμων var, bm και sgbm αντίστοιχα για μια δεδομένη σκηνή σε colormap jet παλέτα Παράδειγμα διασποράς του ζεύγους εικόνων Tsukuba. Κάτω δεξιά είναι το ground truth Δείγμα διασποράς όπως επιστρέφεται και η 3D απεικόνισή του. Είναι εμφανής η κλίση που δίνεται στο πάτωμα Διάγραμμα ροής εντοπισμού χρήστη Το τελικό αποτέλεσμα με τον εντοπισμένο χρήστη και την εικόνα διασποράς που του αντιστοιχεί. Οι markers έχουν εντοπιστεί επιτυχώς Παράδειγμα προσανατολισμένων παραγώγων εικόνας.. 38

9 ΚΑΤΑΛΟΓΟΣ ΣΧΗΜΑΤΩΝ 9 27 Παράδειγμα εντοπισμού ανθρώπων με HOG. Ο αλγόριθμος επιστρέφει τα τετράγωνα εντοπισμού Εντοπισμός προσώπου στη Lena Η κατανομή απόχρωσης δέρματος στο χρωματοχώρο YCrCb Οι markers είναι χρώματος πράσινου και κόκκινου και φοριούνται στους καρπούς των χεριών Παράδειγμα επαναπροβολής ιστογράμματος δέρματος Διάγραμμα ροής εντοπισμού και παρακολούθησης markers Διάγραμμα ροής παρακολούθησης χρήστη Το αποτέλεσμα του αλγορίθμου floodfill Η σχεδίαση του μοντέλου είναι απλή υπόθεση, πρέπει όμως να δοθεί προσοχή στη τοποθέτηση των αρθρώσεων Διάγραμμα ροής μοντελοποιητή Τα όρια αρθρώσεων σε συνδυασμό με τη εξελικτική λογική του PSO επιφέρουν αποτελέσματα που μοιάζουν με έργα τέχνης! Κίνηση σωματιδίου βάσει τυχαίας, βέλτιστης προσωπικής και γενικής θέσης Το kinect γνωρίζει τη θέση διάφορων σημείων του ανθρώπου σε κάθε καρέ της εικόνας διασποράς Συνάρτηση κέρδους για την επίδραση της θέσης των χεριών στο κέρδος του σωματιδίου Σχέση διασποράς και απόστασης από τη κάμερα, για μέγιστη διασπορά 32 pixels Η επιφάνεια που χρησιμοποιήθηκε για τις μετρήσεις είναι μια σκακιέρα, καθώς φέρει έντονη υφή Σχέση πραγματικής απόστασης από τη κάμερα και απόστασης που αυτή υπολογίζει σε cm Απόλυτο ποσοστιαίο σφάλμα απόστασης % ως προς την απόσταση από τη κάμερα Οι markers εντοπίζονται και στη συνέχεια παρακολουθείται η κίνησή τους. Μερικές φορές όμως η πρόβλεψη δεν είναι σωστή! Καθώς ο χρήστης κινείται στο χώρο, το τετράγωνο εντοπισμού τον ακολουθεί Τα αποτελέσματα που δίνουν διάφορες συναρτήσεις κέρδους για τις ίδιες λύσεις του μοντελοποιητή Δοκιμάστηκαν διαφορετικές εκδόσεις σε fuzzy λογική Εξετάστικαν και άλλοι ορισμοί του fuzzy AND και OR Σύνολο 21 λύσεων του μοντελοποιητή για σύγκριση με μια δεδομένη εικόνα διασποράς

10 ΚΑΤΑΛΟΓΟΣ ΣΧΗΜΑΤΩΝ καρέ εικόνας βάθους χρήστη και η λύση που προτείνει το σύστημα Τυχαίνει το σύστημα να μην ακολουθεί πάντα τη κίνηση του ανθρώπου Σύγκριση μεταξύ μερικής παράλληλης και σειριακής επεξεργασίας Κέρδος παράλληλης εκτέλεσης Κατανομή χρόνου σε κάθε εξέλιξη του σμήνους

11 ΚΑΤΑΛΟΓΟΣ ΠΙΝΑΚΩΝ 11 Κατάλογος Πινάκων 1 Όρια min/max αρθρώσεων ανθρώπου σε μοίρες Χαρακτηριστικά συστήματος υλοποίησης Ενδογενείς παράμετροι κάμερας Παράμετροι παραμόρφωσης κάμερας Εξωγενείς παράμετροι κάμερας

12 Μέρος I Εισαγωγή 12

13 1 Ανάλυση προβλήματος 13 1 Ανάλυση προβλήματος Η επικοινωνία ανθρώπου μηχανής αποτελεί ένα από τα σημαντικότερα ζητήματα της επιστήμης των ηλεκτρονικών υπολογιστών (ΗΥ) και ειδικότερα του τομέα της τεχνητής όρασης ή όρασης υπολογιστών (Computer Vision). Καθώς η τεχνολογία εξελίσσεται, οι επεξεργαστικές δυνατότητες των υπολογιστών βελτιώνονται ενώ οι μέθοδοι επικοινωνίας αυτών με τους χρήστες τείνουν να παραμείνουν στάσιμοι σε συμβατικά μέσα εισόδου δεδομένων και εξόδου πληροφορίας (πληκτρολόγιο, ποντίκι, οθόνη κτλ). Η βασικότερη αίσθηση του ανθρώπου είναι αναμφίβολα η όραση, οπότε, όπως ήταν άλλωστε αναμενόμενο, από τη στιγμή που ο ΗΥ εξοπλίστηκε με συσκευές λήψης εικόνας και βίντεο (κάμερες), γίνονται προσπάθειες ανάπτυξης διεπαφών ώστε να αντιλαμβάνεται ο ΗΥ το ανθρώπινο περιβάλλον αλλά κυρίως τον ίδιο τον άνθρωπο. Ο εντοπισμός ενός πιθανού χρήστη στο οπτικό πεδίο μιας κάμερας αλλά και η αναγνώριση των ενεργειών αυτού παρέχει πολύτιμη πληροφορία, που μπορεί να αξιοποιηθεί σε πληθώρα εφαρμογών, όπως είναι η τεχνητή νοημοσύνη, τα βιντεοπαιχνίδια, οι κινηματογραφικές ταινίες, ο χειρισμός αυτοματισμών, η ρομποτική κτλ. Οι περισσότερες από αυτές τις εφαρμογές απαιτούν να αναγνωριστεί ο Σχήμα 1: Τα συστήματα άνθρωπος, να αποκοπεί από το περιβάλλον που τον περιέχει και να εντοπιστεί δεδομένων RGB-D βρίσκουν εντοπισμού χρηστών μέσω η ακριβής ή προσεγγιστική του θέση στις εφαρμογή στη διασκέδαση. 2 διαστάσεις και άνω. Σίγουρα είναι πιο διασκεδαστικό αν ο ήρωας ενός βιντεοπαιχνιδιού κινείται ακριβώς όπως ο χρήστης του, ενώ αυτός τον χειρίζεται με ασφάλεια στο σαλόνι του σπιτιού του. Η βιομηχανία του θεάματος δε θα μπορούσε να μας προσφέρει σκηνές φανταστικών χαρακτήρων με τόσο φυσική κί- Σχήμα 2: Η ταινία Avatar έφερε επανάσταση στη βιομηχανία του θεάματος αξιονηση που εκπλήσσει χωρίς τις τεχνολογίες Καταγραφής Κίνησης (Motion Capture - ποιώντας τεχνολογίες 3D εικόνας και motion capture MoCap). Η ιδέα της χειραψίας ενός ρομπότ με τον άνθρωπο έχει ξεφύγει από σενάριο ταινίας επιστημονικής φαντασίας και τείνει να υλοποιηθεί. Τροχοπέδη στην επαναστατική αυτή εξέλιξη στη τεχνολογία των

14 2 Υπάρχουσες λύσεις 14 υπολογιστών αποτελεί το ίδιο το πρόβλημα. Εκ φύσεως το πρόβλημα εμφανίζεται στον τρισδιάστατο (3Δ) χώρο με 3Δ αντικείμενα να δρουν σε αυτόν (πχ ο άνθρωπος). Ακόμα και αν παραλείψουμε το γεγονός ότι οι συσκευές που επιτρέπουν τον ΗΥ να αντιλαμβάνεται το περιβάλλον με οπτικό τρόπο (κάμερες) λειτουργούν σε ένα υποσύνολο του 2Δ χώρου (μειωμένη ανάλυση, μειωμένο οπτικό πεδίο, χαμηλή προσαρμοστική ικανότητα στις αλλαγές του περιβάλλοντος κτλ), βρισκόμαστε αντιμέτωποι με τον αυξημένο χώρο του προβλήματος, ο οποίος εκτείνεται πέρα από τις 3 διαστάσεις. Ένα συμπαγές άψυχο αντικείμενο στο χώρο μπορεί να κινηθεί με 6 διαφορετικούς τρόπους στο χώρο (3 μετατοπίσεις και 3 περιστροφές) τους οποίους ονομάζουμε βαθμούς ελευθερίας (degrees of freedom - DoF). Ένα αντικείμενο με αρθρώσεις, όπως ο άνθρωπος, εκτός από τους 6 DoF, διαθέτει και DoF για κάθε του άρθρωση. Αν και για έναν άνθρωπο είναι πολύ εύκολο να αναγνωρίσει έναν άλλον άνθρωπο αλλά και τη θέση αυτού στο περιβάλλον με σχετική (ποιοτική) ακρίβεια, ο ΗΥ δε διαθέτει τη νοημοσύνη για να επιφέρει το ίδιο αποτέλεσμα στο ίδιο πρόβλημα, με την ανάλογη ακρίβεια και ταχύτητα. Αντί αυτού, στοχεύουμε στον απόλυτο προσδιορισμό των μεγεθών που χαρακτηρίζουν τη θέση του ανθρώπου, βασιζόμενοι πολλές φορές σε συστήματα που παρέχουν περισσότερη πληροφορία από αυτή που παρέχει η ανθρώπινη όραση. Μπορούμε λοιπόν να φανταστούμε γιατί η αναγνώριση της πόζας του ανθρώπου είναι ένα από τα μεγαλύτερα προβλήματα του τομέα της τεχνητής όρασης. 2 Υπάρχουσες λύσεις Αν και το πρόβλημα της αναγνώρισης της ανθρώπινης πόζας είναι ιδιαίτερα δύσκολο, υπάρχουν λύσεις που προσεγγίζουν τη λύση σε ικανοποιητικό βαθμό, χρησιμοποιώντας διαφορετικές μεθόδους. Όπως και σε κάθε άλλο πρόβλημα, υπάρχουν λύσεις που διαθέτουν έναν συνδυασμό χαρακτηριστικών όπως ταχύτητα, ακρίβεια, αντοχή σε εξωγενείς θορύβους, χαμηλή υπολογιστική πολυπλοκότητα, χαμηλό χρηματικό κόστος κτλ, αλλά λίγες από αυτές συνδυάζουν τα απαραίτητα χαρακτηριστικά ώστε να ξεχωρίσουν ανάμεσα στις άλλες και να ικανοποιήσουν τις απαιτήσεις της αντίστοιχης αγοράς υπολογιστικών συστημάτων, είτε αυτοί είναι οι τελικοί καταναλωτές είτε βιομηχανίες. Ανάμεσα σαυτές διακρίνουμε 2 κυρίως κατηγορίες, τη κατηγορία του MoCap και τη κατηγορία της στερεοσκοπικής όρασης. Οι δυο κατηγορίες δεν είναι απόλυτα ορισμένες καθώς πολλές φορές εμφανίζεται επικάλυψη μεταξύ τους.

15 2.1 MoCap MoCap Ως Καταγραφή Κίνησης ορίζεται η διαδικασία κατά την οποία μετρούμε με άμεσο τρόπο την κίνηση του χρήστη, καθώς αυτός φοράει κάποιον ειδικό εξοπλισμό που το επιτρέπει. Ο εξοπλισμός αυτός συνήθως είναι κάποιας μορφής στολή, με ανακλαστήρες ή πηγές φωτός σε γνωστά στρατηγικά σημεία, την μετατόπιση των οποίων -άρα και τη παραμόρφωση του σώματος- μετράμε μέσω κάμερας κατά τη διάρκεια της κίνησης. Η παραμόρφωση αυτή μετατρέπεται στη συνέχεια σε μετασχηματισμούς σημείων ενός μοντέλου το οποίο αποτελεί και το κινηματικό μοντέλο για παράδειγμα του ανθρώπου. Σε πιο απαιτητικές εφαρμογές, η στολή φέρει αισθητήρες προσανατολισμού και επιτάχυνσης ή ακόμα και μέτρησης σχετικής θέσης αρθρώσεων (σχήμα 4). Σχήμα 3: MoCap με πηγές φωτός Σχήμα 4: MoCap με αισθητήρες Κύριο πλεονέκτημα αυτής της κατηγορίας είναι η ακρίβεια των μετρήσεων και η ταχύτητα λήψης αυτών, καθώς απαιτούνται ελάχιστοι

16 2.2 Μονο-Στερεο-Πολυσκοπική όραση 16 υπολογισμοί για να προκύψει χρήσιμη πληροφορία. Το μειονέκτημα αυτής της κατηγορίας είναι ότι απαιτεί ελεγχόμενο, συνήθως κλειστό, περιβάλλον και συμβιβασμό του χρήστη ως προς την ένδυσή του, καθώς πρέπει να φοράει την απαραίτητη στολή. Η μέθοδος αυτή ενδείκνυται για εμπορικές εφαρμογές αλλά όχι για καταναλωτικές λύσεις. Για το καταναλωτικό κοινό, εφαρμόζονται μέθοδοι μονοσκοπικής, στερεοσκοπικής και πολυσκοπικής όρασης. Έχοντας 2Δ και 3Δ πληροφορία για μια δεδομένη σκηνή, μπορούμε να εκτιμήσουμε την πόζα του χρήστη, όπως ακριβώς θα έκανε ένας άνθρωπος για έναν άλλον άνθρωπο, βασιζόμενος στη κυρίαρχη αίσθηση, την όραση. 2.2 Μονο-Στερεο-Πολυσκοπική όραση Σε αυτό το είδος συστήματος, στόχος είναι ο υπολογισμός του βάθους της σκηνής, με εξαίρεση την μονοσκοπική όραση, η οποία παίρνει στοιχεία από την προαναφερθείσα κατηγορία MoCap. Οι διαφορές ανάμεσα στη μονοσκοπική, τη στερεοσκοπική και τη πολυσκοπική όραση εντοπίζονται κυρίως στον αριθμό καμερών που χρησιμοποιούνται για τη συλ5: Πολυσκοπική λογή δεδομένων. Σε γενικές γραμμές η Σχήμα όραση 128 καμερών του μονοσκοπική όραση προσφέρει 2Δ πληροφορία, η στερεοσκοπική 3Δ ενώ η πο- ιδρύματος Stanford λυσκοπική είτε πιο ακριβή 3Δ πληροφορία είτε 3Δ πληροφορία σημείων που δεν είναι ορατά από μια οπτική γωνία, με εξαιρετική περίπτωση αυτή της πλήρους αναπαράστασης του πραγματικού μοντέλου στο 3D κόσμο. Ανεξάρτητα του αριθμού καμερών που θα χρησιμοποιηθούν, μπορούμε να χωρίσουμε εκ νέου τη κατηγορία σε 2 υποκατηγορίες, τα ενεργά και τα παθητικά συστήματα Ενεργά συστήματα Σχήμα 6: O αισθητήρας Kinect χρησιμοποιεί δομημένο φωτισμό Ως ενεργά συστήματα ορίζουμε τα συστήματα όρασης που μεταβάλλουν χαρακτηριστικά του περιβάλλοντός τους, κυρίως οπτικής φύσεως, ώστε να μπορέσουν να λάβουν 3Δ δεδομένα της σκηνής που έχουν στο οπτικό τους πεδίο. Τα συστήματα αυτά διαθέτουν μια πηγή δομη-

17 2.2 Μονο-Στερεο-Πολυσκοπική όραση 17 μένου φωτισμού (structured lighting) [1] η οποία προβάλλει στη σκηνή ένα γνωστό μοτίβο και μετράει την παραμόρφωση αυτού όταν παρατηρείται από διαφορετική οπτική γωνία. Η πηγή αυτή μπορεί να χρησιμοποιεί μήκος κύματος που ανήκει στο ορατό πεδίο αλλά συνηθέστερα επιλέγεται το πεδίο των υπερύθρων. Χαρακτηριστικό παράδειγμα ενεργού συστήματος στερεοσκοπικής όρασης, που χρησιμοποιεί την τεχνολογία δομημένου φωτισμού για να υπολογίσει βάθος σκηνής ώστε να εντοπίσει τον χρήστη και τη πόζα του, είναι το Kinect της εταιρίας Microsoft. Σχήμα 7: Κάμερα τεχνολογίας ToF Άλλα, πιο εξελιγμένα συστήματα, εφαρμόζουν τη τεχνική του Time of Flight (ToF), στην οποία μετριέται η χρονική διάρκεια που κάνει για να επιστρέψει ένας παλμός φωτός ύστερα από ανάκλαση από κάποιο αντικείμενο της σκηνής. Τα ενεργά συστήματα τείνουν να εμφανίζουν καλύτερα αποτελέσματα από τα παθητικά, κυρίως σε θέματα ακρίβειας μέτρησης. Όπως όμως και τα MoCap συστήματα, απαιτούν λειτουργία σε ελεγχόμενο περιβάλλον, κυρίως εσωτερικού χώρου, χωρίς άμεσο φωτισμό προς το σύστημα ή τον χρήστη. Οι κάμερες αυτές επιτρέπουν μέτρηση βάθους σκηνής από μερικά μέτρα μέχρι μερικές δεκάδες μέτρα, διακριτικής ικανότητας 1cm και ταχύτητας λήψης 100fps (frames per second). Το υψηλό τους κόστος και η χαμηλή ανάλυση που προσφέρουν (μόλις 320x240 για εμπορικές εφαρμογές) είναι από τα βασικότερα μειονεκτήματά τους Παθητικά συστήματα Η αρχή λειτουργίας των παθητικών Σχήμα 8: Στέρεο κάμερα συστημάτων βασίζεται κυρίως στον τρόπο με τον οποίο λειτουργεί η ανθρώπινη όραση. Το περιβάλλον εμφανίζεται όπως θα το έβλεπε ένας άνθρωπος, πιθανώς με ισχυρότερο φωτισμό, αλλά ομοιόμορφο και όχι δομημένο, όπως στη προηγούμενη κατηγορία. Το σύστημα Bumblebee 2 που χρησιμοποιεί μία κάμερα εφαρμόζει τεχνικές MoCap ή ευριστικές, σύμφωνα με τις οποίες επιδιώκεται η οπτική προσαρμογή ενός γνωστού 3D μο-

18 2.2 Μονο-Στερεο-Πολυσκοπική όραση 18 ντέλου ώστε η 2D προβολή του να μοιάζει με την 2D εικόνα εισόδου. Το σύστημα που χρησιμοποιεί δύο κάμερες σε στερεοσκοπική διάταξη, προσεγγίζει περισσότερο την ανθρώπινη όραση και έχει αντίστοιχους περιορισμούς. Τέλος, το σύστημα πολλών καμερών επιτρέπει καλύτερη αντίληψη του 3Δ χώρου από διάφορες οπτικές γωνίες, περιορίζοντας όμως το περιβάλλον στη τομή των οπτικών πεδίων του συνόλου των καμερών Υβριδικά συστήματα Σχήμα 9: Συνδυασμός ToF και stereo Ο συνδυασμός ενός παθητικού με έναν ενεργό σύστημα, μας δίνει ένα υβριδικό σύστημα το οποίο συνδυάζει τα καλύτερα των δύο τεχνολογιών. Μια ToF κάμερα μπορεί να συνδυαστεί με μια στερεοσκοπική κάμερα [2] ενώ μια kinect συσκευή μπορεί να αξιοποιήσει τις δύο διαθέσιμες κάμερες ως παθητική διάταξη [3] καλύπτοντας έτσι αδυναμίες του ενεργού συστήματος. Η όλη κατασκευή είναι σαφώς ανώτερη σε δυνατότητες, ακρίβεια αλλά και σε κόστος και βάρος κατασκευής. Ένα βασικό πρόβλημα είναι η ένωση (fusion) της πληροφορίας βάθους που προσφέρει η ToF κάμερα και η στέρεο κάμερα, καθώς πρέπει για κάθε περιοχή της εικόνας βάθους να επιλεγεί η σωστή τιμή αυτού από τα δύο υποσυστήματα. Τα συστήματα αυτά θεωρούνται ως η ιδανική επιλογή για ρομποτικές εφαρμογές, καθώς επιτρέπουν στο σύστημα να έχει πλήρη αντίληψη του περιβάλλοντος χώρου, ώστε να μπορεί να δράσει ανάλογα Λογισμικά Δυστυχώς δεν υπάρχουν πολλές λύσεις υπό μορφή λογισμικού. Ο τομέας της αναγνώρισης και παρακολούθησης πόζας ήταν πάντοτε άμεσα συνδεδεμένος με την τεχνητή όραση, όμως ενθαρρυντικά αποτελέσματα άρχισαν να εμφανίζονται τα τελευταία χρόνια, με την θριαμβευτική είσοδο του kinect στην καταναλωτική αγορά. Αν και η κυκλοφορία του kinect χρονολογείται από το 2010, ελάχιστες κινήσεις έχουν γίνει για την δημιουργία συστημάτων εύρεσης πόζας και παρακολούθησης αυτής. Μεγάλο μέρος της έρευνας έχει αφοσιωθεί στην ερμηνεία της συμπεριφοράς του ανθρώπου και στη χρήση της αξιόπιστης εικόνας βάθους που

19 3 Διάρθρωση εργασίας 19 προσφέρει ένα σύστημα χαμηλού κόστους όπως το kinect. Σχήμα 10: Το λογισμικό Skeltrack του Joaquim Rocha Κατά τη διάρκεια της αναζήτησης πριν από τη συγγραφή της παρούσας εργασίας εντοπίστηκαν δύο πακέτα λογισμικού τα οποία κινούνται στο χώρο της αναγνώρισης πόζας βασιζόμενα σε πληροφορία χρώματος και βάθους. Το skeltrack του Joaquim Rocha link δημιουργεί τον άνω σκελετό του ανθρώπινου σώματος, βασιζόμενο σε μαθηματικές εξισώσεις και περιορισμούς (ακρότατα 3D μοντέλου, αναλογίες ανθρώπινων άκρων κτλ) και στην εικόνα βάθους που προσφέρει μια συσκευή τύπου kinect, εφόσον αυτή περιέχει μόνο το βάθος εντός της σιλουέτας του ανθρώπου. Επίσης, η βιβλιοθήκη Point Cloud Library - PCL link προσφέρει ένα υποσύστημα αναγνώρισης πόζας -παρόμοιο του kinect- το οποίο όμως απαιτεί τη χρήση κάρτας γραφικών με υποστήριξη CUDA. 3 Διάρθρωση εργασίας Στη παρούσα εργασία θα παρουσιάσουμε ένα παθητικό σύστημα στερεοσκοπικής όρασης με στοιχεία MoCap. Με το σύστημα αυτό γίνεται μια απόπειρα προσέγγισης της αποτελεσματικότητας εμπορικών συστημάτων, χρησιμοποιώντας εργαλεία ανοικτού κώδικα, με απώτερο στόχο τη δημιουργία ενός συστήματος ανοικτού επίσης κώδικα αλλά και χαμηλού τελικού κόστους. Στην ενότητα II θα αναφερθούμε εν συντομία στη κατασκευή της στερεοσκοπικής διάταξης που χρησιμοποιήθηκε για τις ανάγκες της παρούσας εργασίας. Περνώντας στην ενότητα III, όπου παρουσιάζεται η αρχιτεκτονική του συστήματος, θα εξετάσουμε πως λειτουργεί μια στερεοσκοπική διάταξη (κεφ.7 & 8) ώστε να υπολογιστεί το βάθος της σκηνής που αυτή παρατηρεί. Στη συνέχεια στα κεφάλαια 9, 10 και 11, θα παρουσιάσουμε τη διαδικασία που μπορεί να ακολουθήσει κανείς για να ερμηνεύσει τη πληροφορία χρώματος και βάθους που διαθέτει ώστε να ερμηνεύσει την πόζα οποιουδήποτε αντικειμένου ενδιαφέροντος στο χώρο. Τέλος στην ενότητα IV, αναγράφουμε επιμέρους και τελικά αποτελέσματα του συστήματος Άργος, όπως αυτό υλοποιήθηκε για τις ανάγκες της παρούσας εργασίας, καθώς επίσης και τα προβλήματα και περιορισμούς που συναντήσαμε, τόσο στο υλικό όσο και στο λογισμικό.

20 Μέρος II Διάταξη καμερών 20

21 4 Απαιτήσεις 21 4 Απαιτήσεις Ο σχεδιασμός ενός συστήματος εντοπισμού ανθρώπου και αναγνώρισης της πόζας του, βασιζόμενο σε δεδομένα RGB-D, απαιτεί τη χρήση μιας διάταξης ικανής να φέρει τουλάχιστον δύο διακριτές κάμερες, σε παράλληλη διάταξη. Η διάταξη αυτή θα πρέπει να είναι τέτοιας μορφής ώστε να επιτρέπει στη κατασκευή, σύμφωνα με τη θεωρία της στερεοσκοπικής όρασης, να υπολογίζει το βάθος της σκηνής (depth) και, σε συνδυασμό με την υπάρχουσα χρωματική πληροφορία RGB (red-greenblue), να παρέχει στο σύστημα Άργος πληροφορία RGB-depth (RGB- D). Η θεωρία της στερεοσκοπικής όρασης απαιτεί μια στερεοσκοπική κατασκευή (stereo rig) η οποία διατηρεί τις δύο κάμερες σε παράλληλη κάθετη ή οριζόντια διάταξη, με παράλληλες τις ευθείες που διέρχονται από τα κέντρα φακών και κέντρα προβολής των δυο καμερών. Στόχος του συστήματος Άργος είναι να προσεγγιστεί η λειτουργία ακριβών ή κλειστών συστημάτων με ανοικτό κώδικα και υλικά χαμηλού κόστους. Για το λόγο αυτό δε χρησιμοποιήθηκε έτοιμη κατασκευή στερεοσκοπικής κάμερας, με ή χωρίς προεπεξεργασία εικόνας μέσω DSP ή FPGA, καθώς μια τέτοια λύση κρίνεται ιδιαίτερα ακριβή για τους σκοπούς της παρούσας εργασίας. Αντί αυτού, επιλέχθηκαν κοινές κάμερες πρωτοκόλλου επικοινωνίας USB, οι οποίες τοποθετήθηκαν σε ένα κουτί αλουμινίου. 5 Κατασκευή 5.1 Κάμερες Χρησιμοποιήθηκαν 2 διακριτές USB κάμερες χαμηλού κόστους (<30 έκαστη) αλλά σχετικά υψηλών επιδόσεων της εταιρίας Sony, με όνομα προϊόντος Sony PS3 Eye. Οι συγκεκριμένες κάμερες έχουν σχεδιαστεί από την εταιρία SCEI για λογαριασμό της Sony για εφαρμογές τεχνητής όρασης στο σύστημα PlayStation 3 της ιδίας εταιρίας. Διαθέτουν φακούς χαμηλής παραμόρφωσης (radial distortion), εξοπλισμένους με φίλτρα IR για πιστή αναπαράσταση χρωμάτων και Σχήμα 11: PS3 Eye με οριζόντιο οπτικό εύρος (field of view-fov) 75. κάμερα της Sony Το οπτικό εύρος είναι μεγαλύτερο από αυτό των κοινών καμερών και θεωρείται απαραίτητο για εφαρμογές στερεοσκο-

22 5.2 Περίβλημα 22 πικής όρασης. Η κάμερα έχει σχεδιαστεί για εφαρμογές τεχνητής όρασης, μιας και αποτελεί συνοδευτικό του πακέτου PS3 move, με το οποίο ο χρήστης μπορεί να χρησιμοποιεί το χειριστήριό του στο 3Δ χώρο. Ο αισθητήρας OmniVision OV7720 εμφανίζει υψηλό SNR ακόμα και σε καταστάσεις χαμηλού φωτισμού. Λόγω πρωτοκόλλου επικοινωνίας USB 2.0 και αισθητήρα OmniVision, εξασφαλίζεται συμβατότητα με συστήματα WINDOWS και LINUX, ακόμα και με τους προκαθορισμένους οδηγούς συσκευής. 5.2 Περίβλημα Σχήμα 12: Η μπροστινή όψη της κάμερας που χρησιμοποιήθηκε κατά τη διάρκεια της εργασίας Για να μπορέσουν οι δύο ανεξάρτητες κάμερες να λειτουργήσουν στερεοσκοπικά, πρέπει να στερεωθούν μόνιμα σε παράλληλη διάταξη, χωρίς να υπάρχει η πιθανότητα σχετικής τους μετακίνησης. Για το λόγο αυτό υλοποιήθηκε μια πρόχειρη κατασκευή από αλουμίνιο, ικανή να διατηρήσει τις κάμερες σε παράλληλη θέση. Οφείλουμε να σημειώσουμε ότι η κατασκευή είναι πλήρως χειροποίητη ενώ για να πετύχουμε το καλύτερο δυνατό αποτέλεσμα θα έπρεπε να σχεδιαστεί μια πιο ανθεκτική κατασκευή και να κατασκευαστεί με τη βοήθεια μηχανουργικών μηχανημάτων υψηλής ακρίβειας. Η κατασκευή αποτέλεσε επίσης τον πρόγονο της νέας βελτιωμένης στερεοσκοπικής κάμερας με PS3 Eye που χρησιμοποιήθηκε στη ρομποτική πλατφόρμα Pandora για τις ανάγκες της ομάδας ρομποτικής του τμήματος Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Λόγω απαιτήσεων του λογισμικού Σχήμα 13: Μια πιο στιβαρή που θα αναφερθούν παρακάτω, οι κάμερες έπρεπε να τοποθετηθούν παράλληλα μεταξύ τους (παράλληλοι άξονες φακών), με την ελάχιστη δυνατή απόσταση που μπορούσε να επιτευχθεί. Οι αισθητήρες κατασκευή τοποθετή- τοποθετήθηκαν σε μια απόσταση 8.3εκ, ηθηκε οποία στοθεωρείται όχημα της ιδανική ομάδας για εφαρμογές μέτρησης βάθους σκηνής μέ- ρομποτικής PANDORA του ΑΠΘ

23 5.2 Περίβλημα 23 Σχήμα 14: Η μπροστινή όψη της κάμερας που χρησιμοποιήθηκε κατά τη διάρκεια της εργασίας τριας απόστασης. Η απόσταση των φακών ονομάζεται baseline της στερεοσκοπικής κάμερας και είναι γνωστή εκ κατασκευής ή μετράται αργότερα μέσω της διαδικασία της βαθμονόμησης (calibration). Εφόσον η κατασκευή δεν ακολουθεί βιομηχανικά πρότυπα, η ακριβής μέτρηση του baseline μέσω της διαδικασίας βαθμονόμησης θεωρείται απαραίτητη.

24 Μέρος III Αρχιτεκτονική του συστήματος 24

25 6 Απαιτήσεις 25 6 Απαιτήσεις Μέχρι αυτό το σημείο αναφερθήκαμε στις απαιτήσεις που έχει η διάταξη καμερών του συστήματος. Στο σημείο αυτό οφείλουμε να αναφέρουμε ορισμένες λειτουργικές απαιτήσεις του τμήματος του λογισμικού, ώστε να έχουμε μια πλήρη εποπτεία των απαιτήσεων αλλά και των δυνατοτήτων του συστήματος. Έτσι λοιπόν το σύστημα Άργος πρέπει να: μπορεί να υπολογίζει το βάθος σκηνής χρησιμοποιώντας τη στερεοσκοπική μέθοδο εντοπίζει την ύπαρξη ενός αντικειμένου ενδιαφέροντος, στη δική μας περίπτωση ενός ανθρώπινου χρήστη προτείνει μια πιθανή πόζα του αντικειμένου αυτού σε πραγματικές συντεταγμένες προσαρμόζει την πόζα αυτή στη κίνηση του αντικειμένου αξιολογεί την συμβατότητα της λύσης που προτείνει με την πραγματική σκηνή που δέχεται ως είσοδο βασίζεται σε βιβλιοθήκες ανοικτού κώδικα εκτελείται realtime ή near-realtime και να είναι παραλληλοποιήσιμο μπορεί να εκτελεστεί σε διαφορετικά περιβάλλοντα και λειτουργικά συστήματα είναι εύκολα προσαρμόσιμο στις εκάστοτε απαιτήσεις παρακολούθησης Λαμβάνοντας υπόψη τις παραπάνω λειτουργικές απαιτήσεις, θα γίνει μια απόπειρα σχεδίασης ενός ολοκληρωμένου συστήματος το οποίο αξιοποιεί τεχνικές όρασης υπολογιστών και σχεδίασης γραφικών, ώστε να επιτύχει το στόχο της αναγνώρισης της πόζας ενός ανθρώπου. 6.1 Γενική εικόνα του συστήματος Το σύστημα, που θα αναλυθεί στη συνέχεια, αποτελείται από τα ακόλουθα τμήματα: Η διαδικασία λειτουργίας που λαμβάνει χώρα, αποτελείται από τα ακόλουθα βήματα. Αρχικά λαμβάνεται μια στερεοσκοπική

26 6.1 Γενική εικόνα του συστήματος 26 Σχήμα 15: Λειτουργικά τμήματα του συστήματος Άργος εικόνα σαν είσοδος στο σύστημα. Η εικόνα αναλύεται και εντοπίζεται ο ενεργός χρήστης και το βάθος σκηνής που ανήκει σε αυτόν. Σε συνεργασία με τον μοντελοποιητή, το σύστημα αναζητά λύσεις για την εύρεση της πόζας του ανθρώπου. Ο μοντελοποιητής επικοινωνεί με τον renderer, ο οποίος εκτελεί εντολές δημιουργίας 3D μοντέλων στη κάρτα γραφικών. Η λογική του συστήματος είναι υλοποιημένη σε C++ και χρησιμοποιεί τη βιβλιοθήκη OpenCV. Οι λειτουργίες του συστήματος που θα παρουσιαστούν στη συνέχεια εμφανίζονται σε μορφή διαγράμματος ροής στο σχήμα 16. Σχήμα 16: Διάγραμμα ροής του τμήματος λογικής του Άργος.

27 7 Λήψη εικόνας και βάθους σκηνής 27 7 Λήψη εικόνας και βάθους σκηνής Το σύστημα Άργος χρησιμοποιεί οπτική πληροφορία η οποία αποτελείται από έγχρωμες συνεχόμενες λήψεις της επιθυμητής σκηνής (εικονοροή) από δύο διαφορετικές θέσεις του χώρου (στερεοσκοπική όραση). Η διαδικασία αυτή δεν είναι ικανή από μόνη της να παράγει την επιπλέον πληροφορία βάθους σκηνής που απαιτεί το σύστημα, στο οποίο επιλέξαμε να χρησιμοποιήσουμε μια στερεοσκοπική διάταξη. Μια τέτοιου είδους πληροφορία απαιτεί αφενός τη βαθμονόμηση της διάταξης καμερών, ώστε να γνωρίζουμε τις εσωτερικές και εξωτερικές παραμέτρους της διάταξης, και αφετέρου την χρήση ειδικών αλγορίθμων στερεοσκοπίας που εμφανίζουν χαρακτηριστικά λειτουργίας παρόμοια με αυτά της ανθρώπινης όρασης. Το πακέτο βιβλιοθηκών που επιλέχθηκε για χρήση στο τμήμα της επεξεργασίας εικόνας του συστήματος είναι η OpenCV [4], ένα ευρέως γνωστό API για εφαρμογές τεχνητής όρασης, με πλούσιες δυνατότητες, ενεργή κοινότητα και πολλά υποσχόμενη μελλοντική εξέλιξη. Προσφέρεται σε ποικίλα λειτουργικά συστήματα και γλώσσες προγραμματισμού, διατίθεται και σε εκδόσεις φορητών λειτουργικών συστημάτων (πχ android) ενώ κινείται προς τα πεδία της παράλληλης επεξεργασίας δεδομένων πολλών πυρήνων, μέσω της βιβλιοθήκης TBB (Thread Building Blocks) της Intel. 7.1 Βαθμονόμηση διάταξης (Calibration) Θεωρία βαθμονόμησης Όπως θα αντιληφθούμε καλύτερα στη συνέχεια, για να μπορέσουμε να υπολογίσουμε το βάθος της σκηνής, πρέπει να γνωρίζουμε τις ενδογενείς και εξωγενείς παραμέτρους τις κάμερας. Το μοντέλο της κάμερας που χρησιμοποιούμε είναι το γνωστό και ως pinhole μοντέλο κάμερας ή κάμερα οπής (pinhole camera) και εκφράζεται μαθηματικά ως: u v = 1 } {{ } συντεταγμένες εικόνας f x 0 c x 0 f y c y } {{ } εστιακή απόσταση & κέντρο προβολής (ενδογενείς) r 11 r 12 r 13 t 1 r 21 r 22 r 23 t 2 r 31 r 32 r 33 t 3 } {{ } μεταφορά & περιστροφή (εξωγενείς) X Y Z 1 } {{ } συντεταγμένες 3Δ

28 7.1 Βαθμονόμηση διάταξης (Calibration) 28 Το μοντέλο αυτό είναι ιδιαίτερα διαδεδομένο χάρη στην απλότητά του αλλά και το επίπεδο απόδοσης της λειτουργίας μιας πραγματικής κάμερας που αυτό προσφέρει. Με τον όρο ενδογενείς παράμετροι (intrinsic parameters) εννοούμε το σύνολο των αριθμητικών παραμέτρων που χαρακτηρίζουν μεγέθη μίας κάμερας και οφείλονται σε χαρακτηριστικά της κατασκευής της ή αναπόφευκτες ατέλειες, γνωστών και ως εσωτερικές παράμετροι της κάμερας. Οι παράμετροι αυτοί περιλαμβάνουν το κέντρο προβολής, την εστιακή απόσταση (focal length) και τις παραμορφώσεις του φακού. Οι παραμορφώσεις εκφράζονται με μαθηματικό τρόπο ως: Οι παραμορφώσεις αυτές είναι αποτέλεσμα των ατελειών κατασκευής. Εμφανίζονται στο καρέ ως βαρελοειδής παραμορφώσεις και στρεβλώσεις (skew). Οι παραμορφώσεις αυτές παραποιούν τη πραγματική θέση των αντικειμένων με σημείο αναφοράς τη κάμερα και αλλοιώνουν τα ευθύγραμμα τμήματα (σχήμα 17). Με τον όρο εξωγενείς παράμετροι (extrinsic parameters) εννοούμε το σύνολο των αριθμητικών παραμέτρων που χαρακτηρίζουν τη μετατόπιση και περιστροφή της στέρεο-κάμερας ως προς την σκηνή που παρατηρεί ή αντίστροφα τη μεταφορά της σκηνής σε 3Δ συντεταγμένες στέρεο-κάμερας. Συγκεκριμένα περιλαμβάνονται οι πίνακες: R:περιστροφή ανάμεσα στα συστήματα συντεταγμένων των 2 καμερών T:μεταφορά ανάμεσα στα συστήματα συντεταγμένων των 2 καμερών R1:μετασχηματισμός ανόρθωσης για την 1η κάμερα R2:μετασχηματισμός ανόρθωσης για τη 2η κάμερα P1:ανορθωμένος πίνακας προβολής 1ης κάμερας

29 7.1 Βαθμονόμηση διάταξης (Calibration) 29 P2:ανορθωμένος πίνακας προβολής 1ης κάμερας Q:πίνακας αντιστοίχισης διασποράς-βάθους (disparity-depth) Σχήμα 17: Βαρελοειδής παραμόρφωση και στρέβλωση Η χρησιμότητα των παραπάνω παραμέτρων θα φανεί στη συνέχεια, όπου παρουσιάζεται η διαδικασία υπολογισμού του βάθους σκηνής από δύο στερεοσκοπικές λήψεις (κεφ. 8.2). Τα αποτελέσματα της βαθμονόμησης της δικής μας κατασκευής αναγράφονται στο κεφάλαιο Διαδικασία βαθμονόμησης Για τη βαθμονόμηση της στερεοσκοπικής διάταξης, χρησιμοποιήθηκε η μέθοδος του Zhengyou Zhang, 1999 [5], σύμφωνα με την οποία χρησιμοποιείται ένα μοτίβο ομοεπίπεδων γεωμετρικών σχημάτων γνωστής μορφής και μεγέθους. Το πακέτο αλγορίθμων που χρησιμοποιήθηκε, διέθετε μοτίβα σκακιέρας, συμμετρικών και μη συμμετρικών κύκλων. Σχήμα 18: Μοτίβο σκακιέρας, συμμετρικών και μη-συμμετρικών κύκλων Ύστερα από δοκιμές, αποδείχθηκε ότι το μοτίβο μη-συμμετρικών κύκλων παρουσιάζει καλύτερα αποτελέσματα για τη βαθμονόμηση της στερεοσκοπικής διάταξης, μέσω του πακέτου αλγορίθμων τεχνητής όρασης που χρησιμοποιήθηκαν. Το φαινόμενο αυτό οφείλεται πιθανότατα

30 7.1 Βαθμονόμηση διάταξης (Calibration) 30 στη φύση του σχήματος, η οποία όντας κυκλική επιτρέπει τον ακριβέστερο προσδιορισμό των σημείων του μοτίβου, σε αντίθεση με τις γωνίες της σκακιέρας, οι οποίες τείνουν να παραμορφώνονται. Η αξιολόγηση έγινε λαμβάνοντας υπόψην το μέσο τετραγωνικό σφάλμα, το οπτικό αποτέλεσμα των ανορθωμένων εικόνων καθώς και τη ποιότητα της εικόνας διασποράς που προκύπτει στη συνέχεια. Η βαθμονόμηση της διάταξης έγινε με τη διάταξη σταθερή σε οριζόντια επιφάνεια, ενώ μετακινούσαμε το μοτίβο σε διαφορετικές θέσεις και προσανατολισμούς, προσέχοντας να βρίσκεται σχετικά κοντά στη διάταξη και να καλύπτει όλο το οπτικό πεδίο της κάμερας. Για βέλτιστα αποτελέσματα, επιλέξαμε να βαθμονομήσουμε πρώτα την κάθε κάμερα ξεχωριστά, ώστε να υπολογισθούν οι ενδογενείς παράμετροι, και ύστερα τη στερεοσκοπική διάταξη των 2 καμερών, ώστε να υπολογισθούν οι εξωγενείς παράμετροι. Το μέσο τετραγωνικό σφάλμα που αναφέρθηκε από τον αλγόριθμο ήταν περίπου 0.3 pixel. Οφείλουμε να σημειώσουμε ότι η βαθμονόμηση της διάταξης ορίζει τα μεγέθη που προκύπτουν από τον υπολογισμό του βάθους σκηνής. Ορίζοντας ως απόσταση κύκλου από κύκλο ίση με 17.5mm, το αποτέλεσμα του υπολογισμού του βάθους σκηνής θα είναι σε mm. Έτσι, αν ο χρήστης στέκεται στα 2.5m, το σύστημα θα εμφανίσει αριθμό Η ακρίβεια αυτή υπερκαλύπτει τις ανάγκες του συστήματος. Εκτός από τη χρήση γνωστών μοτίβων, μπορούμε να εκτελέσουμε βαθμονόμηση χρησιμοποιώντας πραγματικά πλάνα, στα οποία παρατηρούμε σημεία που ξεχωρίζουν και μετράμε τη σχετική και απόλυτη κίνησή τους. Με το τρόπο αυτό μπορούμε να αποκτήσουμε τις εσωτερικές και εξωτερικές παραμέτρους χωρίς να μπούμε στη διαδικασία της ελεγχόμενης βαθμονόμησης. Η διαδικασία αυτή θεωρείται ότι κινείται εκτός των ορίων της παρούσας εργασίας, γιαυτό και αναφέρεται μόνο εγκυκλοπαιδικά.

31 8 Υπολογισμός βάθους σκηνής 31 8 Υπολογισμός βάθους σκηνής Ως απαραίτητο στάδιο πριν τη λειτουργία του συστήματος, εμφανίζεται ο υπολογισμός του βάθους της σκηνής. Η πληροφορία αυτή, σε συνδυασμό με την χρωματική πληροφορία, θα συνθέσουν τα δεδομένα RGB-D. 8.1 Θεωρία επιπολικής γεωμετρίας Επιπολική γεωμετρία ονομάζεται η γεωμετρία της στερεοσκοπικής όρασης. Πρόκειται για τη γεωμετρία που εκφράζει μια σκηνή η οποία παρατηρείται από δύο κάμερες, τοποθετημένες σε διαφορετικές γωνίες λήψης ή πιο απλά για την ίδια κάμερα μετατοπισμένη σε διαφορετικές οπτικές γωνίες. Σχήμα 19: Επιπολική γεωμετρία Σχήμα 20: Το pinhole μοντέλο που είναι ευρέως αποδεκτό Όπως μπορεί πολύ εύκολα να αντιληφθεί κανείς, ένα σημείο που προβάλλεται στον αισθητήρα μιας κάμερας δεν μπορεί να αντιστοιχηθεί στη συνέχεια σε ένα σημείο 3Δ του χώρου. Το φαινόμενο αυτό οφείλεται στη προβολή αυτή καθαυτή, καθώς εκτελείται ο μετασχηματισμός 2Δ σε 3Δ, με την αντίστοιχη απώλεια πληροφορίας βάθους. Αν λοιπόν θεωρήσουμε ένα σημείο του χώρου P(Χ,Υ,Ζ), τότε η προβολή του στον αισθητήρα της κάμερας (και άρα οι 2Δ συντεταγμένες του στην εικόνα)στην απλοποιημένη μορφή

32 8.2 Διαθέσιμοι αλγόριθμοι 32 της θα προκύπτει από: ( x y ) = f Z ( X Y ) Η μόνη πληροφορία που μπορεί να προκύψει είναι ο υπολογισμός της ημιευθείας πάνω στην οποία βρίσκεται το εν λόγω σημείο, ημιευθείας που ξεκινάει από το κέντρο προβολής της κάμερας και εκτείνεται απομακρυνόμενη από την κάμερα, όπως φαίνεται στο Σχήμα 19. Συνεπώς, αν διαθέτουμε δεύτερη κάμερα σε διαφορετικό σημείο του χώρου, που καλύπτει την ίδια σκηνή, μπορούμε, μέσω τριγωνομετρίας, να υπολογίσουμε τις ακριβείς 3Δ συντεταγμένες του σημείου, εφόσον φυσικά γνωρίζουμε την αντιστοίχηση των σημείων της μιας κάμερας στα σημεία της άλλης (x 1 = x 2 + disparity(x)). x 1 = f Z X 1, x 2 = f Z X 2, f affine : P 1 P 2 Η επίλυση του προβλήματος είναι απλή υπόθεση καθώς χρειάζεται να επιλύσουμε ένα σύστημα τριών εξισώσεων με τρεις αγνώστους. Ως δεδομένα έχουμε την θέση του pixel στο καρέ της κάθε κάμερας, καθώς και το μετασχηματισμό affine ανάμεσα στα συστήματα συντεταγμένων των δυο καμερών. Η αντιστοίχηση των pixel σε επίπεδο καρέ γίνεται μέσω των αλγορίθμων που θα εξετάσουμε στη συνέχεια. 8.2 Διαθέσιμοι αλγόριθμοι Το πακέτο αλγορίθμων που επιλέξαμε να χρησιμοποιήσουμε για τις ανάγκες τις εργασίας, διαθέτει τους ακόλουθους αλγόριθμους αντιστοίχησης σημείων στερεοσκοπικής κάμερας: StereoVar: Stereo Variational. Τροποποιημένος αλγόριθμος του S. G. Kosov [6] StereoΒΜ: Stereo Block Matching. Αλγόριθμος ο οποίος αναζητά την αντιστοίχηση κάθε pixel της λήψης μιας κάμερας στην άλλη κάμερα, χρησιμοποιώντας μια τετράγωνη περιοχή γύρω από το pixel, για να εκτιμήσει που ανήκει στη λήψη της 2ης κάμερας, βασιζόμενος στην εντροπία της περιοχής αυτής. StereoSGΒΜ: Stereo Semi-Global Block Matching. Τροποποιημένος αλγόριθμος του H. Hirschmuller [7]. Βασίζεται στον StereoBM αλγόριθμο. Αναζητά συσχέτιση βάθους σε γειτονικά pixel στις τέσσερις ή οκτώ διευθύνσεις.

33 8.2 Διαθέσιμοι αλγόριθμοι 33 Όπως έχουμε ήδη αναφέρει, οι παραπάνω αλγόριθμοι ψάχνουν την αντιστοιχία του κάθε pixel της μιας κάμερας στα pixel της άλλης. Για να μειωθεί η πολυπλοκότητα της διαδικασίας, η αναζήτηση γίνεται μόνο κατά τη μία διάσταση της λήψης. Στη συγκεκριμένη περίπτωση που κάνουμε λόγο για στερεοσκοπική κάμερα οριζόντιας διάταξης, η αναζήτηση γίνεται στον οριζόντιο άξονα. Για το λόγο αυτό χρειαζόμαστε τους προαναφερθέντες πίνακες R1 και R2, οι οποίοι ανορθώνουν την εικόνα, επιτρέποντας αυτή τη μείωση διαστάσεων του χώρου αναζήτησης. Σχήμα 21: Τα αποτελέσματα των αλγορίθμων var, bm και sgbm αντίστοιχα για μια δεδομένη σκηνή σε colormap jet παλέτα Ο πιο διαδεδομένος αλγόριθμος είναι ο Stereo Block Matching. Πρόκειται για τον πιο απλοϊκό αλγόριθμο ως προς τη πολυπλοκότητα αλλά και τη σύλληψή του. Η διαδικασία αναζήτησης αντιστοίχησης τμημάτων (block) των εικόνων σημαίνει ότι ο αλγόριθμος βασίζεται ιδιαίτερα στις ακμές και τις έντονες χρωματικές αλλαγές των δύο λήψεων. Για το λόγο αυτό, ο συγκεκριμένος αλγόριθμος αποτυγχάνει πολλές φορές να αποδώσει το βάθος σε τμήματα ενός αντικειμένου που είναι ομοιογενούς υφής. Το πρόβλημα αυτό έρχεται να αντιμετωπίσει ο SGBM, ο οποίος καλύπτει αυτή την αδυναμία, αναζητώντας πληροφορία βάθους στα γειτονικά 4 ή 8 pixel της εικόνας, δίνοντας έτσι μια μέτρηση βάθους με λιγότερα κενά από τον απλό BM. Ο αλγόριθμος της OpenCV επιστρέφει έναν πίνακα διασποράς 16bit, πολλαπλασιασμένο με έναν παράγοντα x16. Για λόγους οπτικοποίησης, προσαρμόζουμε την εικόνα στις αποχρώσεις του γκρι [0,255] και εφαρμόζουμε την παλέτα colormap jet¹. Λόγω της φύσεως του προβλήματος, θα θέλαμε οι αλγόριθμοι αυτοί να εκτελούνται σε πραγματικό χρόνο. Πράγματι, ο ΒΜ είναι πλήρως ¹Η παλέτα colormap jet αντιστοιχεί αποχρώσεις του γκρι σε μια παλέτα θερμώνψυχρών χρωμάτων. Τα θερμότερα pixels βρίσκονται πιο κοντά από τα ψυχρότερα

34 8.2 Διαθέσιμοι αλγόριθμοι 34 παραλληλοποιήσιμος και ιδανικός για συστήματα παράλληλης επεξεργασίας όπως κάρτες γραφικών, FPGA κτλ. Αντιθέτως ο SGBM είναι μερικώς παραλληλοποιήσιμος. Τα περισσότερα ολοκληρωμένα συστήματα που κυκλοφορούν για βιομηχανικές εφαρμογές στερεοσκοπικής όρασης, κυρίως για λόγους ελέγχου της γραμμής παραγωγής, φέρουν μικροεπεξεργαστή που εκτελεί αλγορίθμους τύπου BM, πλήρως παραλληλοποιημένους. Σχήμα 22: Παράδειγμα διασποράς του ζεύγους εικόνων Tsukuba. Κάτω δεξιά είναι το ground truth. Η έξοδος των αλγορίθμων είναι ένα μέγεθος που ονομάζεται διασπορά (disparity) και εκφράζει την οριζόντια μετατόπιση της προβολής ενός σημείου του 3Δ χώρου στις δύο κάμερες. Εξορισμού, η μετατόπιση αυτή ξεκινάει από μηδενική (σημείο στο άπειρο) και φτάνει το πολύ μέχρι την οριζόντια ανάλυση της κάμερας. Οι αλγόριθμοι συνήθως σημειώνουν με μηδενική διασπορά τα σημεία των οποίων η διασπορά δε μπορεί να υπολογιστεί. Στα παθητικά συστήματα στερεοσκοπικής όρασης, τέτοια σημεία είναι συνήθως σημεία επιφανειών με ομοιογενή υφή (πχ τοίχοι, ουρανός κτλ). Το Σχήμα 22 δείχνει ένα παράδειγμα διασποράς, το οποίο έχει μετατραπεί σε εικόνα αποχρώσεων του γκρι. Η διασπορά μπορεί στη συνέχεια να μετατραπεί σε βάθος σκηνής, χρησιμοποιώντας τον πίνακα αντιστοίχισης διασποράς-βάθους Q μέσω της ακόλουθης εξίσωσης:

35 8.3 Εικόνα διασποράς 35 [X Y Z W ] T } {{ } 3Δ συντεταγμένες = Q [x y disparity(x, y) } {{ } διασπορά του pixel(x,y) Το σύνολο των σημείων που προκύπτουν από τον παραπάνω μετασχηματισμό ονομάζεται νέφος σημείων (point cloud) [8]. Μπορούμε να φανταστούμε το νέφος σημείων ως το σύνολο των κορυφών ενός 3Δ αντικειμένου, όταν από αυτό αφαιρέσουμε επιφάνειες και ακμές. Οφείλουμε να σημειώσουμε ότι δουλεύουμε με ομογενείς συντεταγμένες (homogenous coordinates) ώστε να μπορούμε να εκτελέσουμε μετασχηματισμούς Affine² (Affine transformations) με άλγεβρα πινάκων. 8.3 Εικόνα διασποράς Όπως αναφέραμε προηγουμένως, η εικόνα διασποράς εκφράζει την απόσταση σε pixel των προβολών ενός σημείου στο χώρο πάνω στις δύο κάμερες. Από μόνη της αυτή η πληροφορία δεν αποτελεί πληροφορία βάθους, καθώς το βάθος εξαρτάται -εκτός από τη διασπορά- και από τις 2D συντεταγμένες του σημείου στο καρέ. Τα σημεία που εμφανίζουν μηδενική διασπορά -τα μαύρα pixel στην εικόνα διασποράς- θεωρούνται ότι είτε βρίσκονται στο άπειρο -οπότε η προβολή τους στις δύο κάμερες δεν αλλάζει- είτε ο αλγόριθμος δε μπόρεσε να αποφανθεί για την αντιστοίχησή τους ανάμεσα στις δύο κάμερες. Συνήθως αντιμετωπίζουμε τα σημεία αυτά ως θόρυβο. Το φαινόμενο αυτό γίνεται αισθητό όταν παρατηρούμε μια σκηνή στην οποία το πάτωμα είναι παράλληλο με την κάμερα αλλά η τελευταία βρίσκεται μακριά από αυτό, όπως φαίνεται στο σχήμα 23. Λόγω προοπτικής προβολής, η μεταβολή της διασποράς δεν θα είναι απότομη στη περιοχή του πατώματος, όπως θα περίμενε κανείς, αλλά σταδιακή υπό μορφή ράμπας. Η συμπεριφορά αυτή είναι σημαντική και προκαλεί προβλήματα στην αποκοπή του χρήστη, μιας και ένας region growing αλγόριθμος θα συμπεριλάβει και το έδαφος καθώς εκτελείται. Αν όμως επιλέξουμε σαν είσοδο του αλγορίθμου το νέφος σημείων που αντιστοιχεί στην εικόνα διασποράς, η κατάσταση βελτιώνεται. ²Ως μετασχηματισμός Affine ορίζεται ο συνδυασμός μεταφοράς και περιστροφής ενός σημείου στο χώρο. 1] T

36 9 Εντοπισμός και αποκοπή χρήστη 36 Σχήμα 23: Δείγμα διασποράς όπως επιστρέφεται και η 3D απεικόνισή του. Είναι εμφανής η κλίση που δίνεται στο πάτωμα. 9 Εντοπισμός και αποκοπή χρήστη Το σύστημα Άργος δημιουργήθηκε για να αναγνωρίζει τον άνθρωπο ως χρήστη του, χωρίς βέβαια αυτό να αποτελεί κανόνα αλλά μια απλή παραδοχή σχεδίασης. Για να μπορέσει το σύστημα να απαλλαγεί από τη περιττή πληροφορία της σκηνής του οπτικού πεδίου της κάμερας, πρέπει να εντοπίσει και να αποκόψει τον πιθανό άνθρωπο-χρήστη. Η διαδικασία συνοψίζεται στο σχήμα 24. Σχήμα 24: Διάγραμμα ροής εντοπισμού χρήστη Αποκοπή δεν εκτελείται υπό μορφή αφαίρεσης της περιττής πληροφορίας και διατήρησης της σιλουέτας του ανθρώπου, το οποίο θα ήταν ιδανικό. Αντί αυτού, επιλέγουμε ουσιαστικά ένα τμήμα της εικόνας στο οποίο πιστεύουμε ότι έχουμε εντοπίσει το χρήστη και το οποίο τον περιέχει ολοκληρωτικά. Με τον τρόπο αυτό αφενός μειώνουμε την επίδραση της σκηνής στον αλγόριθμο εύρεσης πόζας και αφετέρου μειώνουμε την πολυπλοκότητα υπολογισμού του βάθους σκηνής. Η διαδικασία αυτή μας προκαλεί πρόβλημα στη περίπτωση που θέλουμε να εντοπίσουμε το χρήστη χρησιμοποιώντας και την πληροφορία βάθους,

37 9 Εντοπισμός και αποκοπή χρήστη 37 όπως θα αναφέρουμε στη συνέχεια. Ένα δείγμα του αποτελέσματος της διαδικασίας εντοπισμού και αποκοπής χρήστη φαίνεται στο σχήμα 25. Σχήμα 25: Το τελικό αποτέλεσμα με τον εντοπισμένο χρήστη και την εικόνα διασποράς που του αντιστοιχεί. Οι markers έχουν εντοπιστεί επιτυχώς.

38 9.1 Εντοπισμός ανθρώπων Εντοπισμός ανθρώπων Η μέθοδος που επιλέχθηκε είναι να εντοπιστούν αρχικά οι παρόντες άνθρωποι στο οπτικό πεδίο της στερεοσκοπικής διάταξης, με χρήση του αλγορίθμου Ιστογράμματος Προσανατολισμένων Παραγώγων (Histogram of Oriented Gradients) [9]. O HOG είναι μέλος της οικογένειας των περι- Σχήμα 26: Παράδειγμα προσανατολισμένων παραγώγων εικόνας γραφέων χαρακτηριστικών (feature descriptors) βασισμένων σε ταξινομητές SVM (Support Vector Machines). Ως εκ τούτου, έχει εκπαιδευτεί για να αναγνωρίζει συγκεκριμένα αντικείμενα, όχι απαραίτητα ανθρώπους, αν και βρίσκει συχνή εφαρμογή σε συστήματα ασφάλειας που πρέπει να αναγνωρίζουν πεζούς. Η αρχή λειτουργίας του βασίζεται στην εξαγωγή του ιστογράμματος των παραγώγων φωτεινότητας της εικόνας που μας ενδιαφέρει. Οι παράγωγοι αυτοί διαθέτουν μέτρο και κατεύθυνση (εξού και το όνομα) και στην ουσία αποτελούν περιγραφή του σχήματος μιας εικόνας με έντονες ακμές. Χωρίζοντας την παραπάνω έκφραση πληροφορίας σε μικρότερα τμήματα, τα λεγόμενα κελιά (cells), μπορεί να αποφανθεί για τη φύση του ιστογράμματος αυτών μέσω του εκπαιδευμένου SVM. Ως εκ τούτου, διαθέτει μια σχετική ανοχή σε γεωμετρικούς και φωτομετρικούς μετασχηματισμούς, εκτός του μετασχηματισμού που εκφράζει τον προσανατολισμό του αντικειμένου. Το πακέτο αλγορίθμων που επιλέχθηκε να χρησιμοποιηθεί, διαθέτει εκπαιδευμένο HOG αλγόριθμο για ανθρώπους, ο οποίος επιτυγχάνει αναγνώριση μόνο όταν ο άνθρωπος κοιτάει προς ή μακριά από τη κάμερα. Ο αλγόριθμος επιστρέφει τους εντοπισμένους ανθρώπους υπό μορφή τετραγώνων στην εικόνα, όπως φαίνεται

39 9.2 Εντοπισμός χρήστη 39 στο παράδειγμα του σχήματος 27. Όπως και με κάθε ταξινομητή τύπου SVM, υπάρχουν και false positive αποτελέσματα. Σχήμα 27: Παράδειγμα εντοπισμού ανθρώπων με HOG. Ο αλγόριθμος επιστρέφει τα τετράγωνα εντοπισμού. Η μέθοδος εντοπισμού με HOG δεν περιορίζεται αποκλειστικά και μόνο στον εντοπισμό ανθρώπων. Μια κατάλληλη εκπαίδευση του περιγραφέα μπορεί να εντοπίσει άλλες οντότητες, έμβιες και μη. Μάλιστα το HOG δεν αναφέρεται απαραίτητα στην φωτεινότητα της σκηνής ή σε κάποιο μέγεθος χρωματικότητας. Όπως φαίνεται και από την εργασία των Spinello και Arras People Detection in RGB-D Data [10], μπορούμε να εκπαιδεύσουμε έναν descriptor ώστε να εντοπίζει ανθρώπους βάσει του ιστογράμματος βάθους των, δημιουργώντας τη μέθοδο HOD (Histogram of Oriented Depths). 9.2 Εντοπισμός χρήστη Στο σημείο αυτό κάναμε μια παραδοχή, η οποία απλοποιεί κατά πολύ το σύστημα που σχεδιάζουμε. Θεωρούμε ότι, αν και οι άνθρωποι που εντοπίστηκαν στο κάδρο μπορεί να είναι περισσότεροι του ενός (ανάμεσα στους οποίους και false-positives υποψήφιων χρηστών), μπορεί να υπάρχει μόνο ένας ενεργός χρήστης του συστήματος. Αυτό φυ-

40 9.2 Εντοπισμός χρήστη 40 σικά μπορεί πολύ εύκολα να αλλάξει, αλλά αυξάνει τη πολυπλοκότητα του συστήματος. Συνεπώς, πρέπει το σύστημα να επιλέξει με κάποιο τρόπο ποιος από τους εντοπισμένους ανθρώπους του αλγορίθμου HOG είναι ο χρήστης. Κάθε εντοπισμένος άνθρωπος λαμβάνει ένα σκορ. Το σκορ αυτό υπολογίζεται με την ακόλουθη φόρμουλα: score = distance(head_center, body_center) body_height head_height skin_pixels head_pixels Όπως είναι εμφανές, οι εντοπισμένοι άνθρωποι που λαμβάνουν το μεγαλύτερο σκορ, διαθέτουν τα παρακάτω χαρακτηριστικά: Διαθέτει πρόσωπο που έχει εντοπιστεί Το πρόσωπο εμφανίζει pixels στο χρώμα του δέρματος Το πρόσωπο βρίσκεται μακριά από το κέντρο του εντοπισμένου ανθρώπου, όπως συμβαίνει και στη πραγματικότητα Έχουν εντοπιστεί markers στα χέρια του ανθρώπου Είναι εμφανές ότι εντοπισμένοι άνθρωποι που δεν διαθέτουν τα παραπάνω χαρακτηριστικά, οι οποίοι θα μπορούσαν να είναι false positives, λαμβάνουν μηδενικό σκορ. Στη συνέχεια, επιλέγεται για χρήστης ο άνθρωπος που θα επιστρέψει το υψηλότερο ακόλουθο αριθμό: Εντοπισμός προσώπου Σχήμα 28: Εντοπισμός προσώπου στη Lena final_score = body a rea (1 + score) Ο εντοπισμός του προσώπου γίνεται με προεκπαιδευμένο cascade classifier ένα συνδυασμό δηλαδή ταξινομητών, οι οποίοι βασίζονται σε Haar-Like Χαρακτηριστικά [11]. Η έξοδος του πρώτου ταξινομητή του ταξινομητή καταρράκτη οδηγείται στον δεύτερο, του δεύτερου στον τρίτο κοκ, εξού και το όνομα. Τα Haar-Like χαρακτηριστικά κωδικοποιούν την ύπαρξη και θέση προσανατολισμένων αντιθέσεων των περιοχών μιας εικόνας. Τα χαρακτηριστικά αυτά μπορούν να χρησιμοποιηθούν για να εκφράσουν τα χαρακτηριστικά του ανθρώπινου προσώπου και τις χωρικές μεταξύ τους θέσεις. Το όνομά του προέρχεται από το γεγονός ότι υπολογίζονται με παρόμοιο τρόπο με αυτό των συντελεστών του μετασχηματισμού παλμοσειράς Haar.

41 9.2 Εντοπισμός χρήστη Εντοπισμός δέρματος Σχήμα 29: Η κατανομή απόχρωσης δέρματος στο χρωματοχώρο YCrCb για αναγνώριση δέρματος ήταν: Ο εντοπισμός δέρματος είναι ένα ιδιαίτερο πρόβλημα από μόνο του. Υπάρχουν αναρίθμητες εργασίες και έρευνες σχετικές με το θέμα του εντοπισμού του δέρματος σε διαφορετικούς φωτισμούς και χρωματοχώρους (colorspaces). Στη παρούσα εργασία, η αναγνώριση δέρματος δεν αποτελεί ιδιαίτερα απαραίτητη πληροφορία αλλά κυρίως επικουρική. Συμβουλευόμενοι την εργασία Skin Detection - a Short Tutorial [12], επιλέξαμε την απλή μέθοδο αναγνώρισης δέρματος βάσει των τιμών του στο χρωματοχώρο YCrCb. Το κατόφλι που ορίσαμε (60, 130, 80) < pixel_y CrCb < (255, 170, 125) Εντοπισμός markers Σχήμα 30: Οι markers είναι χρώματος πράσινου και κόκκινου και φοριούνται στους καρπούς των χεριών. Ένας από τους στόχους του συστήματος είναι η ελάχιστη δυνατή χρήση σημαδιών (markers) στα διάφορα σημεία του σώματος. Εντούτοις, το σύστημα απαιτεί τη χρήση markers στα χέρια, καθώς αυτά έχουν την τάση να κινούνται σε μεγάλο βαθμό και ανεξάρτητα από το υπόλοιπο σώμα. Η ύπαρξη λοιπόν περικάρπιων στα χέρια του χρήστη, χρωμάτων που ξεχωρίζουν, μας επιτρέπει να εντοπίσουμε και να παρακολουθήσουμε την κίνησή τους στον 2Δ χώρο, με χρήση του αλγορίθμου CamShift [13]. Καθώς όμως το κέντρο του εντοπισμένου marker εμφανίζει άτακτη κίνηση (λόγω θορύβου αισθητήρα, διαφορετικού φωτισμού, επικάλυψής του από άλλα μέρη του σώματος) θα χρειαστεί να εφαρμόσουμε ένα φίλτρο Kalman [14], το οποίο θα αναλάβει αφενός να μειώσει την άτακτη αυτή κίνηση και αφετέρου να προβλέψει κατά κάποιο τρόπο την

42 9.2 Εντοπισμός χρήστη 42 κίνηση του marker στη περίπτωση επικάλυψης. Ο αλγόριθμος CamShift πρόκειται για έναν αλγόριθμο παρακολούθησης της κίνησης ενός αντικειμένου, βασιζόμενος στο ιστόγραμμα αυτού. Εσωτερικά αξιοποιεί τον αλγόριθμο Meanshift [15] Το ιστόγραμμα μπορεί να έχει πολλές διαστάσεις, ίσες με τον αριθμό των καναλιών³ που θέλουμε να χρησιμοποιήσουμε. Ο αλγόριθμος, λαμβάνει μια περιοχή αναζήτησης στην εικόνα που μας ενδιαφέρει και, αξιοποιώντας την πληροφορία του επαναπροβολής⁴ (back projection - link) του ιστογράμματος, προσαρμόζει την περιοχή αυτή στη κίνηση του αντικειμένου. Σχήμα 31: Παράδειγμα επαναπροβολής ιστογράμματος δέρματος Ο αλγόριθμος Camshift μας επιτρέπει να παρακολουθήσουμε τους markers, ακόμα και αν στη σκηνή εμφανιστούν αντικείμενα παρόμοιας απόχρωσης. Αποδεικνύεται επίσης χρήσιμος αργότερα, καθώς προσαρμόζουμε το τετράγωνο εντοπισμού του χρήστη, ενώ αυτός κινείται στο χώρο, ώστε να έχουμε στη συνέχεια την αποτελεσματική αποκοπή αυτού αλλά και μια στοιχειώδη πρώτη παρακολούθηση του χρήστη. Στη περίπτωση που ο marker χαθεί από το οπτικό πεδίο της στερεοσκοπικής διάταξης, ο camshift θα επιχειρήσει να παρακολουθήσει τη περιοχή της εικόνας με την αμέσως μεγαλύτερη πιθανότητα, η οποία βρίσκεται από συνδυασμό της επαναπροβολής του ιστογράμματος και της τελευταίας γνωστής θέσης της περιοχής αναζήτησης. Για το λόγο αυτό, συχνά εμφανίζεται ένα φαινόμενο έκρηξης του αλγορίθμου. Αξιολογώντας την πυκνότητα των σημείων της επαναπροβολής ως προς το μέγεθος της περιοχής αναζήτησης, μπορούμε να ξέρουμε κατά πόσο ο αλγόριθμος παρακολουθεί πραγματικά τον marker ή απλώς ακολουθεί το αμέσως επόμενο πιθανότερο μέρος της λήψης. ³Με τον όρο κανάλι εννοούμε τις διάφορες διαστάσεις μιας εικόνας. Η έγχρωμη εικόνα μπορεί να έχει 3 ή 4 κανάλια, η ασπρόμαυρη 1 κτλ ⁴Η επαναπροβολή του ιστογράμματος πρόκειται ουσιαστικά για τη πιθανότητα κάθε pixel της εικόνας να είναι ανήκει στο ιστόγραμμα που δόθηκε ως είσοδος κατά τον υπολογισμό της επαναπροβολής.

43 9.2 Εντοπισμός χρήστη 43 Η διαδικασία που ακολουθείται για τον εντοπισμό και παρακολούθηση της κίνησης των markers συνοψίζεται στο διάγραμμα ροής του σχήματος 32. Σχήμα 32: Διάγραμμα ροής εντοπισμού και παρακολούθησης markers

44 9.3 Παρακολούθηση χρήστη Παρακολούθηση χρήστη Σε κανονικές συνθήκες λειτουργίας, ο χρήστης κινείται ως προς τη κάμερα το οποίο σημαίνει ότι είτε η κάμερα κινείται είτε ο ίδιος ο χρήστης. Ως εκ τούτου πρέπει το σύστημα να διατηρεί τον εντοπισμένο χρήστη εντός του παραθύρου εντοπισμού. Η διαδικασία αυτή λειτουργεί και ως βελτιστοποίηση των ορίων του τετραγώνου που επιστρέφει ο HOG, καθώς προσαρμόζει το τετράγωνο χρησιμοποιώντας Camshift. Η διαδικασία της παρακολούθησης του χρήστη φαίνεται συνοπτικά στο σχήμα 33. Σχήμα 33: Διάγραμμα ροής παρακολούθησης χρήστη O floodfill είναι η υλοποίηση ενός region growing αλγορίθμου σε περιβάλλον OpenCV. Οι αλγόριθμοι αυτοί εκτελούν έναν δυαδικό διαχωρισμό της εικόνας, ξεκινώντας από ένα δεδομένο σημείο, το γνωστό και ως σημείο-σπόρο (seed point). Χρησιμοποιώντας τα διαθέσιμα κανάλια της εικόνας στην οποία εφαρμόζουμε τον αλγόριθμο, απαιτούμε από αυτόν να ομαδοποιήσει γειτονικά σημεία του seed point βάσει ορισμένων περιορισμών απόστασης. Οι περιορισμοί αυτοί μπορούν να αναφέρονται στο μέσο όρο της συνολικής περιοχής ή στη τιμή του τελευταίου πίξελ που περιλήφθηκε στην ομάδα. Αξιοποιώντας αυτό τον αλγόριθμο μπορούμε να ορίσουμε σε γενικές γραμμές τη σιλουέτα του ανθρώπου χρησιμοποιώντας τη πληροφορία βάθους. Η σιλουέτα αυτή δεν είναι τέλεια καθώς μπορεί να περιέχει τρύπες, περιοχές που δεν ανήκουν στον άνθρωπο αλλά έχουν παρόμοιο βάθος, να μην περιλαμβάνει άκρα που βρίσκονται σε έκταση προς την κάμερα κτλ. Εντούτοις ορίζει μια περιοχή του νέφους σημείων, της οποίας το ιστόγραμμα εκφράζει την κατανομή σημείων που ανήκουν στον άνθρωπο. Το ιστόγραμμα αυτό μπορεί να αξιοποιηθεί από τον

45 10 Αναγνώριση πόζας 45 Σχήμα 34: Το αποτέλεσμα του αλγορίθμου floodfill camshift αλγόριθμο ώστε ο τελευταίος να προσαρμόζει σε κάθε καρέ το τετράγωνο εντοπισμού χρήστη. Το ιστόγραμμα των σημείων του νέφους ανανεώνεται με μια συχνότητα σε κάθε καρέ, μιας και ο χρήστης κινείται στο χώρο. 10 Αναγνώριση πόζας Η αναγνώριση της πόζας του ανθρώπου θεωρείται η καρδιά των συστημάτων παρακολούθησης των κινήσεων του χρήστη. Με τον όρο πόζα εννοείται η θέση και προσανατολισμός του ανθρώπου στο χώρο, καθώς και η θέση των τμημάτων αυτού, ως έκφραση των γωνιών των αρθρώσεών του. Είναι λοιπόν φυσιολογικό να δοθεί η μεγαλύτερη έμφαση σε αυτό το τμήμα του συστήματος, τόσο αλγοριθμικά όσο και προγραμματιστικά. Εφόσον σχεδιάζουμε ένα σύστημα που βασίζεται στην στερεοσκοπική όραση, δηλαδή στον τρόπο με τον οποίο ο ίδιος ο άνθρωπος αντιλαμβάνεται το περιβάλλον του, πρέπει να αναλογιστούμε με ποιον τρόπο ο άνθρωπος γνωρίζει τη πόζα ενός άλλου ανθρώπου. Έτσι λοιπόν ο άνθρωπος γνωρίζει: 1. Πώς μοιάζει ένας άνθρωπος σε 3Δ μορφή στον 3Δ χώρο 2. Πώς προβάλλεται αυτός σε ένα επίπεδο, ποια είναι δηλαδή η φιγούρα του.

46 10.1 Μοντελοποιητής Ποιοι είναι οι περιορισμοί κίνησης που διαθέτει. Για παράδειγμα η άρθρωση του αγκώνα περιστρέφεται μόνο κατά ένα άξονα και για λιγότερο από Πως εκφράζεται αυτή η κίνηση, ώστε η μορφή του ανθρώπου να ταιριάζει σε αυτό που βλέπει. Το παραπάνω είναι ένα απλοϊκό μοντέλο αντίληψης του ανθρώπου από έναν άλλον άνθρωπο. Οι άνθρωποι, ως πολύπλοκα όντα, γνωρίζουν εκτός αυτών του που βρίσκεται κάθε μέλος του σώματος πάνω στο μοντέλο τους περί του ανθρώπου, πως αυτό μοιάζει, ποια θα είναι η πιθανότερη θέση αυτού δεδομένης της προηγούμενης κίνησης του συνολικού ανθρώπου, πως το 3Δ μοντέλο επιδρά στο περιβάλλον (σκιές, εκτοπισμός υγρών) και πολλά ακόμα. Το σύνολο της ανθρώπινης αντίληψης για το περιβάλλον του αλλά και η μελέτη της αντίληψης αυτή, είναι το αντικείμενο έρευνας ομάδων που ασχολούνται με τη σημασιολογία μοντέλων (model semantics). Συνεπώς, είναι δύσκολο να μοντελοποιήσουμε τη πλήρη αντίληψη του ανθρώπου για τα αντικείμενα του περιβάλλοντός του γενικότερα, γιαυτό και καταλήξαμε στο παραπάνω μοντέλο, το οποίο θα προσπαθήσουμε να εκφράσουμε αλγοριθμικά. Έτσι λοιπόν, τα 1 και 2 καλύπτονται από το μοντελοποιητή (modeler) και τα 3 και 4 από τον αλγόριθμο αναζήτησης στο χώρο κίνησης του ανθρώπου Μοντελοποιητής Κατά τη σχεδίαση του συστήματος τέθηκε σαν στόχος να δημιουργηθεί ένα σύστημα που μπορεί να προσαρμοστεί εύκολα σε διάφορες λειτουργικές απαιτήσεις. Δεν είναι απαραίτητο το αντικείμενο που παρατηρούμε να είναι άνθρωπος, θα μπορούσε να είναι οποιασδήποτε μορφής αντικείμενο, με διάφορους βαθμούς ελευθερίας, όπως για παράδειγμα ένα στερεό χωρίς αρθρώσεις, ένα αυτοκίνητο, ένα σπίτι κτλ. Έτσι λοιπόν, χρειαζόμαστε ένα μοντέλο το οποίο μπορεί να παραχθεί εύκολα από έναν γραφίστα ή κάποιον με γνώσεις τρισδιάστατου ψηφιακού μοντελισμού. Μια άλλη απαίτηση ήταν η χρήση λογισμικού και βιβλιοθηκών ανοικτού κώδικα. Ο μοντελοποιητής πρέπει να μπορεί να συνεργαστεί με κώδικα C++ και να χρησιμοποιεί τις δυνατότητες της κάρτας γραφικών, χωρίς όμως να καταφύγουμε σε κλειστές εμπορικές λύσεις.

47 10.1 Μοντελοποιητής Δημιουργία μοντέλου Το μοντέλο του ανθρώπου δημιουργήθηκε με τη βοήθεια του λογισμικού Blender. Δόθηκε ιδιαίτερη έμφαση στην απλότητα του μοντέλο, από άποψη γεωμετρίας και χρησιμοποιηθέντων τριγώνων. Σχήμα 35: Η σχεδίαση του μοντέλου είναι απλή υπόθεση, πρέπει όμως να δοθεί προσοχή στη τοποθέτηση των αρθρώσεων. Σημαντική επίσης ήταν η διαδικασία τοποθέτησης σκελετού στο μοντέλο, έτσι ώστε, παραμορφώνοντας το σκελετό του μοντέλου, να μπορέσουμε να παραμορφώσουμε το μοντέλο στο χώρο, οπότε να έχουμε και την παραγωγή της πόζας. Ο σκελετός σχεδιάστηκε και τοποθετήθηκε προσεγγιστικά με το χέρι. Στη συνέχεια ορίστηκαν τα βάρη των κοκάλων (bones) του σκελετού, βάσει των ομοίων παραμορφώνονται τα vertices του μοντέλου και κατ επέκταση η επιφάνειά του. Στη συνέχεια το μοντέλο αυτό εξήχθη στη κατάλληλη μορφή, που μπορεί να κατανοήσει ο μοντελοποιητής. Αυτό έγινε μέσω ενός εξαγωγέα αρχείων(file exporter) τύπου.mesh και.skeleton, που διατίθεται κατ επιλογή για το Blender.

48 10.1 Μοντελοποιητής Κύριος μοντελοποιητής Βάσει των παραπάνω απαιτήσεων, επιλέχθηκε η μηχανή γραφικών ανοικτού κώδικα Ogre3D (Object-Oriented Graphics Rendering Engine). Επιτρέπει την παραγωγή υψηλής ποιότητας ψηφιακών γραφικών, 2Δ και 3Δ, χωρίς ο προγραμματιστής να ασχοληθεί σε βάθος με τα API γραφικών όπως τα γνωστά DirectX της Microsoft και OpenGl. Διαθέτει ικανοποιητικό documentation και μπορεί να χρησιμοποιηθεί σε διάφορες πλατφόρμες (Unix, Windows, Mac κτλ). Ο μοντελοποιητής αναλαμβάνει να μετατρέψει τις μεταβλητές πόζας σε 3Δ μετασχηματισμό του μοντέλου, χρησιμοποιώντας τις δυνατότητες της κάρτας γραφικών μέσω των renderers. Πρόκειται ουσιαστικά για την διεπαφή που συνδέει το υψηλό επίπεδο ενός αλγορίθμου αναζήτησης στο χώρο του προβλήματος και το χαμηλότερο επίπεδο της παραγωγής του 3Δ μοντέλου μέσα στο οπτικό πεδίο μιας εικονικής κάμερας. Το Ogre3D διαθέτει πολλές δυνατότητες για την οργάνωση του χώρου της ψηφιακής αναπαράστασης. Αυτές περιλαμβάνουν μοντέλα, αρθρωτά ή μη, κάμερες, φώτα (κατευθυντικά, σημειακά, περιβάλλοντος κτλ), πηγές σωματιδίων (particle sources), εφέ μετεπεξεργασίας (post processing), πεδία, θόλους κτλ. Στο σύστημά μας, αρκεί η χρήση μιας κάμερας και του ψηφιακού μοντέλου του ανθρώπου, χωρίς τεχνητούς φωτισμούς ή πεδία. Γίνεται άμεσα αντιληπτό ότι σε ένα τέτοιο περιβάλλον προσομοίωσης μπορούμε να μετακινήσουμε είτε την κάμερα είτε το μοντέλο.επιλέξαμε να διατηρήσουμε σταθερή τη κάμερα και να μετακινούμε το μοντέλο σε σχέση με αυτήν (το WCS θεωρεί ως σημείο αναφοράς το κέντρο της κάμερας). Η περιστροφή του μοντέλου γύρω από τους 3 άξονες (pan, tilt, yaw) γίνεται ως προς το κέντρο αγκίστρωσης του μοντέλου, το οποίο ορίζεται κατά τη δημιουργία αυτού. Επιπροσθέτως, οι γωνίες κάμψης των αρθρώσεων του μοντέλου, ορίζονται με βάση το τοπικό σύστημα συντεταγμένων της κάθε άρθρωσης, έτσι μια εντολή κάμψης 90 της άρθρωσης του βραχίωνα με τον πήχη θα τους τοποθετήσει κάθετα μεταξύ τους. Θα πρέπει να σημειωθεί ότι ο μοντελοποιητής δίνει ως έξοδο μια εικόνα διασποράς του μοντέλου και μόνο αυτού. Οι παράμετροι της διασποράς αυτής, δηλαδή πόσο θα είναι το μέγιστο και ελάχιστο υπολογίσιμο βάθος, συμφωνούν με τις αντίστοιχες παραμέτρους της στερεοσκοπικής κάμερας που χρησιμοποιήθηκε αλλά και των παραμέτρων που δόθηκαν στον χρησιμοποιηθέντα αλγόριθμο στερεοσκοπίας επιπολικής γεωμετρίας. Η εικόνα αυτή παράγεται μέσω ενός τμήματος κώδικα που εκτελείται διαμέσου του Ogre3D πάνω στη κάρτα γραφικών και πιο συγκεκρι-

49 10.1 Μοντελοποιητής 49 μένα στα API γραφικών. Το τμήμα κώδικα είναι γραμμένο σε μια ειδική γλώσσα γνωστή ως Cg - C for graphics, ανεπτυγμένη από την Nvidia. Η χρήση της γλώσσας αυτής είναι απολύτως αναγκαία μιας και οι κάρτες γραφικών έχουν σχεδιαστεί με τέτοιο τρόπο ώστε να παρέχουν 2Δ οπτική πληροφορία στην οθόνη και όχι 3Δ ψηφιακή πληροφορία στη μνήμη συστήματος. Πρέπει λοιπόν να δοθεί εντολή στο σύστημα γραφικών για να μετατρέψει την πληροφορία βάθους των μοντέλων που έχει σχεδιάσει η κάρτα γραφικών σε αντίστοιχη πληροφορία διασποράς. Η πληροφορία βάθους παρέχεται από έναν ειδικό buffer των καρτών γραφικών, τον λεγόμενο Z-buffer, που αναλαμβάνει την απεικόνιση αντικειμένων σε διαφορετικό βάθος σκηνής που αλληλοκαλύπτονται μερικώς ή ολικώς. Ο συγκεκριμένος buffer σπάνια αξιοποιείται από άλλο σύστημα, πλην της κάρτας γραφικών, για το λόγο που αναφέραμε. Η λειτουργία του μοντελοποιητή περιγράφεται στο διάγραμμα ροής του σχήματος 36.

50 10.1 Μοντελοποιητής 50 Σχήμα 36: Διάγραμμα ροής μοντελοποιητή

51 10.2 Αλγόριθμος εύρεσης λύσης Αλγόριθμος εύρεσης λύσης Μέχρι το σημείο αυτό, διαθέτουμε την είσοδο του συστήματος -η οποία είναι μια περιοχή του οπτικού πεδίου μιας στερεοσκοπικής κάμερας, που παρέχει τη πληροφορία βάθους σκηνής- και ένα υποσύστημα μοντελοποιητή το οποίο είναι έτοιμο να μας παράξει μια πληροφορία βάθους μοντέλου που ελέγχεται από το σύστημα. Πρέπει επίσης να σημειώσουμε ότι ο χώρος αναζήτησης του προβλήματος αναγνώρισης πόζας ανθρώπου βασισμένου σε αρθρωτό μοντέλο είναι ιδιαίτερα μεγάλος. Συγκεκριμένα, αν αναλογιστούμε ότι το μοντέλο διαθέτει 3 dof θέσης, 3 dof προσανατολισμού μοντέλου και 19*3 dof για τις 19 επιμέρους αρθρώσεις, έχουμε στη χειρότερη περίπτωση ένα χώρο αναζήτησης 63 διαστάσεων. limb Yaw Pitch Roll head -90/90-50/90-60/60 u.torso -45/45-90/60-90/90 l.torso -45/45-20/90-20/20 r.shoulder 0-10/40-20/20 l.shoulder 0-10/40-20/20 r.hip 0-40/40-20/20 l.hip 0-40/40-20/20 r.arm -90/90-90/40-10/140 r.forearm -60/80 0 0/150 r.hand -90/90-90/90-45/45 l.arm -90/90-90/40-140/10 l.forearm -80/ /0 l.hand -90/90-90/90-45/45 r.thigh -90/90-20/100-40/20 r.calf 0-150/0 0 r.foot 0-50/20 0 l.thigh -90/90-20/100-20/40 l.calf 0-150/0 0 l.foot 0-50/20 0 Πίνακας 1: Όρια min/max αρθρώσεων ανθρώπου σε μοίρες Ευτυχώς οι διαστάσεις αυτές μειώνονται καθώς κάποιες αρθρώσεις δεν διαθέτουν 3 dof ενώ οι υπόλοιπες εμφανίζουν περιορισμούς (πχ ο αγκώνας χεριού σε έκταση δε μπορεί να καλύψει πάνω απο 150 κάμψης περίπου). Παρόλ αυτά, πρόκειται για ένα ιδιαίτερα μεγάλο πρόβλημα, το οποίο εμφανίζει αρκετά τοπικά ακρότατα, μερικά από

52 10.2 Αλγόριθμος εύρεσης λύσης 52 τα οποία βρίσκονται πολλές φορές κοντά στο ολικό ακρότατο (βέλτιστη λύση) στη τιμή αλλά όχι στη θέση στο χώρο αναζήτησης. Επιπλέον, η εισαγωγή περιορισμών στη κίνηση του μοντέλου δημιουργεί εμπόδια της κίνησης των σωματιδίων στο χώρο αναζήτησης. Σχήμα 37: Τα όρια αρθρώσεων σε συνδυασμό με τη εξελικτική λογική του PSO επιφέρουν αποτελέσματα που μοιάζουν με έργα τέχνης! Μπορούμε να φανταστούμε την κατάσταση αυτή ως ένα δωμάτιο και τη διάθεση ενός ατόμου να φτάσει σε ένα σημείο του χωρίς να έχει αίσθηση της τοποθεσίας αυτού αλλά μόνο της ιδιότητάς του (π.χ. είναι το πιο ψυχρό σημείο). Αν το δωμάτιο είναι άδειο τότε το άτομο μπορεί με τυχαίο τρόπο να φτάσει πιο γρήγορα και με μεγαλύτερη ακρίβεια στο εν λόγω σημείο σε σχέση με ένα δωμάτιο που περιέχει έπιπλα Μέθοδοι εκτίμησης πόζας που χρησιμοποιούνται Όπως έχουμε ήδη αναφέρει, η εκτίμηση της θέσης ενός αντικειμένου στον 3Δ χώρο είναι δύσκολο πρόβλημα, ειδικότερα αν αυτή περιλαμβάνει τη πόζα ενός αρθρωτού αντικειμένου. Ο επιστημονικός κλάδος της τεχνητής όρασης αναζητά συνεχώς νέες μεθόδους επίλυσης προβλημάτων αυτού του τύπου, ενώ έχει δώσει λύσεις που μπορούν να αξιοποιηθούν σε εμπορικά συστήματα. Τα συστήματα αυτά δεν περιλαμβάνουν τη τεχνολογία MoCap, καθώς αυτή προσφέρει άμεσα την πληροφορία κάμψης των αρθρώσεων ή θέσης αυτών από τους αισθητήρες, χωρίς να μεσολαβεί κάποιος αλγόριθμος εκτεταμένης αναζήτησης. Για παράδειγμα, το δημοφιλές σύστημα kinect της Microsoft, χρησιμοποιεί τη μέθοδο ταξινόμησης Τυχαίων Δασών (Random Forests), ενός δηλαδή εκτεταμένου συνόλου δέντρων απόφασης (decision trees), το οποίο έχει εκπαιδευτεί ώστε να αναγνωρίζει μέλη του ανθρώπινου σώματος χρησιμοποιώντας τη πληροφορία βάθους [16]. Στη συνέχεια,

53 10.2 Αλγόριθμος εύρεσης λύσης 53 συγχωνεύει τη πληροφορία αυτή με ένα σύνολο αποθηκευμένων προσημειωμένων θέσεων ανθρώπων (πόζες) διάφορων χαρακτηριστικών (εύσωμων, κοντών, ψηλών κτλ). Καθώς το σύστημα kinect είναι εμπορικό, δε διαθέτει την ευελιξία τροποποίησης ή παραμετροποίησης ενός συστήματος ανοικτού κώδικα, ενώ απαγορεύει την εκπαίδευση αυτού για αναγνώριση πόζας άλλων αντικειμένων (πχ ενός κινούμενου αυτοκινήτου ή ενός ζώου). Η λύση σε αυτό το πρόβλημα είναι ένα σύστημα το οποίο με ελάχιστες μετατροπές, μπορεί να δεχτεί ένα σύνολο μοντέλων, αρθρωτών ή μη, τα οποία μπορεί να αναζητήσει στην εικόνα βάθους σκηνής που δέχεται ως είσοδο, με αυτόματο ή ημιαυτόματο τρόπο. Πηγή έμπνευσης για το σύστημα Άργος αποτέλεσε η έρευνα των Οικονομίδη, Κυριαζή και Αργυρού [17], σχετικά με την αναγνώριση της πόζας ενός ανθρώπινου χεριού. Το συγκεκριμένο σύστημα χρησιμοποιεί τον μετευρετικό αλγόριθμο αναζήτησης Βελτιστοποίησης Σμήνους Σωματιδίων (PSO - metaheuristic Particle Swarm Optimization algorithm) εκτέλεσης σε πραγματικό χρόνο, χάρη στη παραλληλοποιήσιμη φύση του προβλήματος, των δεδομένων και του αλγορίθμου αναζήτησης PSO Μετευρετικός αλγόριθμος PSO Ο συγκεκριμένος αλγόριθμος έχει τις ρίζες του στη παρατήρηση της συμπεριφοράς ενός σμήνους πτηνών, στο οποίο κάθε μέλος έχει αυτόνομη συμπεριφορά στο χώρο (ένα πτηνό για παράδειγμα μπορεί να πετάξει οπουδήποτε) αλλά διαθέτει μια προσωπική βέλτιστη κατάσταση στην οποία στοχεύει (ένα συγκεκριμένο πτηνό μπορεί να θέλει να κάτσει σε μια κεραία) καθώς και επηρεάζεται από το υπόλοιπο σμήνος (ένα σμήνος πουλιών κινείται συνήθως μαζί). Παρουσιάστηκε για πρώτη φορά από τους Kennedy, Eberhart και Shi [18] [19]. Σχήμα 38: Κίνηση σωματιδίου βάσει τυχαίας, βέλτιστης προσωπικής και γενικής θέσης Ο αλγόριθμος PSO μοιάζει λειτουργικά σε έναν γενετικό αλγόριθμο. Έτσι, ενώ ένας γενετικός αλγόριθμος έχει πληθυσμό από γονιδιώματα(ή άτομα) τα οποία μεταλλάσσει σε κάθε γενιά, ο αλγόριθμος Βελτιστοποίησης Σμήνους Σωματιδίων έχει σμήνος από σωματίδια τα οποία βελτιστοποιεί σε κάθε επανάληψη(ή εξέλιξη). Όπως θα δούμε αργότερα, η διαδικασία αναζήτησης της βέλτιστης λύσης μέσω της κίνησης του σμήνους μοιάζει πολύ με τη διαδικασία αναζήτη-

54 10.2 Αλγόριθμος εύρεσης λύσης 54 σης της βέλτιστης λύσης μέσω της μετάλλαξης του πληθυσμού. Εντούτοις, γενετικός και PSO αλγόριθμος διαφέρουν κυρίως στα δεδομένα τα οποία μπορούν να χειριστούν. Ένας γενετικός αλγόριθμος βασίζεται στο γεγονός ότι τα δεδομένα είναι διακριτής φύσεως ή τουλάχιστον διακριτοποιήσιμα χωρίς σημαντική απώλεια πληροφορίας, κωδικοποιώντας τα για παράδειγμα με μια συμβολοσειρά. Αντιθέτως, ο PSO αλγόριθμος μπορεί να χειριστεί συνεχή μεγέθη, όπως αυτά μπορούν να αναπαρασταθούν σε έναν υπολογιστή χρησιμοποιώντας τη περιορισμένη ικανότητα αναπαράστασης αριθμών του [20]. Αν θεωρήσουμε ότι η θέση ενός σωματιδίου p στο χώρο R n εκφράζεται ως x i,η τρέχουσα ταχύτητα εξέλιξης ως v i, η βέλτιστη των θέσεων του ως p i και η βέλτιστη θέση που βρέθηκε σε όλο το σμήνος g, τότε προσπαθούμε να βρούμε τη βέλτιστη λύση, σύμφωνα με μια συνάρτηση κέρδους (ή κόστους αντίστοιχα) f : R n R μέσω της ακόλουθης διαδικασίας: 1. Αρχικοποίηση σωματιδίου p (αʹ) Αρχικοποίηση της θέσης x i μέσω τυχαίας μεταβλητής ομοιόμορφης κατανομής (b lo, b up ), όπου b lo και b up τα κάτω και άνω όρια της εκάστοτε διάστασης αναζήτησης. (βʹ) Όρισε p i = x i (γʹ) Αν g < p i τότε g = p i (δʹ) Αρχικοποίηση της ταχύτητας 2. Μέχρι να περάσει ένας αριθμός επαναλήψεων ή το βέλτιστο κέρδος να παραμείνει για πολλές επαναλήψεις ίδιο: (αʹ) Για κάθε σωματίδιο i = 1,..., S και για κάθε διάσταση d = 1,..., n του σωματιδίου: i. Επέλεξε τυχαίους αριθμούς r p, r g (0, 1) ii. Ενημέρωσε την ταχύτητα εξέλιξης του σωματιδίου v i,d = a v i,d + c1 r p (p i,d x i,d ) + c2 r g (p i,d x i,d ) (βʹ) Ενημέρωσε τη θέση του σωματιδίου x i = x i + v i (γʹ) Αν f(x i ) > f(p i ) τότε p i = x i (δʹ) Αν f(x i ) > f(g) τότε g = x i 3. Το g διατηρεί τη βέλτιστη λύση του αλγορίθμου.

55 10.2 Αλγόριθμος εύρεσης λύσης 55 Η χρήση του αλγορίθμου PSO για την εύρεση πόζας έχει εφαρμοστεί σε πρόσφατες εργασίες όπως για παράδειγμα στον εντοπισμό πόζας κεφαλιού [21], χεριών [17] ή ακόμα και ολόκληρου του σώματος [22] Αξιολόγηση πόζας Προηγουμένως αναφέραμε ότι η συνάρτηση κέρδους score f : R n R είναι αυτή που θα μας επιτρέψει να καθοδηγήσουμε το σμήνος προς την βέλτιστη λύση ή τουλάχιστον μια λύση που μας καλύπτει, δεδομένου του μεγάλου χώρου αναζήτησης του προβλήματος ή/και του μέγιστου δυνατού αριθμού επαναλήψεων. Είναι σημαντικό αυτή η συνάρτηση να είναι σαφώς ορισμένη και υπολογιστικά απλή, καθώς εκτελείται για κάθε έκδοση των σωματιδίων και σε κάθε επανάληψη, για όποια δεδομένα επιλέξαμε να αξιοποιήσουμε. Έτσι, ένα σμήνος 50 σωματιδίων σε λειτουργία αναζήτησης 100 επαναλήψεων, θα συγκλίνει στη λύση σε 5 δευτερόλεπτα αν η συνάρτηση κέρδους υπολογίζεται σε 1ms. Ο ορισμός αυτής της συνάρτησης δεν είναι απλή υπόθεση. Αυτό που απαιτεί ο PSO αλγόριθμος είναι μια συνάρτηση που -δεδομένης της πληροφορίας βάθους της σκηνής αλλά και των μοντέλων που επιστρέφει ο μοντελοποιητής- να μπορεί να αποφασίζει ποιο μοντέλο ταιριάζει καλύτερα στη σκηνή. Εκτός αυτού πρέπει στο σημείο αυτό να αποφασίσουμε ποια δεδομένα θα χρησιμοποιηθούν για την αξιολόγηση (βάθος, νέφος σημείων, ακμές, χρώμα κτλ). Αποφασίστηκε να κινηθούμε στα βήματα άλλων εργασιών και κυρίως σε αυτή του εντοπισμού της πόζας χεριών με PSO [17] χωρίς όμως να συμπεριλάβουμε τη πληροφορία ακμών ή χρώματος δέρματος. Η επιλογή μας αυτή μειώνει την πολυπλοκότητα αξιολόγησης κάθε μοντέλου αλλά και την ακρίβεια αυτής. Στο κεφάλαιο 13.5 γίνεται μια μελέτη διαφορετικών συναρτήσεων κέρδους πάνω σε ένα σύνολο στάσεων του μοντέλου του ανθρώπινου σώματος σε σχέση με μια δεδομένη πραγματική σκηνή. Θεωρούμε δεδομένη μια εικόνα βάθους σκηνής Α και μια εικόνα βάθους της λύσης του μοντελοποιητή Β, υπό μορφή πινάκων και εύρους τιμών [0,255]. H συνάρτηση κέρδους που αξιολογεί την ορθότητα μιας λύσης επιλέχθηκε να είναι η ακόλουθη: ( ( ) ) 2 ( bound_rect(a) bound_rect(b) mean( A B ) score f = 1 1 bound_rect(a) bound_rect(b) } {{ } σκορ μεγέθους σκηνής και μεγέθους λύσης ) } 255 {{ } σκορ κανονικοποιημένης απόλυτης διαφοράς

56 11 Παρακολούθηση κίνησης 56 ( ) mean(a B) } {{ } σκορ κανονικοποιημένου XOR lef t_marker_score } {{ } σκορ απόστασης αριστερού marker right_marker_score } {{ } σκορ απόστασης δεξιού marker όπου, και οι τελεστές AND, OR και XOR επί των πινάκων A και B αντίστοιχα. Οι συναρτήσεις bound_rect() και mean() υπολογίζουν το περιγεγραμμένο τετράγωνο και τη μέση τιμή αντίστοιχα. 11 Παρακολούθηση κίνησης Η παρακολούθηση κίνησης αποτελεί ένα ξεχωριστό λειτουργικό κομμάτι του συστήματος, παρόλο που υλοποιείται με τον υπάρχοντα αλγόριθμο Παρακολούθηση με PSO O PSO αλγόριθμος έχει την ιδιαιτερότητα να μπορεί να παρακολουθήσει εναλλαγές στη πόζα σχετικά εύκολα. Αν θεωρήσουμε ότι το μοντέλο μας έχει τοποθετηθεί σε μια αρχική πόζα η οποία ταιριάζει ικανοποιητικά με τη πόζα του χρήστη, τότε ο χώρος αναζήτησης της επόμενης πόζας μειώνεται δραματικά, καθώς δεδομένης της ταχύτητας λήψης καρέ από την στερεοσκοπική κάμερα, ο χρήστης μπορεί να βρεθεί σε διαφορετική θέση στο χώρο βάσει μιας κανονικής κατανομής. Αυτό σημαίνει ότι είναι περισσότερο πιθανό να έχει κουνήσει ελάχιστα το κεφάλι του παρά να έχει βρεθεί στην άλλη άκρη του δωματίου Υποβοήθηση παρακολούθησης με προηγούμενη γνώση Μπορούμε να βοηθήσουμε σημαντικά τον αλγόριθμο παρακολούθησης κίνησης, αν προτείνουμε στα σωματίδια μια εκτιμώμενη βέλτιστη πόζα του τρέχοντος καρέ. Γνωρίζουμε ότι όταν ο PSO εκκινεί για 1η φορά, η βέλτιστη λύση θεωρείται μια τυχαία θέση στο χώρο αναζήτησης, τόσο για κάθε σωματίδιο ξεχωριστά όσο και για το σύνολο των σωματιδίων ως σμήνος. Αν και αυτές οι θέσεις τροποποιούνται σχετικά γρήγορα, δεν μας εξασφαλίζουν ότι βρίσκονται κοντά στο ολικό βέλτιστο. Αν, σε κατάσταση παρακολούθησης κίνησης, θέσουμε στα σωματίδια μια εκτίμησης της βέλτιστης θέσης στο νέο καρέ, βρισκόμαστε πλέον με μεγαλύτερη σιγουριά κοντά στο τοπικό βέλτιστο που θέλουμε να εντοπίσουμε. Φυσικά, όλη αυτή η εκτίμηση της επόμενης βέλτιστης

57 11.2 Υποβοήθηση παρακολούθησης με προηγούμενη γνώση 57 θέσης, εξαρτάται από τη διαδικασία υπολογισμού αυτής που θα υιοθετήσουμε καθώς και τη ποιότητα της προηγούμενης λύσης που δώσαμε. Οι μέθοδοι που δοκιμάστηκαν στη παρούσα εργασία ήταν οι ακόλουθες: Η Αφελής μέθοδος (Naive): Στη μέθοδο αυτή θεωρούμε ότι η βέλτιστη πόζα του τρέχοντος καρέ είναι ίδια με τη βέλτιστη θέση του προηγούμενου καρέ. Η μέθοδος ορμής (Momentum): Στη μέθοδο αυτή θεωρούμε ότι η βέλτιστη πόζα του τρέχοντος καρέ είναι η βέλτιστη θέση του προηγούμενου καρέ, όταν σε αυτή προσθέσουμε έναν παράγοντα ορμής, που προκύπτει από τη μέχρι τώρα λειτουργία του συστήματος, με μνήμη ενός καρέ. Η μέθοδος φίλτρου Kalman: Στη μέθοδο αυτή θεωρούμε ότι η βέλτιστη πόζα του τρέχοντος καρέ είναι το αποτέλεσμα της πρόβλεψης του φίλτρου kalman. Η διόρθωση του φίλτρου kalman γίνεται χρησιμοποιώντας τη μέθοδο ορμής. Από τις παραπάνω μεθόδους, η μέθοδος του φίλτρου Kalman βρέθηκε να εμφανίζει τα καλύτερα αποτελέσματα. Οφείλουμε να τονίσουμε ότι λόγω της αργής ανθρώπινης κίνησης σε σχέση με την ανανέωση του καρέ της κάμερας και της φύσης του αλγορίθμου PSO, η πρόβλεψη της βέλτιστης πόζας δεν είναι απαραίτητη. Εντούτοις, η πρόβλεψη αυτή επιτρέπει στον αλγόριθμο να συγκλίνει γρηγορότερα στην επιθυμητή λύση, αποφεύγοντας άλλα τοπικά ακρότατα που πιθανώς να εμφανιστούν Μορφή φίλτρου Kalman Το (γραμμικό) φίλτρο Kalman λειτουργεί σε 2 στάδια, αυτό της πρόβλεψης και αυτό της διόρθωσης. Το φίλτρο λειτουργεί αναδρόμικα, προβλέποντας και στη συνέχεια διορθώνοντας το state στο οποίο βρίσκεται το σύστημα. Σε γενικές γραμμές μπορούμε να το αναπαραστήσουμε ως εξής: x k k 1 = F k x k 1 k 1 + B k 1 u k 1 + w k (1) όπου x k k 1 είναι το τρέχον predicted state, x k 1 k 1 το προηγούμενο state, u k 1 ο έλεγχος του προηγούμενου state, w k το σφάλμα (στις περισσότερες περιπτώσεις θεωρούμε ότι ακολουθεί κανονική κατανομή με μέση τιμή 0 και συμμεταβλητοτητα Q, άρα w k (0, Q k )), F k ο πίνακας μετάβασης του state και B k είναι ο πίνακας επίδρασης του ελέγχου.

58 11.2 Υποβοήθηση παρακολούθησης με προηγούμενη γνώση 58 Η μέτρηση του συστήματος μοντελοποιείται ως εξής: ẑ k = H k x k + v k (2) όπου ẑ k είναι η εκτιμώμενη μέτρηση του συστήματος, H k είναι ο πίνακας παρατήρησης και v k ο θόρυβος παρατήρησης (επίσης κανονική κατανομή v k (0, R k )). Η μέτρηση του συστήματος είναι εκείνα τα μεγέθη τα οποία μπορούμε να δειγματοληπτήσουμε ανά ορισμένο πεπερασμένο χρονικό διάστημα. Από το 1, το 2 αλλά και τα γνωστά μεγέθη του συστήματος μπορούμε να διορθώσουμε το state του συστήματος, δημιουργώντας μια νέα εκτίμηση αυτού: x estk = x k + K k (z k ẑ k ) (3) όπου K k είναι το κέρδος του φίλτρου kalman. Η εκτίμηση αυτή θα δοθεί στον PSO αλγόριθμο σαν best position. Αν αναλύσουμε τις παραπάνω εξισώσεις και εισάγουμε τους προαναφερθέντες όρους θορύβου, έχουμε τα εξής: Στην πρόβλεψη: x k k 1 = F k x k 1 k 1 + B k 1 u k 1 (4) P k k 1 = F k P k 1 k 1 F T k + Q k (5) Στην διόρθωση: y k = z k H k ŷ k k 1 (6) S k = H k P k k 1 H T k + R k (7) K k = P k k 1 H T k S 1 k (8) x k k = x k k 1 + K k y k (9) P k k 1 = (I K k H k )P k k 1 (10) όπου P k k 1 η συμμεταβλητότητα της πρόβλεψης, y k το υπόλοιπο της μέτρησης, S k η συμμεταβλητότητα του υπολοίπου, K k το βέλτιστο κέρδος Kalman, P k k 1 η συμμεταβλητότητα της εκτίμησης. Έχουμε λοιπόν P k k 1 = conv(x k x k k 1 ) και S k = conv(y k ).

59 11.2 Υποβοήθηση παρακολούθησης με προηγούμενη γνώση Προσαρμογή φίλτρου Kalman Είναι απαραίτητο να ορίσουμε την γραμμική σχέση στην οποία υπακούει το σύστημά μας. Θεωρούμε ότι όλες οι μετακινήσεις και περιστροφές είναι ανεξάρτητες μεταξύ τους και ακολουθούν ευθύγραμμη ομαλά επιταχυνόμενη κίνηση. Άρα αν p t ένα από τα μεγέθη που εξετάζονται (μετατόπιση ή γωνία), τότε: p t = p t 1 + ṗ t 1 t p t 1 t 2 (11) ṗ t = ṗ t 1 + p t 1 t (12) Σαν state του συστήματος x k ορίζουμε το σύνολο των γωνιών και συντεταγμένων όλου του μοντέλου, καθώς και το ρυθμό μεταβολής αυτών. Είναι η πληροφορία που μας διατίθεται αρχικά και είναι η πληροφορία που θέλουμε να προσαρμόσουμε βάσει της ορμής του συστήματος. Σαν state εκκίνησης θα ορίσουμε την έξοδο του SPO αλγορίθμου όταν εντοπίσει για 1η φορά τον χρήστη ενώ οι ταχύτητες θα θεωρηθούν μηδενικές, μιας και εκείνη τη στιγμή ο χρήστης όντως δε κινείται. x k = X k Ẋ k Y k Ẏk Z k Żk R k Ṙ k. (13) Σαν measurement z k ορίζουμε την έξοδο του PSO αλγορίθμου (state)στο προηγούμενο καρέ, έχοντας κάνει μια πρόβλεψη με τη μέθοδο ορμής.σε γενικές γραμμές, η εξέλιξη των σωματιδίων του αλγορίθμου είναι ελάχιστα βίαιη και αρκετά ελεγχόμενη καθώς δεν αναμένεται μεγάλη μεταβολή σε διαδοχικά καρέ αλλά απαιτείται μέγιστη ταχύτητα σύγκλισης του αλγορίθμου. Με τον τρόπο αυτό, τοποθετούμε το PSO σμήνος πιο κοντά στη λύση, οπότε μειώνουμε το χώρο αναζήτησης.

60 11.2 Υποβοήθηση παρακολούθησης με προηγούμενη γνώση 60 z k = X k 0 Y k 0 Z k 0 R k 0. (14) Θεωρούμε ότι δεν υπάρχει control u k ή τουλάχιστον δεν τον γνωρίζουμε, μιας και ευθέως ανάλογο του ελέγχου θα ήταν η ανθρώπινη σκέψη ή τουλάχιστον ένα σύστημα πρόβλεψης της ανθρώπινης συμπεριφοράς. Οι πίνακες που αναφέρθηκαν στα 1,2 και 3 πρέπει να οριστούν επακριβώς: 1 t t t 0 0 F k = t 0, t = 1 (15) t H k = (16) Σε αυτό το σημείο χρειάζεται να ορίσουμε τους πίνακες P, Q και R. Ο πίνακας P υπολογίζεται αναδρομικά. Όμως, όπως βλέπουμε από τα 6,8 και 9, μας δίνει το βαθμό εμπιστοσύνης που έχουμε στην αρχική μας πρόβλεψη. Συνεπώς το P 0 0 = [0]. Οι Q και R αφορούν κανονικές κατανομές θορύβου μέτρησης και είναι αντικείμενο εκτεταμένης έρευνας για διάφορες εφαρμογές του φίλτρου Kalman. Στη βιβλιογραφία, οι περισσότερες εργασίες χρησιμοποιούν κατανομές θορύβου που

61 11.3 Υποβοήθηση παρακολούθησης με σημεία του χρήστη 61 έχουν προσαρμόσει τυχαία με δοκιμές ή έχουν κάνει τη παραδοχή ότι ο θόρυβος πρέπει να τηρεί ορισμένα όρια και να ακολουθεί γνωστές κατανομές. Σε πραγματικές εφαρμογές, τα μεγέθη αυτά αναφέρονται σε αισθητήρες που δίνουν τιμές με συγκεκριμένες κατανομές θορύβου. Όταν αυτές δεν είναι διαθέσιμες από το κατασκευαστή, μπορεί να γίνει δειγματοληψία αυτής της κατασκευής, με καταγραφή του θορύβου υπό διαφορετικές συνθήκες του συστήματος, ώστε να δημιουργηθεί ένα αξιόπιστο μοντέλο του θορύβου μέτρησης. Σε γενικές γραμμές, το ίδιο το φίλτρο εμφανίζει ανοχές στην επιλογή του μοντέλου αυτού Υποβοήθηση παρακολούθησης με σημεία του χρήστη Η παρακολούθηση αλλά και ο εντοπισμός της πόζας είναι ευκολότερη διαδικασία αν γνωρίζουμε από πριν ορισμένα σημεία του χρήστη. Η τεχνική αυτή χρησιμοποιείται στη μέθοδο MoCap, όπου γνωρίζουμε σχεδόν όλες τις απόλυτες ή σχετικές θέσεις των αρθρώσεων που μας ενδιαφέρουν. Ο αριθμός και το είδος των μεθόδων που χρησιμοποιούμε για τον εντοπισμό αυτών των σημείων εξαρτάται από το πόσο συνεργάσιμος και διατεθειμένος είναι ο χρήστης να τοποθετήσει πάνω του σημεία αναφοράς, γνωστά και ως markers. Η τεχνική του MoCap ήταν ως επί των πλείστων βασισμένη σε χρήση markers, μιας και οι χρήστες ήταν κυρίως ηθοποιοί ή συνεργάτες σε επιστημονικές έρευνες. Ως εκ τούτου, θεωρούνται επαγγελματίες, άτομα συνεργάσιμα που βρίσκονται σε ένα ελεγχόμενο περιβάλλον, στο οποίο τόσο οι συνθήκες όσο και οι δράσεις του χρήστη είναι αυστηρώς προδιαγεγραμμένες. Η απαίτηση της μη χρήσης markers (γνωστή και ως markerless design) που εισάγεται σε ένα σύστημα, το οποίο απευθύνεται σε μη επαγγελματίες χρήστες (όπως για παράδειγμα ο χρήστης μιας κονσόλας βιντεοπαιχνιδιών) έρχεται να δυσκολέψει την ήδη απαιτητική διαδικασία αναγνώρισης πόζας ενός πολυαρθρωτού μοντέλου όπως είναι ο άνθρωπος. Στο συγκεκριμένο τομέα γίνονται ιδιαίτερες προσπάθειες, άλλες επιτυχημένες και άλλες όχι, με χρήση διαφόρων μεθόδων και υπό διαφορετικές συνθήκες λειτουργίας. Χαρακτηριστικό παράδειγμα αποτελεί το kinect και η χρήση ενός εκπαιδευμένου Random Forest, το οποίο χρησιμοποιείται για να εντοπίσει τα διαφορετικά σημεία αναφοράς ενός ανθρώπου, όπως τα χέρια, ο κορμός, το κεφάλι, σε μια διαδικασία κατάτμησης (segmentation).

62 11.3 Υποβοήθηση παρακολούθησης με σημεία του χρήστη 62 Σχήμα 39: Το kinect γνωρίζει τη θέση διάφορων σημείων του ανθρώπου σε κάθε καρέ της εικόνας διασποράς Σχήμα 40: Συνάρτηση κέρδους για την επίδραση της θέσης των χεριών στο κέρδος του σωματιδίου Στο σύστημα Άργος, ο χρήστης φοράει χρωματιστά περικάρπια, η κίνηση των οποίων παρακολουθείται σε κάθε καρέ. Έχοντας διαθέσιμη τη 2D θέση των καρπών, μπορούμε να καθοδηγήσουμε τον PSO αλγόριθμο προς μια λύση, που συμφωνεί με τη θέση αυτή. Η όλη διαδικασία εκτελείται κατά την διάρκεια του υπολογισμού του σκορ των σωματιδίων του PSO, στην οποία πολλαπλασιάζεται ένας παράγοντας κέρδους παραβολικής φύσεως, όπως φαίνεται στο διπλανό σχήμα. Επιλέξαμε αυτή τη μορφή διότι θέλαμε να δώσουμε μεγαλύτερο κόστος στη περίπτωση που το μοντέλο τοποθετεί το χέρι μακριά από τον marker του χρήστη αλλά μικρότερο κέρδος όταν ο marker βρίσκεται κοντά στο άκρο του μοντέλου, ώστε να αποτρέψουμε φαινόμενα over-fitting.

63 Μέρος IV Υλοποίηση του συστήματος 63

64 12 Χρησιμοποιηθέντα εργαλεία Χρησιμοποιηθέντα εργαλεία 12.1 Συνολικό σύστημα Σύστημα Είδος Φορητός Υπολογιστής Επεξεργαστής Intel(R)Core(TM)i3 Μνήμη DDR GB Λειτ. Σύστημα 64-bit Windows 7 Home Premium SP1 Είδος Σταθερός Υπολογιστής Επεξεργαστής AMD Phenom Μνήμη DDR GB Λειτ. Σύστημα 64-bit Windows 7 Professional SP1 Κάμερα Μοντέλο Sony s PS3 eye Τεχνολογία CMOS Ανάλυση fps, fps GPU s Σταθερός Ati HD5750 Οδηγοί Ati Catalyst 13.4 Φορητός Ati HD5450 Οδηγοί Ati Catalyst 13.4 API s OpenCV Έκδοση με ΤΒΒ 4.1 Ogre3D Boost OpenGL Πίνακας 2: Χαρακτηριστικά συστήματος υλοποίησης 12.2 Renderers Οι renderers είναι βιβλιοθήκες που επιτρέπουν τη χρήση γλώσσας υψηλού επιπέδου (π.χ. C++) για λόγους επικοινωνίας με τη κάρτα γραφικών. Λειτουργούν ως μεσολαβητές ανάμεσα στον κώδικα του προγραμματιστή, το λειτουργικό και τους οδηγούς της κάρτας γραφικών. Για τις ανάγκες του συστήματος, εξετάστηκαν δύο γνωστοί renderers: OpenGL DirectX

65 12.3 Ogre3D 65 Ύστερα από δοκιμές, βρέθηκε ότι ο OpenGL ήταν η ιδανικότερη επιλογή, καθώς ο DirectX εμφάνιζε σημαντικότερο χρόνο εκτέλεσης (περίπου 10 φορές μεγαλύτερο). Το φαινόμενο αυτό οφείλεται κυρίως στη χρήση της βιβλιοθήκης Ogre3D, η οποία δημιουργήθηκε βασισμένη στον OpenGL Ogre3D Όπως αναφέρθηκε στη παράγραφο , επιλέξαμε τη χρήση της βιβλιοθήκης Ogre3D. Πρόκειται για μηχανή γραφικών και όχι μηχανή παιχνιδιών. Η διαφορά έγκειται στο γεγονός ότι η πρώτη περιλαμβάνει αποκλειστικά και μόνο μεθόδους δημιουργίας και χειρισμού γραφικών ενώ η δεύτερη επικεντρώνεται κυρίως στις διαδικασίες που επιτρέπουν σε ένα παιχνίδι να αποκτήσει την συμπεριφορά που το διακρίνει, όπως scripting, physics, sound management, model collision, multiplayer support κτλ OpenCV Η OpenCV είναι μια πολύ διαδεδομένη βιβλιοθήκη προγραμματισμού για επεξεργασία εικόνας. Υποστηρίζει πολλές εναλλακτικές γλώσσες και περιβάλλοντα (java, c, c++, android, ios κτλ), διαθέτει γνωστούς αλγορίθμους επεξεργασίας εικόνας σε έτοιμες μεθόδους (gaussian blur, canny edge detector, watershed κτλ) αλλά και μεθόδους εξαγωγής πληροφορίας από την εικόνα (SIFT, SURF, feature detector, HuMoments, histogram calculation κτλ). Από την έκδοση 2.3 και έπειτα, προάγεται η χρήση του νέου API της OpenCV, το οποίο αναπαριστά την εικόνα σαν πίνακα τιμών και επιτρέπει την άλγεβρα πινάκων. Τέλος, από την έκδοση 2.4.4, εισάγεται η υποστήριξη της γλώσσας OpenCL, η οποία επιτρέπει την εκτέλεση υπολογισμών στη κάρτα γραφικών αντί για τη CPU, με παράλληλη επεξεργασία Boost Η βιβλιοθήκη boost διαθέτει πολλά χρήσιμα εργαλεία τα οποία μπορούν να οργανώσουν ένα πρόγραμμα σε εργασίες (tasks) και δομές (structures).

Στόχος της εργασίας και ιδιαιτερότητες του προβλήματος

Στόχος της εργασίας και ιδιαιτερότητες του προβλήματος ΑΝΑΠΤΥΞΗ ΟΠΤΙΚΟΥ ΣΥΣΤΗΜΑΤΟΣ ΠΡΟΣΑΡΜΟΣΤΙΚΟΥ ΕΛΕΓΧΟΥ ΚΑΤΕΡΓΑΣΙΑΣ ΥΛΙΚΩΝ Κουλουμέντας Παναγιώτης Σχολή Ηλεκτρονικών Μηχανικών και Μηχανικών Υπολογιστών Χανιά,Νοέμβριος 2014 Επιτροπή: Ζερβάκης Μιχάλης (επιβλέπων)

Διαβάστε περισσότερα

Συστήματα συντεταγμένων

Συστήματα συντεταγμένων Κεφάλαιο. Για να δημιουργήσουμε τρισδιάστατα αντικείμενα, που μπορούν να παρασταθούν στην οθόνη του υπολογιστή ως ένα σύνολο από γραμμές, επίπεδες πολυγωνικές επιφάνειες ή ακόμη και από ένα συνδυασμό από

Διαβάστε περισσότερα

ΡΟΜΠΟΤΙΚΗ ΟΡΑΣΗ. Όταν ένα ρομπότ κινείται σε άγνωστο χώρο ή σε χώρο που μπορεί να αλλάξει η διάταξή του τότε εμφανίζεται η ανάγκη της όρασης μηχανής.

ΡΟΜΠΟΤΙΚΗ ΟΡΑΣΗ. Όταν ένα ρομπότ κινείται σε άγνωστο χώρο ή σε χώρο που μπορεί να αλλάξει η διάταξή του τότε εμφανίζεται η ανάγκη της όρασης μηχανής. ΡΟΜΠΟΤΙΚΗ ΟΡΑΣΗ Όταν ένα ρομπότ κινείται σε άγνωστο χώρο ή σε χώρο που μπορεί να αλλάξει η διάταξή του τότε εμφανίζεται η ανάγκη της όρασης μηχανής. Αισθητήρες που χρησιμοποιούνται για να αντιλαμβάνεται

Διαβάστε περισσότερα

ΤΟΠΟΓΡΑΦΙΚΑ ΔΙΚΤΥΑ ΚΑΙ ΥΠΟΛΟΓΙΣΜΟΙ ΑΝΑΣΚΟΠΗΣΗ ΘΕΩΡΙΑΣ ΣΥΝΟΡΘΩΣΕΩΝ

ΤΟΠΟΓΡΑΦΙΚΑ ΔΙΚΤΥΑ ΚΑΙ ΥΠΟΛΟΓΙΣΜΟΙ ΑΝΑΣΚΟΠΗΣΗ ΘΕΩΡΙΑΣ ΣΥΝΟΡΘΩΣΕΩΝ ΤΟΠΟΓΡΑΦΙΚΑ ΔΙΚΤΥΑ ΚΑΙ ΥΠΟΛΟΓΙΣΜΟΙ ΑΝΑΣΚΟΠΗΣΗ ΘΕΩΡΙΑΣ ΣΥΝΟΡΘΩΣΕΩΝ Βασίλης Δ. Ανδριτσάνος Δρ. Αγρονόμος - Τοπογράφος Μηχανικός ΑΠΘ Επίκουρος Καθηγητής ΤΕΙ Αθήνας 3ο εξάμηνο http://eclass.teiath.gr Παρουσιάσεις,

Διαβάστε περισσότερα

Εικόνα. Τεχνολογία Πολυμέσων και Πολυμεσικές Επικοινωνίες 05-1

Εικόνα. Τεχνολογία Πολυμέσων και Πολυμεσικές Επικοινωνίες 05-1 Εικόνα Εισαγωγή Ψηφιακή αναπαράσταση Κωδικοποίηση των χρωμάτων Συσκευές εισόδου και εξόδου Βάθος χρώματος και ανάλυση Συμβολική αναπαράσταση Μετάδοση εικόνας Σύνθεση εικόνας Ανάλυση εικόνας Τεχνολογία

Διαβάστε περισσότερα

ΕΦΑΡΜΟΓΕΣ ΦΩΤΟΓΡΑΜΜΕΤΡΙΑΣ. Βασίλης Γιαννακόπουλος, Δρ. Δασολόγος

ΕΦΑΡΜΟΓΕΣ ΦΩΤΟΓΡΑΜΜΕΤΡΙΑΣ. Βασίλης Γιαννακόπουλος, Δρ. Δασολόγος ΕΦΑΡΜΟΓΕΣ ΦΩΤΟΓΡΑΜΜΕΤΡΙΑΣ Βασίλης Γιαννακόπουλος, Δρ. Δασολόγος Φωτογραμμετρία Εισαγωγή Ορισμοί Πλεονεκτήματα Μειονεκτήματα Εφαρμογές Εισαγωγή Προσδιορισμός θέσεων Με τοπογραφικά όργανα Σχήμα Μέγεθος Συντεταγμένες

Διαβάστε περισσότερα

Εισαγωγή στη σχεδίαση κινούμενων γραφικών

Εισαγωγή στη σχεδίαση κινούμενων γραφικών ΕΣΔ200 Δημιουργία Περιεχομένου ΙI Εισαγωγή στη σχεδίαση κινούμενων γραφικών Νικόλας Τσαπατσούλης Επίκουρος Καθηγητής Τμήμα Επικοινωνίας & Σπουδών Διαδικτύου Εισαγωγή Εφαρμογές Κύρια Χαρακτηριστικά Flash

Διαβάστε περισσότερα

ΣΤΕΡΕΟΣΚΟΠΙΚΕΣ ΕΙΚΟΝΕΣ

ΣΤΕΡΕΟΣΚΟΠΙΚΕΣ ΕΙΚΟΝΕΣ ΣΤΕΡΕΟΣΚΟΠΙΚΕΣ ΕΙΚΟΝΕΣ Η προοπτική εικόνα, είναι, όπως είναι γνωστό, η προβολή ενός χωρικού αντικειμένου, σε ένα επίπεδο, με κέντρο προβολής, το μάτι του παρατηρητή. Η εικόνα αυτή, θεωρούμε ότι αντιστοιχεί

Διαβάστε περισσότερα

Κατάτµηση Εικόνων: Ανίχνευση Ακµών και Κατάτµηση µε Κατωφλίωση

Κατάτµηση Εικόνων: Ανίχνευση Ακµών και Κατάτµηση µε Κατωφλίωση ΤΨΣ 50 Ψηφιακή Επεξεργασία Εικόνας Κατάτµηση Εικόνων: Ανίχνευση Ακµών και Κατάτµηση µε Κατωφλίωση Τµήµα ιδακτικής της Τεχνολογίας και Ψηφιακών Συστηµάτων Πανεπιστήµιο Πειραιώς Περιεχόµενα Βιβλιογραφία

Διαβάστε περισσότερα

Επεξεργασία Χαρτογραφικής Εικόνας

Επεξεργασία Χαρτογραφικής Εικόνας Επεξεργασία Χαρτογραφικής Εικόνας Διδάσκων: Αναγνωστόπουλος Χρήστος Κώδικες μετρήσεων αντικειμένων σε εικόνα Χρωματικά μοντέλα: Munsell, HSB/HSV, CIE-LAB Κώδικες μετρήσεων αντικειμένων σε εικόνες Η βασική

Διαβάστε περισσότερα

ΔΙΕΡΕΥΝΗΣΗ ΤΩΝ ΕΝΝΟΙΩΝ ΕΝΤΑΣΗ ΚΑΙ ΔΥΝΑΜΙΚΟ ΣΕ ΗΛΕΚΤΡΙΚΟ ΠΕΔΙΟ ΠΟΥ ΔΗΜΙΟΥΡΓΕΙΤΑΙ ΑΠΟ ΔΥΟ ΣΗΜΕΙΑΚΑ ΦΟΡΤΙΑ

ΔΙΕΡΕΥΝΗΣΗ ΤΩΝ ΕΝΝΟΙΩΝ ΕΝΤΑΣΗ ΚΑΙ ΔΥΝΑΜΙΚΟ ΣΕ ΗΛΕΚΤΡΙΚΟ ΠΕΔΙΟ ΠΟΥ ΔΗΜΙΟΥΡΓΕΙΤΑΙ ΑΠΟ ΔΥΟ ΣΗΜΕΙΑΚΑ ΦΟΡΤΙΑ 2 Ο ΣΥΝΕΔΡΙΟ ΣΤΗ ΣΥΡΟ ΤΠΕ ΣΤΗΝ ΕΚΠΑΙΔΕΥΣΗ 475 ΔΙΕΡΕΥΝΗΣΗ ΤΩΝ ΕΝΝΟΙΩΝ ΕΝΤΑΣΗ ΚΑΙ ΔΥΝΑΜΙΚΟ ΣΕ ΗΛΕΚΤΡΙΚΟ ΠΕΔΙΟ ΠΟΥ ΔΗΜΙΟΥΡΓΕΙΤΑΙ ΑΠΟ ΔΥΟ ΣΗΜΕΙΑΚΑ ΦΟΡΤΙΑ Μαστρογιάννης Αθανάσιος Εκπαιδευτικός Δευτεροβάθμιας

Διαβάστε περισσότερα

7.1 ΜΕΤΡΗΣΗ ΤΗΣ ΕΣΤΙΑΚΗΣ ΑΠΟΣΤΑΣΗΣ ΦΑΚΩΝ

7.1 ΜΕΤΡΗΣΗ ΤΗΣ ΕΣΤΙΑΚΗΣ ΑΠΟΣΤΑΣΗΣ ΦΑΚΩΝ 7.1 ΑΣΚΗΣΗ 7 ΜΕΤΡΗΣΗ ΤΗΣ ΕΣΤΙΑΚΗΣ ΑΠΟΣΤΑΣΗΣ ΦΑΚΩΝ ΘΕΩΡΙΑ Όταν φωτεινή παράλληλη δέσμη διαδιδόμενη από οπτικό μέσο α με δείκτη διάθλασης n 1 προσπίπτει σε άλλο οπτικό μέσο β με δείκτη διάθλασης n 2 και

Διαβάστε περισσότερα

Κεφάλαιο 7. Τρισδιάστατα Μοντέλα

Κεφάλαιο 7. Τρισδιάστατα Μοντέλα Κεφάλαιο 7. 7.1 ομές εδομένων για Γραφικά Υπολογιστών. Οι δομές δεδομένων αποτελούν αντικείμενο της επιστήμης υπολογιστών. Κατά συνέπεια πρέπει να γνωρίζουμε πώς οργανώνονται τα γεωμετρικά δεδομένα, προκειμένου

Διαβάστε περισσότερα

ΕΡΕΥΝΗΤΙΚΑ ΠΡΟΓΡΑΜΜΑΤΑ ΑΡΧΙΜΗΔΗΣ ΕΝΙΣΧΥΣΗ ΕΡΕΥΝΗΤΙΚΩΝ ΟΜΑΔΩΝ ΣΤΟ ΤΕΙ ΣΕΡΡΩΝ. Ενέργεια. 2.2.3.στ ΘΕΜΑ ΕΡΕΥΝΑΣ: ΔΙΑΡΘΡΩΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΕΧΡΩΜΩΝ ΕΓΓΡΑΦΩΝ

ΕΡΕΥΝΗΤΙΚΑ ΠΡΟΓΡΑΜΜΑΤΑ ΑΡΧΙΜΗΔΗΣ ΕΝΙΣΧΥΣΗ ΕΡΕΥΝΗΤΙΚΩΝ ΟΜΑΔΩΝ ΣΤΟ ΤΕΙ ΣΕΡΡΩΝ. Ενέργεια. 2.2.3.στ ΘΕΜΑ ΕΡΕΥΝΑΣ: ΔΙΑΡΘΡΩΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΕΧΡΩΜΩΝ ΕΓΓΡΑΦΩΝ ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ (Τ.Ε.Ι.) ΣΕΡΡΩΝ Τμήμα ΠΛΗΡΟΦΟΡΙΚΗΣ & ΕΠΙΚΟΙΝΩΝΙΩΝ ΕΡΕΥΝΗΤΙΚΑ ΠΡΟΓΡΑΜΜΑΤΑ ΑΡΧΙΜΗΔΗΣ ΕΝΙΣΧΥΣΗ ΕΡΕΥΝΗΤΙΚΩΝ ΟΜΑΔΩΝ ΣΤΟ ΤΕΙ ΣΕΡΡΩΝ Ενέργεια. 2.2.3.στ ΘΕΜΑ ΕΡΕΥΝΑΣ: ΔΙΑΡΘΡΩΣΗ

Διαβάστε περισσότερα

ΠΑΙΖΩ ΚΑΙ ΚΑΤΑΛΑΒΑΙΝΩ ΜΑΘΗΜΑΤΙΚΑ

ΠΑΙΖΩ ΚΑΙ ΚΑΤΑΛΑΒΑΙΝΩ ΜΑΘΗΜΑΤΙΚΑ 1oς ΚΥΚΛΟΣ - ΠΑΙΖΟΥΜΕ ΚΑΙ ΜΑΘΑΙΝΟΥΜΕ ΤΟΥΣ ΑΡΙΘΜΟΥΣ Α Ενότητα Ανακαλύπτουμε τις ιδιότητες των υλικών μας, τα τοποθετούμε σε ομάδες και διατυπώνουμε κριτήρια ομαδοποίησης Οι μαθητές μαθαίνουν να αναπτύσσουν

Διαβάστε περισσότερα

Σύμφωνα με το Ινστιτούτο Ρομποτικής της Αμερικής

Σύμφωνα με το Ινστιτούτο Ρομποτικής της Αμερικής ΡΟΜΠΟΤΙΚΗ: ΟΡΙΣΜΟΣ: Σύμφωνα με το Ινστιτούτο Ρομποτικής της Αμερικής, ρομπότ είναι ένας αναπρογραμματιζόμενος και πολυλειτουργικός χωρικός μηχανισμός σχεδιασμένος να μετακινεί υλικά, αντικείμενα, εργαλεία

Διαβάστε περισσότερα

Μετάδοση Πολυμεσικών Υπηρεσιών Ψηφιακή Τηλεόραση

Μετάδοση Πολυμεσικών Υπηρεσιών Ψηφιακή Τηλεόραση Χειμερινό Εξάμηνο 2013-2014 Μετάδοση Πολυμεσικών Υπηρεσιών Ψηφιακή Τηλεόραση 5 η Παρουσίαση : Ψηφιακή Επεξεργασία Εικόνας Διδάσκων: Γιάννης Ντόκας Σύνθεση Χρωμάτων Αφαιρετική Παραγωγή Χρώματος Χρωματικά

Διαβάστε περισσότερα

Αριθμητική εύρεση ριζών μη γραμμικών εξισώσεων

Αριθμητική εύρεση ριζών μη γραμμικών εξισώσεων Αριθμητική εύρεση ριζών μη γραμμικών εξισώσεων Με τον όρο μη γραμμικές εξισώσεις εννοούμε εξισώσεις της μορφής: f( ) 0 που προέρχονται από συναρτήσεις f () που είναι μη γραμμικές ως προς. Περιέχουν δηλαδή

Διαβάστε περισσότερα

2 ΟΥ και 7 ΟΥ ΚΕΦΑΛΑΙΟΥ

2 ΟΥ και 7 ΟΥ ΚΕΦΑΛΑΙΟΥ ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ ΠΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ ΠΕΡΙΒΑΛΛΟΝ ΕΠΙΜΕΛΕΙΑ: ΜΑΡΙΑ Σ. ΖΙΩΓΑ ΚΑΘΗΓΗΤΡΙΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΘΕΩΡΙΑ 2 ΟΥ και 7 ΟΥ ΚΕΦΑΛΑΙΟΥ ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΑΛΓΟΡΙΘΜΩΝ και ΔΟΜΗ ΑΚΟΛΟΥΘΙΑΣ 2.1 Να δοθεί ο ορισμός

Διαβάστε περισσότερα

Στα 1849 ο Sir David Brewster περιγράφει τη μακροσκοπική μηχανή λήψης και παράγονται οι πρώτες στερεοσκοπικές φωτογραφίες (εικ. 5,6).

Στα 1849 ο Sir David Brewster περιγράφει τη μακροσκοπική μηχανή λήψης και παράγονται οι πρώτες στερεοσκοπικές φωτογραφίες (εικ. 5,6). ΣΤΕΡΕΟΣΚΟΠΙΑ Η στερεοσκοπία είναι μια τεχνική που δημιουργεί την ψευδαίσθηση του βάθους σε μια εικόνα. Στηρίζεται στο ότι η τρισδιάστατη φυσική όραση πραγματοποιείται διότι κάθε μάτι βλέπει το ίδιο αντικείμενο

Διαβάστε περισσότερα

Περιεχόμενα. Κεφάλαιο 1 ΣΥΣΤΗΜΑΤΑ ΣΥΝΤΕΤΑΓΜΕΝΩΝ ΣΕ ΜΙΑ ΕΥΘΕΙΑ... 13 1.1 Οι συντεταγμένες ενός σημείου...13 1.2 Απόλυτη τιμή...14

Περιεχόμενα. Κεφάλαιο 1 ΣΥΣΤΗΜΑΤΑ ΣΥΝΤΕΤΑΓΜΕΝΩΝ ΣΕ ΜΙΑ ΕΥΘΕΙΑ... 13 1.1 Οι συντεταγμένες ενός σημείου...13 1.2 Απόλυτη τιμή...14 Περιεχόμενα Κεφάλαιο 1 ΣΥΣΤΗΜΑΤΑ ΣΥΝΤΕΤΑΓΜΕΝΩΝ ΣΕ ΜΙΑ ΕΥΘΕΙΑ... 13 1.1 Οι συντεταγμένες ενός σημείου...13 1.2 Απόλυτη τιμή...14 Κεφάλαιο 2 ΣΥΣΤΗΜΑΤΑ ΣΥΝΤΕΤΑΓΜΕΝΩΝ ΣΕ ΕΝΑ ΕΠΙΠΕΔΟ 20 2.1 Οι συντεταγμένες

Διαβάστε περισσότερα

Περιεχόμενα. Τοπογραφικό... 9 Σκάλα... 33 Φωτορεαλισμός... 57 Αντικείμενα... 91 Ανοίγματα... 95 Γραμμές... 99 Επεξεργασία... 103 Περιβάλλον...

Περιεχόμενα. Τοπογραφικό... 9 Σκάλα... 33 Φωτορεαλισμός... 57 Αντικείμενα... 91 Ανοίγματα... 95 Γραμμές... 99 Επεξεργασία... 103 Περιβάλλον... Περιεχόμενα Τοπογραφικό... 9 Σκάλα... 33 Φωτορεαλισμός... 57 Αντικείμενα... 91 Ανοίγματα... 95 Γραμμές... 99 Επεξεργασία... 103 Περιβάλλον... 111 Πρόλογος Στο κείμενο αυτό παρουσιάζονται οι νέες δυνατότητες

Διαβάστε περισσότερα

Εικόνες και γραφικά. Τεχνολογία Πολυµέσων 05-1

Εικόνες και γραφικά. Τεχνολογία Πολυµέσων 05-1 Εικόνες και γραφικά Περιγραφή στατικών εικόνων Αναπαράσταση γραφικών Υλικό γραφικών Dithering και anti-aliasing Σύνθεση εικόνας Ανάλυση εικόνας Μετάδοση εικόνας Τεχνολογία Πολυµέσων 05-1 Περιγραφή στατικών

Διαβάστε περισσότερα

Οδηγίες για το Geogebra Μωυσιάδης Πολυχρόνης Δόρτσιος Κώστας

Οδηγίες για το Geogebra Μωυσιάδης Πολυχρόνης Δόρτσιος Κώστας Οδηγίες για το Geogebra Μωυσιάδης Πολυχρόνης Δόρτσιος Κώστας Η πρώτη οθόνη μετά την εκτέλεση του προγράμματος διαφέρει κάπως από τα προηγούμενα λογισμικά, αν και έχει αρκετά κοινά στοιχεία. Αποτελείται

Διαβάστε περισσότερα

ΔΙΟΙΚΗΣΗ ΠΑΡΑΓΩΓΗΣ. ΕΝΟΤΗΤΑ 4η ΠΡΟΒΛΕΨΗ ΖΗΤΗΣΗΣ

ΔΙΟΙΚΗΣΗ ΠΑΡΑΓΩΓΗΣ. ΕΝΟΤΗΤΑ 4η ΠΡΟΒΛΕΨΗ ΖΗΤΗΣΗΣ ΤΕΙ ΚΡΗΤΗΣ ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΚΑΙ ΟΙΚΟΝΟΜΙΑΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΔΙΟΙΚΗΣΗ ΠΑΡΑΓΩΓΗΣ ΕΝΟΤΗΤΑ 4η ΠΡΟΒΛΕΨΗ ΖΗΤΗΣΗΣ ΓΙΑΝΝΗΣ ΦΑΝΟΥΡΓΙΑΚΗΣ ΕΠΙΣΤΗΜΟΝΙΚΟΣ ΣΥΝΕΡΓΑΤΗΣ ΤΕΙ ΚΡΗΤΗΣ ΔΟΜΗ ΠΑΡΟΥΣΙΑΣΗΣ 1. Εισαγωγή

Διαβάστε περισσότερα

Ηχρήση του χρώµατος στους χάρτες

Ηχρήση του χρώµατος στους χάρτες Ηχρήση του χρώµατος στους χάρτες Συµβατική χρήση χρωµάτων σε θεµατικούς χάρτες και «ασυµβατότητες» Γεωλογικοί χάρτες: Χάρτες γήινου ανάγλυφου: Χάρτες χρήσεων γης: Χάρτες πυκνότητας πληθυσµού: Χάρτες βροχόπτωσης:

Διαβάστε περισσότερα

4.3 Δραστηριότητα: Θεώρημα Fermat

4.3 Δραστηριότητα: Θεώρημα Fermat 4.3 Δραστηριότητα: Θεώρημα Fermat Θέμα της δραστηριότητας Η δραστηριότητα αυτή εισάγει το Θεώρημα Fermat και στη συνέχεια την απόδειξή του. Ακολούθως εξετάζεται η χρήση του στον εντοπισμό πιθανών τοπικών

Διαβάστε περισσότερα

1. Πειραματική διάταξη

1. Πειραματική διάταξη 1. Πειραματική διάταξη 1.1 Περιγραφή της διάταξης Η διάταξη του πειράματος αποτελείται από έναν αερόδρομο και ένα ή δύο κινητά τα οποία είναι συζευγμένα μέσω ελατήριου. Η κίνηση των ταλαντωτών καταγράφεται

Διαβάστε περισσότερα

Γραφικά & Οπτικοποίηση. Κεφάλαιο 1. Εισαγωγή. Γραφικά & Οπτικοπίηση: Αρχές & Αλγόριθμοι Κεφάλαιο 1

Γραφικά & Οπτικοποίηση. Κεφάλαιο 1. Εισαγωγή. Γραφικά & Οπτικοπίηση: Αρχές & Αλγόριθμοι Κεφάλαιο 1 Γραφικά & Οπτικοποίηση Κεφάλαιο 1 Εισαγωγή Ιστορικά Ιστορική ανασκόπηση : 2 Ιστορικά (2) Ρυθμοί ανάπτυξης CPU και GPU 3 Εφαρμογές Ειδικά εφέ για ταινίες & διαφημίσεις Επιστημονική εξερεύνηση μέσω οπτικοποίησης

Διαβάστε περισσότερα

Ερωτήσεις Απαντήσεις επανάληψης κεφ.9 (Πολυμέσα).

Ερωτήσεις Απαντήσεις επανάληψης κεφ.9 (Πολυμέσα). 14 ο Γυμνάσιο Περιστερίου 1 Ερωτήσεις Απαντήσεις επανάληψης κεφ.9 (Πολυμέσα). Μάθημα 9.1 Ο κόσμος των Πολυμέσων 1. Τι είναι μια Εφαρμογή Πολυμέσων. Λογισμικό στο οποίο χρησιμοποιούνται πολλά και διαφορετικά

Διαβάστε περισσότερα

Μοντέλα Παλινδρόμησης. Άγγελος Μάρκος, Λέκτορας ΠΤ Ε, ΠΘ

Μοντέλα Παλινδρόμησης. Άγγελος Μάρκος, Λέκτορας ΠΤ Ε, ΠΘ Μοντέλα Παλινδρόμησης Άγγελος Μάρκος, Λέκτορας ΠΤ Ε, ΠΘ Εισαγωγή (1) Σε αρκετές περιπτώσεις επίλυσης προβλημάτων ενδιαφέρει η ταυτόχρονη μελέτη δύο ή περισσότερων μεταβλητών, για να προσδιορίσουμε με ποιο

Διαβάστε περισσότερα

Ανάπτυξη δικτυακών εκπαιδευτικών παιχνιδιών πολλών χρηστών. Δ. Μετάφας. (Android, ipad κ.α.). Το παιχνίδι που θα επιλεγεί για την

Ανάπτυξη δικτυακών εκπαιδευτικών παιχνιδιών πολλών χρηστών. Δ. Μετάφας. (Android, ipad κ.α.). Το παιχνίδι που θα επιλεγεί για την 31 Ανάπτυξη δικτυακών εκπαιδευτικών παιχνιδιών πολλών χρηστών Δ. Μετάφας Στόχος της εργασίας είναι η ανάπτυξη δικτυακού εκπαιδευτικού παιχνιδιού πολλών χρηστών, ανεξάρτητο πλατφόρμας λειτουργικού συστήματος.

Διαβάστε περισσότερα

ΤΟΠΟΓΡΑΦΙΚΑ ΔΙΚΤΥΑ ΚΑΙ ΥΠΟΛΟΓΙΣΜΟΙ ΟΙ ΜΕΤΡΗΣΕΙΣ ΤΩΝ ΑΠΟΣΤΑΣΕΩΝ - ΠΡΟΕΠΕΞΕΡΓΑΣΙΑ

ΤΟΠΟΓΡΑΦΙΚΑ ΔΙΚΤΥΑ ΚΑΙ ΥΠΟΛΟΓΙΣΜΟΙ ΟΙ ΜΕΤΡΗΣΕΙΣ ΤΩΝ ΑΠΟΣΤΑΣΕΩΝ - ΠΡΟΕΠΕΞΕΡΓΑΣΙΑ ΤΟΠΟΓΡΑΦΙΚΑ ΔΙΚΤΥΑ ΚΑΙ ΥΠΟΛΟΓΙΣΜΟΙ ΟΙ ΜΕΤΡΗΣΕΙΣ ΤΩΝ ΑΠΟΣΤΑΣΕΩΝ - ΠΡΟΕΠΕΞΕΡΓΑΣΙΑ Βασίλης Δ. Ανδριτσάνος Δρ. Αγρονόμος - Τοπογράφος Μηχανικός ΑΠΘ Επίκουρος Καθηγητής ΤΕΙ Αθήνας 3ο εξάμηνο http://eclass.teiath.gr

Διαβάστε περισσότερα

Η Μηχανική Μάθηση στο Σχολείο: Μια Προσέγγιση για την Εισαγωγή της Ενισχυτικής Μάθησης στην Τάξη

Η Μηχανική Μάθηση στο Σχολείο: Μια Προσέγγιση για την Εισαγωγή της Ενισχυτικής Μάθησης στην Τάξη 6 ο Πανελλήνιο Συνέδριο «Διδακτική της Πληροφορικής» Φλώρινα, 20-22 Απριλίου 2012 Η Μηχανική Μάθηση στο Σχολείο: Μια Προσέγγιση για την Εισαγωγή της Ενισχυτικής Μάθησης στην Τάξη Σάββας Νικολαΐδης 1 ο

Διαβάστε περισσότερα

Συνήθεις διαφορικές εξισώσεις προβλήματα οριακών τιμών

Συνήθεις διαφορικές εξισώσεις προβλήματα οριακών τιμών Συνήθεις διαφορικές εξισώσεις προβλήματα οριακών τιμών Οι παρούσες σημειώσεις αποτελούν βοήθημα στο μάθημα Αριθμητικές Μέθοδοι του 5 ου εξαμήνου του ΤΜΜ ημήτρης Βαλουγεώργης Καθηγητής Εργαστήριο Φυσικών

Διαβάστε περισσότερα

Τμήμα Μηχανολόγων Μηχανικών Πανεπιστήμιο Θεσσαλίας ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ Η/Υ. Βήματα προς τη δημιουργία εκτελέσιμου κώδικα

Τμήμα Μηχανολόγων Μηχανικών Πανεπιστήμιο Θεσσαλίας ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ Η/Υ. Βήματα προς τη δημιουργία εκτελέσιμου κώδικα Τμήμα Μηχανολόγων Μηχανικών Πανεπιστήμιο Θεσσαλίας ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ Η/Υ Βήματα προς τη δημιουργία εκτελέσιμου κώδικα Ιωάννης Λυχναρόπουλος Μαθηματικός, MSc, PhD Βήματα προς τη δημιουργία εκτελέσιμου κώδικα

Διαβάστε περισσότερα

Εισαγωγή στα συστήματα σχεδιομελέτης και παραγωγής με χρήση υπολογιστή - Computer aided design and manufacture (cad/cam)

Εισαγωγή στα συστήματα σχεδιομελέτης και παραγωγής με χρήση υπολογιστή - Computer aided design and manufacture (cad/cam) 1 ΚΕΦΑΛΑΙΟ Εισαγωγή στα συστήματα σχεδιομελέτης και παραγωγής με χρήση υπολογιστή - Computer aided design and manufacture (cad/cam) Περιεχόμενα κεφαλαίου 1.4 Εξέλιξη συστημάτων Cad σελ. 20 1.1 Ορισμός

Διαβάστε περισσότερα

Στο προοπτικό ανάγλυφο για τη ευθεία του ορίζοντα χρησιμοποιούμε ένα δεύτερο κατακόρυφο επίπεδο Π 1

Στο προοπτικό ανάγλυφο για τη ευθεία του ορίζοντα χρησιμοποιούμε ένα δεύτερο κατακόρυφο επίπεδο Π 1 ΠΡΟΟΠΤΙΚΟ ΑΝΑΓΛΥΦΟ Το προοπτικό ανάγλυφο, όπως το επίπεδο προοπτικό, η στερεοσκοπική εικόνα κ.λπ. είναι τρόποι παρουσίασης και απεικόνισης των αρχιτεκτονικών συνθέσεων. Το προοπτικό ανάγλυφο είναι ένα

Διαβάστε περισσότερα

ΛΟΓΙΣΜΙΚΟ ΜΕΛΕΤΩΝ ΗΛΕΚΤΡΙΚΩΝ ΕΓΚΑΤΑΣΤΑΣΕΩΝ ΚΑΙ ΥΠΟΣΤΑΘΜΩΝ ΜΕΣΗΣ ΤΑΣΗΣ

ΛΟΓΙΣΜΙΚΟ ΜΕΛΕΤΩΝ ΗΛΕΚΤΡΙΚΩΝ ΕΓΚΑΤΑΣΤΑΣΕΩΝ ΚΑΙ ΥΠΟΣΤΑΘΜΩΝ ΜΕΣΗΣ ΤΑΣΗΣ ΛΟΓΙΣΜΙΚΟ ΜΕΛΕΤΩΝ ΗΛΕΚΤΡΙΚΩΝ ΕΓΚΑΤΑΣΤΑΣΕΩΝ ΚΑΙ ΥΠΟΣΤΑΘΜΩΝ ΜΕΣΗΣ ΤΑΣΗΣ Βασίλης Τσέτογλου, Ηλεκτρολόγος Μηχ/κός ΑΠΘ (Φρυγίας 30 Καβάλα, τηλ. 2510-241735, e-mail:vatset@panafonet.gr) ΠΕΡΙΛΗΨΗ Η συνεχής και

Διαβάστε περισσότερα

Κεφάλαιο 1. Εισαγωγή στα συστήματα σχεδιομελέτης και παραγωγής με χρήση υπολογιστή computer aided design and manufacture (cad/cam)

Κεφάλαιο 1. Εισαγωγή στα συστήματα σχεδιομελέτης και παραγωγής με χρήση υπολογιστή computer aided design and manufacture (cad/cam) Κεφάλαιο 1 Εισαγωγή στα συστήματα σχεδιομελέτης και παραγωγής με χρήση υπολογιστή computer aided design and manufacture (cad/cam) 1.1 Ορισμός σχεδιομελέτης και παραγωγής με χρήση υπολογιστή CAD (Computer

Διαβάστε περισσότερα

ΦΥΣΙΚΗ ΘΕΤΙΚΗΣ ΚΑΙ ΤΕΧΝΟΛΟΓΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ

ΦΥΣΙΚΗ ΘΕΤΙΚΗΣ ΚΑΙ ΤΕΧΝΟΛΟΓΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ ΦΥΣΙΚΗ ΘΕΤΙΚΗΣ ΚΑΙ ΤΕΧΝΟΛΟΓΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ 3 ο ΔΙΑΓΩΝΙΣΜΑ ΘΕΜΑΤΑ ΘΕΜΑ Α Στις ημιτελείς προτάσεις 1-4 να γράψετε στο τετράδιό σας τον αριθμό της πρότασης και δίπλα το γράμμα που αντιστοιχεί στη φράση,

Διαβάστε περισσότερα

TFT TV. Τι είναι οι TFT και πως λειτουργούν;

TFT TV. Τι είναι οι TFT και πως λειτουργούν; TFT TV Τι είναι οι TFT και πως λειτουργούν; Η ετυμολογία του όρου TFT (Thin Film Transistor ή τρανζίστορ λεπτού φιλμ) μας παραπέμπει στο δομικό στοιχείο ελέγχου της οθόνης, που είναι το τρανζίστορ. Οι

Διαβάστε περισσότερα

Κεφάλαιο 7 Ισομετρίες, Συμμετρίες και Πλακοστρώσεις Οπως είδαμε στην απόδειξη του πρώτου κριτηρίου ισότητας τριγώνων, ο Ευκλείδης χρησιμοποιεί την έννοια της εφαρμογής ενός τριγώνου σε ένα άλλο, χωρίς

Διαβάστε περισσότερα

I. ΜΙΓΑΔΙΚΟΙ ΑΡΙΘΜΟΙ. math-gr

I. ΜΙΓΑΔΙΚΟΙ ΑΡΙΘΜΟΙ. math-gr I ΜΙΓΑΔΙΚΟΙ ΑΡΙΘΜΟΙ i e ΜΕΡΟΣ Ι ΟΡΙΣΜΟΣ - ΒΑΣΙΚΕΣ ΠΡΑΞΕΙΣ Α Ορισμός Ο ορισμός του συνόλου των Μιγαδικών αριθμών (C) βασίζεται στις εξής παραδοχές: Υπάρχει ένας αριθμός i για τον οποίο ισχύει i Το σύνολο

Διαβάστε περισσότερα

Εισαγωγή Στοιχεία Θεωρίας

Εισαγωγή Στοιχεία Θεωρίας Εισαγωγή Σκοπός της άσκησης αυτής είναι η εισαγωγή στην τεχνογνωσία των οπτικών ινών και η μελέτη τους κατά τη διάδοση μιας δέσμης laser. Συγκεκριμένα μελετάται η εξασθένιση που υφίσταται το σήμα στην

Διαβάστε περισσότερα

ΓΕΩΜΕΤΡΙΚΗ ΟΠΤΙΚΗ. Ανάκλαση. Κάτοπτρα. Διάθλαση. Ολική ανάκλαση. Φαινόμενη ανύψωση αντικειμένου. Μετατόπιση ακτίνας. Πρίσματα

ΓΕΩΜΕΤΡΙΚΗ ΟΠΤΙΚΗ. Ανάκλαση. Κάτοπτρα. Διάθλαση. Ολική ανάκλαση. Φαινόμενη ανύψωση αντικειμένου. Μετατόπιση ακτίνας. Πρίσματα ΓΕΩΜΕΤΡΙΚΗ ΟΠΤΙΚΗ Ανάκλαση Κάτοπτρα Διάθλαση Ολική ανάκλαση Φαινόμενη ανύψωση αντικειμένου Μετατόπιση ακτίνας Πρίσματα ΓΕΩΜΕΤΡΙΚΗ ΟΠΤΙΚΗ - Ανάκλαση Επιστροφή σε «γεωμετρική οπτική» Ανάκλαση φωτός ονομάζεται

Διαβάστε περισσότερα

Γνωστική Ψυχολογία Ι (ΨΧ32)

Γνωστική Ψυχολογία Ι (ΨΧ32) Γνωστική Ψυχολογία Ι (ΨΧ32) Διάλεξη 6 Μηχανισμοί επεξεργασίας οπτικού σήματος Οι άλλες αισθήσεις Πέτρος Ρούσσος Η αντιληπτική πλάνη του πλέγματος Hermann 1 Πλάγια αναστολή Η πλάγια αναστολή (lateral inhibition)

Διαβάστε περισσότερα

Αριθμητικές μέθοδοι σε ταλαντώσεις μηχανολογικών συστημάτων

Αριθμητικές μέθοδοι σε ταλαντώσεις μηχανολογικών συστημάτων ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ Καθηγητής κ. Σ. Νατσιάβας Αριθμητικές μέθοδοι σε ταλαντώσεις μηχανολογικών συστημάτων Στοιχεία Φοιτητή Ονοματεπώνυμο: Νατσάκης Αναστάσιος Αριθμός Ειδικού Μητρώου:

Διαβάστε περισσότερα

ΦΩΤΟΡΕΑΛΙΣΜΟΣ & ΚΙΝΗΣΗ (ΘΕΩΡΙΑ)

ΦΩΤΟΡΕΑΛΙΣΜΟΣ & ΚΙΝΗΣΗ (ΘΕΩΡΙΑ) ΦΩΤΟΡΕΑΛΙΣΜΟΣ & ΚΙΝΗΣΗ ΔΙΔΑΣΚΩΝ : ΝΤΙΝΤΑΚΗΣ ΙΩΑΝΝΗΣ (MSC) Καθηγητής Εφαρμογών ΚΑΡΔΙΤΣΑ 2013 ΤΙ ΕΙΝΑΙ ΦΩΤΟΑΠΟΔΟΣΗ: ΕΝΝΟΟΥΜΕ ΤΗ ΔΙΑΔΙΚΑΣΙΑ ΚΑΘΟΡΙΣΜΟΥ ΟΛΩΝ ΕΚΕΙΝΩΝ ΤΩΝ ΣΤΟΙΧΕΙΩΝ ΚΑΙ ΠΑΡΑΜΕΤΡΩΝ ΩΣΤΕ ΝΑ ΕΧΟΥΜΕ

Διαβάστε περισσότερα

Λειτουργικά. Τεχνολογικό Εκπαιδευτικό Ίδρυμα Δυτικής Μακεδονίας Σιώζιος Κων/νος - Πληροφορική Ι

Λειτουργικά. Τεχνολογικό Εκπαιδευτικό Ίδρυμα Δυτικής Μακεδονίας Σιώζιος Κων/νος - Πληροφορική Ι Λειτουργικά Συστήματα 1 Λογισμικό του Υπολογιστή Για να λειτουργήσει ένας Η/Υ εκτός από το υλικό του, είναι απαραίτητο και το λογισμικό Το σύνολο των προγραμμάτων που συντονίζουν τις λειτουργίες του υλικού

Διαβάστε περισσότερα

ΤΕΧΝΙΚΗ ΜΗΧΑΝΙΚΗ Ι ΕΙΣΑΓΩΓΙΚΕΣ ΕΝΝΟΙΕΣ- ΥΝΑΜΕΙΣ ΣΤΟ ΕΠΙΠΕ Ο ΚΑΙ ΣΤΟ

ΤΕΧΝΙΚΗ ΜΗΧΑΝΙΚΗ Ι ΕΙΣΑΓΩΓΙΚΕΣ ΕΝΝΟΙΕΣ- ΥΝΑΜΕΙΣ ΣΤΟ ΕΠΙΠΕ Ο ΚΑΙ ΣΤΟ ΤΕΧΝΙΚΗ ΜΗΧΑΝΙΚΗ Ι ΕΙΣΑΓΩΓΙΚΕΣ ΕΝΝΟΙΕΣ- ΥΝΑΜΕΙΣ ΣΤΟ ΕΠΙΠΕ Ο ΚΑΙ ΣΤΟ ΧΩΡΟ Στη συνέχεια θα δοθούν ορισμένες βασικές έννοιες μαθηματικών και φυσικήςμηχανικής που είναι απαραίτητες για την κατανόηση του μαθήματος

Διαβάστε περισσότερα

ΦΥΛΛΟ ΕΡΓΑΣΙΑΣ: ΔΥΝΑΜΕΙΣ ΚΑΙ ΡΟΠΕΣ

ΦΥΛΛΟ ΕΡΓΑΣΙΑΣ: ΔΥΝΑΜΕΙΣ ΚΑΙ ΡΟΠΕΣ ΦΥΛΛΟ ΕΡΓΑΣΙΑΣ: ΔΥΝΑΜΕΙΣ ΚΑΙ ΡΟΠΕΣ Σ ένα στερεό ασκούνται ομοεπίπεδες δυνάμεις. Όταν το στερεό ισορροπεί, δηλαδή ισχύει ότι F 0 και δεν περιστρέφεται τότε το αλγεβρικό άθροισμα των ροπών είναι μηδέν Στ=0,

Διαβάστε περισσότερα

ΣΧΕΔΙΟ ΜΑΘΗΜΑΤΟΣ: ΜΑΘΗΜΑΤΙΚΑ ΣΤ ΔΗΜΟΤΙΚΟΥ «ΤΑ ΚΛΑΣΜΑΤΑ»

ΣΧΕΔΙΟ ΜΑΘΗΜΑΤΟΣ: ΜΑΘΗΜΑΤΙΚΑ ΣΤ ΔΗΜΟΤΙΚΟΥ «ΤΑ ΚΛΑΣΜΑΤΑ» ΣΧΕΔΙΟ ΜΑΘΗΜΑΤΟΣ: ΜΑΘΗΜΑΤΙΚΑ ΣΤ ΔΗΜΟΤΙΚΟΥ «ΤΑ ΚΛΑΣΜΑΤΑ» Νικόλαος Μπαλκίζας 1. ΕΙΣΑΓΩΓΗ Σκοπός του σχεδίου μαθήματος είναι να μάθουν όλοι οι μαθητές της τάξης τις έννοιες της ισοδυναμίας των κλασμάτων,

Διαβάστε περισσότερα

M m l B r mglsin mlcos x ml 2 1) Να εισαχθεί το µοντέλο στο simulink ορίζοντας από πριν στο MATLAB τις µεταβλητές Μ,m,br

M m l B r mglsin mlcos x ml 2 1) Να εισαχθεί το µοντέλο στο simulink ορίζοντας από πριν στο MATLAB τις µεταβλητές Μ,m,br ΑΣΚΗΣΗ 1 Έστω ένα σύστηµα εκκρεµούς όπως φαίνεται στο ακόλουθο σχήµα: Πάνω στη µάζα Μ επιδρά µια οριζόντια δύναµη F l την οποία και θεωρούµε σαν είσοδο στο σύστηµα. Έξοδος του συστήµατος θεωρείται η απόσταση

Διαβάστε περισσότερα

ΠΟΥ ΔΙΑΔΙΔΕΤΑΙ ΤΟ ΦΩΣ

ΠΟΥ ΔΙΑΔΙΔΕΤΑΙ ΤΟ ΦΩΣ 1 ΦΩΣ Στο μικρόκοσμο θεωρούμε ότι το φως έχει δυο μορφές. Άλλοτε το αντιμετωπίζουμε με τη μορφή σωματιδίων που ονομάζουμε φωτόνια. Τα φωτόνια δεν έχουν μάζα αλλά μόνον ενέργεια. Άλλοτε πάλι αντιμετωπίζουμε

Διαβάστε περισσότερα

Υπολογισμός της εστιακής απόστασης f λεπτού συμμετρικού συγκλίνοντος φακού απο τη γραμμική μεγέθυνση Μ

Υπολογισμός της εστιακής απόστασης f λεπτού συμμετρικού συγκλίνοντος φακού απο τη γραμμική μεγέθυνση Μ ΟΜΑΔΑ ΟΝΟΜΑΤΕΠΩΝΥΜΑ ΜΑΘΗΤΩΝ 1)... 2)... 3)... ΗΜΕΡΟΜΗΝΙΑ : Υπολογισμός της εστιακής απόστασης f λεπτού συμμετρικού συγκλίνοντος φακού απο τη γραμμική μεγέθυνση Μ Με το πείραµα αυτό θα προσδιορίσουµε: Σκοπός

Διαβάστε περισσότερα

Εκπαιδευτική Μονάδα 10.2: Εργαλεία χρονοπρογραμματισμού των δραστηριοτήτων.

Εκπαιδευτική Μονάδα 10.2: Εργαλεία χρονοπρογραμματισμού των δραστηριοτήτων. Εκπαιδευτική Μονάδα 10.2: Εργαλεία χρονοπρογραμματισμού των δραστηριοτήτων. Στην προηγούμενη Εκπαιδευτική Μονάδα παρουσιάστηκαν ορισμένα χρήσιμα παραδείγματα διαδεδομένων εργαλείων για τον χρονοπρογραμματισμό

Διαβάστε περισσότερα

minimath.eu Φυσική A ΛΥΚΕΙΟΥ Περικλής Πέρρος 1/1/2014

minimath.eu Φυσική A ΛΥΚΕΙΟΥ Περικλής Πέρρος 1/1/2014 minimath.eu Φυσική A ΛΥΚΕΙΟΥ Περικλής Πέρρος 1/1/014 minimath.eu Περιεχόμενα Κινηση 3 Ευθύγραμμη ομαλή κίνηση 4 Ευθύγραμμη ομαλά μεταβαλλόμενη κίνηση 5 Δυναμικη 7 Οι νόμοι του Νεύτωνα 7 Τριβή 8 Ομαλη κυκλικη

Διαβάστε περισσότερα

1. Ποια μεγέθη ονομάζονται μονόμετρα και ποια διανυσματικά;

1. Ποια μεγέθη ονομάζονται μονόμετρα και ποια διανυσματικά; ΚΕΦΑΛΑΙΟ 2 ο ΚΙΝΗΣΗ 2.1 Περιγραφή της Κίνησης 1. Ποια μεγέθη ονομάζονται μονόμετρα και ποια διανυσματικά; Μονόμετρα ονομάζονται τα μεγέθη τα οποία, για να τα προσδιορίσουμε πλήρως, αρκεί να γνωρίζουμε

Διαβάστε περισσότερα

Γραφικά Υπολογιστών: Μέθοδοι Ανίχνευσης Επιφανειών (Surface Detection Methods)

Γραφικά Υπολογιστών: Μέθοδοι Ανίχνευσης Επιφανειών (Surface Detection Methods) 1 ΤΕΙ Θεσσαλονίκης Τμήμα Πληροφορικής Γραφικά Υπολογιστών: Μέθοδοι Ανίχνευσης Επιφανειών (Surface Detection Methods) Πασχάλης Ράπτης http://aetos.it.teithe.gr/~praptis praptis@it.teithe.gr 2 Περιεχόμενα

Διαβάστε περισσότερα

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R, Επίκουρος Καθηγητής, Τομέας Μαθηματικών, Σχολή Εφαρμοσμένων Μαθηματικών και Φυσικών Επιστημών, Εθνικό Μετσόβιο Πολυτεχνείο. Περιεχόμενα Εισαγωγή στο

Διαβάστε περισσότερα

ΑΝΑΠΤΥΞΗ ΣΥΣΤΗΜΑΤΟΣ ΜΗΧΑΝΙΚΗΣ ΟΡΑΣΗΣ ΜΕ ΔΥΟ ΚΑΜΕΡΕΣ ΚΑΙ ΑΝΙΧΝΕΥΣΗ ΒΑΘΟΥΣ ΜΕ ΤΗ ΒΟΗΘΕΙΑ ΣΤΕΡΕΟΣΚΟΠΙΚΟΥ ΑΛΓΟΡΙΘΜΟΥ

ΑΝΑΠΤΥΞΗ ΣΥΣΤΗΜΑΤΟΣ ΜΗΧΑΝΙΚΗΣ ΟΡΑΣΗΣ ΜΕ ΔΥΟ ΚΑΜΕΡΕΣ ΚΑΙ ΑΝΙΧΝΕΥΣΗ ΒΑΘΟΥΣ ΜΕ ΤΗ ΒΟΗΘΕΙΑ ΣΤΕΡΕΟΣΚΟΠΙΚΟΥ ΑΛΓΟΡΙΘΜΟΥ 1 ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΚΕΝΤΡΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ ΕΔΡΑ ΣΕΡΡΕΣ ΣΧΟΛΗ ΤΕΧΝΟΛΟΓΙΚΩΝ ΕΦΑΡΜΟΓΩΝ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΠΛΗΡΟΦΟΡΙΚΗΣ Τ.Ε. ΑΝΑΠΤΥΞΗ ΣΥΣΤΗΜΑΤΟΣ ΜΗΧΑΝΙΚΗΣ ΟΡΑΣΗΣ ΜΕ ΔΥΟ ΚΑΜΕΡΕΣ ΚΑΙ ΑΝΙΧΝΕΥΣΗ ΒΑΘΟΥΣ

Διαβάστε περισσότερα

Γραφικά με Η/Υ / Εισαγωγή

Γραφικά με Η/Υ / Εισαγωγή Γραφικά με Η/Υ Εισαγωγή Πληροφορίες μαθήματος (1/4) Υπεύθυνος μαθήματος: Μανιτσάρης Αθανάσιος, Καθηγητής ιδάσκοντες: Μανιτσάρης Αθανάσιος: email: manits@uom.gr Μαυρίδης Ιωάννης: email: mavridis@uom.gr

Διαβάστε περισσότερα

ΜΕΛΕΤΗ ΒΑΣΙΚΩΝ ΣΥΝΑΡΤΗΣΕΩΝ

ΜΕΛΕΤΗ ΒΑΣΙΚΩΝ ΣΥΝΑΡΤΗΣΕΩΝ 5 ΜΕΛΕΤΗ ΒΑΣΙΚΩΝ ΣΥΝΑΡΤΗΣΕΩΝ Εισαγωγή Στο κεφάλαιο αυτό θα δούμε πώς, με τη βοήθεια των πληροφοριών που α- ποκτήσαμε μέχρι τώρα, μπορούμε να χαράξουμε με όσο το δυνατόν μεγαλύτερη ακρίβεια τη γραφική παράσταση

Διαβάστε περισσότερα

1.1. Κινηµατική Οµάδα Γ.

1.1. Κινηµατική Οµάδα Γ. 1.1. Οµάδα Γ. 1.1.21. Πληροφορίες από το διάγραµµα θέσης-χρόνου..ένα σώµα κινείται ευθύγραµµα και στο διάγραµµα βλέπετε τη θέση του σε συνάρτηση µε το χρόνο. i) Βρείτε την κλίση στο διάγραµµα x-t στις

Διαβάστε περισσότερα

Εισαγωγή. Γραφικά. Μοντέλο (Πληροφορίες για Περιεχόµενο εικόνας. Επεξεργασία Εικόνων. Εικόνα. Τεχνητή Όραση 1.1. Εργα: : 2000+1 & ΣΚΕΠΣΙΣ (ΕΠΕΑΚ

Εισαγωγή. Γραφικά. Μοντέλο (Πληροφορίες για Περιεχόµενο εικόνας. Επεξεργασία Εικόνων. Εικόνα. Τεχνητή Όραση 1.1. Εργα: : 2000+1 & ΣΚΕΠΣΙΣ (ΕΠΕΑΚ Εισαγωγή Μιάεικόνααξίζει1000 λέξεις : Ανθρώπινοοπτικόκανάλι: 30-40 Μbits/s (=64-85 M λέξεις /min µε 4 γράµµατα/λέξη, 7bits/γράµµα). Γραπτό κείµενο: 600-1200 λέξεις/min. 100.000 αποδοτικότερη επικοινωνία

Διαβάστε περισσότερα

Δύο κύριοι τρόποι παρουσίασης δεδομένων. Παράδειγμα

Δύο κύριοι τρόποι παρουσίασης δεδομένων. Παράδειγμα Δύο κύριοι τρόποι παρουσίασης δεδομένων Παράδειγμα Με πίνακες Με διαγράμματα Ονομαστικά δεδομένα Εδώ τα περιγραφικά μέτρα (μέσος, διάμεσος κλπ ) δεν έχουν νόημα Πήραμε ένα δείγμα από 25 άτομα και τα ρωτήσαμε

Διαβάστε περισσότερα

iii ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος

iii ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος iii ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος xi 1 Αντικείμενα των Πιθανοτήτων και της Στατιστικής 1 1.1 Πιθανοτικά Πρότυπα και Αντικείμενο των Πιθανοτήτων, 1 1.2 Αντικείμενο της Στατιστικής, 3 1.3 Ο Ρόλος των Πιθανοτήτων

Διαβάστε περισσότερα

Γεωμετρία, Αριθμοί και Μέτρηση

Γεωμετρία, Αριθμοί και Μέτρηση 1. Εισαγωγή Γεωμετρία, Αριθμοί και Μέτρηση Μαθαίνω Γεωμετρία και Μετρώ Παίζω με τους αριθμούς Βρίσκω τα πολλαπλάσια Το εκπαιδευτικό λογισμικό «Γεωμετρία, Αριθμοί και Μέτρηση» δίνει τη δυνατότητα στα παιδιά

Διαβάστε περισσότερα

9. Τοπογραφική σχεδίαση

9. Τοπογραφική σχεδίαση 9. Τοπογραφική σχεδίαση 9.1 Εισαγωγή Το κεφάλαιο αυτό εξετάζει τις παραμέτρους, μεθόδους και τεχνικές της τοπογραφικής σχεδίασης. Η προσέγγιση του κεφαλαίου γίνεται τόσο για την περίπτωση της συμβατικής

Διαβάστε περισσότερα

DIP_06 Συμπίεση εικόνας - JPEG. ΤΕΙ Κρήτης

DIP_06 Συμπίεση εικόνας - JPEG. ΤΕΙ Κρήτης DIP_06 Συμπίεση εικόνας - JPEG ΤΕΙ Κρήτης Συμπίεση εικόνας Το μέγεθος μιας εικόνας είναι πολύ μεγάλο π.χ. Εικόνα μεγέθους Α4 δημιουργημένη από ένα σαρωτή με 300 pixels ανά ίντσα και με χρήση του RGB μοντέλου

Διαβάστε περισσότερα

ΦΩΤΟΓΡΑΦΙΑ I Β Ενιαίου Λυκείου. (μάθημα ενδιαφέροντος)

ΦΩΤΟΓΡΑΦΙΑ I Β Ενιαίου Λυκείου. (μάθημα ενδιαφέροντος) ΦΩΤΟΓΡΑΦΙΑ I Β Ενιαίου Λυκείου (μάθημα ενδιαφέροντος) 1 ΓΕΝΙΚΟΙ ΣΚΟΠΟΙ ΚΑΙ ΣΤΟΧΟΙ Με τη διδασκαλία του μαθήματος επιδιώκεται η μύηση των μαθητών στον κόσμο της φωτογραφίας ώστε να: 1. Αντιλαμβάνονται οι

Διαβάστε περισσότερα

Φύση του φωτός. Θεωρούμε ότι το φως έχει διττή φύση: διαταραχή που διαδίδεται στο χώρο. μήκος κύματος φωτός. συχνότητα φωτός

Φύση του φωτός. Θεωρούμε ότι το φως έχει διττή φύση: διαταραχή που διαδίδεται στο χώρο. μήκος κύματος φωτός. συχνότητα φωτός Γεωμετρική Οπτική Φύση του φωτός Θεωρούμε ότι το φως έχει διττή φύση: ΚΥΜΑΤΙΚΗ Βασική ιδέα Το φως είναι μια Η/Μ διαταραχή που διαδίδεται στο χώρο Βασική Εξίσωση Φαινόμενα που εξηγεί καλύτερα (κύμα) μήκος

Διαβάστε περισσότερα

ΕΦΑΡΜΟΓΕΣ ΠΛΗΡΟΦΟΡΙΚΗΣ. Α Γενικού Λυκείου (Μάθημα Επιλογής)

ΕΦΑΡΜΟΓΕΣ ΠΛΗΡΟΦΟΡΙΚΗΣ. Α Γενικού Λυκείου (Μάθημα Επιλογής) ΕΦΑΡΜΟΓΕΣ ΠΛΗΡΟΦΟΡΙΚΗΣ Α Γενικού Λυκείου (Μάθημα Επιλογής) Σύγχρονα Υπολογιστικά Συστήματα τους υπερυπολογιστές (supercomputers) που χρησιμοποιούν ερευνητικά εργαστήρια τα μεγάλα συστήματα (mainframes)

Διαβάστε περισσότερα

ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ ΠΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ ΠΕΡΙΒΑΛΛΟΝ ΜΑΡΙΑ Σ. ΖΙΩΓΑ ΚΑΘΗΓΗΤΡΙΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΕΙΣΑΓΩΓΗ ΣΤΟΝ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟ

ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ ΠΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ ΠΕΡΙΒΑΛΛΟΝ ΜΑΡΙΑ Σ. ΖΙΩΓΑ ΚΑΘΗΓΗΤΡΙΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΕΙΣΑΓΩΓΗ ΣΤΟΝ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟ ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ ΠΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ ΠΕΡΙΒΑΛΛΟΝ ΕΠΙΜΕΛΕΙΑ: ΜΑΡΙΑ Σ. ΖΙΩΓΑ ΚΑΘΗΓΗΤΡΙΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΘΕΩΡΙΑ 6 ΟΥ ΚΕΦΑΛΑΙΟΥ ΕΙΣΑΓΩΓΗ ΣΤΟΝ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟ 6.1 Τι ονοµάζουµε πρόγραµµα υπολογιστή; Ένα πρόγραµµα

Διαβάστε περισσότερα

ΠΡΟΔΙΑΓΡΑΦΕΣ - ΟΔΗΓΙΕΣ ΔΙΑΜΟΡΦΩΣΗΣ ΘΕΜΑΤΩΝ ΓΙΑ ΤΟ ΜΑΘΗΜΑ

ΠΡΟΔΙΑΓΡΑΦΕΣ - ΟΔΗΓΙΕΣ ΔΙΑΜΟΡΦΩΣΗΣ ΘΕΜΑΤΩΝ ΓΙΑ ΤΟ ΜΑΘΗΜΑ ΠΡΟΔΙΑΓΡΑΦΕΣ - ΟΔΗΓΙΕΣ ΔΙΑΜΟΡΦΩΣΗΣ ΘΕΜΑΤΩΝ ΓΙΑ ΤΟ ΜΑΘΗΜΑ Μαθηματικά (Άλγεβρα - Γεωμετρία) Α ΤΑΞΗ ΗΜΕΡΗΣΙΟΥ και Α, Β ΤΑΞΕΙΣ ΕΣΠΕΡΙΝΟΥ ΓΕΝΙΚΟΥ ΛΥΚΕΙΟΥ Α ΤΑΞΗ ΗΜΕΡΗΣΙΟΥ και Α ΤΑΞΗ ΕΣΠΕΡΙΝΟΥ ΕΠΑΛ ΚΕΝΤΡΙΚΗ

Διαβάστε περισσότερα

Η κατασκευή με τις δύο πινέζες και το νήμα

Η κατασκευή με τις δύο πινέζες και το νήμα Η κατασκευή με τις δύο πινέζες και το νήμα Στη δραστηριότητα αυτή θα εξερευνήσετε ίσως την πλέον κοινή μέθοδο κατασκευής μιας έλλειψης. Προκειμένου να θέσετε το πλαίσιο για την κατασκευή αυτή, πρέπει να

Διαβάστε περισσότερα

ΕΡΓΑΣΤΗΡΙΟ ΔΥΝΑΜΙΚΗΣ ΜΗΧΑΝΩΝ

ΕΡΓΑΣΤΗΡΙΟ ΔΥΝΑΜΙΚΗΣ ΜΗΧΑΝΩΝ ΕΡΓΑΣΤΗΡΙΟ ΔΥΝΑΜΙΚΗΣ ΜΗΧΑΝΩΝ Εργαστηριακή Άσκηση 2 ΦΥΓΟΚΕΝΤΡΟΣ ΔΥΝΑΜΗ Ονοματεπώνυμο: Παριανού Θεοδώρα Όνομα Πατρός: Απόστολος Αριθμός μητρώου: 1000107 Ημερομηνία Διεξαγωγής: 05/12/11 Ημερομηνία Παράδοσης:

Διαβάστε περισσότερα

ΔΗΜΙΟΥΡΓΙΑ ΠΡΟΦΙΛ ΣΥΣΤΑΔΩΝ ΜΕ ΤΗ ΧΡΗΣΗ Η/Υ

ΔΗΜΙΟΥΡΓΙΑ ΠΡΟΦΙΛ ΣΥΣΤΑΔΩΝ ΜΕ ΤΗ ΧΡΗΣΗ Η/Υ ΔΗΜΙΟΥΡΓΙΑ ΠΡΟΦΙΛ ΣΥΣΤΑΔΩΝ ΜΕ ΤΗ ΧΡΗΣΗ Η/Υ ΑΤΕΙ ΚΑΒΑΛΑΣ ΠΑΡΑΡΤΗΜΑ ΔΡΑΜΑΣ ΤΜΗΜΑ ΔΑΣΟΠΟΝΙΑΣ ΚΑΙ ΔΙΑΧΕΙΡΙΣΗΣ ΦΥΣΙΚΟΥ ΠΕΡΙΒΑΛΛΟΝΤΟΣ ΚΑΔΑΣ ΜΑΡΙΟΣ 2008 ΕΥΧΑΡΙΣΤΙΕΣ Στον κ. Ι. Τάκο για την καθοδήγηση του σε όλη

Διαβάστε περισσότερα

Επεξεργασία Δεδομένων - Γραφικές Παραστάσεις

Επεξεργασία Δεδομένων - Γραφικές Παραστάσεις 1. Σκοπός Επεξεργασία Δεδομένων - Γραφικές Παραστάσεις Σκοπός της άσκησης είναι να εξοικειωθούν οι σπουδαστές με τη γραφική απεικόνιση των δεδομένων τους, την χρήση των γραφικών παραστάσεων για την εξαγωγή

Διαβάστε περισσότερα

ΕΣΔ 200: ΔΗΜΙΟΥΡΓΙΑ ΠΕΡΙΕΧΟΜΕΝΟΥ ΙΙ. Ακαδημαϊκό Έτος 2011 2012, Χειμερινό Εξάμηνο Διδάσκων Καθ.: Νίκος Τσαπατσούλης

ΕΣΔ 200: ΔΗΜΙΟΥΡΓΙΑ ΠΕΡΙΕΧΟΜΕΝΟΥ ΙΙ. Ακαδημαϊκό Έτος 2011 2012, Χειμερινό Εξάμηνο Διδάσκων Καθ.: Νίκος Τσαπατσούλης ΤΕΧΝΟΛΟΓΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ, ΤΜΗΜΑ ΕΠΙΚΟΙΝΩΝΙΑΣ & ΣΠΟΥΔΩΝ ΔΙΑΔΙΚΤΥΟΥ ΕΣΔ 200: ΔΗΜΙΟΥΡΓΙΑ ΠΕΡΙΕΧΟΜΕΝΟΥ ΙΙ Ακαδημαϊκό Έτος 2011 2012, Χειμερινό Εξάμηνο Διδάσκων Καθ.: Νίκος Τσαπατσούλης ΕΡΩΤΗΣΕΙΣ ΕΠΑΝΑΛΗΨΗΣ

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 18. 18 Μηχανική Μάθηση

ΚΕΦΑΛΑΙΟ 18. 18 Μηχανική Μάθηση ΚΕΦΑΛΑΙΟ 18 18 Μηχανική Μάθηση Ένα φυσικό ή τεχνητό σύστηµα επεξεργασίας πληροφορίας συµπεριλαµβανοµένων εκείνων µε δυνατότητες αντίληψης, µάθησης, συλλογισµού, λήψης απόφασης, επικοινωνίας και δράσης

Διαβάστε περισσότερα

ΠΛΗΡΟΦΟΡΙΚΗ: ΥΠΟΛΟΓΙΣΤΕΣ & ΤΕΧΝΟΛΟΓΙΕΣ ΔΙΑΔΙΚΤΥΟΥ

ΠΛΗΡΟΦΟΡΙΚΗ: ΥΠΟΛΟΓΙΣΤΕΣ & ΤΕΧΝΟΛΟΓΙΕΣ ΔΙΑΔΙΚΤΥΟΥ ΠΛΗΡΟΦΟΡΙΚΗ: ΥΠΟΛΟΓΙΣΤΕΣ & ΤΕΧΝΟΛΟΓΙΕΣ ΔΙΑΔΙΚΤΥΟΥ kv@hua.gr Στόχος Μαθήματος Εισαγωγή σε Βασικούς Όρους Πληροφορικής και Τηλεματικής. Εφαρμογές Τηλεματικής. Αναφορά στις κοινωνικές επιπτώσεις των Υπολογιστών.

Διαβάστε περισσότερα

ΓΕΩΜΕΤΡΙΑ Α ΤΑΞΗ ΗΜΕΡΗΣΙΟΥ ΓΕΝΙΚΟΥ ΛΥΚΕΙΟΥ ΔΙΔΑΚΤΕΑ ΕΞΕΤΑΣΤΕΑ ΥΛΗ

ΓΕΩΜΕΤΡΙΑ Α ΤΑΞΗ ΗΜΕΡΗΣΙΟΥ ΓΕΝΙΚΟΥ ΛΥΚΕΙΟΥ ΔΙΔΑΚΤΕΑ ΕΞΕΤΑΣΤΕΑ ΥΛΗ ΥΛΗ ΚΑΙ ΟΔΗΓΙΕΣ ΔΙΔΑΣΚΑΛΙΑΣ ΣΧΟΛ. ΕΤΟΣ 2014-15 ΓΕΩΜΕΤΡΙΑ Α ΤΑΞΗ ΗΜΕΡΗΣΙΟΥ ΓΕΝΙΚΟΥ ΛΥΚΕΙΟΥ ΔΙΔΑΚΤΕΑ ΕΞΕΤΑΣΤΕΑ ΥΛΗ Από το βιβλίο «Ευκλείδεια Γεωμετρία Α και Β Ενιαίου Λυκείου» των Αργυρόπουλου Η., Βλάμου

Διαβάστε περισσότερα

Β2.6 Άλλες Περιφερειακές Συσκευές και Κάρτες Επέκτασης

Β2.6 Άλλες Περιφερειακές Συσκευές και Κάρτες Επέκτασης Β2.6 Άλλες Περιφερειακές Συσκευές και Κάρτες Επέκτασης Τι θα μάθουμε σήμερα: Να αναγνωρίζουμε και να ονομάζουμε άλλες περιφερειακές συσκευές και κάρτες επέκτασης Να εντοπίζουμε τα κύρια χαρακτηριστικά

Διαβάστε περισσότερα

Digital Image Processing

Digital Image Processing Digital Image Processing Intensity Transformations Πέτρος Καρβέλης pkarvelis@gmail.com Images taken from: R. Gonzalez and R. Woods. Digital Image Processing, Prentice Hall, 2008. Image Enhancement: είναι

Διαβάστε περισσότερα

Συμπεριφορά συναρτήσεως σε κλειστές φραγμένες περιοχές. (x 0, y 0, f(x 0, y 0 ) z = L(x, y)

Συμπεριφορά συναρτήσεως σε κλειστές φραγμένες περιοχές. (x 0, y 0, f(x 0, y 0 ) z = L(x, y) 11.7. Aκρότατα και σαγματικά σημεία 903 39. Εκτίμηση μέγιστου σφάλματος Έστω ότι u e sin και ότι τα,, και μπορούν να μετρηθούν με μέγιστα δυνατά σφάλματα 0,, 0,6, και / 180, αντίστοιχα. Εκτιμήστε το μέγιστο

Διαβάστε περισσότερα

ΑΞΟΝΟΜΕΤΡΙΑ. Εισαγωγή

ΑΞΟΝΟΜΕΤΡΙΑ. Εισαγωγή ΑΞΟΝΟΜΕΤΡΙΑ Εισαγωγή Η προβολή τρισδιάστατου αντικειμένου πάνω σε δισδιάστατη επιφάνεια αποτέλεσε μια από τις βασικές αναζητήσεις μεθόδων απεικόνισης και απασχόλησε από πολύ παλιά τους ανθρώπους. Με την

Διαβάστε περισσότερα

Σενάριο με το λογισμικό modellus Πηγή: http://www.dapontes.gr/index.php?option=com_content&task=view&id=229&itemid=50 ΠΡΟΛΟΓΟΣ

Σενάριο με το λογισμικό modellus Πηγή: http://www.dapontes.gr/index.php?option=com_content&task=view&id=229&itemid=50 ΠΡΟΛΟΓΟΣ Σενάριο με το λογισμικό modellus Τίτλος: Πότε δύο τρένα έχουν την ελάχιστη απόσταση μεταξύ τους; Πηγή: http://www.dapontes.gr/index.php?option=com_content&task=view&id=229&itemid=50 ΠΡΟΛΟΓΟΣ Σε μια πρώτη

Διαβάστε περισσότερα

Εισαγωγή στην Ρομποτική

Εισαγωγή στην Ρομποτική Τμήμα Μηχανολογίας Τ.Ε.Ι. Κρήτης Εισαγωγή στην Ρομποτική 1 Γενική περιγραφή ρομποτικού βραχίονα σύνδεσμοι αρθρώσεις αρπάγη Περιστροφική Πρισματική Βάση ρομποτικού βραχίονα 3 Βασικές ρομποτικές αρθρώσεις

Διαβάστε περισσότερα

Τεχνικές Μείωσης Διαστάσεων. Ειδικά θέματα ψηφιακής επεξεργασίας σήματος και εικόνας Σ. Φωτόπουλος- Α. Μακεδόνας

Τεχνικές Μείωσης Διαστάσεων. Ειδικά θέματα ψηφιακής επεξεργασίας σήματος και εικόνας Σ. Φωτόπουλος- Α. Μακεδόνας Τεχνικές Μείωσης Διαστάσεων Ειδικά θέματα ψηφιακής επεξεργασίας σήματος και εικόνας Σ. Φωτόπουλος- Α. Μακεδόνας 1 Εισαγωγή Το μεγαλύτερο μέρος των δεδομένων που καλούμαστε να επεξεργαστούμε είναι πολυδιάστατα.

Διαβάστε περισσότερα

Κίνηση σε Ηλεκτρικό Πεδίο.

Κίνηση σε Ηλεκτρικό Πεδίο. Κίνηση σε Ηλεκτρικό Πεδίο. 3.01. Έργο κατά την μετακίνηση φορτίου. Στις κορυφές Β και Γ ενόςισοπλεύρου τριγώνου ΑΒΓ πλευράς α= 2cm, βρίσκονται ακλόνητα δύο σηµειακά ηλεκτρικά φορτία q 1 =2µC και q 2 αντίστοιχα.

Διαβάστε περισσότερα

ΠΡΟΓΡΑΜΜΑ ΕΞΕΤΑΣΕΩΝ. Διατάξεις Ημιαγωγών. Ηλ. Αιθ. 013. Αριθμητικές Μέθοδοι Διαφορικών Εξισώσεων Ηλ. Αιθ. 013

ΠΡΟΓΡΑΜΜΑ ΕΞΕΤΑΣΕΩΝ. Διατάξεις Ημιαγωγών. Ηλ. Αιθ. 013. Αριθμητικές Μέθοδοι Διαφορικών Εξισώσεων Ηλ. Αιθ. 013 ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ & ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ Ακαδημαϊκό Έτος 2014-2015 Περίοδος Φεβρουαρίου 2015 ΠΡΟΓΡΑΜΜΑ ΕΞΕΤΑΣΕΩΝ ΗΜΕΡΟΜΗΝΙΑ ΩΡΑ 1ο-2ο ΕΞΑΜΗΝΟ 3ο-4ο ΕΞΑΜΗΝΟ 5ο-6ο

Διαβάστε περισσότερα

8. Σύνθεση και ανάλυση δυνάμεων

8. Σύνθεση και ανάλυση δυνάμεων 8. Σύνθεση και ανάλυση δυνάμεων Βασική θεωρία Σύνθεση δυνάμεων Συνισταμένη Σύνθεση δυνάμεων είναι η διαδικασία με την οποία προσπαθούμε να προσδιορίσουμε τη δύναμη εκείνη που προκαλεί τα ίδια αποτελέσματα

Διαβάστε περισσότερα

Πληρουορική Γ Γσμμασίοσ

Πληρουορική Γ Γσμμασίοσ Πληρουορική Γ Γσμμασίοσ Προγραμματισμός και Αλγόριθμοι Από το και τημ Χελώμα στημ Ευριπίδης Βραχνός http://evripides.mysch.gr/ 2014 2015 1 Προγραμματισμός Ζάννειο Πρότυπο Πειραματικό Γυμνάσιο Πειραιά Ενότητα:

Διαβάστε περισσότερα

Απλά θα είναι μαζί σας...

Απλά θα είναι μαζί σας... Απλά θα είναι μαζί σας... κάθε φορά που χρειάζεστε ζεστό νερό! Τα μπόιλερ με αντλία θερμότητας της ADTHERM εχουν σχεδιαστεί για παραγωγή ζεστού νερού χρήσης με τα ακόλουθα χαρακτηριστικά: COP ΕΩΣ 3,2 ΒΑΣΙΖΟΜΕΝΟ

Διαβάστε περισσότερα

ΒΙΟΜΗΧΑΝΙΚΕΣ ΕΦΑΡΜΟΓΕΣ. Μηχανική όραση Cognex... για μέγιστη αξιοπιστία στην παραγωγή. Τρόφιμα & Ποτά

ΒΙΟΜΗΧΑΝΙΚΕΣ ΕΦΑΡΜΟΓΕΣ. Μηχανική όραση Cognex... για μέγιστη αξιοπιστία στην παραγωγή. Τρόφιμα & Ποτά ΒΙΟΜΗΧΑΝΙΚΕΣ ΕΦΑΡΜΟΓΕΣ Μηχανική όραση Cognex... για μέγιστη αξιοπιστία στην παραγωγή. Τρόφιμα & Ποτά Ένα ευρύ φάσμα λύσεων Οι αισθητήρες μηχανικής όρασης της Cognex παρέχουν στη βιομηχανία τροφίμων & ποτών

Διαβάστε περισσότερα

Υπάρχουν πολλά είδη Ηλιακών Ρολογιών. Τα σημαντικότερα και συχνότερα απαντόμενα είναι:

Υπάρχουν πολλά είδη Ηλιακών Ρολογιών. Τα σημαντικότερα και συχνότερα απαντόμενα είναι: ΗΛΙΑΚΑ ΩΡΟΛΟΓΙΑ Υπάρχουν πολλά είδη Ηλιακών Ρολογιών. Τα σημαντικότερα και συχνότερα απαντόμενα είναι: Οριζόντια Κατακόρυφα Ισημερινά Το παρακάτω άρθρο αναφέρεται στον τρόπο λειτουργίας αλλά και κατασκευής

Διαβάστε περισσότερα

Α.2 Μαθησιακά Αποτελέσματα Έχοντας ολοκληρώσει επιτυχώς το μάθημα οι εκπαιδευόμενοι θα είναι σε θέση να:

Α.2 Μαθησιακά Αποτελέσματα Έχοντας ολοκληρώσει επιτυχώς το μάθημα οι εκπαιδευόμενοι θα είναι σε θέση να: ΒΑΣΙΚΕΣ ΠΛΗΡΟΦΟΡΙΕΣ Τίτλος Μαθήματος Μεθοδολογίες και Συστήματα Βιομηχανικής Αυτοματοποίησης Κωδικός Μαθήματος Μ3 Θεωρία / Εργαστήριο Θεωρία + Εργαστήριο Πιστωτικές μονάδες 4 Ώρες Διδασκαλίας 2Θ+1Ε Τρόπος/Μέθοδοι

Διαβάστε περισσότερα

Κεφάλαιο 4: Λογισμικό Συστήματος

Κεφάλαιο 4: Λογισμικό Συστήματος Κεφάλαιο 4: Λογισμικό Συστήματος Ερωτήσεις 1. Να αναφέρετε συνοπτικά τις κατηγορίες στις οποίες διακρίνεται το λογισμικό συστήματος. Σε ποια ευρύτερη κατηγορία εντάσσεται αυτό; Το λογισμικό συστήματος

Διαβάστε περισσότερα