«FACE RECOGNITION (ΑΝΑΓΝΩΡΙΣΗ ΠΡΟΣΩΠΟΥ) ΤΕΧΝΙΚΕΣ ΣΕ 2D»

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "«FACE RECOGNITION (ΑΝΑΓΝΩΡΙΣΗ ΠΡΟΣΩΠΟΥ) ΤΕΧΝΙΚΕΣ ΣΕ 2D»"

Transcript

1 Τεχνολογικό Εκπαιδευτικό Ίδρυµα Κρήτης Σχολή Τεχνολογικών Εφαρµογών Τµήµα Εφαρµοσµένης Πληροφορικής & Πολυµέσων ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ «FACE RECOGNITION (ΑΝΑΓΝΩΡΙΣΗ ΠΡΟΣΩΠΟΥ) ΤΕΧΝΙΚΕΣ ΣΕ 2D» Μαλακωνάκης Ανδρέας (ΑΜ: 1966) Φραγκιουδάκη Μαρία (ΑΜ: 2070) Επιβλέπων καθηγητής: Τριανταφυλλίδης Γεώργιος Επιτροπή Αξιολόγησης: Ηµεροµηνία παρουσίασης:

2 ΕΥΧΑΡΙΣΤΙΕΣ Θα θέλαµε να ευχαριστήσουµε θερµά τον Καθηγητή µας Κο Τριανταφυλλίδη Γεώργιο για την επίβλεψη της πτυχιακής µας εργασίας. Οι συµβουλές του και η καθοδήγησή του υπήρξαν καθοριστικές για την ολοκλήρωσή της. Τµήµα Εφαρµοσµένης Πληροφορικής & Πολυµέσων 2

3 ABSTRACT Applications that require the identification of a person continuously proliferate and with them increases the need for using methods of certification will not require people to remember complicated passwords or carry magnetic cards, identification cards or other documents to verify their identities. The use of biometric methods of certification, ie methods based on identification of natural features or characteristics of human behavior is the solution to this problem. Among the various biometric methods used, such as iris, fingerprint, hand geometry, the gait, the voice, the way of typing, signing, etc., the face recognition (face recognition) is definitely one of the friendly the user, because essentially mimics the way that people use to recognize one another. Τµήµα Εφαρµοσµένης Πληροφορικής & Πολυµέσων 3

4 ΣΥΝΟΨΗ Οι εφαρµογές που απαιτούν την εξακρίβωση της ταυτότητας ενός ατόµου πολλαπλασιάζονται συνεχώς και µαζί µε αυτές αυξάνεται η ανάγκη για τη χρήση µεθόδων πιστοποίησης που δεν θα απαιτούν από τους ανθρώπους να θυµούνται πολύπλοκους κωδικούς πρόσβασης ή να µεταφέρουν µαγνητικές κάρτες, ταυτότητες ή άλλου είδους έγγραφα που θα επαληθεύουν την ταυτότητα τους. Η χρήση βιοµετρικών µεθόδων πιστοποίησης, δηλαδή µεθόδων που στηρίζονται στην αναγνώριση φυσικών χαρακτηριστικών ή χαρακτηριστικών της συµπεριφοράς του ανθρώπου είναι η λύση σε αυτό το πρόβληµα. Μεταξύ των διαφόρων βιοµετρικών µεθόδων που χρησιµοποιούνται, όπως η ίριδα, τα δακτυλικά αποτυπώµατα, η γεωµετρία της παλάµης, το βάδισµα, η φωνή, ο τρόπος πληκτρολόγησης, η υπογραφή, κτλ, η αναγνώριση προσώπου (face recognition) είναι σίγουρα µία από τις φιλικότερες προς το χρήστη, γιατί ουσιαστικά µιµείται τον τρόπο που χρησιµοποιούν οι άνθρωποι για να αναγνωρίζουν ο ένας τον άλλο. Τµήµα Εφαρµοσµένης Πληροφορικής & Πολυµέσων 4

5 ΠΙΝΑΚΑΣ ΠΕΡΙΕΧΟΜΕΝΩΝ Σελ.: ABSTRACT.. 3 ΣΥΝΟΨΗ 4 ΠΙΝΑΚΑΣ ΣΧΗΜΑΤΩΝ 8 ΛΙΣΤΑ ΕΙΚΟΝΩΝ...10 ΛΙΣΤΑ ΠΙΝΑΚΩΝ ΕΙΣΑΓΩΓΗ ΑΝΑΓΝΩΡΙΣΗ ΠΡΟΣΩΠΟΥ - ΤΕΧΝΙΚΕΣ ΠΡΟΒΛΗΜΑΤΑ Αναγνώριση προσώπων Τεχνικές αναγνώρισης προσώπων Αναπαράσταση Αναπαράσταση προσώπων - Εξαγωγή χαρακτηριστικών Αναπαράσταση προσώπων µε χρήση των τιµών της κλίµακας του γκρι Γεωµετρικά χαρακτηριστικά από εικόνες εµπρόσθιας όψης και προφίλ Υβριδική αναπαράσταση ιανυσµατική αναπαράσταση των εικόνων προσώπου Principal Component Analysis Independent Component Analysis Αναπαράσταση των εικόνων προσώπου µε ICA Αναγνώριση εκφράσεων µε Support Vector Machines Προβλήµατα αναγνώρισης προσώπων Προβλήµατα Στατικής και υναµικής ταύτισης Προβλήµατα στατικής ταύτισης Τµήµα Εφαρµοσµένης Πληροφορικής & Πολυµέσων 5

6 3. ΑΝΑΓΝΩΡΙΣΗ ΠΡΟΣΩΠΟΥ ΜΕ ΤΕΧΝΙΚΕΣ 2D Ανίχνευση προσώπου σε 2 εικόνες Ανίχνευση προσώπου µε χρήση αλγορίθµων που βασίζονται στη γνώση Ανίχνευση προσώπου µε χρήση αλγορίθµων που βασίζονται στα χαρακτηριστικά Ανίχνευση προσώπου µε χρήση αλγορίθµων που βασίζονται στη σύγκριση περιγραµµάτων Ανίχνευση προσώπου µε χρήση καθολικών αλγορίθµων Αναγνώριση προσώπου από 2 εικόνες Καθολικές τεχνικές Τεχνικές που βασίζονται στα χαρακτηριστικά Υβριδικές τεχνικές ΑΝΑΓΝΩΡΙΣΗ ΠΡΟΣΩΠΟΥ ΜΕ ΤΕΧΝΙΚΕΣ 3D Αναγνώριση προσώπου από 3 εικόνες Μέθοδοι που στηρίζονται στον αλγόριθµο πρωτευουσών Συνιστωσών Μέθοδοι που στηρίζονται στην ανάλυση της καµπυλότητας ΠΕΙΡΑΜΑΤΙΚΟ ΜΕΡΟΣ Η ιστορία του Matlab: Tι είναι το Matlab; Το γραφικό περιβάλλον GUI Αναγνώριση Προσώπου Με τη Χρήση Matlab Ο Αλγόριθµος που χρησιµοποιήθηκε Η βάση των Ιδιοπροσώπων Απλοποιώντας την αρχική βάση ιδιοπροσώπων Η Φύση των Εικόνων που χρησιµοποιήθηκαν Αποβάλλοντας το Φόντο Κλίµακα (Μέγεθος Κεφαλιού) & Σταθερότητα Προσανατολισµού Κατανοµή στο ιάστηµα Προσώπου Πολλαπλές Όψεις Η Ανάπτυξη του Συστήµατος 78 Τµήµα Εφαρµοσµένης Πληροφορικής & Πολυµέσων 6

7 5.5. Η εφαρµογή Πειραµατικά Αποτελέσµατα Σενάριο Α: Πλάγιες Όψεις Σενάριο Β: Πρόσωπο µε Γυαλιά Σενάριο Γ: Πρόσωπο µε Γυαλιά και Καπέλο Σενάριο : Πρόσωπο µε Αλλαγές στο Φόντο Σενάριο Ε: Πρόσωπο µε Αλλαγές στο Τριχωτό της Κεφαλής ΜΕΛΛΟΝΤΙΚΗ ΕΞΕΛΙΞΗ ΣΥΜΠΕΡΑΣΜΑΤΑ 104 ΒΙΒΛΙΟΓΡΑΦΙΑ Τµήµα Εφαρµοσµένης Πληροφορικής & Πολυµέσων 7

8 Πίνακας Σχηµάτων Σελ. Σχήµα 1: Αρχιτεκτονική συστηµάτων αναγνώρισης προσώπων και εκφράσεων Σχήµα 2: (α) και (β) Συσκευές καταγραφής βάθους.. 18 Σχήµα 3: Σύστηµα συντεταγµένων µε βάση τη φωτογραφία 20 Σχήµα 4: Ολοκληρωµατικές προβολές 23 Σχήµα 5: Αναπαράσταση προσώπου ως άθροισµα ιδιοδιανυσµάτων.. 24 Σχήµα 6: Σηµεία σε προφίλ και frontal views 29 Σχήµα 7: Image Synthesis Model. 36 Σχήµα 8: εκατέσσερις στατιστικά ανεξάρτητες συνιστώσες ενός συνόλου εικόνων της βάσης Σχήµα 9: Η αναπαράσταση ICA αποτελείται από τους συντελεστές b του γραµµικού συνδυασµού των ανεξάρτητων εικόνων βάσης u που συνθέτουν κάθε εικόνα προσώπου Σχήµα 10: (α) Mug shot φωτογραφία (front view) (β) Mug shot φωτογραφία (profile) (γ) (δ) Φωτογραφίες σε διπλώµατα οδήγησης, διαβατήρια κλπ.. 44 Σχήµα 11: Παραδείγµατα ενδοατοµικών παραλλαγών (intrapersonal variations), δηλαδή παραλλαγών που εµφανίζονται σε διαφορετικές εικόνες του ίδιου προσώπου. Η εµφάνιση ενός προσώπου µπορεί να µεταβληθεί σηµαντικά λόγω παραγόντων όπως η πόζα, ο φωτισµός, οι εκφράσεις, το µακιγιάζ, το χτένισµα, η χρήση γυαλιών, καπέλων, κτλ, αλλά και λόγω της φυσιολογικής γήρανσης του ανθρώπου 51 Σχήµα 12: Παραδείγµατα έγχρωµων εικόνων του προσώπου και των αντίστοιχων χαρτών βάθους. Στους χάρτες βάθους οι πιο σκούρες αποχρώσεις του γκρι αντιστοιχούν σε σηµεία του προσώπου που απέχουν µικρότερη απόσταση από το επίπεδο της κάµερας, ενώ οι πιο ανοιχτές αποχρώσεις αντιστοιχούν σε σηµεία που απέχουν µεγαλύτερη απόσταση από την κάµερα 52 Σχήµα 13: Ανίχνευση προσώπου µε χρήση ιδιοπροσώπων και ιδιοχαρακτηριστικών. Από αριστερά προς τα δεξιά: α) αρχική εικόνα, β) εκτίµηση της θέσης και της κλίµακας του µεγέθους του κεφαλιού µε χρήση ιδιοπροσώπων, γ) κεντράρισµα του προσώπου στην εικόνα, δ) ακριβής προσδιορισµός της θέσης των µατιών, της µύτης και του στόµατος µε χρήση Τµήµα Εφαρµοσµένης Πληροφορικής & Πολυµέσων 8

9 ιδιοχαρακτηριστικών και ε) η περιοχή του προσώπου µετά την κανονικοποίηση. 57 Σχήµα 14: Μοντελοποίηση του ανθρώπινου προσώπου µε χρήση ένθετων Κρυφών Μοντέλων Markov (1η εικόνα), εξαγωγή των διανυσµάτων παρατήρησης σαρώνοντας την εικόνα από αριστερά προς τα δεξιά και από πάνω προς τα κάτω µε ένα παράθυρο σταθερών διαστάσεων και σύγκλιση των καταστάσεων του ΕΗΜΜ, οι οποίες όπως φαίνεται αντιστοιχούν σε οµογενείς περιοχές ή χαρακτηριστικά του προσώπου 60 Σχήµα 15: Παραδείγµατα 3 απεικονίσεων του προσώπου: α) 2 έγχρωµη εικόνα, β) εικόνα βάθους (range or depth image), γ) 3 επιφάνεια του προσώπου, δ) 3 επιφάνεια του προσώπου µε πληροφορία υφής, ε) 3 πλέγµα που αναπαριστά το πρόσωπο και πληροφορία υφής και στ) 3 επιφάνεια του προσώπου ως νέφος σηµείων Σχήµα 16: Επισκόπηση του Μatlab Σχήµα 17: Ένα ισχυρό σύστηµα ανίχνευσης µπορεί να παραγάγει τις σωστές αντιστοιχίες όταν το πρόσωπο αισθάνεται ευτυχές ή λυπηµένο 70 Σχήµα 18: Παράδειγµα Εικόνων από τη Βάση εδοµένων. 72 Σχήµα 19: Μέσο πρόσωπο από τη βάση 72 Σχήµα 20: Τα κορυφαία δέκα ιδιοπρόσωπα της Βάσης µας Σχήµα 21: (a)original image (b)the corresponding face map, where low values(dark areas) indicate the presence of a face 76 Σχήµα 22 : ιάγραµµα ανάπτυξης του Συστήµατος. 78 Σχήµα 23 : ιάγραµµα Ροής του Συστήµατος 79 Τµήµα Εφαρµοσµένης Πληροφορικής & Πολυµέσων 9

10 Λίστα Εικόνων Σελ. Εικόνα 1: Το πρόγραµµα κατά την εκκίνηση.. 80 Εικόνα 2: Κουµπί Load image from File.. 81 Εικόνα 3 : Επιλογή φακέλου.. 81 Εικόνα 4 : Επιλογή εικόνας 82 Εικόνα 5 : Άνοιγµα εικόνας 82 Εικόνα 6 : Κουµπί Capture Image. 83 Εικόνα 7: Κουµπί Add Image To Database 83 Εικόνα 8 : Πληκτρολόγηση αριθµού κλάσης 84 Εικόνα 9 : Πληκτρολόγηση αριθµού κλάσης 84 Εικόνα 10 : Κουµπί Face Recognition. 85 Εικόνα 11 : Αποτέλεσµα στο Command Window 85 Εικόνα 12 : Στοιχεία Ατόµου 86 Εικόνα 13 : Κουµπί Database Info Εικόνα 14 : Άτοµα καταχωρηµένα στη βάση 87 Εικόνα 15 : Κουµπί Delete Database Εικόνα 16 : Εντολή διαγραφής αφού πατηθεί το κουµπί 88 Εικόνα 17 : Επιβεβαίωση διαγραφής.. 88 Εικόνα 18 : Κουµπί Exit 89 Εικόνα 19: Πρόσωπο στη βάση Εικόνα 20 : Πρόσωπο στη βάση Εικόνα 21: Πρόσωπο στη βάση Εικόνα 22 : Πρόσωπο στη βάση Εικόνα 23: Πρόσωπο στη βάση Εικόνα 24 : Πρόσωπο στη βάση Εικόνα 25: Πρόσωπο στη βάση Εικόνα 26 : Πρόσωπο στη βάση Εικόνα 27: Πρόσωπο στη βάση Εικόνα 28 : Πρόσωπο στη βάση Εικόνα 29 : Αναγνώριση Εικόνα 30 : Αποτέλεσµα Τµήµα Εφαρµοσµένης Πληροφορικής & Πολυµέσων 10

11 Εικόνα 31 : Στοιχεία Ατόµου Εικόνα 32 : Αναγνώριση Εικόνα 33 : Αποτέλεσµα Εικόνα 34 : Στοιχεία Ατόµου Εικόνα 35 : Αναγνώριση Εικόνα 36 : Αποτέλεσµα Εικόνα 37 : Στοιχεία Ατόµου Εικόνα 38 : Αναγνώριση Εικόνα 39 : Αποτέλεσµα Εικόνα 40 : Στοιχεία Ατόµου 99 Εικόνα 41 : Αναγνώριση. 100 Εικόνα 42 : Αποτέλεσµα. 101 Εικόνα 43 : Στοιχεία Ατόµου Τµήµα Εφαρµοσµένης Πληροφορικής & Πολυµέσων 11

12 Λίστα Πινάκων Σελ. Πίνακας 1: εδοµένα που χρησιµοποιήθηκαν σε διάφορες µελέτες αναγνώρισης προσώπων.. 20 Πίνακας 2: Χαρακτηριστικά που χρησιµοποιήθηκαν σε παλαιότερες µελέτες αναγνώρισης προσώπων Πίνακας 3: Αναγνώριση προσώπων σε διάφορες αναλύσεις και µε χρήση 5 διαφορετικών µετρικών Πίνακας 4: Αναγνώριση προσώπων σε διάφορες αναλύσεις και µε χρήση 5 διαφορετικών µετρικών. Επιτυχής θεωρείται η αναγνώριση αν η προς έλεγχο φωτογραφία και κάποια από τις τρεις πλησιέστερες προς αυτήν αποθηκευµένες ανήκουν στο ίδιο πρόσωπο 27 Πίνακας 5: Αναγνώριση προσώπων σε διάφορες αναλύσεις και µε χρήση 5 διαφορετικών µετρικών. Επιτυχής θεωρείται η αναγνώριση αν η προς έλεγχο φωτογραφία και κάποια από τις πέντε πλησιέστερες προς αυτήν αποθηκευµένες ανήκουν στο ίδιο πρόσωπο 28 Πίνακας 6: Χαρακτηριστικά για την περιγραφή του προσώπου d(i,j) είναι η Ευκλείδεια απόσταση ανάµεσα στα σηµεία i και j 30 Τµήµα Εφαρµοσµένης Πληροφορικής & Πολυµέσων 12

13 1. ΕΙΣΑΓΩΓΗ Ένα σύστηµα αναγνώρισης προσώπου (Facial Recognition System) είναι µια εφαρµογή πληροφορικής για αυτόµατη αναγνώριση ή επαλήθευση ενός προσώπου είτε από µια ψηφιακή εικόνα, είτε από ένα καρέ βίντεο. Ένας από τους τρόπους για να πραγµατοποιηθεί η αναγνώριση, είναι συγκρίνοντας επιλεγµένα χαρακτηριστικά του προσώπου από την εικόνα και µιας βάσης δεδοµένων. Χρησιµοποιείται συνήθως σε συστήµατα ασφαλείας και µπορεί να συγκριθεί µε άλλα βιοµετρικά στοιχεία, όπως δακτυλικά αποτυπώµατα ή συστήµατα αναγνώρισης ίριδας µατιού. Το πρόβληµα της αναγνώρισης προσώπου είναι βασικά ένα πρόβληµα ταξινόµησης όπου κάθε πρόσωπο στη βάση δεδοµένων αναπαριστά µια κατηγορία στην οποία τα εισερχόµενα δεδοµένα πρόκειται να αντιστοιχιστούν. Το πρόβληµα της ταξινόµησης επιδεινώνεται µε το µέγεθος των δεδοµένων. Κατά τα τελευταία δέκα χρόνια περίπου, η αναγνώριση προσώπου έχει γίνει ένα δηµοφιλές θέµα έρευνας και µελέτης για τους επιστήµονες στο χώρο των υπολογιστών και επίσης µια από τις πιο πετυχηµένες εφαρµογές ανάλυσης εικόνας και κατανόηση αυτής. Λόγω της φύσης του προβλήµατος, δεν είναι µόνο ερευνητές της επιστήµης των υπολογιστών που ενδιαφέρονται για το θέµα αυτό, αλλά νευροεπιστήµονες και ψυχολόγοι επίσης. Κίνητρο για τη διεξαγωγή αυτής της πτυχιακής εργασίας υπήρξε ο συνεχώς αυξανόµενος ρόλος που διαδραµατίζει η τεχνολογία σε όλους τους τοµείς της κοινωνίας µας. Ενώ µέχρι πρόσφατα η αναγνώριση προσώπων ήταν δύσκολη υπόθεση στις µέρες µας ολοένα και περισσότερες τεχνικές αναπτύσσονται µε αξιόλογα αποτελέσµατα. Σκοπός αυτής της πτυχιακής εργασίας είναι να παρουσιάσει και να εξετάσει όσο γίνεται πιο αναλυτικά κάποιες απ τις τεχνικές αυτές, και συγκεκριµένα την αναγνώριση προσώπων µε τις τεχνικές 2D και 3D, και κατόπιν να διατυπωθούν τα συµπεράσµατα. Η εργασία αποτελείται από έξι κεφάλαια. Το πρώτο κεφάλαιο κάνει µια γενική εισαγωγή στο θέµα και παρουσιάζει τους στόχους της εργασίας. Το δεύτερο κεφάλαιο αναφέρεται στην αναγνώριση προσώπου, στις τεχνικές αλλά και στα προβλήµατα που δηµιουργούν αυτές. Το τρίτο κεφάλαιο αναλύει τις τεχνικές 2D που χρησιµοποιούνται για την αναγνώριση προσώπων. Το τέταρτο κεφάλαιο εξετάζει την αναγνώριση προσώπων µέσα από τις τεχνικές 3D. Τµήµα Εφαρµοσµένης Πληροφορικής & Πολυµέσων 13

14 Στο πέµπτο κεφάλαιο ακολουθεί µία εφαρµογή σχετική µε το θέµα. Στο έκτο κεφάλαιο γίνεται λόγο για την µελλοντική εξέλιξη αυτών των τεχνικών αναγνώρισης προσώπων. Η εργασία τελειώνει µε την παράθεση των συµπερασµάτων. Τµήµα Εφαρµοσµένης Πληροφορικής & Πολυµέσων 14

15 2. ΑΝΑΓΝΩΡΙΣΗ ΠΡΟΣΩΠΟΥ - ΤΕΧΝΙΚΕΣ ΠΡΟΒΛΗΜΑΤΑ 2.1. Αναγνώριση προσώπων Η σηµασία του ανθρώπινου προσώπου δεν είναι µόνο ανατοµική και λειτουργική, αλλά έχει επιπλέον ένα γενικότερο ατοµικό και διαπροσωπικό ρόλο. Αποτελεί για κάθε άνθρωπο ένα εντελώς ιδιαίτερο γνώρισµα, του οποίου η σπουδαιότητα έχει κοινωνικές, ψυχολογικές, καλλιτεχνικές και φιλοσοφικές προεκτάσεις. Η αναγνώριση προσώπου αποτελεί µια εναλλακτική πρόταση ταυτοποίησης ανθρώπων χωρίς τη χρήση εγγράφων, όπως είναι τα δακτυλικά αποτυπώµατα, η ίριδα του µατιού κ.ά. Ο όρος αναγνώριση προσώπων αναφέρεται σε δυο διαφορετικά σενάρια εφαρµογής: την ταυτοποίηση (identification) και την πιστοποίηση (verification ή authentication). 1,2 Και στις δυο περιπτώσεις, πριν από την αναγνώριση λαµβάνει χώρα το στάδιο της καταγραφής (enrollment) των εικόνων των οποίων η ταυτότητα ή/και η έκφραση είναι γνωστή. Κατά την καταγραφή υπολογίζονται τα χαρακτηριστικά (features) των προσώπων και αποθηκεύονται σε µια βάση δεδοµένων που αποτελεί τη συλλογή (gallery) του συστήµατος. Μετά την καταγραφή το σύστηµα µπορεί να δεχτεί νέα άγνωστα πρόσωπα δοκιµής (probe faces) και να αναγνωρίσει την ταυτότητα ή την έκφραση τους. Στην περίπτωση της ταυτοποίησης το σύστηµα καλείται να βρει την ταυτότητα του ατόµου της συλλογής στο οποίο ανήκει η εικόνα δοκιµής. Το σύστηµα απαντά στο ερώτηµα "ποιος είναι;" ο εικονιζόµενος. Εδώ υπάρχουν δύο ακόµα υποπεριπτώσεις, η ταυτοποίηση ανοιχτού και κλειστού συνόλου. Με τον όρο κλειστό σύνολο εννοούµε ότι η εικόνα δοκιµής ανήκει σε κάποιο από τα άτοµα της συλλογής, ενώ µε τον όρο ανοιχτό εννοούµε ότι η εικόνα δοκιµής µπορεί να ανήκει και σε άτοµο που δεν έχει προηγουµένως καταγραφεί στη συλλογή. Στην πρώτη περίπτωση, το σύστηµα συγκρίνει την εικόνα δοκιµής µία προς µία µε όλες τις εικόνες συλλογής για τον καθορισµό ενός µέτρου οµοιότητας (similarity score), σύµφωνα µε το οποίο αποφασίζει σε ποιο άτοµο ανήκει η εικόνα δοκιµής. Στη δεύτερη περίπτωση το καλύτερο µέτρο οµοιότητας συγκρίνεται και µε ένα κατώφλι (threshold) για να ελεγχθεί µήπως η εικόνα δοκιµής δεν ανήκει σε κανένα από τα άτοµα της συλλογής. Σε κάθε δοκιµή λοιπόν κατασκευάζεται ένας µονοδιάστατος πίνακας από τα µέτρα οµοιότητας της εικόνας δοκιµής µε κάθε εικόνα συλλογής, Τµήµα Εφαρµοσµένης Πληροφορικής & Πολυµέσων 15

16 στη συνέχεια τα άτοµα της συλλογής κατατάσσονται µε φθίνουσα σειρά των µέτρων οµοιότητας και τέλος επιστρέφεται η ταυτότητα του ατόµου µε το καλύτερο µέτρο. 1,2 Στην πιστοποίηση, το σύστηµα αναγνώρισης προσώπων καλείται να εξακριβώσει αν η ταυτότητα που επικαλείται κάποιος χρήστης είναι αληθής ή όχι, καλείται δηλαδή να απαντήσει στο ερώτηµα "είναι πράγµατι αυτός που ισχυρίζεται ότι είναι;" κι έτσι να διακρίνει αν πρόκειται για εξουσιοδοτηµένη χρήση (legitimate user) ή για πλαστο-προσωπία (impostor). Για να γίνει αυτό, η εικόνα δοκιµής συγκρίνεται µε τις εικόνες συλλογής του ατόµου του οποίου η ταυτότητα επικαλείται και στη συνέχεια το µέτρο οµοιότητας που προκύπτει συγκρίνεται µε ένα κατώφλι για την αποδοχή ή όχι του αιτήµατος. Ενώ λοιπόν η ταυτοποίηση είναι µια διαδικασία σύγκρισης ένα-προς πολλά (1:Ν), η πιστοποίηση είναι µια διαδικασία σύγκρισης ένα προς ένα (1:1) κι έχει δυαδικό αποτέλεσµα: Ναι, Όχι. Η απόδοση ενός συστήµατος πιστοποίησης εξαρτάται από την επιλογή του κατωφλίου, γιατί αυτό καθορίζει τη συναλλαγή (trade-off) ανάµεσα στην ασφάλεια και την άνεση του χρήστη. Όσο υψηλότερο είναι το κατώφλι τόσο πιο αυστηρό γίνεται το σύστηµα και η ασφάλεια αυξάνεται. Ταυτόχρονα όµως αυξάνεται και η πιθανότητα να απορριφθούν εξουσιοδοτηµένοι χρήστες µε αποτέλεσµα το σύστηµα να γίνεται λιγότερο φιλικό προς το χρήστη. Το αντίστροφο συµβαίνει όταν µειώνεται το κατώφλι. Αυτή η συµπεριφορά του συστήµατος κωδικοποιείται στη χαρακτηριστική λειτουργίας δέκτη (Receiver Operating Charaeterietie-ROC) που δείχνει την τιµή του ρυθµού εσφαλµένης αποδοχής (False Accept Rate-FAR) και του ρυθµού εσφαλµένης απόρριψης (False Reject Rate-FRR) για κάθε τιµή του κατωφλίου. 1,2 Οι δυνατότητες της γεωµετρίας του προσώπου για την αναγνώριση προσώπων και εκφράσεων ουσιαστικά άρχισαν να ερευνώνται µόλις τα δέκα περίπου τελευταία χρόνια. Το υψηλό κόστος των αισθητήρων σε συνδυασµό µε τη χαµηλή ποιότητα των δεδοµένων που παρήγαγαν και το µεγάλο χρόνο απόκρισης οδήγησαν τη πλειοψηφία των ερευνητών στη χρήση έγχρωµων εικόνων ή εικόνων φωτεινότητας και την ανάπτυξη φωτοµετρικών (photometry) µεθόδων αναγνώρισης. Στον τοµέα της αναγνώρισης προσώπων προτάθηκε ένας τεράστιος αριθµός τεχνικών, πολλές από τις οποίες έχουν ήδη χρησιµοποιηθεί για την ανάπτυξη εµπορικών συστηµάτων. Με την πρόοδο των αισθητήρων βάθους τα τελευταία χρόνια και τη διαθεσιµότητα δεδοµένων στην επιστηµονική κοινότητα για την διεξαγωγή πειραµάτων, η έρευνα γύρω από την 2 ή 3 αναγνώριση προσώπων και εκφράσεων δέχτηκε σηµαντική ώθηση. Τµήµα Εφαρµοσµένης Πληροφορικής & Πολυµέσων 16

17 Σχήµα 1: Αρχιτεκτονική συστηµάτων αναγνώρισης προσώπων και εκφράσεων Όλα τα συστήµατα αναγνώρισης προτύπων ακολουθούν µια τυπική αρχιτεκτονική που περιλαµβάνει τέσσερα βασικά στάδια επεξεργασίας: α) τη λήψη µετρήσεων για κάποιες από τις ιδιότητες του αντικειµένου, β) την προ-επεξεργασία των µετρήσεων για τη µείωση του θορύβου ή την κανονικοποίηση των µετρήσεων, γ) την εξαγωγή χαρακτηριστικών µε τα οποία γίνεται η διάκριση των προτύπων και δ) την ταξινόµηση, που περιλαµβάνει τη σύγκριση των χαρακτηριστικών του αντικειµένου είτε µε κάποια κατώφλια είτε µε αντίστοιχα προ-αποθηκευµένα χαρακτηριστικά γνωστών αντικειµένων, ώστε να αποφασιστεί σε ποια κλάση κατατάσσεται το αντικείµενο. 1,2 Τα συστήµατα 3 αναγνώρισης προσώπων και εκφράσεων ακολουθούν την ίδια τυπική αρχιτεκτονική µε την επιπλέον ιδιαιτερότητα ότι τα δυο πρώτα στάδια, της καταγραφής του βάθους και της προ-επεξεργασίας, είναι ακριβώς τα ίδια, ενώ τα στάδια της εξαγωγής χαρακτηριστικών και της ταξινόµησης χρησιµοποιούν παρόµοιες τεχνικές. Η καταγραφή της επιφάνειας του προσώπου γίνεται µε µεθόδους που µπορούν να χωριστούν σε δυο µεγάλες κατηγορίες, τις ενεργητικές και τις παθητικές. Οι ενεργητικές µέθοδοι στηρίζονται στο φωτισµό της επιφάνειας µε ένα γνωστό πρότυπο φωτός (light pattern). Το πρότυπο φωτός προβάλλεται µέσω ενός προβολέα πάνω στο αντικείµενο και µια κάµερα συλλαµβάνει το είδωλο του. Στη συνέχεια, για κάθε σηµείο της επιφάνειας υπολογίζεται η αντίστοιχη θέση του πάνω στην εικόνα και µέσω αυτής της αντιστοιχίας και απλών τριγωνοµετρικών υπολογισµών εκτιµάται η απόσταση του σηµείου από το επίπεδο της κάµερας. Το πρότυπο φωτός µπορεί να είναι ένα απλό σηµείο ή µια γραµµή. Επειδή όµως η χρήση τόσο απλών προτύπων καταλήγει σε χρονοβόρες διαδικασίες αντιστοίχησης, τελευταία Τµήµα Εφαρµοσµένης Πληροφορικής & Πολυµέσων 17

18 χρησιµοποιούνται πιο πολύπλοκα πρότυπα που επιτρέπουν παράλληλη επεξεργασία, όπως πλέγµατα ή χρωµατικά κωδικοποιηµένες λωρίδες. Επίσης για να µην ενοχλείται ο χρήστης από την προβολή φωτός, γίνονται προσπάθειες για την αντικατάσταση των ορατών προτύπων από υπέρυθρες ακτίνες Σχήµα 2α. 1,2,26 Οι παθητικοί αισθητήρες χρησιµοποιούν στερεοσκοπικές µεθόδους για τον υπολογισµό του βάθους, στηρίζονται δηλαδή στην επεξεργασία δυο ή περισσότερων εικόνων του αντικειµένου από διαφορετικές όψεις. Το κύριο πρόβληµα σ' αυτές τις µεθόδους είναι το πρόβληµα της αντιστοίχησης, η εύρεση δηλαδή των εικονοστοιχείων (pixels) σε όλες τις εικόνες που αντιστοιχούν στο ίδιο 3 σηµείο της επιφάνειας. Για την επίλυση του, συνήθως χρησιµοποιείται η µέθοδος της οπτικής ροής (optical flow) σε συνδυασµό µε επιπολικούς περιορισµούς που περιορίζουν το εύρος της αναζήτησης. Ένα µειονέκτηµα της συγκεκριµένης µεθόδου είναι ότι δεν µπορεί να εφαρµοστεί για αντικείµενα που δε διαθέτουν υφή (texture). Αυτό βέβαια µπορεί να αντιµετωπιστεί εφαρµόζοντας ενεργητικές τεχνικές προβολής κατάλληλου πρότυπου υφής. Το ανθρώπινο πρόσωπο περιέχει αρκετή πληροφορία για την επίλυση του προβλήµατος της αντιστοίχησης χωρίς να χρειάζεται η προβολή προτύπου υφής. Στο Σχήµα 2β. φαίνεται ένας στερεοσκοπικός αισθητήρας που χρησιµοποιεί δυο όψεις του προσώπου για την εξαγωγή του βάθους. 1,2 Σχήµα 2: (α) και (β) Συσκευές καταγραφής βάθους Η επιλογή του αισθητήρα εξαρτάται κυρίως από την εφαρµογή για την οποία προορίζεται. Γενικά, είναι θέµα συµβιβασµού ανάµεσα στην ταχύτητα, το κόστος και την ποιότητα των παραγόµενων δεδοµένων. Οι παθητικοί αισθητήρες είναι ταχύτεροι και Τµήµα Εφαρµοσµένης Πληροφορικής & Πολυµέσων 18

19 φθηνότεροι, αλλά παράγουν δεδοµένα µε περισσότερο θόρυβο. Από την άλλη πλευρά, οι ενεργητικοί αισθητήρες είναι πιο ακριβείς, αλλά είναι ακριβότεροι και απαιτούν την ακινητοποίηση του χρήστη για το διάστηµα της καταγραφής. Οι δυο τεχνικές στηρίζονται σε φωτοµετρικές µεθόδους (2 ) για την εκτίµηση του βάθους. Αυτό σηµαίνει ότι ενώ το βάθος εν γένει δεν εξαρτάται από τις συνθήκες φωτισµού, ωστόσο η καταγραφή (sensing) του µπορεί να επηρεάζεται από αυτές. 1,2, Τεχνικές αναγνώρισης προσώπων Η διαδικασία της αναγνώρισης µπορεί να διαιρεθεί σε τρία διαδοχικά στάδια: Σε µια δοσµένη εικόνα ερευνάται, αν αυτή απεικονίζει κάποιο πρόσωπο, το οποίο και εξάγεται από τον περιβάλλοντα χώρο. Κατόπιν έχουµε αναπαράσταση του προσώπου µε την εξαγωγή διαφόρων χαρακτηριστικών ώστε να µειωθεί η διάσταση του προβλήµατος. Τέλος ακολουθεί η διαδικασία της ταυτοποίησης του προσώπου µε κάποιο υπάρχον στη βάση ή η προσθήκη του σε αυτήν. Η έρευνα στην αναγνώριση προσώπων ξεκίνησε από τα µέσα του περασµένου αιώνα από τον Francis Galton. 3,4,30 Στη περίπτωση της ταυτοποίησης η θέση του προσώπου είναι εκ των προτέρων γνωστή ή µπορεί να εκτιµηθεί µε ευριστικό τρόπο. Σε πολλές περιπτώσεις ισχυρές παραδοχές τίθενται για να διευκολύνουν το πρόβληµα της ταυτοποίησης: Το απεικονιζόµενο πρόσωπο είναι σε εµπρόσθια όψη ή σε πλάγια όψη (προφίλ). Με την παραδοχή αυτή είναι ευκολότερο να εντοπιστούν τα βασικά χαρακτηριστικά του. Το πρόσωπο έχει µηδενική ή πολύ µικρή κλίση (περί τον άξονα z που περνά από το κέντρο της φωτογραφίας - Σχήµα 3). εν υπάρχει επικάλυψη τµήµατος του προσώπου. Τα µαλλιά δεν επικαλύπτουν τµήµα του προσώπου, το πρόσωπο δεν φορά σκούρα γυαλιά και δεν υπάρχουν ουλές σε αυτό. Οι περισσότερες από τις βάσεις δεδοµένων που έχουν χρησιµοποιηθεί αποτελούνται από λευκούς άνδρες και περιλαµβάνουν σχετικά µικρό αριθµό φωτογραφιών. Τµήµα Εφαρµοσµένης Πληροφορικής & Πολυµέσων 19

20 Σχήµα 3. Σύστηµα συντεταγµένων µε βάση τη φωτογραφία Πίνακας 1: εδοµένα που χρησιµοποιήθηκαν σε διάφορες µελέτες αναγνώρισης προσώπων Αναφορά Πλήθος Ανάλυση Κβαντισµός Σχόλια Φωτογραφιών Χρώµατος Baron x480 6 bpp Η ανάλυση µειώθηκε σε 128x120 Buhr x512 8 bpp Campell x256 6 bpp Craw et al x128 - Ο έλεγχος έγινε σε µόνο 20 πρόσωπα Goldstein et al Προφίλ τα οποία σχεδιάστηκαν από ζωγράφους Harmon et al άνδρες +27 γυναίκες Harmon et al άνδρες +49 γυναίκες Kaufman x356 1 bpp - Nixon 6 128x128 8 bpp - Petajan - 244x248 - Για εντοπισµό χειλιών µόνο Riccia Τα δεδοµένα εισάγονται από τον χρήστη Wong 6 256x256 8 bpp - Wu and Huang Olivetti R.L x92 8 bpp 40 πρόσωπα από 10 φωτογραφίες το καθένα Τµήµα Εφαρµοσµένης Πληροφορικής & Πολυµέσων 20

21 Στον πίνακα 1. δίνονται στοιχεία για τις βάσεις εικόνων και τη µορφή των δεδοµένων που χρησιµοποιήθηκαν, σε διάφορες εργασίες. Όπου λείπουν στοιχεία αυτά δεν αναφέρονται στη συγκεκριµένη εργασία. Σε πολλές περιπτώσεις τα δεδοµένα εισόδου στο σύστηµα δηµιουργήθηκαν χειρωνακτικά (manually). 3,4, Αναπαράσταση ύο είδη αναπαραστάσεων χρησιµοποιούνται στη αναγνώριση και ταυτοποίηση προσώπων: ισδιάστατοι πίνακες τιµών και διανύσµατα χαρακτηριστικών (τα χαρακτηριστικά εδώ δεν αναφέρονται στα χαρακτηριστικά του προσώπου αλλά σε κάποιες τιµές οι οποίες περιγράφουν µε αποτελεσµατικό τρόπο τη δοµή του) Αναπαράσταση προσώπων - Εξαγωγή χαρακτηριστικών Αποδοτική αναπαράσταση ενός προσώπου θεωρείται κάθε αναπαράσταση η οποία µειώνει τη διάσταση της εικόνας διατηρώντας όσο το δυνατό µεγαλύτερο όγκο πληροφορίας. Σε πολλές από τις αρχικές µελέτες η αναπαράσταση των προσώπων γινόταν µε χρήση γεωµετρικών χαρακτηριστικών, όπως αποστάσεων, γωνιών και λόγων αποστάσεων µεταξύ βασικών σηµείων του προσώπου. Τέτοια σηµεία έπρεπε να µπορούν να εντοπίζονται εύκολα και µε ακρίβεια. Μια τέτοια αντιµετώπιση δε λαµβάνει υπόψη πληροφορία από την υφή του προσώπου, γεγονός που οδήγησε στην επέκταση του συνόλου των χρησιµοποιούµενων χαρακτηριστικών συµπεριλαµβάνοντας σε αυτά και πληροφορία υφής, είτε µε άµεση µορφή (πίνακες φωτεινότητας διαφόρων περιοχών), είτε µε χρήση στατιστικών µεγεθών (moment invariants), είτε µε τη βοήθεια κάποιων µετασχηµατισµών (Fourier descriptors). Με τον όρο χαρακτηριστικά αναφερόµαστε σε κάθε αναπαράσταση του προσώπου σε µικρότερη διάσταση, είτε αυτή γίνεται µε γεωµετρικά µεγέθη, είτε µε πίνακες, είτε µε στατιστικά µεγέθη. Με αυτό υπόψη µπορούµε να διακρίνουµε τέσσερις κατηγορίες: Τµήµα Εφαρµοσµένης Πληροφορικής & Πολυµέσων 21

22 Οπτικά χαρακτηριστικά. Στη κατηγορία αυτή περιλαµβάνονται τα γεωµετρικά µεγέθη, οι πίνακες περιγραφής της υφής περιοχών, οι ακµές κοκ.. Η εξαγωγή τέτοιων χαρακτηριστικών βασίζεται σε παραδοσιακές τεχνικές της επεξεργασίας εικόνας όπως το χωρικό φιλτράρισµα, η ταύτιση µε πρότυπο, τα ενεργά περιγράµµατα -active contours-κοκ. 3,4 Στον Πίνακα 2 παρουσιάζονται τέτοια χαρακτηριστικά, τα περισσότερα από τα οποία έχουν χρησιµοποιηθεί κατά κόρον σε παλαιότερες µελέτες. Πίνακας 2: Χαρακτηριστικά που χρησιµοποιήθηκαν σε παλαιότερες µελέτες αναγνώρισης προσώπων Κατηγορία Συνολικά Μάτια Βλέφαρα Φρύδια Χείλη Στόµα Μύτη Αυτιά Μαλλιά Μάγουλα Αποστάσεις Χαρακτηριστικά Ύψος, περίγραµµα, εµβαδόν, κέντρο βάρους Σχήµα, χρώµα, εµβαδόν, άνοιγµα, κέντρο, φωτεινότητα γύρω από την ίριδα, Ό(άνω βλέφαρο, κάτω βλέφαρο), Ό(εσωτερική γωνία µατιού, εξωτερική γωνία µατιού), Ό(κέντρο αριστερού µατιού, κέντρο δεξιού µατιού), Ό(εξωτερική γωνία αριστερού µατιού, εξωτερική γωνία δεξιού µατιού) Εµβαδόν, απόσταση από την καµπύλη του µατιού Πάχος, Ό(µάτι, φρύδι) Πάχος, σχήµα, πρότυπο, πλάτος Πρότυπο, πλάτος, µήκος, εµβαδόν, άνοιγµα Πρότυπο, σχήµα, πλάτος, µήκος, εµβαδόν ρουθουνιών Μήκος, σχήµα, εµβαδόν Χρώµα, υφή, περιοχή κάλυψης προσώπου, µήκος Φωτεινότητα, υφή Πλάτος προσώπου στο ύψος των µατιών, Ό(πηγούνι, γραµµή µατιών), Ό(πηγούνι, κέντρο χειλιών), Ό(µάτια, γραµµή µαλλιών), Ό(µάτια, κέντρο µύτης), Ό(κορυφή πηγουνιού, κέντρο προσώπου), Ό(αριστερή ακµή προσώπου, κέντρο µύτης), Ό(δεξιά ακµή προσώπου, κέντρο µύτης), Τµήµα Εφαρµοσµένης Πληροφορικής & Πολυµέσων 22

23 Εµβαδά Λόγοι Άλλα Ό(εσωτερική κόχη µατιού, κέντρο προσώπου), Ό(κέντρο µατιού, κέντρο φρυδιού), Ό(κέντρο προσώπου, κέντρο φρυδιών), Ό(εσωτερική κόχη µατιού, κόχη στόµατος), Ό(κέντρου µατιού, κέντρο στόµατος), Ό(κορυφή µύτης, κέντρο στόµατος) Α(εσωτερικές κόχες µατιών, κέντρο στόµατος), Α(κέντρα φρυδιών, κέντρο στόµατος), Α(κέντρα µατιών, κέντρο προσώπου) Ό(κέντρο προσώπου, άνοιγµα στόµατος)/ Ό(πηγούνι, άνοιγµα στόµατος) Ό(πηγούνι, άνοιγµα στόµατος)/ Ό(κορυφή µύτης, άνοιγµα στόµατος) Περίγραµµα πηγουνιού, περίγραµµα µετώπου, µέγεθος µετώπου Στατιστικά Χαρακτηριστικά Τέτοια χαρακτηριστικά είναι το ιστόγραµµα ολόκληρης της εικόνας ή περιοχών αυτής και οι ολοκληρωµατικές προβολές εικόνων ακµών στον κάθετο και οριζόντιο άξονα. Έστω για παράδειγµα η υποεικόνα I(xy) ορισµένη στη περιοχή [x 1,x 2 ]x [y 1,y 2 ]. Οι ολοκληρωµατικές προβολές κατά τον κάθετο και οριζόντιο άξονα δίνονται από τις σχέσεις: 3,4 Σχήµα 4: Ολοκληρωµατικές προβολές Τµήµα Εφαρµοσµένης Πληροφορικής & Πολυµέσων 23

24 Εξαγωγή στατιστικών χαρακτηριστικών από περιοχές του προσώπου γίνεται επίσης µε χρήση κεντρικών ροπών (central moments) και moment invariants. Τα moment invariants είναι γραµµικοί συνδυασµοί κανονικοποιηµένων κεντρικών ροπών και έχουν το σηµαντικό χαρακτηριστικό της αναισθησίας ως προς τη θέση, προσανατολισµό και αλλαγή κλίµακας. Χαρακτηριστικά συντελεστών µετασχηµατισµού Η χρήση µετασχηµατισµών όπως Fourier, Hadamard για περιγραφή ορίων περιοχών είναι αρκετά διαδεδοµένη. Οι περιγραφείς Fourier και οι υπογραφές (signatures) είναι επίσης δύο τεχνικές που χρησιµοποιούνται ευρέως. Οι συντελεστές των µετασχηµατισµών λαµβάνονται ως χαρακτηριστικά περιγραφής των επιµέρους περιοχών της εικόνας. 3,4 Αλγεβρικά Χαρακτηριστικά Τα αλγεβρικά χαρακτηριστικά αναπαριστούν εσωτερικές ιδιότητες της εικόνας η οποία θεωρείται δισδιάστατος πίνακας. Η τεχνική εξαγωγής τέτοιων χαρακτηριστικών βασίζεται στην αποσύνθεση πινάκων. Οι πιο διαδεδοµένες τεχνικές είναι ο µετασχηµατισµός Karhunen Loeve - KL και η SVD -Singular Value Decomposition. Στο µετασχηµατισµό KL κάθε εικόνα αναπτύσσεται µε βάση τα ιδιοδιανύσµατα του πίνακα συµµεταβλητότητας ο οποίος εκτιµάται πάνω σε ένα σύνολο από εικόνες προσώπων - Σχήµα 6. Οι συντελεστές της ανάπτυξης αυτής αποτελούν τα αλγεβρικά χαρακτηριστικά µε βάση τα οποία αναπαρίσταται η εικόνα. Σχήµα 5: Αναπαράσταση προσώπου ως άθροισµα ιδιοδιανυσµάτων Τµήµα Εφαρµοσµένης Πληροφορικής & Πολυµέσων 24

25 Αναπαράσταση προσώπων µε χρήση των τιµών της κλίµακας του γκρι Η απλούστερη αναπαράσταση της φωτογραφίας ενός προσώπου είναι ο πίνακας µε τις τιµές των στοιχείων της. Μια τέτοια αναπαράσταση δεν είναι ιδιαίτερα συµπαγής αλλά είναι επιθυµητή όταν ο βασικός στόχος είναι η ευρωστία του συστήµατος. Σε συστήµατα τα οποία χρησιµοποιούν άλλα χαρακτηριστικά για τη περιγραφή των προσώπων, αποθηκεύεται επίσης ο πίνακας µε τις gray scale τιµές, έστω και αν δεν χρησιµοποιείται. Σε µεγάλες βάσεις δεδοµένων µε πολλές εικόνες, η αναπαράσταση µε gray scale τιµές δεν είναι αποδοτική. Παρόλα αυτά, µε δεδοµένο ότι αναπαράσταση σε ανάλυση 32x32 και κβαντισµό 4 bpp είναι ικανοποιητική τόσο για την ανίχνευση όσο και την ταυτοποίηση, πολλές φορές οι πίνακες µε τις gray scale τιµές υποδειγµατοληπτούνται στη παραπάνω ανάλυση, επιτρέποντας µε τον τρόπο αυτό αποδοτικότερη εφαρµογή των αλγορίθµων. 3,4 Ο ρόλος της χωρικής ανάλυσης σε διαδικασίες ταύτισης µε βάση τις gray scale τιµές Ο Πίνακας 3 δείχνει πειραµατικά αποτελέσµατα για τη διαδικασία αναγνώρισης µε χρήση διαφόρων αναλύσεων και πέντε διαφορετικών µετρικών. Συγκεκριµένα έστω R1 και R2 δύο δισδιάστατοι πίνακες διάστασης kxl που αντιστοιχούν στις gray scale τιµές δύο εικόνων. Ορίζουµε της παρακάτω µετρικές: Τµήµα Εφαρµοσµένης Πληροφορικής & Πολυµέσων 25

26 Η βάση δεδοµένων που χρησιµοποιήθηκε είναι της Olivetti Research Laboratory (ORL) η οποία είναι µια από τις πλέον χρησιµοποιούµενες και συχνά χρησιµοποιείται ως βάση σύγκρισης διαφορετικών αλγορίθµων. Οι συγκρίσεις πραγµατοποιήθηκαν µε βάση τους πίνακες των gray scale τιµών και σε όλες τις περιπτώσεις ο κβαντισµός ήταν 8 bpp. Επιτυχής θεωρείται η αναγνώριση αν η προς έλεγχο φωτογραφία και η πλησιέστερη προς αυτήν αποθηκευµένη ανήκουν στο ίδιο πρόσωπο. Από τα αποτελέσµατα προκύπτουν µερικά σηµαντικά συµπεράσµατα: Ακόµα και σε ανάλυση 28x23 η αναγνώριση είναι αποτελεσµατική. Σηµειώνεται πολύ µικρή µείωση στο βαθµό επιτυχίας του συστήµατος -σε σχέση µε τη µέγιστη ανάλυση. Η µέγιστη ανάλυση δεν δίνει υποχρεωτικά και τα καλύτερα αποτελέσµατα σε όλες τις µετρικές. Αυτό είναι σύµφωνο και προς την ολοκληρωτική -και όχι διαφορικήσυµπεριφορά του µατιού. Ο Μέσος Χρόνος Αναγνώρισης (ΜΧΑ) είναι 1.51, 3.81 και sec αντίστοιχα για τις τρεις διαφορετικές αναλύσεις και για τις πέντε µετρικές συνολικά και αναφέρεται σε βάση αποτελούµενη από 200 φωτογραφίες. Σχολιασµός της αποδοτικότητας των µετρικών γίνεται σε επόµενη παράγραφο. 3,4 Τµήµα Εφαρµοσµένης Πληροφορικής & Πολυµέσων 26

27 Πίνακας 3: Αναγνώριση προσώπων σε διάφορες αναλύσεις και µε χρήση 5 διαφορετικών µετρικών Μετρική Μ1 Μ2 Μ3 Μ4 Μ5 Αποτυχηµένες Αναγνωρίσεις ΜΧΑ (sec) 1.51 Ανάλυση 28 x 23 Μετρική Μ1 Μ2 Μ3 Μ4 Μ5 Αποτυχηµένες Αναγνωρίσεις ΜΧΑ (sec) 3.81 Ανάλυση 56 x 46 Μετρική Μ1 Μ2 Μ3 Μ4 Μ5 Αποτυχηµένες Αναγνωρίσεις ΜΧΑ (sec) Ανάλυση 112 x 92 Πίνακας 4: Αναγνώριση προσώπων σε διάφορες αναλύσεις και µε χρήση 5 διαφορετικών µετρικών. Επιτυχής θεωρείται η αναγνώριση αν η προς έλεγχο φωτογραφία και κάποια από τις τρεις πλησιέστερες προς αυτήν αποθηκευµένες ανήκουν στο ίδιο πρόσωπο Μετρική Μ1 Μ2 Μ3 Μ4 Μ5 Αποτυχηµένες Αναγνωρίσεις Ανάλυση 28 x 23 Μετρική Μ1 Μ2 Μ3 Μ4 Μ5 Αποτυχηµένες Αναγνωρίσεις Ανάλυση 56 x 46 Τµήµα Εφαρµοσµένης Πληροφορικής & Πολυµέσων 27

28 Μετρική Μ1 Μ2 Μ3 Μ4 Μ5 Αποτυχηµένες Αναγνωρίσεις Ανάλυση 112 x 92 Πίνακας 5: Αναγνώριση προσώπων σε διάφορες αναλύσεις και µε χρήση 5 διαφορετικών µετρικών. Επιτυχής θεωρείται η αναγνώριση αν η προς έλεγχο φωτογραφία και κάποια από τις πέντε πλησιέστερες προς αυτήν αποθηκευµένες ανήκουν στο ίδιο πρόσωπο Μετρική Μ1 Μ2 Μ3 Μ4 Μ5 Αποτυχηµένες Αναγνωρίσεις Ανάλυση 28 x 23 Μετρική Μ1 Μ2 Μ3 Μ4 Μ5 Αποτυχηµένες Αναγνωρίσεις Ανάλυση 56 x 46 Μετρική Μ1 Μ2 Μ3 Μ4 Μ5 Αποτυχηµένες Αναγνωρίσεις Ανάλυση 112 x 92 Ο Πίνακας 4 δείχνει αποτελέσµατα από το προηγούµενο πείραµα, µόνο που τώρα επιτυχηµένη θεωρείται η αναγνώριση, αν η προς έλεγχο φωτογραφία και κάποια από τις τρεις πλησιέστερες προς αυτήν αποθηκευµένες ανήκουν στο ίδιο πρόσωπο. Αντίστοιχα, ο Πίνακας 5 δείχνει αποτελέσµατα στα οποία επιτυχηµένη θεωρείται η αναγνώριση, αν η προς έλεγχο φωτογραφία και κάποια από τις πέντε πλησιέστερες προς αυτήν αποθηκευµένες, ανήκουν στο ίδιο πρόσωπο. Τα αποτελέσµατα των Πινάκων 4 και 5 δείχνουν την ευρωστία της αναγνώρισης για τις διάφορες µετρικές. 5-7,32 Τµήµα Εφαρµοσµένης Πληροφορικής & Πολυµέσων 28

29 Γεωµετρικά χαρακτηριστικά από εικόνες εµπρόσθιας όψης και προφίλ Η αναπαράσταση προσώπων µε κάποιο διάνυσµα γεωµετρικών χαρακτηριστικών είναι η πιο διαδεδοµένη πρακτική όταν χρησιµοποιούνται εικόνες προφίλ. Αντίθετα σε εικόνες εµπρόσθιας όψης η αναπαράσταση µε τις τιµές της κλίµακας του γκρι είναι πιο διαδεδοµένη. Η χρήση γεωµετρικών χαρακτηριστικών για την αναπαράσταση προσώπων έχει ανακτήσει νέο ενδιαφέρον µε την ανάπτυξη του προτύπου MPEG-4. Σε εικόνες προφίλ οι τιµές των χαρακτηριστικών παράγονται µε βάση κάποια σηµεία στη οριογραµµή του, όπως η εγκοπή ανάµεσα στα φρύδια και τη µύτη, η κορυφή της µύτης, η εγκοπή ανάµεσα στη µύτη και το άνω χείλος και η κορυφή του πηγουνιού. Τα χαρακτηριστικά είναι συνήθως αποστάσεις και γωνίες ανάµεσα στα χαρακτηριστικά αυτά σηµεία. Ο Πίνακας 6 παρουσιάζει ένα σύνολο από συχνά χρησιµοποιούµενα γεωµετρικά χαρακτηριστικά και για τις δύο κατηγορίες εικόνων. Σχήµα 6: Σηµεία σε προφίλ και frontal views Τµήµα Εφαρµοσµένης Πληροφορικής & Πολυµέσων 29

30 Πίνακας 6: Χαρακτηριστικά για την περιγραφή του προσώπου d(i,j) είναι η Ευκλείδεια απόσταση ανάµεσα στα σηµεία i και j. Χαρακτηριστικά σε Περιγραφή Χαρακτηριστικά σε Περιγραφή εικόνες profile εικόνες frontal view Γωνία Μέτρηση πηγουνιού Λόγος d(14,15) /d(4,9) Μέτρηση πλάτους προσώπου Γωνία Μέτρηση µύτης Λόγος d(12,13) /d(14,15) Απόσταση µατιών Λόγος d(8,10) /d(2,8) Μακρύ κοντό Λόγος d(5a, 5b) Μέγεθος στόµατος πηγούνι /d(14,15) Υβριδική αναπαράσταση Συχνά για την αναπαράσταση προσώπων χρησιµοποιείται συνδυασµός των gray scale τιµών και άλλων χαρακτηριστικών όπως αυτά των Πινάκων 2 και 6. Για παράδειγµα ο Campell χρησιµοποίησε χαρακτηριστικά όπως η τιµή φωτεινότητας των µαλλιών και των παρειών σε συνδυασµό µε ένα πίνακα 32x32 µε τις gray scale τιµές της περιοχής των µατιών. 5-7,32 Στις πρώτες προσπάθειες για αναγνώριση προσώπων, οι οποίες κατά βάση στηρίζονταν σε εικόνες προφίλ από πορτρέτα, χρησιµοποιήθηκαν ευρέως τεχνικές τµηµατικής προσέγγισης καµπυλών. Ο Galton δηµιούργησε ένα σύστηµα, στο οποίο πορτρέτα προφίλ περιγράφονται µε χρήση ενός µαθηµατικού τύπου. Κάθε τύπος αποτελείται από τέσσερις οµάδες εικόνων οι οποίες περιέχουν πέντε εικόνες η καθεµιά. Τα τµήµατα των προφίλ κοντά στα χαρακτηριστικά σηµεία, ή οι συνδέσεις των σηµείων αυτών, περιγράφονται µε τη χρήση απλών αριθµών. Οι αριθµοί αυτοί υπολογίζονται από κάποιο πίνακα στον οποίο διαφορετικά σχήµατα καµπυλών περιγράφονται από συγκεκριµένους αριθµούς (δείκτες) ιανυσµατική αναπαράσταση των εικόνων προσώπου ύο είδη αναπαραστάσεων µπορούν να χρησιµοποιηθούν στη αναγνώριση και ταυτοποίηση εκφράσεων και προσώπων γενικότερα: ισδιάστατοι πίνακες τιµών, που αποτελούν αναπαράσταση της εικόνας στην κλίµακα του γκρι, και διανύσµατα χαρακτηριστικών τα οποία να περιγράφουν µε αποτελεσµατικό τρόπο τη δοµή του. Τµήµα Εφαρµοσµένης Πληροφορικής & Πολυµέσων 30

31 Η προσπάθεια ταυτοποίησης που να βασίζεται σε ακατέργαστες εικόνες έχει αποδειχθεί ευαίσθητη ως προς τις συνθήκες φωτισµού, τις όψεις και τις εκφράσεις όσον αφορά το ότι δύο εικόνες που µοιάζουν κατά το ανθρώπινο µάτι µπορεί να αποδειχθούν διαφορετικές στη σύγκριση pixel by pixel. Γι αυτό είναι απαραίτητο να εξαχθούν από τις εικόνες διαχωριζόµενα χαρακτηριστικά και να γίνει σύγκριση των χαρακτηριστικών αυτών αντί των αρχικών εικόνων. 'Όσο πιο διαχωρισµένα είναι αυτά τα χαρακτηριστικά τόσο πιο εύκολη θα είναι η ταυτοποίηση. Επιπλέον, αποδοτική αναπαράσταση ενός προσώπου θεωρείται κάθε αναπαράσταση η οποία µειώνει τη διάσταση της εικόνας διατηρώντας όσο το δυνατό µεγαλύτερο όγκο πληροφορίας. 5-7,32 Η εξαγωγή διανυσµάτων χαρακτηριστικών µπορεί να υπερκεράσει προβλήµατα που σχετίζονται µε τη µεγάλη διάσταση του χώρου των εικόνων, όπως η υπολογιστική πολυπλοκότητα, αλλά και µε τις διακυµάνσεις των εικόνων όσον αφορά το φωτισµό και τις έντονες διαφορές µεταξύ των προσώπων. Τα διανύσµατα χαρακτηριστικών που επιλέγονται πρέπει να οδηγούν στην περιγραφή κάθε προσώπου µε µοναδικό τρόπο και να επιτρέπουν την ταυτοποίηση του µέσω ενός χώρου µικρότερης διάστασης. Επιπλέον, πρέπει να µπορούν να εξάγονται αυτόµατα από το υπολογιστικό σύστηµα που χρησιµοποιείται για την ταυτοποίηση και η διάσταση τους να είναι σηµαντικά µικρότερη από την διάσταση των εικόνων προσώπου. Η εύρεση τέτοιων διανυσµάτων είναι το βασικότερο πρόβληµα των συστηµάτων αναγνώρισης προσώπων και συναισθηµάτων. Τα δεδοµένα εικόνων, εποµένως, µπορούν να αναπαρασταθούν µε διανύσµατα σε έναν πολυδιάστατο διανυσµατικό χώρο. Έστω ότι ο πίνακας X = (χ 1,χ 2,, x n ) αναπαριστά έναν n x N πίνακα δεδοµένων όπου κάθε Xj είναι ένα διάνυσµα προσώπου διάστασης N, που προέκυψε από µια εικόνα προσώπου p x q pixels όπου N = p x q. Σηµειώνουµε ότι n είναι το πλήθος των διαφορετικών εικόνων προσώπου του συνόλου εκπαίδευσης. Επιπλέον το µέσο διάνυσµα των εικόνων εκπαίδευσης µ = n Ύ^η= 1 χ έχει αφαιρεθεί από κάθε διάνυσµα εικόνας. Μας ενδιαφέρει να προβάλουµε τα διανύσµατα εικόνας πάνω σε µια διανυσµατική βάση ώστε να χρησιµοποιήσουµε τους συντελεστές του µετασχηµατισµού αυτού ως διανυσµατική αναπαράσταση χαρακτηριστικών (feature representation) κάθε εικόνας. 5-7,32 Μια τέτοια αναπαράσταση µπορεί να γίνει µε έναν γραµµικό µετασχηµατισµό των διανυσµάτων των αρχικών εικόνων σε διανύσµατα χαρακτηριστικών. Η σχέση του µετασχηµατισµού αυτού θα έχει γενική µορφή Y = W X Τµήµα Εφαρµοσµένης Πληροφορικής & Πολυµέσων 31

32 όπου Y είναι ένας πίνακας d x N διανυσµάτων χαρακτηριστικών, d η διάσταση του διανύσµατος χαρακτηριστικών και W ο πίνακας µετασχηµατισµού. Πρέπει να σηµειωθεί εδώ ότι d <C N. Έπειτα, η ταυτοποίηση εικόνων θα γίνει µε βάση τα διανύσµατα αναπαράστασης. ηλαδή το διάνυσµα αναπαράστασης κάθε νέας εικόνας θα συγκριθεί, µε τη χρήση κάποιας µετρικής µεθόδου (όπως π.χ. το συνηµίτονο της γωνίας τους ή η ευκλείδεια απόσταση) ή µε κάποιον πολυδιάστατο ταξινοµητή, µε τα διανύσµατα αναπαράστασης των εικόνων εκπαίδευσης ώστε να βρεθεί τελικά µε ποιό από αυτά ταιριάζει περισσότερο. Για τη διανυσµατική αναπαράσταση των εικόνων προσώπου έχουν αναπτυχθεί πολυάριθµες µέθοδοι όπως µε τον αλγόριθµο Independent Component Analysis (ICA) καθώς και το συνδυασµό του µε τη µέθοδο Principal Component Analysis (PCA) Principal Component Analysis Η µέθοδος της Ανάλυσης Κυρίων Συνιστωσών (PCA) υπολογίζει ένα ορθοκανονικό σύνολο αξόνων στις διευθύνσεις όπου τα δεδοµένα παρουσιάζουν µέγιστη συνδιακύµανση. ηλαδή, γεωµετρικά οι κύριες συνιστώσες (principal components) είναι οι διευθύνσεις του χώρου τον δεδοµένων όπου µεγιστοποιείται η συνδιασπορά της προβολής των αρχικών διανυσµάτων στις συνιστώσες αυτές. Τα διανύσµατα αυτά ορίζουν τον υποχώρο των εικόνων προσώπου ο οποίος ονοµάζεται υποχώρος προσώπου (face space). Όλες οι εικόνες προσώπων του συνόλου εκπαίδευσης προβάλλονται πάνω στον υποχώρο αυτό προκειµένου να βρεθεί ένα σύνολο βαρών που περιγράφει τη συµµετοχή κάθε διανύσµατος στον υποχώρο προσώπου. Για να γίνει ταυτοποίηση µιας νέας εικόνας πρέπει να προβληθεί το διάνυσµα που την αναπαριστά στον υποχώρο προσώπου ώστε να υπολογιστεί ένα αντίστοιχο σύνολο βαρών. Συγκρίνοντας τα βάρη της εικόνας µε το σύνολο βαρών των εικόνων εκπαίδευσης µπορεί να γίνει η ταυτοποίηση της. 5-7 Η διαδικασία PCA στηρίζεται στο µετασχηµατισµό Karhunen-Loeve. Οι κύριες συνιστώσες ορίζονται ως τα ιδιοδιανύσµατα (eigenvectors) του πίνακα συνδιασποράς C n C = Σ(χ - - µ) Τ i=1 Τµήµα Εφαρµοσµένης Πληροφορικής & Πολυµέσων 32

33 όπου Xj το διάνυσµα κάθε εικόνας, µ η µέση τιµή των διανυσµάτων εικόνας και n το πλήθος των εικόνων. Η προβολή των εικόνων γίνεται στα ιδιοδιανύσµατα που αντιστοιχούν στις m µεγαλύτερες ιδιοτιµές (eigenvalues). Οι κύριες συνιστώσες έχουν ίδια διάσταση µε τις αρχικές εικόνες κι αναφέρονται συχνά ως eigenfaces. Αφού γίνει η προβολή, το διάνυσµα εισόδου διάστασης N, δηλαδή το πρόσωπο, αναπαρίσταται µε ένα διάνυσµα του m-διάστατου υποχώρου. Οι ιδιοτιµές αποτελούν ένδειξη της αναλογίας µεταβλητότητας των δεδοµένων τα οποία αφορά κάθε ιδιοδιάνυσµα. Η πρώτη κύρια συνιστώσα δείχνει την κατεύθυνση της µέγιστης µεταβλητότητας, η δεύτερη την κατεύθυνση µέγιστης µεταβλητότητας που είναι ορθογώνια ως προς την πρώτη κ.ο.κ. Η αποµάκρυνση ορισµένων ιδιοδιανυσµάτων µπορεί να βελτιώσει την απόδοση της µεθόδου µε την αποµάκρυνση θορύβου. Για το λόγο αυτό, η συνήθης προσέγγιση της µεθόδου περιλαµβάνει επιλογή των ιδιοδιανυσµάτων που αντιστοιχούν στις µεγαλύτερες ιδιοτιµές. Η επιλογή αυτή οδηγεί ουσιαστικά σε επιλογή των διευθύνσεων στις οποίες οι εικόνες διαφέρουν περισσότερο. Στις περισσότερες εφαρµογές, τα ιδιοδιανύσµατα που αντιστοιχούν σε µικρές ιδιοτιµές θεωρούνται θόρυβος και δεν λαµβάνονται υπόψη στης διαδικασία ταυτοποίησης. Στο σχήµα 3.1 βλέπουµε τα eigenfaces που αντιστοιχούν στις 8 µεγαλύτερες ιδιοτιµές και 8 eigenfaces που αντιστοιχούν σε χαµηλές ιδιοτιµές κατά την εφαρµογή της µεθόδου σε δείγµα εικόνων της βάσης MUG. Έχουν αναπτυχθεί διάφορες παραλλαγές όσον αφορά την επιλογή του πλήθους των ιδιοδιανυσµάτων που πρέπει να απαλειφθούν. Η προσέγγιση που υιοθετήθηκε στην εργασία συνίσταται στην επιλογή του ελάχιστου πλήθους ιδιοδιανυσµάτων για τα οποία η ενέργεια e είναι µεγαλύτερη από ένα κατώφλι (threshold) τιµής. 5-7 Επειδή τα ιδιοδιανύσµατα ορίζουν ορθογώνιες κατευθύνσεις στον χώρο συνδιασποράς, η αναπαράσταση PCA είναι ασυσχέτιστη. Οι συντελεστές για έναν άξονα δε µπορούν να προβλεφθούν γραµµικά από τους συντελεστές των άλλων αξόνων Independent Component Analysis Η µέθοδος PCA ανήκει στην κατηγορία των στατιστικών µεθόδων που βρίσκουν ένα σύνολο από εικόνες βάσης και αναπαριστούν τα πρόσωπα ως ένα γραµµικό συνδυασµό των εικόνων αυτών. ιαχωρίζει τις συσχετίσεις των δεδοµένων εισόδου αλλά δεν επεκτείνεται στις υψηλής τάξης εξαρτήσεις όπως οι σχέσεις µεταξύ τριών ή περισσότερων pixels. Τµήµα Εφαρµοσµένης Πληροφορικής & Πολυµέσων 33

34 Σε µια διεργασία, όµως, όπως η αναγνώριση προσώπου ή εκφράσεων, στην οποία σηµαντική πληροφορία µπορεί να περιέχεται στις υψηλής τάξης σχέσεις µεταξύ των pixels, είναι λογική η προσδοκία ότι καλύτερες εικόνες βάσης µπορούν να προκύψουν από µεθόδους ευαίσθητες σε αυτές της υψηλής τάξης ροπές. Η Ανάλυση ανεξάρτητων συνιστωσών (Independent Component Analysis, ICA), που αποτελεί µια γενίκευση της µεθόδου PCA, είναι µια τέτοια µέθοδος η οποία προσπαθεί να υπολογίσει µια στατιστικά ανεξάρτητη διανυσµατική βάση. Για εφαρµογές επεξεργασίας εικόνων του προσώπου έχουν αναπτυχθεί δύο αρχιτεκτονικές βασισµένες στην Ανάλυση Ανεξάρτητων Συνιστωσών. Η πρώτη αρχιτεκτονική (Architecture I) παράγει στατιστικά ανεξάρτητες εικόνες βάσης ενώ η δεύτερη (Architecture II) παράγει στατιστικά ανεξάρτητους συντελεστές. Στην εργασία η αναπαράσταση των εικόνων προσώπου έγινε µε βάση την πρώτη αρχιτεκτονική. 8,9,27 Σύµφωνα µε την αρχιτεκτονική αυτή, η είσοδος του αλγόριθµου είναι ένας πίνακας X στις γραµµές του οποίου έχουν τοποθετηθεί n εικόνες, δηλαδή οι εικόνες του συνόλου εκπαίδευσης, µε τη µορφή διανυσµάτων µήκους N, όπου N το πλήθος pixels των εικόνων. Στόχος της µεθόδου ICA είναι να υπολογίσει µια στατιστικά ανεξάρτητη διανυσµατική βάση U και να παραστήσει τις εικόνες προσώπου του X ως ένα γραµµικό συνδυασµό της βάσης αυτής. Η διαδικασία αυτή συνοψίζεται στην εξίσωση U = W X όπου W ένας n χ n αντιστρέψιµος πίνακας. Η διανυσµατική βάση U, διάστασης n χ N, και ο πίνακας W υπολογίζονται από την µέθοδο ICA. Για την υλοποίηση της µεθόδου, δηλαδή τον υπολογισµό των πινάκων W και U, χρησιµοποιήθηκε ο αλγόριθµος Infomax που προτάθηκε από τους Bell και Sejnowski [20] και προέρχεται από την αρχή βέλτιστης µεταφοράς πληροφορίας σε νευρώνες µε σιγµοειδείς συναρτήσεις µεταφοράς. Ο αλγόριθµος συνίσταται ως εξής: Θεωρούµε τους πίνακες X και W, που αναφέρθηκαν προηγουµένως και συνδέονται µε την σχέση 3.3, και τον πίνακα Y = f ( U ) που αναπαριστά τις εξόδους των n-νευρώνων και έχει ίδιες διαστάσεις µε τον X. Κάθε στοιχείο της f = ( f 1,, f n ) είναι µια αντιστρέψιµη συνάρτηση που απεικονίζει πραγµατικούς αριθµούς στο διάστηµα [0,1]. Τυπικά η συνάρτηση που χρησιµοποιείται είναι η Τµήµα Εφαρµοσµένης Πληροφορικής & Πολυµέσων 34

35 f 1 1+ e ( u) = -u Οι γραµµές του U, δηλαδή τα διανύσµατα ui,, u n, είναι γραµµικοί συνδυασµοί των εισόδων και µπορούν να ερµηνευθούν ως προσυναπτικοί ενεργοποιητές των n-νευρώνων. Οι γραµµές του Y, τα διανύσµατα y 1,, y n, µπορούν να ερµηνευθούν ως µετασυναπτικοί βαθµοί ενεργοποίησης και περιορίζονται στο διάστηµα [0, 1]. Σκοπός του αλγόριθµου είναι να µεγιστοποιηθεί η κοινή πληροφορία µεταξύ της εισόδου και της εξόδου του νευρωνικού δικτύου Y [17]. Αυτό επιτυγχάνεται µε την βαθµωτή άνοδο της εντροπίας της εξόδου σε σχέση µε τον πίνακα βαρών W. Ο αλγόριθµος είναι επαναληπτικός και ο κανόνας εκπαίδευσης του πίνακα βαρών W προκύπτει από την σχέση: AW O C V W H (Y)W T W = (I + Y ' U T ) W όπου I ο µοναδιαίος πίνακας. Η χρήση της λογιστικής συνάρτησης δίνει yj = (1 2yj). 8,9,27 Όταν υπάρχουν πολλαπλές είσοδοι και έξοδοι, η µεγιστοποίηση της κοινής εντροπίας των εξόδων Y ενθαρρύνει τις εξόδους στον U να κινηθούν προς την στατιστική ανεξαρτησία. Όταν η µορφή των µη γραµµικών συναρτήσεων µεταφοράς f είναι ίδια µε τις αθροιστικές συναρτήσεις πυκνότητας των Independent Components (ICs), µεγιστοποιώντας την κοινή εντροπία των εξόδων Y ελαχιστοποιείται η κοινή πληροφορία µεταξύ των εξόδων του U. Ο αλγόριθµος περιλαµβάνει και µια διαδικασία "sphering" πριν την διαδικασία εκπαίδευσης. Ο µέσοι όροι γραµµών αφαιρούνται από το σύνολο δεδοµένων εισόδου X και έπειτα ο X διέρχεται από ένα µηδενικής φάσης whitening φίλτρο, W Z, το οποίο ισούται µε το διπλάσιο της τετραγωνικής ρίζας του πίνακα συµµεταβλητότητας W Z = 2(XX T ) 1/2. Η διαδικασία αυτή αφαιρεί τις πρώτης και δεύτερης τάξης στατιστικές των δεδοµένων καθώς οι διακυµάνσεις αντισταθµίζονται. Όταν οι είσοδοι στον αλγόριθµο ICA έχουν υποβληθεί σε διαδικασία sphering, ο πίνακας µετασχηµατισµού της εξίσωσης 3.3 είναι ο Wj, ο οποίος προκύπτει από το γινόµενο του πίνακα WZ και του πίνακα που εκπαιδεύτηκε κατά την διαδικασία ICA Wj = WWZ Τµήµα Εφαρµοσµένης Πληροφορικής & Πολυµέσων 35

36 Αναπαράσταση των εικόνων προσώπου µε ICA Η πρώτη αρχιτεκτονική της µεθόδου ICA παράγει, όπως είπαµε, ένα σύνολο στατιστικά ανεξάρτητων εικόνων βάσης και αναπαριστά τις αρχικές εικόνες ως ένα γραµµικό συνδυασµό των εικόνων αυτών. Για να βρούµε ένα σύνολο στατιστικά ανεξάρτητων εικόνων βάσης από τις αρχικές εικόνες προσώπου, διαχωρίζουµε τις ανεξάρτητες συνιστώσες τους σύµφωνα µε το συνθετικό µοντέλο εικόνας (image synthesis model) του σχήµατος 7. Οι εικόνες προσώπου του πίνακα X θεωρούµε ότι προέρχονται από ένα γραµµικό συνδυασµό ενός άγνωστου συνόλου στατιστικά ανεξάρτητων εικόνων πηγής (source images) S, όπου A ένας άγνωστος πίνακας µετασχηµατισµού. Οι εικόνες πηγής µπορούν να προσεγγισθούν µε τη χρήση του πίνακα εκπαιδευµένων φίλτρων W j, που παράγει ένα σύνολο στατιστικά ανεξάρτητων εξόδων, U. 8,9 S Χ U Σχήµα 7: Image Synthesis Model Έστω ότι το σύνολο εικόνων εκπαίδευσης αποτελείται από n εικόνες προσώπου διάστασης p χ q pixels. Η είσοδος του αλγόριθµου είναι ο πίνακας X στις γραµµές του οποίου τοποθετούνται οι εικόνες µε τη µορφή διανυσµάτων µήκους N, όπου N = p χ q. Εποµένως ο πίνακας X θα έχει διάσταση n χ N. Για το λόγο αυτό αναφέρονται και ως «εικόνες βάσης». Αποτελούν ένα σύνολο στατιστικά ανεξάρτητων γνωρισµάτων προσώπου (facial features) όπου οι τιµές των pixels σε Τµήµα Εφαρµοσµένης Πληροφορικής & Πολυµέσων 36

37 κάθε τέτοια εικόνα δεν µπορούν να προβλεφθούν από τις τιµές των pixels στις άλλες εικόνες γνωρισµάτων. Στο σχήµα βλέπουµε ένα υποσύνολο από 14 εικόνες βάσης. 8,9 Σχήµα 8: εκατέσσερις στατιστικά ανεξάρτητες συνιστώσες ενός συνόλου εικόνων της βάσης. Από την σχέση U = W j X προκύπτει: X = W f 1 U Εποµένως οι εικόνες του πίνακα X αποτελούν ένα γραµµικό συνδυασµό των εικόνων βάσης U. Ως εκ τούτου, οι εικόνες εισόδου µπορούν να αναπαρασταθούν από τους συντελεστές του µετασχηµατισµού αυτού, δηλαδή από τις γραµµές του πίνακα W - 1. Για ευκολία ονοµάζουµε B τον πίνακα συντελεστών ICA και άρα ισχύει B = W f 1 Ο πίνακας W j έχει διάσταση n x n και εποµένως αυτή είναι και η διάσταση του B. Τελικά, η αναπαράσταση ICA της i-οστής εικόνας του X αποτελείται από τους συντελεστές του γραµµικού συνδυασµού των ανεξάρτητων εικόνων βάσης που την συνθέτει, δηλαδή από τους συντελεστές της i-οστής γραµµής του B. Αυτό φαίνεται παραστατικά στο σχήµα. 8,9 Αφού ολοκληρώθηκε η αναπαράσταση των εικόνων εκπαίδευσης, ακολουθεί η αναπαράσταση των εικόνων δοκιµής. Έστω ότι το σύνολο των εικόνων δοκιµής περιλαµβάνει k εικόνες προσώπου. Θεωρούµε ότι ο πίνακας X t es t περιλαµβάνει στις γραµµές του τις εικόνες δοκιµής, µε τη µορφή διανυσµάτων µήκους N, από τις όποιες όµως έχουν αφαιρεθεί οι µέσοι Τµήµα Εφαρµοσµένης Πληροφορικής & Πολυµέσων 37

ΣΥΣΤΗΜΑ ΑΝΑΓΝΩΡΙΣΗΣ ΠΡΟΣΩΠΩΝ ΜΕ ΧΡΗΣΗ WEB CAMERA ΚΑΙ OPENCV

ΣΥΣΤΗΜΑ ΑΝΑΓΝΩΡΙΣΗΣ ΠΡΟΣΩΠΩΝ ΜΕ ΧΡΗΣΗ WEB CAMERA ΚΑΙ OPENCV ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΣΕΡΡΩΝ ΣΧΟΛΗ ΤΕΧΝΟΛΟΓΙΚΩΝ ΕΦΑΡΜΟΓΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ & ΕΠΙΚΟΙΝΩΝΙΩΝ 2013 ΣΕΡΡΕΣ ΣΥΣΤΗΜΑ ΑΝΑΓΝΩΡΙΣΗΣ ΠΡΟΣΩΠΩΝ ΜΕ ΧΡΗΣΗ WEB CAMERA ΚΑΙ OPENCV ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ Κωνσταντίνος

Διαβάστε περισσότερα

ΣΥΣΤΗΜΑ ΑΝΑΓΝΩΡΙΣΗΣ ΠΡΟΣΩΠΩΝ ΜΕ ΧΡΗΣΗ WEB CAMERA ΚΑΙ OPENCV

ΣΥΣΤΗΜΑ ΑΝΑΓΝΩΡΙΣΗΣ ΠΡΟΣΩΠΩΝ ΜΕ ΧΡΗΣΗ WEB CAMERA ΚΑΙ OPENCV ΣΕΡΡΕΣ ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΣΕΡΡΩΝ ΣΧΟΛΗ ΤΕΧΝΟΛΟΓΙΚΩΝ ΕΦΑΡΜΟΓΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ & ΕΠΙΚΟΙΝΩΝΙΩΝ 2013 ΣΥΣΤΗΜΑ ΑΝΑΓΝΩΡΙΣΗΣ ΠΡΟΣΩΠΩΝ ΜΕ ΧΡΗΣΗ WEB CAMERA ΚΑΙ OPENCV ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ Κωνσταντίνος

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥ ΩΝ ΤΜΗΜΑΤΟΣ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥ ΩΝ ΤΜΗΜΑΤΟΣ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥ ΩΝ ΤΜΗΜΑΤΟΣ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ Τίτλος Εργασίας: Μελέτη Αλγορίθµων Αναγνώρισης Προσώπου,

Διαβάστε περισσότερα

Πανεπιστήμιο Πειραιώς Τμήμα Πληροφορικής Πρόγραμμα Μεταπτυχιακών Σπουδών «Προηγμένα Συστήματα Πληροφορικής»

Πανεπιστήμιο Πειραιώς Τμήμα Πληροφορικής Πρόγραμμα Μεταπτυχιακών Σπουδών «Προηγμένα Συστήματα Πληροφορικής» Τμήμα Πληροφορικής Πρόγραμμα Μεταπτυχιακών Σπουδών «Προηγμένα Συστήματα Πληροφορικής» Μεταπτυχιακή Διατριβή Τίτλος Διατριβής Ονοματεπώνυμο Φοιτητή Πατρώνυμο Αριθμός Μητρώου Επιβλέπων Αναγνώριση ανθρώπων

Διαβάστε περισσότερα

ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΑΝΑΤΟΛΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ ΚΑΙ ΘΡΑΚΗΣ ΣΧΟΛΗ ΤΕΧΝΟΛΟΓΙΚΩΝ ΕΦΑΡΜΟΓΩΝ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΠΛΗΡΟΦΟΡΙΚΗΣ ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ

ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΑΝΑΤΟΛΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ ΚΑΙ ΘΡΑΚΗΣ ΣΧΟΛΗ ΤΕΧΝΟΛΟΓΙΚΩΝ ΕΦΑΡΜΟΓΩΝ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΠΛΗΡΟΦΟΡΙΚΗΣ ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΑΝΑΤΟΛΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ ΚΑΙ ΘΡΑΚΗΣ ΣΧΟΛΗ ΤΕΧΝΟΛΟΓΙΚΩΝ ΕΦΑΡΜΟΓΩΝ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΠΛΗΡΟΦΟΡΙΚΗΣ ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ ΤΑΥΤΟΠΟΙΗΣΗ ΔΗΜΙΟΥΡΓΟΥ ΠΙΝΑΚΩΝ ΖΩΓΡΑΦΙΚΗΣ ΜΕ ΤΗ ΧΡΗΣΗ ΟΡΘΟΓΩΝΙΩΝ

Διαβάστε περισσότερα

Αναγνώριση µορφασµών µε ϐάση τα ενεργά σηµεία του προσώπου

Αναγνώριση µορφασµών µε ϐάση τα ενεργά σηµεία του προσώπου Α ρ ι ς τ ο τ ε λ ε ι ο Π α ν ε π ι ς τ η µ ι ο Θ ε ς ς α λ ο ν ι κ η ς Τµηµα Ηλεκτρολογων Μηχανικων & Μηχανικων Υπολογιστων Τοµεας Ηλεκτρονικης και Υπολογιστων Αναγνώριση µορφασµών µε ϐάση τα ενεργά σηµεία

Διαβάστε περισσότερα

ΜΙΑ ΕΝΑΛΛΑΚΤΙΚΗ ΜΕΘΟ ΟΣ ΕΚΤΙΜΗΣΗΣ ΤΗΣ ΚΙΝΗΣΗΣ ΚΑΙ ΤΗΣ ΤΑΧΥΤΗΤΑΣ ΕΝΟΣ ΟΧΗΜΑΤΟΣ

ΜΙΑ ΕΝΑΛΛΑΚΤΙΚΗ ΜΕΘΟ ΟΣ ΕΚΤΙΜΗΣΗΣ ΤΗΣ ΚΙΝΗΣΗΣ ΚΑΙ ΤΗΣ ΤΑΧΥΤΗΤΑΣ ΕΝΟΣ ΟΧΗΜΑΤΟΣ ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΜΙΑ ΕΝΑΛΛΑΚΤΙΚΗ ΜΕΘΟ ΟΣ ΕΚΤΙΜΗΣΗΣ ΤΗΣ ΚΙΝΗΣΗΣ ΚΑΙ ΤΗΣ ΤΑΧΥΤΗΤΑΣ ΕΝΟΣ ΟΧΗΜΑΤΟΣ ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ ΠΟΥ ΕΚΠΟΝΗΘΗΚΕ

Διαβάστε περισσότερα

Πτυχιακή Εργασία τμήματος Εφαρμοσμένης Πληροφορικής & Πολυμέσων. Τεχνολογικό Εκπαιδευτικό Ίδρυμα Κρήτης

Πτυχιακή Εργασία τμήματος Εφαρμοσμένης Πληροφορικής & Πολυμέσων. Τεχνολογικό Εκπαιδευτικό Ίδρυμα Κρήτης Πτυχιακή Εργασία τμήματος Εφαρμοσμένης Πληροφορικής & Πολυμέσων Τεχνολογικό Εκπαιδευτικό Ίδρυμα Κρήτης Σχολή Τεχνολογικών Εφαρμογών Τμήμα Εφαρμοσμένης Πληροφορικής Και Πολυμέσων Πτυχιακή Εργασία Τίτλος:

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΙΡΑΙΩΣ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΙΡΑΙΩΣ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΙΡΑΙΩΣ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΠΜΣ: Προηγμένα Συστήματα Πληροφορικής Διπλωματική Εργασία «Εντοπισμός Ανθρώπων σε Video: Βασικές Έννοιες, Μέθοδοι και Προοπτικές» Γαλάνης Δημήτρης, Α.Μ: ΜΠΣΠ/09014

Διαβάστε περισσότερα

ΤΕΧΝΙΚΗ ΑΝΑΦΟΡΑ Βελτίωση τεχνικών ψηφιοποίησης και μοντελοποίησης

ΤΕΧΝΙΚΗ ΑΝΑΦΟΡΑ Βελτίωση τεχνικών ψηφιοποίησης και μοντελοποίησης 3D CMS - Ολοκληρωμένη Πλατφόρμα Ανάπτυξης και διαχείρισης 3D Εφαρμογών Πολιτιστικού Περιεχομένου ΤΕΧΝΙΚΗ ΑΝΑΦΟΡΑ Βελτίωση τεχνικών ψηφιοποίησης και μοντελοποίησης Ενότητα Εργασίας 2. Τεχνικές βέλτιστης

Διαβάστε περισσότερα

ΤΕΛΙΚΗ ΕΚΘΕΣΗ ΜΕΤΑ Ι ΑΚΤΟΡΙΚΗΣ ΕΡΕΥΝΑΣ ΜΕ ΘΕΜΑ:

ΤΕΛΙΚΗ ΕΚΘΕΣΗ ΜΕΤΑ Ι ΑΚΤΟΡΙΚΗΣ ΕΡΕΥΝΑΣ ΜΕ ΘΕΜΑ: ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙ ΕΥΤΙΚΟ Ι ΡΥΜΑ ΥΤΙΚΗΣ ΜΑΚΕ ΟΝΙΑΣ ΣΧΟΛΗ ΤΕΧΝΟΛΟΓΙΚΩΝ ΕΦΑΡΜΟΓΩΝ ΤΜΗΜΑ ΓΕΩΤΕΧΝΟΛΟΓΙΑΣ & ΠΕΡΙΒΑΛΛΟΝΤΟΣ ΤΕΛΙΚΗ ΕΚΘΕΣΗ ΜΕΤΑ Ι ΑΚΤΟΡΙΚΗΣ ΕΡΕΥΝΑΣ ΜΕ ΘΕΜΑ: ιερεύνηση Επιπτώσεων ιαστατικότητας στην

Διαβάστε περισσότερα

ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΤΜΗΜΑ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ ΗΛΕΚΤΡΟΝΙΚΗΣ ΚΑΙ ΥΠΟΛΟΓΙΣΤΩΝ ΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ

ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΤΜΗΜΑ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ ΗΛΕΚΤΡΟΝΙΚΗΣ ΚΑΙ ΥΠΟΛΟΓΙΣΤΩΝ ΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΤΜΗΜΑ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ ΗΛΕΚΤΡΟΝΙΚΗΣ ΚΑΙ ΥΠΟΛΟΓΙΣΤΩΝ ΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ "ΕΞΟΡΥΞΗ ΠΛΗΡΟΦΟΡΙΑΣ ΑΠΟ ΠΟΛΥΜΕΣΑ ΜΕ ΧΡΗΣΗ ΓΝΩΣΗΣ" ΙΩΣΗΦΙ

Διαβάστε περισσότερα

ΑΝΑΠΤΥΞΗ ΣΥΣΤΗΜΑΤΟΣ ΜΗΧΑΝΙΚΗΣ ΟΡΑΣΗΣ ΜΕ ΔΥΟ ΚΑΜΕΡΕΣ ΚΑΙ ΑΝΙΧΝΕΥΣΗ ΒΑΘΟΥΣ ΜΕ ΤΗ ΒΟΗΘΕΙΑ ΣΤΕΡΕΟΣΚΟΠΙΚΟΥ ΑΛΓΟΡΙΘΜΟΥ

ΑΝΑΠΤΥΞΗ ΣΥΣΤΗΜΑΤΟΣ ΜΗΧΑΝΙΚΗΣ ΟΡΑΣΗΣ ΜΕ ΔΥΟ ΚΑΜΕΡΕΣ ΚΑΙ ΑΝΙΧΝΕΥΣΗ ΒΑΘΟΥΣ ΜΕ ΤΗ ΒΟΗΘΕΙΑ ΣΤΕΡΕΟΣΚΟΠΙΚΟΥ ΑΛΓΟΡΙΘΜΟΥ 1 ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΚΕΝΤΡΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ ΕΔΡΑ ΣΕΡΡΕΣ ΣΧΟΛΗ ΤΕΧΝΟΛΟΓΙΚΩΝ ΕΦΑΡΜΟΓΩΝ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΠΛΗΡΟΦΟΡΙΚΗΣ Τ.Ε. ΑΝΑΠΤΥΞΗ ΣΥΣΤΗΜΑΤΟΣ ΜΗΧΑΝΙΚΗΣ ΟΡΑΣΗΣ ΜΕ ΔΥΟ ΚΑΜΕΡΕΣ ΚΑΙ ΑΝΙΧΝΕΥΣΗ ΒΑΘΟΥΣ

Διαβάστε περισσότερα

Πτυχιακή εργασία. Ανίχνευση κίνησης από κάµερες για λόγους ασφαλείας

Πτυχιακή εργασία. Ανίχνευση κίνησης από κάµερες για λόγους ασφαλείας Τεχνολογικό Εκπαιδευτικό Ίδρυµα Κρήτης Σχολή Τεχνολογικών Εφαρµογών Τµήµα Εφαρµοσµένης Πληροφορικής και Πολυµέσων Πτυχιακή εργασία Ανίχνευση κίνησης από κάµερες για λόγους ασφαλείας Σταµατάκης Ξενοφών

Διαβάστε περισσότερα

ΣΧΟΛΗ ΤΕΧΝΟΛΟΓΙΚΩΝ ΕΦΑΡΜΟΓΩΝ ΤΜΗΜΑ ΒΙΟΜΗΧΑΝΙΚΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΤΟΜΕΑΣ ΥΠΟΛΟΓΙΣΤΙΚΩΝ ΣΥΣΤΗΜΑΤΩΝ. Πτυχιακή Εργασία

ΣΧΟΛΗ ΤΕΧΝΟΛΟΓΙΚΩΝ ΕΦΑΡΜΟΓΩΝ ΤΜΗΜΑ ΒΙΟΜΗΧΑΝΙΚΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΤΟΜΕΑΣ ΥΠΟΛΟΓΙΣΤΙΚΩΝ ΣΥΣΤΗΜΑΤΩΝ. Πτυχιακή Εργασία ΣΧΟΛΗ ΤΕΧΝΟΛΟΓΙΚΩΝ ΕΦΑΡΜΟΓΩΝ ΤΜΗΜΑ ΒΙΟΜΗΧΑΝΙΚΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΤΟΜΕΑΣ ΥΠΟΛΟΓΙΣΤΙΚΩΝ ΣΥΣΤΗΜΑΤΩΝ Πτυχιακή Εργασία ΜΕΛΕΤΗ, ΣΧΕΔΙΑΣΗ ΚΑΙ ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΗΣ ΛΟΓΙΣΜΙΚΟΥ ΓΙΑ ΤΟΝ ΕΛΕΓΧΟ ΤΗΣ ΕΙΣΟΔΟΥ ΣΕ ΠΡΟΣΤΑΤΕΥΜΕΝΟ

Διαβάστε περισσότερα

Τεχνολογικό Εκπαιδευτικό Ίδρυμα Κρήτης. Τίτλος: Αναγνώριση Εκφράσεων Προσώπου στην Μουσική

Τεχνολογικό Εκπαιδευτικό Ίδρυμα Κρήτης. Τίτλος: Αναγνώριση Εκφράσεων Προσώπου στην Μουσική Τεχνολογικό Εκπαιδευτικό Ίδρυμα Κρήτης Σχολή Τεχνολογικών Εφαρμογών Τμήμα Εφαρμοσμένης Πληροφορικής & Πολυμέσων ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ Τίτλος: Αναγνώριση Εκφράσεων Προσώπου στην Μουσική Γιώργος Καββαλάκης (AM:

Διαβάστε περισσότερα

Αναγνώριση Χειρονομιών-actions σε συνθήκες έντονου ανομοιόμορφου φωτισμού

Αναγνώριση Χειρονομιών-actions σε συνθήκες έντονου ανομοιόμορφου φωτισμού Διατμηματικό Πρόγραμμα Μεταπτυχιακών Σπουδών στην Ηλεκτρονική και Επεξεργασία της Πληροφορίας Δ.Π.Μ.Σ.-Η.Ε.Π. Ειδική Επιστημονική Εργασία Αναγνώριση Χειρονομιών-actions σε συνθήκες έντονου ανομοιόμορφου

Διαβάστε περισσότερα

Διπλωματική Εργασία του φοιτητή του Τμήματος Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών της Πολυτεχνικής Σχολής του Πανεπιστημίου Πατρών

Διπλωματική Εργασία του φοιτητή του Τμήματος Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών της Πολυτεχνικής Σχολής του Πανεπιστημίου Πατρών ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΤΜΗΜΑ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΤΕΧΝΟΛΟΓΙΑΣ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ: ΣΥΣΤΗΜΑΤΩΝ ΑΥΤΟΜΑΤΟΥ ΕΛΕΓΧΟΥ ΕΡΓΑΣΤΗΡΙΟ ΑΥΤΟΜΑΤΙΣΜΟΥ ΚΑΙ ΡΟΜΠΟΤΙΚΗΣ Διπλωματική Εργασία του φοιτητή του Τμήματος Ηλεκτρολόγων

Διαβάστε περισσότερα

Επεξεργασία και Αναγνώριση Χειρόγραφων Κειμένων

Επεξεργασία και Αναγνώριση Χειρόγραφων Κειμένων ΕΘΝΙΚΟ ΚΑΙ ΚΑΠΟΔΙΣΤΡΙΑΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΣΧΟΛΗ ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΤΗΛΕΠΙΚΟΙΝΩΝΙΩΝ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΔΙΔΑΚΤΟΡΙΚΗ ΔΙΑΤΡΙΒΗ Επεξεργασία και Αναγνώριση Χειρόγραφων Κειμένων

Διαβάστε περισσότερα

ΕΠΙΛΟΓΗ ΧΑΡΑΚΤΗΡΙΣΤΙΚΩΝ ΜΕ ΓΕΝΕΤΙΚΟΥΣ ΑΛΓΟΡΙΘΜΟΥΣ ΣΕ ΠΡΟΒΛΗΜΑΤΑ ΥΠΟΛΟΓΙΣΤΙΚΗΣ ΟΡΑΣΗΣ Η ΜΕΤΑΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ ΕΙ ΙΚΕΥΣΗΣ.

ΕΠΙΛΟΓΗ ΧΑΡΑΚΤΗΡΙΣΤΙΚΩΝ ΜΕ ΓΕΝΕΤΙΚΟΥΣ ΑΛΓΟΡΙΘΜΟΥΣ ΣΕ ΠΡΟΒΛΗΜΑΤΑ ΥΠΟΛΟΓΙΣΤΙΚΗΣ ΟΡΑΣΗΣ Η ΜΕΤΑΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ ΕΙ ΙΚΕΥΣΗΣ. ΕΠΙΛΟΓΗ ΧΑΡΑΚΤΗΡΙΣΤΙΚΩΝ ΜΕ ΓΕΝΕΤΙΚΟΥΣ ΑΛΓΟΡΙΘΜΟΥΣ ΣΕ ΠΡΟΒΛΗΜΑΤΑ ΥΠΟΛΟΓΙΣΤΙΚΗΣ ΟΡΑΣΗΣ Η ΜΕΤΑΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ ΕΙ ΙΚΕΥΣΗΣ Υποβάλλεται στην ορισθείσα από την Γενική Συνέλευση Ειδικής Σύνθεσης του Τµήµατος

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ Τµήµα Εφαρµοσµένης Πληροφορικής Πρόγραµµα Μεταπτυχιακών Σπουδών Ειδίκευσης Σύγκριση Μεθόδων Ανάκτησης Εικόνας Βασισµένης στο Περιεχοµένο µε

Διαβάστε περισσότερα

ΕΥΧΑΡΙΣΤΙΕΣ Θα ήθελα να ευχαριστήσω πολύ τον επιβλέποντα καθηγητή κ.μ.γ.στρίντζη, για την εμπιστοσύνη που μου έδειξε στην εκπόνηση της παρούσας διπλωματικής εργασίας, καθώς και τους κ. Ν.Γραμμαλίδη και

Διαβάστε περισσότερα

Μέθοδοι Αναγνώρισης Προσώπων σε Εικονοσειρές

Μέθοδοι Αναγνώρισης Προσώπων σε Εικονοσειρές ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΣΧΟΛΗ ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ Μέθοδοι Αναγνώρισης Προσώπων σε Εικονοσειρές Εµµανουήλ Τζουρίδης Επιβλέπων καθηγητής : Ιωάννης Πήτας,

Διαβάστε περισσότερα

Τεχνολογικό Εκπαιδευτικό Ίδρυμα Κρήτης

Τεχνολογικό Εκπαιδευτικό Ίδρυμα Κρήτης Τεχνολογικό Εκπαιδευτικό Ίδρυμα Κρήτης Σχολή Τεχνολογικών Εφαρμογών Τμήμα Εφαρμοσμένης Πληροφορικής & Πολυμέσων Πτυχιακή εργασία 3DTV-ΔΗΜΙΟΥΡΓΙΑ ΕΙΚΟΝΩΝ ΒΑΘΟΥΣ Σπουδαστής: Αντωνάκης Ελευθέριος (ΑΜ : 1943)

Διαβάστε περισσότερα

ΥΛΟΠΟΙΗΣΗ ΜΕΘΟΔΟΥ ΑΝΑΚΤΗΣΗΣ ΕΙΚΟΝΩΝ ΜΕ ΒΑΣΗ ΤΟ ΠΕΡΙΕΧΟΜΕΝΟ

ΥΛΟΠΟΙΗΣΗ ΜΕΘΟΔΟΥ ΑΝΑΚΤΗΣΗΣ ΕΙΚΟΝΩΝ ΜΕ ΒΑΣΗ ΤΟ ΠΕΡΙΕΧΟΜΕΝΟ Τ Ε Χ Ν Ο Λ Ο Γ Ι Κ Ο Ε Κ Π Α Ι Δ Ε Υ Τ Ι Κ Ο Ι Δ Ρ Υ Μ Α Σ Ε Ρ Ρ Ω Ν Σ Χ Ο Λ Η Τ Ε Χ Ν Ο Λ Ο Γ Ι Κ Ω Ν Ε Φ Α Ρ Μ Ο Γ Ω Ν Τ Μ Η Μ Α Π Λ Η Ρ Ο Φ Ο Ρ Ι Κ Η Σ & Ε Π Ι Κ Ο Ι Ν Ω Ν Ι Ω Ν ΥΛΟΠΟΙΗΣΗ ΜΕΘΟΔΟΥ ΑΝΑΚΤΗΣΗΣ

Διαβάστε περισσότερα

ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ ΗΛΕΚΤΡΟΝΙΚΗΣ ΚΑΙ ΥΠΟΛΟΓΙΣΤΩΝ

ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ ΗΛΕΚΤΡΟΝΙΚΗΣ ΚΑΙ ΥΠΟΛΟΓΙΣΤΩΝ ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ ΗΛΕΚΤΡΟΝΙΚΗΣ ΚΑΙ ΥΠΟΛΟΓΙΣΤΩΝ "ΤΕΧΝΙΚΕΣ ΑΝΙΧΝΕΥΣΗΣ ΚΙΝΗΣΗΣ ΣΕ ΠΡΟΚΑΘΟΡΙΣΜΕΝΕΣ ΠΕΡΙΟΧΕΣ

Διαβάστε περισσότερα

ΑΛΓΟΡΙΘΜΟΙ ΑΝΑΛΥΣΗΣ ΙΑΤΡΙΚΗΣ ΕΙΚΟΝΑΣ

ΑΛΓΟΡΙΘΜΟΙ ΑΝΑΛΥΣΗΣ ΙΑΤΡΙΚΗΣ ΕΙΚΟΝΑΣ ΕΘΝΙΚΟ & ΚΑΠΟ ΙΣΤΡΙΑΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Μεταπτυχιακό Πρόγραµµα Σπουδών ΑΛΓΟΡΙΘΜΟΙ ΑΝΑΛΥΣΗΣ ΙΑΤΡΙΚΗΣ ΕΙΚΟΝΑΣ Χάρης Γεωργίου, ΑΜ:Μ-177 Αθήνα, Σεπτέµβριος 2000 - ii - ΑΛΓΟΡΙΘΜΟΙ ΑΝΑΛΥΣΗΣ

Διαβάστε περισσότερα

ΠΟΛΥΤΕΧΝΕΙΟ ΚΡΗΤΗΣ ΤΜΗΜΑ ΗΛΕΚΤΡΟΝΙΚΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΗΛΕΚΤΡΟΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ ΤΗΛΕΠΙΚΟΙΝΩΝΙΩΝ

ΠΟΛΥΤΕΧΝΕΙΟ ΚΡΗΤΗΣ ΤΜΗΜΑ ΗΛΕΚΤΡΟΝΙΚΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΗΛΕΚΤΡΟΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ ΤΗΛΕΠΙΚΟΙΝΩΝΙΩΝ ΤΜΗΜΑ ΗΛΕΚΤΡΟΝΙΚΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΗΛΕΚΤΡΟΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ ΤΗΛΕΠΙΚΟΙΝΩΝΙΩΝ Ελαχιστοποίηση χαρακτηριστικών ταξινομητή για γονιδιακή σύνθεση ΑΚΑΔΗΜΑΪΚΟ ΕΤΟΣ : 2008 2009 ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ

Διαβάστε περισσότερα

ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ. Πολυτεχνική Σχολή Τμήμα Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών

ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ. Πολυτεχνική Σχολή Τμήμα Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ Πολυτεχνική Σχολή Τμήμα Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών Σύστημα Άργος Σύστημα εντοπισμού ανθρώπου και αναγνώρισης πόζας,βασιζόμενο σε δεδομένα RGB-D

Διαβάστε περισσότερα

ΑΝΑΠΤΥΞΗ ΛΟΓΙΣΜΙΚΟΥ ΓΙΑ ΤΗΝ ΑΝΑΓΝΩΡΙΣΗ ΟΠΤΙΚΩΝ ΣΗΜΑΤΩΝ ΜΕΣΩ ΒΛΕΦΑΡΙΣΜΑΤΟΣ (BLINK DETECTION) Πτυχιακή εργασία

ΑΝΑΠΤΥΞΗ ΛΟΓΙΣΜΙΚΟΥ ΓΙΑ ΤΗΝ ΑΝΑΓΝΩΡΙΣΗ ΟΠΤΙΚΩΝ ΣΗΜΑΤΩΝ ΜΕΣΩ ΒΛΕΦΑΡΙΣΜΑΤΟΣ (BLINK DETECTION) Πτυχιακή εργασία Τ Ε Χ Ν Ο Λ Ο Γ Ι Κ Ο Ε Κ Π Α Ι Δ Ε Υ Τ Ι Κ Ο Ι Δ Ρ Υ Μ Α Κ Ε Ν Τ Ρ Ι Κ Η Σ Μ Α Κ Ε Δ Ο Ν Ι Α Σ Σ Χ Ο Λ Η Τ Ε Χ Ν Ο Λ Ο Γ Ι Κ Ω Ν Ε Φ Α Ρ Μ Ο Γ Ω Ν Τ Μ Η Μ Α Μ Η Χ Α Ν Ι Κ Ω Ν Π Λ Η Ρ ΟΦ Ο Ρ Ι Κ ΗΣ Τ.

Διαβάστε περισσότερα