ΧΡΗΣΗ ΤΥΧΑΙΩΝ ΧΡΟΝΙΚΩΝ ΔΙΑΣΤΗΜΑΤΩΝ ΓΙΑ ΕΛΕΓΧΟ ΒΙΟΜΕΤΡΙΚΩΝ ΧΑΡΑΚΤΗΡΙΣΤΙΚΩΝ

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "ΧΡΗΣΗ ΤΥΧΑΙΩΝ ΧΡΟΝΙΚΩΝ ΔΙΑΣΤΗΜΑΤΩΝ ΓΙΑ ΕΛΕΓΧΟ ΒΙΟΜΕΤΡΙΚΩΝ ΧΑΡΑΚΤΗΡΙΣΤΙΚΩΝ"

Transcript

1 ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΣΧΟΛΗ ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΦΥΣΙΚΗΣ ΠΜΣ ΣΤΗΝ «ΗΛΕΚΤΡΟΝΙΚΗ ΚΑΙ ΕΠΕΞΕΡΓΑΣΙΑ ΤΗΣ ΠΛΗΡΟΦΟΡΙΑΣ» ΧΡΗΣΗ ΤΥΧΑΙΩΝ ΧΡΟΝΙΚΩΝ ΔΙΑΣΤΗΜΑΤΩΝ ΓΙΑ ΕΛΕΓΧΟ ΒΙΟΜΕΤΡΙΚΩΝ ΧΑΡΑΚΤΗΡΙΣΤΙΚΩΝ

2 ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΣΧΟΛΗ ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΦΥΣΙΚΗΣ ΠΜΣ ΣΤΗΝ «ΗΛΕΚΤΡΟΝΙΚΗ ΚΑΙ ΕΠΕΞΕΡΓΑΣΙΑ ΤΗΣ ΠΛΗΡΟΦΟΡΙΑΣ» ΧΡΗΣΗ ΤΥΧΑΙΩΝ ΧΡΟΝΙΚΩΝ ΔΙΑΣΤΗΜΑΤΩΝ ΓΙΑ ΕΛΕΓΧΟ ΒΙΟΜΕΤΡΙΚΩΝ ΧΑΡΑΚΤΗΡΙΣΤΙΚΩΝ της φοιτήτριας: Σταμούλη Αλεξίας Α.Μ 138 Επιβλέπων: Σπύρος Φωτόπουλος, Καθηγητής Εγκρίθηκε από την τριμελή επιτροπή στις 27/09/2013 Τριμελής Επιτροπή: Ευάγγελος Ζυγούρης, Καθηγητής, Γεώργιος Οικονόμου, Καθηγητής, Σπύρος Φωτόπουλος, Καθηγητής, Πάτρα, Σεπτέμβριος, 2013

3 Θα ήθελα στο σημείο αυτό να εκφράσω την ευγνωμοσύνη μου σε όλους όσους συντέλεσαν άμεσα ή έμμεσα στην ολοκλήρωση της παρούσας εργασίας. Αρχικά θα ήθελα να ευχαριστήσω τον επιβλέποντα Καθηγητή της μεταπτυχιακής μου εργασίας κ. Σπύρο Φωτόπουλο για την καθοδήγησή του και την πολύτιμη βοήθειά του. Επίσης, θα ήθελα να εκφράσω ένα μεγάλο ευχαριστώ στους υποψήφιους διδάκτορες Φωτεινή Φωτοπούλου και Κωνσταντίνα Μπάρκουλα για τις πολύτιμες συμβουλές τους και τη συνεχή βοήθειά τους τόσο σε όλα τα τεχνικά θέματα της παρούσας μεταπτυχιακής εργασίας αλλά και στα διάφορα προβλήματα που προέκυψαν κατά την εκπόνηση της. Οι συμβουλές και η καθοδήγησή τους αποτέλεσαν καθοριστικά παράγοντα για την ολοκλήρωση της παρούσας εργασίας.

4 Η μέθοδος αναγνώρισης μέσω του τρόπου πληκτρολόγησης αποτελεί μία μέθοδο αναγνώρισης βιομετρικών χαρακτηριστικών με στόχο να ελαχιστοποιηθεί ο κίνδυνος κλοπής των προσωπικών κωδικών των πελατών ενός συστήματος. Το παρόν βιομετρικό σύστημα βασίζεται στο σενάριο ότι ο ρυθμός με τον οποίο ένα πρόσωπο πληκτρολογεί είναι ξεχωριστός. Το βιομετρικό σύστημα έχει δύο λειτουργίες, την εγγραφή των πελατών στο σύστημα και τη σύγκριση. Για την εγγραφή απαραίτητη είναι η εξαγωγή των προτύπων των πελατών τα οποία αποθηκεύονται στη βάση δεδομένων του συστήματος ενώ για στη σύγκριση το πρότυπο του χρήστη συγκρίνεται με το πρότυπο του πελάτη που ισχυρίζεται ότι είναι. Στη παρούσα εργασία η εξαγωγή τον προτύπων πραγματοποιείται μέσω μία σειράς αλγοριθμικών διαδικασιών. Αρχικά η μονοδιάστατη χαρακτηριστική χρονοσειρά του χρήστη μετατρέπεται μέσω της μεθόδου Method of Delays σε ένα πολυδιάστατο διάνυσμα που λειτουργεί ως χαρακτηριστικό της ακολουθίας. Στη συνέχεια χρησιμοποιούμε δύο διαφορετικές μεθόδους για να υπολογίσουμε τις ανομοιότητες μεταξύ των πολυδιάστατων διανυσμάτων που προέκυψαν. Οι δύο αυτές μέθοδοι είναι οι Wald-Wolfowitz test και Mutual Nearest Point Distance. Οι τιμές αυτές τοποθετούνται σε έναν πίνακα κάθε στοιχείο του οποίου αναπαριστά την ανομοιότητα μεταξύ δύο χρονοσειρών. Ο πίνακας αυτός μπορεί είτε να αποτελέσει το σύνολο των προτύπων των χρηστών είτε να χρησιμοποιηθεί ως είσοδο στη μέθοδο Multidimensional Scaling που χρησιμοποιείται για μετατροπή του πίνακα ανομοιοτήτων σε διανύσματα και εξαγωγή νέων προτύπων. Τέλος, προτείνουμε ως επέκταση της εργασίας την εκπαίδευση του βιομετρικού συστήματος με χρήση των τεχνικών Support Vector Machine. Για τη λειτουργία της σύγκρισης εξάγουμε πάλι το πρότυπο του χρήστη με την ίδια διαδικασία και το συγκρίνουμε με μία τιμή κατωφλίου. Τέλος, ο έλεγχος της αξιοπιστίας του συστήματος πραγματοποιείται μέσω της χρήσης τριών δεικτών απόδοσης, Equal Error Rate, False Rejection Rate και False Acceptance Rate. ΛΕΞΕΙΣ ΚΛΕΙΔΙΑ: wald-wolfowitz test, αμοιβαία απόσταση κοντινότερου σημείου, πολυδιάστατη κλιμάκωση, μηχανές διανυσμάτων υποστήριξης, Equal Error Rate iv

5 The identification method via keystroke is a method of identifying biometric features in order to minimize the risk of theft of personal codes of customers of a system. The present biometric system based on the scenario that the rate at which a person presses the keyboard buttons is special. The biometric system has two functions, the enrollment of customers in the system and their test. For enrollment, it is necessary to export standards of customers information stored in the system database and for the test the standard of the user is compared with the standard of the user that is intended to be the customer. In the present thesis the export of the standards is taken place via a series of algorithmic procedures. Initially, the one dimensional characteristic time series of user is converted, by the method Method of Delays, in a multidimensional vector that acts as a feature of the sequence. Then, two different methods are used to compute the dissimilarities between multidimensional vectors obtained. These two methods are the Wald-Wolfowitz test and the Mutual Nearest Point Distance. These values are placed in an array, each element of which represents the dissimilarity between two time series. This table can be either the standards of users or can be entry in the Multidimensional Scaling method used to convert the table disparities in vectors and then produce new standards of users. Finally, we propose as extension of our thesis, the training of biometric system with using the techniques of Support Vector Machine. For the test, again the pattern of the user is extracted with the same procedure and is compared to a threshold. Finally, the reliability of the system is carried out through the use of three performance indicators, Equal Error Rate, False Rejection Rate and False Acceptance Rate. KEYWORDS: method of delays, wald-wolfowitz test, mutual nearest point distance, Multidimensional Scaling, Support Vector Machines, Equal Error Rate, False Rejection Rate, False Acceptance Rate v

6 ΠΕΡΙΛΗΨΗ... IV ABSTRACT... V ΚΑΤΑΛΟΓΟΣ ΕΙΚΟΝΩΝ... X ΚΑΤΑΛΟΓΟΣ ΠΙΝΑΚΩΝ... XIV ΚΕΦΑΛΑΙΟ 1: ΕΙΣΑΓΩΓΗ Εισαγωγικό σημείωμα Σκοπός της εργασίας Διάρθρωση της εργασίας... 2 ΚΕΦΑΛΑΙΟ 2: ΒΙΟΜΕΤΡΙΚΕΣ ΜΕΘΟΔΟΙ ΑΝΑΓΝΩΡΙΣΗΣ Τι είναι η βιομετρική αναγνώριση Συνήθη βιομετρικά χαρακτηριστικά Βιομετρικό Συστήματα Περιγραφή και δυνατότητες ενός βιομετρικού συστήματος Κατηγορίες βιομετρικών συστημάτων και τα χαρακτηριστικά τους Λειτουργίες που παρέχει ένα βιομετρικό σύστημα Τεχνικές βάση των οποίων πραγματοποιείται η αναγνώριση των χρηστών Μέθοδοι αξιολόγησης και Δείκτες απόδοσης Μέθοδοι που χρησιμοποιούνται Σάρωση της ίριδας του ματιού Σάρωση του αμφιβληστροειδή Αναγνώριση προσώπου Δακτυλικά αποτυπώματα Γεωμετρία χεριού Γεωμετρία αιμοφόρων αγγείων στο χέρι ή στο πρόσωπο vi

7 2.5.7 Αναγνώριση φωνής Εξακρίβωση υπογραφής Αναγνώριση τρόπου πληκτρολόγησης ΚΕΦΑΛΑΙΟ 3: ΑΝΑΓΝΩΡΙΣΗ ΤΡΟΠΟΥ ΠΛΗΚΤΡΟΛΟΓΗΣΗΣ Εισαγωγή Τεχνικές Αναγνώρισης Χαρακτηριστικά συστημάτων αναγνώρισης μέσω του τρόπου πληκτρολόγησης Χαρακτηριστικά τα οποία υπολογίζονται αφαιρώντας χρονικές τιμές Χαρακτηριστικά που περιέχουν γενικές πληροφορίες Χαρακτηριστικά που προέκυψαν από τα χαρακτηριστικά πρώτης τάξης Περιβάλλον υλοποίησης του πειράματος Πλεονεκτήματα-Μειονεκτήματα Συμπερασματικά για τη μέθοδο ΚΕΦΑΛΑΙΟ 4: ΕΞΑΓΩΓΗ ΧΑΡΑΚΤΗΡΙΣΤΙΚΩΝ Εισαγωγή Εισαγωγή βιομετρικών δεδομένων Ανακατασκευή του χώρου των φάσεων Μέθοδος ενσωμάτωσης χρονικής καθυστέρησης Ιδανικές παράμετροι ενσωμάτωσης ΚΕΦΑΛΑΙΟ 5: ΜΕΘΟΔΟΙ ΟΜΟΙΟΤΗΤΑΣ ΠΟΛΥΔΙΑΣΤΑΤΩΝ ΔΕΔΟΜΕΝΩΝ Εισαγωγή Μέθοδος Wald Wolfowitz (WW-Test) Στοιχεία Θεωρίας των Γράφων Ανοιγμένα Δέντρα (spanning trees) Δέντρα Ελαχίστου Μήκους (Minimal Spanning Tree MST) Αλγόριθμοι εύρεσης του Δέντρου Ελαχίστου Μήκους Ο KRUSKAL αλγόριθμος υλοποίησης του MST vii

8 Ο PRIM αλγόριθμος υλοποίησης του MST Περιγραφή του Wald-Wolfowitz Test Πλεονεκτήματα του Wald-Wolfowitz test Αμοιβαία Απόσταση Κοντινότερου Σημείου-Mutual Nearest Point Distance ΚΕΦΑΛΑΙΟ 6: ΠΟΛΥΔΙΑΣΤΑΤΗ ΚΛΙΜΑΚΩΣΗ (MDS) Εισαγωγή Ορισμός Μέθοδοι συλλογής των δεδομένων εισόδου στον MDS αλγόριθμο Άμεσες μέθοδοι συλλογής δεδομένων Έμμεσες μέθοδοι συλλογής δεδομένων Είδη πολυδιάστατης κλιμάκωσης Κλασσική MDS ανάλυση Βήματα της κλασικής ανάλυσης MDS Παράδειγμα Μη-μετρική MDS ανάλυση Παράδειγμα μη-μετρικής MDS ανάλυσης Μέτρο αξιοπιστίας της προβολικής απεικόνισης Αποφάσεις που πρέπει να πάρουμε πριν την εφαρμογή του αλγορίθμου ΚΕΦΑΛΑΙΟ 7: ΜΗΧΑΝΕΣ ΔΙΑΝΥΣΜΑΤΩΝ ΥΠΟΣΤΗΡΙΞΗΣ Εισαγωγή Βέλτιστα υπερεπίπεδα για διαχωρισμό γραμμικά διαχωρίσιμων προτύπων Ταξινόμηση δεδομένων Βέλτιστα υπερεπίπεδα για διαχωρισμό μη γραμμικά διαχωρίσιμων προτύπων Μέθοδοι ταξινομητών SVM πολλών κλάσεων Μέθοδοι για έλεγχο της αξιοπιστίας της κατηγοριοποίησης Μέθοδος holdout (train set-test set) viii

9 7.6.2 Οι μέθοδοι Cross Validation ΚΕΦΑΛΑΙΟ 8: ΠΕΙΡΑΜΑΤΙΚΗ ΥΛΟΠΟΙΗΣΗ ΚΑΙ ΑΠΟΤΕΛΕΜΑΤΑ Εισαγωγή Δεδομένα πειράματος Τρόπος αξιοποίησης των δεδομένων Εξαγωγή προτύπων και εκπαίδευση Γραφικά αποτελέσματα αλγορίθμων Διαδικασία επαλήθευσης και σύγκρισης Γραφικά αποτελέσματα πρώτου πειράματος Ολικό κατώφλι Κατώφλι ανά χρήστη Γραφικά αποτελέσματα δεύτερου πειράματος Τελικά Συμπεράσματα ΠΙΝΑΚΑΣ ΟΡΟΛΟΓΙΑΣ ΣΥΝΤΜΗΣΕΙΣ ΑΚΡΩΝΥΜΑ ΑΝΑΦΟΡΕΣ ix

10 Εικόνα 1: Βιομετρικά χαρακτηριστικά φυσιολογίας και συμπεριφοράς Εικόνα 2: Χαρακτηριστικό διάγραμμα ενός βιομετρικού συστήματος Εικόνα 3: Ταξινόμηση του χρήστη με βάση τις τεχνικές επαλήθευσης Εικόνα 4: ROC καμπύλη Εικόνα 5: Διάγραμμα FAR συναρτήσει του FRR για διάφορες τιμές κατωφλίου αποδοχής Εικόνα 6: Διάρκεια μεταξύ διαδοχικών πληκτρολογήσεων και Διάρκεια πίεσης Εικόνα 7: Εξαγόμενα χαρακτηριστικά που βασίζονται στο χρόνο Εικόνα 8: Παράδειγμα ανακατασκευασμένου χώρου φάσεων Εικόνα 9: Παράδειγμα υπολογισμού του μέτρου J Εικόνα 10: Γεωμετρική αναπαράσταση γράφου Εικόνα 11: Γράφος Εικόνα 12: Τοπολογία Σημείων σε Γράφο Εικόνα 13: Ανοιγμένο Δέντρο Επιπέδου Γράφου Εικόνα 14: Γράφος με Βάρη Εικόνα 15: Υλοποίηση αλγόριθμου Prim Εικόνα 16: Στόχος είναι η εύρεση των g i που διατηρούν την D ij όσο το δυνατόν πιο κοντά στην d ij. 53 Εικόνα 17: Δισδιάστατη απεικόνιση όλων των αποστάσεων μεταξύ των πόλεων με χρήση της MDS ανάλυσης Εικόνα 18: Scree plot και Shepard diagram Εικόνα 19: Βέλτιστο υπερεπίπεδο για γραμμικά διαχωρίσιμα πρότυπα Εικόνα 20: Στην περίπτωση αυτή, ένα σημείο x i, πέφτει στην περιοχή του διαχωρισμού, αλλά στην σωστή πλευρά του επιπέδου απόφασης ενώ στη δεύτερη περίπτωση το σημείο πέφτει στην λάθος πλευρά του επιπέδου απόφασης Εικόνα 21: Μη γραμμικός διαχωρισμός δεδομένων Εικόνα 22: Απεικόνιση των δεδομένων εισόδου σε νέο χώρο μέσω της συνάρτησης Φ Εικόνα 23: RTI σήματα του υποκειμένου Εικόνα 24: RTI σήματα του υποκειμένου Εικόνα 25: RTI σήματα τριών διαφορετικών υποκειμένων Εικόνα 26: Πρωτόκολλο πειράματος x

11 Εικόνα 27: Σχηματικό διάγραμμα της διαδικασίας εκπαίδευσης του βιομετρικού συστήματος επαλήθευσης Εικόνα 28: Ανακατασκευασμένες χρονοσειρές με παραμέτρους ενσωμάτωσης p=2, τ=5, για δύο χρονοσειρές του χρήστη Εικόνα 29: Ανακατασκευασμένες χρονοσειρές με παραμέτρους ενσωμάτωσης p=2, τ=5, για δύο διαφορετικού χρήστες Εικόνα 30: Scree plot με παραμέτρους ενσωμάτωσης p=7 και τ=1 και πίνακα ομοιοτήτων που προέκυψε από τη μέθοδο WW-test Εικόνα 31: Scree plot με παραμέτρους ενσωμάτωσης p=7 και τ=1 και πίνακα ομοιοτήτων που προέκυψε από τη μέθοδο MNPD Εικόνα 32: Scree plot με παραμέτρους ενσωμάτωσης p=4 και τ=3 και πίνακα ομοιοτήτων που προέκυψε από τη μέθοδο WW-test Εικόνα 33: Scree plot με παραμέτρους ενσωμάτωσης p=4 και τ=3 και πίνακα ομοιοτήτων που προέκυψε από τη μέθοδο WW-test Εικόνα 34: Δισδιάστατη αναπαράσταση των σημείων που προέκυψαν από την MDS ανάλυση Εικόνα 35: Δισδιάστατη αναπαράσταση των σημείων που προέκυψαν από την MDS ανάλυση Εικόνα 36: Δισδιάστατη αναπαράσταση των σημείων που προέκυψαν από την MDS ανάλυση Εικόνα 37: Δισδιάστατη αναπαράσταση των σημείων που προέκυψαν από την MDS ανάλυση Εικόνα 38: Παράμετρος J για διαφορετικές τιμές των παραμέτρων ενσωμάτωσης Εικόνα 39: Παράμετρος J για διαφορετικές τιμές των παραμέτρων ενσωμάτωσης Εικόνα 40: Σχηματική αναπαράσταση πρώτου πειράματος διαδικασίας σύγκρισης Εικόνα 41: Σχηματική αναπαράσταση δεύτερου πειράματος διαδικασίας σύγκρισης Εικόνα 42: Σχηματική αναπαράσταση ταξινόμησης των δειγμάτων με χρήση της SVM τεχνικής Εικόνα 43: Διάγραμμα FAR συναρτήσει του FRR για διάφορες τιμές κατωφλίου με χρήση της μεθόδου WW-test και παραμέτρους ενσωμάτωσης p=7,τ= Εικόνα 44: Καμπύλη ROC, με χρήση της μεθόδου WW-test και παραμέτρους ενσωμάτωσης p=7,τ= Εικόνα 45: Διάγραμμα FAR συναρτήσει του FRR για διάφορες τιμές κατωφλίου με χρήση της μεθόδου MNPD και παραμέτρους ενσωμάτωσης p=7,τ= Εικόνα 46: Καμπύλη ROC, με χρήση της μεθόδου MNPD και παραμέτρους ενσωμάτωσης p=7,τ= Εικόνα 47: Διάγραμμα FAR συναρτήσει του FRR για διάφορες τιμές κατωφλίου με χρήση της μεθόδου WW-test και παραμέτρους ενσωμάτωσης p=4,τ= xi

12 Εικόνα 48: Καμπύλη ROC, με χρήση της μεθόδου WW-test και παραμέτρους ενσωμάτωσης p=4,τ= Εικόνα 49: Καμπύλη ROC, με χρήση της μεθόδου MNPD και παραμέτρους ενσωμάτωσης p=4,τ= Εικόνα 50: Καμπύλη ROC, με χρήση της μεθόδου MNPD και παραμέτρους ενσωμάτωσης p=4,τ= Εικόνα 51: Διάγραμμα FAR συναρτήσει του FRR για διάφορες τιμές κατωφλίου με χρήση της μεθόδου WW-test και παραμέτρους ενσωμάτωσης p=7,τ= Εικόνα 52: Καμπύλη ROC, με χρήση της μεθόδου WW-test και παραμέτρους ενσωμάτωσης p=7,τ= Εικόνα 53: Διάγραμμα FAR συναρτήσει του FRR για διάφορες τιμές κατωφλίου με χρήση της μεθόδου MNPD και παραμέτρους ενσωμάτωσης p=7,τ= Εικόνα 54: Καμπύλη ROC, με χρήση της μεθόδου MNPD και παραμέτρους ενσωμάτωσης p=7,τ= Εικόνα 55: Διάγραμμα FAR συναρτήσει του FRR για διάφορες τιμές κατωφλίου με χρήση της μεθόδου WW-test και παραμέτρους ενσωμάτωσης p=4,τ= Εικόνα 56: Καμπύλη ROC, με χρήση της μεθόδου WW-test και παραμέτρους ενσωμάτωσης p=4,τ= Εικόνα 57: Διάγραμμα FAR συναρτήσει του FRR για διάφορες τιμές κατωφλίου με χρήση της μεθόδου MNPD και παραμέτρους ενσωμάτωσης p=4,τ= Εικόνα 58: Καμπύλη ROC, με χρήση της μεθόδου MNPD και παραμέτρους ενσωμάτωσης p=4,τ= Εικόνα 59: Διάγραμμα FAR συναρτήσει του FRR για διάφορες τιμές κατωφλίου με χρήση των μεθόδων WW-test και MDS και παραμέτρους ενσωμάτωσης p=7,τ= Εικόνα 60: Καμπύλη ROC, με χρήση των μεθόδων WW-test και MDS και παραμέτρους ενσωμάτωσης p=7,τ= Εικόνα 61: Διάγραμμα FAR συναρτήσει του FRR για διάφορες τιμές κατωφλίου με χρήση των μεθόδων MNPD και MDS και παραμέτρους ενσωμάτωσης p=7,τ= Εικόνα 62: Καμπύλη ROC, με χρήση των μεθόδων MNPD και MDS και παραμέτρους ενσωμάτωσης p=7,τ= Εικόνα 63: Διάγραμμα FAR συναρτήσει του FRR για διάφορες τιμές κατωφλίου με χρήση των μεθόδων WW-test και MDS και παραμέτρους ενσωμάτωσης p=4,τ= xii

13 Εικόνα 64: Καμπύλη ROC, με χρήση των μεθόδων WW-test και MDS και παραμέτρους ενσωμάτωσης p=4,τ= Εικόνα 65: Διάγραμμα FAR συναρτήσει του FRR για διάφορες τιμές κατωφλίου με χρήση των μεθόδων MNPD και MDS και παραμέτρους ενσωμάτωσης p=4,τ= Εικόνα 66: Καμπύλη ROC, με χρήση των μεθόδων MNPD και MDS και παραμέτρους ενσωμάτωσης p=4,τ= xiii

14 Πίνακας 1: Σύγκριση βιομετρικών χαρακτηριστικών... 7 Πίνακας 2: Εξισώσεις Καθυστέρησης Πίνακας 3: Πίνακας των Ευκλείδειων αποστάσεων (σε χλμ.) Πίνακας 4: Πίνακας ανομοιοτήτων δ ij για τις ακόλουθες μάρκες αυτοκινήτων Πίνακας 5: Αρχικές συντεταγμένες για την MDS ανάλυση, πίνακας Χ Πίνακας 6: Πίνακας με τις αποστάσεις d i,j και την αριθμητική διάταξη αυτών Πίνακας 7: Υπολογισμός παραμέτρου Stress Πίνακας 8: Συναρτήσεις Kernel Πίνακας 9: EER (%) για το πρώτο πείραμα και χρήση ολικού κατωφλίου Πίνακας 10: Ιδανικές τιμές κατωφλίων ανά χρήστη, με παραμέτρους ενσωμάτωσης p=7, τ= Πίνακας 11: Ιδανικές τιμές κατωφλίων ανά χρήστη, με παραμέτρους ενσωμάτωσης p=4, τ= Πίνακας 12: EER (%) για το πρώτο πείραμα και χρήση κατωφλίου ανά χρήστη Πίνακας 13: Ιδανικές τιμές κατωφλίων ανά χρήστη, με παραμέτρους ενσωμάτωσης p=7, τ= Πίνακας 14: Ιδανικές τιμές κατωφλίων ανά χρήστη, με παραμέτρους ενσωμάτωσης p=4, τ= Πίνακας 15: EER (%) για το δεύτερο πείραμα και χρήση κατωφλίου ανά χρήστη Πίνακας 16: Συνολικός πίνακας αποτελεσμάτων για το EER (%) xiv

15 1.1 Εισαγωγικό σημείωμα Η ραγδαία ανάπτυξη τις τελευταίες δεκαετίες στον τομέα των ηλεκτρονικών υπολογιστών έχει ως αποτέλεσμα την άμεσα και ολοένα μεγαλύτερη εξάρτησή μας από τα ηλεκτρονικά μέσα και το διαδίκτυο. Οι υπολογιστές ελέγχουν τις αγορές, τις συναλλαγές ακόμα και τις καταθέσεις μας. Οι πιστωτικές κάρτες στις περισσότερες χώρες έχουν αντικαταστήσει τις συναλλαγές με μετρητά και οι αγορές αρκετών προϊόντων πλέον πραγματοποιείται μέσω διαδικτύου. Επιπλέον το διαδίκτυο είναι το μέσο το οποίο επιλέγουν, κυρίως οι νέες γενιές για την ενημέρωση, την επικοινωνία τους και ως μέσο εκπαίδευσης. Παρατηρείται επομένως μια ολοένα και μεγαλύτερη εξάρτηση από τον τομέα των ηλεκτρονικών. Η αυξημένη αυτή χρήση έχει διευκολύνει σε μεγάλο βαθμό την καθημερινότητα μας, προσφέροντας μας μια πιο εύκολη διαβίωση. Η εξάρτηση μας όμως αυτή από την τεχνολογία έχει ως επακόλουθο και αρνητικές συνέπειες. Όσο εύκολα και γρήγορα μπορούμε να ελέγξουμε τους τραπεζικούς μας λογαριασμούς και τα μέσω internet άλλο τόσο εύκολη είναι η εύρεση των προσωπικών μας κωδικών που θα οδηγήσει τελικά στην κλοπή των χρημάτων μας και στη χρήση ευαίσθητων προσωπικών μας δεδομένων. Επομένως, η ανάγκη για τεχνολογίες που σχετίζονται με ασφαλή ταυτοποίηση και επαλήθευση προσώπων γίνεται ολοένα και περισσότερο αναγκαία. Ο τομέας της Βιομετρικής φαίνεται να αποτελεί τη λύση. Η περιοχή της Βιομετρικής περιλαμβάνει αυτοματοποιημένες μεθόδους αναγνώρισης ενός προσώπου μέσω φυσιολογικών χαρακτηριστικών καθώς και χαρακτηριστικών που έχουν σχέση με τη συμπεριφορά π.χ. πρόσωπο, δακτυλικά αποτυπώματα, γεωμετρία χεριού, γραφικός χαρακτήρας, ίρις ματιού. Οι μέθοδοι λοιπόν αυτοί οι οποίοι βασίζονται στη χρήση και επεξεργασία των Βιομετρικών χαρακτηριστικών φαίνεται να αποτελούν την πιο αξιόπιστη και πολλά υποσχόμενη λύση, λόγω την μοναδικότητας των χαρακτηριστικών αυτών και της δυσκολίας αντιγραφής τους από τρίτους. Για τους προηγούμενους λόγους η χρήση βιομετρικών χαρακτηριστικών για ταυτοποίηση και επαλήθευση προσώπων είναι συγκριτικά πιο ακριβής σε σχέση με τωρινές μεθόδους (όπως η χρήση κωδικών ή PINs). Επιπλέον, η Α. Σταμούλη Σελίδα 1

16 χρήση τους είναι εύκολη αφού ο χρήστης δεν είναι υποχρεωμένος να θυμάται κάποιον κωδικό, είναι κοινωνικά αποδεκτές μέθοδοι και το κόστος κατασκευής τους δεν είναι μεγάλο. Στην παρούσα εργασία θα ασχοληθούμε με μία μέθοδο, η οποία βασίζεται περισσότερο σε δυναμικά χαρακτηριστικά (πχ φωνής, ήχος) τα οποία δεν μπορεί κάποιος εύκολα να τα μιμηθεί. Η μέθοδος αυτή ονομάζεται αναγνώριση μέσω πληκτρολόγησης. Μέσω αυτής αναλύεται ο τρόπος με τον οποίο ένα συγκεκριμένο πρόσωπο πληκτρολογεί και μέσω αυτού του τρόπου το σύστημα επιχειρεί να επαληθεύσει τον εκάστοτε χρήστη. Το σύστημα επαλήθευσης βασίζεται στο σενάριο ότι ο ρυθμός με τον οποίο ένα πρόσωπο πληκτρολογεί είναι ξεχωριστός. Σκοπός της μεθόδου αυτής, όπως και των λοιπών βιομετρικών μεθόδων, είναι να ελαχιστοποιηθεί ο κίνδυνος χρήσης προσωπικών κωδικών και λογαριασμών των χρηστών-πελατών από οργανισμούς, εταιρείες ή χρήστες που έχουν ως στόχο την κλοπή και τη χρήση των λογαριασμών προς δικό τους όφελος, ζημιώνοντας τον πελάτη Σκοπός της εργασίας Στόχος της παρούσας εργασίας είναι η μελέτη και η κατανόηση της βιομετρικής μεθόδου αναγνώρισης που εκμεταλλεύεται τον τρόπο πληκτρολόγησης. Θα παρουσιάσουμε και θα αναπτύξουμε τους αλγορίθμους και τις μεθόδους που χρησιμοποιούνται για την επεξεργασία και σύγκριση των αντίστοιχων βιομετρικών χαρακτηριστικών που αξιοποιεί η συγκεκριμένη μέθοδος και θα παρουσιάσουμε τα αποτελέσματα, έτσι ώστε να εξετάσουμε εάν είναι εφικτή η χρήση της συγκεκριμένης μεθόδου για την επαλήθευση και την ταυτοποίηση προσώπων Διάρθρωση της εργασίας Η παρούσα εργασία χωρίζεται σε οχτώ κεφάλαια. Το πρώτο κεφάλαιο αποτελεί ένα εισαγωγικό κεφάλαιο στο θέμα της παρούσας διπλωματικής, μέσω του οποίου εξηγήσουμε τους λόγους που μας οδήγησαν στη χρήση των Βιομετρικών Μεθόδων και την ολοένα και μεγαλύτερη στήριξη της επιστημονικής κοινότητας στην ανάπτυξη των μεθόδων αυτών. Εξηγούμε συνοπτικά τη μέθοδο την οποία εξετάσαμε και τον στόχο που επιδιώκουμε με την ανάλυση της. Το δεύτερο κεφάλαιο χωρίζεται σε πέντε ενότητες. Στην πρώτη ενότητα περιγράφουμε τι είναι Βιομετρική Αναγνώριση και τα συνήθη Βιομετρικά Α. Σταμούλη Σελίδα 2

17 Χαρακτηριστικά. Στη δεύτερη ενότητα παρουσιάζουμε το θεωρητικό υπόβαθρο σχετικά με τα Βιομετρικά Συστήματα. Περιγράφουμε αναλυτικά τι είναι ένα Βιομετρικό Σύστημα, τις κατηγορίες και τα χαρακτηριστικά των Βιομετρικών συστημάτων καθώς επίσης τις λειτουργίες που μας παρέχουν και τις τεχνικές βάση των οποίων πραγματοποιείται η αναγνώριση των χρηστών. Οι μέθοδοι αξιολόγησης και οι δείκτες απόδοσης που παρουσιάζονται στην τρίτη ενότητα σχετίζονται με την αξιοπιστία του συστήματος και την αποδοτική λειτουργία του. Τέλος, στην τελευταία ενότητα περιγράφουμε με λίγα λόγια τις πιο ευρέα διαδεδομένες Βιομετρικές Μεθόδους Αναγνώρισης. Στο τρίτο κεφάλαιο αναλύουμε το θεωρητικό υπόβαθρο της τεχνικής την οποία και μελετάμε. Περιγράφουμε αναλυτικά τα τεχνικά στοιχεία της μεθόδου, τα χαρακτηριστικά που χρησιμοποιούνται από το σύστημα αναγνώρισης μέσω του τρόπου πληκτρολόγησης, το περιβάλλον υλοποίησης του πειράματος και τα πλεονεκτήματαμειονεκτήματα της μεθόδου. Στο επόμενα κεφάλαια περιγράφουμε τη θεωρία των αλγορίθμων που χρησιμοποιήθηκαν για τη δημιουργία της βάσης δεδομένων των προτύπων καθώς και τη διαδικασία της σύγκρισης. Πιο συγκεκριμένα στο κεφάλαιο τέσσερα αναφερόμαστε αρχικά στον τρόπο με τον οποίο εισάγονται τα βιομετρικά δεδομένα του κάθε χρήστη στο σύστημα και στη συνέχεια στη μέθοδο ενσωμάτωσης χρονικής καθυστέρησης- Method of Delays την οποία χρησιμοποιούμε για την εξαγωγή των χαρακτηριστικών του συστήματος. Στο κεφάλαιο πέντε και στο κεφάλαιο έξι αναλύουμε τις δύο μεθόδους που χρησιμοποιούνται για την εξαγωγή των προτύπων του Βιομετρικού συστήματος. Συγκεκριμένα στο κεφάλαιο πέντε περιγράφουμε θεωρητικά τις μεθόδους ομοιότητας πολυδιάστατων δεδομένων που χρησιμοποιούμε για να συγκρίνουμε τα χαρακτηριστικά που προέκυψαν από το κεφάλαιο τέσσερα. Οι δύο αυτές μέθοδοι συγκρίνουν τα χαρακτηριστικά και μας επιστρέφουν ένα πίνακα ομοιοτήτων ή ανομοιοτήτων. Η πρώτη μέθοδος την οποία αναλύουμε ονομάζεται μέθοδος Wald Wolfowitz (WW-test) και στηρίζεται στη θεωρία γράφων και κυρίως στα δέντρα ελαχίστου μήκους. Ξεκινάμε επομένως τη θεωρητική ανάλυση με τα στοιχεία της θεωρίας των γράφων, τα δέντρα ελαχίστου μήκους και τους αλγόριθμους εύρεσης αυτών. Έπειτα περιγράφουμε τις βασικές αρχές της μεθόδου Wald Wolfowitz. Η δεύτερη μέθοδος την οποία αναλύουμε είναι η Αμοιβαία Απόσταση Κοντινότερου Σημείου-Mutual Nearest Point Distance. Η Α. Σταμούλη Σελίδα 3

18 μέθοδος αυτή δεν στηρίζεται σε κάποια θεωρία και είναι πολύ πιο απλή και κατανοητή από την WW-test. Στο κεφάλαιο έξι περιγράφουμε τη μέθοδο Πολυδιάστατης Κλιμάκωσης- Multidimensional Scale (MDS). Η μέθοδος αυτή δέχεται ως είσοδο τον πίνακα που προέκυψε από τις μεθόδους ομοιότητας και ομαδοποιεί τα δεδομένα ανά χρήστη. Το κεφάλαιο αυτό χωρίζεται σε οχτώ ενότητες. Στις δύο πρώτες περιγράφουμε συνοπτικά τον λόγο που χρησιμοποιούμε τη μέθοδο στη συγκεκριμένη εργασία και τον ορισμό της μεθόδου ενώ στην τρίτη τις μεθόδους συλλογής των δεδομένων εισόδου στον MDS αλγόριθμο. Στις επόμενες τρεις ενότητες αναλύουμε θεωρητικά και με παραδείγματα τις δύο βασικές κατηγορίες της πολυδιάστατης κλιμάκωσης, τη μετρική και τη μη μετρική πολυδιάστατη ανάλυση. Τέλος αναφέρουμε τα μέτρα που χρησιμοποιούμε για να ελέγξουμε την αξιοπιστία της μεθόδου και τις αποφάσεις, τις οποίες πρέπει να πάρουμε πριν την εφαρμογή της. Στο κεφάλαιο εφτά περιγράφουμε τις μηχανές διανυσμάτων υποστήριξης ή όπως είναι ευρέως γνωστές Support Vector Machines, οι οποίες προτείνονται ως επέκταση του πειράματος που χρησιμοποιούμε. Οι μέθοδοι αυτοί λαμβάνουν τα δεδομένα που προέκυψαν από τον MDS αλγόριθμο και προσπαθούν να βρουν τα βέλτιστα υπερεπίπεδα για το διαχωρισμό των δεδομένων. Ξεκινάμε λοιπόν με τη βασική θεωρία των μεθόδων αυτών αρχικά για το διαχωρισμό γραμμικά διαχωρίσιμων προτύπων και στη συνέχεια για το διαχωρισμό μη γραμμικά διαχωρίσιμων προτύπων. Τέλος, αναφερόμαστε στις μεθόδους για τον έλεγχο της αξιοπιστίας τους. Στο τελευταίο κεφάλαιο παρουσιάζουμε συνολικά τη πειραματική μας διαδικασία και τα πειραματικά αποτελέσματα. Αρχικά αναφερόμαστε στο σύνολο των δεδομένων του πειράματός μας, συνεχίζουμε με την εξαγωγή των προτύπων, παραθέτοντας ταυτόχρονα και γραφικά αποτελέσματα με τη βοήθεια του matlab. Έπειτα περιγράφουμε τη σύγκριση εισάγοντας γραφικά τους δείκτες απόδοσης και τέλος αξιολογούμε τα αποτελέσματα και ανακεφαλαιώνουμε τα βασικά ευρήματα και συμπεράσματα για την αξιοποίηση του υπό μελέτη Βιομετρικού συστήματος. Α. Σταμούλη Σελίδα 4

19 2.1 Τι είναι η βιομετρική αναγνώριση Βιομετρική αναγνώριση είναι η επιστήμη αναγνώρισης προσώπων μέσω της χρήσης χαρακτηριστικών που εξάγονται είτε από την ανθρώπινη φυσιολογία (physical traits) είτε από την ανθρώπινη συμπεριφορά (behavioral traits). 2.2 Συνήθη βιομετρικά χαρακτηριστικά Τα βιομετρικά χαρακτηριστικά χωρίζονται σε δύο κατηγορίες: Βιομετρικά χαρακτηριστικά φυσιολογίας (physiological trait) Βιομετρικά χαρακτηριστικά συμπεριφοράς (behavioral trait) Τα πρώτα σχετίζονται με εξωτερικά χαρακτηριστικά του ανθρώπινου σώματος ενώ τα χαρακτηριστικά της δεύτερης κατηγορίας εξαρτώνται από τη ψυχολογία ή τη συμπεριφορά του χρήστη. Το παλαιότερο χαρακτηριστικό φυσιολογίας το οποίο χρησιμοποιείται εδώ και 100 περίπου χρόνια είναι τα δακτυλικά αποτυπώματα. Άλλα παραδείγματα είναι η αναγνώριση του προσώπου, η γεωμετρία του χεριού και η αναγνώριση μέσω της ίριδας του ματιού. Όσον αφορά τα βιομετρικά χαρακτηριστικά συμπεριφοράς, το πιο γνωστό χαρακτηριστικό είναι η υπογραφή. Επιπλέον, κάθε κατηγορία περιέχει στοιχεία της άλλης σε διαφορετικό κάθε φορά βαθμό. Χαρακτηριστικό παράδειγμα είναι τη φωνή, η οποία είναι χαρακτηριστικό φυσιολογίας, αφού η φωνή κάθε άτομου χαρακτηρίζεται από διαφορετική περίοδο pitch αλλά η αναγνώριση μέσω φωνής εξαρτάται σημαντικά από την ψυχολογική κατάσταση του ατόμου και στον τρόπο που το κάθε άτομο μιλάει. Στην εικόνα 1 παρουσιάζουμε ορισμένα παραδείγματα βιομετρικών χαρακτηριστικών. [1] Α. Σταμούλη Σελίδα 5

20 Εικόνα 1: Βιομετρικά χαρακτηριστικά φυσιολογίας και συμπεριφοράς. Για να αξιολογήσουμε τα αποτελέσματα ενός βιομετρικού χαρακτηριστικού ή συστήματος ως προς την απόδοση σε εφαρμογές αναγνώρισης ατόμων χρησιμοποιούνται οι παρακάτω παράμετροι, τα τέσσερα πρώτα αφορούν το ίδιο το βιομετρικό χαρακτηριστικό ενώ τα επόμενα 3 το βιομετρικό σύστημα: Καθολικότητα (universality): περιγράφει πόσο κοινό είναι το βιομετρικό χαρακτηριστικό σε κάθε άτομο. Μοναδικότητα (uniqueness): αξιολογεί την ικανότητα του χαρακτηριστικού να διαχωρίζει το ένα άτομο από το άλλο. Μονιμότητα (permanence): μετράει την ικανότητα του βιομετρικού χαρακτηριστικού να αντιστέκεται στην γήρανση. Συλλεξιμότητα (collectability): εξηγεί πόσο εύκολο είναι να συλλεχθούν τα δεδομένα για το συγκεκριμένο χαρακτηριστικό. Αποδοση (performance): δείχνει την ακρίβεια, την ταχύτητα και την αξιοπιστία του συστήματος που χρησιμοποιείται για την συλλογή των δεδομένων του βιομετρικού χαρακτηριστικού. Αποδοχή (acceptability): δείχνει το βαθμό αποδοχής της τεχνολογίας που χρησιμοποιεί το συγκεκριμένο βιομετρικό από το ευρύ κοινό στην καθημερινή ζωή. Εξαπάτηση (circumvention): Πόσο εύκολο είναι να εξαπατηθεί το σύστημα.[1] Α. Σταμούλη Σελίδα 6

21 Σήμερα ένας μεγάλος αριθμός βιομετρικών συστημάτων χρησιμοποιείται σε διάφορες εφαρμογές. Κάθε βιομετρικό σύστημα έχει τα μειονεκτήματα και τα πλεονεκτήματα του, η επιλογή του κατάλληλου βιομετρικού συστήματος εξαρτάται από την εφαρμογή. Δεν απαιτείται κανένα βιομετρικό σύστημα να ικανοποιεί τις απαιτήσεις σε όλες τις εφαρμογές. Το πιο βιομετρικό σύστημα θα χρησιμοποιηθεί και για ποια εφαρμογή θα εξαρτηθεί τόσο από τα χαρακτηριστικά και τις απαιτήσεις της εκάστοτε εφαρμογής όσο και από της δυνατότητες του συστήματος. Στον παρακάτω πίνακα κάνουμε μια σύγκριση μεταξύ διαφόρων βιομετρικών συστημάτων με βάση τις προηγούμενες παραμέτρους: Πίνακας 1: Σύγκριση βιομετρικών χαρακτηριστικών Πρόσωπο H L M H L H L Δακτυλικό M H H M H M H αποτύπωμα Γεωμετρία M M M H M M M χεριού Ίριδα H H H M H L H Υπογραφή L L L H L H L Φωνή M L L M L H L Πληκτρολογηση L L L M L M M DNA H H H L H L L Όπου L χαμηλή εκπλήρωση του κανόνα που εκφράζει η παράμετρος, M μέση εκπλήρωση και H υψηλή. 2.3 Βιομετρικό Συστήματα Περιγραφή και δυνατότητες ενός βιομετρικού συστήματος Στην εικόνα 2 παρουσιάζεται ένα απλό διάγραμμα ενός βιομετρικού συστήματος. Σε γενικές γραμμές τα βιομετρικά συστήματα λειτουργούν με παρόμοιο τρόπο παρόλο που διαφέρουν όσον αφορά στα χαρακτηριστικά που συλλέγουν και στον τρόπο που τα συλλέγουν. Οι κύριες λειτουργίες που μπορεί να επιτελέσει το σύστημα είναι η Εγγραφή (enrollement) του χρήστη και η Σύγκριση (test). Κατά την Εγγραφή, τα βιομετρικά δεδομένα ενός χρήστη αποθηκεύονται στην βάση δεδομένων. Κατά την διάρκεια της Α. Σταμούλη Σελίδα 7

22 Σύγκρισης νέα δεδομένα ανιχνεύονται και συγκρίνονται με τα ήδη υπάρχοντα στη βάση δεδομένων. Το πρώτο υποσύστημα, το σύστημα απόκτησης δεδομένων, αποτελεί τη διεπαφή ανάμεσα στον πραγματικό κόσμο και το βιομετρικό σύστημα. Ο χρήστης υποβάλει ένα δείγμα (μία εικόνα, ένα φυσιολογικό χαρακτηριστικό κ.τ.λ) στο σύστημα αυτό. Τις περισσότερες φορές είναι ένα σύστημα απόκτησης εικόνων ή ένας αισθητήρας αλλά η λειτουργία τους (και επομένως και η συσκευή που χρησιμοποιείται) μπορεί επίσης να τροποποιηθεί κάθε φορά ανάλογα με τα χαρακτηριστικά της εκάστοτε εφαρμογής. Τα συστήματα απόκτησης δεδομένων είναι λοιπόν υπεύθυνα για την συλλογή των απαιτούμενων δειγμάτων-δεδομένων του βιομετρικού χαρακτηριστικού μέσω διάφορων τεχνολογικών μέσων. Εικόνα 2: Χαρακτηριστικό διάγραμμα ενός βιομετρικού συστήματος. Στο δεύτερο στάδιο, που είναι το στάδιο της προεπεξεργασίας πραγματοποιούνται οι κατάλληλες ενέργειες για την απομάκρυνση του θορύβου και την ενίσχυση του σήματος εισόδου που λαμβάνεται από τους αισθητήρες καθώς επίσης και η κανονικοποίηση των δεδομένων. Το τρίτο στάδιο, είναι αυτό της εξαγωγής των χαρακτηριστικών. Είναι ένα πολύ σημαντικό βήμα του συστήματος καθώς τα επιθυμητά χαρακτηριστικά πρέπει να εξαχθούν με το καλύτερο δυνατό τρόπο. Πρέπει λοιπόν να αποφασιστεί ποια χαρακτηριστικά θα εξαχθούν και πώς. Έπειτα λαμβάνεται ένα διάνυσμα χαρακτηριστικών (feature vector) το οποίο χρησιμοποιείται για την δημιουργία ενός προτύπου, το οποίο ονομάζεται και κωδικός του χρήστη. Ένα πρότυπο είναι μια σύνθεση από όλα τα χαρακτηριστικά που μπορούν να εξαχθούν από τα αρχικά δεδομένα Α. Σταμούλη Σελίδα 8

23 και είναι αδύνατο να ανακατασκευάσουμε το βιομετρικό δείγμα από το πρότυπο. Το πρότυπο πρέπει να είναι όσο μικρότερο γίνεται για λόγους αύξησης της αποδοτικότητας αλλά δεν πρέπει να απορρίπτονται πολλές λεπτομέρειες από την πληροφορία για λόγους ελάττωσης της διάκρισης μεταξύ των διαφορετικών προτύπων. Την επεξεργασία για τη δημιουργία του κατάλληλου προτύπου την αναλαμβάνει η γεννήτρια προτύπων. Τέλος το σύστημα εκτελεί είτε την διαδικασία της Εγγραφής είτε της Σύγκρισης. Κατά τη διάρκεια της Εγγραφής το πρότυπο αποθηκεύεται σε κάποια βάση δεδομένων ενώ κατά τη διάρκεια της Σύγκρισης το νέο πρότυπο συγκρίνεται με τα ήδη υπάρχοντα στη βάση δεδομένων εξάγοντας μία τιμή ομοιότητας ή μία απόσταση μεταξύ των νέων και αποθηκευμένων δεδομένων χρησιμοποιώντας έναν αλγόριθμο. Η τιμή ή η απόσταση αυτή χρησιμοποιείται από το σύστημα για να επιβεβαιώσει εάν το νέο δείγμα έχει δημιουργηθεί από κάποιον χρήστη που είναι ήδη αποθηκευμένος στο σύστημα ή όχι. Δύο πρότυπα δεν είναι ποτέ ίδια, επομένως το βιομετρικό σύστημα πρέπει να αποφασίσει πιο πρότυπο από τη βάση δεδομένων είναι κοντά στο νέο πρότυπο που εισήχθη, για να αποφασίσει εάν ο χρήστης είναι αυτός που ισχυρίζεται σε περίπτωση επαλήθευσης ή να μας επιστρέψει την ταυτότητά του σε περίπτωση ταυτοποίησης. Η διαδικασία αυτή υλοποιείται με τη χρήση μία τιμής κατωφλιού. Εάν η τιμή ομοιότητας ή η απόσταση υπερβαίνει την τιμή αυτή τότε το σύστημα επαληθεύει ή ταυτοποιεί το χρήστη. [1] Κατηγορίες βιομετρικών συστημάτων και τα χαρακτηριστικά τους Τα βιομετρικά συστήματα χωρίζονται σε δύο κατηγορίες ανάλογα με τον αριθμό τον βιομετρικών χαρακτηριστικών που χρησιμοποιούν για την αναγνώριση των ατόμων. Τα συστήματα τα οποία στηρίζονται στη χρήση ενός μόνο χαρακτηριστικού για την αναγνώριση (π.χ. δακτυλικό αποτύπωμα ή υπόγραφή) καλούνται μονοτροπικά βιομετρικά συστήματα (unimodal biometric systems), ενώ αυτά που χρησιμοποιούν περισσότερα από ένα ονομάζονται πολυτροπικά βιομετρικά συστήματα (multimodal biometric systems). Τα μονοτροπικά βιομετρικά συστήματα έχουν να αντιμετωπίσουν μία πληθώρα προβλημάτων όπως ο θόρυβος στα λαμβανόμενα δεδομένα μέσω αισθητήρων, μη αποδεκτούς ρυθμούς σφάλματος, κίνδυνο εξαπάτησης, μη καθολικότητα κ.α. Τα Α. Σταμούλη Σελίδα 9

24 πολυτροπικά βιομετρικά συστήματα είναι πιο αξιόπιστα και ξεπερνούν αυτού του είδους τα προβλήματα γιατί χρησιμοποιούν μία πληθώρα διαφορετικών πηγών πληροφορίας που τελικά θα χρησιμοποιηθούν στην αναγνώριση του προσώπου. Αυτές οι πηγές μπορεί να είναι i) πολλαπλοί αισθητήρες για συλλογή δεδομένων του ίδιου βιομετρικού χαρακτηριστικού, ii) διαφορετικές εκφάνσεις του ίδιου βιομετρικού χαρακτηριστικού (π.χ. δακτυλικά αποτυπώματα από διαφορετικά δάκτυλα του ίδιου ατόμου), iii) πολλαπλές λήψεις του ίδιου χαρακτηριστικού (π.χ. διαφορετικές φωτογραφίες του ίδιου προσώπου), iv) διαφορετικοί αλγόριθμοι που εξάγουν σκορ ομοιότητας μεταξύ δυο εκφάνσεων του ίδιου βιομετρικού χαρακτηριστικού και v) πολλαπλά βιομετρικά χαρακτηριστικά. [2,3] Λειτουργίες που παρέχει ένα βιομετρικό σύστημα Οι όροι επαλήθευση και ταυτοποίηση χρησιμοποιούνται συνέχεια όταν αναφερόμαστε στα βιομετρικά συστήματα. Η επαλήθευση και η ταυτοποίηση είναι δύο διαφορετικές μέθοδοι που μας βοηθούν να ξεχωρίσουμε την ταυτότητα ενός χρήστη και είναι σημαντικό να καταλάβουμε τη διαφορά μεταξύ τους. Επαλήθευση (Verification): Αποτελεί μια ένα-προς-ένα σύγκριση (one-to-one Match), του βιομετρικού χαρακτηριστικού που εξάγεται από ένα άτομο με το βιομετρικό χαρακτηριστικό του ατόμου που ισχυρίζεται ότι είναι. Η Επαλήθευση λοιπόν είναι η διαδικασία που προσδιορίζει εάν κάποιος είναι στη πραγματικότητα αυτός που ισχυρίζεται ότι είναι. Τα περισσότερα βιομετρικά συστήματα χρησιμοποιούνται για Επαλήθευση. Για παράδειγμα κάποιος ισχυρίζεται ότι είναι ένας από του εγγεγραμμένους χρήστες του συστήματος. Κατά τη διαδικασία της Επαλήθευσης εξάγονται νέα βιομετρικά δεδομένα από το συγκεκριμένο άτομο, δημιουργείται το πρότυπο το οποίο στη συνέχεια συγκρίνεται με το ήδη υπάρχον πρότυπο στη βάση δεδομένων του ατόμου που ισχυρίζεται ότι είναι και έτσι εξακριβώνεται εάν ο χρήστης είναι αυτό που ισχυρίζεται. Στην παρούσα εργασία θα ασχοληθούμε με την επαλήθευση του χρήστη. Ταυτοποίηση (Identification): Αποτελεί μια ένα-προς-πολλά (one-to-many Match) σύγκριση του βιομετρικού χαρακτηριστικού ενός ατόμου με το σύνολο των βιομετρικών χαρακτηριστικών όλων των ατόμων που είναι Α. Σταμούλη Σελίδα 10

25 αποθηκευμένα στη βάση δεδομένων, για να εξακριβώσουμε ότι το προς έλεγχο βιομετρικό χαρακτηριστικό ανήκει σε κάποιον από αυτούς. Η Ταυτοποίηση είναι λοιπόν η διαδικασία αναγνώρισης της ταυτότητας ενός ανθρώπου. Κατά τη διάρκεια της Ταυτοποίησης εξάγονται βιομετρικά δεδομένα από το άτομο και συγκρίνονται με τα αντίστοιχα στη βάση δεδομένων. Η Ταυτοποίηση είναι μια πιο δύσκολη και χρονοβόρα διαδικασία από την Επαλήθευση, αυτό συμβαίνει γιατί για την εξακρίβωση της ταυτότητας του ατόμου απαιτούνται τόσες Συγκρίσεις όσα είναι και τα αποθηκευμένα πρότυπα στην βάση δεδομένων που σε ένα πραγματικό σύστημα ο αριθμός των προτύπων είναι πάρα πολύ μεγάλος και απαιτείται πολύς χρόνος. Επίσης, η ταυτοποίηση μπορεί να μας επιστρέψει περισσότερα από ένα αποτελέσματα, ο αριθμός των οποίων εξαρτάται από τον αριθμό και την τιμή ομοιότητας των αποθηκευμένων προτύπων.[4] Τεχνικές βάση των οποίων πραγματοποιείται η αναγνώριση των χρηστών Ο ανθρώπινος παράγοντας θεωρείται το πιο αδύναμο σημείο σε ένα υπολογιστικό σύστημα ελέγχου. Ο ανθρώπινος παράγοντας είναι αυτός ο οποίος μας δίνει τα στοιχεία που μας είναι απαραίτητα τόσο για την ανάπτυξη συστημάτων ελέγχου όσο και τα στοιχεία που χρησιμοποιούνται για την Επαλήθευση η την Ταυτοποίηση του χρήστη. Η Επαλήθευση ή η Ταυτοποίηση επιτυγχάνονται με κάποια από τις παρακάτω τεχνικές ή με συνδυασμό τους: Τεχνικές με βάση κάτι που γνωρίζει ο χρήστης- Knowledge Based τεχνικές (π.χ. passwords) Τεχνικές με βάση κάτι που κατέχει ο χρήστης- Object Based τεχνικές (π.χ. credit card, university ID card) Τεχνικές που βασίζονται σε χαρακτηριστικά ή συμπεριφορές του χρήστη- Biometrics Based τεχνικές (πρόσωπο, φωνή, υπογραφή, δακτυλικά αποτυπώματα, DNA, ίριδα ματιού κ.τ.λ) Ο πρώτη τεχνική είναι η πιο ευρέως διαδεδομένη τεχνική ελέγχου και αναγνώρισης χρήστη. Η τεχνική αυτή βασίζεται για την αναγνώριση του χρήστη μέσω της χρήσης ενός κωδικού που ο ίδιος γνωρίζει. Το πρόβλημα που παρουσιάζονται με αυτή την τεχνική Α. Σταμούλη Σελίδα 11

26 είναι ότι η χρήση κωδικών ως μέθοδος ελέγχου δεν είναι ασφαλής. Οι χρήστες χρησιμοποιούν εύκολους κωδικούς για να τους θυμούνται με συνέπεια οι κωδικοί αυτοί να μπορούν με μεγάλη ευκολία να προβλεφθούν από τρίτους. Ακόμα και σε περιπτώσεις που χρησιμοποιούν μεγαλύτερους κωδικούς αναγκάζονται να τους γράψουν κάπου με φόβο τότε να χαθεί ή να κλαπεί. Επιπλέον, οι χρήστες πολλές φορές χρησιμοποιούν σχεδόν πάντα τον ίδιο κωδικό για ευκολία. Στην δεύτερη τεχνική όλη η ασφάλεια του συστήματος είναι βασισμένη σε ένα αντικείμενο που ο χρήστης κατέχει (πιστωτική κάρτα, έγγραφο κ.α.). Τα μειονεκτήματα της τεχνική αυτής είναι και πάλι πολλά. Οι κάρτες που χρησιμοποιούνται μπορούν να αντιγραφούν και επομένως ο χρήστης γίνεται ευάλωτος. Επίσης, υπάρχει και η περίπτωση απώλειας ή κλοπής αυτού του αντικειμένου και ως συνέπεια τη χρήση του από ξένα ως προς τους χρήστες άτομα. Εικόνα 3: Ταξινόμηση του χρήστη με βάση τις τεχνικές επαλήθευσης Οι αδυναμίες των παραπάνω τεχνικών μπορεί να μειωθούν σε σημαντικό βαθμό με τη χρήση των βιομετρικών συστημάτων ως μεθόδου αναγνώρισης. Το σημαντικότερο πλεονέκτημα της τεχνικής αυτής είναι ότι δεν βασίζεται στο χρήστη για την αναγνώριση αλλά στα χαρακτηριστικά του. Η χρήση των χαρακτηριστικών του χρήστη ως βιομετρικά δεδομένα προσφέρει ασφάλεια γιατί είναι σχεδόν ακατόρθωτο να αντιγράψει κάποιος Α. Σταμούλη Σελίδα 12

27 τα χαρακτηριστικά ενός ατόμου, τα οποία είναι μοναδικά, και επιπλέον απαιτείται η παρουσία του ατόμου για να πραγματοποιηθεί η αναγνώριση. Τέλος, να τονίσουμε ότι όλες οι παραπάνω τεχνικές μπορούν να χρησιμοποιηθούν σε συνδυασμό μεταξύ τους.[5,6] 2.4 Μέθοδοι αξιολόγησης και Δείκτες απόδοσης Η αξιολόγηση ενός βιομετρικού συστήματος πραγματοποιείται λαμβάνοντας υπόψη τα ακόλουθα τρία στοιχεία: Απόδοση: Στόχος είναι ο υπολογισμός ποικίλων στατιστικών κριτηρίων που αφορούν την απόδοση του συστήματος όπως EER-Equal Error Rate, FTA- Failure To Acquire, FRR-False Rejection Rate, κ.τ.λ. FAR-False Acceptance Rate Ικανοποίηση του χρήστη και αποδοχή: Δίνει πληροφορίες, όπως η γνώμη και η αποδοχή των χρηστών, που αφορούν το υπό εξέταση σύστημα. Ασφάλεια: Μετράει πόσο καλά ένα βιομετρικό σύστημα αντιστέκεται σε διάφορους τύπους λογικών και φυσικών επιθέσεων όπως εξαπάτηση, μίμηση κ.τ.λ.[7] Στη παρούσα εργασία μας ενδιαφέρει κυρίως η απόδοση του συστήματος, γιατί εμείς παρουσιάζουμε αλγόριθμους αναγνώρισης και όχι ένα ολοκληρωμένο σύστημα. Οι πιο συχνά χρησιμοποιούμενοι δείκτες της απόδοσης των βιομετρικών μεθόδων και αυτοί τους οποίους χρησιμοποιούμε είναι: Το ποσοστό των λανθασμένων απορρίψεων, FRR (False Rejection Rate), δηλαδή το ποσοστό των εξουσιοδοτημένων χρηστών τους οποίους το σύστημα λανθασμένα απέρριψε. Για παράδειγμα εάν FRR=0.1% σημαίνει πως κατά μέσο όρο 2 στους 2000 εγγεγραμμένοι πελάτες του συστήματος δεν θα αναγνωριστούν από αυτό. Αριθμός εσφαλμένων απορρίψεων FRR = Συνολικό αριθμό προσπαθειών πελατών να εισέλθουν στο σύστημα Το ποσοστό των λανθασμένων αποδοχών, FAR (False Acceptance Rate), δηλαδή το ποσοστό των μη εξουσιοδοτημένων χρηστών στους οποίους το σύστημα λανθασμένα επέτρεψε την πρόσβαση. Για παράδειγμα αν FAR=1% (1) Α. Σταμούλη Σελίδα 13

28 σημαίνει ότι κατά μέσο όρο 10 στους 1000 εισβολείς καταφέρνει να αναγνωριστεί ως χρήστης και να εισέλθει στο σύστημα. Αριθμός εσφαλμένων αποδοχών FAR = Συνολικό αριθμό προσπαθειών εισβολέων να εισέλθουν στο σύστημα Kαμπύλη λειτουργικού χαρακτηριστικού δείκτη (Receiver Operating Characteristic-ROC). Μπορούμε να μετρήσουμε την απόδοση ενός συστήματος για διάφορες τιμές κατωφλιών χρησιμοποιώντας την καμπύλη του FAR συναρτήσει του FRR που καλείται καμπύλη λειτουργικού χαρακτηριστικού δείκτη. Στην καμπύλη αυτή ο δείκτης FAR απεικονίζεται στον οριζόντιο άξονα και ο δείκτης FRR στον κατακόρυφο ή και το αντίθετο. Για κάθε τιμή κατωφλίου, βρίσκουμε μία τιμή στο επίπεδο και συνδέοντας τα σημεία αυτά παίρνουμε την καμπύλη Το ποσοστό ίσου σφάλματος, EER (Equal Error Rate). Ο δείκτης EER είναι το σημείο στο οποίο FAR=FRR, άρα είναι το σημείο όπου η ROC τέμνει την ευθεία x=y. Μέσος όρος των ρυθμών σφαλμάτων FAR και FRR, HTER (Half Total Error Rate). Οι δύο πρώτοι δείκτες είναι αμοιβαίως αποκλειόμενοι, δηλαδή όταν αυξάνει ο ένας μειώνεται ο άλλος. Εξαρτάται λοιπόν από το σκοπό χρήσης της εφαρμογής πως θα χρησιμοποιήσουμε τους δύο αυτούς δείκτες. Αν δηλαδή θέλουμε να δοθεί μεγαλύτερη έμφαση στην αποτροπή των εισβολέων ή στην φιλικότητα του συστήματος προς τους νόμιμους χρήστες του. Γενικά, υψηλότερος δείκτης FAR προτιμάται σε συστήματα στα οποία η ασφάλεια δεν παίζει πρωτεύοντα ρόλο ενώ υψηλότερο FRR επιλέγεται σε εφαρμογές που η ασφάλεια είναι σημαντική. [1] Στις εικόνες 4 και 5 βλέπουμε δύο χαρακτηριστικά παραδείγματα καμπυλών που σχετίζονται με τους παραπάνω δείκτες απόδοσης. Η πρώτη καμπύλη είναι η ROC και απεικονίζει τις τιμές του FRR συναρτήσει των τιμών FAR. Η ιδανική ROC καμπύλη έχει τιμές οι οποίες κείνται είτε στον άξονα x είτε στον άξονα y. Στην εικόνα 5 φαίνεται ο τρόπος εύρεσης της τιμή του EER γραφικά. Στον οριζόντιο άξονα είναι η τιμή του κατωφλίου σύμφωνα με το οποίο γίνεται η διαδικασία της Σύγκρισης ενώ στον κατακόρυφο οι τιμές των FRR και FAR. (2) Α. Σταμούλη Σελίδα 14

29 Εικόνα 4: ROC καμπύλη. Εικόνα 5: Διάγραμμα FAR συναρτήσει του FRR για διάφορες τιμές κατωφλίου αποδοχής. 2.5 Μέθοδοι που χρησιμοποιούνται Τα κυριότερα είδη βιομετρικών μεθόδων που χρησιμοποιούνται σήμερα είναι τα παρακάτω και μπορούν να κατηγοριοποιηθούν σε δύο σύνολα. Το πρώτο σύνολο περιλαμβάνει τα χαρακτηριστικά εκείνα που εξάγονται από την ανθρώπινη φυσιολογία Α. Σταμούλη Σελίδα 15

30 και το δεύτερο από την ανθρώπινη συμπεριφορά. Παρακάτω αναλύουμε περιληπτικά ορισμένες βιομετρικές μεθόδους. Χαρακτηριστικά φυσιολογίας: Σάρωση της ίριδας του ματιού Σάρωση του αμφιβληστροειδή Αναγνώριση προσώπου Δακτυλικά αποτυπώματα Γεωμετρία χεριού Γεωμετρία αιμοφόρων αγγείων χεριού Χαρακτηριστικά συμπεριφοράς: Αναγνώριση φωνής Εξακρίβωση υπογραφής Αναγνώριση τρόπου πληκτρολόγησης Σάρωση της ίριδας του ματιού Η συγκεκριμένη μέθοδος αναγνώρισης χρησιμοποιεί την μορφή και τη δομή της ίριδας του ματιού, που είναι η χρωματιστή περιοχή η οποία περιβάλλει την κόρη του ματιού. Η μορφή της ίριδας είναι όχι μόνο τυχαία και διαφορετική σε κάθε άνθρωπο αλλά διαφέρει και από το δεξί με το αριστερό μάτι. Η μορφή της ίριδας είναι διαφορετική ακόμα και στα μονοζυγωτικά δίδυμα αδέρφια. Η ίριδα έχει πολύπλοκη μορφή και περιλαμβάνει πάρα πολλά στοιχεία διαχωρισμού. Τα δείγματα της ίριδας λαμβάνονται μέσω ενός συστήματος video απόκτησης εικόνας. Τα νεότερα συστήματα σάρωσης της ίριδας του ματιού έχουν γίνει αρκετά οικονομικά και φιλικά προ το χρήστη. [9,10] Σάρωση του αμφιβληστροειδή Η μέθοδος αυτή βασίζεται στη μορφολογία των αγγείων του αίματος του αμφιβληστροειδούς χιτώνα. Εξαιτίας λοιπόν της σύνθετης δομής των αιμοφόρων αυτών αγγείων που τροφοδοτούν με αίμα τον αμφιβληστροειδή, ο τελευταίος χαρακτηρίζεται από μοναδικότητα για το κάθε άτομο ξεχωριστά. Όπως και στην περίπτωση της ίριδας του ματιού ο αμφιβληστροειδής είναι μοναδικός για κάθε άνθρωπο ακόμα και για τα Α. Σταμούλη Σελίδα 16

31 μονοζυγωτικά δίδυμα αδέρφια. Η βασική ιδέα για την υλοποίηση της μεθόδου αυτής συνοψίζεται στο ότι τα αιμοφόρα αγγεία του αμφιβληστροειδή απορροφούν φώς πιο εύκολα σε σχέση με τους περιβάλλοντες ιστούς, οπότε και καθορίζονται πιο εύκολα με το κατάλληλο φως. Η συσκευή λοιπόν που χρησιμοποιείται για τη σάρωση του αμφιβληστροειδή περιλαμβάνει μία φωτεινή πηγή που ρίχνει στο μάτι μία δέσμη φωτός (υπέρυθρη ακτινοβολία). Ένα σημαντικό μειονέκτημα της μεθόδου αυτής είναι ότι η μορφολογία του αμφιβληστοειδή χιτώνα μπορεί να μεταβληθεί λόγω ορισμένων κλινικών καταστάσεων όπως εγκυμοσύνη, διαβήτης, ασθένεια AIDS κ.τ.λ. [8,9] Αναγνώριση προσώπου Η μέθοδος αυτή βασίζεται στη γεωμετρία ορισμένων χαρακτηριστικών του προσώπου για την αναγνώριση του ατόμου. Η υλοποίηση της μεθόδου αυτής μπορεί να γίνει με διάφορους τρόπους όπως η απεικόνιση του προσώπου με τη χρήση μιας οπτικής κάμερας. Χρησιμοποιώντας μία μεγάλη ποικιλία από κάμερες και φωτογραφικές μηχανές, τα συστήματα ορατού φωτός εξάγουν χαρακτηριστικά από την φωτογραφία του ατόμου τα οποία δεν αλλάζουν κατά τη διάρκεια του χρόνου όπως η θέση της μύτης και των ματιών, τις περιοχές γύρω από τα ζυγωματικά κόκκαλα, τις δύο όψεις του στόματος ενώ αποφεύγουν χαρακτηριστικά όπως τα μαλλιά και οι εκφράσεις του προσώπου. Η καταγραφή του της εικόνας του προσώπου μπορεί να γίνει από κάποια απόσταση ενώ η αναγνώριση του προσώπου μπορεί να γίνει και χωρίς τη συγκατάθεση του ατόμου που καταγράφεται. [10] Δακτυλικά αποτυπώματα Η μέθοδος αυτή βασίζεται στην αναγνώριση ενός ατόμου μέσω της σύγκρισης των δακτυλικών αποτυπωμάτων. Ένα δακτυλικό αποτύπωμα προκύπτει από τις ραβδώσεις, τις πτυχώσεις και τις αυλακώσεις που έχουν τα ακροδάχτυλα. Το δακτυλικό αποτύπωμα κάθε ανθρώπου είναι μοναδικό χαρακτηριστικό και δύσκολα μεταβάλλεται. Το στοιχείο αυτό κάνει το δακτυλικό αποτύπωμα αξιοποιήσιμο σε μια πληθώρα εφαρμογών. Επίσης, οι πληροφορίες που προκύπτουν από κάθε δαχτυλικό αποτύπωμα απαιτούν λίγο χώρο αποθήκευσης. Η καταγραφή του σχεδίου του δακτυλικού αποτυπώματος γίνεται από ειδικό αισθητήριο και δε θεωρείται ιδιαίτερα κουραστική ή ενοχλητική διαδικασία για τον χρήστη. [12] Α. Σταμούλη Σελίδα 17

32 2.5.5 Γεωμετρία χεριού Η συγκεκριμένη βιομετρική μέθοδος μετρά το μήκος και το πλάτος ενός χεριού και των δακτύλων, εξετάζει δηλαδή τη γεωμετρία του χεριού. Το σύστημα απόκτησης των συγκεκριμένων βιομετρικών χαρακτηριστικών απαιτεί συνεργασία μεταξύ των χρηστών και του συστήματος αφού τους ζητείται να τοποθετήσουν την παλάμη ή το χέρι τους σε συγκεκριμένη θέση ώστε να εξάγει το σύστημα τα χαρακτηριστικά που χρειάζεται. Η τεχνολογία αυτή είναι αποδεκτή από τους περισσότερους χρήστες, οικονομική και εύκολη υπολογιστικά Γεωμετρία αιμοφόρων αγγείων στο χέρι ή στο πρόσωπο Η μέθοδος βασίζεται στη μελέτη της εικόνας των αιμοφόρων αγγείων στο πρόσωπο ή στο χέρι (συνήθως εξετάζεται η διάταξη των φλεβών-αιμοφόρων αγγείων στο χέρι). Θεωρείται πως η πυκνότητα και η θέση των φλεβών είναι μοναδική για το κάθε άτομο. Ακόμα και τα μονοζυγωτικά δίδυμα αδέρφια δεν έχουν πανομοιότυπη διάταξη αιμοφόρων αγγείων ενώ η διάταξη αυτή διαφέρει και στις δύο πλευρές του ίδιου ατόμου. Ένα επιπλέον πλεονέκτημα της μεθόδου είναι ότι μεταβάλλεται ελάχιστα με τα χρόνια. Για να χρησιμοποιήσεις ένα σύστημα αναγνώρισης των αιμοφόρων αγγείων απλά τοποθετείς το δάχτυλο σου, τον καρπό, την παλάμη ή την πίσω πλευρά του χεριού σου πάνω ή κοντά σε ένα scanner. Η συσκευή λαμβάνει μία ψηφιακή εικόνα χρησιμοποιώντας υπέρυθρη ακτινοβολία, έτσι ώστε να απεικονίσει τη διάταξη των φλεβών, κάτω από την επιφάνεια του δέρματος. Με τον τρόπο αυτό, αφού δημιουργηθεί μια απεικόνιση της περιοχής ενδιαφέροντος, η πληροφορία που λαμβάνεται κωδικοποιείται και αποθηκεύεται σε μια βάση δεδομένων από την οποία και ανακαλείται κάθε φορά που πρόκειται να γίνει κάποια σύγκριση προς ταυτοποίηση. [10,11] Αναγνώριση φωνής Η αναγνώριση φωνής ή ομιλίας είναι η ικανότητα μία μηχανής ή ενός προγράμματος να λάβει και να επεξεργαστεί την ομιλία που του υπαγορεύει ένα άτομο, ή να κατανοήσει και να εκτελέσει φωνητικές εντολές. Συνήθως στην περίπτωση της αναγνώρισης ζητείται από το άτομο να εκφωνήσει κάποιες λέξεις που του ζητούνται και Α. Σταμούλη Σελίδα 18

33 τις οποίες έχει εκφωνήσει και κατά τη διάρκεια της εγγραφής. Αυστηρά μιλώντας, η φωνή είναι ένα χαρακτηριστικό φυσιολογίας επειδή για κάθε άτομο το pitch της φωνής είναι διαφορετικό, αλλά η αναγνώριση φωνής βασίζεται στον τρόπο ομιλίας, τη διάθεση και τη φυσική κατάσταση του χρήστη (π.χ. κρυωμένος, κουρασμένος, κλπ) και επομένως κατατάσσεται στα χαρακτηριστικά συμπεριφοράς. Επίσης εξαρτάται από περιβαλλοντικούς παράγοντες όπως ο θόρυβος. Τέλος, ένα ακόμα μειονέκτημα της μεθόδου είναι ότι η αντιγραφή της φωνής του χρήστη είναι ιδιαίτερα εύκολη. Για την υλοποίηση του συστήματος το μόνο που απαιτείται είναι ένα μικρόφωνο, γεγονός που κάνει τη μέθοδο ιδιαίτερα φθηνή και εύκολη στη χρήση Εξακρίβωση υπογραφής Κάθε άτομο έχει έναν ιδιαίτερο τρόπο που υπογράφει. Ο τρόπος, ταχύτητα με την οποία το κάνει, η διεύθυνση, η πίεση που ασκείται στο ηλεκτρονικό μηχάνημα, η συνολική χρονική διάρκεια της υπογραφής είναι όλα χαρακτηριστικά τα οποία εξετάζονται από το συγκεκριμένο βιομετρικό σύστημα και στο σύνολό τους είναι μοναδικά, αφού είναι ακατόρθωτο κάποιος να μιμηθεί όλα αυτά τα στοιχεία. Είναι ιδιαίτερα σημαντικό το γεγονός ότι η διαδικασία παραγωγής μιας υπογραφής χαρακτηρίζεται ως εκπαιδευμένο αντανακλαστικό παρά ως αντικείμενο ενσυνείδητου ελέγχου των μυών. Για τον λόγο αυτό, η απομίμηση της διαδικασίας υπογραφής είναι ιδιαίτερα δύσκολη, ειδικά με κανονική ταχύτητα γραφής. Παρόλα αυτά, η υπογραφή υπόκειται σε ψυχολογικούς και περιβαλλοντικούς παράγοντες, όπως κούραση, άγχος κλπ και είναι δυνατό να υπάρξουν διαφορές στην υπογραφή ενός ατόμου. Ο τρόπος με τον οποίο γίνεται η αναγνώριση είναι ο εξής: κατά τη διάρκεια της υπογραφής καταγράφονται από το βιομετρικό σύστημα κάποια ηλεκτρικά σήματα. Κάθε φορά που υπογράφει κάποιος γίνεται η σύγκριση με τα αποθηκευμένα στοιχεία και αν αυτά συμπίπτουν τότε γίνεται η ταυτοποίηση του ατόμου. [8,12] Αναγνώριση τρόπου πληκτρολόγησης Η μέθοδος αναγνώρισης του τρόπου πληκτρολόγησης αναλύει τον τρόπο με τον οποίο ένας χρήστης γράφει στο πληκτρολόγιο του. Καθώς ο χρήστης πληκτρολογεί εξάγει συγκεκριμένα χαρακτηριστικά τα οποία επεξεργάζεται ώστε να μπορέσει να εξάγει το πρότυπο του χρήστη. Ο τρόπος λοιπόν με τον οποίο ο κάθε χρήστης πληκτρολογεί Α. Σταμούλη Σελίδα 19

34 αποτελεί στην ουσία και τον κωδικό του για την είσοδο του στην εκάστοτε εφαρμογή. Τα χαρακτηριστικά τα οποία η συγκεκριμένη μέθοδος μπορεί να επεξεργαστεί είναι αρκετά και λαμβάνονται από το βιομετρικό σύστημα μέσω του πληκτρολογίου. Ενδεικτικά αναφέρουμε κάποια από αυτά όπως, ο χρόνος που κρατάει πατημένο το κάθε πλήκτρο ο χρήστης, η χρονική καθυστέρηση μεταξύ δύο διαδοχικών πιέσεων πλήκτρων, ο χρόνος που απαιτείται για την πληκτρολόγηση συγκεκριμένων λέξεων και η πίεση που ασκείται σε κάθε πλήκτρο. Η μέθοδος έχει αρκετά πλεονεκτήματα που την καθιστούν ανταγωνιστική σε σχέση με τις υπόλοιπες βιομετρικές μεθόδους που βασίζονται επίσης σε χαρακτηριστικά που σχετίζονται με την ανθρώπινη συμπεριφορά και ψυχολογία. Το πιο σημαντικό είναι ότι δεν απαιτείται η χρήση επιπρόσθετων πολύπλοκων μηχανισμών για την εξαγωγή των χαρακτηριστικών των χρηστών, αρκεί μόνο το πληκτρολόγιο του υπολογιστή ή το οποιοδήποτε πληκτρολόγιο που χρησιμοποιεί ο χρήστης. Επομένως, το κόστος είναι μηδενικό και δεν εμπεριέχει την παραμικρή ενόχληση για τον χρήστη. Ένα ακόμα σημαντικό πλεονέκτημα, είναι ότι δεν γίνεται αντιληπτή από τους πιθανούς εισβολείς, αφού δεν γνωρίζουν ότι καταγράφεται ο τρόπος που πληκτρολογούν και αυτός είναι ο λόγος που δεν τους επιτρέπεται η πρόσβαση στο σύστημα. Στη περίπτωση μάλιστα που κάποιος αντιληφθεί το συγκεκριμένο μέτρο ασφάλειας, η πρόσβαση του στο σύστημα εξακολουθεί να είναι απίθανη αφού δεν θα μπορεί να μιμηθεί τον τρόπο που ο χρήστης πληκτρολογεί. Τέλος, χρησιμοποιούμενη σε συστήματα με συνθηματικά (passwords), τα απαλλάσσει από τον υπαρκτό και ευρέως χρησιμοποιούμενο κίνδυνο να γίνει μία επίθεση μέσω ενός λεξικού συνθηματικών, καθώς εκτός από το να βρεθεί το σωστό συνθηματικό απαιτείται να πληκτρολογηθεί η λέξη με τρόπο αντίστοιχο με αυτόν του νόμιμου χρήστη. Εκτός όμως από τα σημαντικά πλεονεκτήματα που προσφέρονται, η μέθοδος αντιμετωπίζει και ορισμένες δυσκολίες στην υλοποίηση της. Η πιο σημαντική από αυτές είναι το ότι στηρίζεται σε χαρακτηριστικά που σχετίζονται με τη συμπεριφορά του χρήστη. Αυτό σημαίνει πως σε ακραίες περιπτώσεις ή και απλά σε αγχώδεις καταστάσεις για το χρήστη, ο τρόπος με τον οποίο πληκτρολογεί μπορεί να διαφοροποιηθεί και να μη γίνεται αποδεκτός από το σύστημα. Επιπλέον, η μέθοδος αυτή, όπως και όλες οι μέθοδοι που βασίζονται σε στοιχεία συμπεριφοράς, επειδή είναι σχετικά είναι νέα δεν έχουν βρεθεί ακόμα οι αλγόριθμοι που θα αυξάνουν τη χρονική σταθερότητα και την Α. Σταμούλη Σελίδα 20

35 ιδιαιτερότητα ανάμεσα στον πληθυσμό. Η συγκεκριμένη μέθοδος είναι το αντικείμενο της παρούσας εργασίας και θα ασχοληθούμε αναλυτικά στο επόμενο κεφάλαιο. Α. Σταμούλη Σελίδα 21

36 3.1 Εισαγωγή Από όλες τις βιομετρικές μεθόδους για τις οποίες έχουν πραγματοποιηθεί πειράματα, η χρήση του τρόπου πληκτρολόγησης στα συστήματα επαλήθευσης είναι και η πιο ενδιαφέρουσα. Όπως είναι φανερό και από το όνομα της, η μέθοδος της αναγνώρισης τρόπου πληκτρολόγησης αναλύει και επεξεργάζεται τον τρόπο με τον οποίο κάποιος γράφει στο πληκτρολόγιου του. Για την ακρίβεια η μέθοδος αυτή προσπαθεί να αναγνωρίσει τον ρυθμό που ο εκάστοτε χρήστης πληκτρολογεί. Το βασικό πλεονέκτημα της μεθόδου εκτός του ότι αποτελεί ένα οικονομικό σύστημα επαλήθευσης, αφού δεν απαιτούνται περίπλοκα συστήματα για τη λειτουργία του ή αισθητήρες, είναι ότι είναι αποδεκτό από τους χρήστες αφού δεν απαιτείται η συλλογή στοιχείων που σχετίζονται με σημεία του ανθρώπινου σώματος και ότι η συλλογή των δεδομένων μπορεί να γίνει χωρίς να το γνωρίζουν άτομα που ίσως παρακολουθούν το χρήστη. Πολλές έρευνες έχουν πραγματοποιηθεί τα τελευταία χρόνια χρησιμοποιώντας διάφορους αλγόριθμους με στόχο να αυξήσουν την εκτίμηση του συστήματος. Το μειονέκτημα των μεθόδων αυτών είναι ότι βασίζονται στο μεγάλο αριθμό δεδομένων που απαιτούνται στο στάδιο της εγγραφής. Αυτό έχει ως αποτέλεσμα το σύστημα επαλήθευσης να είναι στην ουσία μη αξιοποιήσιμο αφού ο αριθμός δεδομένων στα πραγματικά συστήματα είναι περιορισμένος. Στη παρούσα εργασία προτείνουμε μία μέθοδο που δεν απαιτεί πολλά δείγματα κατά τη διάρκεια της εγγραφής για τη δημιουργία του προτύπου. Σε αυτή τη μέθοδο οι χρήστες επαληθεύονται μέσω δυναμικών χρονοσειρών με τη χρήση ενός ρυθμού που σκέφτονται και ο οποίος δεν είναι υποχρεωτικά ίδιος με τον ρυθμό των υπόλοιπων χρηστών. Σε αρκετές εργασίες η επαλήθευση των χρηστών γίνεται μεν μέσω των δυναμικών χρονοσειρών αλλά οι χρήστες χρησιμοποιούν τον ίδιο ρυθμό ή πληκτρολογούν ένα κείμενο το οποίο είναι ίδιο για όλους τους χρήστες, και στις δύο περιπτώσεις είτε το κείμενο είτε ο ρυθμός έχει επιλεγεί από τον μηχανικό του συστήματος. Το μειονέκτημα στις περιπτώσεις αυτές είναι ότι τα δεδομένα σε ορισμένες περιπτώσεις και κυρίως όταν αυξάνεται ο αριθμός των χρηστών δεν είναι απόλυτα διαχωρίσιμα, τα χαρακτηριστικά Α. Σταμούλη Σελίδα 22

37 συλλέγονται σε μικρούς χρόνους και όσο αυξάνεται το σύνολο των εγγραφών αυξάνεται και η δυσκολία εύρεσης του κατάλληλου κατωφλίου που θα μας οδηγήσει στην επαλήθευση. Όπως είναι φυσικό η προτεινόμενη υλοποίηση προσφέρει ένα σημαντικό πλεονέκτημα συγκριτικά με την πληθώρα άλλων μελετών αφού ο χρήστης επιλέγει το δικό του ρυθμό, με αποτέλεσμα να είναι πιο εύκολη η επιλογή του επιθυμητού κατωφλίου. Στις επόμενες παραγράφους του παρόντος κεφαλαίου θα αναλύσουμε το θεωρητικό υπόβαθρο της αναγνώρισης μέσω του τρόπου πληκτρολόγησης και θα περιγράψουμε τα πλεονεκτήματα της μεθόδου αυτής, γιατί προτιμάται στους Υπολογιστές σε σύγκριση με άλλες υπάρχουσες βιομετρικές μεθόδου καθώς επίσης και της τεχνικές ανάλυσης των δεδομένων και τα πιο συχνά χρησιμοποιούμε εξαγόμενα χαρακτηριστικά. 3.2 Τεχνικές Αναγνώρισης Η αναγνώριση μέσω του τρόπου πληκτρολόγησης μπορεί να ταξινομηθεί στις εξής κατηγορίες: Στατική Ανάλυση (Static Analysis): Η στατική ανάλυση περιλαμβάνει την ανάλυση της συμπεριφοράς πληκτρολόγησης ενός ατόμου βάση προκαθορισμένων φράσεων, κωδικών ή κειμένων και σε συγκεκριμένα σημεία του συστήματος (συνήθως η αναγνώριση σε αυτή την περίπτωση γίνεται μόνο κατά τη διάρκεια εισόδου στο σύστημα). Τα χαρακτηριστικά που εξάγονται κατά την είσοδο στο σύστημα, επεξεργάζονται και ελέγχονται με τα χαρακτηριστικά που εξήχθησαν κατά τη διάρκεια εγγραφής στο σύστημα. Περιοδική ή Συνεχής Δυναμική Ανάλυση (Periodic or Continuous Dynamic Analysis): Η περιοδική ή συνεχής δυναμική ανάλυση περιλαμβάνει τον περιοδικό ή συνεχή έλεγχο της συμπεριφοράς πληκτρολόγησης ενός ατόμου. Ο χρήστης πρώτα ελέγχεται κατά τη διάρκεια εισόδου του στο σύστημα αλλά και κατά τη διάρκεια παραμονής του σε αυτό. Η μέθοδος αυτή εξάγει μια πληθώρα χαρακτηριστικών και αναπτύσσει ένα μοτίβο αναγνώρισης ανεξάρτητα από την λέξη που πληκτρολογείται κάθε φορά. Για παράδειγμα, όταν ένα άτομο περιηγείται στον ιστό, επισκέπτεται κάποιες ιστοσελίδες Α. Σταμούλη Σελίδα 23

38 συχνότερα από κάποιες άλλες. Μία λίστα των προτιμούμενων από το χρήστη ιστοσελίδων καθώς και ο τρόπος πληκτρολόγησης του χρήστη καθώς πληκτρολογεί τον κωδικό του μπορεί να αποθηκευθούν. Στην περίπτωση αυτή, κατά τη διάρκεια της εγγραφής του χρήστη στο σύστημα είναι απαραίτητο ο χρήστης να πληκτρολογήσει τη φράση, τον κωδικό ή το κείμενο που σκέφτεται περισσότερες από μία φορές ώστε να εξαρθεί το πρότυπο. Επιπλέον, στη μέθοδο αυτή δεν απαιτείται η απομνημόνευση ενός συγκεκριμένου συνθηματικού ή κωδικού. [13] 3.3 Χαρακτηριστικά συστημάτων αναγνώρισης μέσω του τρόπου πληκτρολόγησης. Προτού ξεκινήσουμε να αναλύουμε το πείραμά μας είναι σημαντικό να περιγράψουμε με λεπτομέρεια τα χαρακτηριστικά τα οποία μπορούν να εξαχθούν κατά τη διάρκεια της πληκτρολόγησης. Τα εξαγόμενα χαρακτηριστικά αποτελούν ένα σημαντικό κομμάτι στη θεωρία της συγκεκριμένης μεθόδου αφού η χρήση και η επιλογή του κατάλληλου χαρακτηριστικού είναι αυτή που θα οδηγήσει το σύστημα στη δημιουργία του προτύπου βάση του οποίου θα γίνει η επαλήθευση του χρήστη. Τα χαρακτηριστικά αυτά αποτελούν στην ουσία την ταυτότητα του χρήστη και στη συγκεκριμένη μάλιστα μέθοδο αποτελούν τον κωδικό εισόδου του χρήστη στο σύστημα. Ο συνδυασμός περισσοτέρων από ένα χαρακτηριστικά οδηγούν στο καλύτερο διαχωρισμό των χρηστών, αφού είναι σχεδόν ανέφικτο να συμπίπτουν περισσότερα από δύο χαρακτηριστικά για δύο διαφορετικούς χρήστες. Τα χαρακτηριστικά που θα αναλύσουμε παρακάτω προέρχονται είτε από ακατέργαστα βιομετρικά δεδομένα ή από χαρακτηριστικά πρώτης τάξης. Οι δύο πρώτες κατηγορίες που αναλύουμε στη συνέχεια είναι τα χαρακτηριστικά πρώτης τάξης και προέκυψαν από ακατέργαστα βιομετρικά δεδομένα ενώ η τρίτη κατηγορία χαρακτηριστικών προέκυψε από τα χαρακτηριστικά πρώτης τάξης. Παρακάτω περιγράφουμε κάποια από τα πιο κοινά εξαγόμενα χαρακτηριστικά που χρησιμοποιούνται πιο συχνά: Α. Σταμούλη Σελίδα 24

39 3.3.1 Χαρακτηριστικά τα οποία υπολογίζονται αφαιρώντας χρονικές τιμές Διάρκεια (Duration ) ή Hold/Dwell Time: Η διάρκεια είναι ο συνολικός χρόνος για τον οποίο ασκείται πίεση σε ένα πλήκτρο. duration= time { event= RELEASE}-time{event=PRESS} (3) Καθυστέρηση (latency): Η καθυστέρηση είναι η διάρκεια μεταξύ δύο διαφορετικών πληκτρολογήσεων. Υπάρχουν τρία είδη διαφορετικών καθυστερήσεων που χρησιμοποιούνται. Η πρώτη καθυστέρηση ονομάζεται Press-to-Press latency (PP) ή Digraph και είναι ο χρονική διαφορά μεταξύ της πίεσης δύο διαφορετικών πλήκτρων. Η δεύτερη καθυστέρηση ονομάζεται Release-to-Release latency (RR) και είναι η ο χρόνος που πέρασε μεταξύ της απελευθέρωσης δύο διαφορετικών πλήκτρων. Η τρίτη καθυστέρηση ονομάζεται Release-to-Press latency (RP) ή Flight Time και είναι η διάρκεια μεταξύ της απελευθέρωσης ενός πλήκτρου και της του πίεσης επόμενου. Στον πίνακα 2 βλέπουμε τις εξισώσεις βάση των οποίων προκύπτει η χρονική διάρκεια για κάθε μία από τις παραπάνω καθυστερήσεις που περιγράψαμε, όπου i είναι το πλήκτρο που πιέζουμε η απελευθερώνουμε την ίδια χρονική στιγμή ενώ i+1 είναι το πλήκτρο που πιέζουμε η απελευθερώνουμε την επόμενη χρονική στιγμή. Επίσης, άλλη μία καθυστέρηση η οποία χρησιμοποιείται συχνά είναι η διάρκεια μεταξύ της πίεσης ή της απελευθέρωσης τριών διαφορετικών πλήκτρων, η διάρκεια αυτή ονομάζεται Trigraph. Στην εικόνα 6 βλέπουμε τη διαφορά μεταξύ διάρκειας και καθυστέρησης και στην εικόνα 7 βλέπουμε γραφικά όλες τις καθυστερήσεις. Πίνακας 2: Εξισώσεις Καθυστέρησης Press-to-Press PP i= time i+1 { event i+1= PRESS}-time i {event i=press} (4) Release-to- RR i= time i+1 { event i+1= RELEASE }-time i {event i= RELEASE } (5) Release Release-to-Press RP i= time i+1 { event i+1= PRESS}-time i {event i= RELEASE } (6) Α. Σταμούλη Σελίδα 25

40 Εικόνα 6: Διάρκεια μεταξύ διαδοχικών πληκτρολογήσεων και Διάρκεια πίεσης Χαρακτηριστικά που περιέχουν γενικές πληροφορίες Συνολική Διάρκεια (Total Duration): Αφορά τον συνολικό χρόνο που απαιτείται για να πληκτρολογήσουμε ένα κείμενο. Το χαρακτηριστικό αυτό μπορεί να χρησιμοποιηθεί σαν επιπλέον πληροφορία για το διάνυσμα χαρακτηριστικών ή σαν παράγοντας κανονικοποίησης. Μέσος Χρόνος (Middle Time): Είναι η διάρκεια από τη στιγμή που ο χρήστης ξεκίνησε να εισάγει τα δεδομένα μέχρι τη στιγμή που πληκτρολογεί το μεσαίο χαρακτήρα του κωδικού, του κειμένου κ.ο.κ για την είσοδο του στο σύστημα. Συχνότητα Σφάλματος (Mistake Error): Μετράει πόσες φορές ο χρήστης πάτησε το backspace πλήκτρο. Χρησιμοποιείται στα συστήματα περιοδικής ή συνεχής επαλήθευσης. Πίεση (Pressure): Υπάρχουν συγκεκριμένα πληκτρολόγια στην αγορά τα οποία διαθέτουν αισθητήρες πίεσης και καταγράφουν την πίεση που ασκείται σε κάθε πλήκτρο.[14] Χαρακτηριστικά που προέκυψαν από τα χαρακτηριστικά πρώτης τάξης Ελάχιστη/Μέγιστη τιμή (Minimum/Maximum): Υπολογίσουμε την ελάχιστη ή μέγιστη τιμή δεδομένων όπως η διάρκεια και η καθυστέρηση. Α. Σταμούλη Σελίδα 26

41 Ταχύτητα πληκτρολόγησης (Speed of Typing): Είναι ο μέσος χρόνος πληκτρολόγησης κάθε χαρακτήρα ή ο αριθμός των λέξεων ανά δευτερόλεπτο. Μέση τιμή ή τυπική απόκλιση κάθε τύπου δεδομένων όπως η διάρκεια και η καθυστέρηση. Εικόνα 7: Εξαγόμενα χαρακτηριστικά που βασίζονται στο χρόνο. Τα τελικά βιομετρικά δεδομένα είναι πάντα ένα διάνυσμα που αποτελείται από ποικίλα χαρακτηριστικά. Το πιο από τα παραπάνω χαρακτηριστικά ή συνδυασμό αυτών θα χρησιμοποιήσει ο ερευνητής ή διαχειριστής του συστήματος εξαρτάται από το είδος της εφαρμογής και τις απαιτήσεις της. [14] 3.4 Περιβάλλον υλοποίησης του πειράματος Το περιβάλλον αποτελεί ένα σημαντικό στοιχείο στον προσδιορισμό της συμπεριφοράς του τρόπου πληκτρολόγησης. Ο ρυθμός που ένας χρήστης πληκτρολογεί επηρεάζεται από το πληκτρολόγιο που έχει στη διάθεσή του και από το χώρο στον οποίο βρίσκεται. Για παράδειγμα με διαφορετικό ρυθμό πληκτρολογεί ο χρήστης στο πληκτρολόγιο του υπολογιστή του και διαφορετικά στο πληκτρολόγιο του κινητού του. Επίσης, τα περισσότερα πειράματα έχουν διεξαχθεί σε ελεγχόμενα περιβάλλοντα, με συγκεκριμένο φωτισμό για όλους τους χρήστες χωρίς καθόλου εξωτερικές ενοχλήσεις. Μάλιστα στις περισσότερες περιπτώσεις οι χρήστες χρησιμοποίησαν το πληκτρολόγια πριν την έναρξη του πειράματος για να το συνηθίσουν. Όπως είναι φυσικό τα δεδομένα Α. Σταμούλη Σελίδα 27

42 που έχουν συλλεχθεί σε τέτοιους χώρους δεν είναι αντιπροσωπευτικά των πραγματικών δεδομένων. Ένα μη ελεγχόμενο περιβάλλον μπορεί να οριστεί ως το περιβάλλον που οι ερευνητές έχουν ελέγξει εν μέρει ή και καθόλου τον τρόπο που τα υποκείμενα εισάγουν πληροφορίες στο σύστημα. Σε αυτές τις περιπτώσεις οι ερευνητές ζητούν από τα υποκείμενα να κατεβάσουν το πρόγραμμα στο προσωπικό τους υπολογιστή ή να συμπληρώσουν διαδικτυακά μία φόρμα συλλέγοντας τα δεδομένα που απαιτούνται για τον έλεγχο του συστήματος. Τα μη ελεγχόμενα περιβάλλοντα αποτελούν μία πιο ρεαλιστική προσέγγιση της πραγματικότητας όπου τελικά θα γίνει και ο έλεγχος των βιομετρικών αυτών συστημάτων για να διαπιστωθεί εάν είναι αξιοποιήσιμα. Παρόλα αυτά αντιλαμβανόμαστε ότι η μελέτη σε ένα τέτοιο περιβάλλον είναι χρονοβόρα και περίπλοκη αφού απαιτείται να ληφθούν υπόψη πληθώρα παραμέτρων. Για παράδειγμα, ο τρόπος που ο χρήστης πληκτρολογεί αλλάζει εάν είναι καθισμένος στο γραφείο ή στο κρεβάτι του. Επιπλέον, διαφορετικές μάρκες πληκτρολογίων έχουν διαφορές στο μέγεθος, στην ευαισθησία των πλήκτρων και στις αποστάσεις μεταξύ αυτών με συνέπεια όταν ο χρήστης χρησιμοποιεί ένα πληκτρολόγιο που δεν έχει συνηθίσει να ελαττώνεται ο ρυθμός πληκτρολόγησης. [15] 3.5 Πλεονεκτήματα-Μειονεκτήματα Η μέθοδος αναγνώρισης τύπου πληκτρολόγησης έχει ορισμένα σημαντικά πλεονεκτήματα και μειονεκτήματα. Στην παρούσα παράγραφο θα τα αναλύσουμε. Πλεονεκτήματα: Η μέθοδος αναγνώρισης τύπου πληκτρολόγησης δεν απαιτεί επιπρόσθετο hardware υλικό. Η μέθοδος βασίζεται στην ανάπτυξη του κατάλληλου λογισμικού, επιτρέποντας στο σύστημα να λειτουργήσει γρήγορα. Είναι επομένως από τις πιο οικονομικές μεθόδους επαλήθευσης αφού δεν απαιτούνται πολύπλοκα συστήματα όπως κάμερες, σκάνερ υψηλής ποιότητας ή αισθητήρες ακριβείας τα οποία κοστίζουν. Αρκεί μόνο το πληκτρολόγιο του υπολογιστή το οποίο κάθε χρήστης με Ηλεκτρονικό Υπολογιστή προφανώς διαθέτει. Επιτρέπει εάν κριθεί απαραίτητο από το σύστημα ή εάν η εφαρμογή το απαιτεί, το συνεχή έλεγχο της ταυτότητας του ατόμου που πληκτρολογεί. Α. Σταμούλη Σελίδα 28

43 Ένα ακόμα σημαντικό στοιχείο της μεθόδου, είναι ότι μπορεί να χρησιμοποιηθεί σε συνδυασμό με άλλες υπάρχουσες μεθόδους. Η ενσωμάτωση της συγκεκριμένης βιομετρικής μεθόδου από άλλες τεχνολογίες είναι εύκολη και δεν αυξάνει το κόστος. Μπορεί επίσης να χρησιμοποιηθεί σε κάθε εφαρμογή εντός του σπιτιού που χρησιμοποιεί λογισμικό. Όλοι είμαστε εξοικειωμένοι με το να πληκτρολογούμε. Επομένως απαιτείται ελάχιστη εκπαίδευση ώστε να μπορέσει ο χρήστης να συνηθίσει τη παρούσα μέθοδο. Η μέθοδος της αναγνώρισης τρόπου πληκτρολόγησης δε ζητάει από τον χρήστη να κάνει τίποτα παραπάνω από αυτό που θα έκανε, να γράψει στον υπολογιστή του. Ακόμα και η διαδικασία της εγγραφής, αφού ο χρήστης ορίσει τα προσωπικά του στοιχεία για να δημιουργηθεί ο λογαριασμός του, μπορεί να γίνει καθώς ο χρήστης πληκτρολογεί κάτι για τη δουλειά του. Η μέθοδος αυτή εξαλείφει τον κίνδυνο επιθέσεως με λεξικό συνθηματικών. Η επίθεση αυτή είναι μία τεχνική που διαψεύδει το σύστημα προσπαθώντας να βρει τη λέξη ή τη φράση κλειδί που χρησιμοποιείται ως κωδικός και να εισέλθει στο λογαριασμό του χρήστη, εφαρμόζοντας ένα μεγάλο αριθμό από λέξεις κλειδιά. Η μέθοδος αυτή παραβίασης της ασφάλειας είναι αδύνατο να λειτουργήσει στη συγκεκριμένη μέθοδο, γιατί πρέπει να βρουν όχι μόνο το σωστό συνθηματικό αλλά να μιμηθούν και τον ξεχωριστό τρόπο πληκτρολόγησης του κάθε χρήστη. Είναι ευρέως αποδεκτή από τους χρήστες γιατί δεν απαιτεί να σταθούν μπροστά από κάμερες ή συστήματα αποτύπωσης του προσώπου τους ή της ίριδας των ματιών τους όπως σε άλλες μεθόδους ταυτοποίησης, οι οποίες τους προξενούν αμηχανία και εκνευρισμό. Μειονεκτήματα Η μέθοδος αναγνώρισης τύπου πληκτρολόγησης είναι μία μη στατική βιομετρική μέθοδος. Αυτό σημαίνει ότι ο τρόπος με τον οποίο ο εκάστοτε χρήστης πληκτρολογεί μπορεί να αλλάζει συνεχώς και να απαιτείται συνεχώς ανανέωση της βάσης με τη λήψη εκ νέου καινούργιων δειγμάτων. Για παράδειγμα όσο περισσότερο κάποιος πληκτρολογεί τόσο πιο πολύ εξοικειώνεται με αποτέλεσμα, ο ρυθμός πληκτρολόγησης να είναι πιο γρήγορος ή εάν κάποιος είναι κουρασμένος ο ρυθμός να μειώνεται. Α. Σταμούλη Σελίδα 29

44 Είναι δύσκολο να δημιουργήσεις ένα ενιαίο λογισμικό γιατί συνήθως ο τρόπος πληκτρολόγησης συνήθως διαφέρει από γλώσσα σε γλώσσα. Η μέθοδος αυτή δεν έχει αναπτυχθεί σε μεγάλο βαθμό και δεν γνωρίζουμε εάν τα στοιχεία που προκύπτουν είναι ικανά να μας προσφέρουν τις απαραίτητες πληροφορίες για να ξεχωρίσουμε του χρήστες. [16,17] 3.6 Συμπερασματικά για τη μέθοδο Η μέθοδος αναγνώρισης του ρυθμού μέσω πληκτρολόγησης μπορεί να χρησιμοποιηθεί τόσο για την επαλήθευση όσο και για την ταυτοποίηση των χρηστών. Η πληθώρα όμως των ερευνών όπως και η παρούσα εργασία επικεντρώνονται στην επαλήθευση. Αυτό είναι απόλυτα λογικό γιατί σκοπός της μεθόδου αυτής είναι στην ουσία η αύξηση της ασφάλειας των εγγεγραμμένων χρηστών σε ένα σύστημα και η αποφυγή εισόδου στο σύστημα προσποιητών. Η μέθοδος αυτή μπορεί να χρησιμοποιηθεί σε συνδυασμό με pins και κωδικούς μειώνοντας τον κίνδυνο υποκλοπών στις τραπεζικές συναλλαγές και τον κίνδυνο εισόδου κακόβουλων ατόμων ή εταιριών σε προσωπικές ηλεκτρονικές ιστοσελίδες. Αυτό που πρέπει όμως να τονίσουμε είναι ότι για να τεθεί σε εφαρμογή το συγκεκριμένο σύστημα βιομετρικής αναγνώρισης πρέπει αρχικά να καταγραφούν τα βιομετρικά χαρακτηριστικά του χρήστη ώστε να δημιουργηθεί, όπως έχουμε ήδη περιγράψει, μία βάση δεδομένων. Για να δημιουργήσουμε τη βάση δεδομένων απαιτείται ο χρήστης κατά τη διάρκεια εγγραφής του στο σύστημα να πληκτρολογήσει εκτός από τον κωδικό του έναν αριθμό λέξεων, ένα κείμενο ή στην περίπτωση της δικής μας εργασίας να πληκτρολογήσει ένα συγκεκριμένο αριθμό χτυπημάτων με ένα ρυθμό. Η επιλογή των λέξεων, του κειμένου ή του ρυθμού μπορεί να οριστεί από τον διαχειριστή του συστήματος ή να είναι και αυθαίρετη. Στην παρούσα εργασία η επιλογή του ρυθμού είναι αυθαίρετη, δεν είναι όμως αυθαίρετος ο αριθμός των χτυπημάτων. Επίσης το χαρακτηριστικό που χρησιμοποιούμε είναι η καθυστέρηση Press-to-Press και το σύστημα μας μπορεί να χρησιμοποιηθεί στην περιοδική ή συνεχή δυναμική επαλήθευση. Τέλος να αναφέρουμε ότι παρόλο που η μέθοδος αυτή βασίζεται στη συμπεριφορά ενός ατόμου εξαρτάται και από κάποια χαρακτηριστικά φυσιολογία όπως το μήκος των δακτύλων και των χεριών. Άλλοι παράγοντες που επίσης επηρεάζουν τον τρόπο πληκτρολόγησης όπως αναλύσαμε και στην ενότητα 3.4 είναι το περιβάλλον που Α. Σταμούλη Σελίδα 30

45 βρίσκεται ο χρήστης, το πληκτρολόγιο που χρησιμοποιεί, το πόσο οικείος είναι με τα ηλεκτρονικά μέσα, η συναισθηματική κατάσταση στην οποία βρίσκεται και η κούραση. Αντιλαμβανόμαστε λοιπόν ότι σε ένα μη ελεγχόμενο περιβάλλον πρέπει να ληφθούν υπόψη αρκετές παράμετροι ώστε να μειωθεί η πιθανότητα απόρριψης του χρήστη. Α. Σταμούλη Σελίδα 31

46 4.1 Εισαγωγή Αφού αναλύσαμε θεωρητικά τι είναι βιομετρικό σύστημα και τι μέθοδος αναγνώρισης μέσω του τρόπου πληκτρολόγησης, στο παρόν κεφάλαιο θα περιγράψουμε τα δύο πρώτα στάδια του βιομετρικού συστήματος μας, δηλαδή τον τρόπο εισόδου των βιομετρικών δεδομένων στο σύστημα μας και την εξαγωγή των διανυσμάτων χαρακτηριστικών. Όπως αναλύσαμε στο δεύτερο κεφάλαιο το βιομετρικό σύστημα επιτελεί δύο βασικές λειτουργίες την εγγραφή των χρηστών στο σύστημα, στην οποία γίνεται και η εκπαίδευση του βιομετρικού συστήματος και την σύγκριση μέσω της οποίας επαληθεύεται εάν ένα άτομο είναι χρήστης του συστήματος όπως ισχυρίζεται. Στις δύο αυτές λειτουργίες τα δύο πρώτα στάδια επιτελούνται με τον ίδιο ακριβώς τρόπο. Το σύστημα απόκτησης δεδομένων που χρησιμοποιούμε είναι απλά το πληκτρολόγιο του υπολογιστή. Ο χρήστης αρκεί μόνο να χρησιμοποιήσει το πληκτρολόγιο του σύμφωνα με τις οδηγίες που θα του δοθούν για να γίνει η συλλογή των βιομετρικών στοιχείων. Στη συνέχεια αφού συλλέξουμε τα βιομετρικά δεδομένα για κάθε χρήστη το επόμενο είναι να εξάγουμε ένα διάνυσμα χαρακτηριστικών. Τα διανύσματα αυτά θα περιγράφουν με ακρίβεια τα χαρακτηριστικά των βιομετρικών δεδομένων και παράλληλα θα είναι κατάλληλα για περαιτέρω επεξεργασία ώστε να μπορέσουμε στη συνέχεια να εξάγουμε τα πρότυπα που είναι το επόμενο βήμα. Για την εξαγωγή των χαρακτηριστικών χρησιμοποιούμε τη μέθοδος ενσωμάτωσης χρονικής καθυστέρησης (method of delays, MOD) [21] την οποία και θα περιγράψουμε στην ενότητα 4.3. Να τονίσουμε στο σημείο αυτό ότι ο αλγόριθμος method of delays που χρησιμοποιούμε δεν εφαρμόζονται στα απευθείας εισαγόμενα δεδομένα αλλά στα Random Time Intervals σήματα που θα εξηγήσουμε στην ενότητα 4.2 πως προκύπτουν. Επομένως στο κεφάλαιο αυτό θα περιγράψουμε με τη σειρά που χρησιμοποιούνται και στο βιομετρικό μας σύστημα τα εξής: 1. Εισαγωγή βιομετρικών δεδομένων στο σύστημα μέσω του πληκτρολογίου 2. Μετατροπή των βιομετρικών δεδομένων σε RTI σήματα Α. Σταμούλη Σελίδα 32

47 3. Χρήση της μεθόδου ενσωμάτωσης χρονικής καθυστέρησης (Methods of Delays, MOD). Η μέθοδος αυτή από μία μονοδιάστατη ακολουθία δεδομένων, στη παρούσα εργασία τα RTI σήματα, παράγει ένα σύνολο πολυδιάστατων διανυσμάτων που λειτουργούν ως χαρακτηριστικό της ακολουθίας. 4.2 Εισαγωγή βιομετρικών δεδομένων Όπως αναφέραμε και στην ενότητα 3.3 η ανάλυση της μεθόδου αναγνώρισης τρόπου πληκτρολόγησης γίνεται βάση ορισμένων χαρακτηριστικών τα οποία είτε τα χρησιμοποιούμε σε συνδυασμό είτε μεμονωμένα. Στην παρούσα εργασία το χαρακτηριστικό το οποίο χρησιμοποιούμε για να διεξάγουμε το πείραμά μας για τη δημιουργία του συστήματος επαλήθευσης είναι η καθυστέρηση, συγκεκριμένα η PP latency (Press-to-Press latency). Από τα δεδομένα αυτά δημιουργούμε τα RTI σήματασήματα τυχαίων χρονοσειρών (Random Interval Signals). Να τονίσουμε στο σημείο αυτό ότι τα δεδομένα αυτά τα είχαμε εκ των προτέρων. Η διαδικασία για την παραγωγή των RTI σημάτων είναι πολύ απλή. Αρχικά, το υποκείμενο πραγματοποιεί ένα μικρότερο πείραμα για να κατανοήσει τη διαδικασία και να συνηθίσει το πληκτρολόγιο. Στο αρχικό αυτό πείραμα ζητείται από το υποκείμενο να πιέσει το πλήκτρο space του πληκτρολογίου, με το δείκτη του κυρίαρχου χεριού του, με όσο το δυνατόν ακανόνιστο ρυθμό έως ότου η οθόνη να δείξει το τέλος της άσκησης. Την πρώτη φορά που το υποκείμενο υποβάλλεται στη συγκεκριμένη άσκηση του δίνεται ένα συγκεκριμένο παράδειγμα, το οποίο αποτελείται από ένα τετράγωνο 4 4, που εμφανίζεται και εξαφανίζεται από την οθόνη με τυχαίο ρυθμό και συγχρονίζεται με την ακολουθία των beeps. Το συγκεκριμένο παράδειγμα είναι ενδεικτικό του είδους των χρονοσειρών που πρέπει να δημιουργηθούν και η ακριβής αναπαραγωγή τους δεν είναι ενδεικτική για την εργασία. Το βασικό πείραμα εκτελέστηκε με παρόμοιο τρόπο χωρίς όμως να υποδεικνύεται στο χρήστη πότε θα πατήσει το πλήκτρο space.το πείραμα θα ολοκληρωθεί όταν συλλεχθεί το σύνολο των καθυστερήσεων που έχει ορίσει ο διαχειριστής του συστήματος. Εάν με x(t) ορίζεται μία χρονοσειρά μήκους Τ των συγκεκριμένων χρονικώνκαθυστερήσεων (time-latencies) των χτυπημάτων του υποκειμένου χ[n]=[t 1,t 2,.,t T ], τα Α. Σταμούλη Σελίδα 33

48 αντίστοιχα RTI είναι η διαφορά αυτών των καθυστερήσεων και η μορφή τους φαίνεται στην παρακάτω εξίσωση. x[n]=[t2 t1,t3 t2,.,tt tt 1] (7) Κατά τη διάρκεια της διαδικασίας εισόδου του χρήστη στο σύστημα, μία σειρά χτυπημάτων x[n] παρέχεται από τον χρήστη και το αντίστοιχο RTI σήμα δημιουργείται αυτόματα και συγκρίνεται με παρόμοια σήματα που έχουν αποθηκευθεί στη βάση δεδομένων. Η σύγκριση αυτή δείχνει πόσο εφικτό είναι μέσω των εσωτερικών διαφορών να παρατηρήσουμε την διαδικασία παραγωγής τυχαίων ρυθμών. Επιπλέον, για κάποιο συγκεκριμένο υποκείμενο ο τρόπος παραγωγής σημάτων αναμένεται να παραμείνει ο ίδιος και η σταθερότητα αυτή θα πρέπει να είναι προφανής και στα χρονικά χαρακτηριστικά των RTI σημάτων τα οποία λαμβάνονται μέσω επαναληπτικών διαδικασιών. 4.3 Ανακατασκευή του χώρου των φάσεων Αφού με την προηγούμενη πειραματική διαδικασία λάβαμε τα βιομετρικά δεδομένα που χρειαζόμαστε με τη μορφή χρονοσειρών, το επόμενο βήμα είναι η εξαγωγή των χαρακτηριστικών από τις χρονοσειρές αυτές. Στόχος είναι η σύγκριση των θεμελιωδών δυναμικών μέσω ουσιαστικά της σύγκρισης των αντίστοιχων χρονοσειρών (TS). Χρησιμοποιώντας λοιπόν το θεώρημα του Taken, κάθε RTI σήμα αναπαρίσταται από διαδοχικά διανύσματα καθυστέρησης x i (n)=(x[n-(p-1) τ,.,x[n-τ],x[n]) και έπειτα αυτά ταξινομούνται σε ένα πίνακα X=[ x i (n-1)x i (n)x i (n+1),.]. Ο πίνακας X περιλαμβάνει τη δυναμική τροχιά που σχετίζεται με το μηχανισμό παραγωγής των RTI σημάτων. Στη δική μας προσέγγιση, προσπαθούμε να ανακατασκευάζουμε από κάθε χρονοσειρά τις δυναμικές σαν μία τροχιά σε έναν πολυδιάστατο χώρο καταστάσεων και έπειτα να συγκρίνουμε τις τροχιές αυτές με τη χρήση μη-παραμετρικών στατιστικών τεχνικών. [22] Μέθοδος ενσωμάτωσης χρονικής καθυστέρησης Η μέθοδος ενσωμάτωσης χρονικής καθυστέρησης οδηγεί μια μονοδιάστατη ακολουθία δεδομένων σε ένα p-διάστατο χώρο και παρέχει ένα σύνολο διανυσμάτων (ή ένα πολυδιάστατο διάνυσμα όταν τοποθετήσουμε τα διανύσματα αυτά σε έναν πίνακα) που λειτουργούν ως χαρακτηριστικό της ακολουθίας. Στη μέθοδο ενσωμάτωσης χρονικής καθυστέρησης (method of delays, MOD) μια βαθμωτή χρονοσειρά x n =x(nτ s ) για Α. Σταμούλη Σελίδα 34

49 n = 1,...,N και τ s ο χρόνος δειγματοληψίας (στην περίπτωση της παρούσας εργασίας η χρονοσειρά δίνεται από τη σχέση 7), δίνει τα πολυδιάστατα διανύσματα σύμφωνα με την σχέση : X = [x t (p 1)τ, x t (p 2)τ,, x t τ, x t ] (8) Επίσης από τα διανύσματα αυτά προκύπτει ένα σύνολο σημείων στις p διαστάσεις σύμφωνα με τα οποία μπορεί να γίνει η αναπαράσταση του χώρου των φάσεων. Τα σημεία αυτά δίνονται και απευθείας χρησιμοποιώντας την παρακάτω εξίσωση: x(ν) = x ν x ν+1τ χ ν+(p 1)τ, όπου ν = [1: P], P = N (p 1)τ (9) Η χρονική καθυστέρηση τ και η διάσταση ενσωμάτωσης p, αποτελούν τις δύο κρίσιμες παραμέτρους της παραπάνω αναπαράστασης. Οι παράμετροι της ανακατασκευής αναλυτικά είναι: Η διάσταση ενσωμάτωσης (embedding dimension) p: αποτελεί τη διάσταση του νέου διανύσματος και ορίζει τον αριθμό των παρατηρήσεων που γίνονται συνιστώσες του ανακατασκευασμένου διανύσματος και Η χρονική καθυστέρηση (delay) τ: καθορίζει τη χρονική απόσταση ανάμεσα στις συνιστώσες των διανυσμάτων στον ανακατασκευασμένο χώρο. [23] Η εφαρμογή των ανωτέρων εξισώσεων σε μια 1-D ακολουθία x(n) καταλήγει σε ένα σύνολο διανυσμάτων στο p-διάστατο χώρο. Ο μετασχηματισμός της x(n) ακολουθίας σε μια σειρά πολυδιάστατων σημείων έχει το πλεονέκτημα ότι το σήμα αναπαρίσταται από ένα σύνολο πολυδιάστατων σημείων και κάθε σημείο μεταφέρει πληροφορία σχετικά με ένα τμήμα της γραμμής. Ως εκ τούτου η πληροφορία λαμβάνεται κατά τρόπο αποτελεσματικό που επιτρέπει την τμήμα-προς-τμήμα αντιστοίχιση αντί της σύγκρισης σημείο-προς-σημείο, που συνήθως προσεγγίζεται. Ας εξηγήσουμε λοιπόν με ένα απλό παράδειγμα πως λειτουργεί η συγκεκριμένη μέθοδος. Ας υποθέσουμε ότι παρατηρούμε τη χρονοσειρά x(t)=(4,2,7,4,9,6,10,3) T. Θεωρούμε την καθυστέρηση τ=2 και την embedding διάσταση p=3. Με τα παραπάνω δεδομένα δημιουργούμε τα ακόλουθα διανύσματα σύμφωνα με τη σχέση 8 που περιγράψαμε προηγουμένως: Α. Σταμούλη Σελίδα 35

50 x t = , x t 2 =, x t 4 = (10) Η αναπαράσταση λοιπόν της προηγούμενης χρονοσειράς στο χώρο των φάσεων προκύπτει από τα σημεία των τεσσάρων πρώτων γραμμών των προκύπτοντων διανυσμάτων. Δηλαδή το πρώτο σημείο αποτελείται από τα πρώτα στοιχεία κάθε διανύσματος (4,7,9). Ομοίως, το δεύτερο είναι (2,4,6), το τρίτο (7,9,10) και το τέταρτο σημείο είναι (4,6,3). [24] Παράγονται λοιπόν τέσσερα διανύσματα συντεταγμένων (ν 1 έως ν 4 ) που αντιπροσωπεύουν τα 4 σημεία της ακολουθίας. Τα εναπομείναντα σημεία των διανυσμάτων δεν χρησιμοποιούνται στη διαδικασία. Τα διανυσματικά σημεία μπορούσαν να προκύψουν απευθείας και από τη σχέση 9. Η ανακατασκευασμένη τροχιά του παραδείγματος είναι: Εικόνα 8: Παράδειγμα ανακατασκευασμένου χώρου φάσεων Θα πρέπει να τονίσουμε στο σημείο αυτό ότι εμείς χρησιμοποιούμε τη μέθοδο ενσωμάτωσης χρονικής καθυστέρησης με μια μικρή αλλαγή. Ο αριθμός των προκυπτόντων σημείων είναι ίδιος με τον αριθμό των στοιχείων της υπό μελέτη χρονοσειράς. Ο υπολογισμός των διανυσμάτων αυτών γίνεται με περιοδικό τρόπο και τα προβλήματα που σχετίζονται με την έναρξη και το τέλος διαδικασίας έχουν απορριφθεί. Για το προηγούμενο λοιπόν παράδειγμα τα διανύσματα ενσωμάτωσης είναι τα εξής: Α. Σταμούλη Σελίδα 36

51 x t = , x t 2 =, x 10 t 4 = (11) Εδώ τα σημεία της τροχιάς, τα οποία προκύπτουν με την ίδια διαδικασία που περιγράψαμε στο προηγούμενο παράδειγμα, είναι πλέον οχτώ και είναι τα εξής: (4,7,9), (2,4,6), (7,9,10), (4,6,3), (9,10,4), (6,3,2), (10,4,7), (3,2,4). Επίσης, από τα διανύσματα της εξίσωσης 11 προκύπτει ο πίνακας Χ (εξίσωση 12), στον οποίο ταξινομούνται τα διανύσματα. Τον πίνακα αυτό, που αποτελεί ένα πολυδιάστατο διάνυσμα p διαστάσεων θα επεξεργαστούμε στη συνέχεια. Χ = (12) Για την επιλογή των κατάλληλων παραμέτρων έχουν προταθεί διάφορες μέθοδοι, όπου κυριαρχούν η εκτίμηση μέσω των συναρτήσεων της αυτοσυσχέτισης και της αμοιβαίας πληροφορίας[23] για την χρονική καθυστέρηση και η μέθοδος των ψευδών κοντινότερων γειτόνων (False nearest neighbors, FNN) [23] για την διάσταση ενσωμάτωσης. Στην παρούσα εργασία δεν τις χρησιμοποιούμε για την επιλογή των παραμέτρων, αν και τις αναλύουμε θεωρητικά στο παράρτημα I. Η μέθοδος την οποία χρησιμοποιούμε για να βρούμε τις κατάλληλες παραμέτρους παρουσιάζεται στην επόμενη παράγραφο και στηρίζεται στη Fisher-analysis.[25] Ιδανικές παράμετροι ενσωμάτωσης Στην παρούσα εργασία θα χρησιμοποιήσουμε μία διαφορετική μέθοδο για την εύρεση των ιδανικών παραμέτρων ενσωμάτωσης. Η μέθοδος αυτή βασίζεται στην ανάλυση διαχωρισμού του Fisher (Fisher Discriminant Analysis-FDA). Α. Σταμούλη Σελίδα 37

52 Στην παρούσα μέθοδο χρησιμοποιούμε το μέτρο διαχωρισμού των ομάδων, το οποίο συμβολίζεται με J, και ορίζεται ως ο λόγος μεταξύ του between-group scatter (αθροιστικό μέτρο των αποστάσεων μεταξύ των χρονοσειρών που ανήκουν σε διαφορετικές ομάδες) και του within-group scatter (αθροιστικό μέτρο των αποστάσεων μεταξύ των χρονοσειρών που ανήκουν στην ίδια ομάδα). Συγκεκριμένα ας υποθέσουμε ότι έχουμε τρία υποκείμενα με τρεις παρατηρήσεις το καθένα. Για να υπολογίσουμε την ποσότητα J θεωρούμε ότι κάθε ένα υποκείμενο σχηματίζει μία ομάδα που περιλαμβάνει τις παρατηρήσεις του, ενώ μία δεύτερη ομάδα σχηματίζεται με τις παρατηρήσεις των υπόλοιπων υποκειμένων. Έχουμε λοιπόν δύο διαχωρίσιμες ομάδες. Για τις ομάδες που σχηματίστηκαν υπολογίζουμε τις ποσότητες within-scatter (WS) και inner-scatter (IS). Η πρώτη ποσότητα είναι το άθροισμα των αποστάσεων των k κοντινότερων γειτόνων μεταξύ των παρατηρήσεων της ίδιας ομάδας και για τις δύο ομάδες. Η δεύτερη ποσότητα είναι το άθροισμα των αποστάσεων των k κοντινότερων γειτόνων μεταξύ των δύο διαφορετικών ομάδων. Η διαδικασία αυτή πραγματοποιείται διαδοχικά και για όλα τα υποκείμενα, στο παράδειγμα μας τρεις φορές αφού έχουμε τρία υποκείμενα όπως φαίνεται και στην εικόνα 9. Στο συγκεκριμένο παράδειγμα θέσαμε τον αριθμό τον κοντινότερων γειτόνων k=2. Υπολογίζοντας τον λόγο IS/WS για όλα τα υποκείμενα, προκύπτει η ποσότητα J, η οποία μας δείχνει πόσο διαχωρίσιμες είναι οι ομάδες μεταξύ τους και δίνεται από την ακόλουθη σχέση: 3 J = J(D, k) = 1 3 J(S i, k) = 1 IS 3 WS i i=1 Η παραπάνω σχέση γενικεύεται και για περισσότερα υποκείμενα και φυσικά για περισσότερες παρατηρήσεις. Σχηματίζονται πάντα δύο ομάδες, ανεξάρτητα από τον αριθμό των υποκειμένων. Όσο μεγαλύτερη είναι η ποσότητα J τόσο πιο διαχωρίσιμες είναι οι ομάδες. Γενικά, εάν η τιμή του J είναι μεγαλύτερη της μονάδας οι ομάδες είναι επαρκώς διαχωρίσιμες. Στη συγκεκριμένη εργασία χρησιμοποιήσαμε το μέτρο J σαν ένα μέτρο εκτίμησης των παραμέτρων ενσωμάτωσης. Δηλαδή, χρησιμοποιήσαμε διάφορες τιμές των p,τ για τη δημιουργία των πινάκων απόστασης D τ,p ( εξηγούμε στην ενότητα 4.4 πως προέκυψε), με τη βοήθεια των οποίων και με τη χρήση της MDS μεθόδου παραστήσαμε κάθε χρονοσειρά με ένα σημείο σε έναν πολυδιάστατο χώρο και υπολογίσαμε τις ποσότητες J για όλες τις παραμέτρους. Οι παράμετροι p,τ οι οποίες μας έδωσαν και την μεγαλύτερη Α. Σταμούλη Σελίδα 38 3 i=1 (13)

53 τιμή είναι οι ιδανικές για το πείραμα μας. Στο κεφάλαιο 8 θα παρουσιάσουμε και ένα διάγραμμα με τη βοήθεια του matlab στο οποίο θα φαίνονται όλοι οι συνδυασμοί των τιμών των παραμέτρων ενσωμάτωσης τους οποίους δοκιμάσαμε πειραματικά. Θα απεικονίζονται επίσης και η τιμές στις οποίες θα έχουμε τις μεγαλύτερες τιμές που θα είναι οι τιμές που χρησιμοποιήσαμε τελικά στο πείραμα μας. Αντιλαμβανόμαστε λοιπόν ότι η συγκεκριμένη μέθοδος που χρησιμοποιήσαμε είναι αρκετά χρονοβόρα αφού για να βγάλουμε συμπεράσματα για τα ιδανικά ζεύγη τιμών των παραμέτρων δοκιμάζουμε πολλές τιμές πραγματοποιώντας στην ουσία σχεδόν όλη την πειραματική διαδικασία από την αρχή για κάθε διαφορετικό ζεύγος τιμών.[22] Εικόνα 9: Παράδειγμα υπολογισμού του μέτρου J Α. Σταμούλη Σελίδα 39

54 5.1 Εισαγωγή Το επόμενο στάδιο στη λειτουργία του βιομετρικού συστήματος είναι η εξαγωγή των προτύπων. Σκοπός της εξαγωγής των προτύπων είναι η δημιουργία ενός διανύσματος από το σύνολο των δεδομένων που θα χαρακτηρίζει το χρήστη και θα λειτουργεί ως «κώδικας» αυτού. Στην ουσία λοιπόν ένα πρότυπο είναι μια σύνθεση από όλα τα χαρακτηριστικά που μπορούν να εξαχθούν από τα αρχικά δεδομένα, δηλαδή στην περίπτωση μας από το σύνολο των πολυδιάστατων διανυσμάτων (που προέκυψαν με τη μέθοδο ενσωμάτωσης χρονικής καθυστέρησης, κεφάλαιο 4) που αντιστοιχούν σε ένα χρήστη. Το πρότυπο του κάθε χρήστη προκύπτει από την κατάλληλη επεξεργασία των πολυδιάστατων διανυσμάτων των χαρακτηριστικών μέσω μία σειράς αλγόριθμων. Το πρώτο στάδιο για την εξαγωγή των προτύπων μας είναι μία διαδικασία ομοιότητας, η οποία ποσοτικοποιεί την ομοιότητα ή ανομοιότητα μεταξύ των δύο πολυδιάστατων διανυσμάτων που προέκυψαν από την προηγούμενη διαδικασία που περιγράφθηκε στο κεφάλαιο 4. Δεδομένου λοιπόν ότι η εξαγωγή χαρακτηριστικών αποτελείται από ένα σύνολο p-διάστατων διανυσμάτων, πρέπει να εφαρμοστεί μια πολυμεταβλητή μέθοδος για τη μεταξύ τους σύγκριση. Η σύγκριση επομένως των δύο τροχιών X και Υ που προέκυψαν με την προηγούμενη μέθοδο γίνεται στην παρούσα εργασία μέσω των δύο μη-παραμετρικών στατιστικών μεθόδων Wald-Wolfowitz ή (WWtest) [26] και της Mutual Nearest Point Distance [44]. Στην πρώτη μέθοδο χρησιμοποιώντας τα δύο ζευγάρια διανυσμάτων καθυστέρησης {x i } και {y i } (αντιστοιχούν στους πίνακες X και Υ) κατασκευάζουμε το συνολικό Minimal Spanning Tree και τον πίνακα των στατιστικών ποσοτήτων W. Ο πίνακας W είναι ένα μέτρο ομοιότητας μεταξύ των δυναμικών των RTI σημάτων x[n] και y[n]. Όσο πιο θετική είναι η τιμή W(x[n],y[n],τ,p)=W({x i },{y i }), τόσο πιο όμοιες είναι οι δύο τροχιές. Είναι λοιπόν εμφανές ότι το WW-test πρακτικά υπολογίζει τη σχετική επικάλυψη των αντίστοιχων τροχιών. Επομένως, ο δείκτης W είναι ένα ενδεικτικό μέτρο. O δείκτης αυτός έχει ένα γενικό χαρακτήρα όταν χρησιμοποιείται ως μέτρο ομοιότητας για τη σύγκριση των δυναμικών δύο διαφορετικών χρονοσειρών. Ο μόνος περιορισμός είναι ότι οι παράμετροι p,τ πρέπει να έχουν την ίδια τιμή για τα δύο σήματα. Α. Σταμούλη Σελίδα 40

55 Αντίθετα, η MNPD είναι μια απλούστερη εναλλακτική διαδικασία σύγκρισης πολυμεταβλητών δεδομένων. Το μέτρο αυτό ποσοτικοποιεί την ανομοιότητα μεταξύ δύο πολυδιάστατων συνόλων που αντιπροσωπεύουν τα RTI. Ο πίνακας που προκύπτει στην περίπτωση αυτή περιλαμβάνει τα μέτρα ανομοιότητας για κάθε ζεύγος X,Υ που προέκυψε. 5.2 Μέθοδος Wald Wolfowitz (WW-Test) Στη συγκεκριμένη ενότητα γίνεται αναφορά στη μέθοδο Wald-Wolfowitz Test που χρησιμοποιείται για τη σύγκριση των χαρακτηριστικών των ανακατασκευασμένων διανυσμάτων και στηρίζεται στη θεωρία των γράφων [29]. Το Wald test είναι ένα στατιστικό τεστ ελέγχου [27] υποθέσεων με πολλαπλές χρήσεις. Σκοπός του είναι να ελέγξει την ομοιότητα δύο κατανομών, απορρίπτοντας, ή μη κατορθώνοντας να απορρίψει τη μηδενική υπόθεση. Για να κατανοήσουμε τη μέθοδο Wald-Wolfowitz Test πρέπει να αναφερθούμε αρχικά στη θεωρία των γράφων και ιδιαίτερα στο δέντρο ελαχίστου μήκους το οποίο χρησιμοποιείται στο WW-test για τη σύγκριση των εξαγομένων χαρακτηριστικών Στοιχεία Θεωρίας των Γράφων Ο γράφος είναι μια μαθηματική οντότητα (σύνολο σημείων διανυσμάτων και σύνολο ακμών), ένα ζεύγος G = (V, E) από σύνολα που ικανοποιούν τη συνθήκη E [V] 2 (μέγιστες δυνατές ακμές). Επομένως τα στοιχεία του Ε είναι υποσύνολα 2 στοιχείων του V. Τα στοιχεία που αποτελούν το σύνολο V = V i i=1:n ονομάζονται κορυφές ή κόμβοι ή σημεία ενός γράφου (nodes) G, ενώ τα στοιχεία του συνόλου E = E ij i j είναι οι ακμές ή οι γραμμές του (edges), οι οποίες ενώνουν 2 σημεία. Στην εικόνα 10 βλέπουμε τη γεωμετρική αναπαράσταση ενός γράφου με κόμβους V = {1,2,3,4,5} και σύνολο ακμών Ε = {(1,3), (1,5), (2,5)}. Α. Σταμούλη Σελίδα 41

56 Εικόνα 10: Γεωμετρική αναπαράσταση γράφου Οι περισσότεροι συγγραφείς εξαιρούν τα απομονωμένα σημεία από τη γεωμετρική αναπαράσταση ενός γράφου, τα σημεία δηλαδή εκείνα που δεν έχουν κάποια σύνδεση με οποιοδήποτε άλλο σημείο ενός γράφου. Επιπλέον, συμπεριλαμβάνουν στον ορισμό ενός γράφου τα σημεία στα οποία μια ακμή τελειώνει από εκεί από όπου ξεκίνησε. Συνεπώς, σε ένα γράφο, κάθε ακμή ενώνει δυο σημεία τα οποία καλούμε και ως πέρατα ή άκρα αυτής της ακμής. Αν ορίσουμε τα σημεία με αριθμούς 1,2,3, m, τότε οι ακμές μπορούν να ορισθούν από γράμματα e 1, e 2, e 3,, e n ή να αναπαρασταθούν ως διατεταγμένα ζεύγη των άκρων τους. Για παράδειγμα (1,3), (1,5) κ.ο.κ.. Ο βαθμός ενός σημείου v ισούται με τον αριθμό των ακμών που εμπίπτουν σε αυτόν. Για παράδειγμα στο προηγούμενο σχήμα ο βαθμός των σημείων 2,3 ισούται με 1, των σημείων 1,5 με 2 ενώ το σημείο 4, ονομάζεται απομονωμένο σημείο. Δυο σημεία που είναι ενωμένα με την ίδια ακμή, ονομάζονται γειτονικά ή συνοριακά σημεία.[30], [45] Ανοιγμένα Δέντρα (spanning trees) Προτού αναφερθούμε στην ειδική κατηγορία των γραφημάτων που ονομάζονται δέντρα, πρέπει να εισάγουμε ορισμένες ενδιαφέρουσες έννοιες και δομές. Ας θεωρήσουμε το γράφο του παρακάτω σχήματος: Α. Σταμούλη Σελίδα 42

57 Εικόνα 11: Γράφος Αν θελήσουμε να διασταυρώσουμε κάποια σημεία κατά μήκος των δεδομένων σημείων, θα προκύψει ένας σημαντικός αριθμός από διαφορετικές πιθανότητες και προβλήματα, ανάλογα με τους περιορισμούς που τίθενται από τις επιλογές των τροχιών. Αν δεν υπάρχει κάποιος περιορισμός, η οποιαδήποτε οδός διαμέσου του γράφου ονομάζεται διαδρομή. Για παράδειγμα, η μετακίνηση μεταξύ των κόμβων μέσα στο γράφο είναι απλά μια διαδρομή. Αν η κάθε ακμή μπορεί να συναντηθεί μόνο μια φορά, η δεδομένη διαδρομή διαμέσου του γράφου ονομάζεται ίχνος. Για παράδειγμα, η μετακίνηση μεταξύ του σχήματος είναι ένα ίχνος. Ένα μονοπάτι είναι μια διαδρομή η οποία δεν περιέχει επαναλαμβανόμενους κόμβους. Προφανώς κάθε μονοπάτι είναι αυτομάτως και ένα ίχνος, επειδή είναι αδύνατο να διασχίσουμε την ίδια ακμή δυο φορές χωρίς να επισκεφθούμε τουλάχιστον ένα από τα διπλανά του σημεία. Ένα τυπικό μονοπάτι του σχήματος αποτελεί η μετακίνηση Θα ονομάζουμε κλειστό κάποιο (οποιοδήποτε) μονοπάτι, ίχνος ή διαδρομή, αν καταλήγει στο σημείο εκείνο από το οποίο ξεκίνησε. Πιο συγκεκριμένα, αν ένα μονοπάτι θεωρούμε ότι καταλήγει στο σημείο εκείνο που ξεκίνησε, τότε ονομάζεται κύκλος (cycle). Προφανώς ο κύκλος περιέχει τρία σημεία, επειδή ο ορισμός του γράφου μας αποκλείει την ύπαρξη διπλών ακμών. Για παράδειγμα, ο κλειστός βρόχος του σχήματος αποτελεί ένα κύκλο. Επιπλέον, συνδεδεμένος γράφος, ονομάζεται ο γράφος στον οποίο κάθε ζεύγος σημείων έχει κάποια διαδρομή ανάμεσά τους. Όταν σε κάθε συνδεδεμένο γράφο έχει αποδοθεί μια τιμή ως απόσταση για κάθε ακμή, τότε λέμε ότι ο γράφος είναι σταθμισμένος. Το μήκος μιας διαδρομής σε ένα τέτοιο γράφο θα είναι τότε το άθροισμα Α. Σταμούλη Σελίδα 43

58 των αποστάσεων όλων των ακμών που συμμετέχουν. Επομένως, είναι προφανές ότι το συντομότερο μονοπάτι ελαχιστοποιεί την ποσότητα l ij όπου l ij η Ευκλείδεια απόσταση μιας ακμής, με i = 1,2,.., n 1 και j = 1,2,.., n για τον αριθμό n των σημείων που συμμετέχουν στο γράφο. Τέλος, ένας γράφος G = (V, Ε ) ονομάζεται υπογράφος του G = (V, Ε), αν V V και Ε Ε. [29] Δέντρα Ελαχίστου Μήκους (Minimal Spanning Tree MST) Ένα δέντρο είναι ένα ειδικό είδος γράφου, το οποίο χαρακτηρίζεται από (α) έλλειψη κύκλων και (β) συνεκτικότητα, όταν δηλαδή υπάρχουν ακμές οι οποίες ενώνουν όλα τα σημεία του γράφου. Ομοίως, ένα ανοιγμένο δέντρο (spanning tree) ενός συνδεδεμένου σταθμισμένου γράφου G = (V, E), είναι ένας συνδεδεμένος υπογράφος του G = (V, E) ο οποίος περιέχει όλα τα σημεία του γράφου και επιπλέον δεν περιέχει κανένα κύκλο. Αν αρχικά υπάρχουν Ν σημεία τότε MST ονομάζεται ένα ανοιγμένο δέντρο που περιέχει ακριβώς Ν 1 ακμές, για τις οποίες το άθροισμα των αποστάσεών τους είναι ελάχιστο. Δηλαδή, αν κάθε ακμή (i, j) έχει ένα μήκος l ij, το MST είναι η δενδρική δομή του γράφου για την οποία ελαχιστοποιείται η ποσότητα l ij. [30], [45] Εικόνα 12: Τοπολογία Σημείων σε Γράφο. Παραπάνω απεικονίζονται γραφικά οι ορισμοί που δόθηκαν για την ίδια ακριβώς τοπολογία σημείων. Ένα ανοιγμένο δέντρο αποτελείται από τις διαδοχικές ακμές, ενώ βλέπουμε και το MST. Από τον ορισμό και τη σχηματική αναπαράσταση μπορούμε να αντιληφθούμε ότι το ανοιγμένο δέντρο δεν είναι μονοσήμαντα ορισμένο, σε αντίθεση με το MST το οποίο είναι ένα και μοναδικό για κάθε διαφορετική τοπολογία σημείων. Επιπλέον και τα δυο δέντρα έχουν τον ίδιο αριθμό ακμών, π.χ. Ν 1 = 5 για το παράδειγμα μας με Ν = 6. Παρακάτω απεικονίζεται το ανοιγμένο δέντρο ενός επίπεδου γράφου. Κάθε ακμή έχει και το «βάρος» της το οποίο είναι ανάλογο του μήκους της. Α. Σταμούλη Σελίδα 44

59 Εικόνα 13: Ανοιγμένο Δέντρο Επιπέδου Γράφου Αλγόριθμοι εύρεσης του Δέντρου Ελαχίστου Μήκους Για την εύρεση του δέντρου ελάχιστου μήκους- MST έχουν προταθεί διάφοροι αλγόριθμοι, οι πιο σημαντικοί από τους οποίους είναι ο αλγόριθμος Kruskal και ο αλγόριθμος Prim. Στη παρούσα εργασία για την εύρεση του MST χρησιμοποιήσαμε τον αλγόριθμο Kruskal Ο KRUSKAL αλγόριθμος υλοποίησης του MST Ο αλγόριθμός Kruskal [31], [32] είναι ο πιο παλαιός και απλός αλγόριθμος κατασκευής του MST και επιτυγχάνεται ξεκινώντας από κάποιο γράφο και επιλέγουμε διαδοχικά ακμές. Η υλοποίησή του είναι ιδιαίτερα κατάλληλη για αραιούς γράφους, εκείνους δηλαδή τους γράφους που έχουν μικρό αριθμό από ακμές. Τα βήματα που ακολουθεί ο αλγόριθμος για την κατασκευή του MST είναι τα ακόλουθα: 1. Ελέγχουμε ότι ο γράφος είναι ενωμένος. Αν δεν είναι, διακόπτουμε. 2. Ταξινομούμε τις ακμές του γράφου G κατά αύξουσα σειρά μήκους. 3. Επιλέγουμε τις ακμές με αυτήν τη σειρά, ελέγχοντας παράλληλα σε κάθε στάδιο να μη δημιουργείται κύκλος. Αν η πρόσφατα προστιθέμενη ακμή σχηματίζει κύκλο με ακμές που έχουν ήδη επιλεγεί, την απορρίπτουμε και δοκιμάζουμε την επόμενη. 4. Αν βρεθούν Ν 1 ακμές, τότε το υπάρχον σύνολο των ακμών αποτελεί το MST, συνεπώς σταματάμε. Α. Σταμούλη Σελίδα 45

60 Επομένως υπό την προϋπόθεση ότι έχουμε ένα συνδεδεμένο σταθμισμένο γράφο G(V, E) και αντίστοιχα βάρη (Ευκλείδειες αποστάσεις) l ij ως εισόδους, ο αλγόριθμος Kruskal επιλέγει πάντοτε τη μικρότερη διαθέσιμη ακμή από το σύνολο Ε των ακμών και την προσθέτει στο σύνολο των ήδη επιλεγμένων ακμών. Ας υποθέσουμε ότι έχουμε τον παρακάτω γράφο με τα βάρη των ακμών του. Εικόνα 14: Γράφος με Βάρη Οι ακμές AD και CE έχουν το μικρότερο μήκος (5). Αρχικά αυθαίρετα επιλέγουμε την AD και μετά την CE. Η επόμενη ακμή που επιλέγεται είναι η DF μήκους (6) και αμέσως μετά οι AB και BE μήκους (7). Η ακμή BD απορρίπτεται διότι υπάρχει ήδη ένα μονοπάτι μεταξύ των B και D, αλλιώς θα σχηματιζόταν κύκλος (ABD). Για αποφυγή σχηματισμού του (BCE) κύκλου απορρίπτουμε την ακμή BC. Επίσης απορρίπτουμε τις ακμές DE και FE για να μην σχηματιστούν οι κύκλοι (DEBA) και (FEBAD) αντίστοιχα. Τέλος επιλέγοντας την EG καταλήγουμε στο MST Ο PRIM αλγόριθμος υλοποίησης του MST O αλγόριθμους Prim [33] [32] χωρίζει τους κόμβους του δικτύου σε αυτούς που έχουν συνδεθεί στο δέντρο (συνδεδεμένους) και σε αυτούς που δεν έχουν συνδεθεί ακόμα (μη συνδεδεμένοι). Στο πρώτο στάδιο, αρχίζοντας από έναν οποιοδήποτε κόμβο, επιλέγουμε από όλους τους κλάδους που συνδέουν αυτό τον κόμβο με κάποιο άλλο, εκείνον με τη μικρότερη απόσταση, χωρίς ν' ανησυχούμε για την επίδραση που μπορεί να έχει αυτή μας η απόφαση σε επόμενες αποφάσεις. Σε κάθε επόμενο στάδιο προσδιορίζουμε το μη συνδεμένο κόμβο, που είναι πλησιέστερα σε οποιοδήποτε από τους συνδεμένους κόμβους και μετά προσθέτουμε τον αντίστοιχο κλάδο στο δέντρο. Η Α. Σταμούλη Σελίδα 46

61 διαδικασία αυτή επαναλαμβάνεται, όπως παρουσιάζεται και παρακάτω, μέχρι να συνδεθούν όλοι οι κόμβοι. Το δίκτυο που προκύπτει εξασφαλίζεται ότι είναι ένα δέντρο ελάχιστου μήκους. Αλγόριθμος Prim για την εύρεση του δέντρου ελάχιστης κάλυψης 1. Επίλεξε έναν κόμβο αυθαίρετα και σύνδεσε τον με τον πλησιέστερο κόμβο. 2. Βρες το μη συνδεδεμένο κόμβο που είναι πλησιέστερος σε έναν συνδεμένο κόμβο και σύνδεσε τους δύο αυτούς κόμβους. Επανάλαβε το βήμα 2 μέχρι να συνδεθούν όλοι οι κόμβοι. Εικόνα 15: Υλοποίηση αλγόριθμου Prim. Στο παράδειγμα της εικόνας 15 επιλέγουμε αρχικά τυχαία τον κόμβο 1. Ο πλησιέστερος σε αυτόν κόμβος είναι ο 3. Επομένως τους ενώνουμε. Έπειτα ο πλησιέστερος μη συνδεδεμένος κόμβος σε έναν συνδεδεμένο είναι ο 6. Συνεχίζουμε με την ίδια διαδικασία μέχρι να ενώσουμε όλους τους κόμβους Περιγραφή του Wald-Wolfowitz Test Σκοπός του Wald test όπως έχουμε ήδη αναφέρει είναι να ελέγξει την ομοιότητα δύο κατανομών, απορρίπτοντας ή μη κατορθώνοντας να απορρίψει τη μηδενική υπόθεση Έστω ότι έχουμε δύο πολυδιάστατα διανύσματα : x 1 = και x 2 = Α. Σταμούλη Σελίδα 47

62 Παρατηρούμε ότι η διάσταση των σημείων πρέπει να είναι η ίδια (εδώ έχουμε δισδιάστατα σημεία), ενώ ο αριθμός των σημείων των δειγμάτων μπορεί να είναι διαφορετικός (εδώ το πρώτο δισδιάστατο δείγμα αποτελείται από 5 σημεία ενώ το δεύτερο δισδιάστατο δείγμα αποτελείται από 4 σημεία). Γενικά έχουμε δείγματα Χ, Υ μεγέθους m, n αντίστοιχα, που ορίζονται όμως και τα δύο στον χώρο ίδιων διαστάσεων, έστω R p. Ορίζεται η μηδενική υπόθεση Η ο : προέρχονται από την ίδια κατανομή. Δηλαδή μηδενική υπόθεση Η ο ορίζουμε το γεγονός ότι οι δύο κατανομές δεν είναι διαχωρισμένες. Σκοπός είναι να αποφασίσουμε αν θα καταρρίψουμε ή θα δεχτούμε τη μηδενική υπόθεση. Αν δεχτούμε τη μηδενική υπόθεση σημαίνει ότι τα δείγματα ανήκουν στην ίδια κατανομή, ενώ αν απορρίψουμε τη μηδενική υπόθεση σημαίνει ότι τα δείγματα δεν ανήκουν στην ίδια κατανομή. Αρχικά κατασκευάζεται το MST, με τον τρόπο που περιγράψαμε στην προηγούμενη παράγραφο, και των δύο δειγμάτων και όχι καθενός δείγματος ξεχωριστά. Στη συνέχεια υπολογίζεται μια στατιστική ποσότητα R, που είναι ο αριθμός των διαδοχικών σημείων στο δέντρο που μοιράζονται την ίδια ταυτότητα. Δηλαδή, το R δηλώνει πόσες υποομάδες (υπο-δέντρα) εμφανίζονται αποτελούμενες από διαδοχικά σημεία που ανήκουν στην ίδια κατανομή. Αν το R είναι μεγάλο, δέχομαι την μηδενική υπόθεση, αν το R είναι μικρό, απορρίπτω την Η ο. Αυτό εξηγείται εύκολα, διότι αν έχω μεγάλο R, σημαίνει ότι τα δείγματα είναι 'μπλεγμένα' μεταξύ τους, δηλαδή προέρχονται από την ίδια ομάδα, ενώ αν το R είναι μικρό σημαίνει ότι τα δείγματα είναι διαχωρισμένα, συνεπώς δεν ανήκουν στην ίδια κατανομή. Το ww-test ορίζει και τον ορισμό κάποιων άλλων παραμέτρων, όπως είναι η μέση τιμή Ε και η διασπορά Var, με σκοπό να καταλήξει στον υπολογισμό μιας άλλης στατιστικής ποσότητας, το W. Το W αποτελεί κι αυτό ένα μέτρο ομοιότητας- όπως και το R- μεταξύ των δύο δειγμάτων. Ας δούμε τα βήματα υπολογισμού της στατιστικής ποσότητας W. Έστω ότι έχουμε δύο δείγματα μεγέθους m, n αντίστοιχα που ανήκουν στις κατανομές Fx, Fy αντίστοιχα. Τα δείγματα ανήκουν στον ίδιο πολυδιάστατο χώρο, R p. Α. Σταμούλη Σελίδα 48

63 Ορίζουμε N=m+n, C τον αριθμό του ζέυγους ακμών του MST που καταλήγουν στον ίδιο κόμβο και d i το βαθμό του i κόμβου. Υπολογίζουμε την μέση τιμή E[R] του R και τη διασπορά Var[R C] του R από τους παρακάτω τύπους: Var[R/C] = 2mn N(N 1) 2mn N N Ε[R] = 2mn N + 1 (14) (15) C N (N 2)(N 3) [N(N 1) 4mn + 2] Έχει αποδειχτεί ότι η ποσότητα W προσεγγίζει την κανονική κατανομή: όπου R = N 1 i=1 Z i R E[R] W = Var[R] (16) + 1, Z = 1. Με 1 ισούται αν η ακμή i συνδέει τους κόμβους από 0 διαφορετικά δείγματα, 0 αλλιώς. Για θετικότερες τιμές του W, ενισχύεται η αποδοχή της μηδενικής υπόθεσης, ενώ για αρνητικότερες τιμές του, ενισχύεται η απόρριψη της μηδενικής υπόθεσης. Δηλαδή το W χρησιμοποιείται ως ένα μέτρο ομοιότητας μεταξύ δύο δειγμάτων-κατανομών: όσο θετικότερη τιμή έχει, τόσο πιο όμοιες είναι οι κατανομές. Για μικρές τιμές του W (δηλαδή αρνητικές), απορρίπτουμε τη μηδενική υπόθεση. Ένα μεγάλο πλεονέκτημα της δοκιμής WW είναι ότι δεν είναι απαραίτητη καμία εκ των προτέρων (apriori) παραδοχή των δύο κατανομών. Επιπλέον, τα δύο σύνολα προς σύγκριση δεν απαιτείται να έχουν τον ίδιο αριθμό σημείων. Όπως έχει ήδη αναφερθεί, μεγάλες τιμές του W δηλώνουν μεγάλη ομοιότητα μεταξύ των συγκρινόμενων συνόλων. Για να χειρισθεί η παράμετρος W σε μια διατύπωση ανομοιότητας, υπολογίζουμε τον πίνακα ανομοιότητας D, ως: 0, W(i, j) > 0 D(i, j) τ,p = abs(w(i, j), otherwise (17) Πλεονεκτήματα του Wald-Wolfowitz test Τα πλεονεκτήματα της μεθόδου Wald-Wolfowitz test είναι τα εξής: 1. Δεν απαιτείται η ίδια μέθοδος εξαγωγής χαρακτηριστικών των δειγμάτων, μπορεί να είναι διαφορετικά χαρακτηριστικά. 2. Δεν χρειάζεται να προηγηθεί κάποια υπόθεση για τις κατανομές. Α. Σταμούλη Σελίδα 49

64 3. Τα δείγματα προς σύγκριση, δεν είναι αναγκαίο να έχουν τον ίδιο αριθμό σημείων. 5.3 Αμοιβαία Απόσταση Κοντινότερου Σημείου-Mutual Nearest Point Distance Μία εναλλακτική διαδικασία σύγκρισης ομοιότητας πολυμεταβλητών δεδομένων είναι η Mutual Nearest Point Distance-MNPD. Είναι μια πολυπαραγοντική μέθοδος σύγκρισης που χρησιμοποιείται προκειμένου να ποσοτικοποιήσει την ανομοιότητα μεταξύ δύο πολυδιάστατων συνόλων διανυσμάτων στο χώρο των φάσεων. Δεδομένου δύο συνόλων διανυσμάτων - στο χώρο της φάσης - Χ{x ι }, i = 1: ν 1, Υ{y j }, j = 1: ν 2 όπου ν 1, ν 2 (όπως περιγράφτηκε και στην εξίσωση 9) είναι ο αριθμός των σημείων σε κάθε σύνολο, η Mutual Nearest Point Distance υπολογίζεται χρησιμοποιώντας την ακόλουθη εξίσωση: ν 1 D(i, j) τ,p = MNPD(X, Y) = i=1 dmin x i y j=1:ν2 + j=1 d min y j x i=1:ν1 (18) ν 1 + ν 2 Η απόσταση μεταξύ των πολυδιάστατων διανυσμάτων στο χώρο των φάσεων, Χ και Υ, ορίζεται από το άθροισμα όλων των πλησιέστερων αποστάσεων κατά ένα αμοιβαίο τρόπο. Από κάθε x(i), υπολογίζεται η μικρότερη απόσταση από όλα τα y(j) σημεία, και ομοίως προς την αντίθετη κατεύθυνση. Η MNPD υπολογίζεται κατά έναν αμφίδρομο τρόπο, ώστε να αποφεύγονται ακραίες περιπτώσεις κατά τον υπολογισμό των αποστάσεων μονής κατεύθυνσης, όπου οι αποστάσεις των τροχιών στο χώρο των φάσεων που ανήκουν σε διαφορετικά σύνολα δεδομένων είναι μικρή ενώ οι αντίστοιχες αποστάσεις που ανήκουν στο ίδιο σύνολο είναι διαφορετικές. Ο αριθμητής του κλάσματος κανονικοποιείται στο άθροισμα ν 1 + ν 2, έτσι ώστε να καταστήσει το αποτέλεσμα ανεξάρτητο του αριθμού των σημείων. Ο αλγόριθμος MNPD είναι χαμηλότερης πολυπλοκότητας από τη μέθοδο WW-test, που περιγράφθηκε στην προηγούμενη ενότητα, και για το λόγο αυτό προτιμάται στις διάφορες εφαρμογές. [28], [44]. ν 2 Α. Σταμούλη Σελίδα 50

65 6.1 Εισαγωγή Από τις μεθόδους ομοιότητας πολυδιάστατων δεδομένων έχει προκύψει ένας πίνακας ανομοιοτήτων (D τ,p ) μεταξύ των πολυδιάστατων διανυσμάτων. Με τη μέθοδο της πολυδιάστατης κλιμάκωσης τα προκύπτοντα συσχετιζόμενα δεδομένα πρέπει να μετασχηματιστούν σε διανύσματα συντεταγμένων. Η τεχνική η οποία θα χρησιμοποιήσουμε για την αναπαράσταση του πίνακα αποστάσεων σε διανύσματα συντεταγμένων ονομάζεται Πολυδιάστατη Κλιμάκωση (Multidimensional Scaling-MDS). Η τεχνική MDS έχει σαν αποτέλεσμα τη δημιουργία N διανυσμάτων gi ԑ R l έτσι ώστε η σημείο προς σημείο ευκλείδειες αποστάσεις g i g j να προσεγγίζουν όσο είναι εφικτό τις τιμές του πίνακα D ij. Η τεχνική MDS ορίζεται ως G=MDS(D, l), με την παράμετρο l να δηλώνει τη διάσταση που θα χρησιμοποιηθεί. Ο πίνακας των αποστάσεων ή ομοιοτήτων D χρησιμοποιείται για τον υπολογισμό του αντίστοιχου πίνακα των εκτιμώμενων αποστάσεων μέσω μιας μονότονης συνάρτησης μετασχηματισμού f.[22] 6.2 Ορισμός Η πολυδιάστατη κλιμάκωση (MDS-Multidimensional Scaling) [35] είναι ένα σύνολο από μεθόδους ανάλυσης που έχουν ως στόχο τη κατασκευή ενός χώρου για την ανάλυση της εγγύτητας ενός συνόλου αντικειμένων. Μία εγγύτητα είναι μία αριθμητική ποσότητα η οποία υποδεικνύει κατά πόσον όμοια ή διαφορετικά είναι ή γίνονται αντιληπτά δύο αντικείμενα. Τα αντικείμενα μπορεί να είναι διαφόρων ειδών όπως εμπορικά προϊόντα, πολιτικά πρόσωπα, ψυχολογικές οντότητες, μεταβλητές διαφόρων ειδών ή οποιασδήποτε μορφής αντικείμενα των οποίων ο εικονικός χώρος μας ενδιαφέρει να αναπαραστήσουμε και να μελετήσουμε. Γίνεται λοιπόν αντιληπτό ότι τα αντικείμενα της εκάστοτε έρευνας δεν ανήκουν πάντα σε κάποιο υπαρκτό κοινό γεωμετρικό χώρο όπως συμβαίνει με τις πόλεις στο χάρτη. Ο χώρος αυτός μπορεί να είναι μιας, δύο, τριών διαστάσεων (μπορεί να παρασταθεί από ένα διάγραμμα) ή περισσοτέρων διαστάσεων (στην περίπτωση αυτή η γραφική αναπαράσταση δεν είναι εφικτή). Την είσοδο του αλγόριθμου αυτού, αποτελεί ένα πίνακας ομοιοτήτων ή ανομοιοτήτων των υπό Α. Σταμούλη Σελίδα 51

66 επεξεργασία αντικειμένων (δεδομένων). Στόχος λοιπόν της MDS τεχνικής είναι να επεξεργαστεί τα αρχικά αντικείμενα με τέτοιο τρόπο έτσι ώστε κάθε ένα αντικείμενο να αποτυπώνεται ως ένα σημείο σε έναν νέο εικονικό χώρο στον οποίο οι γειτνιάσεις (εγγύτητες) μεταξύ των αρχικών πολυδιάστατων αντικειμένων να διατηρούνται με τον καλύτερο δυνατό τρόπο. Αυτό σημαίνει πως τα δεδομένα που βρίσκονται κοντά στον αρχικό χώρο θα πρέπει κατά αντιστοιχία να βρίσκονται σε μικρές αποστάσεις μεταξύ τους και στην νέα χωρική απεικόνιση. Δηλαδή, τα όμοια αντικείμενα αναπαρίστανται ως σημεία το ένα κοντά στο άλλο ενώ τα ανόμοια σαν σημεία που απέχουν μεταξύ τους. Το κύριο αποτέλεσμα που παρέχεται με αυτή τη μέθοδο είναι η γεωμετρική αναπαράσταση του εικονικού χώρου των αντικειμένων σε ένα γράφημα λίγων διαστάσεων. Από μία αξιόπιστη αναπαράσταση μπορούμε να εξάγουμε συμπεράσματα για τυχόν κρυφές δομές στα δεδομένα, παρατηρώντας απλά τις αποστάσεις των σημείων-αντικειμένων και γενικά τις μεταξύ τους θέσεις. Επίσης, σημαντικό ρόλο παίζουν και συγκεκριμένες κατευθύνσεις που ανάλογα με τη δομή και τη μορφή του νέφους των σημείων-αντικειμένων μπορεί να αποκτήσουν κάποιο υποκειμενικό νόημα, κάτι που καθιστά τα δεδομένα ακόμα πιο κατανοητά. Στο γράφημα όσο μεγαλύτερη είναι η ομοιότητα ή όσο μικρότερη είναι η απόσταση μεταξύ δύο αντικειμένων, τόσο πιο κοντά θα πρέπει να βρίσκονται τα αντικείμενα αυτά στο γράφημα. Η πολυδιάστατη κλιμάκωση μπορεί συνεπώς να αποτελέσει και μία τεχνική ελαχιστοποίησης του όγκου των αντικειμένων, καθώς αναζητεί τη βέλτιστη διαμόρφωση του εικονικού χώρου των αντικειμένων αυτών με τη μικρότερη δυνατή διάσταση. Α. Σταμούλη Σελίδα 52

67 Εικόνα 16: Στόχος είναι η εύρεση των gi που διατηρούν την Dij όσο το δυνατόν πιο κοντά στην dij Μαθηματικά, η πολυδιάστατη κλιμάκωση εφαρμόζεται και για την παραγωγή διαγραμμάτων l διαστάσεων. Ένα διάγραμμα πολλών διαστάσεων θα μπορούσε να απεικονίσει ακριβέστερα τη δομή του χώρου των αντικειμένων από ένα χώρο λιγότερο διαστάσεων για τα ίδια δεδομένα. Το μειονέκτημα το εικονικών χώρων πολλών διαστάσεων είναι ότι δεν μπορούν να αξιολογηθούν από το ανθρώπινο μάτι. Στη παρούσα εργασία αυτό που μας ενδιαφέρει είναι περισσότερο η ακρίβεια μεταξύ των αποστάσεων των σημείων στον εικονικό χώρο, αφού τα δεδομένα αυτά θα αποτελέσουν είσοδο στους ταξινομητές μας και λιγότερο η οπτικοποίηση των αποστάσεων των αντικειμένων. Συνεπώς, δοθέντων ενός NxN πίνακα ανομοιοτήτων D i,j, όπου με i,j συμβολίζονται τα αντικείμενα και Ν είναι το πλήθος των αντικειμένων, αποτελούμενο από τα μέτρα εγγύτητας (μέτρα ομοιότητας ή ανομοιότητας) μεταξύ των δεδομένων αυτών, ο MDS αλγόριθμος παράγει μία νέα l-διαστάσεων αναπαράσταση των αντικειμένων. Στον νέο αυτό χώρο κάθε αντικείμενο απεικονίζεται ως ένα σημείο [g i,1,.,g i,l ] με τέτοιο τρόπο ώστε οι αποστάσεις ανάμεσα στα σημεία στον καινούργιο χώρο να αντιπροσωπεύουν όσον το δυνατό καλύτερα τις γειτνιάσεις των αρχικών δεδομένων. Το πιο συνηθισμένο μέτρο απόστασης που χρησιμοποιείται από την MDS τεχνική είναι η Ευκλείδεια απόσταση(l 2 -νόρμα). Α. Σταμούλη Σελίδα 53

68 6.3 Μέθοδοι συλλογής των δεδομένων εισόδου στον MDS αλγόριθμο Τα δεδομένα που χρησιμοποιούνται ως είσοδο στην MDS ανάλυση ονομάζονται δεδομένα εγγύτητας (proximities). Τα δεδομένα αυτά είναι αριθμητικές τιμές που δηλώνουν την ομοιότητα (η οποία δηλώνεται από τον όρο S ij ) ή την ανομοιότητα των υπό επεξεργασία δεδομένων (η οποία δηλώνεται από τον όρο δ ij ). Η MDS τεχνική στοχεύει στη χωρική απεικόνιση των δεδομένων, με τέτοιο τρόπο ώστε η αναπαράσταση των σημείων στο νέο χώρο, να διατηρεί όσο το δυνατόν καλύτερα στην ομοιότητα ή την ανομοιότητα των αρχικών δεδομένων. Συνήθως ο πίνακας των ομοιοτήτων ή ανομοιοτήτων είναι ένας τετραγωνικός πίνακας που ονομάζεται proximity matrix (πίνακα εγγυτήτων). Στη παρούσα εργασία τα δεδομένα εγγύτητας θα προσδιορίζονται από το μέτρο ανομοιότητας δ ij μεταξύ των αντικειμένων και ο πίνακας των ανομοιοτήτων θα συμβολίζεται με D ij. Υπάρχουν δύο βασικές κατηγορίες για να συλλέξουμε τα δεδομένα για τον πίνακα εγγυτήτων: Άμεσες μέθοδοι συλλογής: Στη μέθοδο αυτή οι διαφορετικές πηγές μιας έρευνας μπορούν είτε να αναθέσουν οι ίδιοι μία αριθμητική τιμή ομοιότητας-ανομοιότητας σε κάθε ζευγάρι δεδομένων, είτε να καθορίσουν μία διάταξη των ζευγών αυτών (αύξουσας ή φθίνουσα) σε σχέση με την ομοιότητα ή ανομοιότητα τους. Έμμεσες μέθοδοι συλλογής: Στη μέθοδο αυτή η συλλογή των δεδομένων δε στηρίζεται στις τιμές που τους αναθέτουν οι ερωτώμενοι αλλά είναι αποτέλεσμα επιπρόσθετων μαθηματικών διαδικασιών ή μετρήσεων. Τα δεδομένα προκύπτουν είτε από δεδομένα σύγχυσης, είτε από πίνακες συσχετίσεων ή αποστάσεων ανάμεσα στα δεδομένα αυτά. [36] Άμεσες μέθοδοι συλλογής δεδομένων Στην κατηγορία αυτή, για να συλλέξουμε τα δεδομένα για τον πίνακα εγγύτητας, θα πρέπει να λάβουμε από κάποιες πηγές, όπως για παράδειγμα ταξιδιωτικούς χάρτες, όλες τις ανά δύο ομοιότητες-ανομοιότητες των αντικειμένων. Κάθε στοιχείο λοιπόν του πίνακα αντιστοιχεί σε ένα ζεύγος δεδομένων και είναι μία αριθμητική τιμή που αναπαριστά την ομοιότητα ή ανομοιότητα μεταξύ του ζεύγους αυτού. Όταν τα στοιχεία Α. Σταμούλη Σελίδα 54

69 αυτά αναπαριστούν ομοιότητες, σημαίνει όσο πιο μεγάλη είναι η τιμή για ένα ζεύγος αντικειμένων τόσο πιο όμοια και κοντά βρίσκονται τα αντικείμενα αυτά. Αντίθετα, για τα μέτρα ανομοιότητας όσο μεγαλύτερη είναι η τιμή τόσο πιο ανόμοια είναι τα αντικείμενα. Ο πίνακας που θα αποτελέσει είσοδο στον MDS αλγόριθμο είναι ένας τετραγωνικός πίνακας NxN διαστάσεων, όπου Ν είναι ο αριθμός των δεδομένων που θέλουμε να επεξεργαστούμε. Στον πίνακα αυτόν θα έχουμε Ν(Ν-1)/2 διαφορετικά αριθμητικές τιμές, διότι η διαδικασία προϋποθέτει ότι οι σχέσεις ομοιότηταςανομοιότητας που θα προκύψουν είναι συμμετρικές και συνεπώς η σειρά των ζευγαριών δεν έχει σημασία (το αντικείμενο i απέχει από το j όσο και το j από το i). Επίσης, δε λαμβάνονται σχέσεις ομοιότητας (ανομοιότητας) μεταξύ ενός αντικειμένου και του εαυτού του. Συνεπώς, ο πίνακας εγγύτητας είναι συμμετρικός και ως προς την κύρια διαγώνιο του, η οποία αποτελείται από μηδενικά. Να τονίσουμε ότι ο MDS αλγόριθμος μπορεί να χειριστεί και μη-συμμετρικά δεδομένα όταν επεξεργαζόμαστε δεδομένα σύγχυσης (confusion data). Στην περίπτωση αυτή διπλασιάζεται ο αριθμός των δεδομένων εγγύτητας που πρέπει να επεξεργαστούμε. Το μεγάλο πλεονέκτημα της κατηγορίας αυτής είναι ότι τα δεδομένα είναι απευθείας έτοιμα για επεξεργασία από τον MDS αλγόριθμο. Δηλαδή τα δεδομένα εγγύτητας, ή τα δεδομένα ανομοιοτήτων στη περίπτωση μας, αποτελούν και τα δεδομένα του πίνακα εγγυτήτων χωρίς κάποια επιπλέον επεξεργασία. Συνεπώς, είναι δυνατή είτε μια ξεχωριστή ανάλυση κάθε πηγής-συμμετέχοντος ή μία συνολική ανάλυση όλων των πηγών-συμμετεχόντων ταυτόχρονα. Το μειονέκτημα της μεθόδου είναι ότι η αύξηση των δεδομένων συνεπάγεται και αύξηση των προς επεξεργασία αριθμητικών τιμών του πίνακα εγγύτητας.[36] Έμμεσες μέθοδοι συλλογής δεδομένων Στις έμμεσες μεθόδους συλλογής δεδομένων τα δεδομένα προκύπτουν είτε από δεδομένα σύγχυσης, είτε από πίνακες συσχετίσεων ή αποστάσεων ανάμεσα στα δεδομένα αυτά. Στη παρούσα εργασία ο πίνακας εγγύτητας προκύπτει από τον πίνακα συσχετίσεων ανάμεσα στα δεδομένα, ο οποίος προκύπτει από τη μέθοδο ww-test, επομένως θα μελετήσουμε μόνο αυτή την περίπτωση. Η μόνη διαφορά στην περίπτωση αυτή από την άμεση μέθοδο συλλογής δεδομένων είναι στον τρόπο που προκύπτει ο πίνακας εγγύτητας. Στην προηγούμενη περίπτωση τον λαμβάνουμε κατευθείαν από τις Α. Σταμούλη Σελίδα 55

70 πηγές και είναι έτοιμος προς επεξεργασία από τον MDS αλγόριθμο, ενώ στην περίπτωση αυτή τον πίνακα συσχετίσεων (ομοιοτήτων) πρέπει πρώτα να τον επεξεργαστούμε, να τον μετατρέψουμε σε πίνακα εγγυτήτων και έπειτα να τον εισάγουμε στον MDS αλγόριθμο. Επομένως, ότι αναλύσαμε στην προηγούμενη ενότητα για τον πίνακα εγγύτητας ισχύει και σε αυτή την περίπτωση. Ο πίνακας συσχετίσεων χρησιμοποιείται στην περίπτωση που θέλουμε να εφαρμόσουμε την πολυδιάστατη κλιμάκωση σε δεδομένα τα οποία δεν αποτελούν δεδομένα εγγύτητας. Τα δεδομένα αυτά δεν μπορούν να χρησιμοποιηθούν από την MDS τεχνική, η οποία όπως έχουμε ήδη αναφέρει επεξεργάζεται μόνο δεδομένα εγγύτητας. Ο πίνακας συσχετίσεων μπορεί να αποτελέσει ενδεικτικό μέτρο εγγύτητας, καθώς όσο πιο θετική είναι η τιμή του ενός στοιχείου του πίνακα συσχετίσεων μεταξύ δύο αντικειμένων, τόσο πιο όμοιο είναι το ζεύγος των αντικειμένων. Επιπλέον, ο πίνακας συσχετίσεων μέσω κατάλληλης επεξεργασίας μπορεί να μετασχηματιστεί σε πίνακα εγγύτητας και να χρησιμοποιηθεί ως αρχικός πινάκας στην MDS ανάλυση. Το μειονέκτημα της παρούσας μεθόδου συγκριτικά με την προηγούμενη είναι ότι απαιτούνται επιπρόσθετες υλοποιήσεις ώστε να λάβουμε τον πίνακα εγγύτητας. Το πλεονέκτημα είναι ότι με τη μέθοδο αυτή μας δίνει τη δυνατότητα να χρησιμοποιήσουμε την MDS ανάλυση ακόμα και σε δεδομένα στα οποία η κλίμακα, οι διαστάσεις και τα χαρακτηριστικά των υπό μελέτη αντικειμένων δεν είναι γνωστά εκ των προτέρων.[36] 6.4 Είδη πολυδιάστατης κλιμάκωσης Ο σκοπός της MDS ανάλυσης είναι να βρει μια χωρική αναπαράσταση των υπό επεξεργασία αντικειμένων, όταν η μοναδική πληροφορία που είναι γνωστή είναι τα μέτρα (αν)ομοιοτήτων μεταξύ αυτών. Εφόσον έχει υπολογισθεί ο πίνακας εγγυτήτων που θα χρησιμοποιηθεί ως είσοδο στην MDS ανάλυση, εφαρμόζεται ο κατάλληλος MDS αλγόριθμος για τη δημιουργία της νέας χωρικής αναπαράστασης. Υπάρχουν δύο διαδικασίες της MDS ανάλυσης: Η μετρική (metric) πολυδιάστατη κλιμάκωση και Η μη- μετρική (non-metric) πολυδιάστατη κλιμάκωση Η μετρική (metric) πολυδιάστατη κλιμάκωση [35] προϋποθέτει ότι τα αρχικά δεδομένα εκφράζονται με αριθμητικές τιμές, όπως οι αποστάσεις που μετρήθηκαν από ένα χάρτη και επιδεικνύουν εγγύτητες που είναι κλασματικά (ratio) και διαστηματικά (Interval) Α. Σταμούλη Σελίδα 56

71 δεδομένα. Μία τέτοια μετρική υπόθεση λειτουργεί ικανοποιητικά για έναν πίνακα του οποίου τα στοιχεία συλλέγονται από μεθόδους άμεσου καθορισμού ομοιότητας ή ανομοιότητας. Η απλούστερη εκδοχή της μετρικής πολυδιάστατης κλιμάκωσης είναι η κλασσική πολυδιάστατη κλιμάκωση. Στη περίπτωση αυτή οι εγγύτητες είναι πραγματικές αποστάσεις στον ευκλείδειο χώρο. Αντίθετα η μη-μετρική (metric) πολυδιάστατη κλιμάκωση [35] θεωρεί σημαντική την αριθμητική διάταξη μεταξύ των εγγυτήτων. Στην μη-μετρική υπόθεση η MDS τεχνική στοχεύει ώστε η αριθμητική διάταξη των σημείων να προσεγγίζει όσον το δυνατό καλύτερα την αντίστοιχη των αρχικών δεδομένων. Μία τέτοια μετρική υπόθεση λειτουργεί ικανοποιητικά για έναν πίνακα του οποίου τα στοιχεία συλλέγονται από μεθόδους έμμεσου καθορισμού ομοιότητας ή ανομοιότητας. [35] 6.5 Κλασσική MDS ανάλυση Έχουμε το εξής πρόβλημα: Ας υποθέσουμε ότι έχουμε ένα χάρτη στον οποίο απεικονίζεται ένας αριθμός από πόλεις. Οι αποστάσεις μεταξύ αυτών των πόλεων μπορούν πολύ απλά να υπολογιστούν μετρώντας τες με έναν χάρακα. Εκτός από αυτό, μπορούμε επίσης να χρησιμοποιήσουμε την ευκλείδεια απόσταση. Γνωρίζοντας τις συντεταγμένες x,y μεταξύ των δύο πόλεων a και b η ευκλείδεια απόσταση υπολογίζεται από τον εξής μαθηματικό τύπο: d ab = (x a x b ) 2 + (y a y b ) 2 (19) Τώρα ας υποθέσουμε ότι έχουμε το αντίστροφο πρόβλημα: Έχοντας μόνο τις αποστάσεις μεταξύ των πόλεων, είναι εφικτό να σχηματίσουμε το χάρτη; Η κλασσική MDS ανάλυση, που εισήγαγε πρώτος ο Torgerson (1952), επιλύει αυτό το πρόβλημα. Έχοντας σαν δεδομένα μόνο τον πίνακα αποστάσεων μεταξύ των αντικειμένων προσπαθεί να δημιουργήσει έναν εικονικό χώρο όσον το δυνατό πιο κοντά στις αρχικές αποστάσεις. Η κλασική ανάλυση χρησιμοποιεί κυρίως τις ευκλείδειες αποστάσεις στον πίνακα εγγυτήτων. Υπάρχουν βέβαια και πολλές μη ευκλείδειες μετρικές (cf. Borg & Groenen, 1997). Σε πολλές εφαρμογές του MDS τα δεδομένα δεν είναι αποστάσεις που μετρήθηκαν στο χάρτη, αλλά δεδομένα ομοιότητας, όπως περιγράψαμε και στην ενότητα Ωστόσο, όταν εφαρμόζουμε τον κλασικό MDS αλγόριθμο θεωρούμε ότι τα δεδομένα εγγύτητας συμπεριφέρονται σαν πραγματικές μετρήσιμες αποστάσεις. Το πλεονέκτημα της Α. Σταμούλη Σελίδα 57

72 κλασικής ανάλυσης MDS είναι ότι παρέχει μια αναλυτική λύση, χωρίς τη χρήση πολλών επαναληπτικών διαδικασιών. [36] Βήματα της κλασικής ανάλυσης MDS Η κλασική ανάλυση περιλαμβάνει μερικά θεωρήματα και εφαρμογές της γραμμικής άλγεβρας. Ο αλγόριθμος αυτός, βασίζεται στο γεγονός ότι ο coordinate πίνακας d μπορεί να εξαχθεί από ανάλυση ιδιοτιμών ενός βαθμωτού πίνακα Β=dd'. Έστω ότι ονομάζουμε D τον πίνακα εισόδου του αλγορίθμου, τον πίνακα δηλαδή που περιέχει τα στοιχεία εκείνα (υπό μορφή αριθμητικών τιμών) που δείχνουν την (αν)ομοιότητα μεταξύ των δεδομένων, δηλαδή τον πίνακα εγγυτήτων. Το πρόβλημα της κατασκευής του πίνακα Β από τον πίνακα D λύνεται με τον πολλαπλασιασμό του D (2) με τον πίνακα J ο οποίος δίνεται από τη σχέση J = I 1 l l. H διαδικασία αυτή καλείται N double centering. Συνοπτικά, ο αλγόριθμος δίνεται από τα παρακάτω βήματα: 1. Εύρεση του πίνακα των τετραγώνων των εγγυτήτων D 2 = (D ij 2 ) 2. Εφαρμογή του double centering για την εύρεση του πίνακα εσωτερικών γινομένων (scalar product matrix) B, B = 1 2 JP2 J, όπου J είναι ο πίνακας κεντρικός τελεστής (centering operator) και ο οποίος υπολογίζεται από τη σχέση J = I 1 l l, όπου Ν ο αριθμός των προς επεξεργασία δεδομένων, I N ο μοναδιαίος πίνακας και l το διάνυσμα στήλη με μοναδιαία στοιχεία. O πίνακας B είναι τετραγωνικός και συμμετρικός ως προς την κύρια διαγώνιο του. 3. Εξαγωγή των l μεγαλύτερων θετικών ιδιοτιμών λ1,λ2,λ3.,λl (l I) του πίνακα B, καθώς και των αντίστοιχων ιδιοδιανυσμάτων e1,e2,,el. 4. Τώρα από τα N δεδομένα, έχουμε εξάγει μία χωρική απεικόνιση των l- διαστάσεων, από τον πίνακα d=e l Λ l 1/2,όπου E l είναι ο πίνακας των l ιδιοδιανυσμάτων (είναι ορθογώνιος πίνακας, δηλαδή ΕΕ =I) και Λ l είναι ο διαγώνιος πίνακας των m ιδιοτιμών (τα διαγώνια στοιχεία του Λ l είναι οι μηαρνητικές ιδιοτιμές του πίνακα B) του πίνακα B διότι: B = E l Λ l E l = E l (Λ l ) 1 2 (Λ l ) 1 2E l = XX (20) Α. Σταμούλη Σελίδα 58

73 6.5.2 Παράδειγμα Για να κατανοήσουμε καλύτερα τη μέθοδο της κλασικής πολυδιάστατης κλιμάκωσης, ας υποθέσουμε ότι έχουμε τον παρακάτω πίνακα δεδομένων-αποστάσεων μεταξύ 8 ελληνικών πόλεων από ένα χάρτη. Συνεπώς, ο πίνακας των εγγυτήτων είναι ένας συμμετρικός πίνακας ανομοιοτήτων. Όσο, μεγαλύτερη η αριθμητική τιμή τόσο μεγαλύτερη η ανομοιότητα μεταξύ του ζεύγους των αντικειμένων και τόσο πιο μακριά θα πρέπει να απεικονιστούν στον MDS χάρτη. Πίνακας 3: Πίνακας των Ευκλείδειων αποστάσεων (σε χλμ.) Αθήνα Αλεξανδρούπολη Άμφισσα Άρτα Βέροια Βόλος Γρεβενά Δράμα Αθήνα Αλεξανδρούπο λη Άμφισσα Άρτα Βέροια Βόλος Γρεβενά Δράμα Έπειτα από την υλοποίηση των κατάλληλων υπολογισμών, οι οποίοι περιγράφηκαν στην ενότητα 4.5.6, προκύπτει ο νέος δισδιάστατος χώρος των ευκλείδειων αποστάσεων στον οποίο κάθε πόλη αναπαρίσταται από ένα σημείο στο χάρτη. Στην εικόνα 17 αναπαρίστανται εποπτικά όλες οι πόλεις μεταξύ τους, με όσον το δυνατό καλύτερη ακρίβεια μεταξύ των αποστάσεων του αρχικού πίνακα δεδομένων. Μπορούμε να παρατηρήσουμε ότι οι πόλεις οι οποίες έχουν μεταξύ τους μεγάλη αριθμητική τιμή απεικονίζονται πιο μακριά στο χάρτη. Α. Σταμούλη Σελίδα 59

74 Εικόνα 17: Δισδιάστατη απεικόνιση όλων των αποστάσεων μεταξύ των πόλεων με χρήση της MDS ανάλυσης. 6.6 Μη-μετρική MDS ανάλυση Η υπόθεση ότι οι εγγύτητες είναι αποκλειστικά συνεχείς αριθμητικές τιμές ή έχουν μετρικές ιδιότητες και προσεγγίζονται από ευκλείδειες αποστάσεις μπορεί να αποβεί πολύ περιοριστική. Για να αντιμετωπιστεί μία τέτοια περίπτωση, εισήχθηκε από τους Shepard (1962) και Kruskal (1964) η μη-μετρική πολυδιάστατη κλιμάκωση. Ο σκοπός είναι η μετατροπή των εγγυτήτων σε εκτιμώμενες ευκλείδειες αποστάσεις, οι οποίες να τις αντιπροσωπεύουν με το βέλτιστο δυνατό τρόπο. Οι εγγύτητες δ ij χρησιμοποιούνται για τον υπολογισμό αντίστοιχων εκτιμώμενων αποστάσεων d ij μέσω μιας γνησίως αύξουσας συνάρτησης μετασχηματισμού f,δηλαδή d ij =f(δ ij ). Δηλαδή η f έχει την ιδιότητα εάν δ ij <δ rs τότε f(δ ij )< f(δ rs ). Η πιο κοινή προσέγγιση που χρησιμοποιείται για να προσδιοριστούν τα στοιχεία d ij και να υπολογιστούν οι συντεταγμένες των αντικειμένων x 1,x 2,x 3.x n έχοντας ως πληροφορία μόνο την αριθμητική διάταξη των αντικειμένων είναι μια επαναληπτική διαδικασία και ονομάζεται αλγόριθμος Shepard-Kruskal. Τα βήματα του αλγόριθμου αυτού είναι τα εξής: 1. Στο πρώτο βήμα επιλέγουμε τον αριθμό, έστω l, των διαστάσεων του χώρου στον οποίο θέλουμε να αναπαραστήσουμε το πλήθος Ν των αντικειμένων. Θεωρούμε ότι τα Ν αυτά αντικείμενα ορίζονται με τυχαίες συντεταγμένες Α. Σταμούλη Σελίδα 60

75 στον l -διάστατο αυτόν χώρο και ότι οι συντεταγμένες αυτές συνοψίζονται σε διανύσματα-γραμμές του πίνακα X0. Για να υπολογίσουμε τις αρχικές αυτές συντεταγμένες μπορούμε να χρησιμοποιήσουμε και τη μετρική MDS ανάλυση. Αφού έχουμε τις τυχαίες συντεταγμένες των σημείων υπολογίζουμε τις μεταξύ τους ευκλείδειες αποστάσεις dij(0. 2. Στο δεύτερο βήμα υπολογίζουμε τις ανομοιότητες d (0) ıȷ από τις αποστάσεις dij(0) με μεθόδους παλινδρόμησης μεταξύ των τιμών dij(0) (εξαρτημένη μεταβλητή) και των δij (ανεξάρτητη μεταβλητή), υπό τον περιορισμό ότι εάν δij< δrs, τότε d (0) ıȷ < d (0) rs. Για να υπολογίσουμε τις ανομοιότητες d (0) ıȷ, χρησιμοποιούμε τον αλγόριθμο PVA (pool-adjacent violators). Στο συγκεκριμένο αλγόριθμο θεωρούμε ότι (i1,j1)>(i2,j2)>.>(iκ,jκ) είναι η φθίνουσα διάταξη των ανομοιοτήτων των k=n(n-1)/2 ανά δύο αντικειμένων. Ξεκινώντας λοιπόν από τη μικρότερη τιμή δij, οι εξαρτώμενες τιμές dij(0) συγκρίνονται για κάθε δij έτσι ώστε να ελέγξουμε εάν οι τιμές dij(0) σχετίζονται μονότονα με τις τιμές δij. Όταν ανακαλυφθούν δύο συνεχόμενες τιμές dij(0) που παραβαίνουν τη μονότονη διάταξη τότε αυτές αντικαθίστανται με το μέσο όρο τους. 3. Σε αυτή τη φάση ο πίνακας Χ0 μεταβάλλεται ώστε να προκύψει ο πίνακας Χ1. Από τον νέο πίνακα X1 προκύπτουν οι νέες ευκλείδειες αποστάσεις dij(1) οι οποίες σχετίζονται καλύτερα με τις εκτιμώμενες d (0) ıȷ που προέκυψαν από το βήμα 2. Η βελτιωμένη θέση του αντικειμένου i σε σχέση με το αντικείμενο j δίνεται από τη σχέση: x new il = x il + a 1 d ıȷ x d jl x il, ij l = 1,2,.., R (21) Η παράμετρος α εδώ αποτελεί το εύρος βήματος (step width) της επαναληπτικής διαδικασίας. Η επιλογή της τιμής είναι κρίσιμη και ο Kruskal προτείνει μία αρχική τιμή της τάξης του 0.2. Επομένως, η αναλυτική σχέση που δίνει τη βελτιωμένη θέση του σημείου i σε σχέση με όλα τα υπόλοιπα είναι η ακόλουθη: N x new il = x il + a Ν 1 1 d ıȷ x d jl x il, l = 1,2,.., R (22) ij j=1,j i Α. Σταμούλη Σελίδα 61

76 Για να εκτιμήσουμε πόσο καλά προσαρμόζονται οι νέες τιμές υπολογίζεται ο παράγοντας Stress Που δίνεται από τις εξισώσεις 24 και Στο τελευταίο βήμα ελέγχουμε αν ο παράγοντας Stress δίνει καλύτερα αποτελέσματα ή όχι. Αν ναι σταματάμε την επαναληπτική διαδικασία, αν όχι επαναλαμβάνουμε τα βήματα 2 και Παράδειγμα μη-μετρικής MDS ανάλυσης Ας υποθέσουμε ότι έχουμε τον πίνακα 4 που περιλαμβάνει 4 αντικείμενα βασισμένα στο σύνολο δεδομένων από μάρκες αυτοκινήτων. Σκοπός μας είναι να βρούμε μια αναπαράσταση στο χώρο R=2 διαστάσεων χρησιμοποιώντας την MDS ανάλυση. Θεωρούμε επίσης ότι ο πίνακας 5 μας δίνει τις αρχικές συντεταγμένες των υπό εξέταση αντικειμένων που θα χρειαστούμε για το πρώτο βήμα της μη-μετρικής MDS ανάλυσης. Πίνακας 4: Πίνακας ανομοιοτήτων δij για τις ακόλουθες μάρκες αυτοκινήτων. j i Mercedes Jaguar Ferrari VW 1 Mercedes - 2 Jaguar 3-3 Ferrari VW Πίνακας 5: Αρχικές συντεταγμένες για την MDS ανάλυση, πίνακας Χ0 I Xi1 Xi2 1 Mercedes Jaguar Ferrari VW 10 4 Αφού έχουμε τις συντεταγμένες τον αντικειμένων, υπολογίζουμε το δευτερο βήμα της διαδικασίας. Στον πίνακα 6 υπολογίζονται οι αποστάσεις d i,j = (x i x j ) T (x i x j ). Α. Σταμούλη Σελίδα 62

77 Όπως παρατηρούμε από τον πίνακα 6 η σχέση που προκύπτει δεν είναι ικανοποιητική αφού η αριθμητική διάταξη των δ i,j δεν σχετίζεται μονότονα με την αριθμητική διάταξη των d i,j. Έτσι λοιπόν θα χρησιμοποιήσουμε τον αλγόριθμο PAV Πίνακας 6: Πίνακας με τις αποστάσεις di,j και την αριθμητική διάταξη αυτών I,j d i,j rank(d i,j ) δ i,j 1, , , , , , Σύμφωνα με τον αλγόριθμο PAV όταν ανακαλύψουμε δύο συνεχόμενες τιμές d ij (0) που παραβαίνουν τη μονότονη διάταξη τότε αυτές αντικαθίστανται με το μέσο όρο τους. Τα δύο πρώτα συνεχόμενα ζευγάρια τιμών που παραβαίνουν τη μονότονη διάταξη είναι τα (2,3) και (1,3). Επομένως, για να υπολογίσουμε τις ανομοιότητες d 2,3 και d 1,3 υπολογίζουμε το μέσο όρο των αποστάσεων d 2,3 και d 1,3. Έχουμε λοιπόν: d 2,3 =d 1,3 = d 2,3 +d 1,3 2 = = Ομοίως υπολογίζουμε και τις ανομοιότητες d 2,3 =d 1,3 = 7.9. Στον πίνακα 7 βλέπουμε τις προκύπτουσες ανομοιότητες και τις διαφορές που χρειάζονται για τον υπολογισμό του παράγοντα Stress που χρησιμοποιούμε στο τρίτο βήμα. Η μέση απόσταση d που χρησιμοποιείται από την εξίσωση 25 είναι d = 36.4 = 6.1. Επομένως, από τις εξισώσεις 24 και 25 και από τον 6 πίνακα 7 έχουμε Stress= (2.6/256) 1/2 =0.1 και Stress2= (2.6/36.4) 1/2 =0.27 Α. Σταμούλη Σελίδα 63

78 Πίνακας 7: Υπολογισμός παραμέτρου Stress (I,j) δ i,j d i,j d ı,ȷ (d i,j d 2 2 ı,ȷ ) d i,j (d i,j d ) 2 (2,3) (1,3) (1,2) (2,4) (1,4) (3,4) Σ Αφού υπολογίσαμε τον παράγοντα Stress, τώρα θα υπολογίσουμε και τις νέες συντεταγμένες των αντικειμένων i=3 και i=4 ώστε να φτιάξουμε το νέο πίνακα συντεταγμένων Χ 1. Οι νέες συντεταγμένες υπολογίζονται από την εξίσωση 23. Θεωρώντας α=3 θα υπολογίσουμε ενδεικτικά τα σημεία x 31 και x 32. Οι αρχικές τιμές των σημείων αυτών από τον πίνακα X0 είναι x 31 =1 και x 32 = 3. Έτσι λοιπόν έχουμε: 4 x new 31 = d 3ȷ x d j1 1 3j j=1,j 3 = (3 1) + 1 (2 1) (10 1) = = Ομοίως, x NEW 32 = Με παρόμοιο τρόπο υπολογίζουμε τα σημεία x NEW 41 x NEW 31. Έτσι δημιουργούμε τον πίνακα Χ 1 υπολογίζουμε πάλι αποστάσεις d (1) ij και τις νέες ανομοιότητες d ıȷ. Εάν ο παράγοντας Stress που προκύπτει δίνει καλύτερα αποτελέσματα συνεχίζουμε την επαναληπτική διαδικασία, εάν δεν υπάρχει διαφορά σταματάμε και κρατάμε ως σημεία στον MDS χώρο τον τελευταίο πίνακα που προέκυψε. [46] 6.7 Μέτρο αξιοπιστίας της προβολικής απεικόνισης Ο βαθμός συσχέτισης των αποστάσεων μεταξύ των σημείων που προέκυψαν στον MDS χάρτη και αυτών που εισήχθησαν στο σύστημα μέσω του πίνακα ανομοιότητας, μπορεί να εκφραστεί με ένα στατιστικό μέτρο σύγκρισης. Αυτή η συσχέτιση (23) και Α. Σταμούλη Σελίδα 64

79 επιτυγχάνεται με την κανονικοποιημένη συνάρτηση κόστους Stress, η οποία λειτουργεί ως μέτρο αξιοπιστίας της διαδικασίας, αναφορικά με την ικανότητα του αλγόριθμου να εκφράσει την αρχική δομή δεδομένων. Παρακάτω δίνονται η βασική συνάρτηση Stress που χρησιμοποιείται συνήθως και μία εναλλακτική συνάρτηση σφάλματος η Stress2 Stress = N i<j (D(i, j) d(i, j))2 N i<j(d(i, j)) 2 Stress2 = N i<j = N i<j D(i, j) g i g j N D(i, j) i<j D(i, j) g i g j N i<j (D(i, j) d) 2 (24) (25) Όπου, ο πίνακας d, είναι ο πίνακας με τις αποστάσεις μεταξύ των σημείων d(i, j) = g i g j L2 στο νέο ελαττωμένο χώρο, ενώ ο πίνακας D(I,j) συμβολίζει τα διανύσματα στον αρχικό τους χώρο. Στη συνάρτηση Stress2 η τιμή d αναπαριστά το μέσο όρο των εκτιμώμενων αποστάσεων d(i, j). Εάν η τιμή του παράγοντα Stress είναι μηδέν, σημαίνει ότι πετύχαμε την ιδανική αναπαράσταση των τιμών ανομοιότητας μεταξύ των αντικειμένων με τις αποστάσεις στο νέο χώρο που επιθυμούμε, κάτι που πρακτικά δεν συμβαίνει. Εάν η τιμή του stress είναι κάτω από 0.10, τότε μπορούμε να θεωρήσουμε ότι πετύχαμε μία μέτρια αναπαράσταση των δοσμένων τιμών ανομοιότητας, ενώ κάτω από 0.05 μια ικανοποιητική αναπαράσταση που είναι και το επιθυμητό. Όσο μικρότερη είναι η τιμή του παράγοντα Stress, τόσο αξιόπιστη είναι η αναπαράσταση. Επιπλέον, αύξηση της τιμής της παραμέτρου l έχει ως αποτέλεσμα η τιμή του δείκτη Stress να μειώνεται. Η διαπίστωση αυτή μπορεί να χρησιμοποιηθεί για την επιλογή της βέλτιστης αναπαράστασης. Εκτός από την τιμή του stress, έχουν αναπτυχθεί και δύο παράλληλα χρησιμοποιούμενες επιπρόσθετες τεχνικές για να εξεταστεί καλύτερα το κατά πόσον η λύση που βρέθηκε είναι επαρκής. Αυτές αναφορικά είναι: Το scree plot Το scatter (ή Shepard) diagram Το scree plot ουσιαστικά συγκρίνει τις τιμές της κανονικοποιημένης συνάρτησης του κόστους για κάθε επιλεγόμενο αριθμό διαστάσεων. Στο scree plot απεικονίζεται η (φθίνουσα) μεταβολή στην τιμή που λαμβάνει το κόστος σε σχέση με τον αριθμό των διαστάσεων που επιλέγεται. Εφόσον το κόστος μειώνεται μονότονα καθώς ο αριθμός των διαστάσεων αυξάνεται, είναι λογικό να ψάξουμε στο διάγραμμα τον ελάχιστο Α. Σταμούλη Σελίδα 65

80 αριθμό διαστάσεων με αντίστοιχα ικανοποιητική τιμή του κόστους. Κατόπι θα πρέπει να αναζητήσουμε σε ένα τέτοιο γράφημα μεταξύ ποιων διαστάσεων πετυχαίνουμε τη σχετικά μεγάλη πτώση της τιμής του κόστους και να υιοθετήσουμε τον αντίστοιχο αριθμό διαστάσεων. Όταν η γραμμή ομαλοποιείται σημαίνει ότι η υιοθέτηση περισσότερων διαστάσεων στο γράφημα αναπαράστασης δε θα απόφερε σημαντική μείωση του κόστους. Το scatter (ή Shepard) diagram απεικονίζει το σύνολο των σημείων που έχουν ως τετμημένες όλες τις ανά δύο εγγύτητες του πίνακα και ως τεταγμένες τις αντίστοιχες αποστάσεις των αντικειμένων στο γράφημα. Παρατηρείται δηλαδή γραφικά το κατά πόσο ικανοποιητική είναι η σχέση που συνδέει τις αρχικές εγγύτητες των αντικειμένων με τις τελικές αποστάσεις που τους αποδίδονται στη ζητούμενη αναπαράσταση του εικονικού τους χώρου. Αν η ανάλυση είναι καλή τότε το νέφος των σημείων θα έχει μια ροπή από νοτιοδυτικά προς βορειοανατολικά και οι εγγύτητες θα είναι ισχυρά θετικά συσχετισμένες. Όταν έχουμε μη- μετρική πολυδιάστατη κλιμάκωση, μία καλή ανάλυση προϋποθέτει τα σημεία να μην βρίσκονται μακριά και να μην απλώνονται σε μεγάλη έκταση πέρα από τη γραφική παράσταση της συνάρτησης f που έχουμε ορίσει για το συγκεκριμένο πρόβλημα. Στην εικόνα 18 βλέπουμε ένα παράδειγμα scree plot και Shepard diagram. Εικόνα 18: Scree plot και Shepard diagram. Από το scree plot βλέπουμε πως η καλύτερη επιλογή θα ήταν ένα γράφημα 6 διαστάσεων. Στο scatter diagram, απεικονίζεται το νέφος των σημείων και ταυτόχρονα η γραφική παράσταση της μονότονης συνάρτησης μετασχηματισμού. Α. Σταμούλη Σελίδα 66

81 6.8 Αποφάσεις που πρέπει να πάρουμε πριν την εφαρμογή του αλγορίθμου Η τεχνική MDS συχνά προϋποθέτει σχετική εμπειρία από μέρους του ερευνητή. Σε αντίθεση με άλλες στατιστικές μεθόδους, το αποτέλεσμα της MDS ανάλυσης, εξαρτάται από τις αποφάσεις που θα πάρουμε πριν την εφαρμογή του. Στο στάδιο συλλογής δεδομένων, έχει μεγάλη σημασία εάν τα δεδομένα εγγύτητας που θα επιλέξουμε θα είναι ομοιότητες ή ανομοιότητες και αν ο πίνακας εγγύτητας θα είναι συμμετρικός ή όχι. Το αποτέλεσμα θα είναι διαφορετικό, γι' αυτό πρέπει να είμαστε σίγουροι για το τι ζητάμε Είναι σημαντικό επίσης να γνωρίζουμε τον τρόπο συλλογής των δεδομένων, δηλαδή εάν θα χρησιμοποιήσουμε άμεση ή έμμεση μέθοδο. Συνέχοντας, αποφάσεις πρέπει επίσης να ληφθούν μεταξύ μετρικής ή μη μετρικής ανάλυσης. Η επιλογή του κατάλληλου μέτρου απόστασης είναι σημαντική. Η ευκλείδεια απόσταση προτιμάται όταν ο βασικός στόχος είναι η οπτικοποίηση των αρχικών αντικειμένων, ενώ ένα άλλο μέτρο επιλέγεται όταν μας ενδιαφέρει περισσότερο η έρευνα συγκεκριμένων υποθέσεων. Επιπλέον, η διάσταση της απεικόνισης επηρεάζει δραστικά το αποτέλεσμα. χρήστης, αλλά Τη διάσταση της τελικής αναπαράστασης, την επιλέγει ο η επιλογή αυτή μπορεί να γίνει ευκολότερη με τη χρήση κάποιων κριτηρίων. Ο αριθμός των αντικειμένων (δεδομένων) που θέλουμε να απεικονιστούν σχετίζεται με τη διάσταση. Πιο συγκεκριμένα, για μια αναπαράσταση στον Κ-διάστατο χώρο, απαιτούνται τουλάχιστον 4Κ δεδομένα. Αυτό σημαίνει ότι για απεικόνιση στον 2- διάστατο χώρο, χρειάζονται τουλάχιστον 8 δεδομένα. Τέλος, είναι σημαντικό να επιλέξουμε τον κατάλληλο αλγόριθμο για την υλοποίηση της MDS τεχνικής. Η επιλογή αυτή γίνεται από το χρήστη σύμφωνα με τις ανάγκες του πειράματος του, εάν και οι περισσότερες παράμετροι προεπιλέγονται αυτόματα από αντίστοιχα λογισμικά. [36] Α. Σταμούλη Σελίδα 67

82 7.1 Εισαγωγή Στο παρόν κεφάλαιο θα περιγράψουμε την θεωρία των μηχανών διανυσμάτων υποστήριξης, οι οποίες μπορούν να χρησιμοποιηθούν ως επέκταση των πειραμάτων μας. Οι τεχνικές αυτές μπορούν να χρησιμοποιηθούν μετά τη χρήση της πολυδιάστατης κλιμάκωσης. Τα πρότυπα τα οποία εξάγαμε από τη μέθοδο MDS μπορούμε να τα χρησιμοποιήσουμε για να εκπαιδεύσουμε το βιομετρικό μας σύστημα. Αυτό θα γίνει με τη χρήση των κατάλληλων μηχανών διανυσμάτων υποστήριξης, οι οποίες θα λάβουν ως είσοδο τα πρότυπα αυτά (δηλαδή τις g i πολυδιάστατες αναπαραστάσεις) και θα υπολογίσουν την κατάλληλη συνάρτηση απόφασης για το βέλτιστο διαχωρισμό των δεδομένων ανά χρήστη. Στην ενότητα αυτή θα περιγράψουμε θεωρητικά τις μηχανές διανυσμάτων υποστήριξης ή όπως είναι ευρέως γνωστές τις τεχνικές Support Vector Machines. Οι τεχνικές Support Vector Machines [37,38] είναι ένα σύνολο μεθόδων μάθησης με επίβλεψη και χρησιμοποιούνται ευρύτατα σε προβλήματα διαχωρισμού προτύπων παρουσιάζοντας υψηλή απόδοση σε χώρους δεδομένων υψηλής διάστασης. Στόχος τους είναι η κατασκευή ενός υπερεπιπέδου σε ένα πολυδιάστατο χώρο χαρακτηριστικών ώστε να επιτευχθεί ο βέλτιστος διαχωρισμός των δεδομένων εκπαίδευσης. Στην απλή περίπτωση των δύο διαστάσεων ο αλγόριθμος θα προσπαθήσει να βρει το βέλτιστο υπερεπίπεδο μία διάστασης, δηλαδή μία γραμμή. Πρόκειται λοιπόν για ένα δυαδικό πρόβλημα αφού η ταξινόμηση των δεδομένων γίνεται σε δύο κατηγορίες. Οι τεχνικές SVM παρουσιάζουν δύο σημαντικά πλεονεκτήματα. Το πρώτο είναι η επίλυση προβλημάτων μάθησης που δεν μπορούν να αντιμετωπιστούν από γραμμικά μοντέλα, αφού μπορούν να παράγουν και μη γραμμικές επιφάνειες απόφασης και δεύτερον μπορούν να προβάλλουν τα δεδομένα σε χώρους υψηλότερων διαστάσεων, όπου οι τιμές των μεταβλητών αντικαθίστανται από μη γραμμικούς συνδυασμούς τους. Η δεύτερη αυτή ιδιότητα επιτρέπει την ομαδοποίηση των δεδομένων με πολύ μεγαλύτερη ακρίβεια, αφού είναι σε θέση να αναδείξει συσχετίσεις μεταξύ των δεδομένων που οι κλασσικές μέθοδοι μηχανικής μάθησης πρακτικά αδυνατούν να εντοπίσουν. Α. Σταμούλη Σελίδα 68

83 Το βασικό μειονέκτημα τους είναι ο τρόπος με τον οποίο γίνεται η εκπαίδευση. Γιατί όταν τελειώσει η εκπαίδευση του συστήματος, αν υποθέσουμε ότι παρουσιάζεται ένα καινούργιο σύνολο δεδομένων, για να προστεθεί η νέα αυτή πληροφορία πρέπει να εκπαιδεύσουμε το σύστημα από την αρχή. Αυτό έχει σαν αποτέλεσμα σημαντική αύξηση του υπολογιστικού κόστους. Στις επόμενες παραγράφους αναλύουμε θεωρητικά την SVM μέθοδο ξεκινώντας από τα γραμμικά συστήματα μεταξύ δύο κλάσεων, για καλύτερη κατανόηση. 7.2 Βέλτιστα υπερεπίπεδα για διαχωρισμό γραμμικά διαχωρίσιμων προτύπων Ξεκινάμε με την απλούστερη περίπτωση, όπου τα δεδομένα του συνόλου εκπαίδευσης είναι γραμμικά διαχωρίσιμα. Στην περίπτωση λοιπόν αυτή οι γραμμικοί διαχωριστές αποσκοπούν στην επίλυση του προβλήματος ταξινόμησης δύο κλάσεων εντοπίζοντας το βέλτιστο διαχωριστικό υπερεπίπεδο. Έστω λοιπόν ένα δυαδικό πρόβλημα και ένα σύνολο {x i, d i } N i=1, όπου η μεταβλητή d i δείχνει την κλάση του διανύσματος εισόδου x i. Έστω, επίσης, m η διάσταση του χώρου εισόδου. Επειδή το πρόβλημα είναι δυαδικό, κάθε διάνυσμα εισόδου μπορεί να ανήκει μόνο σε μια από τις δύο κατηγορίες (κλάσεις), με την πρώτη να συμβολίζεται με d i =+1 και την δεύτερη με d i =-1, δηλαδή d i ԑ{-1,1}. Ο σκοπός είναι η εύρεση ενός υπερεπιπέδου (δηλαδή μία συνάρτησης) που να χωρίζει το σύνολο αυτό κατά τέτοιον τρόπο ώστε τα διανύσματα ίδιας κατηγορίας να αφήνονται στην ίδια πλευρά του. Η εξίσωση ενός τέτοιου υπερεπιπέδου έχει την μορφή: w x + b = 0, όπου είναι το εσωτερικό γινόμενο άρα w x = w T x (26) Όπου x είναι ένα διάνυσμα εισόδου, w ένα ρυθμιζόμενο διάνυσμα βάρους, το οποίο είναι κάθετο στο υπερεπίπεδο και b είναι μία πόλωση. Για την σωστή ταξινόμηση των προτύπων εισόδου, πρέπει το διάνυσμα των βαρών w και το b να προσδιοριστούν έτσι ώστε για κάθε διάνυσμα εισόδου που δεν ανήκει απαραίτητα στο σύνολο εκπαίδευσης, να ικανοποιείται η σχέση: d i (w i x i + b) > 0, i = 1,2, N (27) Για ένα δεδομένο διάνυσμα βάρους w και μία πόλωση b, η απόσταση μεταξύ του υπερεπιπέδου που καθορίζεται στην Εξ. 26 και του πλησιέστερου (θετικού/αρνητικού) σημείου δεδομένων ονομάζεται διαχωριστική απόσταση και δηλώνεται με ρ. Στόχος Α. Σταμούλη Σελίδα 69

84 του SVM είναι να εντοπίσει το συγκεκριμένο υπερεπίπεδο για το οποίο το διαχωριστικό όριο ρ μεγιστοποιείται. Υπό αυτήν τη συνθήκη το υπερεπίπεδο αναφέρεται ως το βέλτιστο υπερεπίπεδο (optimal Hyperplane). Αν w 0 και b 0 είναι οι βέλτιστες τιμές για το διάνυσμα των βαρών και της πόλωσης, τότε το βέλτιστο υπερεπίπεδο περιγράφεται από την σχέση: w 0 x+b 0 = 0 (28) Το ζητούμενο λοιπόν είναι να βρεθούν οι παράμετροι w 0 και b 0 για το βέλτιστο υπερεπίπεδο του συνόλου εκπαίδευσης {x i, d i } N i=1. Για να βρεθεί το βέλτιστο υπερεπίπεδο οι παράμετροι (w 0,b 0 ) πρέπει να ικανοποιούν τον περιορισμό: d i (w x + b) 1, i = 1,2, N (29) Όταν η εξίσωση 27 ισχύει, τότε τα πρότυπα είναι γραμμικά διαχωρίσιμα και οι τιμές τόσο του w 0, όσο και του b 0, μπορούν να μεταβληθούν ώστε να ισχύει η 29. Η μεταβολή αυτή δεν επηρεάζει την εξίσωση 28 που περιγράφει το βέλτιστο υπερεπίπεδο. Τα δεδομένα {x i,d i } για τα οποία η 29 ισχύει σαν ισότητα ονομάζονται «Διανύσματα Στήριξης» (Support Vectors) και από αυτά προκύπτει το όνομα Support Vector Machine. Τα διανύσματα αυτά παίζουν τον πιο σημαντικό ρόλο, μιας και είναι αυτά που βρίσκονται πιο κοντά στο επίπεδο απόφασης και άρα και δυσκολότερο να ταξινομηθούν. Προφανώς, η μετακίνησή τους αλλάζει την λύση του προβλήματος, αφού οδηγεί σε άλλο βέλτιστο υπερεπίπεδο. Αν γ + (γ - ) η ελάχιστη απόσταση μεταξύ του κοντινότερου θετικού (αρνητικού) δεδομένου, τότε αφού αυτά τα δεδομένα βρίσκονται στα υπερεπίπεδα w 0 x+b 0 = ±1, θα είναι γ + = γ = 1. Άρα το να βρεθεί το βέλτιστο υπερεπίπεδο w συνεπάγεται την ελαχιστοποίηση της ευκλείδειας νόρμας του w στην πραγματικότητα της συνάρτησης 1 2 w 2. Εάν ρ είναι η βέλτιστη τιμή του διαχωριστικού ορίου μεταξύ δύο κλάσεων τότε ρ= 2 w ονομάζεται «απόσταση διαχωρισμού» και προφανώς το βέλτιστο υπερεπίπεδο είναι εκείνο που μεγιστοποιεί την απόσταση αυτή και αυτό προσπαθεί να κάνει ο αλγόριθμος βελτιστοποίησης που χρησιμοποιείται. Είναι επίσης προφανές ότι όσο μεγαλύτερη είναι η απόσταση διαχωρισμού, τόσο μεγαλύτερη είναι η ικανότητα για γενίκευση. [37] Στην παρακάτω εικόνα φαίνεται η υλοποίηση της μεθόδου βέλτιστου υπερεπιπέδου για γραμμικά διαχωρίσιμα πρότυπα. Α. Σταμούλη Σελίδα 70

85 Εικόνα 19: Βέλτιστο υπερεπίπεδο για γραμμικά διαχωρίσιμα πρότυπα. Ωστόσο, σπάνια στην πράξη συναντάμε εφαρμογές όπου τα δεδομένα εισόδου είναι γραμμικώς διαχωρίσιμα. Στην περίπτωση που δίνεται ένα μη γραμμικά διαχωρίσιμο σύνολο εκμάθησης, δεν είναι δυνατόν να κατασκευαστεί κάποιο υπερεπίπεδο που να μην κάνει λάθη. Έτσι, σκοπός είναι να κατασκευαστεί το υπερεπίπεδο που ελαχιστοποιεί την πιθανότητα λάθους. Η απόσταση διαχωρισμού λέγεται χαλαρή αν υπάρχει κάποιο διάνυσμα στο σύνολο εκμάθησης που να παραβιάζει την γνωστή συνθήκη (εξίσωση 29). Με βάση τον τρόπο που περιγράφηκε πιο πάνω, υπάρχουν δύο τρόποι για να παραβιάζεται η παραπάνω συνθήκη: Το διάνυσμα (x i,d i ) να βρίσκεται στην σωστή μεριά αλλά μέσα στην περιοχή διαχωρισμού. Αυτό δεν σημαίνει ότι έχουμε λάθος κατάταξη. Το διάνυσμα (x i,d i ) να βρίσκεται στην λάθος πλευρά του επίπεδου απόφασης.[37] Α. Σταμούλη Σελίδα 71

86 Εικόνα 20: Στην περίπτωση αυτή, ένα σημείο xi, πέφτει στην περιοχή του διαχωρισμού, αλλά στην σωστή πλευρά του επιπέδου απόφασης ενώ στη δεύτερη περίπτωση το σημείο πέφτει στην λάθος πλευρά του επιπέδου απόφασης. Για το σκοπό αυτό ορίζουμε τις ψευδομεταβλητές ξ N i=1 και έτσι η σχέση 29 γίνεται: d i (w x + b) 1 ξ i, i = 1,2, N, ξ i > 0 (30) Και η συνάρτηση προς ελαχιστοποίηση γίνεται: 1 N 2 w 2 + C ξ i i=1 Οι μεταβλητές ξ i μετράνε την απόσταση ενός σημείου από την ιδανική περίπτωση. Για 0<ξ i <1, το σημείο πέφτει μέσα στην περιοχή διαχωρισμού, αλλά στην σωστή πλευρά, ενώ για ξ i >1 πέφτει στην λάθος πλευρά του υπερεπιπέδου. Στην περίπτωση αυτή, τα διανύσματα στήριξης είναι αυτά που ικανοποιούν την εξίσωση 30 ως ισότητα, ακόμα και για μη μηδενική τιμή του ξ i. [37] Η παράμετρος C επιλέγεται από το χρήστη για τη φάση εκπαίδευσης. Μια μικρή τιμή της παραμέτρου αναγκάζει τον αλγόριθμο για την εύρεση του υπερεπιπέδου με βέλτιστο εύρος να μεγιστοποιήσει την απόσταση 1 w (31), δηλαδή το εύρος αδιαφορώντας για σφάλματα εκπαίδευσης. Αντίθετα, μία μεγάλη τιμή της παραμέτρου προκαλεί την τάση για ελαχιστοποίηση του εμπειρικού σφάλματος, εις βάρος βέβαια της μεγιστοποίησης του εύρους. [37] Στις δύο προηγούμενες περιπτώσεις που εξετάσαμε, γραμμικά διαχωρίσιμα και γραμμικά μη διαχωρίσιμα δεδομένα, στο τέλος έχουμε να αντιμετωπίσουμε ένα πρόβλημα ελαχιστοποίησης συνάρτησης, συνοδευόμενο από μία σειρά περιορισμών. Για την επίλυση αυτού του προβλήματος απαιτείται να εργαστούμε με διανύσματα μεγάλης διάστασης. Προκειμένου να αποφύγουμε αυτούς τους χρονοβόρους υπολογισμούς, θα Α. Σταμούλη Σελίδα 72

87 χρησιμοποιήσουμε τη θεωρία Lagrange για να απλοποιήσουμε το πρόβλημα βελτιστοποίησης. Σύμφωνα με τη θεωρία Lagrange πολλαπλασιάζουμε την κάθε ανισότητα με έναν μη αρνητικό πολλαπλασιαστή a i, και στη συνέχεια την αφαιρούμε από τη συνάρτηση κόστους. Από την εφαρμογή λοιπόν του κανόνα για την περίπτωση των μη γραμμικά διαχωρίσιμων δεδομένων, οδηγούμαστε στη ελαχιστοποίηση της ακόλουθης συνάρτησης κόστους: L = 1 2 w 2 + a i d i (w x i + b) + a i (32) Οι περιοριστικές συνθήκες είναι a i 0. Θέλουμε τώρα την παραπάνω σχέση να την ελαχιστοποιήσουμε ως προς w και b, απαιτώντας συγχρόνως να απαλείφονται τα a i με μηδενισμό των μερικών πρώτων παραγώγων. Επειδή όμως για λόγους απλοποίησης θέλουμε να εργαστούμε με τους πολλαπλασιαστές a i θα λύσουμε το δυαδικό πρόβλημα του προηγούμενου. Δηλαδή, θα μεγιστοποιήσουμε τη σχέση 32 ως προς a i απαιτώντας την απαλοιφή των w,b με μηδενισμό των μερικών πρώτων παραγώγων, τηρώντας όμως τους περιορισμούς a i 0. Από τον μηδενισμό της παραγώγου της L μια φορά ως προς w και μια ως προς b προκύπτουν οι παρακάτω σχέσεις: w = a i d i x i (33) a i d i = 0 (34) Αντικαθιστώντας τις εξισώσεις 33 και 34 στην εξίσωση 32 και λαμβάνοντας υπόψη όλα τις περιοριστικές συνθήκες, καταλήγουμε στην μεγιστοποίηση της συνάρτησης: L D = 1 2 a i d i a j d j x i x j + a i (35) Με περιορισμούς: α ι 0, a i d i = 0 (36) Οι σχέσεις 35 και 36 περιγράφουν το προς βελτιστοποίηση πρόβλημα στην επίλυση του οποίου στοχεύει η μεθοδολογία SVM για την περίπτωση των γραμμικά διαχωρίσιμων δεδομένων. Το πρόβλημα αυτό ονομάζεται δυϊκό του προβλήματος βελτιστοποίησης και έχει να κάνει μόνο με το σύνολο εκμάθησης και όχι με το διάνυσμα βάρος w ή την πόλωση b. Αφού βρεθούν οι πολλαπλασιαστές Lagrange, που συμβολίζονται a 0,I, το βέλτιστο διάνυσμα βάρους w 0 και η βέλτιστη πόλωση b 0 δίνονται από τις παρακάτω σχέσεις: Α. Σταμούλη Σελίδα 73

88 N w 0 = a 0i d i x i (37) i=1 b 0 = 1 w 0 x (s), θεωρώντας d (s) = +1 (38) Πρέπει να τονίσουμε στο συγκεκριμένο σημείο ότι υπάρχει ένας πολλαπλασιαστής Lagrange για κάθε σημείο εκμάθησης (x i,d i ). Τα διανύσματα στα οποία ο αντίστοιχος πολλαπλασιαστής Lagrange a i είναι θετικός αντιστοιχούν στα διανύσματα στήριξης. Για τα άλλα διανύσματα εκμάθησης a i =0. Αν οποιοδήποτε από τα διανύσματα εκμάθησης εκτός των διανυσμάτων στήριξης μετακινηθεί, παραμένοντας όμως στη σωστή πλευρά του υπερεπιπέδου διαχωρισμού, ή αφαιρεθεί τελείως, ο αλγόριθμος θα καταλήξει ακριβώς στο ίδιο βέλτιστο υπερεπίπεδο. Όμως όπως ήδη τονίσαμε μεγαλύτερο ενδιαφέρον υπάρχει για την περίπτωση των μη γραμμικά διαχωρίσιμων δεδομένων. Εφαρμόζοντας πάλι τη θεωρία Lagrange στις εξισώσεις 30 και 31 καταλήγουμε στην μεγιστοποίηση της συνάρτησης: L D = 1 2 a i d i a j d j x i x j + a i (39) Με περιορισμούς: 0 α ι C, a i d i = 0 (40) Παρατηρούμε ότι στο δυϊκό πρόβλημα δεν εμφανίζονται πουθενά οι μεταβλητές ξ i και ότι ο δεύτερος περιορισμός είναι στην περίπτωση αυτή πιο αυστηρός, καθώς οι a i έχουν το C σαν άνω φράγμα. Στην περίπτωση αυτή η βέλτιστη λύση για το διάνυσμα βάρους w 0 και η βέλτιστη πόλωση b 0 δίνονται από τις παρακάτω σχέσεις: n w 0 = a 0i d i x i, n: ο αριθμός των διανυσμάτων στήριξης (41) i=1 b 0 = α ι [d i (w x i + b) 1 + ξ i ] = 0, μ ι ξ ι = 0 για i = 1,2,, N (42) Όπου μ i πολλαπλασιαστές Lagrange που εισάγονται για να εξασφαλίσουν ότι οι ψευδομεταβλητές ξ i είναι μη αρνητικές. Να τονίσουμε στο σημείο αυτό ότι οι αλγόριθμοι που βασίζονται στη θεωρία των ψευδοματαβλητών ονομάζονται Soft Margin SVM 51,52] αντίθετα οι αλγόριθμοι που διαχωρίζονται τα δεδομένα ως αυστηρώς γραμμικά διαχωρίσιμα ονομάζονται Hard Margin SVM. [37, 38] Α. Σταμούλη Σελίδα 74

89 7.3 Ταξινόμηση δεδομένων Μετά την εκπαίδευση του συστήματος κάθε ελεγχόμενο στοιχείο καθορίζεται σε ποια πλευρά του ορίου απόφασης (δηλαδή του υπερεπιπέδου) βρίσκεται και ταξινομείται στην κλάση εκείνη σύμφωνα με τον υπολογισμό της παρακάτω σχέσης 43. Δηλαδή το άγνωστο x θα ανήκει απλά στη θετική κατηγορία αν f(x)>0. n f(x) = a 0,i d i x i x + b > 0, n: ο αριθμός των διανυσμάτων στήριξης (43) i=1 7.4 Βέλτιστα υπερεπίπεδα για διαχωρισμό μη γραμμικά διαχωρίσιμων προτύπων Ο γραμμικός διαχωρισμός τον οποίο εξετάσαμε, ενδεχομένως να μην είναι ο καταλληλότερος για τα δεδομένα μας. Υπάρχουν λοιπόν περιπτώσεις όπου η συνάρτηση απόφασης μπορεί να είναι μια μη γραμμική υπερεπιφάνεια η οποία είναι μη γραμμική όπως στην εικόνα 21. Εικόνα 21: Μη γραμμικός διαχωρισμός δεδομένων. Ένα από τα βασικότερα πλεονεκτήματα των SVΜs είναι η ιδιότητα ότι τα πρότυπα που δεν είναι γραμμικά διαχωρίσιμα στον χώρο εισόδου, μπορεί να είναι γραμμικά διαχωρίσιμα σε έναν άλλο χώρο διαφορετικής διάστασης, με έναν μη γραμμικό μετασχηματισμό. Στον χώρο αυτό θα κατασκευαστεί ένα υπερεπίπεδο διαχωρισμού, το οποίο θα διαχωρίσει τις εικόνες πια των προτύπων. Το υπερεπίπεδο αυτό θα είναι μια Α. Σταμούλη Σελίδα 75

90 γραμμική συνάρτηση όχι πια των προτύπων, αλλά των εικόνων τους στον νέο χώρο. Ο χώρος μεγαλύτερης διάστασης λέγεται χώρος χαρακτηριστικών. Εικόνα 22: Απεικόνιση των δεδομένων εισόδου σε νέο χώρο μέσω της συνάρτησης Φ. Εργαζόμαστε ακριβώς όπως στην γραμμική περίπτωση με τη μόνη διαφορά ότι αντί για το διάνυσμα εισόδου χρησιμοποιούμε σε όλες τις παραπάνω σχέσεις το διάνυσμα F(x i ). Ακολουθώντας λοιπόν την ίδια πορεία, οδηγούμαστε για την περίπτωση των μη γραμμικών SVM στην μεγιστοποίηση της συνάρτησης: L D = 1 2 a i d i a j d j Φ(x i ) Φ(x j ) + a i (44) Με περιορισμούς: 0 α ι C, a i d i = 0 (45) Παρατηρούμε λοιπόν ότι η μορφή του προβλήματος βελτιστοποίησης είναι ίδια με πριν με την διαφορά ότι αντί για το εσωτερικό γινόμενο x i x j, πρέπει τώρα να υπολογίσουμε το γινόμενο Φ(x i ) Φ(x j ). Η συγκεκριμένη μορφή μας ωθεί στο να χρησιμοποιήσουμε αντί του παραπάνω εσωτερικού γινομένου μία συνάρτηση πυρήνα (Kernel) K(x i,x j ), με την προϋπόθεση ότι ο πυρήνας αυτός να ικανοποιεί το θεώρημα Mercer, τέτοια ώστε: Κ x i, x j = Φ(x i ) Φ(x j ) (46) Με τη συγκεκριμένη αντικατάσταση δεν ενδιαφερόμαστε πλέον για την επιλογή της απεικόνισης Φ, μιας και αυτή δεν δηλώνεται πλέον πουθενά στην επίλυση του προβλήματος. Το πρόβλημα αυτό είναι ακριβώς το ίδιο όπως και στην περίπτωση των μη γραμμικά διαχωρίσιμων προβλημάτων, με μόνη διαφορά ότι το εσωτερικό γινόμενο x i xj έχει αντικατασταθεί από τον πυρήνα Κ(x i,xj). Δηλαδή η συνάρτηση μεγιστοποίησης είναι: Α. Σταμούλη Σελίδα 76

91 L D = 1 2 a i d i a j d j Κ x i, x j + a i (47) Οι περιορισμοί είναι αυτοί της εξίσωσης 45. Στην περίπτωση αυτή η βέλτιστη λύση για το διάνυσμα βάρους w δίνεται από τη σχέση 48 ενώ η πόλωση είναι το πρώτο στοιχειό του διανύσματος w 0 : n W 0 = a 0,i d i φ(x i ) (48) i=1 Επιλύοντας την 47 με τους περιορισμούς της εξίσωσης 45 καθορίζονται οι πολλαπλασιαστές Langrange και ο ταξινομητής που στο χώρο χαρακτηριστικών δίνεται από την σχέση: n f(x) = a 0,i d i Κ(s i, x) + b > 0, i=1 n: ο αριθμός των διανυσμάτων στήριξης και s i τα διανύσματα στήριξης Με τη χρήση της κατάλληλης συνάρτησης πυρήνα μειώνουμε την υπολογιστική πολυπλοκότητα, αφού δεν απαιτείται πλέον η μεταφορά των δεδομένων σε χώρο μεγαλύτερης διάστασης και μετά ο υπολογισμός των εσωτερικών γινομένων. Για τον λόγο αυτό, μοναδικός μας στόχος είναι η κατάλληλη επιλογή του πυρήνα K. Οι πιο γνωστοί πυρήνες είναι οι ακόλουθοι. Στην παρούσα εργασία χρησιμοποιούνται πολυωνυμικές μηχανές μάθησης με d=4. [37, 38] Πίνακας 8: Συναρτήσεις Kernel (49) Τύπος του SVM δικτύου Γκαουσιανή μηχανή μάθησης (RBF) Πυρήνας Εσωτερικού Γινομένου Κ(x i,x j ) e y i x i y i 2 Παρατηρήσεις Πολυωνυμική μηχανή μάθησης (x i x j + 1) d Η δύναμη d καθορίζεται από τον χρήστη εκ των προτέρων Σιγμοειδής μηχανή μάθησης K(x, y) = tanh (γ x i x j + δ) Το θεώρημα Mercer δεν ικανοποιείται για όλες τις τιμές των γ και δ Α. Σταμούλη Σελίδα 77

92 7.5 Μέθοδοι ταξινομητών SVM πολλών κλάσεων Για την περίπτωση προβλημάτων ταξινόμησης με περισσότερες κατηγορίες υπάρχουν δύο βασικές προσεγγίσεις : η One Versus All και η One Versus One. Εμείς χρησιμοποιούμε την One Versus All. Στην προσέγγιση One Versus All για ένα πρόβλημα ταξινόμησης L κατηγοριών εκπαιδεύονται L SVMs. Κάθε SVM διαχωρίζει μια κατηγορία από τις υπόλοιπες. Η ταξινόμηση ενός νέου δείγματος, είναι απόφαση του ταξινομητή που δίνει τη μεγαλύτερη τιμή σαν έξοδο. Στην προσέγγιση One Versus One για ένα αντίστοιχο πρόβλημα ταξινόμησης L κατηγοριών εκπαιδεύονται L (L 1) 2 SVMs. Κάθε SVM διαχωρίζει ένα ζεύγος κατηγοριών. Για την ταξινόμηση ενός νέου δείγματος γίνεται σύγκριση κάθε κατηγορίας με καθεμία από τις υπόλοιπες L-1 ξεχωριστά. Για κάθε σύγκριση η επικρατούσα κατηγορία παίρνει μια ψήφο και το δείγμα ταξινομείται στην κατηγορία που έχει συγκεντρώσει τις περισσότερες ψήφους [39]. 7.6 Μέθοδοι για έλεγχο της αξιοπιστίας της κατηγοριοποίησης Για να υπολογιστεί η αξιοπιστία του συστήματος επαλήθευσης που δημιουργήθηκε στην εργασία αυτή, είναι σκόπιμο να χρησιμοποιηθεί μια μέθοδος που θα δείχνει πόσο ακριβής είναι ένας ταξινομητής. Τα αποτελέσματα που λαμβάνουμε από τις μεθόδους αυτές τα χρησιμοποιούμε για να υπολογίσουμε τους δείκτες απόδοσης των βιομετρικών συστημάτων τους οποίους και αναλύσαμε στην ενότητα 2.4. Για τον λόγο αυτό οι συγκεκριμένοι μέθοδοι χρησιμοποιούνται για τον έλεγχο της αξιοπιστίας της κατηγοριοποίησης. Εμείς θα περιγράψουμε μόνο τις δύο μεθόδους τις οποίες χρησιμοποιήσαμε στην εργασία. Οι μέθοδοι αυτοί δεν χρησιμοποιούνται μόνο στη περίπτωση των ταξινομητών SVM αλλά και για οποιαδήποτε μέθοδο ταξινόμησης Μέθοδος holdout (train set-test set) Η μέθοδος holdout [40] εκτιμά το σφάλμα διαχωρίζοντας το σύνολο δεδομένων σε δύο ανεξάρτητα σύνολα, ένα σύνολο δεδομένων εκπαίδευσης (Training set), και ένα σύνολο δεδομένων ελέγχου (Test set). Κρατά ένα μέρος για δοκιμές ελέγχου, δηλαδή εκτίμηση του σφάλματος ταξινομητή και χρησιμοποιεί τα υπόλοιπα δεδομένα για Α. Σταμούλη Σελίδα 78

93 εκπαίδευση για να καθορίσουν έτσι το μοντέλο, και τις ελεύθερες παραμέτρους του. Μερικές φορές αυτή η μέθοδος είναι η μόνη πρακτική προσέγγιση στο πρόβλημα. Στην πράξη συνηθίζεται να κρατά το 1/3 για έλεγχο και να χρησιμοποιεί τα 2/3 για εκπαίδευση. Φυσικά, μπορεί να είμαστε άτυχοι και τα δείγματα που έχουμε για εκπαίδευση (ή έλεγχο) να μην είναι αντιπροσωπευτικά. Γενικά, δεν μπορούμε να καθορίσουμε αν το δείγμα είναι αντιπροσωπευτικό ή όχι αλλά υπάρχει ένας έλεγχος: κάθε μια από τις κλάσεις στο πλήρες σύνολο πρέπει να αναπαρίσταται με περίπου την σωστή αναλογία στα υποσύνολα. Πράγματι, πρέπει να εξασφαλίσουμε ότι η τυχαία δειγματοληψία κατά το διαχωρισμό σε δύο υποσύνολα γίνεται με τέτοιο τρόπο ώστε να εγγυάται ότι κάθε κλάση αναπαρίσταται κατάλληλα και στο σύνολο εκπαίδευσης και στο σύνολο ελέγχου. Η διαδικασία αυτή που καλείται stratification παρέχει σε κάποιο βαθμό μία ομαλή εκπροσώπηση κλάσεων στα σύνολα εκπαίδευσης ή ελέγχου. Το stratified Sampling είναι χρήσιμο όταν υπάρχουν μεγάλες διαφορές στη συχνότητα εμφάνισης κάθε κλάσης. Η βασική ιδέα του stratification είναι απλή: ο αρχικός πληθυσμός διαμερίζεται σε υποσύνολα που λέγονται strata, χρησιμοποιώντας τις τιμές κάποιου γνωρίσματος ή ομάδας γνωρισμάτων. Ένα τυχαίο δείγμα επιλέγεται έπειτα από κάθε stratum Οι μέθοδοι Cross Validation Η μέθοδος holdout μπορεί να έχει δύο μειονεκτήματα [40]. Πρώτον σε προβλήματα όπου υπάρχει ένα αραιό σύνολο δεδομένων (sparse data set) μπορεί να μην είμαστε σε θέση να αντέξουμε την "πολυτέλεια" του παραμερισμού μιας μερίδας του συνόλου δεδομένων. Το δεύτερο είναι ότι αφού αποτελεί ένα ενιαίο πείραμα εκπαίδευσης-και-δοκιμής, η εκτίμηση holdout του σφάλματος μπορεί να είναι παραπλανητική εάν συμβεί ένας "ανεπιτυχής μη αντιπροσωπευτικός" διαχωρισμός δεδομένων. Οι περιορισμοί του holdout μπορούν να υπερνικηθούν με μια οικογένεια μεθόδων ανά δειγματοληψίας, που χρησιμοποιούν τελικά ολόκληρο το σύνολο δεδομένων και για εκπαίδευση και για έλεγχο/επικύρωση, διεξάγοντας βέβαια πολλαπλάσια πειράματα εις βάρος του υψηλότερου υπολογιστικού κόστους. Αυτές είναι οι Cross Validation (Random Subsampling, K-Fold Cross-Validation, Leave-one-out Cross- Validation) και Bootstrap. Εμείς θα αναλύουμε μόνο την Leave-one-out Cross-Validation την οποία χρησιμοποιούμε. Α. Σταμούλη Σελίδα 79

94 Η leave-one-out cross validation [40] (εξαίρεσε ένα) ή Jackknife resampling [41][42] είναι μια ειδική περίπτωση κατά την οποία η ομάδα εκπαίδευσης είναι όλα τα δείγματα εξαιρουμένου πάντα ενός, κάθε φορά διαφορετικού. Η διαδικασία επαναλαμβάνεται τόσες φορές όσα είναι και τα δείγματα. Για ένα σύνολο δεδομένων με Ν δείγματα εκτελούμε Ν πειράματα. Κάθε δείγμα αφήνετε με την σειρά του έξω από το σύνολο εκπαίδευσης, και ο αλγόριθμος στην συνέχεια εκπαιδεύεται στα υπόλοιπα Ν-1. Το σχήμα μάθησης στην συνέχεια αξιολογείται στο παράδειγμα που έχει αφεθεί, 1 ή 0 για επιτυχία και αποτυχία αντίστοιχα. Η αξιοπιστία του ταξινομητή στη μέθοδο leave-oneout cross validation ή Jackknife resampling υπολογίζεται ως ο μέσος όρος των πειραμάτων. Υπάρχουν τρία πλεονεκτήματα στη μέθοδο leave-one-out cross validation ή Jackknife resampling. Πρώτον χρησιμοποιείται το μέγιστο δυνατό ποσό δεδομένων για εκπαίδευση. Δεύτερον, η διαδικασία είναι αιτιοκρατική: δεν περιπλέκεται τυχαία δειγματοληψία. Τρίτον το αποτέλεσμα του τεστ ελέγχου είναι ή 0% ή 100% σωστή ταξινόμηση κάθε φορά αφού εξετάζεται πάντα σε ένα δείγμα. Ένα προφανές μειονέκτημα της leave-one-out είναι το υψηλό υπολογιστικό κόστος. Α. Σταμούλη Σελίδα 80

95 8.1 Εισαγωγή Στα προηγούμενα κεφάλαια παρουσιάσαμε τις θεωρίες των μεθόδων και των αλγορίθμων που χρησιμοποιούμε στο στάδιο της εγγραφής και της σύγκρισης αναλύοντας αυτές με τη σειρά που χρησιμοποιούνται από το βιομετρικό μας σύστημα. Αναλύσαμε λοιπόν για τη λειτουργία της εγγραφής τόσο τον τρόπο που λαμβάνουμε τα βιομετρικά δεδομένα από το πληκτρολόγιο, τη διαδικασία εξαγωγής των προτύπων, την εκπαίδευση του βιομετρικού συστήματος για περαιτέρω έρευνα καθώς και μερικούς αλγορίθμους που χρησιμοποιούνται στη διαδικασία της σύγκρισης. Αφού λοιπόν κατανοήσαμε τις προηγούμενες μεθοδολογίες καθώς και το σκοπό για τον οποίο χρησιμοποιούνται στη διεξαγωγή του πειράματος, στο παρόν κεφάλαιο θα παρουσιάσουμε συνολικά τη διαδικασία εκπαίδευσης και σύγκρισης που χρησιμοποιούμε για το συγκεκριμένο βιομετρικό σύστημα καθώς και τα αποτελέσματα που προκύπτουν. Αρχικά λοιπόν θα παρουσιάσουμε το σύνολο των δεδομένων μας τα οποία έχουμε εξηγήσει στη ενότητα 4.2 πως τα λαμβάνουμε και θα αναλύσουμε τον τρόπο με τον οποίο τα χωρίζουμε ώστε να μπορέσουμε να τα επεξεργαστούμε και να πραγματοποιήσουμε τη διαδικασία της εκπαίδευσης του βιομετρικού συστήματος και μετέπειτα την επαλήθευση (σύγκριση). Αφού ολοκληρώσουμε τα πειραματικά δεδομένα στη συνέχεια θα περιγράψουμε, παραθέτοντας και ένα σχήμα, τη βήμα προς βήμα διαδικασία της εγγραφής των χρηστών και τη διαδικασία της σύγκρισης για να έχουμε μία συνολική εικόνα του πως χρησιμοποιούνται οι παραπάνω αλγόριθμοι και θα παρουσιάσουμε τα αποτελέσματα των αλγορίθμων αυτών επίσης με τη σειρά που χρησιμοποιούνται στο πείραμα. Το παρόν κεφάλαιο θα ολοκληρωθεί με την αξιολόγηση του πειράματος χρησιμοποιώντας τις μεθόδους αξιολόγησης που χρησιμοποιήσαμε στην ενότητα Δεδομένα πειράματος Ξεκινάμε με την παρουσίαση των δεδομένων που συλλέξαμε σύμφωνα με την πειραματική διαδικασία που περιγράφτηκε στην ενότητα 4.2. Όπως αναφέραμε το βιομετρικό χαρακτηριστικό που συλλέγεται από το πληκτρολόγιο για κάθε χρήστη είναι η Α. Σταμούλη Σελίδα 81

96 καθυστέρηση (PP latency). Ο αριθμός των δειγμάτων που επεξεργαστήκαμε είναι συνολικά 200 RTI σήματα. Συγκεκριμένα είκοσι υποκείμενα συμμετείχαν στη δημιουργία δέκα RTI σημάτων σε πέντε διαφορετικές μέρες. Κάθε φορά καταγραφόταν δύο χρονοσειρές και κάθε διάνυσμα αποτελούταν από 128 τιμές. Δηλαδή το υποκείμενο πάτησε 128 φορές το πληκτρολόγιο σύμφωνα με ένα συγκεκριμένο μοτίβο. Έπειτα από το συγκεκριμένο διάνυσμα εξάγαμε τα διανύσματα των RTI σημάτων σύμφωνα με την εξίσωση 7. Προέκυψαν λοιπόν τα διανύσματα των RTI σημάτων, 10 διανύσματα για κάθε χρήστη, συνολικά 200 (επομένως έχουμε 200 διάνυσμα και κάθε ένα έχει 127 στοιχεία, ή ένα πίνακας [200x127]). Ο χρόνος καταγραφής μιας απλής χρονοσειράς διήρκησε κατά μέσο όρο 175±35 sec. Στις παρακάτω εικόνες παρουσιάζουμε τα RTI σήματα διάφορων υποκειμένων. Στην εικόνα 23 παρουσιάζουμε δύο χρονοσειρές (RTI σήματα) του υποκειμένου 1. Παρατηρούμε ότι οι χρονοσειρές αυτές είναι όμοιες μεταξύ τους κάτι το οποίο και αναμέναμε αφού είναι βιομετρικό χαρακτηριστικό του ίδιο χρήστη. Ομοίως και στην εικόνα 24 που απεικονίζονται δύο χρονοσειρές του υποκειμένου 20. Αντίθετα, στην εικόνα 25 που έχουμε τρεις χρονοσειρές από τρία διαφορετικά υποκείμενα, παρατηρούμε ότι είναι αρκετά ανόμοιες μεταξύ τους. 7 6 Time series subject 1-timeseries 1 subject 1-timeseries 9 5 Different subjects Number of blows Εικόνα 23: RTI σήματα του υποκειμένου 1. Α. Σταμούλη Σελίδα 82

97 3 2.5 subject 20-timeseries 5 subject 20-timeseries 10 Time series Different subjects Number of blows Εικόνα 24: RTI σήματα του υποκειμένου Time series subject 1 subject 2 subject 20 5 Different subjects Number of blows Εικόνα 25: RTI σήματα τριών διαφορετικών υποκειμένων. Α. Σταμούλη Σελίδα 83

98 8.3 Τρόπος αξιοποίησης των δεδομένων Όπως έχουμε ήδη αναλύσει, σκοπός της εργασίας είναι η εγγραφή χρηστών στο βιομετρικό σύστημα έτσι ώστε το σύστημα στη συνέχεια να επιβεβαιώσει εάν ένα άτομο είναι όντως ο εγγεγραμμένος χρήστης του συστήματος που ισχυρίζεται ότι είναι ή όχι. Για τον λόγο αυτό, τα δεδομένα τα οποία διαθέτουμε θα πρέπει στην ουσία να τα χωρίσουμε σε δύο ομάδες. Η μία ομάδα θα αποτελείται από τους χρήστες, για την ακρίβεια δεδομένα χρηστών (στην περίπτωση μας τα RTI σήματα) τους οποίους θα εγγράψουμε στο σύστημα και θα αποτελέσουν τη βάση προτύπων μας και η άλλη ομάδα θα αποτελείται από χρήστες για τους οποίους είτε υπάρχει πρότυπο αποθηκευμένο στη βάση προτύπων και επομένως το σύστημα θα πρέπει να τους επιτρέψει την είσοδο, είτε από χρήστες οι οποίοι δεν έχουν κάποιο πρότυπο στη βάση και θα πρέπει να απορριφθούν. Όπως περιγράψαμε στην προηγούμενη παράγραφο το σύνολο των δεδομένων μας αποτελείται από 20 χρήστες και κάθε χρήστης χαρακτηρίζεται από 10 χρονοσειρές (RTI σήματα). Για να επιβεβαιώσουμε την πρότασή μας και να αποδείξουμε ότι τα RTI σήματα τα οποία εξάγαμε από ένα απλό σύστημα επαλήθευσης μπορούν να οδηγήσουν σε ακριβείς και αξιοποιήσιμες πληροφορίες, υιοθετήσαμε ένα πειραματικό πρωτόκολλο. Το πρωτόκολλο αυτό βασίζεται στη μέθοδο leave-one-out cross validation που περιγράψαμε στην ενότητα και στην εναλλαγή των χρηστών. Η εικόνα 26 θα μας βοηθήσει να περιγράψουμε τον τρόπο που θα χειριστούμε τα δεδομένα μας. Εικόνα 26: Πρωτόκολλο πειράματος. Α. Σταμούλη Σελίδα 84

Τεχνικές Μείωσης Διαστάσεων. Ειδικά θέματα ψηφιακής επεξεργασίας σήματος και εικόνας Σ. Φωτόπουλος- Α. Μακεδόνας

Τεχνικές Μείωσης Διαστάσεων. Ειδικά θέματα ψηφιακής επεξεργασίας σήματος και εικόνας Σ. Φωτόπουλος- Α. Μακεδόνας Τεχνικές Μείωσης Διαστάσεων Ειδικά θέματα ψηφιακής επεξεργασίας σήματος και εικόνας Σ. Φωτόπουλος- Α. Μακεδόνας 1 Εισαγωγή Το μεγαλύτερο μέρος των δεδομένων που καλούμαστε να επεξεργαστούμε είναι πολυδιάστατα.

Διαβάστε περισσότερα

ΑΝΑΓΝΩΡΙΣΗ ΠΡΟΤΥΠΩΝ. ΕΝΟΤΗΤΑ: Γραμμικές Συναρτήσεις Διάκρισης. ΔΙΔΑΣΚΟΝΤΕΣ: Βλάμος Π. Αυλωνίτης Μ. ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ

ΑΝΑΓΝΩΡΙΣΗ ΠΡΟΤΥΠΩΝ. ΕΝΟΤΗΤΑ: Γραμμικές Συναρτήσεις Διάκρισης. ΔΙΔΑΣΚΟΝΤΕΣ: Βλάμος Π. Αυλωνίτης Μ. ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΝΑΓΝΩΡΙΣΗ ΠΡΟΤΥΠΩΝ ΕΝΟΤΗΤΑ: Γραμμικές Συναρτήσεις Διάκρισης ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΔΙΔΑΣΚΟΝΤΕΣ: Βλάμος Π. Αυλωνίτης Μ. Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης

Διαβάστε περισσότερα

Αναγνώριση Προτύπων Ι

Αναγνώριση Προτύπων Ι Αναγνώριση Προτύπων Ι Ενότητα 1: Μέθοδοι Αναγνώρισης Προτύπων Αν. Καθηγητής Δερματάς Ευάγγελος Τμήμα Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται

Διαβάστε περισσότερα

Β Γραφικές παραστάσεις - Πρώτο γράφημα Σχεδιάζοντας το μήκος της σανίδας συναρτήσει των φάσεων της σελήνης μπορείτε να δείτε αν υπάρχει κάποιος συσχετισμός μεταξύ των μεγεθών. Ο συνήθης τρόπος γραφικής

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 5. Κύκλος Ζωής Εφαρμογών ΕΝΟΤΗΤΑ 2. Εφαρμογές Πληροφορικής. Διδακτικές ενότητες 5.1 Πρόβλημα και υπολογιστής 5.2 Ανάπτυξη εφαρμογών

ΚΕΦΑΛΑΙΟ 5. Κύκλος Ζωής Εφαρμογών ΕΝΟΤΗΤΑ 2. Εφαρμογές Πληροφορικής. Διδακτικές ενότητες 5.1 Πρόβλημα και υπολογιστής 5.2 Ανάπτυξη εφαρμογών 44 Διδακτικές ενότητες 5.1 Πρόβλημα και υπολογιστής 5.2 Ανάπτυξη εφαρμογών Διδακτικοί στόχοι Σκοπός του κεφαλαίου είναι οι μαθητές να κατανοήσουν τα βήματα που ακολουθούνται κατά την ανάπτυξη μιας εφαρμογής.

Διαβάστε περισσότερα

Σχεδιασμός και Διεξαγωγή Πειραμάτων

Σχεδιασμός και Διεξαγωγή Πειραμάτων Σχεδιασμός και Διεξαγωγή Πειραμάτων Πρώτο στάδιο: λειτουργικοί ορισμοί της ανεξάρτητης και της εξαρτημένης μεταβλητής Επιλογή της ανεξάρτητης μεταβλητής Επιλέγουμε μια ανεξάρτητη μεταβλητή (ΑΜ), την οποία

Διαβάστε περισσότερα

Επιβεβαίωση online υπογραφής με χρήση της βάσης δεδομένων SUSIG

Επιβεβαίωση online υπογραφής με χρήση της βάσης δεδομένων SUSIG ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΤΜΗΜΑ ΦΥΣΙΚΗΣ ΤΟΜΕΑΣ ΗΛΕΚΤΡΟΝΙΚΗΣ & ΥΠΟΛΟΓΙΣΤΩΝ ΕΡΓΑΣΤΗΡΙΟ ΗΛΕΚΤΡΟΝΙΚΗΣ Επιβεβαίωση online υπογραφής με χρήση της βάσης δεδομένων SUSIG ΚΟΥΛΟΥΡΗ ΜΕΤΑΞΙΑ Α.Μ. 4735 ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ

Διαβάστε περισσότερα

Εισαγωγή στους Υπολογιστές

Εισαγωγή στους Υπολογιστές Εισαγωγή στους Υπολογιστές Ενότητα #2: Αναπαράσταση δεδομένων Αβεβαιότητα και Ακρίβεια Καθ. Δημήτρης Ματαράς Πολυτεχνική Σχολή Τμήμα Χημικών Μηχανικών Αναπαράσταση δεδομένων (Data Representation), Αβεβαιότητα

Διαβάστε περισσότερα

Περιεχόμενο του μαθήματος

Περιεχόμενο του μαθήματος ΤΕΧΝΟΛΟΓΙΑ ΛΟΓΙΣΜΙΚΟΥ Απαιτήσεις Λογισμικού Περιπτώσεις χρήσης Δρ Βαγγελιώ Καβακλή Τμήμα Πολιτισμικής Τεχνολογίας και Επικοινωνίας Πανεπιστήμιο Αιγαίου Εαρινό Εξάμηνο 2012-2013 1 Περιεχόμενο του μαθήματος

Διαβάστε περισσότερα

Συστήματα αναγνώρισης ίριδας

Συστήματα αναγνώρισης ίριδας Συστήματα αναγνώρισης ίριδας Σοφία Μιχοπούλου επιβλέπων καθηγητής Σπύρος Φωτόπουλος 1 Η βιομετρική αναγνώριση Δακτυλικό αποτύπωμα Πρόσωπο Ίριδα Υπογραφή Γεωμετρία Χεριού Φωνή 2 Οι εφαρμογές της αναγνώρισης

Διαβάστε περισσότερα

Ένα αναλογικό σήμα περιέχει άπειρες πιθανές τιμές. Για παράδειγμα ένας απλός ήχος αν τον βλέπαμε σε ένα παλμογράφο θα έμοιαζε με το παρακάτω:

Ένα αναλογικό σήμα περιέχει άπειρες πιθανές τιμές. Για παράδειγμα ένας απλός ήχος αν τον βλέπαμε σε ένα παλμογράφο θα έμοιαζε με το παρακάτω: Σημειώσεις Δικτύων Αναλογικά και ψηφιακά σήματα Ένα αναλογικό σήμα περιέχει άπειρες πιθανές τιμές. Για παράδειγμα ένας απλός ήχος αν τον βλέπαμε σε ένα παλμογράφο θα έμοιαζε με το παρακάτω: Χαρακτηριστικά

Διαβάστε περισσότερα

Αναγνώριση Προτύπων Ι

Αναγνώριση Προτύπων Ι Αναγνώριση Προτύπων Ι Ενότητα 3: Στοχαστικά Συστήματα Αν. Καθηγητής Δερματάς Ευάγγελος Τμήμα Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες

Διαβάστε περισσότερα

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Data Mining - Classification

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Data Mining - Classification ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ Data Mining - Classification Data Mining Ανακάλυψη προτύπων σε μεγάλο όγκο δεδομένων. Σαν πεδίο περιλαμβάνει κλάσεις εργασιών: Anomaly Detection:

Διαβάστε περισσότερα

Μια από τις σημαντικότερες δυσκολίες που συναντά ο φυσικός στη διάρκεια ενός πειράματος, είναι τα σφάλματα.

Μια από τις σημαντικότερες δυσκολίες που συναντά ο φυσικός στη διάρκεια ενός πειράματος, είναι τα σφάλματα. Εισαγωγή Μετρήσεις-Σφάλματα Πολλές φορές θα έχει τύχει να ακούσουμε τη λέξη πείραμα, είτε στο μάθημα είτε σε κάποια είδηση που αφορά τη Φυσική, τη Χημεία ή τη Βιολογία. Είναι όμως γενικώς παραδεκτό ότι

Διαβάστε περισσότερα

Μαθηματική Εισαγωγή Συναρτήσεις

Μαθηματική Εισαγωγή Συναρτήσεις Φυσικός Ραδιοηλεκτρολόγος (MSc) ο Γενικό Λύκειο Καστοριάς A. Μαθηματική Εισαγωγή Πράξεις με αριθμούς σε εκθετική μορφή Επίλυση βασικών μορφών εξισώσεων Συναρτήσεις Στοιχεία τριγωνομετρίας Διανύσματα Καστοριά,

Διαβάστε περισσότερα

Εισαγωγή Αλγόριθµοι Αποτελέσµατα Επίλογος Ορισµός του Προβλήµατος Ευθυγράµµιση : Εύρεση ενός γεωµετρικού µετασχηµατισµού που ϕέρνει κοντά δύο τρισδιάσ

Εισαγωγή Αλγόριθµοι Αποτελέσµατα Επίλογος Ορισµός του Προβλήµατος Ευθυγράµµιση : Εύρεση ενός γεωµετρικού µετασχηµατισµού που ϕέρνει κοντά δύο τρισδιάσ Εισαγωγή Αλγόριθµοι Αποτελέσµατα Επίλογος Αλγόριθµοι Ευθυγράµµισης Τρισδιάστατων Αντικειµένων Τµήµα Πληροφορικής και Τηλεπικοινωνιών Εθνικό & Καποδιστριακό Πανεπιστήµιο Αθηνών 20 Οκτωβρίου 2005 Εισαγωγή

Διαβάστε περισσότερα

Μαθηματική Εισαγωγή Συναρτήσεις

Μαθηματική Εισαγωγή Συναρτήσεις Φυσικός Ραδιοηλεκτρολόγος (MSc) ο Γενικό Λύκειο Καστοριάς Καστοριά, Ιούλιος 14 A. Μαθηματική Εισαγωγή Πράξεις με αριθμούς σε εκθετική μορφή Επίλυση βασικών μορφών εξισώσεων Συναρτήσεις Στοιχεία τριγωνομετρίας

Διαβάστε περισσότερα

ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ «ΔΙΟΙΚΗΣΗ της ΥΓΕΙΑΣ» ΑΞΙΟΛΟΓΗΣΗ ΑΠΟΔΟΣΗΣ ΠΡΟΣΩΠΙΚΟΥ: ΜΕΛΕΤΗ ΠΕΡΙΠΤΩΣΗΣ ΙΔΙΩΤΙΚΟΥ ΝΟΣΟΚΟΜΕΙΟΥ ΠΑΡΑΓΙΟΥΔΑΚΗ ΜΑΓΔΑΛΗΝΗ

ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ «ΔΙΟΙΚΗΣΗ της ΥΓΕΙΑΣ» ΑΞΙΟΛΟΓΗΣΗ ΑΠΟΔΟΣΗΣ ΠΡΟΣΩΠΙΚΟΥ: ΜΕΛΕΤΗ ΠΕΡΙΠΤΩΣΗΣ ΙΔΙΩΤΙΚΟΥ ΝΟΣΟΚΟΜΕΙΟΥ ΠΑΡΑΓΙΟΥΔΑΚΗ ΜΑΓΔΑΛΗΝΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΙΡΑΙΩΣ ΤΜΗΜΑ ΟΙΚΟΝΟΜΙΚΗΣ ΕΠΙΣΤΗΜΗΣ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ «ΔΙΟΙΚΗΣΗ της ΥΓΕΙΑΣ» ΑΞΙΟΛΟΓΗΣΗ ΑΠΟΔΟΣΗΣ ΠΡΟΣΩΠΙΚΟΥ: ΜΕΛΕΤΗ ΠΕΡΙΠΤΩΣΗΣ ΙΔΙΩΤΙΚΟΥ ΝΟΣΟΚΟΜΕΙΟΥ ΠΑΡΑΓΙΟΥΔΑΚΗ ΜΑΓΔΑΛΗΝΗ Διπλωματική

Διαβάστε περισσότερα

ΦΥΣΙΚΗ ΠΡΟΣΑΝΑΤΟΛΙΣΜΟΥ

ΦΥΣΙΚΗ ΠΡΟΣΑΝΑΤΟΛΙΣΜΟΥ ΦΥΣΙΚΗ ΠΡΟΣΑΝΑΤΟΛΙΣΜΟΥ Β ΛΥΚΕΙΟΥ Καμπυλόγραμμες Κινήσεις Επιμέλεια: Αγκανάκης Α. Παναγιώτης, Φυσικός http://phyiccore.wordpre.com/ Βασικές Έννοιες Μέχρι στιγμής έχουμε μάθει να μελετάμε απλές κινήσεις,

Διαβάστε περισσότερα

ΔΠΜΣ: ΕΦΑΡΜΟΣΜΕΝΕΣ ΜΑΘΗΜΑΤΙΚΕΣ ΕΠΙΣΤΗΜΕΣ ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΤΕΛΙΚΗ ΕΡΓΑΣΙΑ

ΔΠΜΣ: ΕΦΑΡΜΟΣΜΕΝΕΣ ΜΑΘΗΜΑΤΙΚΕΣ ΕΠΙΣΤΗΜΕΣ ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΤΕΛΙΚΗ ΕΡΓΑΣΙΑ Ε Θ Ν Ι Κ Ο Μ Ε Τ Σ Ο Β Ι Ο Π Ο Λ Υ Τ Ε Χ Ν Ε Ι Ο ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ & ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΔΠΜΣ: ΕΦΑΡΜΟΣΜΕΝΕΣ ΜΑΘΗΜΑΤΙΚΕΣ ΕΠΙΣΤΗΜΕΣ ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΤΕΛΙΚΗ ΕΡΓΑΣΙΑ ΟΝΟΜΑΤΕΠΩΝΥΜΟ:

Διαβάστε περισσότερα

Συστήματα συντεταγμένων

Συστήματα συντεταγμένων Κεφάλαιο. Για να δημιουργήσουμε τρισδιάστατα αντικείμενα, που μπορούν να παρασταθούν στην οθόνη του υπολογιστή ως ένα σύνολο από γραμμές, επίπεδες πολυγωνικές επιφάνειες ή ακόμη και από ένα συνδυασμό από

Διαβάστε περισσότερα

Κεφάλαιο 8. Οπτικοποίηση Απαλοιφή

Κεφάλαιο 8. Οπτικοποίηση Απαλοιφή Κεφάλαιο 8. Οπτικοποίηση Απαλοιφή Oι οπτικές επιδράσεις, που μπορεί να προκαλέσει μια εικόνα στους χρήστες, αποτελούν ένα από τα σπουδαιότερα αποτελέσματα των λειτουργιών γραφικών με Η/Υ. Τον όρο της οπτικοποίησης

Διαβάστε περισσότερα

iii ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος

iii ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος iii ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος xi 1 Αντικείμενα των Πιθανοτήτων και της Στατιστικής 1 1.1 Πιθανοτικά Πρότυπα και Αντικείμενο των Πιθανοτήτων, 1 1.2 Αντικείμενο της Στατιστικής, 3 1.3 Ο Ρόλος των Πιθανοτήτων

Διαβάστε περισσότερα

Εξαμηνιαία Εργασία Β. Κανονική Κατανομή - Επαγωγική Στατιστική

Εξαμηνιαία Εργασία Β. Κανονική Κατανομή - Επαγωγική Στατιστική 1 ΕΞΑΜΗΝΙΑΙΑ Β ΤΟ ΦΩΤΟΒΟΛΤΑΙΚΟ ΠΑΡΚΟ ΑΣΠΑΙΤΕ Τμήμα Εκπαιδευτικών Ηλεκτρολογίας Εργαστήριο Συλλογής και Επεξεργασίας Δεδομένων Διδάσκοντες: Σπύρος Αδάμ, Λουκάς Μιχάλης, Παναγιώτης Καράμπελας Εξαμηνιαία

Διαβάστε περισσότερα

ΣΧΕΔΙΑΣΜΟΣ ΕΠΙΓΕΙΟΥ ΣΥΣΤΗΜΑΤΟΣ ΑΛΥΣΟΚΙΝΗΣΗΣ ΓΙΑ ΜΕΤΑΦΟΡΑ ΤΡΟΛΕΪ

ΣΧΕΔΙΑΣΜΟΣ ΕΠΙΓΕΙΟΥ ΣΥΣΤΗΜΑΤΟΣ ΑΛΥΣΟΚΙΝΗΣΗΣ ΓΙΑ ΜΕΤΑΦΟΡΑ ΤΡΟΛΕΪ ΤΕΧΝΟΛΟΓΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΣΧΟΛΗ ΜΗΧΑΝΙΚΗΣ ΚΑΙ ΤΕΧΝΟΛΟΓΙΑΣ Πτυχιακή εργασία ΣΧΕΔΙΑΣΜΟΣ ΕΠΙΓΕΙΟΥ ΣΥΣΤΗΜΑΤΟΣ ΑΛΥΣΟΚΙΝΗΣΗΣ ΓΙΑ ΜΕΤΑΦΟΡΑ ΤΡΟΛΕΪ Μάριος Σταυρίδης Λεμεσός, Ιούνιος 2017 ΤΕΧΝΟΛΟΓΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ

Διαβάστε περισσότερα

Φυσικά μεγέθη. Φυσική α λυκείου ΕΙΣΑΓΩΓΗ. Όλα τα φυσικά μεγέθη τα χωρίζουμε σε δύο κατηγορίες : Α. τα μονόμετρα. Β.

Φυσικά μεγέθη. Φυσική α λυκείου ΕΙΣΑΓΩΓΗ. Όλα τα φυσικά μεγέθη τα χωρίζουμε σε δύο κατηγορίες : Α. τα μονόμετρα. Β. ΕΙΣΑΓΩΓΗ Φυσικά μεγέθη Όλα τα φυσικά μεγέθη τα χωρίζουμε σε δύο κατηγορίες : Α. τα μονόμετρα Β. τα διανυσματικά Μονόμετρα ονομάζουμε τα μεγέθη εκείνα τα οποία για να τα γνωρίζουμε χρειάζεται να ξέρουμε

Διαβάστε περισσότερα

Αριθμητική εύρεση ριζών μη γραμμικών εξισώσεων

Αριθμητική εύρεση ριζών μη γραμμικών εξισώσεων Αριθμητική εύρεση ριζών μη γραμμικών εξισώσεων Με τον όρο μη γραμμικές εξισώσεις εννοούμε εξισώσεις της μορφής: f( ) 0 που προέρχονται από συναρτήσεις f () που είναι μη γραμμικές ως προς. Περιέχουν δηλαδή

Διαβάστε περισσότερα

Μεταπτυχιακό Πρόγραμμα Φυσικού Τμήματος «Υπολογιστική Φυσική» Θέμα εργασίας στο A Μέρος του μαθήματος «Προσομοίωση Χαοτικών Συστημάτων»

Μεταπτυχιακό Πρόγραμμα Φυσικού Τμήματος «Υπολογιστική Φυσική» Θέμα εργασίας στο A Μέρος του μαθήματος «Προσομοίωση Χαοτικών Συστημάτων» Μεταπτυχιακό Πρόγραμμα Φυσικού Τμήματος «Υπολογιστική Φυσική» Θέμα εργασίας στο A Μέρος του μαθήματος «Προσομοίωση Χαοτικών Συστημάτων» Οδηγίες: Σχετικά με την παράδοση της εργασίας θα πρέπει: Το κείμενο

Διαβάστε περισσότερα

Ησυνθήκη SENGEN καιτα Ολοκληρωµένα Ηλεκτρονικά Συστήµατα Ελέγχου-Αναφοράς σε αεροδρόµια, λιµάνια και τελωνεία

Ησυνθήκη SENGEN καιτα Ολοκληρωµένα Ηλεκτρονικά Συστήµατα Ελέγχου-Αναφοράς σε αεροδρόµια, λιµάνια και τελωνεία ΗΜΕΡΙ Α «ΥΠΗΡΕΣΙΕΣ ΗΛΕΚΤΡΟΝΙΚΗΣ ΕΠΙΤΗΡΗΣΗΣ ΚΑΙ ΤΑΥΤΟΠΟΙΗΣΗΣ ΓΙΑ ΤΟΝ ΕΛΕΓΧΟ ΤΩΝ ΣΥΝΟΡΩΝ» Λ.Α.Ε.., Αθήνα - 24 Ιανουαρίου 2011 Ησυνθήκη SENGEN καιτα Ολοκληρωµένα Ηλεκτρονικά Συστήµατα Ελέγχου-Αναφοράς σε

Διαβάστε περισσότερα

Τα ηλεκτρονικά σήματα πληροφορίας διακρίνονται ανάλογα με τη μορφή τους σε δύο κατηγορίες : Αναλογικά σήματα Ψηφιακά σήματα

Τα ηλεκτρονικά σήματα πληροφορίας διακρίνονται ανάλογα με τη μορφή τους σε δύο κατηγορίες : Αναλογικά σήματα Ψηφιακά σήματα ΕΝΟΤΗΤΑ 2 2.0 ΗΛΕΚΤΡΙΚΑ ΣΗΜΑΤΑ ΚΑΙ ΑΡΧΕΣ ΕΠΙΚΟΙΝΩΝΙΑΣ ΕΙΣΑΓΩΓΗ Ηλεκτρικό σήμα ονομάζεται η τάση ή το ρεύμα που μεταβάλλεται ως συνάρτηση του χρόνου. Στα ηλεκτρονικά συστήματα επικοινωνίας, οι πληροφορίες

Διαβάστε περισσότερα

ιαχείριση και Ανάκτηση Εικόνας µε χρήση Οµοιότητας Γράφων (WW-test)

ιαχείριση και Ανάκτηση Εικόνας µε χρήση Οµοιότητας Γράφων (WW-test) ιαχείριση και Ανάκτηση Εικόνας µε χρήση Οµοιότητας Γράφων (WW-test) Θεοχαράτος Χρήστος Εργαστήριο Ηλεκτρονικής (ELLAB), Τµήµα Φυσικής, Πανεπιστήµιο Πατρών email: htheohar@upatras.gr http://www.ellab.physics.upatras.gr/users/theoharatos/default.htm

Διαβάστε περισσότερα

ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ. «ΔΙΟΙΚΗΣΗ της ΥΓΕΙΑΣ» ΑΞΙΟΛΟΓΗΣΗ ΚΑΙ ΔΙΑΧΕΙΡΙΣΗ ΝΟΣΟΚΟΜΕΙΑΚΟΥ ΠΡΟΣΩΠΙΚΟΥ

ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ. «ΔΙΟΙΚΗΣΗ της ΥΓΕΙΑΣ» ΑΞΙΟΛΟΓΗΣΗ ΚΑΙ ΔΙΑΧΕΙΡΙΣΗ ΝΟΣΟΚΟΜΕΙΑΚΟΥ ΠΡΟΣΩΠΙΚΟΥ ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΙΡΑΙΩΣ ΤΜΗΜΑ ΟΙΚΟΝΟΜΙΚΗΣ ΕΠΙΣΤΗΜΗΣ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ «ΔΙΟΙΚΗΣΗ της ΥΓΕΙΑΣ» ΑΞΙΟΛΟΓΗΣΗ ΚΑΙ ΔΙΑΧΕΙΡΙΣΗ ΝΟΣΟΚΟΜΕΙΑΚΟΥ ΠΡΟΣΩΠΙΚΟΥ Μαστρογιάννη Μαρία Διπλωματική Εργασία υποβληθείσα

Διαβάστε περισσότερα

ΠΙΛΟΤΙΚΗ ΕΦΑΡΜΟΓΗ ΑΥΤΟΝΟΜΩΝ ΣΥΣΤΗΜΑΤΩΝ ΠΛΟΗΓΗΣΗΣ ΓΙΑ ΤΗΝ ΠΑΡΑΓΩΓΗ ΥΨΗΛΗΣ ΑΝΑΛΥΣΗΣ ΟΡΘΟΦΩΤΟΓΡΑΦΙΩΝ ΓΕΩΡΓΙΚΩΝ ΕΚΤΑΣΕΩΝ

ΠΙΛΟΤΙΚΗ ΕΦΑΡΜΟΓΗ ΑΥΤΟΝΟΜΩΝ ΣΥΣΤΗΜΑΤΩΝ ΠΛΟΗΓΗΣΗΣ ΓΙΑ ΤΗΝ ΠΑΡΑΓΩΓΗ ΥΨΗΛΗΣ ΑΝΑΛΥΣΗΣ ΟΡΘΟΦΩΤΟΓΡΑΦΙΩΝ ΓΕΩΡΓΙΚΩΝ ΕΚΤΑΣΕΩΝ Σχολή Μηχανικής & Τεχνολογίας Τμήμα Πολιτικών & Μηχανικών Γεωπληροφορικής Μεταπτυχιακή διατριβή ΠΙΛΟΤΙΚΗ ΕΦΑΡΜΟΓΗ ΑΥΤΟΝΟΜΩΝ ΣΥΣΤΗΜΑΤΩΝ ΠΛΟΗΓΗΣΗΣ ΓΙΑ ΤΗΝ ΠΑΡΑΓΩΓΗ ΥΨΗΛΗΣ ΑΝΑΛΥΣΗΣ ΟΡΘΟΦΩΤΟΓΡΑΦΙΩΝ ΓΕΩΡΓΙΚΩΝ

Διαβάστε περισσότερα

Ανάκτηση Εικόνας βάσει Υφής με χρήση Eye Tracker

Ανάκτηση Εικόνας βάσει Υφής με χρήση Eye Tracker Ειδική Ερευνητική Εργασία Ανάκτηση Εικόνας βάσει Υφής με χρήση Eye Tracker ΚΑΡΑΔΗΜΑΣ ΗΛΙΑΣ Α.Μ. 323 Επιβλέπων: Σ. Φωτόπουλος Καθηγητής, Μεταπτυχιακό Πρόγραμμα «Ηλεκτρονική και Υπολογιστές», Τμήμα Φυσικής,

Διαβάστε περισσότερα

Πτυχιακή Εργασία ηµιουργία Εκπαιδευτικού Παιχνιδιού σε Tablets Καλλιγάς ηµήτρης Παναγιώτης Α.Μ.: 1195 Επιβλέπων καθηγητής: ρ. Συρµακέσης Σπύρος ΑΝΤΙΡΡΙΟ 2015 Ευχαριστίες Σ αυτό το σηµείο θα ήθελα να

Διαβάστε περισσότερα

LOGO. Εξόρυξη Δεδομένων. Δειγματοληψία. Πίνακες συνάφειας. Καμπύλες ROC και AUC. Σύγκριση Μεθόδων Εξόρυξης

LOGO. Εξόρυξη Δεδομένων. Δειγματοληψία. Πίνακες συνάφειας. Καμπύλες ROC και AUC. Σύγκριση Μεθόδων Εξόρυξης Εξόρυξη Δεδομένων Δειγματοληψία Πίνακες συνάφειας Καμπύλες ROC και AUC Σύγκριση Μεθόδων Εξόρυξης Πασχάλης Θρήσκος PhD Λάρισα 2016-2017 pthriskos@mnec.gr LOGO Συμπερισματολογία - Τι σημαίνει ; Πληθυσμός

Διαβάστε περισσότερα

Ασκήσεις Φροντιστηρίου «Υπολογιστική Νοημοσύνη Ι» 5 o Φροντιστήριο

Ασκήσεις Φροντιστηρίου «Υπολογιστική Νοημοσύνη Ι» 5 o Φροντιστήριο Πρόβλημα ο Ασκήσεις Φροντιστηρίου 5 o Φροντιστήριο Δίνεται το παρακάτω σύνολο εκπαίδευσης: # Είσοδος Κατηγορία 0 0 0 Α 2 0 0 Α 0 Β 4 0 0 Α 5 0 Β 6 0 0 Α 7 0 Β 8 Β α) Στον παρακάτω κύβο τοποθετείστε τα

Διαβάστε περισσότερα

Μέθοδοι Μηχανών Μάθησης για Ευφυή Αναγνώριση και ιάγνωση Ιατρικών εδοµένων

Μέθοδοι Μηχανών Μάθησης για Ευφυή Αναγνώριση και ιάγνωση Ιατρικών εδοµένων Μέθοδοι Μηχανών Μάθησης για Ευφυή Αναγνώριση και ιάγνωση Ιατρικών εδοµένων Εισηγητής: ρ Ηλίας Ζαφειρόπουλος Εισαγωγή Ιατρικά δεδοµένα: Συλλογή Οργάνωση Αξιοποίηση Data Mining ιαχείριση εδοµένων Εκπαίδευση

Διαβάστε περισσότερα

Η ΜΕΘΟΔΟΣ PCA (Principle Component Analysis)

Η ΜΕΘΟΔΟΣ PCA (Principle Component Analysis) Η ΜΕΘΟΔΟΣ PCA (Principle Component Analysis) Η μέθοδος PCA (Ανάλυση Κύριων Συνιστωσών), αποτελεί μία γραμμική μέθοδο συμπίεσης Δεδομένων η οποία συνίσταται από τον επαναπροσδιορισμό των συντεταγμένων ενός

Διαβάστε περισσότερα

Δίκτυα Υπολογιστών Εργαστήρια

Δίκτυα Υπολογιστών Εργαστήρια Δίκτυα Υπολογιστών Εργαστήρια Άσκηση 6 η Πολλαπλή Πρόσβαση με Ακρόαση Φέροντος (CSMA-CD) Πανεπιστήμιο Ιωαννίνων Τμήμα Μηχανικών Η/Υ και Πληροφορικής Διδάσκων: Παπαπέτρου Ευάγγελος 2 1 Εισαγωγή Σκοπός της

Διαβάστε περισσότερα

ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΚΕΝΤΡΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ ΣΧΟΛΗ ΤΜΗΜΑ. Μαθηματικά 2. Σταύρος Παπαϊωάννου

ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΚΕΝΤΡΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ ΣΧΟΛΗ ΤΜΗΜΑ. Μαθηματικά 2. Σταύρος Παπαϊωάννου ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΚΕΝΤΡΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ ΣΧΟΛΗ ΤΜΗΜΑ Μαθηματικά Σταύρος Παπαϊωάννου Ιούνιος 015 Τίτλος Μαθήματος Περιεχόμενα Χρηματοδότηση... Error! Bookmark not defined. Σκοποί Μαθήματος (Επικεφαλίδα

Διαβάστε περισσότερα

ΔΙΑΧΩΡΙΣΜΟΣ ΚΑΙ ΤΑΞΙΝΟΜΗΣΗ ΚΡΗΤΙΚΟΥ ΚΑΤΕΡΙΝΑ NΙΚΑΚΗ ΚΑΤΕΡΙΝΑ NΙΚΟΛΑΪΔΟΥ ΧΡΥΣΑ

ΔΙΑΧΩΡΙΣΜΟΣ ΚΑΙ ΤΑΞΙΝΟΜΗΣΗ ΚΡΗΤΙΚΟΥ ΚΑΤΕΡΙΝΑ NΙΚΑΚΗ ΚΑΤΕΡΙΝΑ NΙΚΟΛΑΪΔΟΥ ΧΡΥΣΑ ΔΙΑΧΩΡΙΣΜΟΣ ΚΑΙ ΤΑΞΙΝΟΜΗΣΗ ΚΡΗΤΙΚΟΥ ΚΑΤΕΡΙΝΑ NΙΚΑΚΗ ΚΑΤΕΡΙΝΑ NΙΚΟΛΑΪΔΟΥ ΧΡΥΣΑ ΔΙΑΧΩΡΙΣΜΟΣ ΚΑΙ ΤΑΞΙΝΟΜΗΣΗ Είναι τεχνικές που έχουν σκοπό: τον εντοπισμό χαρακτηριστικών των οποίων οι αριθμητικές τιμές επιτυγχάνουν

Διαβάστε περισσότερα

ΤΕΧΝΟΛΟΓΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΣΧΟΛΗ ΓΕΩΤΕΧΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΚΑΙ ΕΠΙΣΤΗΜΗΣ ΚΑΙ ΤΕΧΝΟΛΟΓΙΑΣ ΠΕΡΙΒΑΛΛΟΝΤΟΣ. Πτυχιακή διατριβή

ΤΕΧΝΟΛΟΓΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΣΧΟΛΗ ΓΕΩΤΕΧΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΚΑΙ ΕΠΙΣΤΗΜΗΣ ΚΑΙ ΤΕΧΝΟΛΟΓΙΑΣ ΠΕΡΙΒΑΛΛΟΝΤΟΣ. Πτυχιακή διατριβή ΤΕΧΝΟΛΟΓΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΣΧΟΛΗ ΓΕΩΤΕΧΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΚΑΙ ΕΠΙΣΤΗΜΗΣ ΚΑΙ ΤΕΧΝΟΛΟΓΙΑΣ ΠΕΡΙΒΑΛΛΟΝΤΟΣ Πτυχιακή διατριβή Η ΣΥΓΚΕΝΤΡΩΣΗ ΤΩΝ ΒΑΡΕΩΝ ΜΕΤΑΛΛΩΝ ΣΤΟ ΕΔΑΦΟΣ ΚΑΙ ΜΕΘΟΔΟΙ ΠΡΟΣΔΙΟΡΙΣΜΟΥ ΤΟΥΣ Μιχαήλ

Διαβάστε περισσότερα

Βιοµετρικά Συστήµατα για Έλεγχο Πρόσβασης

Βιοµετρικά Συστήµατα για Έλεγχο Πρόσβασης Βιοµετρικά Συστήµατα για Έλεγχο Πρόσβασης Στέλιος Χ. Α. Θωµόπουλος, Ph.D. (Stelios C. A. Thomopoulos) /ντής Ινστ. Πληροφορικής & Τηλεπικοινωνών ΕΚΕΦΕ ηµόκριτος ηµόκριτος, 13 Μαΐου 2003 2 Κύρια θέµατα της

Διαβάστε περισσότερα

ΚΥΠΡΙΑΚΗ ΕΤΑΙΡΕΙΑ ΠΛΗΡΟΦΟΡΙΚΗΣ CYPRUS COMPUTER SOCIETY ΠΑΓΚΥΠΡΙΟΣ ΜΑΘΗΤΙΚΟΣ ΔΙΑΓΩΝΙΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ 19/5/2007

ΚΥΠΡΙΑΚΗ ΕΤΑΙΡΕΙΑ ΠΛΗΡΟΦΟΡΙΚΗΣ CYPRUS COMPUTER SOCIETY ΠΑΓΚΥΠΡΙΟΣ ΜΑΘΗΤΙΚΟΣ ΔΙΑΓΩΝΙΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ 19/5/2007 Οδηγίες: Να απαντηθούν όλες οι ερωτήσεις. Αν κάπου κάνετε κάποιες υποθέσεις να αναφερθούν στη σχετική ερώτηση. Όλα τα αρχεία που αναφέρονται στα προβλήματα βρίσκονται στον ίδιο φάκελο με το εκτελέσιμο

Διαβάστε περισσότερα

Εισαγωγικά για την αναγνώριση έκφρασης προσώπου (Facial Expression Recognition)

Εισαγωγικά για την αναγνώριση έκφρασης προσώπου (Facial Expression Recognition) Ο στόχος της διπλωματικής είναι η αναγνώριση του συναισθήματος ενός συγκεκριμένου ανθρώπου από μια αλληλουχία εικόνων στις οποίες παίρνει διάφορες εκφράσεις. Αυτό θα γίνει κάνοντας χρήση τεχνικών βαθιάς

Διαβάστε περισσότερα

ΣΧΕΔΙΑΣΜΟΣ ΚΑΙ ΧΑΡΑΞΗ ΓΡΑΦΙΚΩΝ ΠΑΡΑΣΤΑΣΕΩΝ

ΣΧΕΔΙΑΣΜΟΣ ΚΑΙ ΧΑΡΑΞΗ ΓΡΑΦΙΚΩΝ ΠΑΡΑΣΤΑΣΕΩΝ ΠΡΟΤΥΠΟ ΠΕΙΡΑΜΑΤΙΚΟ ΛΥΚΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟΥ ΠΑΤΡΩΝ ΣΧΟΛ. ΕΤΟΣ 2014-15 1. Εισαγωγή ΣΧΕΔΙΑΣΜΟΣ ΚΑΙ ΧΑΡΑΞΗ ΓΡΑΦΙΚΩΝ ΠΑΡΑΣΤΑΣΕΩΝ Οι γραφικές παραστάσεις (ή διαγράμματα) χρησιμεύουν για την απεικόνιση της εξάρτησης

Διαβάστε περισσότερα

ΤΕΧΝΟΛΟΓΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΣΧΟΛΗ ΜΗΧΑΝΙΚΗΣ ΚΑΙ ΤΕΧΝΟΛΟΓΙΑΣ. Πτυχιακή εργασία

ΤΕΧΝΟΛΟΓΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΣΧΟΛΗ ΜΗΧΑΝΙΚΗΣ ΚΑΙ ΤΕΧΝΟΛΟΓΙΑΣ. Πτυχιακή εργασία ΤΕΧΝΟΛΟΓΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΣΧΟΛΗ ΜΗΧΑΝΙΚΗΣ ΚΑΙ ΤΕΧΝΟΛΟΓΙΑΣ Πτυχιακή εργασία ΑΝΑΠΤΥΞΗ ΕΙΚΟΝΙΚΗΣ ΠΛΑΤΦΟΡΜΑΣ ΠΡΟΣΟΜΟΙΩΣΗΣ ΤΗΣ ΠΑΡΑΜΟΡΦΩΣΗΣ ΑΝΘΡΩΠΙΝΟΥ ΗΠΑΤΟΣ ΜΕ ΤΗ ΧΡΗΣΗ ΑΠΤΙΚΟΥ ΜΕΣΟΥ Δηµήτρης Δούνας

Διαβάστε περισσότερα

Πανεπιστήμιο Κύπρου Πολυτεχνική Σχολή

Πανεπιστήμιο Κύπρου Πολυτεχνική Σχολή Πανεπιστήμιο Κύπρου Πολυτεχνική Σχολή Τμήμα Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών ΗΜΜΥ 795: ΑΝΑΓΝΩΡΙΣΗ ΠΡΟΤΥΠΩΝ Ακαδημαϊκό έτος 2010-11 Χειμερινό Εξάμηνο Practice final exam 1. Έστω ότι για

Διαβάστε περισσότερα

ΦΙΛΤΡΟ KALMAN ΔΙΑΚΡΙΤΟΥ ΧΡΟΝΟΥ

ΦΙΛΤΡΟ KALMAN ΔΙΑΚΡΙΤΟΥ ΧΡΟΝΟΥ 1 ΦΙΛΤΡΟ KALMAN ΔΙΑΚΡΙΤΟΥ ΧΡΟΝΟΥ Σε αυτό το μέρος της πτυχιακής θα ασχοληθούμε λεπτομερώς με το φίλτρο kalman και θα δούμε μια καινούρια έκδοση του φίλτρου πάνω στην εφαρμογή της γραμμικής εκτίμησης διακριτού

Διαβάστε περισσότερα

ΦΥΣΙΚΗ ΠΡΟΣΑΝΑΤΟΛΙΣΜΟΥ Β ΛΥΚΕΙΟΥ

ΦΥΣΙΚΗ ΠΡΟΣΑΝΑΤΟΛΙΣΜΟΥ Β ΛΥΚΕΙΟΥ ΦΥΣΙΚΗ ΠΡΟΣΑΝΑΤΟΛΙΣΜΟΥ Β ΛΥΚΕΙΟΥ Διατήρηση Ορμής Επιμέλεια: ΑΓΚΑΝΑΚΗΣ A.ΠΑΝΑΓΙΩΤΗΣ, Φυσικός htt://hyiccore.wordre.co/ Βασικές Έννοιες Μέχρι τώρα έχουμε ασχοληθεί με την μελέτη ενός σώματος και μόνο. Πλέον

Διαβάστε περισσότερα

Κεφάλαιο 9. Έλεγχοι υποθέσεων

Κεφάλαιο 9. Έλεγχοι υποθέσεων Κεφάλαιο 9 Έλεγχοι υποθέσεων 9.1 Εισαγωγή Όταν παίρνουμε ένα ή περισσότερα τυχαία δείγμα από κανονικούς πληθυσμούς έχουμε τη δυνατότητα να υπολογίζουμε στατιστικά, όπως μέσους όρους, δειγματικές διασπορές

Διαβάστε περισσότερα

Εισαγωγή ΕΙΣΑΓΩΓΗ ΣΤΑ ΓΣΠ

Εισαγωγή ΕΙΣΑΓΩΓΗ ΣΤΑ ΓΣΠ ΕΙΣΑΓΩΓΗ ΣΤΑ ΓΣΠ Τα τελευταία 25 χρόνια, τα προβλήµατα που σχετίζονται µε την διαχείριση της Γεωγραφικής Πληροφορίας αντιµετωπίζονται σε παγκόσµιο αλλά και εθνικό επίπεδο µε την βοήθεια των Γεωγραφικών

Διαβάστε περισσότερα

Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ. (Power of a Test) ΚΕΦΑΛΑΙΟ 21

Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ. (Power of a Test) ΚΕΦΑΛΑΙΟ 21 ΚΕΦΑΛΑΙΟ 21 Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ (Power of a Test) Όπως είδαμε προηγουμένως, στον Στατιστικό Έλεγχο Υποθέσεων, ορίζουμε δύο είδη πιθανών λαθών (κινδύνων) που μπορεί να συμβούν όταν παίρνουμε αποφάσεις

Διαβάστε περισσότερα

ΕΡΓΑΣΤΗΡΙΟ ΑΝΑΛΟΓΙΚΩΝ & ΨΗΦΙΑΚΩΝ ΕΠΙΚΟΙΝΩΝΙΩΝ

ΕΡΓΑΣΤΗΡΙΟ ΑΝΑΛΟΓΙΚΩΝ & ΨΗΦΙΑΚΩΝ ΕΠΙΚΟΙΝΩΝΙΩΝ Σχολή Θετικών Επιστημών Τεχνολογίας Τηλεπικοινωνιών Τμήμα Επιστήμης και Τεχνολογίας Τηλεπικοινωνιών ΕΡΓΑΣΤΗΡΙΟ ΑΝΑΛΟΓΙΚΩΝ & ΨΗΦΙΑΚΩΝ ΕΠΙΚΟΙΝΩΝΙΩΝ ΕΠΙΚΟΙΝΩΝΙΕΣ ΙI Εργαστήριο 9 ο : Δειγματοληψία και Ανασύσταση

Διαβάστε περισσότερα

Μάθημα 3: Αρχιτεκτονική Υπολογιστών

Μάθημα 3: Αρχιτεκτονική Υπολογιστών Μάθημα 3: Αρχιτεκτονική Υπολογιστών 3.1 Περιφερειακές μονάδες και τμήμα επεξεργασίας Στην καθημερινή μας ζωή ερχόμαστε συνέχεια σε επαφή με υπολογιστές. Ο υπολογιστής είναι μια συσκευή που επεξεργάζεται

Διαβάστε περισσότερα

Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης

Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης 1 Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης Όπως γνωρίζουμε από προηγούμενα κεφάλαια, στόχος των περισσότερων στατιστικών αναλύσεων, είναι η έγκυρη γενίκευση των συμπερασμάτων, που προέρχονται από

Διαβάστε περισσότερα

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ Σ ΤΑΤ Ι Σ Τ Ι Κ Η i ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ Κατανομή Δειγματοληψίας του Δειγματικού Μέσου Ο Δειγματικός Μέσος X είναι μια Τυχαία Μεταβλητή. Καθώς η επιλογή και χρήση διαφορετικών δειγμάτων από έναν

Διαβάστε περισσότερα

Εξόρυξη γνώμης πολιτών από ελεύθερο κείμενο

Εξόρυξη γνώμης πολιτών από ελεύθερο κείμενο Δίκαρος Νίκος Δ/νση Μηχανογράνωσης κ Η.Ε.Σ. Υπουργείο Εσωτερικών. Τελική εργασία Κ Εκπαιδευτικής Σειράς Ε.Σ.Δ.Δ. Επιβλέπων: Ηρακλής Βαρλάμης Εξόρυξη γνώμης πολιτών από ελεύθερο κείμενο Κεντρική ιδέα Προβληματισμοί

Διαβάστε περισσότερα

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium iv

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium iv Σ ΤΑΤ Ι Σ Τ Ι Κ Η i Statisticum collegium iv Στατιστική Συμπερασματολογία Ι Σημειακές Εκτιμήσεις Διαστήματα Εμπιστοσύνης Στατιστική Συμπερασματολογία (Statistical Inference) Το πεδίο της Στατιστικής Συμπερασματολογία,

Διαβάστε περισσότερα

Άσκηση 5 Υπολογισμός της σταθεράς ελατηρίου

Άσκηση 5 Υπολογισμός της σταθεράς ελατηρίου Άσκηση 5 Υπολογισμός της σταθεράς ελατηρίου Σύνοψη Σκοπός της συγκεκριμένης άσκησης είναι ο υπολογισμός της σταθεράς ενός ελατηρίου. Αυτό θα γίνει με δύο τρόπους: από την κλίση της (πειραματικής) ευθείας

Διαβάστε περισσότερα

Θεωρία Λήψης Αποφάσεων

Θεωρία Λήψης Αποφάσεων Θεωρία Λήψης Αποφάσεων Ενότητα 2: Θεωρία Απόφασης του Bayes Μπεληγιάννης Γρηγόριος Σχολή Οργάνωσης και Διοίκησης Επιχειρήσεων Τμήμα Διοίκησης Επιχειρήσεων Αγροτικών Προϊόντων & Τροφίμων (Δ.Ε.Α.Π.Τ.) Θεωρία

Διαβάστε περισσότερα

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium Iii

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium Iii Σ ΤΑΤ Ι Σ Τ Ι Κ Η i Statisticum collegium Iii Η Κανονική Κατανομή Λέμε ότι μία τυχαία μεταβλητή X, ακολουθεί την Κανονική Κατανομή με παραμέτρους και και συμβολίζουμε X N, αν έχει συνάρτηση πυκνότητας

Διαβάστε περισσότερα

Ειδικές Επιστηµονικές Εργασίες

Ειδικές Επιστηµονικές Εργασίες Ειδικές Επιστηµονικές Εργασίες 2005-2006 1. Ανίχνευση προσώπων από ακολουθίες video και παρακολούθηση (face detection & tracking) Η ανίχνευση προσώπου (face detection) αποτελεί το 1 ο βήµα σε ένα αυτόµατο

Διαβάστε περισσότερα

ΤΟΠΟΓΡΑΦΙΚΑ ΔΙΚΤΥΑ ΚΑΙ ΥΠΟΛΟΓΙΣΜΟΙ ΑΝΑΣΚΟΠΗΣΗ ΘΕΩΡΙΑΣ ΣΥΝΟΡΘΩΣΕΩΝ

ΤΟΠΟΓΡΑΦΙΚΑ ΔΙΚΤΥΑ ΚΑΙ ΥΠΟΛΟΓΙΣΜΟΙ ΑΝΑΣΚΟΠΗΣΗ ΘΕΩΡΙΑΣ ΣΥΝΟΡΘΩΣΕΩΝ ΤΟΠΟΓΡΑΦΙΚΑ ΔΙΚΤΥΑ ΚΑΙ ΥΠΟΛΟΓΙΣΜΟΙ ΑΝΑΣΚΟΠΗΣΗ ΘΕΩΡΙΑΣ ΣΥΝΟΡΘΩΣΕΩΝ Βασίλης Δ. Ανδριτσάνος Δρ. Αγρονόμος - Τοπογράφος Μηχανικός ΑΠΘ Επίκουρος Καθηγητής ΤΕΙ Αθήνας 3ο εξάμηνο http://eclass.teiath.gr Παρουσιάσεις,

Διαβάστε περισσότερα

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΚΑΙ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΠΛΗΡΟΦΟΡΙΑΣ ΠΑΡΟΥΣΙΑΣΗ ΤΕΛΙΚΗΣ ΕΡΓΑΣΙΑΣ ΛΙΝΑ ΜΑΣΣΟΥ

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΚΑΙ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΠΛΗΡΟΦΟΡΙΑΣ ΠΑΡΟΥΣΙΑΣΗ ΤΕΛΙΚΗΣ ΕΡΓΑΣΙΑΣ ΛΙΝΑ ΜΑΣΣΟΥ ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΚΑΙ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΠΑΡΟΥΣΙΑΣΗ ΤΕΛΙΚΗΣ ΕΡΓΑΣΙΑΣ ΛΙΝΑ ΜΑΣΣΟΥ Δ.Π.Μ.Σ: «Εφαρμοσμένες Μαθηματικές Επιστήμες» 2008

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 7 ΕΠΕΞΕΡΓΑΣΙΑ ΚΑΙ ΜΕΤΑΔΟΣΗ ΨΗΦΙΑΚΩΝ ΔΕΔΟΜΕΝΩΝ

ΚΕΦΑΛΑΙΟ 7 ΕΠΕΞΕΡΓΑΣΙΑ ΚΑΙ ΜΕΤΑΔΟΣΗ ΨΗΦΙΑΚΩΝ ΔΕΔΟΜΕΝΩΝ ΚΕΦΑΛΑΙΟ 7 ΕΠΕΞΕΡΓΑΣΙΑ ΚΑΙ ΜΕΤΑΔΟΣΗ ΨΗΦΙΑΚΩΝ ΔΕΔΟΜΕΝΩΝ 1 ΕΙΣΑΓΩΓΗ Ο πραγματικός κόσμος είναι ένας αναλογικός κόσμος. Όλα τα μεγέθη παίρνουν τιμές με άπειρη ακρίβεια. Π.χ. το ηλεκτρικό σήμα τάσης όπου κάθε

Διαβάστε περισσότερα

ΠΕΙΡΑΜΑΤΙΚΕΣ ΠΡΟΣΟΜΟΙΩΣΕΙΣ ΚΕΦΑΛΑΙΟ 4. είναι η πραγματική απόκριση του j δεδομένου (εκπαίδευσης ή ελέγχου) και y ˆ j

ΠΕΙΡΑΜΑΤΙΚΕΣ ΠΡΟΣΟΜΟΙΩΣΕΙΣ ΚΕΦΑΛΑΙΟ 4. είναι η πραγματική απόκριση του j δεδομένου (εκπαίδευσης ή ελέγχου) και y ˆ j Πειραματικές Προσομοιώσεις ΚΕΦΑΛΑΙΟ 4 Όλες οι προσομοιώσεις έγιναν σε περιβάλλον Matlab. Για την υλοποίηση της μεθόδου ε-svm χρησιμοποιήθηκε το λογισμικό SVM-KM που αναπτύχθηκε στο Ecole d Ingenieur(e)s

Διαβάστε περισσότερα

ΕΛΕΓΧΟΣ ΠΑΡΑΓΩΓΙΚΩΝ ΔΙΕΡΓΑΣΙΩΝ

ΕΛΕΓΧΟΣ ΠΑΡΑΓΩΓΙΚΩΝ ΔΙΕΡΓΑΣΙΩΝ ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Ανώτατο Εκπαιδευτικό Ίδρυμα Πειραιά Τεχνολογικού Τομέα ΕΛΕΓΧΟΣ ΠΑΡΑΓΩΓΙΚΩΝ ΔΙΕΡΓΑΣΙΩΝ Ενότητα: Αναγνώριση Διεργασίας - Προσαρμοστικός Έλεγχος (Process Identification) Αλαφοδήμος Κωνσταντίνος

Διαβάστε περισσότερα

Φίλτρα Kalman. Αναλυτικές μέθοδοι στη Γεωπληροφορική. ιατύπωση του βασικού προβλήματος. προβλήματος. μοντέλο. Πρωτεύων μοντέλο

Φίλτρα Kalman. Αναλυτικές μέθοδοι στη Γεωπληροφορική. ιατύπωση του βασικού προβλήματος. προβλήματος. μοντέλο. Πρωτεύων μοντέλο Φίλτρα Kalman Εξαγωγή των εξισώσεων τους με βάση το κριτήριο ελαχιστοποίησης της Μεθόδου των Ελαχίστων Τετραγώνων. Αναλυτικές Μέθοδοι στη Γεωπληροφορική Μεταπτυχιακό Πρόγραμμα ΓΕΩΠΛΗΡΟΦΟΡΙΚΗ ιατύπωση του

Διαβάστε περισσότερα

Μάθηση και Γενίκευση. "Τεχνητά Νευρωνικά Δίκτυα" (Διαφάνειες), Α. Λύκας, Παν. Ιωαννίνων

Μάθηση και Γενίκευση. Τεχνητά Νευρωνικά Δίκτυα (Διαφάνειες), Α. Λύκας, Παν. Ιωαννίνων Μάθηση και Γενίκευση Το Πολυεπίπεδο Perceptron (MultiLayer Perceptron (MLP)) Έστω σύνολο εκπαίδευσης D={(x n,t n )}, n=1,,n. x n =(x n1,, x nd ) T, t n =(t n1,, t np ) T Θα πρέπει το MLP να έχει d νευρώνες

Διαβάστε περισσότερα

Εισαγωγή στις Ηλεκτρικές Μετρήσεις

Εισαγωγή στις Ηλεκτρικές Μετρήσεις Εισαγωγή στις Ηλεκτρικές Μετρήσεις Σφάλματα Μετρήσεων Συμβατικά όργανα μετρήσεων Χαρακτηριστικά μεγέθη οργάνων Παλμογράφος Λέκτορας Σοφία Τσεκερίδου 1 Σφάλματα μετρήσεων Επιτυχημένη μέτρηση Σωστή εκλογή

Διαβάστε περισσότερα

4.3. Γραµµικοί ταξινοµητές

4.3. Γραµµικοί ταξινοµητές Γραµµικοί ταξινοµητές Γραµµικός ταξινοµητής είναι ένα σύστηµα ταξινόµησης που χρησιµοποιεί γραµµικές διακριτικές συναρτήσεις Οι ταξινοµητές αυτοί αναπαρίστανται συχνά µε οµάδες κόµβων εντός των οποίων

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ. ΠΡΟΛΟΓΟΣ... vii ΠΕΡΙΕΧΟΜΕΝΑ... ix ΓΕΝΙΚΗ ΒΙΒΛΙΟΓΡΑΦΙΑ... xv. Κεφάλαιο 1 ΓΕΝΙΚΕΣ ΕΝΝΟΙΕΣ ΑΠΟ ΤΗ ΣΤΑΤΙΣΤΙΚΗ

ΠΕΡΙΕΧΟΜΕΝΑ. ΠΡΟΛΟΓΟΣ... vii ΠΕΡΙΕΧΟΜΕΝΑ... ix ΓΕΝΙΚΗ ΒΙΒΛΙΟΓΡΑΦΙΑ... xv. Κεφάλαιο 1 ΓΕΝΙΚΕΣ ΕΝΝΟΙΕΣ ΑΠΟ ΤΗ ΣΤΑΤΙΣΤΙΚΗ ΠΡΟΛΟΓΟΣ... vii ΠΕΡΙΕΧΟΜΕΝΑ... ix ΓΕΝΙΚΗ ΒΙΒΛΙΟΓΡΑΦΙΑ... xv Κεφάλαιο 1 ΓΕΝΙΚΕΣ ΕΝΝΟΙΕΣ ΑΠΟ ΤΗ ΣΤΑΤΙΣΤΙΚΗ 1.1 Πίνακες, κατανομές, ιστογράμματα... 1 1.2 Πυκνότητα πιθανότητας, καμπύλη συχνοτήτων... 5 1.3

Διαβάστε περισσότερα

ΕΡΕΥΝΗΤΙΚΑ ΠΡΟΓΡΑΜΜΑΤΑ ΑΡΧΙΜΗΔΗΣ ΕΝΙΣΧΥΣΗ ΕΡΕΥΝΗΤΙΚΩΝ ΟΜΑΔΩΝ ΣΤΟ ΤΕΙ ΣΕΡΡΩΝ. Ενέργεια. 2.2.3.στ ΘΕΜΑ ΕΡΕΥΝΑΣ: ΔΙΑΡΘΡΩΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΕΧΡΩΜΩΝ ΕΓΓΡΑΦΩΝ

ΕΡΕΥΝΗΤΙΚΑ ΠΡΟΓΡΑΜΜΑΤΑ ΑΡΧΙΜΗΔΗΣ ΕΝΙΣΧΥΣΗ ΕΡΕΥΝΗΤΙΚΩΝ ΟΜΑΔΩΝ ΣΤΟ ΤΕΙ ΣΕΡΡΩΝ. Ενέργεια. 2.2.3.στ ΘΕΜΑ ΕΡΕΥΝΑΣ: ΔΙΑΡΘΡΩΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΕΧΡΩΜΩΝ ΕΓΓΡΑΦΩΝ ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ (Τ.Ε.Ι.) ΣΕΡΡΩΝ Τμήμα ΠΛΗΡΟΦΟΡΙΚΗΣ & ΕΠΙΚΟΙΝΩΝΙΩΝ ΕΡΕΥΝΗΤΙΚΑ ΠΡΟΓΡΑΜΜΑΤΑ ΑΡΧΙΜΗΔΗΣ ΕΝΙΣΧΥΣΗ ΕΡΕΥΝΗΤΙΚΩΝ ΟΜΑΔΩΝ ΣΤΟ ΤΕΙ ΣΕΡΡΩΝ Ενέργεια. 2.2.3.στ ΘΕΜΑ ΕΡΕΥΝΑΣ: ΔΙΑΡΘΡΩΣΗ

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 6-7 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Λέκτορας v.koutras@fme.aegea.gr Τηλ: 735468 Σε αρκετές εφαρμογές

Διαβάστε περισσότερα

x 2,, x Ν τον οποίον το αποτέλεσμα επηρεάζεται από

x 2,, x Ν τον οποίον το αποτέλεσμα επηρεάζεται από Στη θεωρία, θεωρία και πείραμα είναι τα ΘΕΩΡΙΑ ΣΦΑΛΜΑΤΩΝ... υπό ισχυρή συμπίεση ίδια αλλά στο πείραμα είναι διαφορετικά, A.Ensten Οι παρακάτω σημειώσεις περιέχουν τα βασικά σημεία που πρέπει να γνωρίζει

Διαβάστε περισσότερα

Σχολή Διοίκησης και Οικονομίας. Μεταπτυχιακή διατριβή

Σχολή Διοίκησης και Οικονομίας. Μεταπτυχιακή διατριβή Σχολή Διοίκησης και Οικονομίας Μεταπτυχιακή διατριβή Samsung και Apple: Αναλύοντας τη χρηματοοικονομική πληροφόρηση των ηγετών της τεχνολογίας και η επίδραση των εξωτερικών και ενδοεπιχειρησιακών παραγόντων

Διαβάστε περισσότερα

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Ανώτατο Εκπαιδευτικό Ίδρυμα Πειραιά Τεχνολογικού Τομέα. Ελεγκτική

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Ανώτατο Εκπαιδευτικό Ίδρυμα Πειραιά Τεχνολογικού Τομέα. Ελεγκτική ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Ανώτατο Εκπαιδευτικό Ίδρυμα Πειραιά Τεχνολογικού Τομέα Ελεγκτική Ενότητα # 12: Εισαγωγή στην επιλογή μονάδων και τη δειγματοληψία Νικόλαος Συκιανάκης Τμήμα Λογιστικής και Χρηματοοικονομικής

Διαβάστε περισσότερα

Α. ΔΙΑΓΡΑΜΜΑ ΔΙΑΣΠΟΡΑΣ Απεικόνιση της σχέσης(θετική, αρνητική, απροσδιόριστη) δύο μεταβλητών. Παραδείγματα σχέσεων. Παράδειγμα

Α. ΔΙΑΓΡΑΜΜΑ ΔΙΑΣΠΟΡΑΣ Απεικόνιση της σχέσης(θετική, αρνητική, απροσδιόριστη) δύο μεταβλητών. Παραδείγματα σχέσεων. Παράδειγμα Α. ΔΙΑΓΡΑΜΜΑ ΔΙΑΣΠΟΡΑΣ Απεικόνιση της σχέσης(θετική, αρνητική, απροσδιόριστη) δύο μεταβλητών. Παραδείγματα σχέσεων Παράδειγμα Μας δίνονται τα παρακάτω δεδομένα που αντιπροσωπεύουν τις τιμές πίεσης σε ατμόσφαιρες

Διαβάστε περισσότερα

Άσκηση 4 Θεμελιώδης νόμος της Μηχανικής

Άσκηση 4 Θεμελιώδης νόμος της Μηχανικής Άσκηση 4 Θεμελιώδης νόμος της Μηχανικής Σύνοψη Η άσκηση αυτή διαφέρει από όλες τις άλλες. Σκοπός της είναι η πειραματική επαλήθευση του θεμελιώδους νόμου της Μηχανικής. Αυτό θα γίνει με τη γραφική ανάλυση

Διαβάστε περισσότερα

«Αξιολόγηση ατόμων με αφασία για Επαυξητική και Εναλλακτική Επικοινωνία, σύμφωνα με το μοντέλο συμμετοχής»

«Αξιολόγηση ατόμων με αφασία για Επαυξητική και Εναλλακτική Επικοινωνία, σύμφωνα με το μοντέλο συμμετοχής» Σχολή Επιστημών Υγείας Τμήμα Αποκατάστασης ΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ «Αξιολόγηση ατόμων με αφασία για Επαυξητική και Εναλλακτική Επικοινωνία, σύμφωνα με το μοντέλο συμμετοχής» Χρυσάνθη Μοδέστου Λεμεσός, Μάιος,

Διαβάστε περισσότερα

ΤΕΧΝΙΚΕΣ ΠΡΟΔΙΑΓΡΑΦΕΣ ΟΠΤΙΚΗΣ ΤΟΜΟΓΡΑΦΙΑΣ ΣΥΝΟΧΗΣ-OCT ΜΕ ΨΗΦΙΑΚΗ ΑΓΓΕΙΟΓΡΑΦΙΑ

ΤΕΧΝΙΚΕΣ ΠΡΟΔΙΑΓΡΑΦΕΣ ΟΠΤΙΚΗΣ ΤΟΜΟΓΡΑΦΙΑΣ ΣΥΝΟΧΗΣ-OCT ΜΕ ΨΗΦΙΑΚΗ ΑΓΓΕΙΟΓΡΑΦΙΑ ΤΕΧΝΙΚΕΣ ΠΡΟΔΙΑΓΡΑΦΕΣ ΟΠΤΙΚΗΣ ΤΟΜΟΓΡΑΦΙΑΣ ΣΥΝΟΧΗΣ-OCT ΜΕ ΨΗΦΙΑΚΗ ΑΓΓΕΙΟΓΡΑΦΙΑ Τα σύγχρονα μηχανήματα οπτικής τομογραφίας συνοχής με δυνατότητα μη επεμβατικής αγγειογραφίας αλλά και ελέγχου του προσθίου

Διαβάστε περισσότερα

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2 Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας Verson 2 1 M = 1 N = N prob k N k { k n ω wrongly classfed} = (1 ) N k 2 Η συνάρτηση πιθανοφάνειας L(p) μεγιστοποιείται όταν =k/n. 3 Αφού τα s είναι άγνωστα,

Διαβάστε περισσότερα

Αναγνώριση Προτύπων Εργασία 1η Classification

Αναγνώριση Προτύπων Εργασία 1η Classification ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΤΜΗΜΑ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ & ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ Αναγνώριση Προτύπων Εργασία 1η Classification Κιντσάκης Αθανάσιος 6667 Μόσχογλου Στυλιανός 6978 30 Νοεμβρίου,

Διαβάστε περισσότερα

ΔΙΔΑΣΚΑΛΙΑ ΤΗΣ ΕΝΝΟΙΑΣ ΤΟΥ ΟΡΙΟΥ ΣΥΝΑΡΤΗΣΗΣ

ΔΙΔΑΣΚΑΛΙΑ ΤΗΣ ΕΝΝΟΙΑΣ ΤΟΥ ΟΡΙΟΥ ΣΥΝΑΡΤΗΣΗΣ ΕΠΙΜΟΡΦΩΣΗ ΤΩΝ ΕΚΠΑΙΔΕΥΤΙΚΩΝ ΓΙΑ ΤΗΝ ΑΞΙΟΠΟΙΗΣΗ ΚΑΙ ΕΦΑΡΜΟΓΗ ΤΩΝ ΤΠΕ ΣΤΗ ΔΙΔΑΚΤΙΚΗ ΠΡΑΞΗ ΔΙΔΑΣΚΑΛΙΑ ΤΗΣ ΕΝΝΟΙΑΣ ΤΟΥ ΟΡΙΟΥ ΣΥΝΑΡΤΗΣΗΣ ΟΡΙΟ ΣΥΝΑΡΤΗΣΗΣ ΕΞ ΑΡΙΣΤΕΡΩΝ ΚΑΙ ΕΚ ΔΕΞΙΩΝ ΣΥΓΓΡΑΦΕΑΣ: ΚΟΥΤΙΔΗΣ ΙΩΑΝΝΗΣ

Διαβάστε περισσότερα

Το μοντέλο Perceptron

Το μοντέλο Perceptron Το μοντέλο Perceptron Αποτελείται από έναν μόνο νευρώνα McCulloch-Pitts w j x x 1, x2,..., w x T 1 1 x 2 w 2 Σ u x n f(u) Άνυσμα Εισόδου s i x j x n w n -θ w w 1, w2,..., w n T Άνυσμα Βαρών 1 Το μοντέλο

Διαβάστε περισσότερα

Άσκηση 3 Υπολογισμός του μέτρου της ταχύτητας και της επιτάχυνσης

Άσκηση 3 Υπολογισμός του μέτρου της ταχύτητας και της επιτάχυνσης Άσκηση 3 Υπολογισμός του μέτρου της ταχύτητας και της επιτάχυνσης Σύνοψη Σκοπός της συγκεκριμένης άσκησης είναι ο υπολογισμός του μέτρου της στιγμιαίας ταχύτητας και της επιτάχυνσης ενός υλικού σημείου

Διαβάστε περισσότερα

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2 Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας Verson ΧΑΡΤΟΓΡΑΦΗΣΗ ΤΟΥ ΧΩΡΟΥ ΤΩΝ ΤΑΞΙΝΟΜΗΤΩΝ Ταξινομητές Ταξινομητές συναρτ. διάκρισης Ταξινομητές επιφανειών απόφ. Παραμετρικοί ταξινομητές Μη παραμετρικοί

Διαβάστε περισσότερα

Σύγχρονη Φυσική 1, Διάλεξη 3, Τμήμα Φυσικής, Παν/μιο Ιωαννίνων Η θεωρία του αιθέρα καταρρίπτεται από το πείραμα των Michelson και Morley

Σύγχρονη Φυσική 1, Διάλεξη 3, Τμήμα Φυσικής, Παν/μιο Ιωαννίνων Η θεωρία του αιθέρα καταρρίπτεται από το πείραμα των Michelson και Morley 1 Η θεωρία του αιθέρα καταρρίπτεται από το πείραμα των Mihelson και Morley 0.10.011 Σκοποί της τρίτης διάλεξης: Να κατανοηθεί η ιδιαιτερότητα των ηλεκτρομαγνητικών κυμάτων (π. χ. φως) σε σχέση με άλλα

Διαβάστε περισσότερα

ΧΡΗΣΗ ΝΕΩΝ ΟΠΤΙΚΩΝ ΚΑΙ ΨΗΦΙΑΚΩΝ ΜΕΘΟΔΩΝ ΓΙΑ ΤΗΝ ΑΝΤΙΓΡΑΦΗ ΤΡΙΣΔΙΑΣΤΑΤΩΝ ΑΝΤΙΚΕΙΜΕΝΩΝ ΣΤΕΦΑΝΙΑ ΧΛΟΥΒΕΡΑΚΗ 2014

ΧΡΗΣΗ ΝΕΩΝ ΟΠΤΙΚΩΝ ΚΑΙ ΨΗΦΙΑΚΩΝ ΜΕΘΟΔΩΝ ΓΙΑ ΤΗΝ ΑΝΤΙΓΡΑΦΗ ΤΡΙΣΔΙΑΣΤΑΤΩΝ ΑΝΤΙΚΕΙΜΕΝΩΝ ΣΤΕΦΑΝΙΑ ΧΛΟΥΒΕΡΑΚΗ 2014 ΧΡΗΣΗ ΝΕΩΝ ΟΠΤΙΚΩΝ ΚΑΙ ΨΗΦΙΑΚΩΝ ΜΕΘΟΔΩΝ ΓΙΑ ΤΗΝ ΑΝΤΙΓΡΑΦΗ ΤΡΙΣΔΙΑΣΤΑΤΩΝ ΑΝΤΙΚΕΙΜΕΝΩΝ ΣΤΕΦΑΝΙΑ ΧΛΟΥΒΕΡΑΚΗ 2014 ΧΡΗΣΗ ΝΕΩΝ ΟΠΤΙΚΩΝ ΚΑΙ ΨΗΦΙΑΚΩΝ ΜΕΘΟΔΩΝ ΓΙΑ ΤΗΝ ΑΝΤΙΓΡΑΦΗ ΤΡΙΣΔΙΑΣΤΑΤΩΝ ΑΝΤΙΚΕΙΜΕΝΩΝ Η χρήση

Διαβάστε περισσότερα

Εναλλακτικές στρατηγικές, Πρακτικές και Προσεγγίσεις για κατάκτηση πυρηνικών γνώσεων και ορολογίας

Εναλλακτικές στρατηγικές, Πρακτικές και Προσεγγίσεις για κατάκτηση πυρηνικών γνώσεων και ορολογίας Διδασκαλία του μαθήματος της Φυσικής για μαθητές/τριες με μεταναστευτική βιογραφία που παρακολουθούν μαθήματα Ελληνικής ως δεύτερης γλώσσας στις μεταβατικές τάξεις: Εναλλακτικές στρατηγικές, Πρακτικές

Διαβάστε περισσότερα

Άσκηση 6 Ώθηση δύναμης Μεταβολή ορμής

Άσκηση 6 Ώθηση δύναμης Μεταβολή ορμής Άσκηση 6 Ώθηση δύναμης Μεταβολή ορμής Σύνοψη Σκοπός της συγκεκριμένης άσκησης είναι η κατανόηση του φυσικού διανυσματικού μεγέθους ώθηση δύναμης και η σχέση του με: τη μεταβολή της ορμής υλικού σημείου

Διαβάστε περισσότερα

Είναι γνωστό ότι η δύναμη που ασκείται σε ένα ελατήριο και ονομάζεται δύναμη επαναφοράς δίνεται από τη σχέση : F = kx (3.1)

Είναι γνωστό ότι η δύναμη που ασκείται σε ένα ελατήριο και ονομάζεται δύναμη επαναφοράς δίνεται από τη σχέση : F = kx (3.1) 3.1. Εισαγωγή Είναι γνωστό ότι η δύναμη που ασκείται σε ένα ελατήριο και ονομάζεται δύναμη επαναφοράς δίνεται από τη σχέση : F = kx (3.1) Αν ϑελήσουμε να υπολογίσουμε το έργο της δύναμης αυτής μεταξύ δύο

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 7-8 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Επικ. Καθηγητής v.koutras@fme.aegea.gr Τηλ: 735468 Σε αρκετές εφαρμογές

Διαβάστε περισσότερα

Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500

Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500 Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500 Πληθυσμός Δείγμα Δείγμα Δείγμα Ο ρόλος της Οικονομετρίας Οικονομική Θεωρία Διατύπωση της

Διαβάστε περισσότερα

ΠΑΡΟΥΣΙΑΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ

ΠΑΡΟΥΣΙΑΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ ο Κεφάλαιο: Στατιστική ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΚΑΙ ΟΡΙΣΜΟΙ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ Πληθυσμός: Λέγεται ένα σύνολο στοιχείων που θέλουμε να εξετάσουμε με ένα ή περισσότερα χαρακτηριστικά. Μεταβλητές X: Ονομάζονται

Διαβάστε περισσότερα

Διπλωματική Εργασία Αναγνώριση και ταξινόμηση ιστολόγιων. Αναστασιάδης Αντώνιος

Διπλωματική Εργασία Αναγνώριση και ταξινόμηση ιστολόγιων. Αναστασιάδης Αντώνιος Αναστασιάδης Αντώνιος Τα ιστολόγια σήμερα Διπλωματική Εργασία Η σημασία των πληροφοριών των ιστολόγιων Μέθοδοι κατάτμησης ιστολόγιων Αξιολόγηση κατάτμησης Ταξινόμηση καταχωρήσεων Αξιολόγηση ταξινόμησης

Διαβάστε περισσότερα

Εργαστηριακή άσκηση L0: Ασφάλεια και προστασία από ακτινοβολία Laser. Σύγκριση έντασης ακτινοβολίας Laser με συμβατικές πηγές φωτός

Εργαστηριακή άσκηση L0: Ασφάλεια και προστασία από ακτινοβολία Laser. Σύγκριση έντασης ακτινοβολίας Laser με συμβατικές πηγές φωτός Εργαστηριακή άσκηση L0: Ασφάλεια και προστασία από ακτινοβολία Laser. Σύγκριση έντασης ακτινοβολίας Laser με συμβατικές πηγές φωτός Σκοπός: Σκοπός της άσκησης αυτής είναι η κατανόηση και επίγνωση των κινδύνων

Διαβάστε περισσότερα

Βασίλειος Μαχαιράς Πολιτικός Μηχανικός Ph.D.

Βασίλειος Μαχαιράς Πολιτικός Μηχανικός Ph.D. Βασίλειος Μαχαιράς Πολιτικός Μηχανικός Ph.D. Μη γραμμικός προγραμματισμός: βελτιστοποίηση χωρίς περιορισμούς Πανεπιστήμιο Θεσσαλίας Σχολή Θετικών Επιστημών ΤμήμαΠληροφορικής Διάλεξη 7-8 η /2017 Τι παρουσιάστηκε

Διαβάστε περισσότερα