Αναγνώριση Προτύπων από Εικόνες

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "Αναγνώριση Προτύπων από Εικόνες"

Transcript

1 ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΣΧΟΛΗ ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΜΑΘΗΜΑΤΙΚΩΝ ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ Αναγνώριση Προτύπων από Εικόνες Συγγραφέας: Χάρης Κωτσιόπουλος Επιβλέπων Καθηγητής: Σωτήρης Κωτσιαντής Υποβάλλεται προς εκπλήρωση των απαιτήσεων για το Μεταπτυχιακό Δίπλωμα Ειδίκευσης στο Τμήμα Μαθηματικών 2014

2

3 ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΣΧΟΛΗ ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΜΑΘΗΜΑΤΙΚΩΝ ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ Αναγνώριση Προτύπων από Εικόνες Συγγραφέας: Χάρης Κωτσιόπουλος Επιβλέπων Καθηγητής: Σωτήρης Κωτσιαντής Υποβάλλεται προς εκπλήρωση των απαιτήσεων για το Μεταπτυχιακό Δίπλωμα Ειδίκευσης στο Τμήμα Μαθηματικών Τριμελής Εξεταστική Επιτροπή Σωτήρης Κωτσιαντής Λέκτορας (Επιβλέπων) Θεοδούλα Γράψα Αναπλ. Καθηγήτρια Όμηρος Ράγγος Επίκουρος Καθηγητής 2014

4

5 Δήλωση Συγγραφικής Πατρότητας Εγώ, ο Χάρης Κωτσιόπουλος, δηλώνω ότι το περιεχόμενο της διπλωματικής εργασίας "Αναγνώριση Προτύπων από Εικόνες" και όσα παρουσιάζονται σε αυτήν είναι προϊόν δικής μου δουλειάς και υπάρχουν αναφορές σε όλες τις πηγές που χρησιμοποίησα. Δηλώνω υπεύθυνα ότι η παρούσα εργασία για τη λήψη του μεταπτυχιακού τίτλου σπουδών του Διατμηματικού Μεταπτυχιακού Προγράμματος "Μαθηματικά των Υπολογιστών και των Αποφάσεων" δεν έχει υποβληθεί ούτε έχει εγκριθεί στο πλαίσιο κάποιου άλλου μεταπτυχιακού ή προπτυχιακού τίτλου σπουδών, στην Ελλάδα ή στο εξωτερικό. Υπογραφή: Ημερομηνία: iii

6

7 Ego = 1 Knowledge `` More the knowledge Lesser the Ego, Lesser the Knowledge More the Ego... -Albert Einstein. v

8

9 Αυτή η διπλωματική εργασία στοιχειοθετήθηκε με το πρόγραμμα LATEX (διανομή MIK- TEX) χρησιμοποιώντας το πρότυπο thesis. Η συγγραφή της έγινε με τη βοήθεια του προγράμματος Texmaker (στο λειτουργικό σύστημα UBUNTU LINUX). Για τη δημιουργία των προγραμμάτων χρησιμοποιήθηκε κυρίως το πρόγραμμα MATLAB. Οι γραφικές παραστάσεις έγιναν με τη βοήθεια του προγράμματος MATLAB, ενώ η επεξεργασία των σχημάτων έγινε με το πρόγραμμα Snagit. vii

10

11 Περίληψη Ηπαρούσα διπλωματική εργασία ασχολείται με ένα σημαντικό ερευνητικό πρόβλημα του πεδίου της υπολογιστικής όρασης το οποίο είναι η Αναγνώριση Προτύπων (pattern recognition) μέσα από εικόνες. Πιο συγκεκριμένα, θα μελετήσουμε τον σχεδιασμό και την υλοποίηση ενός συστήματος αναγνώρισης αντικειμένων από ψηφιακές εικόνες καθώς και την ταξινόμησή τους σε κατηγορίες (image classification). Η εργασία είναι οργανωμένη ως εξής: Στο Κεφάλαιο 1 κάνουμε μία εισαγωγή στην επιστημονική περιοχή της αναγνώρισης προτύπων. Θα τονίσουμε την σπουδαιότητα καθώς και την ανάγκη που μας οδηγεί στην εξεύρεση προτύπων. Επιπλέον, περιγράφουμε εν συντομία μερικά στάδια της εξόρυξης γνώσης από εικόνες. Η καταγραφή δεν είναι πλήρης αλλά προσπαθεί να είναι αρκετά επεξηγηματική. Το Κεφάλαιο 2 μας μεταφέρει σε δύο σημαντικούς αλγορίθμους ανίχνευσης αντικειμένων. Αυτοί είναι οι: Sift (Scale Invarient Feature Transform) και Surf (Speeded-Up Robust Features) οι οποίοι βρίσκονται υλοποιημένοι και στην εφαρμογή που δημιουργήθηκε στα πλαίσια αυτής της εργασίας. Στο Κεφάλαιο 3 αναφερόμαστε σε μία σημαντική τεχνική μείωσης της διάστασης ενός συνόλου δεδομένων, την ανάλυση σε κύριες συνιστώσες. Αρχικά κάνουμε μία εισαγωγή στην αναγκαιότητα της μείωσης της διάστασης και εν συνεχεία παρουσιάζουμε την μαθηματική θεμελίωση των κύριων συνιστωσών. Στο Κεφάλαιο 4 ασχολούμαστε με μεθόδους ταξινόμησης. Στην αρχή παρουσιάζεται το μοντέλο των τεχνητών νευρωνικών δικτύων. Στη συνέχεια αναφερόμαστε στις Μηχανές Υποστήριξης Διανυσμάτων SVM (Support Vector Machine). Η μέθοδος αυτή έχει εδραιωθεί ως μία από τις πιο διαδεδομένες μεθόδους ταξινόμησης, αποτελώντας συνάμα και μία βέλτιστη επιλογή για πολλά προβλήματα του χώρου της εξόρυξης γνώσης. Στο Κεφάλαιο 5 παρουσιάζουμε το λογισμικό που δημιουργήσαμε, και βάση αυτού εξάγαμε τα αποτελέσματα της εργασίας μας. Στο Κεφάλαιο 6 προβάλουμε την βάση δεδομένων του πειράματός μας και χρησιμοποιώντας τους αλγορίθμους καθώς και τις μεθόδους ταξινόμησης που αναφέραμε στα προηγούμενα κεφάλαια, εξάγουμε τα αποτελέσματά μας. ix

12 Η εργασία κλείνει με το Κεφάλαιο 7 στο οποίο αναφερόμαστε στα συμπεράσματα που προκύπτουν από τα αποτελέσματα του πειράματός μας και σε πιθανές μελλοντικές επεκτάσεις. x

13 Ευχαριστίες Με την ευκαιρία της ολοκλήρωσης της Μεταπτυχιακής μου εργασίας θα ήθελα να ευχαριστήσω ορισμένα άτομα, τα οποία συνέβαλαν στην περάτωση αυτής της εργασίας. Θα ήθελα πρωτίστως να ευχαριστήσω τον επιβλέποντα καθηγητή μου, λέκτορα κ. Σωτήριο Κωτσιαντή για τη βοήθεια που μου προσέφερε. Ήταν πάντα διαθέσιμος να μου προσφέρει τις γνώσεις και την εμπειρία του για την βαθύτερη κατανόηση της περιοχής της Ανεύρεσης Γνώσης. Η καθοδήγησή του καθώς και οι συμβουλές που μου προσέφερε ήταν καταλυτικές για να έρθει σε πέρας η παρούσα διπλωματική εργασία. Στη συνέχεια, θα ήθελα να ευχαριστήσω τους καθηγητές που συνεργάστηκα μαζί τους. Τους ευχαριστώ θερμά για τις ιδέες που μου προσέφεραν καθ όλη τη διάρκεια παραμονής μου στο Πανεπιστήμιο Πατρών. Δεν θα μπορούσα να ξεχάσω τους συμφοιτητές και τους φίλους που απέκτησα κατά τη διάρκεια των σπουδών μου και όχι μόνο, που χωρίς την βοήθεια, την υποστήριξη και τις συμβουλές τους δεν θα μπορούσα να βγάλω εις πέρας τις υποχρεώσεις μου. Βέβαια, το μεγαλύτερο ευχαριστώ το οφείλω στην οικογένειά μου, της οποίας η πίστη στις δυνατότητές μου αποτέλεσε αρωγός σε όλους τους στόχους και τα όνειρά μου. Χάρης Κωτσιόπουλος Πάτρα, 2014 xi

14

15 Περιεχόμενα Δήλωση Συγγραφικής Πατρότητας iii Περίληψη ix Ευχαριστίες xi Περιεχόμενα xiii Κατάλογος σχημάτων xvii Κατάλογος πινάκων xxi 1 Εισαγωγή Αναγνώριση Προτύπων Υπολογιστική Όραση Υποβοηθούμενη από τον Υπολογιστή Διάγνωση Εξόρυξη Δεδομένων και Ανακάλυψη Γνώσης Η αναγκαιότητα της αναγνώρισης προτύπων από εικόνες Βασικά στάδια εξόρυξης γνώσης από εικόνες Προεπεξεργασία εικόνων Εξαγωγή παραμέτρων Εξαγωγή προτύπων xiii

16 xiv Περιεχόμενα Κατηγοριοποίηση - Πρόβλεψη Παλινδρόμηση Συσταδοποίηση Αξιολόγηση προτύπων Μέτρα αξιολόγησης στην κατηγοριοποίηση Τεχνικές "ισχυροποίησης" αποτελεσματικότητας ενός προβλεπτικού μοντέλου Αναπαράσταση Προτύπων Εισαγωγή Ο αλγόριθμος SIFT Ανίχνευση ακρότατων στο χώρο της κλιμάκωσης Εντοπισμός σημείων κλειδιών Καθορισμός προσανατολισμού Περιγραφή των σημείων κλειδιών Ο αλγόριθμος SURF Εικόνες ολοκλήρωμα Ανίχνευση σημείων ενδιαφέροντος Εντοπισμός σημείων ενδιαφέροντος Ανάθεση προσανατολισμού στα σημεία ενδιαφέροντος Ο περιγραφέας του SURF Συγκρίνοντας τους αλγορίθμους SIFT & SURF Μείωση Διάστασης Δεδομένων Εισαγωγή Ανάλυση Κύριων Συνιστωσών Η βασική ιδέα της μεθόδου των κύριων συνιστωσών Υπολογισμός Κυρίων Συνιστωσών

17 Περιεχόμενα xv 4 Τεχνικές Κατηγοριοποίησης Εισαγωγή Τεχνητά Νευρωνικά Δίκτυα Ιστορική αναδρομή των ΤΝΔ Από τα βιολογικά στα τεχνητά νευρωνικά δίκτυα Εισαγωγή στα τεχνητά νευρωνικά δίκτυα Αρχιτεκτονικές των ΤΝΔ Δίκτυα εμπρόσθιας τροφοδότησης Δίκτυα με ανατροφοδότηση Μάθηση-Εκπαίδευση ΤΝΔ Μάθηση με διόρθωση σφάλματος Μάθηση με επίβλεψη Μάθηση χωρίς επίβλεψη Μηχανές Διανυσμάτων Υποστήριξης Εισαγωγή στα SVMs Γραμμικά διαχωρίσιμα πρότυπα Μη γραμμικά διαχωρίσιμα πρότυπα Συναρτήσεις Πυρήνα Ταξινόμηση πολλών κλάσεων Υλοποίηση Συστήματος Αναγνώρισης Προτύπων Παράθυρο προεπεξεργασίας Διαθέσιμες λειτουργίες προεπεξεργασίας Παράθυρο ταξινόμησης Διαθέσιμες λειτουργίες ταξινόμησης

18 xvi Περιεχόμενα 6 Εκτέλεση Πειράματος Η βάση δεδομένων μας Δημιουργία συνόλων εκπαίδευσης και ελέγχου Προεπεξεργασία δεδομένων και ταξινόμηση Αποτελέσματα Ταξινομητών Συμπεράσματα 77 Παράρτημα A 79 Βιβλιογραφία 83

19 Κατάλογος σχημάτων 1.1 Αδυναμία εντοπισμού διαστάσεων αντικειμένων Στάδια εξόρυξης γνώσης από εικόνες Προβολή των παραμέτρων των εικόνων Προβολή των keypoints των εικόνων Εφαρμογή Sift και εντοπισμός 60 keypoints Για κάθε οκτάβα του χώρου κλίμακας, η αρχική εικόνα επαναληπτικά συνελίσσεται με Gaussian και παράγει το σετ του χώρου κλίμακας εικόνων που φαίνονται στ αριστερά. Γειτονικές Gaussian εικόνες αφαιρούνται και παράγουν τις difference-of-gaussian εικόνες στα δεξιά. Μετά από κάθε οκτάβα, η Gaussian εικόνα υποδειγματοληπτείται και η διαδικασία επαναλαμβάνεται Οκτάβες με διαφορετικές τιμές τις παραμέτρου k Σύγκριση του x pixel με τα 26 "γειτονικά" του Ο περιγραφέας μιας εικόνας Υπολογισμός έντασης μιας περιοχής με χρήση τριών πράξεων και τεσσάρων προσπελάσεων στη μνήμη Προσεγγίσεις της κλίμακας Laplace του Gauss σε x,y και xy διεύθυνση Αριστερά: Προσέγγιση του χώρου κλίμακας με βάση τον SIFT. Δεξιά: Ο SURF αφήνει αμετάβλητη την εικόνα αλλάζοντας μόνο το μέγεθος του φίλτρου Το αριστερό φίλτρο υπολογίζει την παράγωγο στη y διεύθυνση ενώ το δεξί στη x διεύθυνση xvii

20 xviii Κατάλογος Σχημάτων 2.10 Η διαδικασία ανάθεσης προσανατολισμού για τα σημεία ενδιαφέροντος του SURF Διαφορετικές κλίμακες προσανατολισμένων παραθύρων Οι κύριες συνιστώσες ενός δισδιάστατου σύνολου δεδομένων Απλουστευμένο μοντέλο ενός βιολογικού νευρώνα Μοντέλο ενός τεχνητού νευρώνα Πολυστρωματικό ΤΝΔ εμπρόσθιας τροφοδότησης διάταξης Πολυστρωματικό ανατροφοδοτούμενο ΤΝΔ διάταξης Εκπαίδευση με επίβλεψη Για ένα γραμμικά διαχωρίσιμο πρόβλημα δύο κλάσεων υπάρχουν πολλά υπερεπίπεδα διαχωρισμού, αλλά ένα είναι το βέλτιστο (α)στην περίπτωση αυτή, ένα σημείο πέφτει στην περιοχή του διαχωρισμού, αλλά στην σωστή πλευρά του επιπέδου απόφασης (β) Το σημείο πέφτει στην λάθος πλευρά του επιπέδου απόφασης Αναπαράσταση μετασχηματισμού των δεδομένων Παράθυρο προεπεξεργασίας Παράδειγμα εκτέλεσης αλγορίθμου Sift Παράδειγμα επιτυχούς ταιριάσματος εικόνων μέσω του Sift Παράδειγμα εκτέλεσης αλγορίθμου Surf Παράδειγμα εκτέλεσης GrayScale και Edge Detection Παράδειγμα εκτέλεσης Corner Detection και Thres-Holding Παράδειγμα εκτέλεσης ιστογράμματος μίας έγχρωμης εικόνας αριστερά και μίας grayscale δεξιά Παράδειγμα εκτέλεσης Gaussian filter για τυχαίες τιμές διασποράς 1,2,3 και Παράθυρο ταξινόμησης Παράδειγμα εκτέλεσης ταξινόμησης ενός προβλήματος τριών κλάσεων με ένα Neural Network

21 Κατάλογος Σχημάτων xix 5.11 Πληροφορίες εκπαίδευσης ενός Neural Network Εικόνες από το σύνολο Caltech

22

23 Κατάλογος πινάκων 1.1 Πίνακας σύγχυσης Αποτελέσματα μέσης ακρίβειας των ταξινομητών, με αλγόριθμο εξαγωγής στοιχείων τον SIFT για το σύνολο n Αποτελέσματα μέσης ακρίβειας των ταξινομητών, με αλγόριθμο εξαγωγής στοιχείων τον SURF για το σύνολο n Αποτελέσματα μέσης ακρίβειας των ταξινομητών, με αλγόριθμο εξαγωγής στοιχείων τον SIFT για το σύνολο n Αποτελέσματα μέσης ακρίβειας των ταξινομητών, με αλγόριθμο εξαγωγής στοιχείων τον SURF για το σύνολο n Αποτελέσματα μέσης ακρίβειας των ταξινομητών, με αλγόριθμο εξαγωγής στοιχείων τον SIFT για το σύνολο n Αποτελέσματα μέσης ακρίβειας των ταξινομητών, με αλγόριθμο εξαγωγής στοιχείων τον SURF για το σύνολο n Αποτελέσματα μέσης ακρίβειας των ταξινομητών, με αλγόριθμο εξαγωγής στοιχείων τον SIFT για το σύνολο n Αποτελέσματα μέσης ακρίβειας των ταξινομητών, με αλγόριθμο εξαγωγής στοιχείων τον SURF για το σύνολο n xxi

24

25 xxiii Στην οικογένειά μου

26

27 Κεφάλαιο 1 Εισαγωγή 1.1 Αναγνώριση Προτύπων Η αναγνώριση προτύπων (pattern recognition) είναι ένα επιστημονικό πεδίο που έχει στόχο την ανάπτυξη αλγορίθμων για την ταξινόμηση αντικειμένων σε κατηγορίες ή κλάσεις. Ανάλογα με την εφαρμογή, τα αντικείμενα αυτά μπορεί να είναι εικόνες, κυματομορφές σημάτων, βίντεο ή οποιοδήποτε άλλο είδος μετρήσεων που χρειάζεται να ταξινομηθεί. Το ερευνητικό ενδιαφέρον για την αναγνώριση προτύπων έχει μακρά ιστορία, αλλά πριν την δεκαετία του 1960 ήταν κυρίως προϊόν θεωρητικής έρευνας στην περιοχή της στατιστικής. Από το 1960 και μετά, εξαιτίας της αλματώδης ανάπτυξης του τομέα της πληροφορικής και της εξέλιξης των ηλεκτρονικών υπολογιστών, έδωσε νέες δυνατότητες για πρακτικές εφαρμογές [23] Υπολογιστική Όραση Η υπολογιστική όραση (computer vision) είναι το πεδίο το οποίο θα μας απασχολήσει σε αυτήν την εργασία. Πρόκειται για έναν τομέα στον οποίο η αναγνώριση προτύπων είναι ιδιαίτερα χρήσιμη. Ένα σύστημα υπολογιστικής όρασης δέχεται ως είσοδο εικόνες και ο κύριος στόχος του είναι να εξάγει χρήσιμες πληροφορίες από αυτές. Αυτό είναι ένα αρκετά δύσκολο έργο, αν αναλογιστεί κανείς το πλήθος των ερευνητών που ασχολούνται όλα αυτά τα χρόνια σε σχέση με το πόσο μακριά είμαστε από την δημιουργία ενός συστήματος ή μιας μηχανής η οποία μπορεί να μιμηθεί την ανθρώπινη όραση, κάτι το οποίο φαντάζει αρκετά φιλόδοξο ακόμα, μιας και η ανθρώπινη όραση είναι μια αρκετά πολύπλοκη διαδικασία και σε πολύ μεγάλο βαθμό ανεξερεύνητη [2][31]. 1

28 2 Κεφάλαιο 1 Εισαγωγή Ένα από τα προβλήματα που συναντάει ένα σύστημα, στην προσπάθειά του να "ερμηνεύσει" τις εικόνες, είναι η πολυπλοκότητα των οπτικών δεδομένων τους. Για παράδειγμα, είναι δύσκολο να εντοπίσει που αρχίζει ή που τελειώνει ένα αντικείμενο. Παρατηρώντας το Σχήμα 1.1 βλέπουμε πως δεν υπάρχει σχεδόν καμία αλλαγή (κόκκινος κύκλος) στη φωτεινότητα του λευκού κτιρίου και του ουρανού. Ενώ υπάρχει μεγάλη αλλαγή (κίτρινος κύκλος) της έντασης στο κυανό κτίριο, χωρίς στην πραγματικότητα να παρεμβάλλεται κάποιο άλλο αντικείμενο. Άλλη δυσκολία που μπορεί να συναντήσει, είναι το πλήθος των αντικειμένων μέσα στην εικόνα. Μία εικόνα με πολλά αντικείμενα και όχι εύκολα διαχωρίσιμα, αυξάνει την πολυπλοκότητά της, πόσο μάλλον στην περίπτωση που η εικόνα είναι ασπρόμαυρη. Σχήμα 1.1: Αδυναμία εντοπισμού διαστάσεων αντικειμένων. Παρ' όλες αυτές τις δυσκολίες, υπάρχει αξιοσημείωτη πρόοδος στο τομέα της υπολογιστικής όρασης και των εφαρμογών της την τελευταία δεκαετία. Ποιος δεν έχει παρατηρήσει πόσο γρήγορα και με τι ακρίβεια γίνεται η ανίχνευση προσώπου κατά τη διάρκεια της λήψης μίας φωτογραφίας από μία ψηφιακή φωτογραφική μηχανή. Δεν θα μπορούσαμε να μην αναφερθούμε και σε ένα από τα τεχνολογικά επιτεύγματα της εταιρίας Microsoft που είναι το Kinect. Πρόκειται για μία συσκευή ανίχνευσης κίνησης που επιτρέπει στο χρήστη να ελέγχει και να αλληλεπιδρά με μία κονσόλα ή τον υπολογιστή του, χωρίς την ανάγκη κάποιου χειριστηρίου ή κάποιας άλλης περιφερειακής συσκευής, παρά μόνο χρησιμοποιώντας χειρονομίες ή φωνητικές εντολές [2].

29 Κεφάλαιο 1 Εισαγωγή Υποβοηθούμενη από τον Υπολογιστή Διάγνωση Η ψηφιακά υποβοηθούμενη από τον υπολογιστή διάγνωση (Computer Aided Diagnosis - CAD) είναι μία άλλη σημαντική εφαρμογή της αναγνώρισης προτύπων και έχει καταστεί ένα από τα μεγαλύτερα αντικείμενα μελέτης στον τομέα της ιατρικής. Με την υποβοηθούμενη γνώση ο υπολογιστής, έχοντας επεξεργαστεί κάποια δεδομένα, λειτουργεί συμπληρωματικά στο ρόλο του γιατρού προσφέροντάς του μία "δεύτερη γνώμη". Βέβαια, η τελική διάγνωση πρέπει να γίνεται από το γιατρό [23] Εξόρυξη Δεδομένων και Ανακάλυψη Γνώσης Η εξόρυξη δεδομένων και η ανακάλυψη γνώσης (data mining and knowledge discovery) από βάσεις δεδομένων είναι η εύρεση μιας χρήσιμης πληροφορίας ή προτύπων με χρήση αλγορίθμων και των αρχών της τεχνικής νοημοσύνης, της μηχανικής μάθησης και της στατιστικής. Πρόκειται για έναν τομέα αρκετά δημοφιλή σε πολλές επιστήμες όπως βιολογία, ιατρική, οικονομία κ.ά, και η σπουδαιότητά του έγκειται στο γεγονός όχι μόνο της διαχείρισης ενός μεγάλου όγκου δεδομένων (Big Data) αλλά της ανάλυσής του και της "εξόρυξης" ενδιαφέρουσας γνώσης, η οποία είναι άγνωστη μέχρι τώρα [16]. 1.2 Η αναγκαιότητα της αναγνώρισης προτύπων από εικόνες Η λήψη ψηφιακών φωτογραφιών έχει αυξηθεί ραγδαία τα τελευταία χρόνια. Αυτό γίνεται εύκολα αντιληπτό, αν σκεφτεί κανείς πόσες από τις ηλεκτρονικές συσκευές που χρησιμοποιούμε καθημερινά περιλαμβάνουν φωτογραφικό φακό. Από ψηφιακές φωτογραφικές μηχανές και φορητούς υπολογιστές, μέχρι τα κινητά τηλέφωνα, τις ταμπλέτες και τις "έξυπνες" τηλεοράσεις, αποτελούν μόνο μερικές από αυτές. Όλα αυτά τα δεδομένα, εισάγονται σε αποθήκες (data warehouses) ή γίνονται διαθέσιμα στο διαδίκτυο όπως για παράδειγμα σε μέσα κοινωνικής δικτύωσης. Η μαζική χρήση των φωτογραφιών δημιουργεί ένα σημαντικό πρόβλημα το οποίο είναι η "έκρηξη των εικόνων". Με την έννοια "έκρηξη των εικόνων", εννοούμε πως έχουμε ένα τεράστιο όγκο δεδομένων, ο οποίος κρύβει μία μεγάλη ποσότητα πληροφορίας και η οποία δεν έχει εντοπισθεί. Ενδεικτικά να αναφέρουμε ότι, οι χρήστες του κοινωνικού δικτύου Facebook ανεβάζουν τουλάχιστον 350 εκατομμύρια νέες φωτογραφίες σε καθημερινή βάση. Επομένως, προβάλλεται επιτακτική ανάγκη για οργάνωση όλου αυτού του τεράστιου όγκου πληροφοριών, με στόχο την ανεύρεση χρήσιμης γνώσης (κανόνων, προτύπων) από αυτές, ώστε η διαχείρισή τους να είναι πιο λειτουργική.

30 4 Κεφάλαιο 1 Εισαγωγή Στη βιβλιογραφία του πεδίου της αναγνώρισης προτύπων από εικόνες, πολλές απόψεις έχουν προταθεί σχετικά με το ποιος είναι ο κατάλληλος τρόπος οργάνωσης των εικόνων. Μία άποψη ήταν, η περιγραφή μίας εικόνας με κείμενο (textual description). Κάτι τέτοιο όμως, φαντάζει μία επίπονη διαδικασία και αρκετά χρονοβόρα. Εκτός αυτού, η λεκτική περιγραφή μιας εικόνας είναι υποκειμενική και πολλές φορές μπορεί να παρουσιάζει ασάφειες. Μια άλλη άποψη που έχει προταθεί και στα πλαίσια αυτής στηρίζεται η εργασίας μας, είναι η κατηγοριοποίηση των εικόνων με βάση ένα κριτήριο. Αυτό το κριτήριο, έχει να κάνει με την ανάθεση σε κάθε εικόνα μιας ετικέτας ή διαφορετικά μιας κλάσης, από ένα σύνολο προκαθορισμένων κλάσεων. 1.3 Βασικά στάδια εξόρυξης γνώσης από εικόνες Η εξόρυξη γνώσης από εικόνες, αποτελεί κομβικό παράγοντα για την αναγνώριση προτύπων. Για να επιτευχθεί η γνώση, θα πρέπει να περάσουμε μέσα από κάποια στάδια, τα οποία παρουσιάζονται στο σχήμα 1.2. Κάθε ένα από τα στάδια, έχει τη δική του ξεχωριστή σημασία και πρέπει να είμαστε ιδιαίτερα προσεκτικοί για την ανεύρεση της "σωστής" γνώσης. Σχήμα 1.2: Στάδια εξόρυξης γνώσης από εικόνες

31 Κεφάλαιο 1 Εισαγωγή Προεπεξεργασία εικόνων Το πρώτο στάδιο που συναντάμε,το οποίο είναι και ιδιαίτερα σημαντικό, είναι αυτό της προεπεξεργασίας των εικόνων που υπάρχουν στη βάση δεδομένων μας. Τουλάχιστον πάνω από το 50% της προσπάθειάς μας για την ανακάλυψη γνώσης, στηρίζεται σε αυτό το στάδιο. Η ποιότητα των εικόνων μας μπορεί να μην είναι καλή και να χρειάζεται βελτίωση. Για παράδειγμα, κάποιες μπορεί να είναι πολύ φωτεινές ή σκοτεινές και για αυτό το λόγο, η έντασή τους να χρειάζεται εξισορρόπηση. Μπορεί μερικές εικόνες να βρίσκονται περισσότερες από μια φορά στη βάση μας, οπότε σε αυτή τη περίπτωση θα πρέπει να προβούμε στη διαγραφή τους. Μία ακόμα σημαντική εργασία που γίνεται στη φάση της προεπεξεργασίας, είναι η εξομάλυνση των εικόνων που περιέχουν θόρυβο, με τη χρήση κάποιον φίλτρων εικόνας. Το στάδιο λοιπόν της προεπεξεργασίας, λαμβάνει ως είσοδο τις εικόνες της βάσης δεδομένων μας και ως έξοδο παράγει εικόνες, οι οποίες είναι καλύτερες ως προς μία κατεύθυνση, όχι κατ 'ανάγκη καλύτερες αισθητικά. Όσο πιο "καθαρές" είναι οι εικόνες μας, τόσο πιο σωστή θα είναι η παραγόμενη γνώση. Άρα, εύκολα συμπεραίνουμε πόσο σημαντικό είναι και γιατί χρειάζεται τόση προσοχή το συγκεκριμένο στάδιο Εξαγωγή παραμέτρων Σε αυτή τη παράγραφο, αξίζει να επισημάνουμε ότι η έννοια της εικόνας δεν προσδιορίζει μόνο το οπτικό της μέρος, δηλαδή οτιδήποτε μπορούμε να δούμε, αλλά κυρίως αυτό που μπορούμε να απεικονίσουμε. Για παράδειγμα, μία εικόνα ενός τοπίου είναι κάτι το ορατό, αντίθετα από μία ακτινογραφία, η οποία είναι αδύνατο να παρατηρηθεί με την ανθρώπινη όραση [28]. Η φυσική σκηνή ή διαφορετικά η εικόνα που θέλουμε να καταγράψουμε ή να απεικονίσουμε είναι μία δισδιάστατη απεικόνιση. Μπορεί να είναι αναλογική εικόνα, οπότε η συνεχής συνάρτηση που την απεικονίζει είναι της μορφής: f(t 1, t 2 ), t 1, t 2 με τα t 1, t 2 να αποτελούν τις συντεταγμένες του επιπέδου της εικόνας. Η ψηφιακή εικόνα δημιουργείται με δύο διαδικασίες. Πρώτα, γίνεται η διακριτοποίηση του πεδίου ορισμού και εν συνεχεία γίνεται διακριτοποίηση του πεδίου τιμών. Αυτή η διαδικασία καλείται κβαντισμός και ως αποτέλεσμα έχει την καταχώρηση μίας εικόνας σε μητρώο. Το μητρώο αυτό, ενδεχομένως να είναι πολύ μεγάλων διαστάσεων και τα στοιχεία

32 6 Κεφάλαιο 1 Εισαγωγή του, εκφράζουν την ένταση της φωτεινότητας. Στην γενική του μορφή, το μητρώο δηλώνεται ως: x(n 1, n 2 ), 0 n 1 N 1, 0 n 2 N 2 με τα n 1, n 2 να είναι οι συντεταγμένες του μητρώου και τα N 1, N 2 πεπερασμένοι αριθμοί. Στο στάδιο λοιπόν της εξαγωγής παραμέτρων ή χαρακτηριστικών, εύκολα αντιλαμβανόμαστε ότι μία εύκολα εντοπίσιμη παράμετρος είναι η φωτεινότητα της εικόνας. Η φωτεινότητα, είναι ένα χαμηλού επιπέδου χαρακτηριστικό. Μία παράμετρος χαρακτηρίζεται χαμηλού επιπέδου, αν εξάγεται αυτόματα από μία εικόνα χωρίς να φέρει οποιαδήποτε πληροφορία των σχημάτων που περιέχει. Μία άλλη παράμετρος χαμηλού επιπέδου είναι οι ακμές μιας εικόνας. Πρόκειται για μία εικόνα η οποία έχει ανιχνεύσει τις ακμές (edge detection) των αντικειμένων που περιγράφει. Αντίστοιχα, υπάρχει η παράμετρος των γωνιών, η οποία περιγράφει τις γωνίες (corner detection) των αντικειμένων της. Μία ακόμα παράμετρος, είναι αυτή του κατωφλίου (thresholding). Ανάλογα με την τιμή του κατωφλίου, η φωτεινότητα της εικόνα μας, παίρνει δύο δυνατές τιμές [3][31]. Σχήμα 1.3: Προβολή των παραμέτρων των εικόνων

33 Κεφάλαιο 1 Εισαγωγή 7 Υψηλού επιπέδου χαρακτηριστικά, είναι αυτά που προκύπτουν έπειτα από επεξεργασία ή αλλιώς φιλτράρισμα της εικόνας. Μία τέτοια παράμετρος, είναι τα σημεία κλειδιά (keypoints) μιας εικόνας, τα οποία θα δούμε αναλυτικά στο επόμενο κεφάλαιο. Σχήμα 1.4: Προβολή των keypoints των εικόνων Εξαγωγή προτύπων Η βασική εργασία που γίνεται στο στάδιο της εξαγωγής προτύπων, είναι η εφαρμογή αλγορίθμων στη βάση δεδομένων μας, με στόχο δημιουργία μοντέλων που θα παράγουν την γνώση. Το μοντέλο που δημιουργείται μπορεί να είναι προβλεπτικό (predictive) ή περιγραφικό (descriptive) [32]. Ένα προβλεπτικό μοντέλο κάνει μία πρόβλεψη συμπεριφοράς κάποιων χαρακτηριστικών, χρησιμοποιώντας όμως εκ των προτέρων γνώση. Μερικές από τις τεχνικές που χρησιμοποιούν αυτό το είδος μοντέλου είναι η κατηγοριοποίηση, η παλινδρόμηση ή παρεμβολή και η πρόβλεψη. Άπο την άλλη μεριά, ένα περιγραφικό μοντέλο προσπαθεί να εντοπίσει πρότυπα ή σχέσεις που ενυπάρχουν στα δεδομένα του. Αντίθετα από το προβλεπτικό, το περιγραφικό λειτουργεί σαν ένα μέσο που ερευνά τα χαρακτηριστικά των υπό εξέταση δεδομένων και εξηγεί την συμπεριφορά τους. Κάποιες από τις τεχνικές που στηρίζονται σε

34 8 Κεφάλαιο 1 Εισαγωγή αυτό το μοντέλο είναι η συσταδοποίηση, η ανακάλυψη ακολουθιών και οι κανόνες συσχέτισης [29] Κατηγοριοποίηση - Πρόβλεψη Ίσως η πιο γνωστή και πιο δημοφιλής τεχνική της εξόρυξης δεδομένων είναι η κατηγοριοποίηση (classification). Σύμφωνα με αυτή τη τεχνική, τα δεδομένα που βρίσκονται στη βάση μας τα οποία προσδιορίζονται από ένα πλήθος χαρακτηριστικών και μία ετικέτα της κλάσης τους (κατηγορίας), απεικονίζονται σε μία κατηγορία. Η κατηγοριοποίηση υλοποιείται σε δύο βήματα. Πρώτα, χωρίζουμε τα δεδομένα μας σε σύνολο εκπαίδευσης και σε σύνολο ελέγχου (περίπου 70% - 30% αντίστοιχα) και δημιουργούμε ένα συγκεκριμένο μοντέλο για την αξιολόγηση των δεδομένων εκπαίδευσης που ως έξοδο δίνει τα δεδομένα εκπαίδευσης κατηγοριοποιημένα με όσο το δυνατόν μεγαλύτερη ακρίβεια. Στη συνέχεια, εφαρμόζουμε στο μοντέλο που αναπτύχθηκε στο πρώτο βήμα το σύνολο ελέγχου και αξιολογούμε τα αποτελέσματα. Η πρόβλεψη μπορεί να θεωρηθεί σαν ειδικός τύπος της κατηγοριοποίησης. Όταν έχει δημιουργηθεί το μοντέλο, αντί για ένα σύνολο ελέγχου, προσπαθούμε να κατηγοριοποιήσουμε ένα καινούριο δεδομένο. Οι βασικές μέθοδοι δημιουργίας μοντέλων είναι τα Δέντρα απόφασης, Μέθοδος Bayes, Νευρωνικά Δίκτυα Παλινδρόμηση Η παλινδρόμηση ή παρεμβολή (regression) είναι μία στατιστική τεχνική μοντελοποίησης και χρησιμοποιείται για να απεικονίσει κάθε ένα από τα δεδομένα μας σε μία πραγματική τιμή πρόβλεψης. Η παλινδρόμηση προϋποθέτει ότι τα δεδομένα μας ταιριάζουν με μερικά γνωστά είδη συνάρτησης (π.χ. γραμμική, λογαριθμική, κ.ά.) και μετά καθορίζει την καλύτερη συνάρτηση αυτού του είδους που μοντελοποιεί τα δεδομένα μας. Το αποτέλεσμα της παλινδρόμησης είναι η δημιουργία ενός μοντέλου, που χρησιμοποιείται για να προβλέψει τις συνεχείς τιμές της κατηγορίας σε νέα δεδομένα Συσταδοποίηση Το πρόβλημα της συσταδοποίησης σχετίζεται με την τμηματοποίηση (partitioning, clustering) ενός συνόλου δεδομένων σε συστάδες έτσι ώστε τα στοιχεία του συνόλου των δεδομένων που ανήκουν σε μία συστάδα να είναι περισσότερο όμοια μεταξύ τους από ότι είναι με τα στοιχεία των άλλων συστάδων. Η συσταδοποίηση μπορεί να βρεθεί με διαφορετικά ονόματα

35 Κεφάλαιο 1 Εισαγωγή 9 σε διαφορετικά πεδία, όπως μη εποπτευόμενη μάθηση (unsupervised learning) στην αναγνώριση προτύπων, τμηματοποίηση (segmentation, partitioning), στη θεωρία των γράφων και στις Βάσεις Δεδομένων. Υπάρχει ένα μεγάλο πλήθος από αλγόριθμους συσταδοποίησης που έχουν προταθεί και ο καθένας τους βασίζεται σε διαφορετική φιλοσοφία. Σχεδόν όλοι τους, δέχονται ένα σύνολο παραμέτρων που μπορεί να είναι το πλήθος των ομάδων, διανύσματα αρχικοποίησης που απαιτούνται από τον αλγόριθμο αλλά και κάποιες υποθέσεις για την πυκνότητα των διανυσμάτων στο χώρο καθώς και άλλες διάφορες παραμέτρους. Διαφοροποιώντας αυτές τις παραμέτρους, προκύπτει ένα σύνολο από αλγόριθμους σε κάθε βασική κατηγορία [16] Αξιολόγηση προτύπων Το τελευταίο στάδιο πριν την εξόρυξη γνώσης είναι η αξιολόγηση των προτύπων που εξήχθησαν από τα μοντέλα. Αναζητούμε πρότυπα τα οποία είναι έγκυρα και συνεπή σε νέα δεδομένα. Ένα σύστημα μπορεί να παράγει χιλιάδες πρότυπα. Εμείς, διαλέγουμε εκείνα τα οποία έχουν "ενδιαφέρον", δηλαδή εκείνα που έχουν υψηλό περιεχόμενο πληροφορίας από την πλευρά της θεωρίας της πληροφορίας. Ανάλογα με τη τεχνική που επιλέγουμε για τη δημιουργία προτύπων, χρησιμοποιούνται πιο ειδικά μέτρα αξιολόγησης. Βέβαια, μπορούν να χρησιμοποιηθούν και τα παραδοσιακά μέτρα που αφορούν την πολυπλοκότητα χώρου ή/και χρόνου των μοντέλων, όμως τέτοιες προσεγγίσεις είναι συνήθως δευτερευούσης σημασίας Μέτρα αξιολόγησης στην κατηγοριοποίηση Δημοφιλή μέτρα στη τεχνική της κατηγοριοποίησης, αποτελούν η ακρίβεια (accuracy), η ανάκληση (recall), η F-measure και η ορθότητα (precision). Ο ορισμός των παραπάνω μετρικών αξιολόγησης θα γίνει πιο κατανοητός, αν χρησιμοποιήσουμε την βοήθεια του πίνακα σύγχυσης (confusion matrix). Ένας πίνακας σύγχυσης με δύο δυνατές κλάσεις (μπορεί και περισσότερες), έχει την μορφή του πίνακα 1.1. Αποτελείται από δύο στήλες, οι οποίες αντιστοιχούν στις προβλεπόμενες κλάσεις εξόδου (με βάση το μοντέλο που έχουμε δημιουργήσει), ενώ οι γραμμές αντιστοιχούν στις πραγματικές κλάσεις. Κάθε στοιχείο του πίνακα, δηλώνει τον αριθμό των δεδομένων που ανήκουν στην κλάση έστω i και προβλέφθηκε ότι ανήκουν στην κλάση έστω j. Γι' αυτό το λόγο, ορίζουμε ως [30]: Αληθώς θετικό (True Possitive - TP): χαρακτηρίζεται ένα δεδομένο το οποίο εκτιμάται ότι ανήκει στην κλάση 1 και πράγματι ανήκει σε αυτή.

36 10 Κεφάλαιο 1 Εισαγωγή Προβλεπόμενη κλάση κλάση1 κλάση 0 True κλάση1. positive Πραγματική. κλάση False. negative False κλάση0. True. positive negative Πίνακας 1.1: Πίνακας σύγχησης Ψευδώς θετικό (False Possitive - FP): χαρακτηρίζεται ένα δεδομένο το οποίο εκτιμάται ότι ανήκει στην κλάση 1 ενώ στην πραγματικότητα δεν ανήκει σε αυτή. Αληθώς αρνητικό (True Negative - TN): χαρακτηρίζεται ένα δεδομένο το οποίο εκτιμάται ότι ανήκει στην κλάση 0 και πράγματι ανήκει σε αυτή. Ψευδώς αρνητικό (False Negative - FN): χαρακτηρίζεται ένα δεδομένο το οποίο εκτιμάται ότι ανήκει στην κλάση 0 ενώ στην πραγματικότητα ανήκει στη κλάση 1. Με βάση λοιπόν τα παραπάνω, μπορούμε να ορίσουμε τα μέτρα αξιολόγησης ως εξής: Ακρίβεια: Αντιπροσωπεύει το πλήθος των ορθών προβλέψεων δια το σύνολο δεδομένων ελέγχου. Accuracy = T P + T N T P + T N + F P + F N Ανάκληση: Εκφράζει τον αριθμό των αληθώς θετικών δεδομένων που κατάφερε ο ταξινομητής να εντοπίσει. Recall = T P T P + F N Ορθότητα: Δηλώνει τον αριθμό των δεδομένων που ο ταξινομητής τα έχει ταξινομήσει θετικά και πράγματι είναι θετικά. P recision = T P T P + F P

37 Κεφάλαιο 1 Εισαγωγή 11 F-measure: Αποτελεί έναν συνδυασμό της ανάκλησης και της ορθότητας. F measure = 2 recall precision recall + precision Τεχνικές "ισχυροποίησης" αποτελεσματικότητας ενός προβλεπτικού μοντέλου Όπως έχουμε αναφέρει, η ποιότητα των μοντέλων εξετάζεται με την εκτίμηση σφάλματος γενίκευσης, δηλαδή την ικανότητα του μοντέλου να προβλέπει την κλάση μίας νέας περίπτωσης. Όταν εκπαιδεύουμε ένα μοντέλο, έχουμε την δυνατότητα να τροποποιήσουμε τις παραμέτρους των αλγορίθμων με απώτερο στόχο την επίτευξη καλύτερων τιμών των μετρικών αξιολόγησης (δεν είναι ασυνήθιστο να υπάρξει κατηγοριοποίηση με ακρίβεια 100%). Αυτή η ενέργειά μας όμως, ελοχεύει τον κίνδυνο να έρθουμε αντιμέτωποι με ένα σύνηθες πρόβλημα στον τομέα της εξόρυξης γνώσης, το οποίο είναι η υπερεκπαίδευση (overfitting). Αυτό πρακτικά σημαίνει ότι το μοντέλο μας έχει προσαρμοστεί τόσο καλά στα δεδομένα εκπαίδευσης, αλλά στα δεδομένα ελέγχου η απόδοσή του είναι ιδιαίτερα χαμηλή. Γι' αυτό το λόγο, οι μετρικές αξιολόγησης έχουν λόγο υπολογισμού στο σύνολο ελέγχου αλλά όχι τόσο στο σύνολο εκπαίδευσης. Εύλογα τίθεται το ερώτημα του ποιος είναι ο κατάλληλος τρόπος διαχωρισμού των δεδομένων μας στα δύο σύνολα εκπαίδευσης και ελέγχου. Παρακάτω παρουσιάζονται κάποιες από τις γνωστές μεθόδους διαχωρισμού [16]: Η μέθοδος holdout: Η μέθοδος αυτή χωρίζει το σύνολο δεδομένων μας σε δύο ξένα σύνολα μεταξύ τους, ένα σύνολο δεδομένων εκπαίδευσης και ένα σύνολο δεδομένων ελέγχου, με αναλογία 2/3 και 1/3 αντίστοιχα. Ένα σημαντικό μειονέκτημα αυτής της μεθόδου, είναι ότι ο διαχωρισμός αυτός μπορεί να μην είναι αντιπροσωπευτικός. Για παράδειγμα, μπορεί να μην υπάρχει ομοιομορφία στην επιλογή των δεδομένων διαφόρων κλάσεων στα δύο προαναφερθέντα σύνολα. Η μέθοδος K - Fold Cross - Validation: Στην K - Fold Cross - Validation αποφασίζουμε τον αριθμό των πτυχών (folds), συνήθως K=10, και χωρίζουμε το σύνολο δεδομένων σε K τυχαία και ίσα υποσύνολα. Για K επαναλήψεις, το κάθε ένα υποσύνολο θα γίνει σύνολο ελέγχου από μία φορά και τα υπόλοιπα 9 θα γίνονται κάθε φορά σύνολα εκπαίδευσης. Πρόκειται για μία μέθοδο σύμφωνα με την οποία αποφεύγεται η υπερεκπαίδευση ενός μοντέλου λόγο των πολλαπλών διασταυρώσεων των συνόλων μεταξύ τους, και

38 12 Κεφάλαιο 1 Εισαγωγή οι τιμές των μετρικών αξιολόγησης "ισχυροποιούνται" μιας και σαν τελικές τους τιμές λογίζεται ο μέσος όρος των K μοντέλων. Η μέθοδος Leave-one-out Cross - Validation: Η μέθοδος αυτή αποτελεί μία γενίκευση της μεθόδου K - Fold Cross - Validation, στη οποία η τιμή της παραμέτρου K έχει την τιμή N, όπου το N είναι ο συνολικός αριθμός δεδομένων μας. Σίγουρα αυτός ο διαχωρισμός είναι πιο αντιπροσωπευτικός μιας και δεν περιπλέκεται κανένα είδος δειγματοληψίας. Από την άλλη μεριά όμως, το υψηλό υπολογιστικό κόστος είναι ένα σοβαρό μειονέκτημα αυτής της μεθόδου.

39 Κεφάλαιο 2 Αναπαράσταση Προτύπων 2.1 Εισαγωγή Σε αυτό το κεφάλαιο θα παρουσιάσουμε δύο μεθόδους εξαγωγής διακριτών αμετάβλητων χαρακτηριστικών από εικόνες, τα οποία μπορούν να χρησιμοποιηθούν, με αξιόπιστο τρόπο, στην ανίχνευση ή αντιστοίχιση αντικειμένων ακόμα και αν οι εικόνες βρίσκονται τραβηγμένες υπό διαφορετική γωνία λήψης. Τα χαρακτηριστικά που εξάγονται, παραμένουν αμετάβλητα τόσο στην αλλαγή κλίμακας της εικόνας όσο και στην αλλαγή προσανατολισμού της. Επίσης, είναι ανθεκτικά στην ύπαρξη θορύβου καθώς και σε αλλαγές της φωτεινότητας της εικόνας. 2.2 Ο αλγόριθμος SIFT Για τον εντοπισμό και την περιγραφή αντικειμένων σε εικόνες, έχουν αναπτυχθεί αρκετοί αλγόριθμοι στο χώρο της τεχνητής όρασης. Ένας από του πιο διαδεδομένους και αυτός με τις περισσότερες εφαρμογές, είναι ο αλγόριθμος SIFT (Scale Invariant Feature Transform). Ο αλγόριθμος SIFT εξάγει υψηλού επιπέδου χαρακτηριστικά από μία εικόνα, τα οποία είναι γνωστά ως σημεία κλειδιά (keypoint). Στο σχήμα 2.1 παρουσιάζεται το αποτέλεσμα της εφαρμογής του αλγορίθμου πάνω σε μία εικόνα. Η φιλοσοφία του αλγορίθμου στηρίζεται στην εύρεση των πιθανών σημείων κλειδιών και εν συνεχεία, με κατάλληλη χρήση κάποιων τεχνικών, στην ακριβή περιγραφή τους. Η υλοποίηση του αλγορίθμου, μπορεί να χωριστεί σε τέσσερα στάδια τα οποία είναι [1]: 13

40 14 Κεφάλαιο 2 Αναπαράσταση Προτύπων 1. Ανίχνευση ακρότατων στο χώρο της κλιμάκωσης (Scale-space extrema detection) 2. Εντοπισμός σημείων κλειδιών (Keypoint localization) 3. Καθορισμός προσανατολισμού (Orientation assignment) 4. Περιγραφή των σημείων κλειδιών (Keypoint descriptor) Σχήμα 2.1: Εφαρμογή Sift και εντοπισμός 60 keypoints Ανίχνευση ακρότατων στο χώρο της κλιμάκωσης Όπως περιγράψαμε στην φιλοσοφία του αλγορίθμου SIFT, θα ανιχνεύσουμε σημεία κλειδιά χρησιμοποιώντας μια κλιμακωτή προσέγγιση φίλτρων που χρησιμοποιεί αποδοτικούς αλγόριθμους για να προσδιορίσει υποψήφιες θέσεις που θα εξετασθούν έπειτα με περισσότερη λεπτομέρεια. Το πρώτο βήμα στην ανίχνευση των σημείων κλειδιών είναι ο προσδιορισμός θέσεων και κλιμάκων που μπορούν επαναληπτικά να προσδιοριστούν κάτω από διαφορετικές οπτικές του ίδιου αντικειμένου. Δεδομένης λοιπόν μιας εικόνας I(x, y), για τον εντοπισμό τοποθεσιών όπου είναι δυνατό να υπάρχουν σημεία κλειδιά, εφαρμόζουμε ένα φίλτρο σε κάθε ένα pixel της εικόνας, με κύριο στόχο την μείωση του θορύβου. Το φίλτρο που χρησιμοποιούμε στον αλγόριθμο SIFT είναι το Gaussian: G(x, y, σ) = 1 2πσ 2 e (x2 +y 2 )/2σ 2, όπου σ είναι η τυπική απόκλιση. Εφαρμόζοντας στην συνέλιξη (convolution) του φίλτρου με την αρχική μας εικόνα, όπως φαίνεται στη παρακάτω σχέση, παράγεται η εικόνα με μειωμένο θόρυβο. L(x, y, σ) = G(x, y, σ) I(x, y) (2.1)

41 Κεφάλαιο 2 Αναπαράσταση Προτύπων 15 Η αποτύπωση των προβολών αντικειμένων στις εικόνες του πραγματικού κόσμου και πιο συγκεκριμένα η κλίμακά τους, επηρεάζεται αισθητά από την απόστασή τους από το φωτογραφικό φακό. Για παράδειγμα, όταν η απόσταση του αντικειμένου από το φακό είναι μικρή, τότε το αντικείμενο αποτυπώνεται ως μεγάλο, ενώ στην αντίθετη περίπτωση έχουμε ανάποδα αποτελέσματα. Τα σημεία κλειδιά του αλγορίθμου, θα πρέπει να παραμένουν ανεπηρέαστα από αυτή την αλλαγή. Επειδή ένα σύστημα τεχνητής όρασης δεν είναι δυνατόν να γνωρίζει εκ των προτέρων τη κλίμακα των αντικειμένων, χρησιμοποιείται μία αναπαράσταση της ίδιας εικόνας, αλλά σε διαφορετική κλίμακα. Θα πρέπει δηλαδή να παράγουμε ένα σύνολο εικόνων με διαφορετική κλίμακα από την αρχική εικόνα, εφαρμόζοντας το φίλτρο Gaussian με έναν πολλαπλασιαστικό παράγοντα k, G(x, y, kσ) με k >= 0. Οπότε, χρησιμοποιούμε τη συνέλιξή του με την αρχική μας εικόνα όπως παρουσιάζεται στη σχέση 2.2 [7]. L(x, y, σ) = G(x, y, kσ) I(x, y) (2.2) Επόμενο βήμα, αποτελεί η χρήση της συνάρτησης διαφοράς των Gaussian (differenceof-gaussian) φιλτραρισμένων εικόνων του συνόλου δεδομένων μας, σχέση 2.3. D(x, y, σ) = (G(x, y, kσ) G(x, y, σ)) I(x, y) = L(x, y, kσ) L(x, y, σ) (2.3) Όπως φαίνεται από την παραπάνω σχέση, αφαιρούνται οι "γειτονικές" εικόνες, δηλαδή οι εικόνες που διαφέρουν κατά τη παράμετρο k, έχοντας ως αποτέλεσμα τη δημιουργία ενός νέου συνόλου από εικόνες όπως περιγράφεται και στο σχήμα 2.2. Στη συνέχεια, η διαδικασία επαναλαμβάνεται αλλά αυτή τη φορά, το φίλτρο Gauss εφαρμόζεται όχι σε όλα τα pixel αλλά κάθε δεύτερο σε κάθε γραμμή και στήλη, δηλαδή στη μειωμένη στο μισό αρχικής μας εικόνας. Αξίζει να σημειώσουμε ότι, το πλήθος των εικόνων που διαφέρουν κατά την παράμετρο k και έχουν το ίδιο μέγεθος-διαστάσεις καλείται οκτάβα. Στο παράδειγμα του σχήματος 2.3 έχουμε δημιουργήσει 5 οκτάβες με 3 διαφορετικές τιμές της παραμέτρου k σε κάθε μία. Υπάρχουν αρκετοί λόγοι για να διαλέξουμε τη Gaussian συνάρτηση ως φίλτρο των εικόνων μας. Πρώτον, είναι ιδιαιτέρως εύκολη συνάρτηση να υπολογιστεί και εν συνεχεία η συνάρτηση D που αφαιρεί δύο εικόνες, μας οδηγούν σε μία διαδικασία με χαμηλό υπολογιστικό κόστος. Επιπλέον, η συνάρτηση διαφοράς των Gaussian φιλτραρισμένων εικόνων ισούται προσεγγιστικά με την κανονικοποιημένη ως προς την κλίμακα Laplace του Gauss (scale-normalized

42 16 Κεφάλαιο 2 Αναπαράσταση Προτύπων Σχήμα 2.2: Για κάθε οκτάβα του χώρου κλίμακας, η αρχική εικόνα επαναληπτικά συνελίσσεται με Gaussian και παράγει το σετ του χώρου κλίμακας εικόνων που φαίνονται στ αριστερά. Γειτονικές Gaussian εικόνες αφαιρούνται και παράγουν τις difference-of-gaussian εικόνες στα δεξιά. Μετά από κάθε οκτάβα, η Gaussian εικόνα υποδειγματοληπτείται και η διαδικασία επαναλαμβάνεται [1]. Σχήμα 2.3: Οκτάβες με διαφορετικές τιμές τις παραμέτρου k.

43 Κεφάλαιο 2 Αναπαράσταση Προτύπων 17 Laplacian of Gaussian), σ 2 2 G, όπως μελετήθηκε από τον Lindeberg (1994). Ο Lindeberg έδειξε ότι η κανονικοποίηση του Laplace με τον συντελεστή σ 2 απαιτείται για πραγματική σταθερότητα στην κλίμακα. Με λεπτομερειακές πειραματικές συγκρίσεις, ο Milolajczyk (2002) βρήκε ότι τα μέγιστα και τα ελάχιστα του σ 2 2 G παράγουν τα πιο σταθερά χαρακτηριστικά εικόνων συγκρινόμενα με ένα πλήθος άλλων πιθανών φίλτρων εικόνων, όπως για παράδειγμα του εσσιανού [1]. Η σχέση μεταξύ της συνάρτησης D και της σ 2 2 G μπορεί να κατανοηθεί από την παρακάτω εξίσωση: G σ = σ 2 G (2.4) Από αυτό παρατηρούμε ότι, το σ 2 G μπορεί να υπολογιστεί από τη προσέγγιση της διαφοράς G σ, χρησιμοποιώντας τη διαφορά από γειτονικές κλίμακες στα kσ και σ: σ 2 G = G σ G(x, y, kσ) G(x, y, σ) kσ σ (2.5) άρα G(x, y, kσ) G(x, y, σ) (k 1)σ 2 2 G (2.6) Από τη σχέση 2.6 συμπεραίνουμε πως η συνάρτηση διαφορών των Gaussian φιλτραρισμένων εικόνων έχει κλίμακες που διαφέρουν κατά ένα σταθερό συντελεστή, όπου αυτός ήδη περιλαμβάνεται με τον όρο σ 2 στη κανονικοποιημένη ως προς την κλίμακα συνάρτηση Laplace. Ο συντελεστής (k-1) στην εξίσωση είναι μία σταθερά σε όλες τις κλίμακες και έτσι δεν επηρεάζει τις θέσεις των ακρότατων (extrema). Το λάθος προσέγγισης τείνει στο μηδέν καθώς το k τείνει στο ένα, αλλά πρακτικά έχει βρεθεί ότι η προσέγγιση δεν έχει σχεδόν καθόλου επίπτωση στην σταθερότητα (stability) της ανίχνευσης των ακρότατων ή στον εντοπισμό ακόμη και για σημαντικές διαφορές στην κλίμακα, για σχετικά μεγάλα k, όπως k = Εντοπισμός σημείων κλειδιών Στο προηγούμενο στάδιο, είχαμε δημιουργήσει ένα σύνολο εικόνων στο οποίο εφαρμόσαμε το φίλτρο του Gauss σε κάθε μία εικόνα του συνόλου δεδομένων μας και στο επόμενο βήμα, πήραμε τη διαφορά τους. Τώρα, ο κύριος στόχος μας είναι ο εντοπισμός τοπικών

44 18 Κεφάλαιο 2 Αναπαράσταση Προτύπων ελάχιστων και μέγιστων σημείων του προαναφερθέντος συνόλου, δηλαδή της D(x, y, σ), τα οποία θα είναι και τα υποψήφια σημεία κλειδιά μας [3]. Η διαδικασία που ακολουθείται είναι η εξής: κάθε ένα pixel της εικόνας συγκρίνεται με τους 8 γείτονές του στην τρέχουσα εικόνα, με τους 9 γείτονες στην προηγούμενη καθώς και με τους 9 γείτονές του στην επόμενη κλίμακα, σχήμα 2.4. Ένα pixel χαρακτηρίζεται ως ακρότατο μόνο αν αυτό είναι μεγαλύτερο από όλα τα "γειτονικά" του ή μικρότερο από όλα αυτά. Το κόστος αυτού του ελέγχου είναι χαμηλό, διότι τα πιο πολλά pixel θα εξαλειφθούν μετά τους πρώτους ελέγχους. Μια σημαντική βελτίωση του αλγορίθμου, θα μπορούσε να ήταν η αναζήτηση ακρότατων σε συγκεκριμένα σημεία της εικόνας. Δυστυχώς όμως, κάτι τέτοιο δεν μπορεί να πραγματοποιηθεί μιας και δεν υπάρχει ελάχιστη απόσταση μεταξύ τους. Μπορεί να βρίσκονται αυθαίρετα μακριά ή πάρα πολύ κοντά, όπως για παράδειγμα τα ακρότατα μιας εικόνας ενός λευκού κύκλου σε μαύρο φόντο. Αξίζει να τονίσουμε ότι, όταν το ακρότατο εντοπιστεί γνωρίζουμε τη θέση του στο πλέγμα των pixel, όχι όμως την ακριβή του θέση. Σχήμα 2.4: Σύγκριση του x pixel με τα 26 "γειτονικά" του [1]. Όταν ένα υποψήφιο σημείο κλειδί έχει βρεθεί, συγκρίνοντας ένα pixel με τα γειτονικά του, το επόμενο βήμα είναι να προσδιοριστεί ακριβώς η θέση του, η κλίμακα και ο λόγος καμπυλότητάς του (ratio of principal curvatures). Αυτή η πληροφορία επιτρέπει σε πιθανά σημεία κλειδιά να απορριφθούν, αν έχουν χαμηλή αντίθεση ή δεν διαφέρουν σημαντικά από τα γειτονικά τους, (και έτσι είναι ευαίσθητα σε θόρυβο) ή αν βρίσκονται κακώς τοποθετημένα κατά μήκος μιας ακμής.

45 Κεφάλαιο 2 Αναπαράσταση Προτύπων 19 Η αρχική ιδέα αυτού του σταδίου από τον Lowe[4], απλά εντόπιζε τις συντεταγμένες των σημείων κλειδιών καθώς και την κλίμακά τους και τα τοποθετούσε στο κεντρικό σημείο της εικόνας. Ωστόσο, στη συνέχεια ο Lowe μαζί με τον Brown ανέπτυξαν μία μέθοδο (Brown and Lowe, 2002) για την εφαρμογή μιας 3D δευτεροβάθμιας συνάρτησης στα τοπικά ακρότατα δείγματος για να καθοριστεί η παρεμβαλλόμενη περιοχή του. Τα πειράματά τους έδειξαν ότι με τη μέθοδο αυτή επιτυγχάνεται μια σημαντική βελτίωση στο ταίριασμα των εικόνων και στην ευστάθεια. Αυτή η προσέγγιση χρησιμοποιεί το τετραγωνικό ανάπτυγμα Taylor της συνάρτησης D(x, y, σ), μετατοπισμένη με τέτοιο τρόπο ώστε η αρχή να είναι στο υποψήφιο σημείο κλειδί: D(χ) = D + DT χ χ 2 D χ 2 χ (2.7) όπου η παράμετρος D και οι παράγωγοί της υπολογίζονται στο υποψήφιο σημείο κλειδί και χ = (x, y, σ) T είναι η μετατόπιση από αυτό το σημείο κλειδί. Η θέση του ακρότατου,ˆχ, καθορίζεται παίρνοντας την παράγωγο της σχέσης 2.7 ως προς χ και μηδενίζοντάς την, οπότε: ˆχ = 2 D 1 χ 2 D χ (2.8) Όπως προτάθηκε από τον Brown, η Hessian και η παράγωγος του D προσεγγίζονται χρησιμοποιώντας διαφορές γειτονικών σημείων δείγματος. Εάν η απόσταση του ακρότατου, χ, είναι μεγαλύτερη από 0,5 σε κάθε διάσταση, αυτό είναι ένδειξη ότι το ακρότατο είναι πιο κοντά σε ένα διαφορετικό σημείο κλειδί. Σε αυτή την περίπτωση το υποψήφιο σημείο αλλάζει και η παρεμβολή εφαρμόζεται ξανά στις νέες συντεταγμένες του σημείου που εκτιμάται η ύπαρξη του ακρότατου. Σε διαφορετική περίπτωση η απόσταση του ακρότατου ˆχ προστίθεται στο υποψήφιο σημείο κλειδί, για να πάρουμε την τοποθεσία του ακρότατου. Η τιμή της συνάρτησης στο ακρότατο, D(ˆχ) είναι χρήσιμη για την απόρριψη μη σταθερών ακρότατων με χαμηλή αντίθεση. Αυτό μπορεί να αποκτηθεί, αντικαθιστώντας την εξίσωση (2.8) στην (2.7), όπου προκύπτει: D(ˆχ) = D + 1 D T ˆχ (2.9) 2 χ Αν η τιμή είναι μικρότερη από 0.03 τότε το σημείο κλειδί απορρίπτεται. Αλλιώς διατηρείται με τελική θέση που δίνεται από τον τύπο: y + ˆχ (2.10) όπου y είναι η αρχική τοποθεσία του σημείου κλειδιού.

46 20 Κεφάλαιο 2 Αναπαράσταση Προτύπων Η συνάρτηση ιαφοράς του Gauss έχει υψηλή τιμή κατά μήκος των ακμών, ακόμη και αν το υποψήφιο σημείο-κλειδί δεν είναι ανθεκτικό σε μικρά επίπεδα θορύβου. Επομένως για να αυξηθεί η σταθερότητα πρέπει να περιοριστούν τα σημεία-κλειδιά τα οποία έχουν μεγάλη απόκριση, αλλά δεν έχει προσδιοριστεί επαρκώς η θέση τους. Για αυτό το λόγο υπολογίζονται τα ιδιοδιανύσματα του Εσσιανού μητρώου δεύτερης τάξης: [ ] Dxx D xy H = D xy όπου παράγωγοι υπολογίζονται παίρνοντας διαφορές από γειτονικά σημεία. Βέβαια μπορούμε να αποφύγουμε τον υπολογισμό των ιδιοτιμών, καθώς ενδιαφερόμαστε μόνο για το λόγο τους. Έστω ότι α είναι η ιδιοτιμή με το μεγαλύτερο πλάτος(magnitude) και β με το μικρότερο, τότε μπορούμε να υπολογίσουμε το άθροισμα των ιδιοτιμών από το ίχνος του H και το γινόμενό τους από την ορίζουσα [7]: D yy T r(h) = D xx + D yy = α + β (2.11) Det(H) = D xx D yy (D xy ) 2 = αβ (2.12) Στην περίπτωση που η ορίζουσα είναι αρνητική, το σημείο απορρίπτεται από ακρότατο. Έστω ότι r είναι ο λόγος ανάμεσα στη μεγαλύτερη ιδιοτιμή και τη μικρότερη, έτσι ώστε α = rβ. Τότε, T r(h) 2 (α + β)2 = Det(H) αβ = (rβ + β)2 rβ 2 = (r + 1)2, (2.13) r το οποίο εξαρτάται μόνο από το λόγο των ιδιοτιμών και όχι από τις ξεχωριστές τιμές τους. Η ποσότητα (r+1)2 r γίνεται ελάχιστη όταν οι δύο ιδιοτιμές είναι ίσες και αυξάνεται με το r. Έτσι, για να ελέγξουμε ότι ο λόγος των κύριων καμπυλοτήτων είναι κάτω από ένα κατώφλι r, ελέγχουμε μόνο T r(h) 2 (r + 1)2 = Det(H) r (2.14) Καθορισμός προσανατολισμού Σε αυτό το στάδιο του αλγορίθμου, θα πρέπει να ορίσουμε έναν προσανατολισμό για κάθε ένα σημείο κλειδί που εντοπίσαμε [1]. Ο καθορισμός προσανατολισμού είναι μία σημαντική διαδικασία, γιατί είναι πιθανόν να έχουμε δύο εικόνες οι οποίες περιγράφουν το ίδιο αντικείμενο αλλά με διαφορετικό προσανατολισμό η κάθε μία. Ο αλγόριθμος, θα πρέπει να

47 Κεφάλαιο 2 Αναπαράσταση Προτύπων 21 είναι σε θέση να εντοπίζει τα ίδια σημεία κλειδιά για ένα αντικείμενο ακόμη και αν αυτό είναι περιστραμμένο. Η διαδικασία που ακολουθείται για τον καθορισμό προσανατολισμού είναι η ακόλουθη. Δεδομένης μιας εικόνας, στην οποία έχουμε εφαρμόσει το φίλτρο Gauss και έχουμε εντοπίσει τα σημεία κλειδιά της, για κάθε ένα pixel της, υπολογίζουμε το μέγεθος κλίσης (gradient magnitude) της, m(x, y) καθώς και τον προσανατολισμό (orientation) θ(x, y), χρησιμοποιώντας τα τέσσερα γειτονικά pixels. Οι σχέσεις που περιγράφουν τα παραπάνω μέτρα είναι: m(x, y) = (L(x + 1, y) L(x 1, y)) 2 + (L(x, y + 1) L(x, y 1)) 2 (2.15) θ(x, y) = tan 1 L(x, y + 1) L(x, y 1) ( L(x + 1, y) L(x 1, y) ) (2.16) Επόμενο βήμα, αποτελεί η επιλογή ορισμένων pixels γύρω από κάθε ένα σημείο κλειδί, με σκοπό την δημιουργία ενός ιστογράμματος με βάση τον προσανατολισμό τους. Κάθε ένα pixel που εισάγεται στο ιστόγραμμα, πολλαπλασιάζεται με το μέγεθος κλίσης που αντιστοιχεί σε αυτό. Τέλος, η ανάθεση προσανατολισμού στο εκάστοτε σημείο κλειδί, γίνεται με γνώμονα τον προσανατολισμό της υψηλότερης κορυφής του ιστογράμματος και με τον προσανατολισμό των κορυφών που αντιστοιχούν στο 80% της υψηλότερης συχνότητας Περιγραφή των σημείων κλειδιών Στα προηγούμενα βήματα του αλγορίθμου SIFT, εντοπίσαμε τη θέση, τη κλίμακα και την κατεύθυνση των σημείων κλειδιών. Το επόμενο και τελευταίο στάδιο, είναι να υπολογίσουμε ένα περιγραφέα (descriptor) για τα σημεία κλειδιά, ο οποίος θα είναι αρκετά ευδιάκριτος και θα παραμένει αμετάβλητος σε πιθανές διακυμάνσεις τόσο στο φωτισμό των εικόνων όσο και σε ενδεχόμενη αλλαγή της γωνίας λήψης. Στο σχήμα 2.5, παρουσιάζεται η διαδικασία που απαιτείται για τον υπολογισμό του περιγραφέα. Όπως παρατηρούμε, πρώτα θα υπολογίσουμε το μέγεθος κλίσης και τον προσανατολισμό για τα pixels της γειτονιάς του σημείου κλειδιού. Οι κλίσεις παρουσιάζονται με μικρά τόξα όπως βλέπουμε στο αριστερό μέρος του σχήματος. Στη συνέχεια, μία Gaussian συνάρτηση με βάρος σ ίσο με το μισό του πλάτους του παραθύρου του περιγραφέα, χρησιμοποιείται για να προσδώσει ένα βάρος στο μέγεθος κλίσης του καθενός γειτονικού pixel.

48 22 Κεφάλαιο 2 Αναπαράσταση Προτύπων Σχήμα 2.5: Ο περιγραφέας μιας εικόνας [1]. Στο επόμενο βήμα, θα κατασκευάσουμε ένα ιστόγραμμα με άξονα τον προσανατολισμό των pixels για κάθε μία από τις τέσσερις υποπεριοχές. Πειράματα έχουν δείξει πως, η δημιουργία ιστογράμματος με 8 κατευθύνσεις (bins) αποφέρει καλύτερα αποτελέσματα. Έτσι, δημιουργείται ένα διάνυσμα περιγραφής διάστασης 2 2 για το σημείο κλειδί, όπως φαίνεται στη δεξιά μεριά του σχήματος Ο αλγόριθμος SURF Ένας άλλος αλγόριθμος, που αν και πιο νέος από το SIFT, χρησιμοποιείται ήδη ευρέως σε ποικίλες εφαρμογές του τομέα της υπολογιστικής όρασης, παρουσιάστηκε στο 9ο ευρωπαϊκό συνέδριο υπολογιστικής όρασης που διεξήχθη στη πόλη Γρατς της Αυστρίας το Αυτός, είναι ο αλγόριθμος SURF (Speeded Up Robust Features) και οι δημιουργοί του είναι οι: Herbert Bay, Andreas Ess, Tinne Tuytelaars, και ο Luc Van Gool. Ο βασικός στόχος του SURF (ο οποίος στηρίζεται στην ίδια λογική με τον SIFT), είναι η εύρεση διακριτών σημείων σε μία εικόνα. Για να επιτευχθεί αυτό, θα πρέπει να γίνουν μια σειρά από ενέργειες [6]. Πρώτα θα πρέπει να εντοπιστούν τα σημεία ενδιαφέροντος της εικόνας επιλέγοντας συγκεκριμένες τοποθεσίες της, όπως για παράδειγμα γωνίες ή σημεία blob. Γράφοντας για σημεία blob, αναφερόμαστε σε ένα σύνολο από pixels που ο υπολογιστής τα αναγνωρίζει σαν αντικείμενα. Για παράδειγμα, ένας άνθρωπος σε μία εικόνα μπορεί να θεωρηθεί ως blob σημείο. Στη συνέχεια, θα πρέπει η περιοχή κάθε σημείου ενδιαφέροντος να εκπροσωπηθεί από ένα χαρακτηριστικό διάνυσμα που θα αποτελεί στοιχείο του περιγραφέα της εικόνας. Ο περιγραφέας θα πρέπει και σε αυτό τον αλγόριθμο να είναι ανθεκτικός στο θόρυβο ή σε αλλαγές της φωτεινότητας ή της γεωμετρίας μιας εικόνας. Επιπλέον, τόσο ο ανιχνευτής σημείων ενδιαφέροντος, όσο και ο περιγραφέας θα πρέπει να είναι γρήγορα υπολογίσιμοι χωρίς βέβαια να θυσιάζεται η ακρίβεια.

49 Κεφάλαιο 2 Αναπαράσταση Προτύπων Εικόνες ολοκλήρωμα Πριν προβούμε στην ανάλυση των βημάτων του αλγορίθμου, θα ήταν χρήσιμο να αναφερθούμε στις εικόνες ολοκλήρωμα (integral images). Οι εικόνες αυτές, χρησιμοποιούνται από τον SURF, για το γρήγορο υπολογισμό συνελικτικών φίλτρων. Η είσοδος μιας εικόνας ολοκλήρωμα I Σ (x) σε μία τοποθεσία x = (x, y) T αντιπροσωπεύει το άθροισμα όλων των pixels στην εικόνα εισόδου I μέσα σε μία ορθογώνια περιοχή σχηματισμένη από την αρχή και το pixel x [8]. j y i x I Σ (x) = I(i, j) (2.17) i=0 j=0 Όταν η εικόνα ολοκλήρωμα υπολογιστεί, με τη χρήση μόλις τριών πράξεων μπορούμε να υπολογίσουμε το άθροισμα των εντάσεων πάνω σε οποιαδήποτε ορθογώνια περιοχή, όπως παρουσιάζεται στο παρακάτω σχήμα. Σχήμα 2.6: Υπολογισμός έντασης μιας περιοχής με χρήση τριών πράξεων και τεσσάρων προσπελάσεων στη μνήμη. Εύκολα γίνεται αντιληπτό πως ο χρόνος υπολογισμού, είναι ανεξάρτητος του μεγέθους της περιοχής κάτι το οποίο είναι σημαντικό καθώς στη περίπτωση του αλγορίθμου SURF χρησιμοποιούνται φίλτρα μεγάλου μεγέθους Ανίχνευση σημείων ενδιαφέροντος Η προσέγγιση του αλγορίθμου SURF για την ανίχνευση σημείων ενδιαφέροντος χρησιμοποιεί μία βασική προσέγγιση του Εσσιανού μητρώου, κυρίως για λόγους καλής απόδοσης

50 24 Κεφάλαιο 2 Αναπαράσταση Προτύπων σε υπολογιστικούς χρόνους και ακρίβειας [5]. Δοθέντος ενός σημείου x = (x, y) σε μία εικόνα I, ορίζουμε το Εσσιανό μητρώο H(x, σ) στη κλίμακα σ ως: H(x, σ) = [ ] Lxx (x, σ) L xy (x, σ) L xy (x, σ) L yy (x, σ) όπου το L xx (x, σ) είναι η συνέλιξη της δεύτερης τάξης παραγώγου της Gaussian συνάρτησης 2 x 2 g(σ) με την εικόνα I στο σημείο x και ομοίως για τα L x,y (x, σ) και L yy (x, σ). Δεδομένης της επιτυχίας του Lowe με τις προσεγγίσεις της κλίμακας Laplace του Gauss, η προσέγγιση για το Εσσιανό μητρώο πάει ένα βήμα πιο πέρα με τη χρήση φίλτρων κουτιών όπως παρουσιάζονται στο σχήμα 2.7. Αυτά προσεγγίζουν την δεύτερης τάξης παράγωγο της Gaussian συνάρτησης και είναι αρκετά εύκολο να εκτιμηθούν με χαμηλό υπολογιστικό κόστος, με τη βοήθεια των εικόνων ολοκληρωμάτων. Σχήμα 2.7: Προσεγγίσεις της κλίμακας Laplace του Gauss σε x,y και xy διεύθυνση [7]. Τα 9 9 φίλτρα κουτιά στο σχήμα 2.7, προσεγγίζουν μία Gaussian συνάρτηση με τυπική απόκλιση σ=1.2 και αναπαριστούν την χαμηλότερη κλίμακα για τον υπολογισμό των blob αντικειμένων. Θα ονομάζουμε αυτές τις προσεγγίσεις D xx, D yy, D xy. Τα βάρη που εφαρμόζονται στις ορθογώνιες περιοχές, διατηρούνται για λόγους υπολογιστικής επίδοσης. Υπολογίζοντας την ορίζουσα του Εσσιανού μητρώου έχουμε: det(h approx ) = D xx D yy (wd xy ) 2 (2.18) όπου το βάρος w των αποκρίσεων των φίλτρων χρησιμοποιείται για εξισορρόπηση της έκφρασης της Εσσιανής ορίζουσας. Αυτό χρειάζεται για την διατήρηση της ενέργειας μεταξύ των Gaussian πυρήνων και των προσεγγισμένων Gaussian πυρήνων και η τιμή του δίνεται από τη παρακάτω σχέση:

51 Κεφάλαιο 2 Αναπαράσταση Προτύπων 25 w = L xy(1.2) F D yy (9) F L yy (1.2) F D xy (9) F = (2.19) με x F να αποτελεί την Frobenius νόρμα. Το βάρος μπορεί να αλλάξει ανάλογα με την κλίμακα, όμως στη περίπτωση που διατηρηθεί σταθερό, πρακτικά δεν θα έχει μεγάλη επίδραση. Επιπρόσθετα, οι αποκρίσεις των φίλτρων κανονικοποιούνται σε σχέση με το μέγεθός τους. Αυτό εξασφαλίζει μια σταθερή νόρμα Frobenius για κάθε μέγεθος φίλτρου, κάτι το οποίο είναι ιδιαίτερα σημαντικό για την ανάλυση στο χώρο κλίμακας. Η προσεγγισμένη Εσσιανή ορίζουσα εκπροσωπεί την απόκριση blob της εικόνας στο σημείο x. Αυτές οι αποκρίσεις αποθηκεύονται σε μία λίστα, γνωστή ως χάρτη απόκρισης blob για διαφορετικές κλίμακες και ανιχνεύουν τοπικά μέγιστα με τον τρόπο που εξηγούμε στη συνέχεια. Στον αλγόριθμο SIFT, η αναζήτηση σημείων ενδιαφέροντος απαιτούσε τη σύγκριση Gaussian φιλτραρισμένων εικόνων με διαφορετικές κλίμακες [36]. Έτσι λοιπόν και ο SURF, απαιτεί τη χρήση κλίμακας για τον εντοπισμό τους. Όπως είδαμε και νωρίτερα, ο χώρος κλίμακας υλοποιήθηκε ως μια πυραμίδα. Οι εικόνες, φιλτραρίζονταν με την Gaussian συνάρτηση και μετά υποδειγματολειπτούνταν ώστε να επιτευχθεί το ανώτερο επίπεδο της πυραμίδας (αριστερό μέρος σχήματος 2.8). Λόγω της χρήσης των φίλτρων κουτιών και των εικόνων ολοκλήρωμα, δε χρειάζεται να εφαρμόσουμε επαναληπτικά το ίδιο φίλτρο στην έξοδο ενός προηγουμένως φιλτραρισμένου επιπέδου, αλλά αντί αυτού μπορούμε να εφαρμόσουμε φίλτρα κουτιά οποιουδήποτε μεγέθους απευθείας στην αρχική εικόνα. Άρα ο χώρος κλίμακας, αντί να μειώνει επαναληπτικά το μέγεθος της εικόνας, αναλύεται με το να αυξάνει τη κλίμακα του μεγέθους του φίλτρου όπως φαίνεται στο σχήμα 2.8. Σχήμα 2.8: Αριστερά: Προσέγγιση του χώρου κλίμακας με βάση τον SIFT. Δεξιά: Ο SURF αφήνει αμετάβλητη την εικόνα αλλάζοντας μόνο το μέγεθος του φίλτρου [7].

52 26 Κεφάλαιο 2 Αναπαράσταση Προτύπων Η έξοδος του 9 9 φίλτρου, όπως αναφέραμε και πριν, θεωρείται ως το αρχικό επίπεδο κλίμακας το οποίο θα αναφέρεται ως κλίμακα s = 1.2 (προσεγγίζοντας Γκαουσιανές παραγώγους με σ = 1.2). Τα ακόλουθα επίπεδα δημιουργούνται φιλτράροντας την εικόνα με σταδιακά μεγαλύτερες μάσκες, όπως για παράδειγμα φίλτρα μεγέθους 15 15, και Εντοπισμός σημείων ενδιαφέροντος Προκειμένου να εντοπισθεί η τοποθεσία των σημείων ενδιαφέροντος, χρησιμοποιείται η τεχνική της μη μέγιστης κατάπνιξης (Non maximum suppression) σε μία γειτονιά και κρατάμε εκείνα τα pixels που είναι μεγαλύτερα από τους 26 γείτονές τους. Έπειτα, γίνεται μία παρεμβολή της γειτονικής πληροφορίας. Έτσι, η Εσσιανή ορίζουσα H(x, σ), εκφράζεται σαν ανάπτυγμα Taylor 2ου βαθμού, γύρο από το σημείο του μεγίστου. H(x) = H + HT x x + 2 H T x 2 x (2.20) Η θέση του ακρότατου ˆx = (x, y, σ) υπολογίζεται εάν πάρουμε τις παραγώγους της παραπάνω συνάρτησης και τις θέσουμε ίσες με το μηδέν. Δηλαδή: ˆx = 2 H 1 x 2 d xx d yx d σx H x = d xy d yy d σy d xσ d yσ d σσ 1 d x Εδώ, το d x εκφράζει την I x και το d xx αναφέρεται στην 2 I x 2, όπου I, η εικόνα. d y d σ Ανάθεση προσανατολισμού στα σημεία ενδιαφέροντος Για να εξασφαλίσουμε ότι η εικόνα παραμένει αναλλοίωτη κατά τη περιστροφή της, θα πρέπει να ορίσουμε έναν κυρίαρχο προσανατολισμό για τα σημεία ενδιαφέροντος. Για αυτό το σκοπό, υπολογίζονται πρώτα οι αποκρίσεις των κυματιδίων Haar (Haar wavelets) στην x και y κατεύθυνση μέσα σε μία κυκλική περιοχή ακτίνας 6s γύρω από το σημείο ενδιαφέροντος, όπου s είναι η κλίμακα που εντοπίσαμε το ακρότατο. Επιπλέον, για τον υπολογισμό της διεύθυνσης, δεν χρησιμοποιούνται όλα τα pixels που βρίσκονται μέσα στο κύκλο, αλλά γίνεται μία δειγματοληψία με βήμα s. Ακόμα, το μέγεθος των κυματιδίων είναι επίσης εξαρτώμενο από την κλίμακα και τίθεται ως 4s. Έτσι, μπορούμε να χρησιμοποιήσουμε πάλι τις εικόνες ολοκλήρωμα για ένα γρήγορο φιλτράρισμα. Τα φίλτρα αυτά, παρουσιάζονται στο σχήμα 2.9.

53 Κεφάλαιο 2 Αναπαράσταση Προτύπων 27 Σχήμα 2.9: Το αριστερό φίλτρο υπολογίζει την παράγωγο στη y διεύθυνση ενώ το δεξί στη x διεύθυνση. Όταν οι αποκρίσεις των κυματιδίων υπολογιστούν, το επόμενο βήμα είναι η στάθμισή τους με μία Gaussian συνάρτηση, με κέντρο το σημείο ενδιαφέροντος και απόκλιση 2.5s. Oι αποκρίσεις εκπροσωπούνται ως σημεία σε ένα χώρο, με οριζόντια δύναμη απόκρισης κατά μήκος της τετμημένης και την κατακόρυφη δύναμη απόκρισης κατά μήκος της τεταγμένης. Ο κυρίαρχος προσανατολισμός υπολογίζεται από τον υπολογισμό του αθροίσματος όλων των αποκρίσεων μέσα σε ένα περιστρεφόμενο κυκλικό τμήμα που καλύπτει γωνία π 3 γύρω από το σημείο ενδιαφέροντος. Σε κάθε θέση που δείχνει αυτό το κυκλικό τμήμα, οι αποκρίσεις στους άξονες x και y αθροίζονται και φτιάχνουν ένα νέο διάνυσμα. Το μεγαλύτερο από αυτά τα διανύσματα, καθορίζει και τον κυρίαρχο προσανατολισμό όπως φαίνεται και στο σχήμα Σχήμα 2.10: Η διαδικασία ανάθεσης προσανατολισμού για τα σημεία ενδιαφέροντος του SURF [7] Ο περιγραφέας του SURF Το βασικό στάδιο που απομένει για την ολοκλήρωση του αλγορίθμου SURF, είναι η κατασκευή του περιγραφέα [7]. Για την εξαγωγή του, το πρώτο βήμα αποτελείται από την κατασκευή μιας τετράγωνη περιοχής, επικεντρωμένης γύρω από το σημείο ενδιαφέροντος και προσανατολισμένη κατά μήκος του προσανατολισμού που επιλέχθηκε στο προηγούμενο βήμα. Το μέγεθος του παραθύρου είναι 20s. Παραδείγματα από τέτοιες τετράγωνες περιοχές φαίνονται στο σχήμα Στη συνέχεια, τα παράθυρα χωρίζονται σε μικρότερες 4 4 τετράγωνες υποπεριοχές. Αυτό διατηρεί σημαντική χωρική πληροφορία και για κάθε υποπεριοχή, υπολογίζονται

54 28 Κεφάλαιο 2 Αναπαράσταση Προτύπων Σχήμα 2.11: Διαφορετικές κλίμακες προσανατολισμένων παραθύρων [5]. οι αποκρίσεις των κυματιδίων Haar μεγέθους 2s, σε 25 κατανεμημένα σημεία δειγματοληψίας. Για λόγους απλότητας, ονομάζεται dx η απόκριση του κυματιδίου Haar στην οριζόντια διεύθυνση και dy η αντίστοιχη απόκριση στην κατακόρυφη διεύθυνση. Το οριζόντιο και το κατακόρυφο ορίζεται σε σχέση με τον επιλεγμένο προσανατολισμό του σημείου ενδιαφέροντος. Για την αύξηση της στιβαρότητας ως προς γεωμετρικές παραμορφώσεις και σφάλματα εντοπισμού, οι αποκρίσεις d x και d y πρώτα με μια Gaussian με σ = 3.3s επικεντρωμένη και πάλι στο σημείο ενδιαφέροντος.κατόπιν, οι αποκρίσεις κυματιδίων d x και d y αθροίζονται πάνω σε κάθε υποπεριοχή και σχηματίζουν το πρώτο σύνολο καταχωρήσεων στο διάνυσμα του περιγραφέα. Για να υπάρχει πληροφορία για την πόλωση των αλλαγών των εντάσεων, αφαιρούνται επίσης οι απόλυτες τιμές των αποκρίσεων, d x και d y. Έτσι, κάθε υποπεριοχή έχει ένα τετραδιάστατο διάνυσμα περιγραφέα u για την δομή έντασης. Ενώνοντας αυτό για όλες τις 4 4 υποπεριοχές, προκύπτει ένα διάνυσμα περιγραφέα με μήκος 64. Η διαδικασία αυτή, εξασφαλίζει το αναλλοίωτο σε περιστροφή, αλλαγή κλίμακας, φωτεινότητας και μετά από κανονικοποίηση, σε αντίθεση. 2.4 Συγκρίνοντας τους αλγορίθμους SIFT & SURF Μελετώντας το θεωρητικό υπόβαθρο των αλγορίθμων SIFT και SURF, μπορούμε να καταλήξουμε σε κάποια χρήσιμα συμπεράσματα. Ξεκινώντας με τον SIFT και με τα 128- διάστατα διανύσματα του για την περιγραφή των σημείων κλειδιών, προσδίδουν στον αλγόριθμο ένα σημαντικό πλεονέκτημα έναντι του SURF. Ακόμα, σε τυπικές εικόνες, εξάγεται μεγάλος αριθμός από σημεία κλειδιά και αυτό έχει ως αποτέλεσμα να εξάγονται κλειδιά και από αντικείμενα που καταλαμβάνουν μικρό τμήμα της σκηνής ή καλύπτονται, μερικώς, από άλλο αντικείμενο. Επιπρόσθετα, οι απαιτούμενοι υπολογισμοί είναι αποτελεσματικοί και μπορεί να εξαχθεί μεγάλος αριθμός από σημεία ενδιαφέροντος από μια πραγματική εικόνα με μεγάλη ταχύτητα και χωρίς αυξημένες απαιτήσεις σε υλικό.τέλος, πρέπει να αναφερθεί

55 Κεφάλαιο 2 Αναπαράσταση Προτύπων 29 ότι οι Mikolajczyk και Schmid [9] σύγκριναν αλγόριθμους για εξαγωγή χαρακτηριστικών με τον αλγόριθμο SIFT και απέδειξαν ότι ο τελευταίος έχει καλύτερες επιδόσεις. Από την άλλη πλευρά και σύμφωνα με πειραματικές μετρήσεις που έγιναν στο [5] και [6] ο αλγόριθμος SURF είναι περίπου 3-5 φορές γρηγορότερος από τον SIFT, ενώ παράλληλα είναι πιο ανθεκτικός ως προς τον θόρυβο και προσαρμόζεται πιο εύκολα για παράλληλη επεξεργασία αφού κάθε Εσσιανή εικόνα μπορεί να παραχθεί ανεξάρτητα (σε αντίθεση με τον SIFT). Το μεγάλο κέρδος στην ταχύτητα προέρχεται όχι μόνο από τη χρήση των εικόνων ολοκλήρωμα, που μειώνουν δραστικά τις πράξεις για απλές συνελίξεις κουτιά ανεξαρτήτου κλίμακας, αλλά και από την μικρότερη διάσταση (64) των διανυσμάτων του περιγραφέα του. Δεν τίθεται αμφιβολία πως πρόκειται για δύο από τους πιο ελκυστικούς αλγορίθμους για πρακτικές εφαρμογές και γι' αυτό το λόγο χρησιμοποιούνται ευρέως στις μέρες μας.

56 30 Κεφάλαιο 2 Αναπαράσταση Προτύπων

57 Κεφάλαιο 3 Μείωση Διάστασης Δεδομένων 3.1 Εισαγωγή Η γέννηση χαρακτηριστικών είναι μία σημαντική διεργασία για ένα πρόβλημα αναγνώρισης προτύπων, γιατί μέσα αυτών στοχεύουμε στην ανακάλυψη αναπαραστάσεων των δεδομένων μας, οι οποίες θα είναι συμπαγείς και πλούσιες σε πληροφορία. Μία παρόμοια διεργασία συναντάει κανείς στον τρόπο με τον οποίο λειτουργεί η ανθρώπινη αντίληψη. Η νοημοσύνη μας βασίζεται σε ένα σχετικά μικρό αριθμό χαρακτηριστικών, που η αντίληψή μας θεωρεί σχετικά-σημαντικά. Αυτά χαρακτηρίζονται ως σχετικά, μετά από επεξεργασία μεγάλης ποσότητας πληροφορίας που προέρχεται από τα δεδομένα των αισθήσεών μας, όπως για παράδειγμα η ένταση και τα χρώματα των εικονοστοιχείων των εικόνων που προσλαμβάνει η όρασή μας ή τα σήματα ήχου που γίνονται αντιληπτά από την ακοή [23]. Όσο σημαντική είναι η επεξεργασία των δεδομένων στην ανθρώπινη αντίληψη, έτσι και σε νέα σύστημα αναγνώρισης προτύπων αποτελεί ένα αναπόσπαστο τμήμα του. Η προεπεξεργασία προετοιμάζει τα δεδομένα μας για την εκμάθηση της μηχανής με απώτερο στόχο εξόρυξη γνώσης. Ένα από τα μεγαλύτερα προβλήματα που σχετίζονται με την αναγνώριση προτύπων είναι η αποκαλούμενη "κατάρα της διαστασιμότητας" (curse of dimensionality). Αυτό πρακτικά σημαίνει ότι τα δεδομένα μας αποτελούνται από έναν μεγάλο αριθμό χαρακτηριστικών που σε κάποιες ερευνητικές εργασίες μπορεί να ξεπερνά τα εκατοντάδες ακόμα και τα δεκάδες χιλιάδες στο πλήθος χαρακτηριστικών [25]. Ο ρόλος λοιπόν της προεπεξεργασίας των δεδομένων, είναι η επιλογή χαρακτηριστικών ή διαφορετικά η μείωσή τους (reduction) με τέτοιο τρόπο ώστε να επιλέγονται τα πιο σημαντικά από αυτά, αλλά συγχρόνως να διατηρείται όσο το δυνατόν καλύτερα η διακριτική πληροφορία που φέρουν. Η διαδικασία αυτή είναι ζωτικής σημασίας καθώς αν επιλεγούν χαρακτηριστικά μικρής διακριτικής ικανότητας η απόδοση του ταξινομητή δεν θα είναι 31

58 32 Κεφάλαιο 3 Μείωση Διάστασης Δεδομένων ικανοποιητική, ενώ σε διαφορετική περίπτωση το κέρδος πολυπλοκότητας του ταξινομητή μπορεί να γίνει σημαντικά μεγάλο. Η βασική προσέγγιση που ακολουθείται σε αυτό το κεφάλαιο, είναι η εφαρμογή ενός γραμμικού μετασχηματισμού στα χαρακτηριστικά ενός συνόλου με στόχο την απόρριψη αυτών που παρουσιάζουν μικρή διακριτική ικανότητα. 3.2 Ανάλυση Κύριων Συνιστωσών Η ανάλυση κύριων συνιστωσών (Principal Component Analysis - PCA) ή όπως διαφορετικά είναι γνωστή ως μετασχηματισμός Karhunen-Loève είναι μία από τις πλέον δημοφιλείς μεθόδους γέννησης χαρακτηριστικών και μείωσης διάστασης στην αναγνώριση προτύπων. Αν και πρόκειται για μία παλιά τεχνική, παρουσιάστηκε από τον Karl Pearson το 1901 [26], εξακολουθεί να χρησιμοποιείται και να αποτελεί βάση για ένα πλήθος πιο εξελιγμένων τεχνικών Η βασική ιδέα της μεθόδου των κύριων συνιστωσών Η PCA είναι μία στατιστική μέθοδος η οποία έχει ως στόχο την συμπίεση διανυσμάτων σε μικρότερο αριθμό διαστάσεων. Για να το πετύχει αυτό, εκμεταλλεύεται τις συσχετίσεις ανάμεσα στις μεταβλητές των διανυσμάτων που πρόκειται να συμπιεστούν. Έστω x το διάνυσμα των δειγμάτων εισόδου και έστω η διάστασή του να είναι n, οπότε η μορφή τους είναι: (x 1, x 2,..., x n ). Ο στόχος της μεθόδου είναι ο μετασχηματισμός του χώρου των δεδομένων εισόδου σε έναν άλλο χώρο, ο οποίος είναι και αυτός n διαστάσεων και είναι ο χώρος των κυρίων συνιστωσών (Principal Components-PCs). Οι κύριες συνιστώσες είναι ασυσχέτιστες μεταξύ τους, και είναι υπολογισμένες με τέτοιο τρόπο, ώστε το μεγαλύτερο ποσοστό της μεταβλητότητας του δείγματος των διανυσμάτων να αντιπροσωπεύεται από όσο το δυνατό λιγότερους PCs[27]. Η κάθε κύρια συνιστώσα λοιπόν, εκφράζει τη διασπορά που εμφανίζουν τα δεδομένα μας σε μία διάσταση του χώρου. Συνηθίζεται οι κύριες συνιστώσες να διατάσσονται με την εξής φθίνουσα σειρά. Η πρώτη κύρια συνιστώσα (P C 1 ) είναι αυτή που εκφράζει το μεγαλύτερο ποσοστό μεταβλητότητας του δείγματος, δηλαδή αντιστοιχεί στη μέγιστη ποικιλία δεδομένων. Η επόμενη κύρια συνιστώσα (P C 2 ) εκφράζει το δεύτερο μεγαλύτερο ποσοστό μεταβλητότητας του δείγματος και ούτω καθεξής. Όλες μαζί οι PCs αποτελούν το 100% της μεταβλητότητας του δείγματος. Ο λόγος για τον οποίο οι κύριες συνιστώσες κατασκευάζονται με αυτή τη λογική της φθίνουσας σειράς είναι ο εξής: αν υπάρχει ένας αριθμός m από PCs τέτοιος ώστε m < n και ο οποίος αρκεί για να καλύψει ένα μεγάλο ποσοστό της μεταβλητότητας του δείγματος,

59 Κεφάλαιο 3 Μείωση Διάστασης Δεδομένων 33 Σχήμα 3.1: Οι κύριες συνιστώσες ενός δισδιάστατου σύνολου δεδομένων. τότε τα διανύσματα μπορούν να συμπιεστούν από n σε m συνιστώσες χωρίς την απώλεια αρκετής πληροφορίας. Ακόμα, κάθε κύρια συνιστώσα ορίζεται να είναι ένας γραμμικός συνδυασμός των (x 1, x 2,..., x n ). Έτσι, η i-οστή κύρια συνιστώσα P C i έχει τη μορφή: P C i = a 1 x 1 + a 2 x a n x n Η παραπάνω θεωρητική προσέγγιση της μεθόδου των κύριων συνιστωσών μπορεί να γίνει πιο κατανοητή παρατηρώντας το σχήμα 3.1. Το δείγμα του σχήματος αποτελείται ένα πλήθος διανυσματικών μετρήσεων δύο μεταβλητών (x 1, x 2 ). Εφαρμόζοντας τη μέθοδο, το δείγμα μετατρέπεται σε διανύσματα από κύριες συνιστώσες και έχει τη μορφή (P C 1, P C 2 ). Ο βασικός στόχος της είναι η συμπίεση των δεδομένων μας από το χώρο των δύο διαστάσεων σε χώρο μίας διάστασης, χωρίς σημαντική απώλεια πληροφορίας.

60 34 Κεφάλαιο 3 Μείωση Διάστασης Δεδομένων Όπως αναφέρθηκε προηγουμένως, κάθε μία κύρια συνιστώσα είναι ένας γραμμικός συνδυασμός των πραγματικών μεταβλητών οπότε ισχύει: P C 1 = a 1 x 1 + a 2 x 2 &P C 2 = b 1 x 1 + b 2 x 2 (3.1) Ο κάθε ένας PC εκφράζει έναν άξονα όπως φαίνεται και στο σχήμα, και επειδή οι PCs είναι ανεξάρτητοι και ορθογώνιοι μεταξύ τους, οι δύο αυτοί άξονες θα είναι κάθετοι μεταξύ τους. Ο άξονας του P C 1 είναι η ευθεία κατά μήκος της οποίας οι μετρήσεις του δείγματος παρουσιάζουν τη μεγαλύτερη μεταβλητότητα, ενώ ο άξονας του P C 2 είναι κάθετος σε αυτόν του P C 1, και κατά μήκος του η μεταβλητότητα των μετρήσεων είναι σαφώς μικρότερη, όπως το περιμέναμε. Αν χρησιμοποιήσουμε μόνο τον P C 1 και αγνοήσουμε τον P C 2, τότε οι διανυσματικές μετρήσεις συμπιέζονται από μία σε δύο διαστάσεις και όταν αποσυμπιεστούν θα βρίσκονται όλες πάνω στον άξονα του P C 1. Τότε η πληροφορία που θα έχει χαθεί εκφράζεται από την απόσταση των πραγματικών μετρήσεων από τον άξονα του P C 1. Επομένως, όσο μικρότερη είναι η μεταβλητότητα κατά μήκος του άξονα P C 2 που αγνοήθηκε, τόσο μικρότερο είναι και το σφάλμα - απώλεια πληροφορίας. Ένα ιδιαίτερα χρήσιμο συμπέρασμα που μπορούμε να βγάλουμε είναι το εξής: όταν οι μεταβλητές ενός δείγματος είναι συσχετισμένες μεταξύ τους, τότε αρκούν λιγότεροι PCs για να εκφράσουν ένα πολύ μεγάλο ποσοστό της μεταβλητότητας του δείγματος, και συνεπώς το δείγμα υφίσταται μεγαλύτερη συμπίεση. Στην αντίθετη περίπτωση, αν δηλαδή οι μετρήσεις ενός δείγματος είναι αρκετά ασυσχέτιστες μεταξύ τους, τότε απαιτούνται πολλοί, αν όχι όλοι, PCs για να εκφράσουν ένα σημαντικό ποσοστό της μεταβλητότητας του δείγματος, και τότε η συμπίεση είναι πολύ μικρή Υπολογισμός Κυρίων Συνιστωσών Όπως αναφέραμε και την προηγούμενη παράγραφο, για την εύρεση και τον υπολογισμό των κύριων συνιστωσών χρειάζεται ο υπολογισμός της διασποράς των δεδομένων. Στην περίπτωση που τα δεδομένα μας αποτελούνται από περισσότερα του ενός χαρακτηριστικά, υπολογίζουμε το μητρώο συνδιασπορών (convariance matrix) και εν συνεχεία τις ιδιοτιμές και τα ιδιοδιανύσματά του. Στη συνέχεια, οι ιδιοτιμές ταξινομούνται σε φθίνουσα σειρά του μεγέθους τους. Οι μεγαλύτερες σε μέγεθος ιδιοτιμές αντιστοιχούν σε μικρότερης τάξης κύριες συνιστώσες. Κάθε μία κύρια συνιστώσα P C i κατασκευάζεται ως εξής. Αν η P C i αντιστοιχεί στην i-στή μεγαλύτερη ιδιοτιμή λ i, τότε υπολογίζεται ως: P C i = α ix,

61 Κεφάλαιο 3 Μείωση Διάστασης Δεδομένων 35 όπου α i είναι το ιδιοδιάνυσμα που αντιστοιχεί στην ιδιοτιμή λ i, και x είναι μία διανυσματική μέτρηση του δείγματος σε κανονικές συντεταγμένες. Μολονότι αφετηρία μας ήταν η γέννηση στατιστικώς ανεξάρτητων χαρακτηριστικών, προκύπτει πως ο μετασχηματισμός σε κύριες συνιστώσες κρύβει μία σημαντική ιδιότητα η οποία αποτελεί συνάμα και το μυστικό της δημοφιλίας του, την οποία περιγράφουμε στη συνέχεια [23]. Η ανάλυση κύριων συνιστωσών είναι ένας γραμμικός μετασχηματισμός σε ορθογώνια βάση διανυσμάτων. Χωρίς βλάβη στη γενικότητα, υποθέτουμε ότι τα δεδομένα μας έχουν μηδενική μέση τιμή. Αν αυτό δεν ισχύει, απλά μπορούμε να αφαιρέσουμε την μέση τιμή από το δείγμα μας. Τα δεδομένα εισόδου μας λοιπόν, μετασχηματίζονται σε ένα διάνυσμα y του x ως: y = Ax (3.2) όπου το μητρώο Α αποτελεί την ορθογώνια βάση διανυσμάτων. Λόγο του ορισμού των ορθοκανονικών μητρώων, έχουμε: n 1 x = y(i)a i και y(i) = a(i) T x (3.3) i=0 Ας ορίσουμε τώρα ένα νέο διάνυσμα στον m-διάστατο υπόχωρο: x = m 1 i=0 y(i)a i (3.4) όπου εμπλέκονται μόνο m από τα διανύσματα βάσης. Προφανώς, αυτό δεν είναι τίποτα άλλο από την προβολή του x στον υπόχωρο που ορίζουν τα m ορθοκανονικά ιδιοδιανύσματα που εμπλέκονται στο άθροισμα. Αν προσπαθήσουμε να προσεγγίσουμε το x μέσο της προβολής του, ˆx, το μέσο τετραγωνικό σφάλμα που προκύπτει δίνεται από τη σχέση: E x ˆx 2 = E [ n 1 y(i)a i 2 ] (3.5) Ο στόχος μας τώρα είναι να επιλέξουμε τα ιδιοδιανύσματα που οδηγούν στο ελάχιστο μέσο τετραγωνικό σφάλμα (MSE). Από την εξίσωση 3.4 και λαμβάνοντας υπόψη την ορθοκανονική ιδιότητα των ιδιοδιανυσμάτων, έχουμε: i=m E [ n 1 y(i)a i 2 ] = E [ (y(i)a T i )(y(j)a j ) ] (3.6) i=m i j

62 36 Κεφάλαιο 3 Μείωση Διάστασης Δεδομένων n 1 n 1 = E[y 2 (i)] = a T i E[xx T ]a i (3.7) i=m i=m Συνδυάζοντας την παραπάνω εξίσωση με την 3.4 και τον ορισμό των ιδιοδιανυσμάτων, τελικώς προκύπτει ότι n 1 n 1 E[ x ˆx 2 ] = a T i λ i a i = λ i (3.8) i=m i=m Επομένως, αν στην εξίσωση 3.3 επιλέξουμε τα ιδιοδιανύσματα που αντιστοιχούν στις m μεγαλύτερες ιδιοτιμές του μητρώου, τότε το σφάλμα στην εξίσωση 3.7 ελαχιστοποιείται, και είναι ίσο με το άθροισμα των n m μικρότερων ιδιοτιμών. Ακόμα αποδεικνύεται ότι αυτό είναι το ελάχιστο MSE, σε σύγκριση με οποιαδήποτε άλλη προσέγγιση του x από ένα m-διάστατο διάνυσμα.

63 Κεφάλαιο 4 Τεχνικές Κατηγοριοποίησης 4.1 Εισαγωγή Στο κεφάλαιο αυτό, θα ασχοληθούμε με δύο δημοφιλείς τεχνικές κατηγοριοποίησης οι οποίες είναι τα Τεχνητά Νευρωνικά Δίκτυα και οι Μηχανές Υποστήριξης Διανυσμάτων. Θα αναλύσουμε τη δομή των μοντέλων αυτών, τη λειτουργία τους καθώς επίσης θα εξάγουμε και χρήσιμα συμπεράσματα μέσα από την θεωρητική μελέτη τους. 4.2 Τεχνητά Νευρωνικά Δίκτυα Ένα τεχνητό νευρωνικό δίκτυο (ΤΝΔ), ή απλά νευρωνικό δίκτυο, είναι ένα μαθηματικό μοντέλο επεξεργασίας πληροφορίας του οποίου η λειτουργία είναι εμπνευσμένη από τον τρόπο με τον οποίο οι βιολογικοί νευρώνες, όπως αυτοί του ανθρώπινου εγκεφάλου, επεξεργάζονται την πληροφορία. Αποτελείται από ένα μεγάλο αριθμό διασυνδεδεμένων, ανεξάρτητων επεξεργαστών, οι οποίοι καλούνται νευρώνες και οι οποίοι εργάζονται από κοινού για την επίλυση των προβλημάτων [10]. Τα ΤΝΔ, όπως και οι άνθρωποι, μαθαίνουν από παραδείγματα και ρυθμίζονται με τέτοιο τρόπο ώστε να μπορούν να χρησιμοποιηθούν σε συγκεκριμένες εφαρμογές, όπως για παράδειγμα η αναγνώριση προτύπων ή η ταξινόμηση δεδομένων, μέσα από μία διαδικασία εκπαίδευσης Ιστορική αναδρομή των ΤΝΔ Η ιστορία των ΤΝΔ ξεκίνησε σε διεθνές επίπεδο μόλις κατά τις τελευταίες δεκαετίες, αλλά η μεγάλη ώθηση σε αυτά δόθηκε μετά το Όπως είναι εμφανές, η τεράστια ανάπτυξη τόσο του υλικού όσο και του λογισμικού των υπολογιστών τη δεκαετία του 80, έπαιξε 37

64 38 Κεφάλαιο 4 Τεχνικές Κατηγοριοποίησης καθοριστικό ρόλο στην εξέλιξή τους. Θα ήταν άδικο να υποστηρίξουμε την αντίληψη ότι μόνο η επιστήμη της νευρολογίας συνέβαλλε στην ανάπτυξη των ΤΝΔ. Μαθηματικοί, μηχανικοί, βιολόγοι αλλά και ψυχολόγοι, είναι μόνο μερικοί από τους επιστήμονες που συνέβαλλαν αλλά και συμβάλλουν στην εξέλιξή τους. Ήταν το 1943, όταν οι W.McCulloch και Walter Pitts παρουσίασαν το πρώτο μοντέλο νευρωνικού δικτύου [11]. Στην εργασία τους, θεώρησαν ότι ένα νευρωνικό δίκτυο αποτελείται από μία συλλογή ενός μεγάλου αριθμού νευρώνων και έδειξαν πως θα μπορούσαν να λειτουργούν οι νευρώνες με τις διασυνδέσεις τους. Ο Rosenblatt δείχνοντας ιδιαίτερο ενδιαφέρον για την προσομοίωση των νευρωνικών δικτύων, σχεδίασε και ανέπτυξε το 1957 ένα μοντέλο που είναι γνωστό με την ονομασία Percepton [12]. Το 1982 ο Hopfield απέδειξε ότι ένα δίκτυο πολλών επιπέδων μπορεί να αποθηκεύσει οποιαδήποτε πληροφορία καθώς επίσης και να επανακτήσει όλη τη πληροφορία ενός συστήματος, ακόμη και αν του δοθούν μόνο κάποια τμήματα του συστήματος και όχι όλο το σύστημα [13]. Το 1986 έγινε δεκτή από τους επιστήμονες η μέθοδος της οπισθοδρόμησης (back-propagation) για την εκπαίδευση των νευρωνικών δικτύων. Η αρχική ιδέα αυτής της μεθόδου, προέρχεται από τον Paul J. Werbos το 1972 [14] αλλά η ολοκληρωμένη και αποδεδειγμένη παρουσίασή της, έγινε από τους McClelland και Rumelhart [15]. Οι παραπάνω χρονολογίες είναι μόνο μερικές από αυτές που χαρακτηρίζονται ως ορόσημο σημείο στην ιστορία των νευρωνικών δικτύων. Στις μέρες μας, έχει σημειωθεί σημαντική πρόοδος στο τομέα των ΤΝΔ, αρκετή ώστε να προσελκύσει την μεγάλη προσοχή και τη χρηματοδότηση για περαιτέρω έρευνα. Η πρόοδος, πέρα από τις σημερινές εμπορικές εφαρμογές φαίνεται να είναι δυνατή και κατά συνέπεια, η έρευνα προχωράει σε όλο και περισσότερα μέτωπα Από τα βιολογικά στα τεχνητά νευρωνικά δίκτυα Το ΤΝΔ, όπως αναφέραμε και σε προηγούμενη παράγραφο, είναι ένα σύστημα επεξεργασίας πληροφορίας το οποίο αποτελείται από ένα γράφο που αναπαριστά το σύστημα επεξεργασίας, όπως επίσης και διάφορους αλγορίθμους οι οποίοι προσπελαύουν αυτό το γράφο [16]. Λόγο της προσεκτικής απομίμηση της λειτουργίας του ανθρώπινου εγκεφάλου, τα ΤΝΔ είναι εξοπλισμένα με χαρακτηριστικές ιδιότητες ανάλογες αυτού, όπως για παράδειγμα η ικανότητά τους να μαθαίνουν μέσα από εμπειρίες, να γενικεύουν την υπάρχουσα γνώση και να εκτελούν λογικές πράξεις. Συνεπώς, για να κατανοήσουμε καλύτερα τα νευρωνικά δίκτυα, είναι χρήσιμο να δούμε και να περιγράψουμε, τη δομή των βιολογικών. Το νευρόνιο (ή νευρώνας), είναι ένα ζωντανό κύτταρο και αποτελεί το θεμελιώδες δομικό στοιχείο του ανθρώπινου νευρικού συστήματος. Ο κάθε νευρώνας συνδέεται με πολλούς άλλους νευρώνες, με κύριο στόχο την

65 Κεφάλαιο 4 Τεχνικές Κατηγοριοποίησης 39 επικοινωνία τους κάνοντας ανταλλαγή ηλεκτρικών σημάτων. Υπολογίζεται ότι υπάρχουν 30 δισεκατομμύρια νευρώνια στον ανθρώπινο εγκέφαλο και κάθε ένας έχει κατά μέσο όρο συνάψεις (εισόδους) και 500 συναπτικές απολήξεις (εξόδους). Όλα οι νευρώνες, ανεξαρτήτως του είδους, σχήματος και μεγέθους αποτελούνται από τα ίδια βασικά μέρη, τα οποία είναι: το κυτταρικό σώμα, οι δενδρίτες και ο άξονας, όπως δείχνει και το σχήμα 4.1. Οι δενδρίτες βρίσκονται στην εξωτερική πλευρά του νευρώνα και η βασική τους λειτουργία είναι η μεταφορά πληροφοριών διαμέσου των αξόνων προς άλλους νευρώνες με τη βοήθεια χημικών διεργασιών. Το κυτταρικό σώμα, είναι το κεντρικό μέρος του νευρώνα και είναι το σημείο στο οποίο επεξεργάζονται οι πληροφορίες [10]. Σχήμα 4.1: Απλουστευμένο μοντέλο ενός βιολογικού νευρώνα Εισαγωγή στα τεχνητά νευρωνικά δίκτυα Ένα ΤΝΔ αποτελείται από τεχνητούς νευρώνες, οι οποίοι είναι προγραμματισμένοι με τέτοιο τρόπο ώστε να μιμούνται τις ιδιότητες των βιολογικών. Στο σχήμα 4.2, παρουσιάζεται η μορφή ενός τεχνητού νευρώνα. Παρατηρούμε ότι, όπως στα βιολογικά νευρωνικά δίκτυα οι νευρώνες διασυνδέονται μεταξύ τους και μέσα από την εκπαίδευση γίνεται τροποποίηση των πληροφοριών που φέρουν, έτσι και στις συνδέσεις των νευρώνων ενός ΤΝΔ, αντιστοιχίζεται ένας πραγματικός αριθμός, που καλείται βάρος (w). Επιπρόσθετα, υπάρχει ο κόμβος σταθμισμένης άθροισης (Σ), ο οποίος αθροίζει τα σήματα εισόδου (ξ i ) αφού πρώτα τα πολλαπλασιάσει με τα αντίστοιχα βάρη. Επιπλέον, κάθε νευρώνας (εκτός από τους νευρώνες εισόδου) έχει μία ακόμα σύνδεση που ονομάζεται πόλωση (bias) και πρακτικά υποβιβάζει τη είσοδο στη συνάρτηση ενεργοποίησης (g( )). Τέλος η συνάρτηση ενεργοποίησης (ή σύνθλιψης) περιορίζει το επιτρεπόμενο πλάτος του σήματος εξόδου σε κάποια πεπερασμένη τιμή συνήθως στο διάστημα [0,1] ή εναλλακτικά στο [-1,-1]. Παρακάτω παρουσιάζουμε μερικές από τις πιο δημοφιλής συναρτήσεις ενεργοποίησης.

66 40 Κεφάλαιο 4 Τεχνικές Κατηγοριοποίησης Σχήμα 4.2: Μοντέλο ενός τεχνητού νευρώνα. Βηματική g(h) = { 1,h 0 1,h < 0 (4.1) Η βηματική συνάρτηση ορίζει την τιμή 1 ως έξοδο του νευρώνα στη περίπτωση που η σταθμισμένη άθροιση είναι θετικός αριθμός ή μηδεν, διαφορετικά ορίζει την τιμή -1.(Μπορεί να χρησιμοποιηθεί οποιαδήποτε άλλη βηματική συνάρτηση.) Γραμμική g(h) = h (4.2) Η γραμμική συνάρτηση ορίζει την τιμή της σταθμισμένης άθροισης ως έξοδο του νευρώνα. Στην πραγματικότητα, πρόκειται για έξοδο χωρίς τη χρήση κάποιας συνάρτησης ενεργοποίησης. Βέβαια, μπορεί να χρησιμοποιηθεί και οποιαδήποτε άλλα γραμμική. Σιγμοειδής (Υπερβολική εφαπτομένη) g(h) = tanh( h 2 ) = 1 e h 1 + e h (4.3) Η σιγμοειδής συνάρτηση είναι η πιο ευρύτατα χρησιμοποιούμενη συνάρτηση ενεργοποίησης. Η έξοδος του νευρώνα είναι η τιμή της σιγμοειδούς στο σημείο με τιμή αυτή της σταθμισμένης άθροισης. Στοχαστική g(h) = P (h) (4.4)

67 Κεφάλαιο 4 Τεχνικές Κατηγοριοποίησης 41 Σε αυτή τη περίπτωση, η έξοδο του νευρώνα είναι η τιμή της πιθανότητας μιας κατανομής στο σημείο με τιμή αυτή της σταθμισμένης άθροισης Αρχιτεκτονικές των ΤΝΔ Ο τρόπος με τον οποίο είναι διασυνδεδεμένοι οι νερώνες ενός δικτύου ονομάζεται τοπολογία ή αρχιτεκτονική του ΤΝΔ. Οι νευρώνες είναι διαστρωματομένοι σε επίπεδα, με τους νευρώνες του ίδιου επιπέδου να έχουν τυπικά, παρόμοια συμπεριφορά. Σε κάθε ΤΝΔ υπάρχουν τουλάχιστον δύο επίπεδα (στρώματα). Το πρώτο αναφέρεται ως στρώμα εισόδου και περιέχει την είσοδο του ΤΝΔ, ενώ το δεύτερο είναι το στρώμα εξόδου από το οποίο λαμβάνεται η έξοδος του δικτύου. Στη περίπτωση που ένα ΤΝΔ αποτελείται από περισσότερα από δύο στρώματα, τότε πέρα από τα στρώματα εισόδου και εξόδου, έχουμε και τα κρυφά στρώματα (hidden layers) και σε αυτή τη περίπτωση το ΤΝΔ καλείται πολυστρωματικό (multilayer). Εν γένει, όσα περισσότερα στρώματα έχει ένα δίκτυο τόσο πιο αργά εκπαιδεύεται, αλλά η προσέγγιση της λύσης του προβλήματος είναι καλύτερη [17]. Η αρχιτεκτονική ενός ΤΝΔ, εξαρτάται ακόμα και από τον τρόπο διάδοσης των πληροφοριών μεταξύ των νευρώνων. Έτσι έχουμε τα δίκτυα εμπρόσθιας τροφοδότησης (feedforward) και τα αναδρομικά ή διαφορετικά ανατροφοδότησης (recurrent) δίκτυα Δίκτυα εμπρόσθιας τροφοδότησης Τα ΤΝΔ εμπρόσθιας τροφοδότησης, είναι δίκτυα στα οποία το σήμα διαδίδεται έτσι ώστε να μην υπάρχει νευρώνας που η έξοδός του να είναι είσοδος κάποιου νευρώνα του ίδιου ή προηγούμενου στρώματος. Ο απλούστερος τύπος νευρωνικών δικτύων εμπρόσθιας τροφοδότησης είναι αυτός του μονού στρώματος (το στρώμα εισόδου δεν προσμετράται μιας και δεν γίνονται υπολογισμοί), όπου το μοναδικό στρώμα είναι αυτό της εξόδου. Αξίζει ακόμα να επισημάνουμε ότι συνήθως, κάθε νευρώνας ενός στρώματος, συνδέεται με όλους τους άλλους νευρώνες του επόμενου στρώματος [10] Δίκτυα με ανατροφοδότηση Στα ΤΝΔ με ανατροφοδότηση, οι πληροφορίες μεταφέρονται και προς τις δύο κατευθύνσεις, καθώς υπάρχουν βρόγχοι ή και αυτοβρόγχοι στο δίκτυο. Τα δίκτυα με ανατροφοδότηση είναι δυναμικά, κάτι που σημαίνει ότι η κατάστασή τους συνεχώς αλλάζει μέχρι να φτάσουν στην επιθυμητή κατάσταση. Στο σχήμα 4.4 παρουσιάζουμε ένα τέτοιο δίκτυο.

68 42 Κεφάλαιο 4 Τεχνικές Κατηγοριοποίησης Σχήμα 4.3: Πολυστρωματικό ΤΝΔ εμπρόσθιας τροφοδότησης διάταξης Σχήμα 4.4: Πολυστρωματικό ανατροφοδοτούμενο ΤΝΔ διάταξης Μάθηση-Εκπαίδευση ΤΝΔ Η πιο σημαντική ιδιότητα των ΤΝ είναι η ικανότητά τους να μαθαίνουν από το περιβάλλον τους και να βελτιώνουν την απόδοση τους μέσω της διαδικασίας μάθησης. Η βελτίωση αυτή γίνεται στην διάρκεια του χρόνου με κάποιο προκαθορισμένο μέτρο. Η μάθηση είναι μία γενική έννοια της επιστήμης των συστημάτων και ορίζεται με ποικίλους τρόπους, ανάλογα με το πεδίο εφαρμογής. Στα νευρωνικά δίκτυα, η μάθηση είναι η διαδικασία σύμφωνα με την οποία επιτυγχάνεται μία επιθυμητή κατάσταση, μέσω μίας συνεχούς διαδικασίας λήψης πληροφοριών από το περιβάλλον του ΤΝΔ που τα οδηγεί στην προσαρμογή των βαρών του καθώς και της τιμής της παραμέτρου πόλωσης [18]. Στην ιδανική περίπτωση,

69 Κεφάλαιο 4 Τεχνικές Κατηγοριοποίησης 43 μετά από κάθε επανάληψη της διαδικασίας μάθησης το ΤΝ αποκτά περισσότερη γνώση για το περιβάλλον του. Για την εκπαίδευση των ΤΝ, δηλαδή για τον τρόπο με τον οποίο θα μεταβάλλονται οι παράμετροι του βάρους και της πόλωσης, έτσι ώστε να επιτυγχάνεται η επιθυμητή έξοδος για το ΤΝ ανάλογα με τα δεδομένα που εισέρχονται σε αυτό, χρησιμοποιούνται οι αλγόριθμοι εκπαίδευσης. Γενικά, υπάρχουν πολλοί αλγόριθμοι μάθησης, καθένας από τους οποίους έχει συγκεκριμένα μειονεκτήματα και πλεονεκτήματα. Επίσης, η επιλογή τους, εξαρτάται και από το είδος του προβλήματος. Το βασικό σημείο στο οποίο διαφέρουν οι αλγόριθμοι εκπαίδευσης είναι ο τρόπος με τον οποίο προσαρμόζουν τα βάρη μεταξύ των νευρώνων Μάθηση με διόρθωση σφάλματος Το μοντέλο μάθησης με τη μέθοδο διόρθωσης σφάλματος (Error-Correction Learning), είναι μία τεχνική που στηρίζεται στη ελαχιστοποίηση μίας συνάρτησης κόστους. Πιο συγκεκριμένα, θα συμβολίσουμε με y k (x n ; w(n)) την έξοδο του k νευρωνίου στη διακριτή χρονική στιγμή n η οποία αποτελεί συνάρτηση του διανύσματος εισόδου x n που εφαρμόζεται στο στρώμα της εισόδου του ΤΝΔ και του διανύσματος βάρους w. Με t k (n) την επιθυμητή έξοδο του k νευρωνίου στη διακριτή χρονική στιγμή n. Επειδή είθισται στη πράξη, η επιθυμητή έξοδος να διαφέρει από την έξοδο του νευρωνικού δικτύου, ορίζουμε ένα μέτρο το οποίο περιγράφει αυτή τη διαφορά. Οπότε, ως μέτρο σφάλματος ορίζουμε τη παρακάτω σχέση: e k (n) = y k (x n ; w(n)) t k (n) (4.5) Ο τελικός στόχος της εκπαίδευσης με τη μέθοδο διόρθωσης σφάλματος, είναι η ελαχιστοποίηση μιας συνάρτησης κόστους που βασίζεται στο σφάλμα e k (n), έτσι ώστε η πραγματική απάντηση κάθε νευρώνα στο δίκτυο να προσεγγίζει όσο το δυνατόν καλύτερα, την επιθυμητή απάντηση για τον νευρώνα κατά μια στατιστική βεβαίως έννοια. Ένα κριτήριο που χρησιμοποιείται συχνά σαν συνάρτηση κόστους είναι το κριτήριο του μέσου τετραγωνικού σφάλματος (ΜΤΣ), που ορίζεται σαν η μέση τιμή του αθροίσματος των τετραγώνων των σφαλμάτων: { 1 } MT Σ = E e 2 k 2 (n) (4.6) όπου η άθροιση αναφέρεται σε όλα τα νευρώνια εξόδου του ΤΝΔ. Η ελαχιστοποίηση του μέσου τετραγωνικού σφάλματος, μας κατευθύνει στη τεχνική βελτιστοποίησης (ελαχιστοποίησης) της απότομης κλίσης (gradient descent). Στη πράξη, αντιλαμβανόμαστε πως είναι αδύνατο να εντοπίσουμε την ακριβή λύση του προβλήματος ελαχιστοποίησης. Άρα, θα k

70 44 Κεφάλαιο 4 Τεχνικές Κατηγοριοποίησης πρέπει να περιορισθούμε σε μία προσεγγιστική λύση, ελαχιστοποιώντας αυτή τη φορά το στιγμιαίο κριτήριο του τετραγωνικού σφάλματος. MT Σ approx (n) = 1 2 k e 2 k (n) (4.7) Οπότε η διεργασία που έχει απομείνει είναι η ελαχιστοποίηση της MT Σ approx (n) ως προς τα βάρη των συνάψεων του δικτύου. Σύμφωνα με τη μέθοδο διόρθωσης σφάλματος, η προσαρμογή w kj (n) που γίνεται στο διάνυσμα βάρους w kj την χρονική στιγμή n, δίνεται από τη σχέση 4.8 w kj (n) = ηe k (n)x n (4.8) όπου η είναι μία θετική σταθερά που καθορίζει το ρυθμό εκπαίδευσης [20]. Ο κανόνας μάθησης της σχέσης 4.8, ο οποίος είναι γνωστός στη βιβλιογραφία ως κανόνας δέλτα λέει ότι η διόρθωση του διανύσματος του βάρους είναι ανάλογη του σφάλματος και του διανύσματος της εισόδου του ΤΝΔ. Τέλος, η νέα τιμή του διανύσματος των βαρών δίδεται από τη σχέση: w kj (n + 1) = w kj (n) + w kj (n) (4.9) Μάθηση με επίβλεψη Η δομής της μάθησης με επίβλεψη (Supervised Learning), έχει την γενική μορφή του παρακάτω σχήματος και όπως παρατηρούμε, περιλαμβάνει δύο άξονες: το Δάσκαλο και το Σύστημα Μάθησης. Σχήμα 4.5: Εκπαίδευση με επίβλεψη.

71 Κεφάλαιο 4 Τεχνικές Κατηγοριοποίησης 45 Το κύριο χαρακτηριστικό της επιβλεπόμενης μάθησης είναι η ύπαρξη του δασκάλου, ο οποίος με γνώμονα την εμπειρία του είναι ικανός και πρέπει να διδάξει στο σύστημα μάθησης, τις επιθυμητές εξόδους για ένα σύνολο εισόδων εκπαίδευσης. Όταν ο δάσκαλος και το ΤΝΔ λάβουν ένα πρότυπο από το σύνολο εκπαίδευσης, ο πρώτος δίνει στο νευρωνικό δίκτυο μία επιθυμητή έξοδο, η οποία παριστάνει την βέλτιστη λύση που πρέπει να επιτευχθεί από το δίκτυο. Στη συνέχεια οι παράμετροι του δικτύου ανανεώνονται ανάλογα με το πρότυπο που χρησιμοποιείται για την εκπαίδευση και το σφάλμα του δικτύου (δηλαδή την διαφορά μεταξύ της επιθυμητής εξόδου και της εξόδου που στην πράξη δίνει το δίκτυο). Η προσαρμογή αυτών των παραμέτρων, γίνεται επαναληπτικά, βήμα προς βήμα με στόχο το δίκτυο να μπορεί να μιμείται καλά τον δάσκαλο. Αν αυτό πραγματοποιηθεί, τότε μπορούμε να επιτρέψουμε στο δίκτυο να αλληλεπιδράσει με το περιβάλλον, χωρίς την παρουσία του δασκάλου [10] Μάθηση χωρίς επίβλεψη Στην περίπτωση της μάθησης χωρίς επίβλεψη (Unsupervised Learning) ή διαφορετικά μάθησης με αυτο-οργάνωση (Self-organization) δεν υπάρχει κάποιος εξωτερικός παράγοντας που επιβλέπει την διαδικασία μάθησης. Δηλαδή, δεν υπάρχουν παραδείγματα της συνάρτησης που πρέπει να μάθει το δίκτυο. Υπάρχει βέβαια, μία συγκεκριμένη διαδικασία που ακολουθείται και καταλήγει σε εκπαίδευση του δικτύου. Υπάρχει ένα μέτρο που είναι ανεξάρτητο από το εκάστοτε έργο που πρέπει να φέρει εις πέρας το ΤΝ και μετράει την ποιότητα της αναπαράστασης που πρέπει να εκπαιδευτεί το δίκτυο, οπότε οι ελεύθερες παράμετροι του δικτύου βελτιστοποιούνται ως προς αυτό το μέτρο [19]. Ο τρόπος αυτός δεν συναντάται τόσο συχνά όπως η μάθηση με επίβλεψη, αλλά είναι πολύ χρήσιμος σε ορισμένες καταστάσεις που δεν υπάρχουν δεδομένα στο πρόβλημα. Σε όλες τις περιπτώσεις, όταν το δίκτυο σταματάει να αλλάζει τις τιμές των βαρών, τότε θεωρούμε ότι η εκπαίδευση έχει επιτευχθεί. 4.3 Μηχανές Διανυσμάτων Υποστήριξης Σε αυτό το σημείο, θα αναφερθούμε στις Μηχανές Διανυσμάτων Υποστήριξης (Support Vector Machines), μία νέα γενιά εκπαίδευσης συστημάτων, η οποία βασίζεται στις πρόσφατες εξελίξεις της στατιστικής θεωρίας μάθησης. Οι SVMs αποτελούν την τελευταία λέξη της τεχνολογίας σε πραγματικές εφαρμογές, όπως για παράδειγμα η κατηγοριοποίηση κειμένων, η αναγνώρισης χειρόγραφων χαρακτήρων, η ταξινόμηση της εικόνας, κλπ.

72 46 Κεφάλαιο 4 Τεχνικές Κατηγοριοποίησης Η πρώτη εμφάνισή τους, που έγινε στις αρχές της δεκαετίας του '90 από τον Vladimir Ν. Vapnik και τους συνεργάτες του, οδήγησε σε μια έκρηξη των εφαρμογών και την εμβάθυνση της θεωρητικής ανάλυσης, η οποία έχει πλέον έχει καθιερώσει τις μηχανές υποστήριξης διανυσμάτων ως ένα από τα συνήθη εργαλεία για μηχανική μάθηση και την εξόρυξη δεδομένων [21] Εισαγωγή στα SVMs Η βασική ιδέα ενός ταξινομητή SVM είναι η εύρεση ενός υπερεπιπέδου απόφασης, το οποίο να διαχωρίζει το σύνολο των παραδειγμάτων εκπαίδευσης με τέτοιο τρόπο, ώστε τα παραδείγματα που ανήκουν στην ίδια κατηγορία να είναι στη ίδια πλευρά του υπερεπιπέδου. Εάν τα παραδείγματα εκπαίδευσης χωρίζονται για παράδειγμα οπτικά με έναν γραμμικό τρόπο, στη γενική περίπτωση όπως φαίνεται και στο σχήμα 4.6, υπάρχουν αρκετά πιθανά υπερεπίπεδα που τα διαχωρίζουν. Σχήμα 4.6: Για ένα γραμμικά διαχωρίσιμο πρόβλημα δύο κλάσεων υπάρχουν πολλά υπερεπίπεδα διαχωρισμού, αλλά ένα είναι το βέλτιστο. Τα SVMs μεταξύ όλων των πιθανών υπερεπιπέδων, αναζητούν εκείνο για το οποίο η απόσταση από το κοντινότερα παράδειγμα διαφορετικών κλάσεων είναι μέγιστη, δηλαδή αναζητά το υπερεπίπεδο μέγιστου περιθωρίου (maximal margin hyperplane) ή διαφορετικά μέγιστης απόστασης. Τα παραδείγματα εκπαίδευσης που βρίσκονται κοντά στο βέλτιστο επίπεδο καλούνται διανύσματα υποστήριξης (support vectors) και η απόστασή τους από αυτό ονομάζεται περιθώριο (margin) [22].

73 Κεφάλαιο 4 Τεχνικές Κατηγοριοποίησης Γραμμικά διαχωρίσιμα πρότυπα Στα γραμμικά διαχωρίσιμα πρότυπα, αναζητούμε γραμμικές συναρτήσεις τέτοιες ώστε να μπορούν να χρησιμοποιηθούν στην επίλυση προβλημάτων ταξινόμησης. Έστω ότι έχουμε n παραδείγματα εκπαίδευσης για δύο κατηγορίες, τα οποία θα τα συμβολίζουμε ως (x i, y i ) για i=1,...,n, με το x i να αναφέρεται στο διάνυσμα εισόδου του i-οστού προτύπου και το y i στην αντίστοιχη κλάση του και πιο συγκεκριμένα αν y i = 1 θα αναφερόμαστε στην πρώτη κλάση και με y i = 1 στην δεύτερη. Ο στόχος μας είναι να σχεδιάσουμε ένα μοντέλο που ταξινομεί σωστά όλα τα διανύσματα εκπαίδευσης. Η εξίσωση που περιγράφει το υπερεπίπεδο διαχωρισμού των παραδειγμάτων δίνεται από τη σχέση: w x + b = 0 (4.10) όπου w (χαρακτηρίζει τη διεύθυνση του υπερεπιπέδου) και b (καθορίζει την ακριβή θέση του υπερεπιπέδου στο χώρο) είναι οι παράμετροι του μοντέλου. Εναλλακτικά, η σχέση 4.10 συναντάτε και με τη μορφή: g(x) = w x + b (4.11) Ο σκοπός μας είναι η εύρεση εκείνων των τιμών των παραμέτρων w και b, οι οποίες μεγιστοποιούν το περιθώριο διαχωρισμού των δύο κλάσεων υπό τον περιορισμό ό,τι κάθε πλειάδα εκπαίδευσης, θα πρέπει να ταξινομείται σωστά στην αντίστοιχή της κλάση. Δηλαδή θα πρέπει να ισχύει: y i ( w x i + b) 1 i, i = 1,.., n (4.12) ως εξής: Η απόσταση ενός παραδείγματος εκπαίδευσης έστω x από το υπερεπίπεδο εκφράζεται w x = x p + r (4.13) w όπου το x p είναι η προβολή του παραδείγματος x στο υπερεπίπεδο και το r αποτελεί την επιθυμητή αλγεβρική απόσταση, όπου είναι θετική αν το x βρίσκεται στην θετική πλευρά του υπερεπιπέδου, και αρνητικό αν βρίσκεται στην αρνητική. Υπολογίζοντας τώρα την εικόνα της απόστασης έχουμε: ( w ) g(x) = g x p + r w = r w r = g(x) w (4.14)

74 48 Κεφάλαιο 4 Τεχνικές Κατηγοριοποίησης Τώρα μπορούμε να κλιμακώσουμε τις παραμέτρους w και b έτσι ώστε η τιμή της g(x) στα διανύσματα υποστήριξης να είναι ίση με 1 ή με -1, ανάλογα την κλάση που βρίσκονται. Αυτό είναι ισοδύναμο με το να έχουμε ένα περιθώριο μήκους: 1 w + 1 w = 2 w κάτι που σημαίνει ότι μεγιστοποιώντας το περιθώριο διαχωρισμού μεταξύ των κλάσεων, είναι ισοδύναμο με την ελαχιστοποίηση του Ευκλείδειου μέτρου του διανύσματος βαρών w. Γενικά, το βέλτιστο υπερεπίπεδο που ορίζεται από την εξίσωση 4.10, είναι μοναδικό με την έννοια ότι το βέλτιστο διάνυσμα βαρών δίνει το μέγιστο δυνατό διαχωρισμό μεταξύ των θετικών και αρνητικών παραδειγμάτων. Το πρόβλημά μας τώρα μπορεί να συνοψιστεί ως εξής [23]: Υπολόγισε τις παραμέτρους w και b του υπερεπιπέδου έτσι ώστε: 1. να ελαχιστοποιείται η συνάρτηση: J(w, b) = 1 2 w 2 2. υπό τους περιορισμούς: w x + b 1 x που ανήκει στην πρώτη κλάση w x + b 1 x που ανήκει στην δεύτερη κλάση Το παραπάνω πρόβλημα βελτιστοποίησης μπορεί να επιλυθεί εύκολα κάνοντας χρήση της μεθόδου των πολλαπλασιαστών Lagrange. Η Lagrangian συνάρτηση ορίζεται ως: L(w, b, λ) = 1 n 2 wt w λ i [y i ( w T x i + b) 1] (4.15) i=1 όπου λ είναι το διάνυσμα πολλαπλασιαστών Lagrange, λ i. Οι συνθήκες που πρέπει να ικανοποιεί το σημείο όπου εμφανίζεται ελάχιστο της συνάρτησης L είναι οι εξής: L(w, b, λ) w = 0 (4.16) L(w, b, λ) b = 0 (4.17) λ i 0, i = 1, 2,..., n (4.18)

75 Κεφάλαιο 4 Τεχνικές Κατηγοριοποίησης 49 λ i [y i (w T x i + b) 1] = 0, i = 1, 2,..., n (4.19) Συνδυάζοντας την εξίσωση 4.15 με τη 4.16 έχουμε ότι: w = n λ i y i x i (4.20) i=1 ενώ εφαρμόζοντας την εξίσωση 4.17 στη Lagrangian συνάρτηση έχουμε: n λ i y i = 0 (4.21) i=1 Οι πολλαπλασιαστές Lagrange μπορούν να είναι είτε μηδέν είτε θετικοί. Έτσι, το διάνυσμα παραμέτρων, w, της βέλτιστης λύσης είναι ένας γραμμικώς συνδυασμός από n s n διανύσματα παραδειγμάτων, τα οποία σχετίζονται με τιμές λ i 0. Δηλαδή, n s w = λ i y i x i (4.22) i=1 Αυτά είναι γνωστά ως διανύσματα διανύσματα υποστήριξης, όπως αναφέρθηκε και νωρίτερα, και ο βέλτιστος ταξινομητής (υπερεπίπεδο) είναι γνωστός ως μηχανή διανυσματικής υποστήριξης. Στη συνέχεια πρέπει να υπολογιστούν και οι εμπλεκόμενοι παράμετροι Lagrange. Από μία οπτική γωνία αυτό δεν είναι και μία εύκολη διαδικασία, αλλά λόγου της ειδικής φύσης του προβλήματος βελτιστοποίησης που έχουμε να αντιμετωπίσουμε, μπορούμε να κάνουμε χρήση της Lagrangian δυϊκότητας (Lagrangian duality). Το πρόβλημα μπορεί να εκφραστεί ισοδύναμα από την δυϊκή του αναπαράσταση κατά Wolfe, δηλαδή 1. μεγιστοποίησε τη συνάρτηση: L(w, b, λ) 2. υπό τους περιορισμούς: n w = λ i y i x i (4.23) i=1 n λ i y i = 0 (4.24) i=1 λ 0 (4.25) Οι δύο περιορισμοί ισότητας είναι το αποτέλεσμα της εξίσωσης με το μηδέν του διανύσματος μερικών παραγώγων της Lagrangian, ως προς w και ως προς b αντίστοιχα. Αντικαθιστώντας τους δύο αυτούς περιορισμούς στην συνάρτηση Lagrangian που θέλουμε να

76 50 Κεφάλαιο 4 Τεχνικές Κατηγοριοποίησης μεγιστοποιήσουμε, καταλήγουμε στο παρακάτω πρόβλημα βελτιστοποίησης: { n max λ i 1 2 i=1 n n } λ i λ j y i y j x T i x j i=1 j=1 (4.26) υπό τους περιορισμούς n λ i y i = 0 i=1 λ 0 Υπολογίζοντας τους πολλαπλασιαστές Lagrange, μεγιστοποιώντας την σχέση 4.26, το βέλτιστο υπερεπίπεδο υπολογίζεται μέσω της εξίσωσης 4.23 και η παράμετρος b λαμβάνεται από τη σχέση Μη γραμμικά διαχωρίσιμα πρότυπα Τα προβλήματα που καλούμαστε να αντιμετωπίσουμε στο πραγματικό κόσμο δεν είναι εν γένει γραμμικά. Όταν οι κλάσεις δεν είναι διαχωρίσιμες, τίποτα από ότι έχουμε αναφέρει δεν είναι πλέον έγκυρα. Στο σχήμα 4.7 απεικονίζεται μία τέτοια περίπτωση. Σχήμα 4.7: (α)στην περίπτωση αυτή, ένα σημείο πέφτει στην περιοχή του διαχωρισμού, αλλά στην σωστή πλευρά του επιπέδου απόφασης (β) Το σημείο πέφτει στην λάθος πλευρά του επιπέδου απόφασης. Σε αυτή τη περίπτωση, τα διανύσματα εκπαίδευσης είναι πιθανό να ανήκουν σε μία από τις παρακάτω δύο κατηγορίες. Διανύσματα που βρίσκονται εντός της ζώνης διαχωρισμού των κλάσεων και είναι σωστά ταξινομημένα (σχήμα 4.7 (α))

77 Κεφάλαιο 4 Τεχνικές Κατηγοριοποίησης 51 Διανύσματα που βρίσκονται εντός της ζώνης διαχωρισμού των κλάσεων και είναι λάθος ταξινομημένα (σχήμα 4.7 (β)) Και οι δύο αυτές περιπτώσεις μπορούν να αντιμετωπιστούν εισάγοντας έναν περιορισμό που είναι ο εξής: y i [wx + b] 1 ξ i (4.27) Η πρώτη κατηγορία δεδομένων εκπαίδευσης αντιστοιχεί σε 0 < ξ i 1 ενώ η δεύτερη σε τιμές του ξ μεγαλύτερες του 1. Στη βιβλιογραφία, οι μεταβλητές ξ i είναι γνωστές ως μεταβλητές χαλαρότητας (slack variables). Ο στόχος μας είναι ο εντοπισμός του βέλτιστου υπερεπιπέδου. Η φιλοσοφία εύρεσής του, παραμένει ίδια με αυτή της προηγούμενης παραγράφου, με τη διαφορά ότι αναζητούμε εκείνο το υπερεπίπεδο, που έχει όσο το δυνατό μεγαλύτερο περιθώριο αλλά συγχρόνως προσπαθούμε να κρατήσουμε το πλήθος των σημείων για τα οποία ισχύει ξ i > 0, όσο το δυνατό πιο μικρό. Αυτό μεταφράζεται με μαθηματικούς όρους ως εξής: J(w, b, ξ) = 1 2 w 2 +C όπου ξ είναι το διάνυσμα των παραμέτρων ξ i και n I(ξ i ) (4.28) i=1 I(ξ i ) = { 1 ξi > 0 0 ξ i = 0 (4.29) Η παράμετρος C είναι μία θετική σταθερά που ελέγχει την ανταλλαγή ανάμεσα στην πολυπλοκότητα της μηχανής και στο πλήθος των μη διαχωριζόμενων πλειάδων. Η βελτιστοποίηση της παραπάνω συνάρτησης (4.25) είναι δύσκολη, διότι εμπλέκεται μία μη συνεχής συνάρτηση η Ι. Γι' αυτό το λόγο θα χρησιμοποιήσουμε μία προσέγγισή της. Συνοψίζοντας λοιπόν, το πρόβλημα που καλούμαστε να αντιμετωπίσουμε είναι η εύρεση των παραμέτρων w και b του βέλτιστου υπερεπιπέδου, ελαχιστοποιώντας τη συνάρτηση: υπό τους περιορισμούς J(w, b, ξ) = 1 n 2 w 2 +C ξ i (4.30) i=1 y i [wx + b] 1 ξ i i = 1, 2,..., n (4.31)

78 52 Κεφάλαιο 4 Τεχνικές Κατηγοριοποίησης ξ i 0 i = 1, 2,..., n (4.32) Έπειτα, κάνοντας χρήση της μεθόδου των πολλαπλασιαστών Lagrange, θα μετατρέψουμε το παραπάνω πρόβλημα, σε πρόβλημα δυικό για τις μη γραμμικά διαχωρίσιμες πλειάδες. Οπότε, η Lagrangian συνάρτηση που θα μεγιστοποιήσουμε είναι: { n max λ i 1 2 i=1 n n } λ i λ j y i y j x T i x j i=1 j=1 (4.33) υπό τους περιορισμούς n λ i y i = 0 i=1 0 λ i C i = 1, 2,..., n Όπως παρατηρούμε, οι πολλαπλασιαστές Lagrange που αντιστοιχούν στα σημεία που βρίσκονται, είτε μέσα στο περιθώριο, είτε στη λάθος πλευρά του ταξινομητή, δηλαδή για τις τιμές του ξ i που είναι μεγαλύτερες του μηδενός, είναι όλοι ίση με την μέγιστη επιτρεπόμενη τιμή C. Η εύρεση του βέλτιστου διανύσματος βαρών γίνεται από την εξίσωση: w = n λ i y i x i (4.34) i=1 και τον καθορισμό των βέλτιστων τιμών της παραμέτρου b ορίζουμε ξανά τις συνθήκες Kuhn-Tucker και συγκεκριμένα: λ i [y i (w T x i + b) 1 + ξ i ] = 0, i = 1, 2,..., n (4.35) µ i ξ i = 0 (4.36) όπου τα µ i είναι πολλαπλασιαστές Lagrange που εισήχθησαν για να ενισχύσουν την μη αρνητικότητα των μεταβλητών χαλάρωσης,ξ i Συναρτήσεις Πυρήνα Όπως παρατηρούμε μέχρι τώρα, οι SVMs μπορούν να δημιουργούν γραμμικές διαχωριστικές επιφάνειες με σκοπό τον καλύτερο διαχωρισμό δύο κλάσεων, είτε αυτές είναι γραμμικά διαχωρίσιμες, είτε όχι. Σε πολλές περιπτώσεις όμως, οι κλάσεις μπορεί να είναι

79 Κεφάλαιο 4 Τεχνικές Κατηγοριοποίησης 53 διαχωρίσιμες από μη γραμμικές επιφάνειες. Στις περιπτώσεις αυτές, η χρήση του διαχωριστικού μοντέλου θα αποτύγχανε στη κατηγοριοποίηση αρκετών προτύπων. Μια απλή επέκταση των αποτελεσμάτων στη περίπτωση μη γραμμικά διαχωρίσιμων κλάσεων μπορεί να γίνει με χρήση κάποιου κατάλληλου μη γραμμικού μετασχηματισμού Φ, υποθέτοντας ότι τα μετασχηματισμένα πρότυπα Φ(x 1 ),Φ(x 2 ),...,Φ(x n ) θα είναι πλέον γραμμικά διαχωρίσιμα. Σχήμα 4.8: Αναπαράσταση μετασχηματισμού των δεδομένων. Η διαδικασία που ακολουθείται για την επίλυση του προβλήματος εύρεσης του βέλτιστου υπερεπιπέδου, είναι ίδια με αυτή που περιγράφηκε στις προηγούμενες παραγράφους με τη μόνη διαφορά πως αντί για το πρότυπο x i, κάνουμε χρήση του Φ(x i ). Οπότε το δυικό πρόβλημα βελτιστοποίησης έχει τη μορφή: L = n λi 1 2 i=1 n n λ i λ j y i y j Φ(x i ) T Φ(x j ) (4.37) i=1 j=1 Το εσωτερικό γινόμενο στον χώρο Φ(x) καλείται συνάρτηση πυρήνας (kernel function) και ορίζεται: k(x, x i ) = φ T (x)φ(x i ) (4.38) Η επιτυχία λοιπόν της μεθόδου έγκειται από τη σωστή επιλογή της συνάρτησης πυρήνα. Οι πιο γνωστοί πυρήνες είναι οι ακόλουθοι: Γραμμικός (linear): k(x i, x j ) = x i x j Πολυωνυμικός (polynomial): k(x i, x j ) = (x i x j + θ) d Ακτινικής Συνάρτησης Βάσης (radial basis function): k(x i, x j ) = e 1 2σ 2 x i,x j 2 Σιγμοειδής (Sigmoid): tanh(αx i x j + θ)

80 54 Κεφάλαιο 4 Τεχνικές Κατηγοριοποίησης Ταξινόμηση πολλών κλάσεων Μέχρι τώρα, σε όλες τις παραπάνω αναφορές μας στις SVMs, ασχοληθήκαμε με το πρόβλημα ταξινόμησης δύο κλάσεων. Οι ενέργειες που πρέπει να πραγματοποιηθούν, ώστε να επιλυθεί ένα πρόβλημα ταξινόμησης περισσότερων από δύο κλάσεων, θα μελετηθούν σε αυτή την ενότητα. Για προβλήματα ταξινόμησης πολλών κατηγοριών θα προσεγγίσουμε δύο διαφορετικές ιδέες: 1. ένας-εναντίον-όλων (one-against-all). 2. ένας-εναντίον-ένα (one-against-one). ένας-εναντίον-όλων: Μία προσέγγιση για την επίλυση προβλημάτων ταξινόμησης πολλών κλάσεων είναι η αντιμετώπισή τους ως ένα σύνολο δυαδικών προβλημάτων ταξινόμησης. Σύμφωνα με αυτή τη προσέγγιση και για ένα σύνολο Μ κλάσεων K = k 1, k 2,..., k M, απαιτείται η εκπαίδευση Μ δυαδικών SVM. Κάθε SVM υπολογίζει ένα υπερεπίπεδο απόφασης το οποίο διαχωρίζει τα παραδείγματα της κατηγορίας i από τα παραδείγματα των υπολοίπων Μ-1 κατηγοριών. Όλα τα δείγματα της i κλάσης τροφοδοτούνται στον αλγόριθμο δυαδικής ταξινόμησης με βάση την πρώτη κλάση, ενώ αντίστοιχα όλα τα εναπομείναντα δείγματα των Μ-1 κλάσεων ανατίθενται στην δεύτερη. Επόμενο βήμα αποτελεί η επίλυση του προβλήματος εύρεσης βέλτιστου υπερεπιπέδου, όπως περιγράψαμε στις προηγούμενες παραγράφους. Ένα παράδειγμα ελέγχου x, αφού διέλθει και από τους Μ ταξινομητές, ανατίθεται στην κατηγορία k i αν η έξοδος του ταξινομητή i είναι μεγαλύτερη από τις εξόδους των υπόλοιπων SVM. Συνολικά λοιπόν για την εφαρμογή της μεθόδου ένας-εναντίον-όλων, θα επιλυθούν Μ προβλήματα βελτιστοποίησης (όσο και το πλήθος των κλάσεων) ώστε να ταξινομηθούν τα δεδομένα μας. ένας-εναντίον-ένα: Μια εναλλακτική τεχνική είναι η ένας-εναντίον-ένα. Η λογική της μεθόδου αυτής στηρίζεται στο γεγονός της επίλυσης τόσων δυαδικών προβλημάτων ταξινόμησης όσοι και οι δυνατοί συνδυασμό των κλάσεων ανά δύο. Με βάση αυτή τη προσέγγιση και για ένα σύνολο Μ κλάσεων K = k 1, k 2,..., k M, απαιτείται η εκπαίδευση M(M 1)/2 δυαδικών SVM. Αυτό οφείλεται στο γεγονός ότι όταν ο αλγόριθμος ταξινόμησης θα εξετάσει την κλάση k i με την k j, δεν θα χρειαστεί να εξετάσει και την k j με την k i ή την k i με την k i. Οι ταξινομητές δηλαδή, υπολογίζουν ένα υπερεπίπεδο απόφασης το οποίο διαχωρίζει τα παραδείγματα της κατηγορίας i από τα παραδείγματα κάθε μίας από τις υπόλοιπες κατηγορίες. Τέλος, κάθε παράδειγμα ελέγχου x ανατίθεται στην κατηγορία η οποία εμφανίζεται πιο πολλές φορές στην έξοδο των δυαδικών ταξινομητών [24].

81 Κεφάλαιο 5 Υλοποίηση Συστήματος Αναγνώρισης Προτύπων Στα πλαίσια αυτής της εργασίας υλοποιήθηκε ένα σύστημα σε περιβάλλον Matlab και γραφική διεπαφή GUI (Grafical User Interface), το οποίο στοχεύει στην διαδραστική διαδικασία αναγνώρισης προτύπων. Η βάση υλοποίησής του στηρίζεται στη θεωρία που αναφέραμε στα προηγούμενα κεφάλαια. Πιο συγκεκριμένα, το GUI αποτελείται από δύο παράθυρα, το ένα της προεπεξεργασίας (preprocess) και το άλλο της ταξινόμησης (classification), τα οποία παρουσιάζουμε στις επόμενες παραγράφους. 5.1 Παράθυρο προεπεξεργασίας Η πρώτη οθόνη που εμφανίζεται στο χρήστη ανοίγοντας το παράθυρο της προεπεξεργασίας απεικονίζεται στο σχήμα 5.1. Παρατηρούμε ότι το περιβάλλον αποτελείται από κάποια κουμπιά, τα οποία πιέζοντας τα, θα εμφανίσουν κάποια χρήσιμα χαρακτηριστικά που θα συμβάλουν στην περιγραφή μίας εικόνας Διαθέσιμες λειτουργίες προεπεξεργασίας Στη συνέχεια θα παραθέσουμε ένα μικρό οδηγό για τις δυνατότητες που κρύβονται πίσω από τα κουμπιά. Πιέζοντας το συγκεκριμένο κουμπί δίνεται η δυνατότητα στο χρήστη να περιηγηθεί στα αρχεία του υπολογιστή του και να επιλέξει την εικόνα που θέλει να προβάλει και εν συνεχεία να εξάγει χρήσιμες πληροφορίες από αυτήν. 55

82 56 Κεφάλαιο 5 Υλοποίηση Συστήματος Αναγνώρισης Προτύπων Σχήμα 5.1: Παράθυρο προεπεξεργασίας. Το εικονιζόμενο κουμπί δίνει τη δυνατότητα στο χρήστη να εξάγει και να προβάλει τα σημαντικά στοιχεία μιας εικόνας σύμφωνα με τον αλγόριθμο SIFT. Πρόκειται για έναν αλγόριθμο εξαγωγής υψηλού επιπέδου χαρακτηριστικών μιας και τα σημαντικά σημεία που εντοπίζει, προκύπτουν από επεξεργασία της εικόνας. Ακόμα, εμφανίζεται και ο αριθμός των σημαντικών στοιχείων (keypoints) της εικόνας. Στο σχήμα 5.2 δίνεται ένα παράδειγμα εκτέλεσης. Μία ακόμα σημαντική ιδιότητα του αλγορίθμου Sift, είναι η δυνατότητά του να εντοπίζει εικόνες που περιγράφουν το ίδιο αντικείμενο αλλά η μία μπορεί να το προβάλει από διαφορετική γωνία ή ανεστραμμένο ή και με θόρυβο. Πιέζοντας το κουμπί λοιπόν, μπορούμε να επιλέξουμε μια άλλη εικόνα και ο αλγόριθμος θα εντοπίσει τα κοινά τους σημεία (αν έχουν) καθώς και το πλήθος τους. Στο σχήμα 5.3 δίνεται ένα τέτοιο παράδειγμα.

83 Κεφάλαιο 5 Υλοποίηση Συστήματος Αναγνώρισης Προτύπων 57 Σχήμα 5.2: Παράδειγμα εκτέλεσης αλγορίθμου Sift. Σχήμα 5.3: Παράδειγμα επιτυχούς ταιριάσματος εικόνων μέσω του Sift.

84 58 Κεφάλαιο 5 Υλοποίηση Συστήματος Αναγνώρισης Προτύπων Πιέζοντας το διπλανό κουμπί το σύστημα εξάγει και παρουσιάζει όλα τα σημαντικά στοιχεία μιας εικόνας που εντοπίζονται σύμφωνα με τον αλγόριθμο SURF. Πρόκειται για ακόμα έναν αλγόριθμο εξαγωγής υψηλού επιπέδου χαρακτηριστικών όπως περιγράφηκε και στο 2ο κεφάλαιο. Στο σχήμα 5.4 δίνεται ένα παράδειγμα εκτέλεσης καθώς και ο αριθμός των keypoints της εικόνας. Σχήμα 5.4: Παράδειγμα εκτέλεσης αλγορίθμου Surf. Τα επόμενα πέντε κουμπιά: GrayScale, Edge Detection, Corner Detection, Thres-Holding και το κουμπί του ιστογράμματος αποτελούν χαμηλού επιπέδου χαρακτηριστικά μιας εικόνας καθώς δεν φέρουν κάποια πληροφορία των σχημάτων που περιγράφουν. Όπως παρατηρούμε στα προηγούμενα σχήματα, οι αλγόριθμοι υπολογίζουν τα σημεία κλειδιά των εικόνων, αφού πρώτα τις μετατρέψουν σε grayscale. Μία grayscale εικόνα αποτελείται από χρώματα διαφόρων τόνων του γκρίζου. Το Matlab αποθηκεύει μία grayscale εικόνα σαν ένα μητρώο, όπου το κάθε ένα στοιχείο του αναφέρεται σε ένα και μοναδικό εικονοστοιχείο και εκφράζει την ένταση της φωτεινότητα. Οι τιμές που αντιστοιχίζονται στο μητρώο, κυμαίνονται από 0, όπου αναπαριστάται το μαύρο, έως 255 όπου εκφράζεται το άσπρο χρώμα. Οι grayscale εικόνες χρησιμοποιούνται συχνά στο τομέα της υπολογιστικής όρασης, αφενός λόγο χαμηλότερης υπολογιστική πολυπλοκότητας, αφετέρου πολλές φορές παρουσιάζονται ως ένας μοναδικός τρόπος αναπαράστασης μιας εικόνας, όπως για παράδειγμα οι ακτινογραφίες.

85 Κεφάλαιο 5 Υλοποίηση Συστήματος Αναγνώρισης Προτύπων 59 Η ανίχνευση ακμών είναι μία σημαντική λειτουργία από την σκοπιά της εξόρυξης γνώσης από εικόνες. Στα πλαίσια λοιπόν της εργασίας, δημιουργήσαμε αυτό το κουμπί το οποίο εντοπίζει τις ακμές μίας εικόνας σύμφωνα με τη έξυπνη μέθοδο Laplacian of Gaussian (LOG). Αυτή η μέθοδος συνδυάζει το Gaussian φιλτράρισμα μιας εικόνας με την Laplacian συνάρτηση για τον εντοπισμό των ακμών. Πιο συγκεκριμένα, τα σημεία ακμών μίας εικόνας μπορούν να εντοπιστούν υπολογίζοντας τα σημεία zero crossings της 2ης τάξης παραγώγου της έντασης της εικόνας. Όμως η 2η παράγωγος είναι αρκετά ευαίσθητη στο θόρυβο, οπότε θα πρέπει να φιλτράρουμε την εικόνα ώστε να τον απαλείψουμε. Γι' αυτό το λόγο λοιπόν, προσεγγίζουμε την 2η παράγωγο συνελίσσοντας πρώτα την εικόνα με ένα Gaussian φίλτρο και εν συνεχεία υπολογίζουμε τη Laplacian του προηγούμενου αποτελέσματος. Ο εντοπισμός των σημείων zero crossing γίνεται πολύ απλά, ελέγχοντας τα πρόσημα του Laplacian μητρώου για μία 3 3 γειτονιά [34]. Σχήμα 5.5: Παράδειγμα εκτέλεσης GrayScale και Edge Detection. Από τα πιο χαρακτηριστικά σημεία που παρουσιάζονται σε μία εικόνα είναι οι γωνίες. Οι γωνίες είναι πολύ εύκολο να εντοπιστούν με το ανθρώπινο μάτι, ο εντοπισμός τους όμως μέσω του υπολογιστή απαιτεί κάποια συγκεκριμένη διαδικασία. Για την εύρεση των γωνιών μίας εικόνας χρησιμοποιήσαμε τη μέθοδο Harris Corner Detector [33], σύμφωνα με την οποία υπολογίζεται η κλίση όλων των εικονοστοιχείων μίας εικόνας και έπειτα οι ιδιοτιμές των σημείων, με την βοήθεια των οποίων ανιχνεύονται οι γωνίες μιας εικόνας.

86 60 Κεφάλαιο 5 Υλοποίηση Συστήματος Αναγνώρισης Προτύπων Η απλούστερη μορφή εικόνας είναι η δυαδική (Binary or Thresholding). Μια δυαδική εικόνα έχει μόνο δύο στάθμες φωτεινότητας που συνήθως είναι το άσπρο και το μαύρο. Το άσπρο αντιστοιχεί στην τιμή 1 και το μαύρο στην τιμή 0. Μία δυαδική εικόνα καταλαμβάνει μικρότερη μνήμη και η επεξεργασία της απαιτεί μικρότερο υπολογιστικό κόστος. Σε δυαδική μορφή μπορούν να απεικονιστούν σημαντικές πληροφορίες όπως το εμβαδό, η θέση των αντικειμένων κ.ά. Αξίζει να σημειωθεί ότι πολλές και σημαντικές εφαρμογές του πεδίου της ψηφιακής επεξεργασίας εικόνας, όπως η αναγνώριση χαρακτήρων (optical character recognition), η αναγνώριση αποτυπωμάτων (fingerprint recognition) και η αναγνώριση υπογραφής (signature recognition) γίνονται συνήθως με χρήση δυαδικών εικόνων. Σχήμα 5.6: Παράδειγμα εκτέλεσης Corner Detection και Thres-Holding. Στο διπλανό εικονιζόμενο κουμπί, απεικονίζεται το ιστόγραμμα. Το ιστόγραμμα μιας εικόνας παρουσιάζει τα επίπεδα φωτεινότητας των εικονοστοιχείων της. Στην πραγματικότητα μας δείχνει με έναν γραφικό τρόπο, πόσα εικονοστοιχεία μιας εικόνας έχουν κάθε τιμή έντασης. Δεν μας δείχνει όμως την τοποθεσία των εικονοστοιχείων αυτών μέσα στην εικόνα. Το ιστόγραμμα μιας έγχρωμης εικόνας (σχήμα 5.7 αριστερά) αποτελείται από τρία ιστογράμματα, ένα για κάθε ένα από τρία βασικά χρώματα κόκκινο, πράσινο και μπλε. Η τιμές της φωτεινότητας για τα τρία χρωματικά κανάλια, κυμαίνονται από το 0 μέχρι το 255. Μια grayscale εικόνα αποτυπώνεται με ένα ιστόγραμμα (σχήμα 5.7 δεξιά) που παριστά τις διάφορες διακυμάνσεις το γκρι χρώματος, από την τιμή 0 (μαύρο) μέχρι τη 255 (άσπρο).

87 Κεφάλαιο 5 Υλοποίηση Συστήματος Αναγνώρισης Προτύπων 61 Σχήμα 5.7: Παράδειγμα εκτέλεσης ιστογράμματος μίας έγχρωμης εικόνας αριστερά και μίας grayscale δεξιά. Αν πιέσουμε το διπλανό κουμπί, θα μεταβούμε στην καρτέλα της κατηγοριοποίησης, για την οποία θα αναφερθούμε αναλυτικά στην επόμενή μας παράγραφο. Το κουμπί Reset επανεκκινεί την καρτέλα preprocess κάνοντας αποδέσμευση των χρησιμοποιηθέντων μεταβλητών μας. Μας δίνει τη δυνατότητα δηλαδή, να καθαρίσουμε το χώρο προβολής του GUI και να εκτελέσουμε νέες λειτουργίες. Μέσα από τη εργασία, ανακαλύψαμε πόσο χρήσιμη λειτουργία είναι το Gaussian Filter μιας εικόνας. Χρησιμοποιήθηκε ευρέως όχι μόνο στους αλγορίθμους SIFT και SURF, αλλά και στη ανίχνευση σημείων που αποτελούν ακμές μιας εικόνας. Γενικά, είναι ένα χρήσιμο εργαλείο όταν ασχολούμαστε με την ψηφιακή επεξεργασίας εικόνας οπότε θα αποτελούσε αμέλεια η μη συμπερίληψή του. Στο σχήμα 5.7 παρατηρούμε πως μεταβάλλεται η grayscale μορφή της εικόνας για διάφορες τιμές της παραμέτρου της διασποράς.

88 62 Κεφάλαιο 5 Υλοποίηση Συστήματος Αναγνώρισης Προτύπων Σχήμα 5.8: Παράδειγμα εκτέλεσης Gaussian filter για τυχαίες τιμές διασποράς 1,2,3 και Παράθυρο ταξινόμησης Η πρώτη οθόνη που εμφανίζεται στο χρήστη ανοίγοντας το παράθυρο της ταξινόμησης απεικονίζεται στο σχήμα 5.9. Παρατηρούμε ότι υπάρχει ένας αριθμός από επιλογές και κουμπιά, τα οποία εφαρμόζουν στην πράξη ότι έχουμε αναφέρει στη θεωρία, στα προηγούμενα κεφάλαια. Ακόμα, σε αυτό το παράθυρο έλαβε χώρα το πείραμά μας, στο οποίο θα αναφερθούμε στο επόμενο κεφάλαιο της εργασίας μας Διαθέσιμες λειτουργίες ταξινόμησης Κοιτάζοντας το σχήμα 5.9, βλέπουμε πως η πρώτη δυνατότητα που δίνεται στο χρήστη είναι η επιλογή του αλγορίθμου, ανάμεσα στους SIFT και SURF, καθώς και να επιλέξει άμα θέλει ή όχι να κάνει ανάλυση σε κύριες συνιστώσες (PCA). Πρόκειται για δύο σημαντικές ενέργειες, βάση των οποίων θα χτιστεί το σύνολο εκπαίδευσης και ελέγχου. Στο επόμενο βήμα ο χρήστης θα μπορεί, πιέζοντας τα κουμπιά Open Training Set και Open Test Set, να φορτώσει τα δεδομένα-εικόνες εκπαίδευσης και ελέγχου αντίστοιχα και στη συνέχεια το σύστημα θα αναλάβει να εξάγει τα χαρακτηριστικά, σύμφωνα με την προηγούμενή του επιλογή.

89 Κεφάλαιο 5 Υλοποίηση Συστήματος Αναγνώρισης Προτύπων 63 Σχήμα 5.9: Παράθυρο ταξινόμησης. Επόμενο στάδιο αποτελεί η επιλογή ταξινομητή. Οι διαθέσιμες επιλογές του χρήστη είναι τα νευρωνικά δίκτυα (Neural Network) και οι μηχανές διανυσμάτων υποστήριξης (SVM). Ακόμα, όσο αφορά τον ταξινομητή Neural Network, επειδή είναι πολύ δύσκολο να γνωρίζουμε ποιος από τους αλγόριθμος εκπαίδευσης θα είναι ταχύτερος και αποδοτικότερος για το εκάστοτε πρόβλημά μας, αφού εξαρτάται από πολλούς παράγοντες, όπως η πολυπλοκότητα του προβλήματος, ο αριθμός των δεδομένων στο σύνολο εκπαίδευσης, ο αριθμός των βαρών και των αποκλίσεων που παρατηρούνται στο δίκτυο, δίνεται η δυνατότητα στο χρήστη της επιλογής της συνάρτησης εκπαίδευσης με περιθώρια επιλογής ανάμεσα στις: Conjugate Gradient with Powell/Beale Restarts Variable Learning Rate Backpropagation Fletcher-Powell Conjugate Gradient Polak-Ribiére Conjugate Gradient

90 64 Κεφάλαιο 5 Υλοποίηση Συστήματος Αναγνώρισης Προτύπων Resilient Backpropagation στις: Για τον ταξινομητή SVM, ο χρήστης μπορεί να επιλέξει τη συνάρτηση πυρήνα ανάμεσα Linear Quadratic Polynomial Gaussian Radial Basis Function Multilayer Perceptron Για να ξεκινήσει η διαδικασία ταξινόμησης, αρκεί το πάτημα του κουμπιού Start Classify. Τότε στο χώρο προβολής του συστήματος, θα εμφανιστεί το ποσοστό ακρίβεια του ταξινομητή, το πλήθος των σωστών και λανθασμένων ταξινομημένων εικόνων και αμέσως το σύστημα, θα αρχίσει να προβάλει τις εικόνες του συνόλου ελέγχου με ένα μήνυμα που θα αναφέρεται σε πια κλάση κατατάχτηκε. Επιπλέον, αν ο ταξινομητής μας είναι ο Neural Network (σχήμα 5.10), θα εμφανιστούν και κάποιες περαιτέρω πληροφορίες όπως ο πίνακας σύγχυσης, η δομή του νευρωνικού δικτύου, πληροφορίες σχετικά με τις παραμέτρους εκπαίδευσης, τα κριτήρια που σταμάτησε η εκπαίδευση και τα οποία επισημαίνονται με πράσινο χρώμα όπως φαίνονται στο σχήμα 5.11, καθώς και κάποια χρήσιμα διαγράμματα όπως αυτό της απόδοσης του δικτύου, το ιστόγραμμα σφάλματος κ.ά, τα οποία συμβάλουν στην αξιολόγηση του δικτύου. Τέλος, υπάρχουν δύο ακόμα κουμπιά: Το κουμπί Pre-process το οποίο μεταφέρει στην καρτέλα preprocess του συστήματος, και το κουμπί Reset το οποίο επανεκκινεί την καρτέλα classification κάνοντας αποδέσμευση των χρησιμοποιηθέντων μεταβλητών μας και καθαρίζει το χώρο προβολής.

91 Κεφάλαιο 5 Υλοποίηση Συστήματος Αναγνώρισης Προτύπων 65 Σχήμα 5.10: Παράδειγμα εκτέλεσης ταξινόμησης ενός προβλήματος τριών κλάσεων με ένα Neural Network.

92 66 Κεφάλαιο 5 Υλοποίηση Συστήματος Αναγνώρισης Προτύπων Σχήμα 5.11: Πληροφορίες εκπαίδευσης ενός Neural Network.

93 Κεφάλαιο 6 Εκτέλεση Πειράματος Το πρόβλημα στο οποίο καλούμαστε να δώσουμε μία απάντηση στη συνέχεια της εργασίας μας, είναι η εύρεση ενός αποδοτικού συστήματος το οποίο θα είναι σε θέση να αναγνωρίσει, με αξιόπιστο τρόπο, αντικείμενα μέσα από μία βάση δεδομένων. Πιο συγκεκριμένα, θα προσπαθήσουμε να εντοπίσουμε έναν κατάλληλο αλγόριθμο εξαγωγής χαρακτηριστικών και σε συνδυασμό με τον ταξινομητή εκείνο που φέρει τα πιο έγκυρα αποτελέσματα, να προβούμε στη διαδικασία της αναγνώρισης προτύπων. 6.1 Η βάση δεδομένων μας Στα πλαίσια αυτής της εργασίας, θα χρησιμοποιήσουμε τη βάση δεδομένων Caltech- 101 [35]. Πρόκειται ένα πειραματικό σύνολο από εικόνες που συλλέχθηκαν από τους Fei Fei et al και χρησιμοποιείται ευρέως σε ταξινόμηση εικόνων. Η βάση λοιπόν που έχουμε στη διάθεσή μας, περιλαμβάνει 101 κατηγορίες εικόνων και κάθε κατηγορία έχει από 31 ως 800 εικόνες, μέτριας ανάλυσης 300x300 pixels και είναι σε επέκταση JPG. Οι εικόνες περιλαμβάνουν λίγο θόρυβο, ενώ τα αντικείμενα βρίσκονται στο κέντρο της εικόνας και καταλαμβάνουν το μεγαλύτερο μέρος της. Ακόμα, όλες οι εικόνες έχουν ανομοιογενές φόντο και τα περισσότερα αντικείμενα έχουν φωτογραφηθεί από την ίδια οπτική γωνία. Κάποιες από αυτές παρουσιάζονται στο σχήμα Δημιουργία συνόλων εκπαίδευσης και ελέγχου Για το πείραμά μας θα χρησιμοποιήσουμε ένα υποσύνολο των κατηγοριών της βάσης μας, το οποίο θα το εξετάσουμε ως προς έναν διαφορετικό αριθμό πλήθους κλάσεων κάθε φορά. 67

94 68 Κεφάλαιο 6 Εκτέλεση Πειράματος Σχήμα 6.1: Εικόνες από το σύνολο Caltech-101. n 1 Σε πρώτη φάση, θα δούμε πως αποδίδει το σύστημα αναγνώρισης προτύπων για το πρόβλημα ταξινόμησης των κατηγοριών airplanes και Motorbikes. Θα χρησιμοποιήσουμε 600 εικόνες από τις προαναφερθείσες κατηγορίες για εκπαίδευση και με 300 εικόνες θα ελέγξουμε το σύστημα. Για να είμαστε αντικειμενικοί, θα πρέπει η επιλογή τόσο του συνόλου εκπαίδευσης όσο και του ελέγχου να αποτελείται από το ίδιο πλήθος εικόνων για κάθε κατηγορία. Το γεγονός ότι η βάση δεδομένων μας δεν αποτελείται από τον ίδιο αριθμό εικόνων για κάθε κατηγορία, για τα επόμενα τρία πειράματα η επιλογή του πλήθους τόσο του συνόλου εκπαίδευσης όσο και του ελέγχου θα είναι ομοιόμορφη του αριθμού των εικόνων των κατηγοριών. n 2 Επόμενη προσπάθειά μας θα αποτελέσει η δημιουργία ενός συστήματος αναγνώρισης προτύπων, το οποίο θα μπορεί να διαχωρίζει ένα πρόβλημα τριών κατηγοριών. Οι

D. Lowe, Distinctive Image Features from Scale-Invariant Keypoints, International Journal of Computer Vision, 60(2):91-110, 2004.

D. Lowe, Distinctive Image Features from Scale-Invariant Keypoints, International Journal of Computer Vision, 60(2):91-110, 2004. D. Lowe, Distinctive Image Features from Scale-Invariant Keypoints, International Journal of Computer Vision, 60(2):91-110, 2004. 1/45 Τι είναι ο SIFT-Γενικά Scale-invariant feature transform detect and

Διαβάστε περισσότερα

D. Lowe, Distinctive Image Features from Scale-Invariant Keypoints, International Journal of Computer Vision, 60(2):91-110, 2004.

D. Lowe, Distinctive Image Features from Scale-Invariant Keypoints, International Journal of Computer Vision, 60(2):91-110, 2004. D. Lowe, Distinctive Image Features from Scale-Invariant Keypoints, International Journal of Computer Vision, 60(2):91-110, 2004. Εισαγωγικά: SIFT~Harris Harris Detector: Δεν είναι ανεξάρτητος της κλίμακας

Διαβάστε περισσότερα

Μεταπτυχιακό Πρόγραμμα «Γεωχωρικές Τεχνολογίες» Ψηφιακή Επεξεργασία Εικόνας. Εισηγητής Αναστάσιος Κεσίδης

Μεταπτυχιακό Πρόγραμμα «Γεωχωρικές Τεχνολογίες» Ψηφιακή Επεξεργασία Εικόνας. Εισηγητής Αναστάσιος Κεσίδης Μεταπτυχιακό Πρόγραμμα «Γεωχωρικές Τεχνολογίες» Ψηφιακή Επεξεργασία Εικόνας Εισηγητής Αναστάσιος Κεσίδης Ακμές και περιγράμματα Ακμές και περιγράμματα Γενικά Μεγάλο τμήμα της πληροφορίας που γίνεται αντιληπτή

Διαβάστε περισσότερα

Μέθοδοι Μηχανών Μάθησης για Ευφυή Αναγνώριση και ιάγνωση Ιατρικών εδοµένων

Μέθοδοι Μηχανών Μάθησης για Ευφυή Αναγνώριση και ιάγνωση Ιατρικών εδοµένων Μέθοδοι Μηχανών Μάθησης για Ευφυή Αναγνώριση και ιάγνωση Ιατρικών εδοµένων Εισηγητής: ρ Ηλίας Ζαφειρόπουλος Εισαγωγή Ιατρικά δεδοµένα: Συλλογή Οργάνωση Αξιοποίηση Data Mining ιαχείριση εδοµένων Εκπαίδευση

Διαβάστε περισσότερα

Αναγνώριση Προτύπων Ι

Αναγνώριση Προτύπων Ι Αναγνώριση Προτύπων Ι Ενότητα 1: Μέθοδοι Αναγνώρισης Προτύπων Αν. Καθηγητής Δερματάς Ευάγγελος Τμήμα Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται

Διαβάστε περισσότερα

Ειδικά Θέµατα Υπολογιστικής Όρασης & Γραφικής. Εµµανουήλ Ζ. Ψαράκης & Αθανάσιος Τσακαλίδης Πολυτεχνική Σχολή Τµήµα Μηχανικών Η/Υ & Πληροφορικής

Ειδικά Θέµατα Υπολογιστικής Όρασης & Γραφικής. Εµµανουήλ Ζ. Ψαράκης & Αθανάσιος Τσακαλίδης Πολυτεχνική Σχολή Τµήµα Μηχανικών Η/Υ & Πληροφορικής Ειδικά Θέµατα Υπολογιστικής Όρασης & Γραφικής Εµµανουήλ Ζ. Ψαράκης & Αθανάσιος Τσακαλίδης Πολυτεχνική Σχολή Τµήµα Μηχανικών Η/Υ & Πληροφορικής Χαρακτηριστικά Εµµανουήλ Ζ. Ψαράκης Πολυτεχνική Σχολή Τµήµα

Διαβάστε περισσότερα

LOGO. Εξόρυξη Δεδομένων. Δειγματοληψία. Πίνακες συνάφειας. Καμπύλες ROC και AUC. Σύγκριση Μεθόδων Εξόρυξης

LOGO. Εξόρυξη Δεδομένων. Δειγματοληψία. Πίνακες συνάφειας. Καμπύλες ROC και AUC. Σύγκριση Μεθόδων Εξόρυξης Εξόρυξη Δεδομένων Δειγματοληψία Πίνακες συνάφειας Καμπύλες ROC και AUC Σύγκριση Μεθόδων Εξόρυξης Πασχάλης Θρήσκος PhD Λάρισα 2016-2017 pthriskos@mnec.gr LOGO Συμπερισματολογία - Τι σημαίνει ; Πληθυσμός

Διαβάστε περισσότερα

Μετάδοση Πολυμεσικών Υπηρεσιών Ψηφιακή Τηλεόραση

Μετάδοση Πολυμεσικών Υπηρεσιών Ψηφιακή Τηλεόραση Χειμερινό Εξάμηνο 2013-2014 Μετάδοση Πολυμεσικών Υπηρεσιών Ψηφιακή Τηλεόραση 5 η Παρουσίαση : Ψηφιακή Επεξεργασία Εικόνας Διδάσκων: Γιάννης Ντόκας Σύνθεση Χρωμάτων Αφαιρετική Παραγωγή Χρώματος Χρωματικά

Διαβάστε περισσότερα

Ενδεικτική πολυ-εργασία 1 - εφαρμογή στην υπολογιστική όραση

Ενδεικτική πολυ-εργασία 1 - εφαρμογή στην υπολογιστική όραση Ενδεικτική πολυ-εργασία 1 - εφαρμογή στην υπολογιστική όραση Εντοπισμός ενός σήματος STOP σε μια εικόνα. Περιγράψτε τη διαδικασία με την οποία μπορώ να εντοπίσω απλά σε μια εικόνα την ύπαρξη του παρακάτω

Διαβάστε περισσότερα

ΤΕΙ ΣΕΡΡΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΕΠΙΚΟΙΝΩΝΙΩΝ ΕΞΕΤΑΣΗ ΣΤΟ ΜΑΘΗΜΑ «ΑΝΑΓΝΩΡΙΣΗ ΠΡΟΤΥΠΩΝ ΝΕΥΡΩΝΙΚΑ ΔΙΚΤΥΑ» ΔΕ. 11 ΙΟΥΝΙΟΥ 2012

ΤΕΙ ΣΕΡΡΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΕΠΙΚΟΙΝΩΝΙΩΝ ΕΞΕΤΑΣΗ ΣΤΟ ΜΑΘΗΜΑ «ΑΝΑΓΝΩΡΙΣΗ ΠΡΟΤΥΠΩΝ ΝΕΥΡΩΝΙΚΑ ΔΙΚΤΥΑ» ΔΕ. 11 ΙΟΥΝΙΟΥ 2012 ΔΕ. ΙΟΥΝΙΟΥ Δίνονται τα εξής πρότυπα: [ ] [ ] [ ] [ ] Άσκηση η ( μονάδες) Χρησιμοποιώντας το κριτήριο της ομοιότητας να απορριφθεί ένα χαρακτηριστικό με βάσει το συντελεστή συσχέτισης. (γράψτε ποιο χαρακτηριστικό

Διαβάστε περισσότερα

ΕΡΕΥΝΗΤΙΚΑ ΠΡΟΓΡΑΜΜΑΤΑ ΑΡΧΙΜΗΔΗΣ ΕΝΙΣΧΥΣΗ ΕΡΕΥΝΗΤΙΚΩΝ ΟΜΑΔΩΝ ΣΤΟ ΤΕΙ ΣΕΡΡΩΝ. Ενέργεια. 2.2.3.στ ΘΕΜΑ ΕΡΕΥΝΑΣ: ΔΙΑΡΘΡΩΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΕΧΡΩΜΩΝ ΕΓΓΡΑΦΩΝ

ΕΡΕΥΝΗΤΙΚΑ ΠΡΟΓΡΑΜΜΑΤΑ ΑΡΧΙΜΗΔΗΣ ΕΝΙΣΧΥΣΗ ΕΡΕΥΝΗΤΙΚΩΝ ΟΜΑΔΩΝ ΣΤΟ ΤΕΙ ΣΕΡΡΩΝ. Ενέργεια. 2.2.3.στ ΘΕΜΑ ΕΡΕΥΝΑΣ: ΔΙΑΡΘΡΩΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΕΧΡΩΜΩΝ ΕΓΓΡΑΦΩΝ ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ (Τ.Ε.Ι.) ΣΕΡΡΩΝ Τμήμα ΠΛΗΡΟΦΟΡΙΚΗΣ & ΕΠΙΚΟΙΝΩΝΙΩΝ ΕΡΕΥΝΗΤΙΚΑ ΠΡΟΓΡΑΜΜΑΤΑ ΑΡΧΙΜΗΔΗΣ ΕΝΙΣΧΥΣΗ ΕΡΕΥΝΗΤΙΚΩΝ ΟΜΑΔΩΝ ΣΤΟ ΤΕΙ ΣΕΡΡΩΝ Ενέργεια. 2.2.3.στ ΘΕΜΑ ΕΡΕΥΝΑΣ: ΔΙΑΡΘΡΩΣΗ

Διαβάστε περισσότερα

Μεταπτυχιακό Πρόγραμμα «Γεωχωρικές Τεχνολογίες» Ψηφιακή Επεξεργασία Εικόνας. Εισηγητής Αναστάσιος Κεσίδης

Μεταπτυχιακό Πρόγραμμα «Γεωχωρικές Τεχνολογίες» Ψηφιακή Επεξεργασία Εικόνας. Εισηγητής Αναστάσιος Κεσίδης Μεταπτυχιακό Πρόγραμμα «Γεωχωρικές Τεχνολογίες» Ψηφιακή Επεξεργασία Εικόνας Εισηγητής Αναστάσιος Κεσίδης Χωρικά φίλτρα Χωρικά φίλτρα Γενικά Σε αντίθεση με τις σημειακές πράξεις και μετασχηματισμούς, στα

Διαβάστε περισσότερα

Τεχνικές Μείωσης Διαστάσεων. Ειδικά θέματα ψηφιακής επεξεργασίας σήματος και εικόνας Σ. Φωτόπουλος- Α. Μακεδόνας

Τεχνικές Μείωσης Διαστάσεων. Ειδικά θέματα ψηφιακής επεξεργασίας σήματος και εικόνας Σ. Φωτόπουλος- Α. Μακεδόνας Τεχνικές Μείωσης Διαστάσεων Ειδικά θέματα ψηφιακής επεξεργασίας σήματος και εικόνας Σ. Φωτόπουλος- Α. Μακεδόνας 1 Εισαγωγή Το μεγαλύτερο μέρος των δεδομένων που καλούμαστε να επεξεργαστούμε είναι πολυδιάστατα.

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ. ΠΡΟΛΟΓΟΣ... vii ΠΕΡΙΕΧΟΜΕΝΑ... ix ΓΕΝΙΚΗ ΒΙΒΛΙΟΓΡΑΦΙΑ... xv. Κεφάλαιο 1 ΓΕΝΙΚΕΣ ΕΝΝΟΙΕΣ ΑΠΟ ΤΗ ΣΤΑΤΙΣΤΙΚΗ

ΠΕΡΙΕΧΟΜΕΝΑ. ΠΡΟΛΟΓΟΣ... vii ΠΕΡΙΕΧΟΜΕΝΑ... ix ΓΕΝΙΚΗ ΒΙΒΛΙΟΓΡΑΦΙΑ... xv. Κεφάλαιο 1 ΓΕΝΙΚΕΣ ΕΝΝΟΙΕΣ ΑΠΟ ΤΗ ΣΤΑΤΙΣΤΙΚΗ ΠΡΟΛΟΓΟΣ... vii ΠΕΡΙΕΧΟΜΕΝΑ... ix ΓΕΝΙΚΗ ΒΙΒΛΙΟΓΡΑΦΙΑ... xv Κεφάλαιο 1 ΓΕΝΙΚΕΣ ΕΝΝΟΙΕΣ ΑΠΟ ΤΗ ΣΤΑΤΙΣΤΙΚΗ 1.1 Πίνακες, κατανομές, ιστογράμματα... 1 1.2 Πυκνότητα πιθανότητας, καμπύλη συχνοτήτων... 5 1.3

Διαβάστε περισσότερα

Ειδικά Θέµατα Υπολογιστικής Όρασης & Γραφικής. Εµµανουήλ Ζ. Ψαράκης & Αθανάσιος Τσακαλίδης Πολυτεχνική Σχολή Τµήµα Μηχανικών Η/Υ & Πληροφορικής

Ειδικά Θέµατα Υπολογιστικής Όρασης & Γραφικής. Εµµανουήλ Ζ. Ψαράκης & Αθανάσιος Τσακαλίδης Πολυτεχνική Σχολή Τµήµα Μηχανικών Η/Υ & Πληροφορικής Ειδικά Θέµατα Υπολογιστικής Όρασης & Γραφικής Εµµανουήλ Ζ. Ψαράκης & Αθανάσιος Τσακαλίδης Πολυτεχνική Σχολή Τµήµα Μηχανικών Η/Υ & Πληροφορικής Σύνθεση Πανοράµατος Εµµανουήλ Ζ. Ψαράκης Πολυτεχνική Σχολή

Διαβάστε περισσότερα

Ψηφιακή Επεξεργασία και Ανάλυση Εικόνας Ενότητα 4 η : Βελτίωση Εικόνας. Καθ. Κωνσταντίνος Μπερμπερίδης Πολυτεχνική Σχολή Μηχανικών Η/Υ & Πληροφορικής

Ψηφιακή Επεξεργασία και Ανάλυση Εικόνας Ενότητα 4 η : Βελτίωση Εικόνας. Καθ. Κωνσταντίνος Μπερμπερίδης Πολυτεχνική Σχολή Μηχανικών Η/Υ & Πληροφορικής Ψηφιακή Επεξεργασία και Ανάλυση Εικόνας Ενότητα 4 η : Βελτίωση Εικόνας Καθ. Κωνσταντίνος Μπερμπερίδης Πολυτεχνική Σχολή Μηχανικών Η/Υ & Πληροφορικής Σκοποί ενότητας Εισαγωγή στις τεχνικές βελτίωσης εικόνας

Διαβάστε περισσότερα

Μάθημα 8 ο. Ανίχνευση Ακμών ΤΜΗΥΠ / ΕΕΣΤ 1

Μάθημα 8 ο. Ανίχνευση Ακμών ΤΜΗΥΠ / ΕΕΣΤ 1 Μάθημα 8 ο Ανίχνευση Ακμών ΤΜΗΥΠ / ΕΕΣΤ 1 Εισαγωγή (1) Οι ακμές είναι βασικά χαρακτηριστικά της εικόνας. Ένας αποδεκτός ορισμός της ακμής είναι ο ακόλουθος: «Το σύνορο μεταξύ δύο ομοιογενών περιοχών με

Διαβάστε περισσότερα

Μάθημα 8 ο. Ανίχνευση Ακμών ΤΜΗΥΠ / ΕΕΣΤ 1

Μάθημα 8 ο. Ανίχνευση Ακμών ΤΜΗΥΠ / ΕΕΣΤ 1 Μάθημα 8 ο Ανίχνευση Ακμών ΤΜΗΥΠ / ΕΕΣΤ 1 Εισαγωγή (1) Οι ακμές είναι βασικά χαρακτηριστικά της εικόνας Προς το παρόν δεν υπάρχει ακόμα ένας ευρέως αποδεκτός ορισμός της ακμής. Εδώ θα θεωρούμε ως ακμή:

Διαβάστε περισσότερα

Digital Image Processing

Digital Image Processing Digital Image Processing Intensity Transformations Πέτρος Καρβέλης pkarvelis@gmail.com Images taken from: R. Gonzalez and R. Woods. Digital Image Processing, Prentice Hall, 2008. Image Enhancement: είναι

Διαβάστε περισσότερα

ΤΕΙ ΣΕΡΡΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΕΠΙΚΟΙΝΩΝΙΩΝ ΕΞΕΤΑΣΗ ΣΤΟ ΜΑΘΗΜΑ «ΑΝΑΓΝΩΡΙΣΗ ΠΡΟΤΥΠΩΝ ΝΕΥΡΩΝΙΚΑ ΔΙΚΤΥΑ» ΠΑ. 7 ΣΕΠΤΕΜΒΡΙΟΥ 2012

ΤΕΙ ΣΕΡΡΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΕΠΙΚΟΙΝΩΝΙΩΝ ΕΞΕΤΑΣΗ ΣΤΟ ΜΑΘΗΜΑ «ΑΝΑΓΝΩΡΙΣΗ ΠΡΟΤΥΠΩΝ ΝΕΥΡΩΝΙΚΑ ΔΙΚΤΥΑ» ΠΑ. 7 ΣΕΠΤΕΜΒΡΙΟΥ 2012 ΠΑ. 7 ΣΕΠΤΕΜΒΡΙΟΥ Δίνονται τα εξής πρότυπα: [ ] [ ] [ ] [ ] Άσκηση η (3 μονάδες) Χρησιμοποιώντας το κριτήριο της ομοιότητας να απορριφθεί ένα χαρακτηριστικό με βάση το συντελεστή συσχέτισης. (γράψτε ποιο

Διαβάστε περισσότερα

ΙΑ ΟΧΙΚΕΣ ΒΕΛΤΙΩΣΕΙΣ

ΙΑ ΟΧΙΚΕΣ ΒΕΛΤΙΩΣΕΙΣ Tel.: +30 2310998051, Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης Σχολή Θετικών Επιστημών Τμήμα Φυσικής 541 24 Θεσσαλονίκη Καθηγητής Γεώργιος Θεοδώρου Ιστοσελίδα: http://users.auth.gr/theodoru ΙΑ ΟΧΙΚΕΣ ΒΕΛΤΙΩΣΕΙΣ

Διαβάστε περισσότερα

Ε.Α.Υ. Υπολογιστική Όραση. Κατάτμηση Εικόνας

Ε.Α.Υ. Υπολογιστική Όραση. Κατάτμηση Εικόνας Ε.Α.Υ. Υπολογιστική Όραση Κατάτμηση Εικόνας Γεώργιος Παπαϊωάννου 2015 ΚΑΤΩΦΛΙΩΣΗ Κατωφλίωση - Γενικά Είναι η πιο απλή μέθοδος segmentation εικόνας Χωρίζουμε την εικόνα σε 2 (binary) ή περισσότερες στάθμες

Διαβάστε περισσότερα

4. ΚΕΦΑΛΑΙΟ ΕΦΑΡΜΟΓΕΣ ΤΟΥ ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΥ FOURIER

4. ΚΕΦΑΛΑΙΟ ΕΦΑΡΜΟΓΕΣ ΤΟΥ ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΥ FOURIER 4. ΚΕΦΑΛΑΙΟ ΕΦΑΡΜΟΓΕΣ ΤΟΥ ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΥ FOURIER Σκοπός του κεφαλαίου είναι να παρουσιάσει μερικές εφαρμογές του Μετασχηματισμού Fourier (ΜF). Ειδικότερα στο κεφάλαιο αυτό θα περιγραφούν έμμεσοι τρόποι

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 5. Κύκλος Ζωής Εφαρμογών ΕΝΟΤΗΤΑ 2. Εφαρμογές Πληροφορικής. Διδακτικές ενότητες 5.1 Πρόβλημα και υπολογιστής 5.2 Ανάπτυξη εφαρμογών

ΚΕΦΑΛΑΙΟ 5. Κύκλος Ζωής Εφαρμογών ΕΝΟΤΗΤΑ 2. Εφαρμογές Πληροφορικής. Διδακτικές ενότητες 5.1 Πρόβλημα και υπολογιστής 5.2 Ανάπτυξη εφαρμογών 44 Διδακτικές ενότητες 5.1 Πρόβλημα και υπολογιστής 5.2 Ανάπτυξη εφαρμογών Διδακτικοί στόχοι Σκοπός του κεφαλαίου είναι οι μαθητές να κατανοήσουν τα βήματα που ακολουθούνται κατά την ανάπτυξη μιας εφαρμογής.

Διαβάστε περισσότερα

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2 Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας Verson 2 1 M = 1 N = N prob k N k { k n ω wrongly classfed} = (1 ) N k 2 Η συνάρτηση πιθανοφάνειας L(p) μεγιστοποιείται όταν =k/n. 3 Αφού τα s είναι άγνωστα,

Διαβάστε περισσότερα

ΣΥΓΚΡΙΤΙΚΗ ΜΕΛΕΤΗ ΑΛΓΟΡΙΘΜΩΝ ΕΞΑΓΩΓΗΣ ΧΑΡΑΚΤΗΡΙΣΤΙΚΩΝ

ΣΥΓΚΡΙΤΙΚΗ ΜΕΛΕΤΗ ΑΛΓΟΡΙΘΜΩΝ ΕΞΑΓΩΓΗΣ ΧΑΡΑΚΤΗΡΙΣΤΙΚΩΝ ΣΥΓΚΡΙΤΙΚΗ ΜΕΛΕΤΗ ΑΛΓΟΡΙΘΜΩΝ ΕΞΑΓΩΓΗΣ ΧΑΡΑΚΤΗΡΙΣΤΙΚΩΝ Ρήγας Κουσκουρίδας, Βασίλειος Μπελαγιάννης, Δημήτριος Χρυσοστόμου και Αντώνιος Γαστεράτος Δημοκρίτειο Πανεπιστήμιο Θράκης, Πανεπιστημιούπολη, Κιμμέρια,

Διαβάστε περισσότερα

DIP_01 Εισαγωγή στην ψηφιακή εικόνα. ΤΕΙ Κρήτης

DIP_01 Εισαγωγή στην ψηφιακή εικόνα. ΤΕΙ Κρήτης DIP_01 Εισαγωγή στην ψηφιακή εικόνα ΤΕΙ Κρήτης Πληροφορίες Μαθήματος ιαλέξεις Πέμπτη 12:15 15:00 Αιθουσα Γ7 ιδάσκων:. Κοσμόπουλος Γραφείο: Κ23-0-15 (ισόγειο( κλειστού γυμναστηρίου) Ωρες γραφείου Τε 16:00

Διαβάστε περισσότερα

Μέθοδοι Μηχανικής Μάθησης στην επεξεργασία Τηλεπισκοπικών Δεδομένων. Δρ. Ε. Χάρου

Μέθοδοι Μηχανικής Μάθησης στην επεξεργασία Τηλεπισκοπικών Δεδομένων. Δρ. Ε. Χάρου Μέθοδοι Μηχανικής Μάθησης στην επεξεργασία Τηλεπισκοπικών Δεδομένων Δρ. Ε. Χάρου Πρόγραμμα υπολογιστικής ευφυίας Ινστιτούτο Πληροφορικής & Τηλεπικοινωνιών ΕΚΕΦΕ ΔΗΜΟΚΡΙΤΟΣ exarou@iit.demokritos.gr Μηχανική

Διαβάστε περισσότερα

Μάθηση και Γενίκευση. "Τεχνητά Νευρωνικά Δίκτυα" (Διαφάνειες), Α. Λύκας, Παν. Ιωαννίνων

Μάθηση και Γενίκευση. Τεχνητά Νευρωνικά Δίκτυα (Διαφάνειες), Α. Λύκας, Παν. Ιωαννίνων Μάθηση και Γενίκευση Το Πολυεπίπεδο Perceptron (MultiLayer Perceptron (MLP)) Έστω σύνολο εκπαίδευσης D={(x n,t n )}, n=1,,n. x n =(x n1,, x nd ) T, t n =(t n1,, t np ) T Θα πρέπει το MLP να έχει d νευρώνες

Διαβάστε περισσότερα

27-Ιαν-2009 ΗΜΥ 429. 2. (ι) Βασική στατιστική (ιι) Μετατροπές: αναλογικό-σεψηφιακό και ψηφιακό-σε-αναλογικό

27-Ιαν-2009 ΗΜΥ 429. 2. (ι) Βασική στατιστική (ιι) Μετατροπές: αναλογικό-σεψηφιακό και ψηφιακό-σε-αναλογικό ΗΜΥ 429 2. (ι) Βασική στατιστική (ιι) Μετατροπές: αναλογικό-σεψηφιακό και ψηφιακό-σε-αναλογικό 1 (i) Βασική στατιστική 2 Στατιστική Vs Πιθανότητες Στατιστική: επιτρέπει μέτρηση και αναγνώριση θορύβου και

Διαβάστε περισσότερα

Μεταπτυχιακό Πρόγραμμα «Γεωχωρικές Τεχνολογίες» Ψηφιακή Επεξεργασία Εικόνας. Εισηγητής Αναστάσιος Κεσίδης

Μεταπτυχιακό Πρόγραμμα «Γεωχωρικές Τεχνολογίες» Ψηφιακή Επεξεργασία Εικόνας. Εισηγητής Αναστάσιος Κεσίδης Μεταπτυχιακό Πρόγραμμα «Γεωχωρικές Τεχνολογίες» Ψηφιακή Επεξεργασία Εικόνας Εισηγητής Αναστάσιος Κεσίδης Τμηματοποίηση εικόνας Τμηματοποίηση εικόνας Γενικά Διαμερισμός μιας εικόνας σε διακριτές περιοχές

Διαβάστε περισσότερα

4.3. Γραµµικοί ταξινοµητές

4.3. Γραµµικοί ταξινοµητές Γραµµικοί ταξινοµητές Γραµµικός ταξινοµητής είναι ένα σύστηµα ταξινόµησης που χρησιµοποιεί γραµµικές διακριτικές συναρτήσεις Οι ταξινοµητές αυτοί αναπαρίστανται συχνά µε οµάδες κόµβων εντός των οποίων

Διαβάστε περισσότερα

Παρουσίαση Νο. 5 Βελτίωση εικόνας

Παρουσίαση Νο. 5 Βελτίωση εικόνας Ψηφιακή Επεξεργασία και Ανάλυση Εικόνας Παρουσίαση Νο. 5 Βελτίωση εικόνας Εισαγωγή Η βελτίωση γίνεται σε υποκειμενική βάση Η απόδοση εξαρτάται από την εφαρμογή Οι τεχνικές είναι συνήθως ad hoc Τονίζει

Διαβάστε περισσότερα

Ακαδημαϊκό Έτος , Χειμερινό Εξάμηνο Διδάσκων Καθ.: Νίκος Τσαπατσούλης

Ακαδημαϊκό Έτος , Χειμερινό Εξάμηνο Διδάσκων Καθ.: Νίκος Τσαπατσούλης ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΛΟΠΟΝΝΗΣΟΥ, ΤΜΗΜΑ ΤΕΧΝΟΛΟΓΙΑΣ ΤΗΛΕΠΙΚΟΙΝΩΝΙΩΝ ΚΕΣ 3: ΑΝΑΓΝΩΡΙΣΗ ΠΡΟΤΥΠΩΝ ΚΑΙ ΑΝΑΛΥΣΗ ΕΙΚΟΝΑΣ Ακαδημαϊκό Έτος 7 8, Χειμερινό Εξάμηνο Καθ.: Νίκος Τσαπατσούλης ΕΡΩΤΗΣΕΙΣ ΕΠΑΝΑΛΗΨΗΣ Το παρόν

Διαβάστε περισσότερα

Κατάτµηση Εικόνων: Ανίχνευση Ακµών και Κατάτµηση µε Κατωφλίωση

Κατάτµηση Εικόνων: Ανίχνευση Ακµών και Κατάτµηση µε Κατωφλίωση ΤΨΣ 50 Ψηφιακή Επεξεργασία Εικόνας Κατάτµηση Εικόνων: Ανίχνευση Ακµών και Κατάτµηση µε Κατωφλίωση Τµήµα ιδακτικής της Τεχνολογίας και Ψηφιακών Συστηµάτων Πανεπιστήµιο Πειραιώς Περιεχόµενα Βιβλιογραφία

Διαβάστε περισσότερα

Ασκήσεις Φροντιστηρίου «Υπολογιστική Νοημοσύνη Ι» 5 o Φροντιστήριο

Ασκήσεις Φροντιστηρίου «Υπολογιστική Νοημοσύνη Ι» 5 o Φροντιστήριο Πρόβλημα ο Ασκήσεις Φροντιστηρίου 5 o Φροντιστήριο Δίνεται το παρακάτω σύνολο εκπαίδευσης: # Είσοδος Κατηγορία 0 0 0 Α 2 0 0 Α 0 Β 4 0 0 Α 5 0 Β 6 0 0 Α 7 0 Β 8 Β α) Στον παρακάτω κύβο τοποθετείστε τα

Διαβάστε περισσότερα

1 η ΕΡΓΑΣΤΗΡΙΑΚΗ ΑΣΚΗΣΗ

1 η ΕΡΓΑΣΤΗΡΙΑΚΗ ΑΣΚΗΣΗ ΑΕΙ ΠΕΙΡΑΙΑ ΤΤ ΤΜΗΜΑ ΜΗΧΑΝΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ Τ.Ε. ΕΡΓΑΣΤΗΡΙΟ ΜΗΧΑΝΙΚΗΣ ΤΩΝ ΡΕΥΣΤΩΝ Σκοπός της άσκησης 1 η ΕΡΓΑΣΤΗΡΙΑΚΗ ΑΣΚΗΣΗ Σκοπός αυτής της άσκησης είναι η εξοικείωση των σπουδαστών με τα σφάλματα που

Διαβάστε περισσότερα

Ψηφιακή Επεξεργασία και Ανάλυση Εικόνας. Παρουσίαση Νο. 1. Εισαγωγή

Ψηφιακή Επεξεργασία και Ανάλυση Εικόνας. Παρουσίαση Νο. 1. Εισαγωγή Ψηφιακή Επεξεργασία και Ανάλυση Εικόνας Ακαδημαϊκό Έτος 2015-16 Παρουσίαση Νο. 1 Εισαγωγή Τι είναι η εικόνα; Οτιδήποτε μπορούμε να δούμε ή να απεικονίσουμε Π.χ. Μια εικόνα τοπίου αλλά και η απεικόνιση

Διαβάστε περισσότερα

Διδάσκουσα: Χάλκου Χαρά,

Διδάσκουσα: Χάλκου Χαρά, Διδάσκουσα: Χάλκου Χαρά, Διπλωματούχος Ηλεκτρολόγος Μηχανικός & Τεχνολογίας Η/Υ, MSc e-mail: chalkou@upatras.gr Επιβλεπόμενοι Μη Επιβλεπόμενοι Ομάδα Κατηγορία Κανονικοποίηση Δεδομένων Συμπλήρωση Ελλιπών

Διαβάστε περισσότερα

Ανάκτηση πολυμεσικού περιεχομένου

Ανάκτηση πολυμεσικού περιεχομένου Ανάκτηση πολυμεσικού περιεχομένου Ανίχνευση / αναγνώριση προσώπων Ανίχνευση / ανάγνωση κειμένου Ανίχνευση αντικειμένων Οπτικές λέξεις Δεικτοδότηση Σχέσεις ομοιότητας Κατηγοριοποίηση ειδών μουσικής Διάκριση

Διαβάστε περισσότερα

Στατιστική Ι (ΨΥΧ-1202) ιάλεξη 3

Στατιστική Ι (ΨΥΧ-1202) ιάλεξη 3 (ΨΥΧ-1202) Λεωνίδας Α. Ζαμπετάκης Β.Sc., M.Env.Eng., M.Ind.Eng., D.Eng. Εmail: statisticsuoc@gmail.com ιαλέξεις: ftp://ftp.soc.uoc.gr/psycho/zampetakis/ ιάλεξη 3 ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ ΤΜΗΜΑ ΨΥΧΟΛΟΓΙΑΣ Ρέθυμνο,

Διαβάστε περισσότερα

Βασίλειος Μαχαιράς Πολιτικός Μηχανικός Ph.D.

Βασίλειος Μαχαιράς Πολιτικός Μηχανικός Ph.D. Βασίλειος Μαχαιράς Πολιτικός Μηχανικός Ph.D. Μη γραμμικός προγραμματισμός: βελτιστοποίηση χωρίς περιορισμούς Πανεπιστήμιο Θεσσαλίας Σχολή Θετικών Επιστημών ΤμήμαΠληροφορικής Διάλεξη 7-8 η /2017 Τι παρουσιάστηκε

Διαβάστε περισσότερα

Μάθημα 10 ο. Περιγραφή Σχήματος ΤΜΗΥΠ / ΕΕΣΤ 1

Μάθημα 10 ο. Περιγραφή Σχήματος ΤΜΗΥΠ / ΕΕΣΤ 1 Μάθημα 10 ο Περιγραφή Σχήματος ΤΜΗΥΠ / ΕΕΣΤ 1 Εισαγωγή (1) Η περιγραφή μίας περιοχής μπορεί να γίνει: Με βάση τα εξωτερικά χαρακτηριστικά (ακμές, όρια). Αυτή η περιγραφή προτιμάται όταν μας ενδιαφέρουν

Διαβάστε περισσότερα

Πανεπιστήµιο Κύπρου Πολυτεχνική Σχολή

Πανεπιστήµιο Κύπρου Πολυτεχνική Σχολή Πανεπιστήµιο Κύπρου Πολυτεχνική Σχολή Τµήµα Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών ΗΜΜΥ 795: ΑΝΑΓΝΩΡΙΣΗ ΠΡΟΤΥΠΩΝ Ακαδηµαϊκό έτος 2010-11 Χειµερινό Εξάµηνο Τελική εξέταση Τρίτη, 21 εκεµβρίου 2010,

Διαβάστε περισσότερα

HMY 795: Αναγνώριση Προτύπων

HMY 795: Αναγνώριση Προτύπων HMY 795: Αναγνώριση Προτύπων Διάλεξη 3 Επιλογή μοντέλου Επιλογή μοντέλου Θεωρία αποφάσεων Επιλογή μοντέλου δεδομένα επικύρωσης Η επιλογή του είδους του μοντέλου που θα χρησιμοποιηθεί σε ένα πρόβλημα (π.χ.

Διαβάστε περισσότερα

Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος

Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος Χιωτίδης Γεώργιος Τμήμα Λογιστικής και Χρηματοοικονομικής Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης

Διαβάστε περισσότερα

Αναγνώριση Προτύπων Ι

Αναγνώριση Προτύπων Ι Αναγνώριση Προτύπων Ι Ενότητα 3: Στοχαστικά Συστήματα Αν. Καθηγητής Δερματάς Ευάγγελος Τμήμα Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες

Διαβάστε περισσότερα

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Data Mining - Classification

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Data Mining - Classification ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ Data Mining - Classification Data Mining Ανακάλυψη προτύπων σε μεγάλο όγκο δεδομένων. Σαν πεδίο περιλαμβάνει κλάσεις εργασιών: Anomaly Detection:

Διαβάστε περισσότερα

Κεφ. 7: Συνήθεις διαφορικές εξισώσεις (ΣΔΕ) - προβλήματα αρχικών τιμών

Κεφ. 7: Συνήθεις διαφορικές εξισώσεις (ΣΔΕ) - προβλήματα αρχικών τιμών Κεφ. 7: Συνήθεις διαφορικές εξισώσεις (ΣΔΕ) - προβλήματα αρχικών τιμών 7. Εισαγωγή (ορισμός προβλήματος, αριθμητική ολοκλήρωση ΣΔΕ, αντικατάσταση ΣΔΕ τάξης n με n εξισώσεις ης τάξης) 7. Μέθοδος Euler 7.3

Διαβάστε περισσότερα

ΤΟΠΟΓΡΑΦΙΚΑ ΔΙΚΤΥΑ ΚΑΙ ΥΠΟΛΟΓΙΣΜΟΙ ΑΝΑΣΚΟΠΗΣΗ ΘΕΩΡΙΑΣ ΣΥΝΟΡΘΩΣΕΩΝ

ΤΟΠΟΓΡΑΦΙΚΑ ΔΙΚΤΥΑ ΚΑΙ ΥΠΟΛΟΓΙΣΜΟΙ ΑΝΑΣΚΟΠΗΣΗ ΘΕΩΡΙΑΣ ΣΥΝΟΡΘΩΣΕΩΝ ΤΟΠΟΓΡΑΦΙΚΑ ΔΙΚΤΥΑ ΚΑΙ ΥΠΟΛΟΓΙΣΜΟΙ ΑΝΑΣΚΟΠΗΣΗ ΘΕΩΡΙΑΣ ΣΥΝΟΡΘΩΣΕΩΝ Βασίλης Δ. Ανδριτσάνος Δρ. Αγρονόμος - Τοπογράφος Μηχανικός ΑΠΘ Επίκουρος Καθηγητής ΤΕΙ Αθήνας 3ο εξάμηνο http://eclass.teiath.gr Παρουσιάσεις,

Διαβάστε περισσότερα

ΑΝΤΑΓΩΝΙΣΤΙΚΗ ΜΑΘΗΣΗ ΔΙΚΤΥA LVQ και SOM. "Τεχνητά Νευρωνικά Δίκτυα" (Διαφάνειες), Α. Λύκας, Παν. Ιωαννίνων

ΑΝΤΑΓΩΝΙΣΤΙΚΗ ΜΑΘΗΣΗ ΔΙΚΤΥA LVQ και SOM. Τεχνητά Νευρωνικά Δίκτυα (Διαφάνειες), Α. Λύκας, Παν. Ιωαννίνων ΑΝΤΑΓΩΝΙΣΤΙΚΗ ΜΑΘΗΣΗ ΔΙΚΤΥA LVQ και SOM Μάθηση χωρίς επίβλεψη (unsupervised learning) Σύνολο εκπαίδευσης D={(x n )}, n=1,,n. x n =(x n1,, x nd ) T, δεν υπάρχουν τιμές-στόχοι t n. Προβλήματα μάθησης χωρίς

Διαβάστε περισσότερα

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2 Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας Version 2 1 ΔΕΔΟΜΕΝΑ Δεδομένα μπορούν να αποκτηθούν στα πλαίσια διαφόρων εφαρμογών, χρησιμοποιώντας, όπου είναι απαραίτητο, κατάλληλο εξοπλισμό. Μερικά παραδείγματα

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΔΙΚΤΥΑ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΔΙΚΤΥΑ ΘΕΜΑ 1 ο (2,5 μονάδες) ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΔΙΚΤΥΑ Τελικές εξετάσεις Πέμπτη 21 Ιουνίου 2012 16:30-19:30 Υποθέστε ότι θέλουμε

Διαβάστε περισσότερα

Κεφ. 6Β: Συνήθεις διαφορικές εξισώσεις (ΣΔΕ) - προβλήματα αρχικών τιμών

Κεφ. 6Β: Συνήθεις διαφορικές εξισώσεις (ΣΔΕ) - προβλήματα αρχικών τιμών Κεφ. 6Β: Συνήθεις διαφορικές εξισώσεις (ΣΔΕ) - προβλήματα αρχικών τιμών. Εισαγωγή (ορισμός προβλήματος, αριθμητική ολοκλήρωση ΣΔΕ, αντικατάσταση ΣΔΕ τάξης n με n εξισώσεις ης τάξης). Μέθοδος Euler 3. Μέθοδοι

Διαβάστε περισσότερα

Το μοντέλο Perceptron

Το μοντέλο Perceptron Το μοντέλο Perceptron Αποτελείται από έναν μόνο νευρώνα McCulloch-Pitts w j x x 1, x2,..., w x T 1 1 x 2 w 2 Σ u x n f(u) Άνυσμα Εισόδου s i x j x n w n -θ w w 1, w2,..., w n T Άνυσμα Βαρών 1 Το μοντέλο

Διαβάστε περισσότερα

ΙΑΤΡΙΚΗ ΑΠΕΙΚΟΝΙΣΗ & ΨΗΦΙΑΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΙΑΤΡΙΚΗΣ ΕΙΚΟΝΑΣ

ΙΑΤΡΙΚΗ ΑΠΕΙΚΟΝΙΣΗ & ΨΗΦΙΑΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΙΑΤΡΙΚΗΣ ΕΙΚΟΝΑΣ ΙΑΤΡΙΚΗ ΑΠΕΙΚΟΝΙΣΗ & ΨΗΦΙΑΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΙΑΤΡΙΚΗΣ ΕΙΚΟΝΑΣ ΔΡ. Γ. ΜΑΤΣΟΠΟΥΛΟΣ ΕΠ. ΚΑΘΗΓΗΤΗΣ ΣΧΟΛΗ ΗΛΕΚΤΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ Επεξεργασία Ιατρικών Εικόνων

Διαβάστε περισσότερα

Μεταπτυχιακό Πρόγραμμα Φυσικού Τμήματος «Υπολογιστική Φυσική» Θέμα εργασίας στο A Μέρος του μαθήματος «Προσομοίωση Χαοτικών Συστημάτων»

Μεταπτυχιακό Πρόγραμμα Φυσικού Τμήματος «Υπολογιστική Φυσική» Θέμα εργασίας στο A Μέρος του μαθήματος «Προσομοίωση Χαοτικών Συστημάτων» Μεταπτυχιακό Πρόγραμμα Φυσικού Τμήματος «Υπολογιστική Φυσική» Θέμα εργασίας στο A Μέρος του μαθήματος «Προσομοίωση Χαοτικών Συστημάτων» Οδηγίες: Σχετικά με την παράδοση της εργασίας θα πρέπει: Το κείμενο

Διαβάστε περισσότερα

ΠΡΟΒΛΗΜΑΤΑ ΔΥΟ ΔΙΑΣΤΑΣΕΩΝ

ΠΡΟΒΛΗΜΑΤΑ ΔΥΟ ΔΙΑΣΤΑΣΕΩΝ ΠΡΟΒΛΗΜΑΤΑ ΔΥΟ ΔΙΑΣΤΑΣΕΩΝ Η ανάλυση προβλημάτων δύο διαστάσεων με τη μέθοδο των Πεπερασμένων Στοιχείων περιλαμβάνει τα ίδια βήματα όπως και στα προβλήματα μιας διάστασης. Η ανάλυση γίνεται λίγο πιο πολύπλοκη

Διαβάστε περισσότερα

ΠΑΡΟΥΣΙΑΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ

ΠΑΡΟΥΣΙΑΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ ο Κεφάλαιο: Στατιστική ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΚΑΙ ΟΡΙΣΜΟΙ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ Πληθυσμός: Λέγεται ένα σύνολο στοιχείων που θέλουμε να εξετάσουμε με ένα ή περισσότερα χαρακτηριστικά. Μεταβλητές X: Ονομάζονται

Διαβάστε περισσότερα

Συνήθεις διαφορικές εξισώσεις προβλήματα οριακών τιμών

Συνήθεις διαφορικές εξισώσεις προβλήματα οριακών τιμών Συνήθεις διαφορικές εξισώσεις προβλήματα οριακών τιμών Οι παρούσες σημειώσεις αποτελούν βοήθημα στο μάθημα Αριθμητικές Μέθοδοι του 5 ου εξαμήνου του ΤΜΜ ημήτρης Βαλουγεώργης Καθηγητής Εργαστήριο Φυσικών

Διαβάστε περισσότερα

Μάθημα: Μηχανική Όραση

Μάθημα: Μηχανική Όραση Μάθημα: Μηχανική Όραση Εργασία 2: Advances in Digital Imaging and Computer Vision Ομάδα χρηστών 2 : Τσαγκαράκης Νίκος, Καραμήτρος Κώστας Εισαγωγή Σκοπός της άσκησης, είναι να εξοικειωθούμε με κάποιες βασικές

Διαβάστε περισσότερα

Ασκήσεις Φροντιστηρίου «Υπολογιστική Νοημοσύνη Ι» 4 o Φροντιστήριο

Ασκήσεις Φροντιστηρίου «Υπολογιστική Νοημοσύνη Ι» 4 o Φροντιστήριο Ασκήσεις Φροντιστηρίου 4 o Φροντιστήριο Πρόβλημα 1 ο Ο πίνακας συσχέτισης R x του διανύσματος εισόδου x( στον LMS αλγόριθμο 1 0.5 R x = ορίζεται ως: 0.5 1. Ορίστε το διάστημα των τιμών της παραμέτρου μάθησης

Διαβάστε περισσότερα

Ακαδηµαϊκό Έτος , Χειµερινό Εξάµηνο ιδάσκων Καθ.: Νίκος Τσαπατσούλης

Ακαδηµαϊκό Έτος , Χειµερινό Εξάµηνο ιδάσκων Καθ.: Νίκος Τσαπατσούλης ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΙΡΑΙΩΣ, ΤΜΗΜΑ Ι ΑΚΤΙΚΗΣ ΤΗΣ ΤΕΧΝΟΛΟΓΙΑΣ ΚΑΙ ΨΗΦΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ ΤΨΣ 50: ΨΗΦΙΑΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΕΙΚΟΝΑΣ Ακαδηµαϊκό Έτος 005 006, Χειµερινό Εξάµηνο Καθ.: Νίκος Τσαπατσούλης ΤΕΛΙΚΗ ΕΞΕΤΑΣΗ Η εξέταση

Διαβάστε περισσότερα

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ ΤΕΧΝΟΛΟΓΙΑΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΥΠΟΛΟΓΙΣΤΩΝ Εξαγωγή γεωγραφικής πληροφορίας από δεδομένα παρεχόμενα από χρήστες του

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΙΑΣ ΤΜΗΜΑ ΠΟΛΙΤΙΚΩΝ ΜΗΧΑΝΙΚΩΝ ΤΟΜΕΑΣ ΥΔΡΑΥΛΙΚΗΣ ΚΑΙ ΠΕΡΙΒΑΛΛΟΝΤΙΚΗΣ ΤΕΧΝΙΚΗΣ. Διάλεξη 3: Περιγραφή αριθμητικών μεθόδων (συνέχεια)

ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΙΑΣ ΤΜΗΜΑ ΠΟΛΙΤΙΚΩΝ ΜΗΧΑΝΙΚΩΝ ΤΟΜΕΑΣ ΥΔΡΑΥΛΙΚΗΣ ΚΑΙ ΠΕΡΙΒΑΛΛΟΝΤΙΚΗΣ ΤΕΧΝΙΚΗΣ. Διάλεξη 3: Περιγραφή αριθμητικών μεθόδων (συνέχεια) ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΙΑΣ ΤΜΗΜΑ ΠΟΛΙΤΙΚΩΝ ΜΗΧΑΝΙΚΩΝ ΤΟΜΕΑΣ ΥΔΡΑΥΛΙΚΗΣ ΚΑΙ ΠΕΡΙΒΑΛΛΟΝΤΙΚΗΣ ΤΕΧΝΙΚΗΣ Διάλεξη 3: Περιγραφή αριθμητικών μεθόδων (συνέχεια) Χειμερινό εξάμηνο 2008 Προηγούμενη παρουσίαση... Εξετάσαμε

Διαβάστε περισσότερα

Μια από τις σημαντικότερες δυσκολίες που συναντά ο φυσικός στη διάρκεια ενός πειράματος, είναι τα σφάλματα.

Μια από τις σημαντικότερες δυσκολίες που συναντά ο φυσικός στη διάρκεια ενός πειράματος, είναι τα σφάλματα. Εισαγωγή Μετρήσεις-Σφάλματα Πολλές φορές θα έχει τύχει να ακούσουμε τη λέξη πείραμα, είτε στο μάθημα είτε σε κάποια είδηση που αφορά τη Φυσική, τη Χημεία ή τη Βιολογία. Είναι όμως γενικώς παραδεκτό ότι

Διαβάστε περισσότερα

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2 Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας Verson ΧΑΡΤΟΓΡΑΦΗΣΗ ΤΟΥ ΧΩΡΟΥ ΤΩΝ ΤΑΞΙΝΟΜΗΤΩΝ Ταξινομητές Ταξινομητές συναρτ. διάκρισης Ταξινομητές επιφανειών απόφ. Παραμετρικοί ταξινομητές Μη παραμετρικοί

Διαβάστε περισσότερα

Κεφάλαιο 20. Ανακάλυψη Γνώσης σε Βάσεις δεδοµένων. Τεχνητή Νοηµοσύνη - Β' Έκδοση Ι. Βλαχάβας, Π. Κεφαλάς, Ν. Βασιλειάδης, Φ. Κόκκορας, Η.

Κεφάλαιο 20. Ανακάλυψη Γνώσης σε Βάσεις δεδοµένων. Τεχνητή Νοηµοσύνη - Β' Έκδοση Ι. Βλαχάβας, Π. Κεφαλάς, Ν. Βασιλειάδης, Φ. Κόκκορας, Η. Κεφάλαιο 20 Ανακάλυψη Γνώσης σε Βάσεις δεδοµένων Τεχνητή Νοηµοσύνη - Β' Έκδοση Ι. Βλαχάβας, Π. Κεφαλάς, Ν. Βασιλειάδης, Φ. Κόκκορας, Η. Σακελλαρίου Τεχνητή Νοηµοσύνη, B' Έκδοση - 1 - Ανακάλυψη Γνώσης σε

Διαβάστε περισσότερα

ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΣΕΡΡΩΝ ΣΧΟΛΗ ΤΕΧΝΟΛΟΓΙΚΩΝ ΕΦΑΡΜΟΓΩΝ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΠΛΗΡΟΦΟΡΙΚΗΣ ΤΕ. Πτυχιακή εργασία. Μπαδέκα Ευτυχία (AEM 1037)

ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΣΕΡΡΩΝ ΣΧΟΛΗ ΤΕΧΝΟΛΟΓΙΚΩΝ ΕΦΑΡΜΟΓΩΝ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΠΛΗΡΟΦΟΡΙΚΗΣ ΤΕ. Πτυχιακή εργασία. Μπαδέκα Ευτυχία (AEM 1037) ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΣΕΡΡΩΝ ΣΧΟΛΗ ΤΕΧΝΟΛΟΓΙΚΩΝ ΕΦΑΡΜΟΓΩΝ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΠΛΗΡΟΦΟΡΙΚΗΣ ΤΕ Πτυχιακή εργασία Μελέτη και υλοποίηση σε λογισμικό ανιχνευτών σημειακών χαρακτηριστικών από εικόνες (point

Διαβάστε περισσότερα

Κεφάλαιο 9. Έλεγχοι υποθέσεων

Κεφάλαιο 9. Έλεγχοι υποθέσεων Κεφάλαιο 9 Έλεγχοι υποθέσεων 9.1 Εισαγωγή Όταν παίρνουμε ένα ή περισσότερα τυχαία δείγμα από κανονικούς πληθυσμούς έχουμε τη δυνατότητα να υπολογίζουμε στατιστικά, όπως μέσους όρους, δειγματικές διασπορές

Διαβάστε περισσότερα

Κεφάλαιο 5. Το Συμπτωτικό Πολυώνυμο

Κεφάλαιο 5. Το Συμπτωτικό Πολυώνυμο Κεφάλαιο 5. Το Συμπτωτικό Πολυώνυμο Σύνοψη Στο κεφάλαιο αυτό παρουσιάζεται η ιδέα του συμπτωτικού πολυωνύμου, του πολυωνύμου, δηλαδή, που είναι του μικρότερου δυνατού βαθμού και που, για συγκεκριμένες,

Διαβάστε περισσότερα

Γ. Ν. Π Α Π Α Δ Α Κ Η Σ Μ Α Θ Η Μ Α Τ Ι Κ Ο Σ ( M S C ) ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΛΥΜΕΝΕΣ ΑΣΚΗΣΕΙΣ. ΠΡΟΓΡΑΜΜΑ: Σπουδές στις Φυσικές Επιστήμες

Γ. Ν. Π Α Π Α Δ Α Κ Η Σ Μ Α Θ Η Μ Α Τ Ι Κ Ο Σ ( M S C ) ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΛΥΜΕΝΕΣ ΑΣΚΗΣΕΙΣ. ΠΡΟΓΡΑΜΜΑ: Σπουδές στις Φυσικές Επιστήμες Γ. Ν. Π Α Π Α Δ Α Κ Η Σ Μ Α Θ Η Μ Α Τ Ι Κ Ο Σ ( M S C ) ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΛΥΜΕΝΕΣ ΑΣΚΗΣΕΙΣ ΠΡΟΓΡΑΜΜΑ: Σπουδές στις Φυσικές Επιστήμες ΘΕΜΑΤΙΚΗ ΕΝΟΤΗΤΑ: ΦΥΕ10 (Γενικά Μαθηματικά Ι) ΠΕΡΙΕΧΕΙ ΤΙΣ

Διαβάστε περισσότερα

Digital Image Processing

Digital Image Processing Digital Image Processing Χωρικό φιλτράρισμα Πέτρος Καρβέλης pkarvelis@gmail.com Images taken from: R. Gonzalez and R. Woods. Digital Image Processing, Prentice Hall, 008. Χωρικού Φιλτράρισμα Η μηχανική

Διαβάστε περισσότερα

Εξόρυξη Γνώσης από Βιολογικά εδομένα

Εξόρυξη Γνώσης από Βιολογικά εδομένα Παρουσίαση Διπλωματικής Εργασίας Εξόρυξη Γνώσης από Βιολογικά εδομένα Καρυπίδης Γεώργιος (Μ27/03) Επιβλέπων Καθηγητής: Ιωάννης Βλαχάβας MIS Πανεπιστήμιο Μακεδονίας Φεβρουάριος 2005 Εξόρυξη Γνώσης από Βιολογικά

Διαβάστε περισσότερα

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R, Επίκουρος Καθηγητής, Τομέας Μαθηματικών, Σχολή Εφαρμοσμένων Μαθηματικών και Φυσικών Επιστημών, Εθνικό Μετσόβιο Πολυτεχνείο. Περιεχόμενα Εισαγωγή στο

Διαβάστε περισσότερα

Ευφυής Προγραμματισμός

Ευφυής Προγραμματισμός Ευφυής Προγραμματισμός Ενότητα 10: Δημιουργία Βάσεων Κανόνων Από Δεδομένα-Προετοιμασία συνόλου δεδομένων Ιωάννης Χατζηλυγερούδης Πολυτεχνική Σχολή Τμήμα Μηχανικών Η/Υ & Πληροφορικής Δημιουργία Βάσεων Κανόνων

Διαβάστε περισσότερα

6-Aνίχνευση. Ακμών - Περιγράμματος

6-Aνίχνευση. Ακμών - Περιγράμματος 6-Aνίχνευση Ακμών - Περιγράμματος Ανίχνευση ακμών Μετατροπή 2 εικόνας σε σύνολο ακμών Εξαγωγή βασικών χαρακτηριστικών της εικόνας Πιο «συμπαγής» αναπαράσταση Ανίχνευση ακμών Στόχος: ανίχνευση ασυνεχειών

Διαβάστε περισσότερα

Συστήματα συντεταγμένων

Συστήματα συντεταγμένων Κεφάλαιο. Για να δημιουργήσουμε τρισδιάστατα αντικείμενα, που μπορούν να παρασταθούν στην οθόνη του υπολογιστή ως ένα σύνολο από γραμμές, επίπεδες πολυγωνικές επιφάνειες ή ακόμη και από ένα συνδυασμό από

Διαβάστε περισσότερα

Πανεπιστήμιο Κύπρου Πολυτεχνική Σχολή

Πανεπιστήμιο Κύπρου Πολυτεχνική Σχολή Πανεπιστήμιο Κύπρου Πολυτεχνική Σχολή Τμήμα Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών ΗΜΜΥ 795: ΑΝΑΓΝΩΡΙΣΗ ΠΡΟΤΥΠΩΝ Ακαδημαϊκό έτος 2010-11 Χειμερινό Εξάμηνο Practice final exam 1. Έστω ότι για

Διαβάστε περισσότερα

Η ΜΕΘΟΔΟΣ PCA (Principle Component Analysis)

Η ΜΕΘΟΔΟΣ PCA (Principle Component Analysis) Η ΜΕΘΟΔΟΣ PCA (Principle Component Analysis) Η μέθοδος PCA (Ανάλυση Κύριων Συνιστωσών), αποτελεί μία γραμμική μέθοδο συμπίεσης Δεδομένων η οποία συνίσταται από τον επαναπροσδιορισμό των συντεταγμένων ενός

Διαβάστε περισσότερα

Παρουσίαση 2 η : Αρχές εκτίμησης παραμέτρων Μέρος 1 ο

Παρουσίαση 2 η : Αρχές εκτίμησης παραμέτρων Μέρος 1 ο Εφαρμογές Ανάλυσης Σήματος στη Γεωδαισία Παρουσίαση η : Αρχές εκτίμησης παραμέτρων Μέρος ο Βασίλειος Δ. Ανδριτσάνος Αναπληρωτής Καθηγητής Γεώργιος Χλούπης Επίκουρος Καθηγητής Τμήμα Μηχανικών Τοπογραφίας

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 3. Περιγραφή της Μεθόδου ΠΕΡΙΓΡΑΦΗ ΤΗΣ ΜΕΘΟΔΟΥ

ΚΕΦΑΛΑΙΟ 3. Περιγραφή της Μεθόδου ΠΕΡΙΓΡΑΦΗ ΤΗΣ ΜΕΘΟΔΟΥ ΚΕΦΑΛΑΙΟ 3 Περιγραφή της Μεθόδου Το αντικείμενο αυτής της εργασίας είναι η χρήση μιας μεθόδου προσέγγισης συναρτήσεων που έχει προταθεί από τον hen-ha huang και ονομάζεται Ασαφώς Σταθμισμένη Παλινδρόμηση

Διαβάστε περισσότερα

Βασίλειος Μαχαιράς Πολιτικός Μηχανικός Ph.D.

Βασίλειος Μαχαιράς Πολιτικός Μηχανικός Ph.D. Βασίλειος Μαχαιράς Πολιτικός Μηχανικός Ph.D. Μη γραμμικός προγραμματισμός: μέθοδοι μονοδιάστατης ελαχιστοποίησης Πανεπιστήμιο Θεσσαλίας Σχολή Θετικών Επιστημών ΤμήμαΠληροφορικής Διάλεξη 6 η /2017 Τι παρουσιάστηκε

Διαβάστε περισσότερα

Μ Α Θ Η Μ Α Τ Α Γ Λ Υ Κ Ε Ι Ο Υ

Μ Α Θ Η Μ Α Τ Α Γ Λ Υ Κ Ε Ι Ο Υ Μ Α Θ Η Μ Α Τ Α Γ Λ Υ Κ Ε Ι Ο Υ ΜΑΘΗΜΑΤΙΚΑ ΠΡΟΣΑΝΑΤΟΛΙΣΜΟΥ ΘΕΤΙΚΩΝ ΣΠΟΥΔΩΝ ΚΑΙ ΣΠΟΥΔΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΠΛΗΡΟΦΟΡΙΚΗΣ (Α ΜΕΡΟΣ: ΣΥΝΑΡΤΗΣΕΙΣ) Επιμέλεια: Καραγιάννης Ιωάννης, Σχολικός Σύμβουλος Μαθηματικών

Διαβάστε περισσότερα

Ιεραρχική αναλυση αποφασεων Analytic hierarchy process (AHP)

Ιεραρχική αναλυση αποφασεων Analytic hierarchy process (AHP) Ιεραρχική αναλυση αποφασεων Analytic hierarchy process (AHP) Εισαγωγή Παρουσιάστηκε από τον Thomas L. Saaty τη δεκαετία του 70 Μεθοδολογία που εφαρμόζεται στην περιοχή των Multicriteria Problems Δίνει

Διαβάστε περισσότερα

Κεφάλαιο 8. Οπτικοποίηση Απαλοιφή

Κεφάλαιο 8. Οπτικοποίηση Απαλοιφή Κεφάλαιο 8. Οπτικοποίηση Απαλοιφή Oι οπτικές επιδράσεις, που μπορεί να προκαλέσει μια εικόνα στους χρήστες, αποτελούν ένα από τα σπουδαιότερα αποτελέσματα των λειτουργιών γραφικών με Η/Υ. Τον όρο της οπτικοποίησης

Διαβάστε περισσότερα

Υπολογιστικό Πρόβληµα

Υπολογιστικό Πρόβληµα Υπολογιστικό Πρόβληµα Μετασχηµατισµός δεδοµένων εισόδου σε δεδοµένα εξόδου. Δοµή δεδοµένων εισόδου (έγκυρο στιγµιότυπο). Δοµή και ιδιότητες δεδοµένων εξόδου (απάντηση ή λύση). Τυπικά: διµελής σχέση στις

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 18. 18 Μηχανική Μάθηση

ΚΕΦΑΛΑΙΟ 18. 18 Μηχανική Μάθηση ΚΕΦΑΛΑΙΟ 18 18 Μηχανική Μάθηση Ένα φυσικό ή τεχνητό σύστηµα επεξεργασίας πληροφορίας συµπεριλαµβανοµένων εκείνων µε δυνατότητες αντίληψης, µάθησης, συλλογισµού, λήψης απόφασης, επικοινωνίας και δράσης

Διαβάστε περισσότερα

E[ (x- ) ]= trace[(x-x)(x- ) ]

E[ (x- ) ]= trace[(x-x)(x- ) ] 1 ΦΙΛΤΡΟ KALMAN ΔΙΑΚΡΙΤΟΥ ΧΡΟΝΟΥ Σε αυτό το μέρος της πτυχιακής θα ασχοληθούμε λεπτομερώς με το φίλτρο kalman και θα δούμε μια καινούρια έκδοση του φίλτρου πάνω στην εφαρμογή της γραμμικής εκτίμησης διακριτού

Διαβάστε περισσότερα

Σήματα και Συστήματα. Διάλεξη 1: Σήματα Συνεχούς Χρόνου. Δρ. Μιχάλης Παρασκευάς Επίκουρος Καθηγητής

Σήματα και Συστήματα. Διάλεξη 1: Σήματα Συνεχούς Χρόνου. Δρ. Μιχάλης Παρασκευάς Επίκουρος Καθηγητής Σήματα και Συστήματα Διάλεξη 1: Σήματα Συνεχούς Χρόνου Δρ. Μιχάλης Παρασκευάς Επίκουρος Καθηγητής 1 Εισαγωγή στα Σήματα 1. Σκοποί της Θεωρίας Σημάτων 2. Κατηγορίες Σημάτων 3. Χαρακτηριστικές Παράμετροι

Διαβάστε περισσότερα

ΑΝΑΓΝΩΡΙΣΗ ΠΡΟΤΥΠΩΝ. ΕΝΟΤΗΤΑ: Γραμμικές Συναρτήσεις Διάκρισης. ΔΙΔΑΣΚΟΝΤΕΣ: Βλάμος Π. Αυλωνίτης Μ. ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ

ΑΝΑΓΝΩΡΙΣΗ ΠΡΟΤΥΠΩΝ. ΕΝΟΤΗΤΑ: Γραμμικές Συναρτήσεις Διάκρισης. ΔΙΔΑΣΚΟΝΤΕΣ: Βλάμος Π. Αυλωνίτης Μ. ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΑΝΑΓΝΩΡΙΣΗ ΠΡΟΤΥΠΩΝ ΕΝΟΤΗΤΑ: Γραμμικές Συναρτήσεις Διάκρισης ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΔΙΔΑΣΚΟΝΤΕΣ: Βλάμος Π. Αυλωνίτης Μ. Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ Ερωτήσεις πολλαπλής επιλογής Συντάκτης: Δημήτριος Κρέτσης 1. Ο κλάδος της περιγραφικής Στατιστικής: α. Ασχολείται με την επεξεργασία των δεδομένων και την ανάλυση

Διαβάστε περισσότερα

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ Τι κάνει η Στατιστική Στατιστική (Statistics) Μετατρέπει αριθμητικά δεδομένα σε χρήσιμη πληροφορία. Εξάγει συμπεράσματα για έναν πληθυσμό. Τις περισσότερες

Διαβάστε περισσότερα

Διπλωματική Εργασία: «Συγκριτική Μελέτη Μηχανισμών Εκτίμησης Ελλιπούς Πληροφορίας σε Ασύρματα Δίκτυα Αισθητήρων»

Διπλωματική Εργασία: «Συγκριτική Μελέτη Μηχανισμών Εκτίμησης Ελλιπούς Πληροφορίας σε Ασύρματα Δίκτυα Αισθητήρων» Τμήμα Πληροφορικής και Τηλεπικοινωνιών Πρόγραμμα Μεταπτυχιακών Σπουδών Διπλωματική Εργασία: «Συγκριτική Μελέτη Μηχανισμών Εκτίμησης Ελλιπούς Πληροφορίας σε Ασύρματα Δίκτυα Αισθητήρων» Αργυροπούλου Αιμιλία

Διαβάστε περισσότερα

Ενότητα 2: Οι Θεµελιώδεις Αρχές των Ψηφιακών Εικόνων

Ενότητα 2: Οι Θεµελιώδεις Αρχές των Ψηφιακών Εικόνων Ενότητα 2: Οι Θεµελιώδεις Αρχές των Ψηφιακών Εικόνων Δειγµατοληψία και Κβαντισµός: Μια εικόνα (µπορεί να) είναι συνεχής τόσο ως προς τις συντεταγµένες x, y όσο και ως προς το πλάτος. Για να τη µετατρέψουµε

Διαβάστε περισσότερα

iii ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος

iii ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος iii ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος xi 1 Αντικείμενα των Πιθανοτήτων και της Στατιστικής 1 1.1 Πιθανοτικά Πρότυπα και Αντικείμενο των Πιθανοτήτων, 1 1.2 Αντικείμενο της Στατιστικής, 3 1.3 Ο Ρόλος των Πιθανοτήτων

Διαβάστε περισσότερα

Ψηφιακή Επεξεργασία και Ανάλυση Εικόνας Ενότητα 1 η : Εισαγωγή. Καθ. Κωνσταντίνος Μπερμπερίδης Πολυτεχνική Σχολή Μηχανικών Η/Υ & Πληροφορικής

Ψηφιακή Επεξεργασία και Ανάλυση Εικόνας Ενότητα 1 η : Εισαγωγή. Καθ. Κωνσταντίνος Μπερμπερίδης Πολυτεχνική Σχολή Μηχανικών Η/Υ & Πληροφορικής Ψηφιακή Επεξεργασία και Ανάλυση Εικόνας Ενότητα 1 η : Εισαγωγή Καθ. Κωνσταντίνος Μπερμπερίδης Πολυτεχνική Σχολή Μηχανικών Η/Υ & Πληροφορικής Σκοποί ενότητας Βασικά στοιχεία της ψηφιακής επεξεργασίας και

Διαβάστε περισσότερα

ΕΥΦΥΗΣ ΕΛΕΓΧΟΣ. Ενότητα #12: Εισαγωγή στα Nευρωνικά Δίκτυα. Αναστάσιος Ντούνης Τμήμα Μηχανικών Αυτοματισμού Τ.Ε.

ΕΥΦΥΗΣ ΕΛΕΓΧΟΣ. Ενότητα #12: Εισαγωγή στα Nευρωνικά Δίκτυα. Αναστάσιος Ντούνης Τμήμα Μηχανικών Αυτοματισμού Τ.Ε. ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Ανώτατο Εκπαιδευτικό Ίδρυμα Πειραιά Τεχνολογικού Τομέα ΕΥΦΥΗΣ ΕΛΕΓΧΟΣ Ενότητα #12: Εισαγωγή στα Nευρωνικά Δίκτυα Αναστάσιος Ντούνης Τμήμα Μηχανικών Αυτοματισμού Τ.Ε. Άδειες Χρήσης Το

Διαβάστε περισσότερα

Γ Γυμνασίου: Οδηγίες Γραπτής Εργασίας και Σεμιναρίων. Επιμέλεια Καραβλίδης Αλέξανδρος. Πίνακας περιεχομένων

Γ Γυμνασίου: Οδηγίες Γραπτής Εργασίας και Σεμιναρίων. Επιμέλεια Καραβλίδης Αλέξανδρος. Πίνακας περιεχομένων Γ Γυμνασίου: Οδηγίες Γραπτής Εργασίας και Σεμιναρίων. Πίνακας περιεχομένων Τίτλος της έρευνας (title)... 2 Περιγραφή του προβλήματος (Statement of the problem)... 2 Περιγραφή του σκοπού της έρευνας (statement

Διαβάστε περισσότερα

ΑΣΚΗΣΗ 3 ΒΕΛΤΙΩΣΗ ΕΙΚΟΝΑΣ ΜΕΛΕΤΗ ΙΣΤΟΓΡΑΜΜΑΤΟΣ. ( ) 1, αν Ι(i,j)=k hk ( ), διαφορετικά

ΑΣΚΗΣΗ 3 ΒΕΛΤΙΩΣΗ ΕΙΚΟΝΑΣ ΜΕΛΕΤΗ ΙΣΤΟΓΡΑΜΜΑΤΟΣ. ( ) 1, αν Ι(i,j)=k hk ( ), διαφορετικά ΑΣΚΗΣΗ 3 ΒΕΛΤΙΩΣΗ ΕΙΚΟΝΑΣ ΜΕΛΕΤΗ ΙΣΤΟΓΡΑΜΜΑΤΟΣ Αντικείμενο: Εξαγωγή ιστογράμματος εικόνας, απλοί μετασχηματισμοί με αυτό, ισοστάθμιση ιστογράμματος. Εφαρμογή βασικών παραθύρων με την βοήθεια του ΜΑΤLAB

Διαβάστε περισσότερα