R n R 2. x 2. x 1. x: συντεταγµένες του z



Σχετικά έγγραφα
Τεχνικές Μείωσης Διαστάσεων. Ειδικά θέματα ψηφιακής επεξεργασίας σήματος και εικόνας Σ. Φωτόπουλος- Α. Μακεδόνας

Αναγνώριση Προτύπων. 27 Ιουνίου 2008 Ημερίδα για το ΔΠΜΣ - Ηλεκτρονική και Επεξεργασία της Πληροφορίας Τμήμα Φυσικής Πανεπιστήμιο Πάτρας

Εισαγωγή Αλγόριθµοι Αποτελέσµατα Επίλογος Ορισµός του Προβλήµατος Ευθυγράµµιση : Εύρεση ενός γεωµετρικού µετασχηµατισµού που ϕέρνει κοντά δύο τρισδιάσ

Ειδικές Επιστηµονικές Εργασίες

Ζητήματα ηήμ με τα δεδομένα

Διπλωματική Εργασία: «Συγκριτική Μελέτη Μηχανισμών Εκτίμησης Ελλιπούς Πληροφορίας σε Ασύρματα Δίκτυα Αισθητήρων»

Ενότητα 2: Οι Θεµελιώδεις Αρχές των Ψηφιακών Εικόνων

Μέθοδοι Μηχανών Μάθησης για Ευφυή Αναγνώριση και ιάγνωση Ιατρικών εδοµένων

HMY 795: Αναγνώριση Προτύπων


Μεταπτυχιακό Πρόγραμμα «Γεωχωρικές Τεχνολογίες» Ψηφιακή Επεξεργασία Εικόνας. Εισηγητής Αναστάσιος Κεσίδης

Μετάδοση Πολυμεσικών Υπηρεσιών Ψηφιακή Τηλεόραση

Υπολογιστικό Πρόβληµα

ΚΕΦΑΛΑΙΟ 4 ΑΡΙΘΜΗΤΙΚΕΣ ΜΕΘΟ ΟΙ ΕΥΡΕΣΗΣ ΠΡΑΓΜΑΤΙΚΩΝ Ι ΙΟΤΙΜΩΝ. 4.1 Γραµµικοί µετασχηµατισµοί-ιδιοτιµές-ιδιοδιανύσµατα

Ειδικά Θέµατα Υπολογιστικής Όρασης & Γραφικής. Εµµανουήλ Ζ. Ψαράκης & Αθανάσιος Τσακαλίδης Πολυτεχνική Σχολή Τµήµα Μηχανικών Η/Υ & Πληροφορικής

Πανεπιστήμιο Θεσσαλίας. Πολυτεχνική Σχολή ΘΕΜΑΤΙΚΗ : ΨΗΦΙΑΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΕΙΚΟΝΑΣ

Εισαγωγικές Έννοιες. ημήτρης Φωτάκης. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Εθνικό Μετσόβιο Πολυτεχνείο

Αναγνώριση Προτύπων Ι

14 η εβδομάδα (26/01/2017) Έγιναν οι ασκήσεις 28, 29 και 30. Έγινε επανάληψη στη Θεωρία Καμπυλών και στη Θεωρία Επιφανειών.

HMY 795: Αναγνώριση Προτύπων

Εθνικό Μετσόβιο Πολυτεχνείο Σχολή Εφαρμοσμένων Μαθηματικών και Φυσικών Επιστημών Γραμμικές και Μη-γραμμικές Μέθοδοι Αναγωγής Δεδομένων Μεγάλης Κλίμακα

Μέθοδοι πολυδιάστατης ελαχιστοποίησης

Η ΜΕΘΟΔΟΣ PCA (Principle Component Analysis)

ΑΠΟΤΥΠΩΣΕΙΣ - ΧΑΡΑΞΕΙΣ ΕΙΣΑΓΩΓΗ

ΟΜΑΔΕΣ. Δημιουργία Ομάδων

Παράλληλοι Αλγόριθμοι: Ανάλυση Εικόνας και Υπολογιστική Γεωμετρία. Πέτρος Ποτίκας CoReLab 4/5/2006

Μηχανολογικό Σχέδιο με τη Βοήθεια Υπολογιστή. Αφφινικοί Μετασχηματισμοί Αναπαράσταση Γεωμετρικών Μορφών

Επίλυση γεωµετρικών περιορισµών σε µικρά µόρια µε αλγεβρικές µεθόδους

D. Lowe, Distinctive Image Features from Scale-Invariant Keypoints, International Journal of Computer Vision, 60(2):91-110, 2004.

Ραδιομετρική Ενίσχυση - Χωρική Επεξεργασία Δορυφορικών Εικόνων

Gemini, FastMap, Applications. Εαρινό Εξάμηνο Τμήμα Μηχανικών Η/Υ και Πληροϕορικής Πολυτεχνική Σχολή, Πανεπιστήμιο Πατρών

ΣΧΕΔΙΑΣΗ ΜΗΧΑΝΟΛΟΓΙΚΩΝ ΚΑΤΑΣΚΕΥΩΝ ΜΕ Η/Υ (Computer Aided Design)

ΤΟΠΟΓΡΑΦΙΚΑ ΔΙΚΤΥΑ ΚΑΙ ΥΠΟΛΟΓΙΣΜΟΙ ΑΝΑΣΚΟΠΗΣΗ ΘΕΩΡΙΑΣ ΣΥΝΟΡΘΩΣΕΩΝ

4.3. Γραµµικοί ταξινοµητές

ΑΡΧΙΜΗ ΗΣ - ΕΝΙΣΧΥΣΗ ΕΡΕΥΝΗΤΙΚΩΝ ΟΜΑ ΩΝ ΣΤΑ ΤΕΙ. Υποέργο: «Ανάκτηση και προστασία πνευµατικών δικαιωµάτων σε δεδοµένα

ΘΕΩΡΗΤΙΚΗ ΑΣΚΗΣΗ Γραφικές παραστάσεις, κλίση καµπύλης Μέθοδος των ελαχίστων τετραγώνων

Οπτική Μοντελοποίηση Ανθρώπινου Προσώπου με Εφαρμογές σε Αναγνώριση

Ημερολόγιο μαθήματος

ΚΑΤΑΓΡΑΦΗ ΤΟΥ ΙΧΝΟΥΣ ΤΗΣ ΟΠΤΙΚΗΣ ΑΝΑΖΗΤΗΣΗΣ: ΜΙΑ ΜΕΘΟΔΟΣ ΔΙΕΡΕΥΝΗΣΗΣ ΤΗΣ ΕΠΙΛΕΚΤΙΚΟΤΗΤΑΣ ΤΗΣ ΟΠΗΣ ΩΣ ΒΑΣΙΚΟΥ ΧΑΡΑΚΤΗΡΙΣΤΙΚΟΥ ΤΟΥ ΣΧΗΜΑΤΟΣ

Ανακατασκευή εικόνας από προβολές

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥ ΩΝ ΣΤΗΝ «ΠΛΗΡΟΦΟΡΙΚΗ» ΘΕΜΑΤΙΚΗ ΕΝΟΤΗΤΑ : ΠΛΗ12 «ΜΑΘΗΜΑΤΙΚΑ Ι» Επαναληπτική Τελική Εξέταση 16 Ιουλίου 2003

ΤΟΜΟΣ Α : Συμβολικός Προγραμματισμός

MPEG-7 : Περιγραφή πολυμεσικού περιεχομένου

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2

Τηλεπισκόπηση - Φωτοερμηνεία

Συμπίεση Πληροφορίας Πλαισίου με Ανάλυση Κύριων Συνιστωσών

2. Η τιµή της εκτιµήσεως της µεταβλητής στα σηµεία όπου υπάρχουν µετρήσεις να είναι η ίδια µε τη

Εισαγωγή στον Προγραµµατισµό. Ανάλυση (ή Επιστηµονικοί8 Υπολογισµοί)

Ψηφιακή Επεξεργασία Εικόνας. Σ. Φωτόπουλος ΨΕΕ

Στ Τάξη. Α/Α Μαθηματικό περιεχόμενο Δείκτες Επιτυχίας Ώρες Διδ. 1 ENOTHTA 1

Το µαθηµατικό µοντέλο του Υδρονοµέα

Κλασικη ιαφορικη Γεωµετρια

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΤΜΗΜΑ ΔΙΑΧΕΙΡΙΣΗΣ ΠΕΡΙΒΑΛΛΟΝΤΟΣ ΚΑΙ ΦΥΣΙΚΩΝ ΠΟΡΩΝ ΕΡΓΑΣΤΗΡΙΑΚΕΣ ΑΣΚΗΣΕΙΣ ΠΕΡΙΒΑΛΛΟΝΤΙΚΗΣ ΓΕΩΛΟΓΙΑΣ

Μεταπτυχιακό Πρόγραμμα «Γεωχωρικές Τεχνολογίες» Ψηφιακή Επεξεργασία Εικόνας. Εισηγητής Αναστάσιος Κεσίδης

Θέμα Α Α1. Θεωρία (απόδειξη), σελίδα 253 σχολικού βιβλίου. Έστω x1,

Μεταπτυχιακό Πρόγραμμα «Γεωχωρικές Τεχνολογίες» Ψηφιακή Επεξεργασία Εικόνας. Εισηγητής Αναστάσιος Κεσίδης

Αριθµητική Ανάλυση 1 εκεµβρίου / 43

Μοντελοποίηση προβληµάτων

Αναγνώριση Προτύπων Ι

Μεταπτυχιακό Πρόγραμμα «Γεωχωρικές Τεχνολογίες» Ψηφιακή Επεξεργασία Εικόνας. Εισηγητής Αναστάσιος Κεσίδης

Ψηφιακή Επεξεργασία Εικόνας Γεωμετρικές Διορθώσεις

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥ ΩΝ ΤΜΗΜΑΤΟΣ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ

Η γνώση του αναγλύφου

Χρονοσειρές - Μάθημα 9 Aνάλυση χρονοσειρών και δυναμικά συστήματα

Θεωρία μετασχηματισμών

ΣΗΜΑΤΑ ΚΑΙ ΣΥΣΤΗΜΑΤΑ. Εισαγωγή στα Σήµατα Εισαγωγή στα Συστήµατα Ανάπτυγµα - Μετασχηµατισµός Fourier Μετασχηµατισµός Z

Αντικείμενα και γεωμετρικοί μετασχηματισμοί

ΚΙΝΗΣΗ ΣΤΟ ΧΩΡΟ ΚΑΙ ΕΞΕΛΙΞΗ ΣΤΟ ΧΩΡΟ-ΧΡΟΝΟ

ΠΑΡΟΥΣΙΑΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ

Απαραίτητες αφού 3Δ αντικείμενα απεικονίζονται σε 2Δ συσκευές. Θέση παρατηρητή. 3Δ Μετασχ/σμός Παρατήρησης

Μάθημα 9 ο. Κατάτμηση Εικόνας ΤΜΗΥΠ / ΕΕΣΤ 1

Γεωγραφικά Πληροφοριακά Συστήµατα (Geographical Information Systems GIS)

ΠΡΟΓΡΑΜΜΑ ΣΠΟΥ ΩΝ ΠΛΗΡΟΦΟΡΙΚΗΣ ΜΑΘΗΜΑΤΙΚΑ Ι ΕΡΓΑΣΙΑ 6 ΛΥΣΕΙΣ

Χρήστος Ι. Σχοινάς Αν. Καθηγητής ΔΠΘ. Συμπληρωματικές σημειώσεις για το μάθημα: «Επιχειρησιακή Έρευνα ΙΙ»

HMY 799 1: Αναγνώριση Συστημάτων

ΔΙΑΧΩΡΙΣΜΟΣ ΚΑΙ ΤΑΞΙΝΟΜΗΣΗ ΚΡΗΤΙΚΟΥ ΚΑΤΕΡΙΝΑ NΙΚΑΚΗ ΚΑΤΕΡΙΝΑ NΙΚΟΛΑΪΔΟΥ ΧΡΥΣΑ

Ένα Κατανεμημένο Πλαίσιο Μη Γραμμικής Μείωσης Διαστάσεων

Διαχείριση Υδατικών Πόρων Πολυκριτηριακή ανάλυση

Διάνυσμα του Plücker

ΣΤΟΙΧΕΙΑ ΙΑΝΥΣΜΑΤΙΚΟΥ ΛΟΓΙΣΜΟΥ

ΕΡΓΑΣΤΗΡΙΟ ΠΟΛΥΜΕΣΩΝ ΚΑΙ ΓΡΑΦΙΚΩΝ

ιαχείριση και Ανάκτηση Εικόνας µε χρήση Οµοιότητας Γράφων (WW-test)

Ειδικά Θέµατα Υπολογιστικής Όρασης & Γραφικής. Εµµανουήλ Ζ. Ψαράκης & Αθανάσιος Τσακαλίδης Πολυτεχνική Σχολή Τµήµα Μηχανικών Η/Υ & Πληροφορικής

Μάθημα 10 ο. Περιγραφή Σχήματος ΤΜΗΥΠ / ΕΕΣΤ 1

Τηλεπισκόπηση - Φωτοερμηνεία

Μέθοδοι Μηχανικής Μάθησης στην επεξεργασία Τηλεπισκοπικών Δεδομένων. Δρ. Ε. Χάρου

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2

Σημαντικές χρονολογίες στην εξέλιξη της Υπολογιστικής Τομογραφίας

ΧΡΗΣΗ ΝΕΩΝ ΟΠΤΙΚΩΝ ΚΑΙ ΨΗΦΙΑΚΩΝ ΜΕΘΟΔΩΝ ΓΙΑ ΤΗΝ ΑΝΤΙΓΡΑΦΗ ΤΡΙΣΔΙΑΣΤΑΤΩΝ ΑΝΤΙΚΕΙΜΕΝΩΝ ΣΤΕΦΑΝΙΑ ΧΛΟΥΒΕΡΑΚΗ 2014

LOGO. Εξόρυξη Δεδομένων. Δειγματοληψία. Πίνακες συνάφειας. Καμπύλες ROC και AUC. Σύγκριση Μεθόδων Εξόρυξης

ΠΡΟΒΛΗΜΑΤΑ ΔΥΟ ΔΙΑΣΤΑΣΕΩΝ

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ

Αναγνώριση Προτύπων (Pattern Recognition) Μπεϋζιανή Θεωρία Αποφάσεων (Bayesian Decision Theory) Π. Τσακαλίδης

Σχεδίαση με Ηλεκτρονικούς Υπολογιστές

ΘΕΩΡΙΑ Β ΓΥΜΝΑΣΙΟΥ. Μια παράσταση που περιέχει πράξεις με μεταβλητές (γράμματα) και αριθμούς καλείται αλγεβρική, όπως για παράδειγμα η : 2x+3y-8

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ Τµήµα Εφαρµοσµένης Πληροφορικής

Στην ουσία η Φωτογραµµετρία: Χ, Υ, Ζ σηµείων Γραµµικό σχέδιο Εικονιστικό προϊόν

Η διαδικασία Παραγωγής Συνθετικής Εικόνας (Rendering)

Ασκήσεις. Κεφάλαιο 6. a = a 0 + x 1 b 1 + x 2 b 2 + x 3 b 3, όπου b i = a i a 0, i = 1, 2, 3, P 2 = {(x, y, z) R 3 : x 2y + 3z = 2}.

Πανεπιστήμιο Κύπρου Πολυτεχνική Σχολή

Transcript:

Αναγνώριση Προσώπου µε Σύγκριση Υπερεπιφανειών Θανάσης Ζάγουρας.Π.Μ.Σ Η.Ε.Π, Τµήµα Φυσικής, Πανεπιστήµιο Πατρών Επιβλέποντες: Σπ. Φωτόπουλος Γ. Οικονόµου

Ανάλυση Εικόνων Προσώπου Πεδία Αναγνώρισης Προτύπων Εφαρµογές Εντοπισµός Προσώπου Αναγνώριση Προσώπου Αναγνώριση Εκφράσεων Προσώπου αυτοµατοποιηµένη επιτήρηση πλήθους έλεγχος πρόσβασης αναγνώριση φωτογραφιών κακοποιών αναδηµιουργία προσώπου σχεδιασµός ανθρώπινης διεπαφής υπολογιστή επικοινωνία πολυµέσων διαχείριση βάσεων δεδοµένων εικόνας.π.μ.σ Ηλεκτρονική και Επεξεργασία της Πληροφορίας 2

Μέθοδοι Ανάλυσης Εικόνων Αναγνώριση Προσώπου Εκµάθηση Μηχανών Αναγνώριση βάσει Μοντέλου Αναγνώριση βάσει Εµφάνισης ή Εκµάθησης Εκµάθηση Υπερεπιφάνειας και Μείωση ιαστάσεων Γραµµική Μείωση ιαστάσεων Μη Γραµµική Μείωση ιαστάσεων Αναγνώριση βάσει Μοντέλου Εξαγωγή βιοµετρικών χαρακτηριστικών, ακµές, περίγραµµα προσώπου, κ.α. υσκολίες λόγω φύλου, ηλικίας, φωτισµού Μέτρια απόδοση Αναγνώριση βάσει Εµφάνισης ή Εκµάθησης Εκµάθηση Μηχανών ANN (Artificial Neural Networks), SVM (Support Vector Machine) Ικανοποιητικό για εικόνες σταθερής θέσης, ανεπαρκείς για τυχαίες θέσεις Εκµάθηση Υπερεπιφάνειας και Μείωση ιαστάσεων Γραµµική Μείωση (PCA, MDS, LDA) - Αποτυγχάνει για µη γραµµικά δεδοµένα Μη Γραµµική Μείωση (LLE, ISOMAP, Laplacian Eigenmaps) - Πολυπλοκότητα.Π.Μ.Σ Ηλεκτρονική και Επεξεργασία της Πληροφορίας 3

Υπερεπιφάνεια (Manifold) Κάθε εικόνα nxn pixel µπορεί να αναπαρασταθεί στον χώρο R D (D=nxn) ως ένα διάνυσµα χαρακτηριστικών εικόνα 64x64 4096 χαρακτηριστικά σηµείο 4096-διάστατο χώρο δηµιουργία υπερεπιφάνειας R n M z Υπερεπιφάνεια: Το σύνολο των σηµείων στον R D χώρο ο οποίος είναι τοπικά ευκλείδειος Αποτελείται συνήθως από µεγάλο αριθµό σηµείων Κάθε υπόχωρος που σε µικρή κλίµακα ή τοπικά είναι επίπεδος, µπορεί να θεωρηθεί υπερεπιφάνεια R 2 x 2 x x: συντεταγµένες του z Στόχος: η µείωση των διαστάσεων της υπερεπιφάνειας σε χώρο χαµηλής διαστατικότητας (πχ, από R D σε R 2 ) x 1.Π.Μ.Σ Ηλεκτρονική και Επεξεργασία της Πληροφορίας 4

Μείωση ιαστάσεων Ανάγκη ανάλυσης ποσοτήτων µε δεδοµένα πολλών µεταβλητών Εικόνες Προσώπου Κυµατοµορφές Οµιλίας Κλιµατολογικά Πρότυπα Γονιδιακές Κατανοµές Λόγοι Μείωσης ιαστάσεων Αποφυγή της κατάρας της διαστατικότητας Η στατιστική ανάλυση συχνά αποτυγχάνει Πολύπλοκα όρια ταξινόµησης Οπτιποκοίηση δεδοµένων σε 2D, 3D Συµπίεση Καλύτερη αναγνώριση ιαστάσεις µε αναγνωρίσιµο σχήµα υπερεπιφάνειας Αυτόµατη εξαγωγή σηµαντικών χαρακτηριστικών Εξοικονόµηση χώρου αποθήκευσης και υπολογιστικού χρόνου.π.μ.σ Ηλεκτρονική και Επεξεργασία της Πληροφορίας 5

Μέθοδοι Μείωσης ιαστάσεων Η Ανάλυση Κύριων Συνιστωσών (Principal Component Analysis - PCA) υπολογίζει τον χώρο ενσωµάτωσης όπου διατηρείται η µέγιστη διασπορά των δεδοµένων Η Πολυδιάστατη Κλιµάκωση (Multidimensional Scaling - MDS) υπολογίζει τον χώρο ενσωµάτωσης που διατηρούνται βέλτιστα οι αποστάσεις µεταξύ των σηµείων Η Απεικόνιση Ισοµετρικών Χαρακτηριστικών (Isometric Feature Mapping - Isomap) υπολογίζει τον χώρο ενσωµάτωσης που διατηρούνται βέλτιστα οι γεωδαιτικές αποστάσεις µεταξύ των σηµείων [Tenenbaum et al, 2000] Η Τοπικά Γραµµική Ενσωµάτωση (Locally Linear Embedding - LLE) υπολογίζει τον χώρο ενσωµάτωσης που διατηρείται η τοπικά γραµµική δοµή των δεδοµένων [Roweis and Saul, 2000]..Π.Μ.Σ Ηλεκτρονική και Επεξεργασία της Πληροφορίας 6

PCA (Principal Component Analysis) H PCA υπολογίζει τα ιδιοδιανύσµατα του πίνακα συνδιασποράς των δεδοµένων, στις διευθύνσεις των οποίων µεγιστοποιείται η διασπορά τους. Αρχικά εδοµένα: {X 1, X 2,, X D } in R D Τελικά εδοµένα: {Y 1, Y 2,, Y d } in R d, d D Ουσιαστικά υπολογίζει µια ορθονορµαλισµένη βάση E= {e 1, e 2,, e d } ηοποίαµεγιστοποιείτηνδιασποράτου Y i = Ε T X i.π.μ.σ Ηλεκτρονική και Επεξεργασία της Πληροφορίας 7

Αλγόριθµος PCA 1. Υπολογισµόςτου πίνακα συνδιασποράς S=ΧΧ Τ και µέσης τιµής µ 2. Υπολογισµός ιδιοτιµών l i και ιδιοδιανυσµάτων e i µέσω της διαδικασίας ιδιοανάλυσης του S, l i e i = S e i 3. ηµιουργίατουδιαγώνιουπίνακα L = E T S E 4. Ταξινόµηση των d πρώτων ιδιοδιανυσµάτων κατά φθίνουσα σειρά e 1 >e 2 > >e d 5. Υπολογισµόςνέωνµεταβλητών Y i = [e 1, e 2,, e d ] T (X i -µ).π.μ.σ Ηλεκτρονική και Επεξεργασία της Πληροφορίας 8

Σχόλια Τα d πρώτα ιδιοδιανύσµατα αποτελούν τις διευθύνσεις προβολής των δεδοµένων ιατήρηση µέγιστης διασποράς Ασυσχέτιστες νέες µεταβλητές µέσω γραµµικού µετασχηµατισµού Η πρώτη κυρίαρχη συνιστώσα διατηρεί το µέγιστο ποσοστό ενέργειας των αρχικών δεδοµένων, κ.ο.κ.π.μ.σ Ηλεκτρονική και Επεξεργασία της Πληροφορίας 9

Πλεονεκτήµατα / Μειονεκτήµατα Πλεονεκτήµατα Κατάλληλη γραµµική µέθοδος Απευθείας υπολογισµοί από όλα τα αρχικά δεδοµένα Απλή µαθηµατική διαδικασία Μειονεκτήµατα υσκολία σε µη γραµµικές δοµές Πχ η PCA δεν µπορεί να ανακαλύψει την δοµή µιας ελικοειδούς υπερεπιφάνειας 20 15 10 5 0 1 0.5 0-0.5-1 -1-0.5 0 0.5 1.Π.Μ.Σ Ηλεκτρονική και Επεξεργασία της Πληροφορίας 10

MDS (Multidimensional Scaling) O αλγόριθµος απεικονίζει τα αρχικά δεδοµένα σε χώρο χαµηλών διαστάσεων ώστε να διατηρείται η µεταξύ τους γειτνίαση Χρησιµοποιεί τον πίνακα αποστάσεων µεταξύ των αρχικών σηµείων - ευκλείδειες (αν)οµοιότητες d ij ανά ζεύγη σηµείων ιακρίνεται σε: Κλασσικό Μετρικό MDS Αλγόριθµο (ανάλυση ιδιοδιανυσµάτων) Μη µετρικο MDS Αλγόριθµο (επαναληπτικός, υπολογιστικά απαιτητικός).π.μ.σ Ηλεκτρονική και Επεξεργασία της Πληροφορίας 11

Multidimensional Scaling (MDS) z i z j x i γ ij d ij MDS x j Αρχικά δεδοµένα σε (µη) ευκλείδειο χώρο υψηλών διαστάσεων Προβολή σε ευκλείδειο χώρο χαµηλών διαστάσεων Στόχος: η εύρεση των x i που διατηρούν την γ ij όσο το δυνατόν πιο κοντά στην d ij.π.μ.σ Ηλεκτρονική και Επεξεργασία της Πληροφορίας 12

Αλγόριθµος Κλασσικού MDS 1. Από τον nxn πίνακα ανοµοιοτήτων, υπολογίζεται ο τετραγωνικός πίνακας Q= - ½ ij 2 2. Υπολογίζεται ο κεντραρισµένος πίνακας H=Ι-n -1 11 T 3. Μετασχηµατισµός στον B=HQH 4. Προσδιορισµός ιδιοτιµών και ιδιοδιανυσµάτων του Β: Β=VLV Τ 5. Οι συντεταγµένες στον χώρο προβολής d-διαστάσεων: Χ=[x 1,x 2,,x n ] T =V d L d ½ V d : d µεγαλύτερα ιδιοδιανύσµατα L d ½ : τετραγωνική ρίζα των d µεγαλύτερων ιδιοτιµών.π.μ.σ Ηλεκτρονική και Επεξεργασία της Πληροφορίας 13

PCA - MDS Αν ο πίνακας αποστάσεων D είναι ευκλείδειος, αποδεικνύεται ότι ο µετρικός MDS είναι ισοδύναµος µε την PCA (βλ. Y PCA =L PCA 1/2 Y MDS ) PCA και Κλασσικός Μετρικός MDS : απλοί και αποδοτικοί γραµµικοί αλγόριθµοι αδυναµία να ανακαλύψουν µη γραµµικές δοµές στα δεδοµένα Παράδειγµα: τρισδιάστατη κατανοµή Swiss Roll 5000 σηµείων Swiss Roll 5000 σηµείων 2D ενσωµάτωση µε PCA 2D ενσωµάτωση µε MDS.Π.Μ.Σ Ηλεκτρονική και Επεξεργασία της Πληροφορίας 14

Locally Linear Embedding (LLE) O LLE είναι ένας µη γραµµικός αλγόριθµος ενσωµάτωσης σε χώρο χαµηλών διαστάσεων, όπου διατηρεί την γενική µη γραµµικότητα της υπερεπιφάνειας εκµεταλλευόµενος την τοπικά γραµµική δοµή Fit locally, think globally Swiss Roll.Π.Μ.Σ Ηλεκτρονική και Επεξεργασία της Πληροφορίας 15

Κύρια ιδέα του LLE Θεώρηση: Μια υπερεπιφάνεια είναι κατά προσέγγιση γραµµική αν αναφερθούµε µεµονωµένα σε ένα µικρό τµήµα της. Σε κάθε τοπικά γραµµική γειτονία σηµείων, κάθε σηµείο µπορεί να υπολογιστεί ως ο γραµµικός συνδυασµός των γειτόνων του x% i r = r w x j neighbor ( x ) w ij = 1 j i ij j.π.μ.σ Ηλεκτρονική και Επεξεργασία της Πληροφορίας 16

Βήµατα Αλγορίθµου 1. Εύρεση των k κοντινότερων γειτόνων κάθε σηµείου Χ i, στον R D, µέσω ευκλείδειων αποστάσεων 2. Υπολογισµός των βαρών W ij που ανακατασκευάζουν καλύτερα κάθε σηµείο Χ i από τους γείτονές του 3. Προσδιορισµός των σηµείων Υ i, στον R d χώρο, που ανακατασκευάζονται καλύτερα από τα W ij X Y W X i ij j j W Y i ij j j x% i r = r w x j neighbor ( x ) i ij j.π.μ.σ Ηλεκτρονική και Επεξεργασία της Πληροφορίας 17

Χαρακτηριστικά των W Βάρη ανακατασκευής W ij : Ανεξάρτητα περιστροφής, κλιµάκωσης, και µετασχηµατισµού (λόγω W ij = 1 ) Τα ίδια βάρη που υπολογίζονται στις D- διαστάσεις, ανακατασκευάζουν τα σηµεία και στον χώρο ενσωµάτωσης d-διαστάσεων Χαρακτηρίζουν τις εγγενείς γεωµετρικές ιδιότητες κάθε γειτονίας σηµείων j.π.μ.σ Ηλεκτρονική και Επεξεργασία της Πληροφορίας 18

Βήµα 2 Υπολογισµός W ij Τα βέλτιστα βάρη υπολογίζονται µέσω της ελαχιστοποίησης του σφάλµατος ανακατασκευής 2 uur uur ε ( W ) = X i W X j Συνθήκες W ij =0 αν το Χ j δεν είναι γείτονας του Χ i (1) w ij = 1 (2) j i H ελαχιστοποίηση του ε(w) και οι περιορισµοί, συνθέτουν ένα πρόβληµα ελάχιστων τετραγώνων j ij NxN 644444474444448 0.4 0.1 0.3...... 0 0 0... W =.......Π.Μ.Σ Ηλεκτρονική και Επεξεργασία της Πληροφορίας 19

Βήµα 3 Συντεταγµένες σε R d Οι συντεταγµένες στις d-διαστάσεις κάθε σηµείου Υ i υπολογίζονται ελαχιστοποιώντας τις συναρτήσεις κόστους για τα δεδοµένα βάρη W ij Περιορισµοί: Y i = 0 r i ( ) Φ = Y Y i Wij Y j j i r 1 N (1) µέση τιµή (2) διασπορά Η συνάρτηση κόστους µπορεί να γραφεί στη τετραγωνική µορφή όπου Μ=(I-W) T (I-W) uv uv 2 T YY rr = I i uv uv M ij( Yi Y j) ij Πρόβληµα ιδιοδιανυσµάτων του M Τα µικρότερα ιδιοδιανύσµατα ελαχιστοποιούν την συνάρτηση κόστους Επιλέγονται τα d+1 µικρότερα ιδιοδιανύσµατα (αγνοείται το 1 ο ).Π.Μ.Σ Ηλεκτρονική και Επεξεργασία της Πληροφορίας 20

Παράδειγµα - Συµπεράσµατα Ενσωµάτωση σε 2D µιας 3D υπερεπιφάνειας Swiss Roll κατανοµής Πλεονεκτήµατα ιατηρεί τοπικές γειτονίες σηµείων Ικανότητα ανακάλυψης µη γραµµικών υπερεπιφανειών Μη επαναληπτικός αλγόριθµος Καλή αναπαράσταση των σηµείων Μειονεκτήµατα Απαιτεί οµαλές, µη κλειστές, πυκνά δειγµατοληπτηµένες υπερεπιφάνειες Επιλογή των k, d Ευαίσθητο σε αποµακρυσµένα σηµεία (outliers).π.μ.σ Ηλεκτρονική και Επεξεργασία της Πληροφορίας 21

ISOMAP O Isomap υπολογίζει τον χώρο ενσωµάτωσης R d, διατηρώντας τις γεωδαιτικές αποστάσεις µεταξύ των σηµείων της υπερεπιφάνειας R D Εφαρµόζει κλασσικό µετρικό MDS στον πίνακα γεωδαιτικών αποστάσεων µεταξύ όλων των σηµείων (αντί των Ευκλείδειων αποστάσεων) προκειµένου να βρει τις συντεταγµένες στον ελαττωµένο χώρο που τις διατηρεί ιατηρεί την εγγενή γεωµετρία των δεδοµένων Τα τρία βήµατα Isomap του.π.μ.σ Ηλεκτρονική και Επεξεργασία της Πληροφορίας 22

Γεωδαιτική απόσταση Είναι το µήκος της µικρότερης καµπύλης που ενώνει δυο αποµακρυσµένα σηµεία µιας υπερεπιφάνειας (π.χ. σφαίρα, Swiss Roll) Μικρή Ευκλείδεια απόσταση Για γειτονικά σηµεία, η γεωδαιτική τους απόσταση ταυτίζεται ικανοποιητικά µε την ευκλείδεια απόστασή τους Για αποµακρυσµένα σηµεία, η απόσταση προσδιορίζεται από µια ακολουθία µικρών βηµάτων µεταξύ γειτονικών σηµείων Κοντινότερες διαδροµές από ενωµένες ακµές µεταξύ γειτονικών σηµείων Μεγάλη γεωδαιτική απόσταση.π.μ.σ Ηλεκτρονική και Επεξεργασία της Πληροφορίας 23

Βήµατα Isomap 1. Προσδιορισµός των γειτόνων κάθε σηµείου z i όλα τα σηµεία z j εντός σφαίρας ακτίνας ε k κοντινότεροι γείτονες 2. Κατασκευή του γράφου γειτονίας G κάθε σηµείο ενώνεται µε ευκλείδεια ακµή d X (i,j) µε τα γειτονικά του σηµεία δηµιουργία του πίνακα αποστάσεων D X ={d X (i,j)} 3. Υπολογισµός των αποστάσεων µεταξύ όλων των σηµείων πάνω στον γράφο G και εφαρµογή κλασσικού MDS Αλγόριθµος Floyd (για γεωδαιτικές αποστάσεις d G (i,j)) Υπολογισµός του πίνακα αποστάσεων D G ={d G (i,j)} Κλασσικός MDS στον πίνακα D G αντί του D X Πρόβληµα ιδιοδιανυσµάτων Χώρος ενσωµάτωσης R d.π.μ.σ Ηλεκτρονική και Επεξεργασία της Πληροφορίας 24

Παράδειγµα Συµπεράσµατα Παράδειγµα κατανοµής Swiss Roll Πλεονεκτήµατα: Μη γραµµικός, µη επαναληπτικός αλγόριθµος Σφαιρική προσέγγιση Υπολογιστική αποδοτικότητα Εφαρµογή Isomap στις 2D Εφαρµογή MDS στις 2D Μειονεκτήµατα: Ανάκτηση µη γραµµικής γεωµετρικής δοµής ανάλογα µε την υπερεπιφάνεια Λίγα σηµεία, µεγάλη ανακρίβεια γεωδαιτικής απόστασης Μεγάλη καµπυλότητα υπερεπιφάνειας, απαίτηση µεγάλου k (γείτονες) Προσδιορισµός k, d.π.μ.σ Ηλεκτρονική και Επεξεργασία της Πληροφορίας 25

Isomap vs. LLE Οµοιότητες: Ξεκινούν µε τον προσδιορισµό των κοντινότερων γειτόνων ιατηρούν την εγγενή γεωµετρία υπολογίζοντας τοπικές ποσότητες, έπειτα τα αρχικά δεδοµένα περιττεύουν Αντιπαρέρχονται δυσκολίες µη γραµµικών µεθόδων (PCA, MDS) ιαφορές στις τοπικές ποσότητες: Isomap: γεωδαιτικές αποστάσεις σφαιρική προσέγγιση LLE: συνάφεια γειτόνων τοπική προσέγγιση ιαφορές στις εφαρµογή: Εξαρτώνται από το πόσο καλά αντιλαµβάνεται την υπερεπιφάνεια η υπολογιζόµενη τοπική ποσότητα Ο Isomap είναι πιο ανθεκτικός σε αποµακρυσµένα σηµεία (outliers) Ο Isomap διατηρεί αποστάσεις ενώ ο LLE γωνίες Ο LLE αποφεύγει πολυπλοκότητες από τον υπολογισµό αποστάσεων µεταξύ των σηµείων.π.μ.σ Ηλεκτρονική και Επεξεργασία της Πληροφορίας 26

Αναγνώριση Προσώπου µε Σύγκριση Υπερεπιφανειών Πειραµατικό µέρος

Βάση Α ΑT&T Face Database ORL (Βάση Α) Cambridge University Computer Laboratory 40 ευδιάκριτα πρόσωπα µε 10 διαφορετικές εικόνες έκφρασης προσώπου λήψη σε διαφορετικούς χρόνους ποικιλία σε φωτισµό, εκφράσεις προσώπου και λεπτοµέρειες (γυαλιά, γένια, κ.λπ.) σκοτεινό οµοιογενές υπόβαθρο πρόσωπα σε όρθια, µετωπική θέση, µε µικρή µετακίνηση 92x112 pixel, σε 256 σκιάσεις του γκρι (TIFF). οργάνωση σε 40 καταλόγους (ένας για κάθε πρόσωπο).π.μ.σ Ηλεκτρονική και Επεξεργασία της Πληροφορίας 28

Βάση Β Grimace (Βάση Β) Πανεπιστήµιο του Essex. 18 πρόσωπα ανδρών και γυναικών, 20 εικόνες ανά πρόσωπο, ακολουθία ανά 0.5 κίνηση του προσώπου και µορφασµοί (πιο ακραίοι στο τέλος κάθε ακολουθίας) 180x200 pixel, τύπου JPEG. ενιαίο υπόβαθρο µε ελάχιστη µεταβολή φωτεινότητας ελάχιστη αλλαγή θέσης κεφαλιού έντονη µεταβολή εκφράσεων του προσώπου.π.μ.σ Ηλεκτρονική και Επεξεργασία της Πληροφορίας 29

Προεπεξεργασία βάσης Grayscale εικόνα Εξίσωση Ιστογράµµατος (Histogram Equalization) 56x46 pixel νορµαλισµός των τιµών των pixel [0,1] ηµιουργία 2576- διάστατου πίνακα γραµµή ηµιουργία πίνακα δεδοµένων από όλες τις εικόνες.π.μ.σ Ηλεκτρονική και Επεξεργασία της Πληροφορίας 30

Τρόποι Ανάκτησης Ευκλείδειες αποστάσεις ταξινόµηση µε βάση την κοντινότερη ευκλείδεια απόσταση Αλγόριθµος Data Ranking απόδοση µιας αρχικής τιµής ενέργειας στο σηµείο query διασπορά στα σηµεία µέσω µιας επαναληπτικής συνάρτησης σταθερή κατάσταση ενεργειών ταξινόµηση µε βάση το µεγαλύτερο ποσό ενέργειας Πρόβληµα 2φεγγαριών + σηµείο query Ευκλείδεια ταξινόµηση Ranking ταξινόµηση.π.μ.σ Ηλεκτρονική και Επεξεργασία της Πληροφορίας 31

Βάση Α Εφαρµογή των αλγορίθµων στην Βάση Α dimensions=[ 2 3 4 5 6 7 8 9 10 15 20 25 30 40 50 100 150 200 250 300] neighbors=[7 8 9 10 12 15 20 25] Παράδειγµα 2D Ενσωµάτωσης: 2D Isomap 2D LLE 2D PCA X-Y coordinates.π.μ.σ Ηλεκτρονική και Επεξεργασία της Πληροφορίας 32

Ανάκτηση Μέσω Ευκλείδειων Αποστάσεων Ταξινόµηση µε βάση την κοντινότερη απόσταση, µε query την ν -στη εικόνα κάθε οµάδας Υπολογισµός retr= Για κάθε [διάσταση-γείτονες] και µέθοδο µείωσης διαστάσεων Μέση τιµή ανακτήσεων της Βάσης Α πληθος σωστων ανακτησεων πληθος ανακτησεων Method ( Database A) Isomap LLE PCA Original Space Euclidean Retrieval Max retrieval results 0.56042 0.68889 0.64772 0.59472 retr retr retr Isomap LLE PCA retr retr retr retr retr retr dim dim neib neib dim dim neib neib neib dim dim dim.π.μ.σ Ηλεκτρονική και Επεξεργασία της Πληροφορίας 33

Ανάκτηση Μέσω Data Ranking ταξινόµηση µε βάση το µεγαλύτερο ποσό ενέργειας Υπολογισµός ανάκτησης Method (Database A) Isomap LLE Ranking Retrieval Max retrieval results 0.54306 0.73125 0.64375 Μέση τιµή ανακτήσεων Original Space 0.6225 PCA retr Isomap LLE PCA retr retr dim neib dim neib dim.π.μ.σ Ηλεκτρονική και Επεξεργασία της Πληροφορίας 34

Γραφικές ROC ROC (Receiver Operating Characteristics) Μέτρο απόδοσης σε ταξινόµηση 2 κλάσεων κάθε δείγµα ταξινόµησης αποδίδεται σε ένα στοιχείο του συνόλου {P,N} θετικών και αρνητικών κλάσεων Έστω, ταξινόµηση θετικών κλάσεων TP (True Positive): Ορθά θετικά FP (False Positive): Λάθος θετικά TP rate = TP/P, P=πλήθος όµοιων εικόνων µε την query (κλάση Α) FP rate = FP/N, N=πλήθος ανόµοιων εικόνων (κλάση Β) Παράδειγµα P=9 N=390 QueryΕικόνα ΑποτελέσµαταΑνάκτησης.Π.Μ.Σ Ηλεκτρονική και Επεξεργασία της Πληροφορίας 35

Γραφικές ROC και AUC ηµιουργία ζευγών TP rate - FP rate Απεικόνιση σε 2 χώρο Το TP rate του τελευταίου σηµείου αντιστοιχεί στο συνολικό ποσοστό ανάκτησης AUC (Area Under Curve) = εµβαδόν της περιοχής κάτω από την καµπύλη Σύγκριση ταξινοµήσεων Τιµές [0,1] µεγαλύτερο AUC,καλύτερη µέση απόδοση.π.μ.σ Ηλεκτρονική και Επεξεργασία της Πληροφορίας 36

Υπολογισµός AUC ROC καµπύλες στις ταξινοµήσεις µε query την ν -στη εικόνα κάθε οµάδας Υπολογισµός αντιστοίχων εµβαδών ΑUC Για κάθε [διάσταση-γείτονες], µέθοδο ανάκτησης και µέθοδο µείωσης διαστάσεων Μέση τιµή εµβαδών AUC Προσδιορισµός θέσης [διάσταση-γείτονες] του µέγιστου AUC AUC Data Ranking AUC Ευκλείδειες Παράδειγµα: Isomap dim neib dim neib.π.μ.σ Ηλεκτρονική και Επεξεργασία της Πληροφορίας 37

Αξιολόγηση AUC - Αποτελέσµατα Dimensionality Reduction Method (Database A) Max retrieval results Euclidean Retrieval [dim, neib] by max AUC [dim, neib] by max TPrate TP rate Isomap LLE 0.56042 0.68889 [25,7] [40,12] [25,7] [40,12] Ευκλείδειες PCA Original Space 0.64772 0.59472 [30,-] - [30,-] - FP rate ROC καµπύλες για τα µέγιστα ποσοστά ανάκτησης Dimensionality Reduction Method (Database A) Max retrieval results Ranking Retrieval [dim, neib] by max AUC [dim, neib] by max TP rate TP rate Isomap LLE 0.54306 0.73125 [25,7] [50,20] [25,7] [50,20] PCA 0.64375 [50,-] [40,-] Data Ranking Original Space 0.6225 - - FP rate.π.μ.σ Ηλεκτρονική και Επεξεργασία της Πληροφορίας 38

Βάση Β Εφαρµογή των αλγορίθµων στην Βάση Β dim=[ 2 3 4 5 6 7 8 9 10 15 20 25 30 40 50 100 150 200 250 300] neib=[20 25 30 35 40 50 70 80 100] Συνδυαστικά αποτελέσµατα µέσων ανακτήσεων retr retr Data Ranking retr retr dim dim neib neib dim Isomap LLE PCA retr Ευκλείδειες retr dim neib dim neib dim.π.μ.σ Ηλεκτρονική και Επεξεργασία της Πληροφορίας 39

Βάση Β Αποτελέσµατα Dimensionality Reduction Method (Database Β) Max retrieval results Ranking Retrieval [dim, neib] by max AUC [dim, neib] by max TP rate TP rate Isomap LLE 0.92836 0.94357 [8,100] [15,70] [8,100] [15,70] PCA 0.94956 [15,-] [15,-] Ευκλείδειες Original Space 0.92982 - - FP rate ROC καµπύλες για τα µέγιστα ποσοστά ανάκτησης TP rate Dimensionality Reduction Method (Database B) Isomap Max retrieval results 0.92178 Euclidean Retrieval [dim, neib] by max AUC [8,100] [dim, neib] by max TP rate [8,100] LLE 0.93611 [15,70] [15,70] Data Ranking PCA Original Space 0.94678 0.92339 [15,-] - [15,-] - FP rate.π.μ.σ Ηλεκτρονική και Επεξεργασία της Πληροφορίας 40

Συµπεράσµατα Η ανάκτηση µε τον αλγόριθµο Data Ranking υπερτερεί έναντι της ευκλείδειας ανάκτησης Καλύτερη απόδοση ORL: LLE (73,125%) + data ranking retrieval Καλύτερη απόδοση Grimace: PCA (94,956%) + data ranking retrieval ιαφορετικά αποτελέσµατα ανάκτησης στις δυο βάσεις, διαφορετικός αριθµός εικόνων ανά πρόσωπο. Μη γραµµικές µέθοδοι: Χαµηλή απόδοση ISOMAP Υψηλή απόδοση LLE Οι υπερεπιφάνειες δεν παρουσίασαν µια σαφή (µη) γραµµικότητα ώστε να δοθεί σαφές συγκριτικό πλεονέκτηµα µεταξύ γραµµικών και µη γραµµικών αλγορίθµων Το µέγιστο AUC των ROC γραφικών παραστάσεων ταυτίζεται µε το ζεύγος [διάσταση γείτονες] που απορρέει από το µέγιστο ποσοστό TP rate..π.μ.σ Ηλεκτρονική και Επεξεργασία της Πληροφορίας 41