HMY 795: Αναγνώριση Προτύπων

Σχετικά έγγραφα
Αναγνώριση Προτύπων (Pattern Recognition) Μπεϋζιανή Θεωρία Αποφάσεων (Bayesian Decision Theory) Π. Τσακαλίδης

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2

Κεφάλαιο 2: Θεωρία Απόφασης του Bayes 2.1 Εισαγωγή

HMY 795: Αναγνώριση Προτύπων

Μπαεσιανοί Ταξινοµητές (Bayesian Classifiers)

HMY 795: Αναγνώριση Προτύπων

HMY 795: Αναγνώριση Προτύπων

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2

HMY 795: Αναγνώριση Προτύπων. Διαλέξεις 15-16

ΔΙΑΧΩΡΙΣΜΟΣ ΚΑΙ ΤΑΞΙΝΟΜΗΣΗ ΚΡΗΤΙΚΟΥ ΚΑΤΕΡΙΝΑ NΙΚΑΚΗ ΚΑΤΕΡΙΝΑ NΙΚΟΛΑΪΔΟΥ ΧΡΥΣΑ

Πανεπιστήμιο Κύπρου Πολυτεχνική Σχολή

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2

HMY 795: Αναγνώριση Προτύπων

ΘΕΩΡΙΑ ΑΠΟΦΑΣΕΩΝ 3 ο ΦΡΟΝΤΙΣΤΗΡΙΟ ΛΥΣΕΙΣ ΤΩΝ ΑΣΚΗΣΕΩΝ

HMY 795: Αναγνώριση Προτύπων

Πανεπιστήµιο Κύπρου Πολυτεχνική Σχολή

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2

Θεωρία Λήψης Αποφάσεων

HMY 799 1: Αναγνώριση Συστημάτων

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2

Σχόλιο. Κατασκευή των τροχιών της δισδιάστατης γραμμικής δυναμικής.

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2

Ορίζουμε την τυπική πολυδιάστατη κανονική, σαν την κατανομή του τυχαίου (,, T ( ) μεταξύ τους ανεξάρτητα. Τότε

ΠΑΝΕΠΙΣΤΗΜΙΟ ΙΩΑΝΝΙΝΩΝ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ. Πιθανότητες. Συναρτήσεις πολλών μεταβλητών Διδάσκων: Επίκουρος Καθηγητής Κωνσταντίνος Μπλέκας

Γραµµικοί Ταξινοµητές

II.6 ΙΣΟΣΤΑΘΜΙΚΕΣ. 1. Γραφήματα-Επιφάνειες: z= 2. Γραμμική προσέγγιση-εφαπτόμενο επίπεδο. 3. Ισοσταθμικές: f(x, y) = c

ΚΑΤΗΓΟΡΙΕΣ ΤΑΞΙΝΟΜΗΣΗΣ

2 Θεωρία αποφάσεων Bayes..2

Στατιστική Επιχειρήσεων Ι

HMY 795: Αναγνώριση Προτύπων

HMY 795: Αναγνώριση Προτύπων. Διάλεξη 2

Je rhma John L mma Dvoretzky-Rogers

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΔΙΑΤΜΗΜΑΤΙΚΟ ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ ΜΑΘΗΜΑΤΙΚΑ ΤΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΚΑΙ ΑΠΟΦΑΣΕΩΝ. Διαχωριστική Ανάλυση Λογιστική Παλινδρόμηση

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2

Ορίζουμε την τυπική πολυδιάστατη κανονική, σαν την κατανομή του τυχαίου (,, T ( ) μεταξύ τους ανεξάρτητα. Τότε

ΚΑΤΑΝΟΜΕΣ Ι ΙΑΣΤΑΤΩΝ ΤΥΧΑΙΩΝ ΜΕΤΑΒΛΗΤΩΝ (Συνέχεια)

Εφαρμοσμένα Μαθηματικά ΙΙ

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2

Η ΚΑΝΟΝΙΚΗ ΜΟΡΦΗ JORDAN

Ασκήσεις Φροντιστηρίου «Υπολογιστική Νοημοσύνη Ι» 3ο Φροντιστήριο

HMY 795: Αναγνώριση Προτύπων

ΕΚΤΙΜΙΣΗ ΜΕΓΙΣΤΗΣ ΠΙΘΑΝΟΦΑΝΕΙΑΣ

ΓΡΑΜΜΙΚΗ ΑΛΓΕΒΡΑ (Εξ. Ιουνίου - 02/07/08) ΕΠΙΛΕΓΜΕΝΕΣ ΑΠΑΝΤΗΣΕΙΣ

Ψηφιακές Τηλεπικοινωνίες. Βέλτιστος Δέκτης

Αναγνώριση Προτύπων. Baysian Θεωρία Αποφάσεων ΕΠΙΣΚΟΠΗΣΗ-ΑΣΚΗΣΕΙΣ

Λογιστική Παλινδρόμηση & Διαχωριστική Ανάλυση

Τεχνικές Μείωσης Διαστάσεων. Ειδικά θέματα ψηφιακής επεξεργασίας σήματος και εικόνας Σ. Φωτόπουλος- Α. Μακεδόνας

ΤΕΙ ΣΕΡΡΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΕΠΙΚΟΙΝΩΝΙΩΝ ΕΞΕΤΑΣΗ ΣΤΟ ΜΑΘΗΜΑ «ΑΝΑΓΝΩΡΙΣΗ ΠΡΟΤΥΠΩΝ ΝΕΥΡΩΝΙΚΑ ΔΙΚΤΥΑ» ΔΕ. 11 ΙΟΥΝΙΟΥ 2012

Εισαγωγικές έννοιες. Κατηγορίες προβλημάτων (σε μια διάσταση) Προβλήματα εύρεσης μεγίστου. Συμβολισμοί

HMY 795: Αναγνώριση Προτύπων

Δειγματοληψία. Πρέπει να γνωρίζουμε πως πήραμε το δείγμα Το πλήθος n ij των παρατηρήσεων σε κάθε κελί είναι τ.μ. με μ ij συμβολίζουμε την μέση τιμή:

HMY 795: Αναγνώριση Προτύπων

Εφαρμοσμένα Μαθηματικά ΙΙ

Τμήμα Μαθηματικό & Τμήμα Μηχανικών Η/Υ & Πληροφορικής ΔΙΑΤΜΗΜΑΤΙΚΟ ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ. «Τα Μαθηματικά των Υπολογιστών και των Αποφάσεων»

ΣΥΝΗΘΕΙΣ ΔΙΑΦΟΡΙΚΕΣ ΕΞΙΣΩΣΕΙΣ 6

HMY 795: Αναγνώριση Προτύπων

4. Μέθοδοι αναγνώρισης ταξινοµητές µε επόπτη

ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΙΑΣ ΤΜΗΜΑ ΠΟΛΙΤΙΚΩΝ ΜΗΧΑΝΙΚΩΝ ΤΟΜΕΑΣ ΥΔΡΑΥΛΙΚΗΣ ΚΑΙ ΠΕΡΙΒΑΛΛΟΝΤΙΚΗΣ ΤΕΧΝΙΚΗΣ. Διάλεξη 2: Περιγραφή αριθμητικών μεθόδων

ΑΝΑΓΝΩΡΙΣΗ ΠΡΟΤΥΠΩΝ. ΕΝΟΤΗΤΑ: Γραμμικές Συναρτήσεις Διάκρισης. ΔΙΔΑΣΚΟΝΤΕΣ: Βλάμος Π. Αυλωνίτης Μ. ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ

HMY 429: Εισαγωγή στην Επεξεργασία Ψηφιακών Σημάτων. Διάλεξη 20: Διακριτός Μετασχηματισμός Fourier (Discrete Fourier Transform DFT)

4.3. Γραµµικοί ταξινοµητές

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2

και αναζητούμε τις λύσεις του:

Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 19/5/2017

ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΚΕΝΤΡΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ ΣΧΟΛΗ ΤΜΗΜΑ. Μαθηματικά 1. Σταύρος Παπαϊωάννου

Στατιστική Συμπερασματολογία

Εφαρμοσμένα Μαθηματικά ΙΙ Τελική Εξέταση Ι. Λυχναρόπουλος

ΔΗΜΟΚΡΙΤΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΡΑΚΗΣ Τμήμα Επιστήμης Φυσικής Αγωγής και Αθλητισμού Πρόγραμμα Διδακτορικών Σπουδών ΠΛΗΡΟΦΟΡΙΑΚΟ ΕΝΤΥΠΟ ΜΑΘΗΜΑΤΟΣ

, που, χωρίς βλάβη της γενικότητας, μπορούμε να θεωρήσουμε χρονική στιγμή μηδέν, δηλαδή

HMY 795: Αναγνώριση Προτύπων

3. O ΑΛΓΟΡΙΘΜΟΣ ΤΟΥ PERCEPTRON

HMY 795: Αναγνώριση Προτύπων. Διαλέξεις 13-14

Ταξινόμηση καμπυλών και επιφανειών με τη βοήθεια των τετραγωνικών μορφών.

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2

ΕΠΑΝΑΛΗΠΤΙΚΗ ΤΕΛΙΚΗ ΕΞΕΤΑΣΗ 3 Ιουλίου 2010

Ημερολόγιο μαθήματος

ΕΝΤΥΠΟ ΘΕΜΑΤΩΝ ΕΞΕΤΑΣΕΩΝ

ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΚΑΙ ΜΑΘΗΜΑΤΙΚΗ ΔΙΑΤΥΠΩΣΗ, Διαλ. 2. Ανωτάτη Σχολή Παιδαγωγικής και Τεχνολογικής Εκπαίδευσης 8/4/2017

ΕΠΑΝΑΛΗΨΗ ΒΑΣΙΚΩΝ ΕΝΝΟΙΩΝ ΣΤΑΤΙΣΤΙΚΗΣ

Συνάρτηση χρησιμότητας (utility function): u(x)

HMY 795: Αναγνώριση Προτύπων

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2

Ασκήσεις. Κεφάλαιο 6. a = a 0 + x 1 b 1 + x 2 b 2 + x 3 b 3, όπου b i = a i a 0, i = 1, 2, 3, P 2 = {(x, y, z) R 3 : x 2y + 3z = 2}.

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2

Στατιστική είναι το σύνολο των μεθόδων και θεωριών που εφαρμόζονται σε αριθμητικά δεδομένα προκειμένου να ληφθεί κάποια απόφαση σε συνθήκες

Θεωρία Αποφάσεων ο. 4 Φροντιστήριο. Λύσεις των Ασκήσεων

ΜΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΙΣΗ

Φυσική για Μηχανικούς

Εισαγωγή στις Τηλεπικοινωνίες. Δομή της παρουσίασης

14 η εβδομάδα (26/01/2017) Έγιναν οι ασκήσεις 28, 29 και 30. Έγινε επανάληψη στη Θεωρία Καμπυλών και στη Θεωρία Επιφανειών.

Τι είναι βαθμωτό μέγεθος? Ένα μέγεθος που περιγράφεται μόνο με έναν αριθμό (π.χ. πίεση)

(2) Θεωρούµε µοναδιαία διανύσµατα α, β, γ R 3, για τα οποία γνωρίζουµε ότι το διάνυσµα

Αξιολόγηση ακρίβειας στη συνόρθωση δικτύων (μέρος IΙ)

Θέμα 1. με επαυξημένο 0 1 1/ 2. πίνακα. και κλιμακωτή μορφή αυτού

Εισαγωγή στις Τηλεπικοινωνίες. Δομή της παρουσίασης

Αξιολόγηση ακρίβειας στη συνόρθωση δικτύων (μέρος IΙ)

Transcript:

HMY 795: Αναγνώριση Προτύπων Διάλεξη 4 Διαχωριστικές συναρτήσεις Ταξινόμηση Γκαουσιανών μεταβλητών

Bayesan decson Mnmum msclassfcaton rate decson: διαλέγουμε την κατηγορίαck για την οποία η εκ των υστέρων (posteror πιθανότητα p(ck x είναι μέγιστη. Ελαχιστοποίηση ρίσκου C Lkelhood rato επιλέγουμε C αν R(α k x= λ k p(c x = p( x C λ λ p( C >. p( x C λ λ p( C

Διαχωριστικές συναρτήσεις (Dscrmnant functons Ένας από τους πιο συνηθισμένους/χρήσιμους τρόπους αναπαράστασης ενός ταξινομητή με Cκατηγορίες είναι η χρήση ενός συνόλου διαχωριστικών συναρτήσεων (dscrmnant functons g (x (=,, C σύμφωνα με τις οποίες ο ταξινομητής αναθέτει ένα διάνυσμα χαρακτηριστικών x στην κατηγορία αν: g (x> g (x,,

Διαχωριστικές συναρτήσεις (Dscrmnant functons Η επιλογή δενείναι μοναδική αν επιλέξουμε ένα σύνολο g (xτότε και κάθε άλλο σύνολο f(g (xόπου f μονοτονική αύξουσα συνάρτηση έχει το ίδιο αποτέλεσμα Σε συνάρτηση με τα προηγούμενα,για έναν ταξινομητή κατά Bayesστη γενική περίπτωση (με ρίσκο μπορούμε να διαλέξουμε τις συναρτήσεις ως: g ( x = R( α x Για την περίπτωση ελάχιστης λάθος ταξινόμησης (mnmum msclassfcaton rate decson p( x C p( C g ( x = p( C x = c p( x C p( C = ή, εντελώς ισοδύναμα: g ( x = p( x C p( C g ( x = ln p( x C + ln p( C

Διαχωριστικές συναρτήσεις (Dscrmnant functons Για πρόβλημα δύο κατηγοριών g( x = g ( x g ( x Ισοδύναμα g( x > 0 C g( x < 0 C g( x = p( C x p( C x p( x C p( C g( x = ln + ln p( x C p( C

Η πολυδιάστατη κανονική μεταβλητή για διάνυσμα Dx: Μέση τιμή μ Πίνακας συνδιασποράς Σ Ο γεωμετρικός τόπος των σημείων με σταθερή πυκνότητα πιθανότητας είναι υπερελλειψοειδές με κέντρο στο μμε κύριους άξονες των οποίων η κατεύθυνση ορίζεται από το αντίστοιχο ιδιοδιάνυσμα και το μήκος από την αντίστοιχη ιδιοτιμή του πίνακα Σ. Συγκεκριμένα αν ( x µ Τ Σ ( x µ = c ο -οστός άξονας έχει κέντρο στο μκαι δίνεται από: ± c λ e όπου λ, e η αντίστοιχη ιδιοτιμή και το αντίστοιχο ιδιοδιάνυσμα του πίνακα Σ

Για δύο μεταβλητές, αν ρ=σ /σ σ (συντελεστής συσχέτισης πάντα <: ρ=0, ανεξάρτητες μεταβλητές άξονες παράλληλοι με τους άξονες x και x ρ=, μονοδιάστατη κατανομή (γραμμή Σ=σ Ι, σφαίρα Οποιοσδήποτε γραμμικός μετασχηματισμός του x ακολουθεί επίσης κανονική κατανομή, δηλ αν x~n(μ,σ τότε για y=a T xισχύει y~n(a T μ,a T ΣA Για A =ΦΛ -/ -μετασχηματισμός σε κατανομή με μοναδιαίο πίνακα συνδιασποράς(htenng transform H ποσότητα: Τ λέγεται τετραγωνισμένη απόσταση Mahalanobs(squared Mahalanobs dstance από το x στο μ = ( x µ Σ ( x µ Οι ισοϋψείς επιφάνειες καθορίζονται από τα σημεία για τα οποία: ( x µ Τ Σ ( x µ = const r

Έστω ότι το διάνυσμα χαρακτηριστικών (feature vector ακολουθεί την πολυδιάστατη κανονική κατανομή Διαχωριστικές συναρτήσεις (mnmum error rate classfcaton: Για g ( x = ln p( x C + ln p( C p( x C ~ N( µ, Σ D g π D Σ = σ Ι Σ = σ, Σ = σ Ι g ( x = x µ ln ( + P C = σ T T T = ( x x µ x + µ µ + ln P( C σ Τ ( x = ( x µ Σ ( x µ ln( ln Σ + ln P( C Περίπτωση : Ισοδύναμα: g ( x = x+ T 0 = µ σ T 0 = µ ln ( µ + P C σ Γραμμικές διαχωριστικές συναρτήσεις ή γραμμικός ταξινομητής (lnear dscrmnant functon/ classfer

Οι επιφάνειες αποφάσεων (decson surfaces που διαχωρίζουν τις περιοχές αποφάσεων(decson regons είναι υπερεπίπεδα(hyperplanes που ορίζονται από: g όπου: T ( x = g ( x ( x x = 0 = µ µ P( C x µ µ µ µ σ 0 = ( + ln ( µ P( C µ 0 Κάθετο επίπεδοστη γραμμή που συνδέει τις μέσες τιμές μ και μ Αν όλες οι a pror πιθανότητες είναι οι ίδιες: το επίπεδο βρίσκεται στο μέσον μεταξύ των μέσων τιμών ταξινόμηση ενός δείγματος στην κατηγορία για την οποία η Ευκλείδεια απόσταση από τη μέση τιμή είναι ελάχιστη mnmum dstance classfer

Ίσες a pror πιθανότητες Mnmum dstance classfer

Διαφορετικές a pror πιθανότητες: Μετατόπιση του υπερεπιπέδουμακρύτερα από την πιο πιθανή κλάση

Περίπτωση : Ελλειψοειδή ίσου μεγέθους γύρω από διαφορετικές μέσες τιμές g Σ =Σ Τ ( x = ( x µ Σ ( x µ + ln P( C Ίσες a pror πιθανότητες: ταξινόμηση ενός οποιουδήποτε xστην κατηγορία για την Τ οποία η απόσταση Mahalanobs ( x µ είναι ελάχιστη Σ ( x µ T g ( x = x + 0 =Σ µ T 0 = µ Σ µ + ln P( C Γραμμικός ταξινομητής, αλλά το υπερεπίπεδοπου χωρίζει Rκαι Rδεν είναι κάθετο στη γραμμή μεταξύ των μέσων τιμών g T ( x = g ( x ( x x = 0 0 P( C x 0 = µ + µ µ µ =Σ µ µ ( ( ln (, ( P C Τ ( µ µ Σ ( µ µ

Περίπτωση 3: g ( x = x W x+ x+ T T 0 W = Σ =Σ µ Σ αυθαίρετο Τετραγωνικός (quadratc ταξινομητής T 0 = µ Σ µ ln Σ + ln P ( C Οι επιφάνειες αποφάσεων μπορεί να έχουν διάφορες γενικές μορφές (παραβολικές, υπερβολικές, υπερεπίπεδα κλπ - hyperquadrcs

Διαχωρισμός διακριτών χαρακτηριστικών Σε πολλά προβλήματα τα χαρακτηριστικά είναι διακριτά (ακόμη και δυαδικά. Σε αυτή την περίπτωση p( C x = c = p( x C p( C p( x C p( C Ο κανόνας Bayesδεν αλλάζει δηλ. θέλουμε είτε να μεγιστοποιήσουμε την εκ των υστέρων πιθανότητα ή να ελαχιστοποιήσουμε τη συνάρτηση ρίσκου Για δυαδικά χαρακτηριστικά, x=(x,,x D T p = P( x = C D x P( x C = p ( p = x P( x C = q ( q D = q = P( x = C x x Bernoull dstrbuton: p( x C = p ( p x p( x C = q ( q Υποθέτοντας υπό συνθήκη ανεξαρτησία: x x x

Διαχωρισμός διακριτών χαρακτηριστικών Lkelhood rato Διαχωριστική συνάρτηση x x D p( x C p p = p( x C = q q p( C p( C g( = x x ln ln p( x C + p( C D x 0 = g ( x = x + όπου: και: p ( q = ln =,..., D q ( p 0 D p P( C = ln + ln q P( C = decde C f g( x > 0 and C f g( x 0

Διαχωρισμός διακριτών χαρακτηριστικών Παράδειγμα: κλάσεις, p=0.8, q=0.5, ίσες a pror πιθανότητες D p( x C p p = p( x C = q q Διαχωριστική συνάρτηση 0 x x 0.8( 0.5 = ln =.3863 0.5( 0.8 3 0.8 P( C = + = 0.5 P( C ln ln.75 = g( x =.3863( x + x + x.75 C 3 : f g( x > 0 C f g( x 0 p( x C p( C D g( x = ln + ln = x + 0 p( x C p( C =

Διαχωρισμός διακριτών χαρακτηριστικών