Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2

Σχετικά έγγραφα
Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2

Εκτιμητές Μεγίστης Πιθανοφάνειας (Maximum Likelihood Estimators MLE)

Αναγνώριση Προτύπων Ι

ΘΕΩΡΙΑ ΑΠΟΦΑΣΕΩΝ 3 ο ΦΡΟΝΤΙΣΤΗΡΙΟ ΛΥΣΕΙΣ ΤΩΝ ΑΣΚΗΣΕΩΝ

HMY 795: Αναγνώριση Προτύπων

ΦΡΟΝΤΙΣΤΗΡΙΟ 11. β) τον εκτιμητή μέγιστης πιθανοφάνειας για την άγνωστη παράμετρο λ 0.

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2

Συστήµατα Μη-Γραµµικών Εξισώσεων Μέθοδος Newton-Raphson

ΑΝΑΓΝΩΡΙΣΗ ΠΡΟΤΥΠΩΝ. ΕΝΟΤΗΤΑ: Γραμμικές Συναρτήσεις Διάκρισης. ΔΙΔΑΣΚΟΝΤΕΣ: Βλάμος Π. Αυλωνίτης Μ. ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ

ΕΚΤΙΜΙΣΗ ΜΕΓΙΣΤΗΣ ΠΙΘΑΝΟΦΑΝΕΙΑΣ

Αναγνώριση Προτύπων (Pattern Recognition) Μπεϋζιανή Θεωρία Αποφάσεων (Bayesian Decision Theory) Π. Τσακαλίδης

Εφαρμοσμένη Στατιστική

Αναγνώριση Προτύπων. Baysian Θεωρία Αποφάσεων ΕΠΙΣΚΟΠΗΣΗ-ΑΣΚΗΣΕΙΣ

HMY 795: Αναγνώριση Προτύπων

HMY 795: Αναγνώριση Προτύπων

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Στατιστική Συμπερασματολογία

Ακαδημαϊκό Έτος , Χειμερινό Εξάμηνο Διδάσκων Καθ.: Νίκος Τσαπατσούλης

HMY 795: Αναγνώριση Προτύπων

ΦΡΟΝΤΙΣΤΗΡΙΑ 7 ΚΑΙ 8

Δρ. Βασίλειος Γ. Καμπουρλάζος Δρ. Ανέστης Γ. Χατζημιχαηλίδης

Αναγνώριση Προτύπων (Pattern Recognition) Εκτίµηση Παραµέτρων (Parameter Estimation) Π. Τσακαλίδης ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ ΤΜΗΜΑ ΕΠΙΣΤΗΜΗΣ ΥΠΟΛΟΓΙΣΤΩΝ

Πανεπιστήμιο Κύπρου Πολυτεχνική Σχολή

Μέθοδοι πολυδιάστατης ελαχιστοποίησης

HMY 795: Αναγνώριση Προτύπων

Ψηφιακές Τηλεπικοινωνίες. Βέλτιστος Δέκτης

ΤΕΙ ΣΕΡΡΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΕΠΙΚΟΙΝΩΝΙΩΝ ΕΞΕΤΑΣΗ ΣΤΟ ΜΑΘΗΜΑ «ΑΝΑΓΝΩΡΙΣΗ ΠΡΟΤΥΠΩΝ ΝΕΥΡΩΝΙΚΑ ΔΙΚΤΥΑ» ΔΕ. 11 ΙΟΥΝΙΟΥ 2012

HMY 795: Αναγνώριση Προτύπων

Αναγνώριση Προτύπων. Εκτίμηση Παραμέτρων (Parameter Estimation)

HMY 795: Αναγνώριση Προτύπων

HMY 795: Αναγνώριση Προτύπων. Διάλεξη 2

HMY 795: Αναγνώριση Προτύπων

HMY 795: Αναγνώριση Προτύπων

Θεωρία Λήψης Αποφάσεων

Στατιστική Συμπερασματολογία

ΤΕΙ ΣΕΡΡΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΕΠΙΚΟΙΝΩΝΙΩΝ ΕΞΕΤΑΣΗ ΣΤΟ ΜΑΘΗΜΑ «ΑΝΑΓΝΩΡΙΣΗ ΠΡΟΤΥΠΩΝ ΝΕΥΡΩΝΙΚΑ ΔΙΚΤΥΑ» ΠΑ. 7 ΣΕΠΤΕΜΒΡΙΟΥ 2012

Αναγνώριση Προτύπων Ι

Χρονοσειρές, Μέρος Β 1 Πρόβλεψη Χρονικών Σειρών

ΕΚΤΙΜΗΣΗ ΠΟΣΟΣΤΙΑΙΩΝ ΣΗΜΕΙΩΝ ΓΙΑ ΕΠΙΛΕΓΜΕΝΟ ΕΚΘΕΤΙΚΟ ΠΛΗΘΥΣΜΟ ΑΠΟ k ΠΛΗΘΥΣΜΟΥΣ

Εκτίµηση άγνωστων κατανοµών πιθανότητας

ΓΡΑΜΜΙΚΗ ΑΛΓΕΒΡΑ (Εξ. Ιουνίου - 02/07/08) ΕΠΙΛΕΓΜΕΝΕΣ ΑΠΑΝΤΗΣΕΙΣ

Y Y ... y nx1. nx1

(p 1) (p m) (m 1) (p 1)

Πανεπιστήμιο Πατρών Τμήμα Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών. Διάλεξη 11

ΤΟΠΟΓΡΑΦΙΚΑ ΔΙΚΤΥΑ ΚΑΙ ΥΠΟΛΟΓΙΣΜΟΙ ΑΝΑΣΚΟΠΗΣΗ ΘΕΩΡΙΑΣ ΣΥΝΟΡΘΩΣΕΩΝ

Ορίζουμε την τυπική πολυδιάστατη κανονική, σαν την κατανομή του τυχαίου (,, T ( ) μεταξύ τους ανεξάρτητα. Τότε

Θεωρία Αποφάσεων ο. 4 Φροντιστήριο. Λύσεις των Ασκήσεων

Αναγνώριση Προτύπων. Μη παραμετρικές τεχνικές Αριθμητικά. (Non Parametric Techniques)

ΒΕΛΤΙΣΤΟΠΟΙΗΣΗ ΣΥΝΑΡΤΗΣΕΩΝ ΑΚΡΟΤΑΤΑ ΣΥΝΑΡΤΗΣΕΩΝ. Αριθμητικές μέθοδοι ελαχιστοποίησης ΕΛΑΧΙΣΤΟΠΟΙΗΣΗ ΧΩΡΙΣ ΠΕΡΙΟΡΙΣΜΟΥΣ

Στατιστική. Εκτιμητική

ΔΙΑΧΩΡΙΣΜΟΣ ΚΑΙ ΤΑΞΙΝΟΜΗΣΗ ΚΡΗΤΙΚΟΥ ΚΑΤΕΡΙΝΑ NΙΚΑΚΗ ΚΑΤΕΡΙΝΑ NΙΚΟΛΑΪΔΟΥ ΧΡΥΣΑ

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2

Εισαγωγικές έννοιες. Κατηγορίες προβλημάτων (σε μια διάσταση) Προβλήματα εύρεσης μεγίστου. Συμβολισμοί

Παρουσίαση 2 η : Αρχές εκτίμησης παραμέτρων Μέρος 1 ο

E[ (x- ) ]= trace[(x-x)(x- ) ]

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2

Χρήστος Ι. Σχοινάς Αν. Καθηγητής ΔΠΘ. Συμπληρωματικές σημειώσεις για το μάθημα: «Επιχειρησιακή Έρευνα ΙΙ»

Ο Αλγόριθµος της Simplex

ΑΞΙΟΠΙΣΤΙΑ ΚΑΙ ΣΥΝΤΗΡΗΣΗ ΤΕΧΝΟΛΟΓΙΚΩΝ ΣΥΣΤΗΜΑΤΩΝ Συμπληρωματικές Σημειώσεις Δημήτριος Παντελής. Pr T T0

HMY 799 1: Αναγνώριση Συστημάτων

HMY 795: Αναγνώριση Προτύπων

Πανεπιστήµιο Κύπρου Πολυτεχνική Σχολή

Συστήματα Αυτομάτου Ελέγχου ΙΙ. Άσκηση. γραμμάτων του επιθέτου σας (π.χ. για το επίθετο Κοσματόπουλος, οι αριθμοί α ι θα είναι a

Ασκήσεις Φροντιστηρίου «Υπολογιστική Νοημοσύνη Ι» 4 o Φροντιστήριο

Χρήστος Ξενάκης. Πανεπιστήμιο Πειραιώς, Τμήμα Ψηφιακών Συστημάτων

HMY 795: Αναγνώριση Προτύπων

ΚΕΦΑΛΑΙΟ 0. Απλή Γραμμική Παλινδρόμηση. Ένα Πρόβλημα. Η επιδιωκόμενη ιδιότητα. Ένα χρήσιμο γράφημα. Οι υπολογισμοί. Η μέθοδος ελαχίστων τετραγώνων ...

Κεφάλαιο 4: Μη Παραμετρικές Τεχνικές 4.1 Εισαγωγή

ΑΝΑΛΥΣΗ 2. Μ. Παπαδημητράκης.

7.1.1 Η Μέθοδος των Ελαχίστων Τετραγώνων

Γραµµικοί Ταξινοµητές

HMY 795: Αναγνώριση Προτύπων

Παρεμβολή & πρόγνωση άγνωστης συνάρτησης μέσω σημειακής προσαρμογής

Εκπαίδευση ΤΝΔ με ελαχιστοποίηση του τετραγωνικού σφάλματος εκπαίδευσης. "Τεχνητά Νευρωνικά Δίκτυα" (Διαφάνειες), Α. Λύκας, Παν.

Μέθοδος μέγιστης πιθανοφάνειας

( ) S( x ) 2 ( ) = ( ) ( ) = ( ) ( )

Μέρος II. Στατιστική Συμπερασματολογία (Inferential Statistics)

Πανεπιστήμιο Πατρών Τμήμα Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών. Διάλεξη 4

ΓΡΑΜΜΙΚΟΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ με το EXCEL

ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΚΑΙ ΜΑΘΗΜΑΤΙΚΗ ΔΙΑΤΥΠΩΣΗ, Διαλ. 2. Ανωτάτη Σχολή Παιδαγωγικής και Τεχνολογικής Εκπαίδευσης 8/4/2017

Τεχνητή Νοημοσύνη. 18η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

Κεφάλαιο 5: Γραμμικές Διακρίνουσες Συναρτήσεις 5.1 Εισαγωγή

Πανεπιστήμιο Ιωαννίνων Ακαδ. Έτος Τμήμα Μηχανικών Η/Υ & Πληροφορικής. Παρασκευάς Τσανταρλιώτης Α.Μ. 318

Βέλτιστη παρεμβολή και πρόγνωση άγνωστης συνάρτησης με τη μέθοδο της σημειακής προσαρμογής

Κεφάλαιο 2: Θεωρία Απόφασης του Bayes 2.1 Εισαγωγή

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ. ΜΑΘΗΜΑ 8ο

Transcript:

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας Versio

A ΠΑΡΑΜΕΤΡΙΚΟΙ ΤΑΞΙΝΟΜΗΤΕΣ ΒΑΣΙΣΜΕΝΟΙ ΣΕ ΣΥΝΑΡΤΗΣΕΙΣ ΔΙΑΚΡΙΣΗΣ Η περίπτωση του ταξινομητή Bayes Εκτίμηση μέγιστης εκ των υστέρων πιθανότητας Maimum Aoseriori robabiliy MA Esimaio Στην ML μέθοδο, το θ λογιζόταν ως παράμετρος Εδώ θα θεωρήσουμε το θ ως τυχαίο διάνυσμα που περιγράφεται από υποτίθεται γνωστή df θ. Δοθέντος X Υπολόγισε το μέγιστο της From Bayes heorem,,..., X X X X or X X X

A ΠΑΡΑΜΕΤΡΙΚΟΙ ΤΑΞΙΝΟΜΗΤΕΣ ΒΑΣΙΣΜΕΝΟΙ ΣΕ ΣΥΝΑΡΤΗΣΕΙΣ ΔΙΑΚΡΙΣΗΣ Η περίπτωση του ταξινομητή Bayes Εκτίμηση μέγιστης εκ των υστέρων πιθανότητας MA Η μέθοδος: ˆ arg ma X ή ˆ MA : X Αν η είναι ομοιόμορφη ή αρκετά ευρεία: ˆ MA MA ML 3

A ΠΑΡΑΜΕΤΡΙΚΟΙ ΤΑΞΙΝΟΜΗΤΕΣ ΒΑΣΙΣΜΕΝΟΙ ΣΕ ΣΥΝΑΡΤΗΣΕΙΣ ΔΙΑΚΡΙΣΗΣ Η περίπτωση του ταξινομητή Bayes Εκτίμηση μέγιστης εκ των υστέρων πιθανότητας MA 4

A ΠΑΡΑΜΕΤΡΙΚΟΙ ΤΑΞΙΝΟΜΗΤΕΣ ΒΑΣΙΣΜΕΝΟΙ ΣΕ ΣΥΝΑΡΤΗΣΕΙΣ ΔΙΑΚΡΙΣΗΣ Η περίπτωση του ταξινομητή Bayes Εκτίμηση μέγιστης εκ των υστέρων πιθανότητας MA - Παράδειγμα :, Σ, ά, X,..., 0 e l l : l 0 ή ˆ ˆ 0 MA 0 ˆ, ή για ˆ MA MA 0 For ˆ ML Σ Ι 5

A ΠΑΡΑΜΕΤΡΙΚΟΙ ΤΑΞΙΝΟΜΗΤΕΣ ΒΑΣΙΣΜΕΝΟΙ ΣΕ ΣΥΝΑΡΤΗΣΕΙΣ ΔΙΑΚΡΙΣΗΣ Η περίπτωση του ταξινομητή Bayes Η μέθοδος αναμονής-μεγιστοποίησης eecaio-maimizaio EM μοντέλα μίξης - miure models Μοντέλο μίξης: Σταθμισμένο άθροισμα dfs γνωστής παραμετρικής μορφής,, Η μέθοδος ML δεν μπορεί να αξιοποιηθεί εδώ εξαιτίας των ετικετών, που είναι επίσης άγνωστες. Λύση: Ο αλγόριθμος EM. Συμβολισμοί: = θ Θ=θ,,θ κ, =[,, ] T, Ξ=Θ,. X={,, }: μη πλήρες icomlee παρατηρούμενο σύνολο δεδομένων. X c ={,,,, }: πλήρες comlee σύνολο δεδομένων

A ΠΑΡΑΜΕΤΡΙΚΟΙ ΤΑΞΙΝΟΜΗΤΕΣ ΒΑΣΙΣΜΕΝΟΙ ΣΕ ΣΥΝΑΡΤΗΣΕΙΣ ΔΙΑΚΡΙΣΗΣ Η περίπτωση του ταξινομητή Bayes Η μέθοδος EM μοντέλα μίξης

Πρόβλημα: Για κάθε είναι άγνωστη η επιμέρους κατανομή της μίξης από την οποία προήλθε. Λύση: Μεγιστοποίηση της μέσης τιμής της log-lielihood ως προς Ξ Στόχος: Εκτίμηση των Θ και μέσω της ελαχιστοποίησης της λογαριθμικής συνάρτησης πιθανοφάνειας log-lielihood του πλήρους συν. δεδομένων. c Θ X l, l, l Η μέθοδος EM μοντέλα μίξης A ΠΑΡΑΜΕΤΡΙΚΟΙ ΤΑΞΙΝΟΜΗΤΕΣ ΒΑΣΙΣΜΕΝΟΙ ΣΕ ΣΥΝΑΡΤΗΣΕΙΣ ΔΙΑΚΡΙΣΗΣ Η περίπτωση του ταξινομητή Bayes E E l l l l

Επιπλέον πρόβλημα: Οι ποσότητες Ξ είναι άγνωστες. Λύση: Δεδομένου ότι από τον κανόνα του Bayes είναι Α Η λύση είναι ένας αναδρομικός αλγόριθμος. Αρχικοποιώντας το Ξ=Θ, στις τιμές Ξ0=Θ0,0 Εκτιμούμε τις Ξ0 από την Α E-se Υπολογίζουμε τη μέση τιμή της eeced log-lielihood με βάση τις Ξ0 M-se Μεγιστοποιούμε την QΞΞ0 ως προς τις παραμέτρους Ξ. A ΠΑΡΑΜΕΤΡΙΚΟΙ ΤΑΞΙΝΟΜΗΤΕΣ ΒΑΣΙΣΜΕΝΟΙ ΣΕ ΣΥΝΑΡΤΗΣΕΙΣ ΔΙΑΚΡΙΣΗΣ Η περίπτωση του ταξινομητή Bayes - Η μέθοδος EM μοντέλα μίξης l l 0 l 0 Q 0 0 0, 0 Q Q

A ΠΑΡΑΜΕΤΡΙΚΟΙ ΤΑΞΙΝΟΜΗΤΕΣ ΒΑΣΙΣΜΕΝΟΙ ΣΕ ΣΥΝΑΡΤΗΣΕΙΣ ΔΙΑΚΡΙΣΗΣ Η περίπτωση του ταξινομητή Bayes - Η μέθοδος EM μοντέλα μίξης Ο αλγόριθμος ΕΜ Αρχικοποίησε το Ξ=Θ, στις τιμές Ξ0=Θ0,0 =0 Επανέλαβε Εκτίμησε τις Ξ από την Α E-se Υπολόγισε τη μέση τιμή της eeced log-lielihood με βάση τις Ξ M-se Εκτίμησε το Ξ+ μεγιστοποιώντας την QΞΞ ως προς τις παραμέτρους Ξ=Θ, = θ, θ,,,. =+ Q Έως ότου επιτευχθεί σύγκλιση. l Q 0, Q 0

Ο αλγόριθμος EM για την περίπτωση μίξης κανονικών κατανομών. 0.5 e,,, / / T l Μίξη κανονικών κατανομών Miures of Gaussias. Η μέθοδος EM μοντέλα μίξης A ΠΑΡΑΜΕΤΡΙΚΟΙ ΤΑΞΙΝΟΜΗΤΕΣ ΒΑΣΙΣΜΕΝΟΙ ΣΕ ΣΥΝΑΡΤΗΣΕΙΣ ΔΙΑΚΡΙΣΗΣ Η περίπτωση του ταξινομητή Bayes T Q l 0.5 0.5l

Ο αλγόριθμος EM για την περίπτωση μίξης κανονικών κατανομών. - Αρχικοποίησε μ =μ 0, Σ =Σ 0, = 0 - =0 - Επανέλαβε =+, q q q q Θ T - Έως ότου ικανοποιηθεί ένα κατάλληλο κριτήριο τερματισμού A ΠΑΡΑΜΕΤΡΙΚΟΙ ΤΑΞΙΝΟΜΗΤΕΣ ΒΑΣΙΣΜΕΝΟΙ ΣΕ ΣΥΝΑΡΤΗΣΕΙΣ ΔΙΑΚΡΙΣΗΣ Η περίπτωση του ταξινομητή Bayes

A ΠΑΡΑΜΕΤΡΙΚΟΙ ΤΑΞΙΝΟΜΗΤΕΣ ΒΑΣΙΣΜΕΝΟΙ ΣΕ ΣΥΝΑΡΤΗΣΕΙΣ ΔΙΑΚΡΙΣΗΣ Ανασκόπηση του προσεγγιστικού ταξινομητή Bayes - Available daa: X=X X X M. Each X corresods o class ω. Σχεδιασμός ταξινομητή - Υιοθέτησε ένα μοντέλο df για κάθε ω, με άγνωστες παραμέτρους θ. - Εφάρμοσε την ML ή τις MA, EM μεθόδους M φορές μία για κάθε κλάση για την εκτίμηση των θ s, με βάση τα αντίστοιχα σύνολα X, -Προσέγγισε τις ω ως εξής ˆ -Όρισε g Χρήση ταξινομητή -Για δεδομένο, ˆ ˆ -Υπολόγισε τις τιμές των g, =,,M. ˆ ˆ -Καταχώρησε το στην κλάση με g =ma =,,M g. i

Ένα σημαντικό ζήτημα Η κατάρα της διαστατικότητας Curse of dimesioaliy Σε όλες τις μεθόδους που εξετάσαμε μέχρι στιγμής είδαμε ότι όσο μεγαλύτερος είναι ο αριθμός των σημείων, Ν, τόσο καλύτερες είναι και οι προκύπτουσες εκτιμήσεις. Αν στο μονοδιάστατο χώρο για ένα διάστημα μήκους L, Ν σημεία είναι αρκετά για να δώσουν μια καλή εκτίμηση των εμπλεκόμενων παραμέτρων, στο διδιάστατο χώρο για μια επιφάνεια διαστάσεων LL απαιτούνται Ν σημεία για να πάρουμε καλές εκτιμήσεις και, γενικά, στον l-διάστατο χώρο για έναν υπερκύβο διαστάσεων L l απαιτούνται l σημέια. Η εκθετική αύξηση του αριθμού των σημείων που απαιτούνται για μια καλή εκτίμηση των εμπλεκόμενων παραμέτρων με τη διάσταση του χώρου είναι γνωστή ως κατάρα της διαστατικότητας curse of dimesioaliy. Πρόκειται για ένα σημαντικό πρόβλημα που απαντάται σε προβλήματα που απεικονίζονται σε χώρους υψηλής διαστατικότητας.

A ΠΑΡΑΜΕΤΡΙΚΟΙ ΤΑΞΙΝΟΜΗΤΕΣ ΒΑΣΙΣΜΕΝΟΙ ΣΕ ΣΥΝΑΡΤΗΣΕΙΣ ΔΙΑΚΡΙΣΗΣ Ο απλοϊκός ταξινομητής Bayes aive Bayes classifier - Διαθέσιμα δεδομένα: X=X X X M. Κάθε X αντιστοιχεί στην κλάση ω. Έστω X =X X l -Υπόθεση: Όλα τα χαρακτηριστικά feaures είναι μεταξύ τους στατιστικώς ανεξάρτητα. Έτσι l,, M -Ως εκ τούτου, μπορούμε για κάθε κλάση να εργαστούμε για κάθε ω ανεξάρτητα από τις υπόλοιπες q ω, q=,,l, q.

A ΠΑΡΑΜΕΤΡΙΚΟΙ ΤΑΞΙΝΟΜΗΤΕΣ ΒΑΣΙΣΜΕΝΟΙ ΣΕ ΣΥΝΑΡΤΗΣΕΙΣ ΔΙΑΚΡΙΣΗΣ Ο απλοϊκός ταξινομητής Bayes aive Bayes classifier Σχεδιασμός ταξινομητή - Υιοθέτησε ένα μοντέλο df για κάθε ω, με άγνωστες παραμέτρους θ. - Εφάρμοσε την ML μέθοδο M l φορές l φορές για κάθε κλάση για την εκτίμηση των θ s των μονοδιάστατων ω, με βάση τα αντίστοιχα X -Προσέγγισε τις ω ως ακολούθως ˆ -Όρισε g Χρήση ταξινομητή -Για δεδομένο, -Υπολόγισε τις τιμές των g, =,,M. -Καταχώρησε το στην κλάση με g =ma =,,M g. i l ˆ ˆ ˆ ˆ

A ΠΑΡΑΜΕΤΡΙΚΟΙ ΤΑΞΙΝΟΜΗΤΕΣ ΒΑΣΙΣΜΕΝΟΙ ΣΕ ΣΥΝΑΡΤΗΣΕΙΣ ΔΙΑΚΡΙΣΗΣ Γραμμικοί ταξινομητές Ο ταξινομητής ελάχιστης Ευκλείδειας απόστασης - Διαθέσιμα δεδομένα: X=X X X M. Κάθε X αντιστοιχεί στην κλάση ω. Σχεδιασμός ταξινομητή - Εκτίμησε το μέσο διάνυσμα, m, κάθε κλάσης ω, με βάση το X, =,,. συνήθως, η μέθοδος ML χρησιμοποιείται για κάθε κλάση, με την υπόθεση ότι κάθε κλάση μοντελοποιείται από μια κανονική κατανομή αγνώστου μέσου διανύσματος και το m τίθεται ίσο με την προκύπτουσα εκτίμηση του μέσου διανύσματος ΣΗΜ: Γενικά, ο ταξινομητής -Όρισε ελάχιστης Ευκλείδειας απόστασης g =--m δεν είναι βέλτιστος ως προς το κριτήριο της πιθανότητας λάθους Χρήση ταξινομητή κάτω από ποιές συνθήκες ο -Για δεδομένο, ταξινομητής αυτός θα μπορούσε να -Υπολόγισε τις τιμές των g, =,,M. είναι βέλτιστος -Καταχώρησε το στην κλάση με g =ma =,,M g.

A ΠΑΡΑΜΕΤΡΙΚΟΙ ΤΑΞΙΝΟΜΗΤΕΣ ΒΑΣΙΣΜΕΝΟΙ ΣΕ ΣΥΝΑΡΤΗΣΕΙΣ ΔΙΑΚΡΙΣΗΣ Γραμμικοί ταξινομητές Ο ταξινομητής ελάχιστης Mahalaobis απόστασης - Διαθέσιμα δεδομένα: X=X X X M. Κάθε X αντιστοιχεί στην κλάση ω. Σχεδιασμός ταξινομητή - Εκτίμησε το μέσο διάνυσμα, m, και το μητρώο συνδιασποράς, S, κάθε κλάσης ω, με βάση το X, =,,. συνήθως, η μέθοδος ML χρησιμοποιείται για κάθε κλάση, με την υπόθεση ότι κάθε κλάση μοντελοποιείται από μια κανονική κατανομή αγνώστου μέσου διανύσματος και μητρώου συνδιασποράς και τα m και S, τίθενται ίσα με τις προκύπτουσες εκτιμήσεις το κοινό μητρώο συνδιασποράς μπορεί να τεθεί ίσο με το μέσο των εκτιμήσεων για τα S ΣΗΜ: Γενικά, ο ταξινομητής -Όρισε ελάχιστης Mahalaobis απόστασης g =--m T S - -m δεν είναι βέλτιστος ως προς το κριτήριο της πιθανότητας λάθους Χρήση ταξινομητή κάτω από ποιές συνθήκες ο -Για δεδομένο, ταξινομητής αυτός θα μπορούσε να -Υπολόγισε τις τιμές των g, =,,M. είναι βέλτιστος -Καταχώρησε το στην κλάση με g =ma =,,M g.

A ΠΑΡΑΜΕΤΡΙΚΟΙ ΤΑΞΙΝΟΜΗΤΕΣ ΒΑΣΙΣΜΕΝΟΙ ΣΕ ΣΥΝΑΡΤΗΣΕΙΣ ΔΙΑΚΡΙΣΗΣ Τετραγωνικοί ταξινομητές - Διαθέσιμα δεδομένα: X=X X X M. Κάθε X αντιστοιχεί στην κλάση ω. Σχεδιασμός ταξινομητή - Εκτίμησε το μέσο διάνυσμα, m, και το μητρώο συνδιασποράς, S, κάθε κλάσης ω, με βάση το X, =,,. συνήθως, η μέθοδος ML χρησιμοποιείται για κάθε κλάση, με την υπόθεση ότι κάθε κλάση μοντελοποιείται από μια κανονική κατανομή αγνώστου μέσου διανύσματος και μητρώου συνδιασποράς και τα m και S, τίθενται ίσα με τις προκύπτουσες εκτιμήσεις -Όρισε g =--m T S - -m Χρήση ταξινομητή -Για δεδομένο, -Υπολόγισε τις τιμές των g, =,,M. -Καταχώρησε το στην κλάση με g =ma =,,M g. ΣΗΜ: Γενικά, ο τετραγωνικός ταξινομητής δεν είναι βέλτιστος ως προς το κριτήριο της πιθανότητας λάθους κάτω από ποιές συνθήκες ο ταξινομητής αυτός θα μπορούσε να είναι βέλτιστος