Αναγνώριση Προτύπων. Σημερινό Μάθημα

Σχετικά έγγραφα
όπου ω j η κλάση j και x το διάνυσμα χαρακτηριστικών Ένας τυπικός κανόνας απόφασης είναι να επιλέγουμε την κλάση με τη μέγιστη P[ω j x]

Αναγνώριση Προτύπων. Σήμερα! Λόγος Πιθανοφάνειας Πιθανότητα Λάθους Κόστος Ρίσκο Bayes Ελάχιστη πιθανότητα λάθους για πολλές κλάσεις

Αναγνώριση Προτύπων. Σημερινό Μάθημα

Αναγνώριση Προτύπων. Σημερινό Μάθημα

Αναγνώριση Προτύπων. Σημερινό Μάθημα

Αποδεικτικές Διαδικασίες και Μαθηματική Επαγωγή.

{ i f i == 0 and p > 0

Ο όρος εισήχθηκε το 1961 από τον Bellman Αναφέρεται στο πρόβλημα της ανάλυσης δεδομένων πολλών μεταβλητών καθώς αυξάνει η διάσταση.

Εισαγωγικά. 1.1 Η σ-αλγεβρα ως πληροφορία

Εφαρμογές στην κίνηση Brown

5.1 Μετρήσιμες συναρτήσεις

Αναγνώριση Προτύπων. Σημερινό Μάθημα

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ ΜΑΘΗΜΑ: ΕΡΩΤΗΣΕΙΣ ΟΙΚΟΝΟΜΙΚΗΣ ΘΕΩΡΙΑΣ

Εστω X σύνολο και A μια σ-άλγεβρα στο X. Ονομάζουμε το ζεύγος (X, A) μετρήσιμο χώρο.

Αναγνώριση Προτύπων 1

Ταξινόμηση των μοντέλων διασποράς ατμοσφαιρικών ρύπων βασισμένη σε μαθηματικά κριτήρια.

Σχέσεις και ιδιότητές τους

Εκφωνήσεις και Λύσεις των Θεμάτων

ΑΡΧΗ 1ΗΣ ΣΕΛΙΔΑΣ Γ ΤΑΞΗ

«ΔΙΑΚΡΙΤΑ ΜΑΘΗΜΑΤΙΚΑ»

Ψηφιακή Εικόνα. Σημερινό μάθημα!

Η ανισότητα α β α±β α + β με α, β C και η χρήση της στην εύρεση ακροτάτων.

Ας υποθέσουμε ότι ο παίκτης Ι διαλέγει πρώτος την τυχαιοποιημένη στρατηγική (x 1, x 2 ), x 1, x2 0,

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ. Εαρινό Εξάμηνο

ΤΑΞΙΝΟΜΗΣΗ ΟΡΓΑΝΙΣΜΩΝ

ΣΧΟΛΙΚΟ ΕΤΟΣ ΕΥΘΥΓΡΑΜΜΗ ΟΜΑΛΗ ΚΙΝΗΣΗ ΤΡΙΩΡΗ ΓΡΑΠΤΗ ΕΞΕΤΑΣΗ ΣΤΗ ΦΥΣΙΚΗ A ΛΥΚΕΙΟΥ. Ονοματεπώνυμο Τμήμα

Αλγόριθμοι & Βελτιστοποίηση

Παντού σε αυτό το κεφάλαιο, αν δεν αναφέρεται κάτι διαφορετικό, δουλεύουμε σε ένα χώρο πιθανότητας (Ω, F, P) και η G F είναι μια σ-άλγεβρα.

Τρίτη, 05 Ιουνίου 2001 ΤΕΧΝΟΛΟΓΙΚΗ ΚΑΤΕΥΘΥΝΣΗ Γ ΛΥΚΕΙΟΥ ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ ΠΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ ΠΕΡΙΒΑΛΛΟΝ

Ανεξαρτησία Ανεξαρτησία για οικογένειες συνόλων και τυχαίες μεταβλητές

Ο Ισχυρός Νόμος των Μεγάλων Αριθμών

Αναγνώριση Προτύπων. Σημερινό Μάθημα

602. Συναρτησιακή Ανάλυση. Υποδείξεις για τις Ασκήσεις

Pointers. Σημερινό Μάθημα! Χρήση pointer Τελεστής * Τελεστής & Γενικοί δείκτες Ανάκληση Δέσμευση μνήμης new / delete Pointer σε αντικείμενο 2

Προτεινόμενα θέματα στο μάθημα. Αρχές Οικονομικής Θεωρίας ΟΜΑΔΑ Α. Στις προτάσεις από Α.1. μέχρι και Α10 να γράψετε στο τετράδιό σας τον αριθμό της

Γενικό Λύκειο Μαραθοκάμπου Σάμου. Άλγεβρα Β λυκείου. 13 Οκτώβρη 2016

Ανελίξεις σε συνεχή χρόνο

Περιγραφή Περιγράμματος

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ. Εαρινό Εξάμηνο

Αναλυτικές ιδιότητες

Κατασκευή της κίνησης Brown και απλές ιδιότητες

Επίλυση ειδικών μορφών ΣΔΕ

Αναγνώριση Προτύπων. Σήμερα! Περιεχόμενο μαθήματος Διαδικαστικά Απαλλακτικές Εργασίες Εισαγωγή στο αντικείμενο του μαθήματος

Διανυσματικές Συναρτήσεις

Ανεξαρτησία Ανεξαρτησία για οικογένειες συνόλων και τυχαίες μεταβλητές

Οι γέφυρες του ποταμού... Pregel (Konigsberg)

Ο τύπος του Itô. f (s) ds (12.1) f (g(s)) dg(s). (12.2) t f (B s ) db s + 1 2

Αναγνώριση Προτύπων. Σημερινό Μάθημα

CSE.UOI : Μεταπτυχιακό Μάθημα

τεσσάρων βάσεων δεδομένων που θα αντιστοιχούν στους συνδρομητές

ΜΙΚΡΟΟΙΚΟΝΟΜΙΚΗ Η ΚΑΤΑΝΑΛΩΤΙΚΗ ΑΠΟΦΑΣΗ. Άσκηση με θέμα τη μεγιστοποίηση της χρησιμότητας του καταναλωτή

ΑΠΟΛΥΤΗΡΙΕΣ ΕΞΕΤΑΣΕΙΣ Γ ΤΑΞΗΣ ΗΜΕΡΗΣΙΟΥ ΓΕΝΙΚΟΥ ΛΥΚΕΙΟΥ ΕΞΕΤΑΖΟΜΕΝΟ ΜΑΘΗΜΑ: ΑΡΧΕΣ ΟΙΚΟΝΟΜΙΚΗΣ ΘΕΩΡΙΑΣ ΜΑΘΗΜΑ ΕΠΙΛΟΓΗΣ Γ ΛΥΚΕΙΟΥ

ΣΥΝΟΛΑ (προσέξτε τα κοινά χαρακτηριστικά των παρακάτω προτάσεων) Οι άνθρωποι που σπουδάζουν ΤΠ&ΕΣ και βρίσκονται στην αίθουσα

Επίλυση δικτύων διανομής

Το κράτος είναι φτιαγμένο για τον άνθρωπο και όχι ο άνθρωπος για το κράτος. A. Einstein Πηγή:

Δήμος Σωτήριος Υ.Δ. Εργαστήριο Λογικής & Επιστήμης Υπολογιστών. Τομέας Τεχνολογίας Πληροφορικής & Υπολογιστών Σ.Η.Μ.Μ.Υ. Ε.Μ.Π.

Συναρτήσεις. Σημερινό μάθημα

ΣΤΟ ΦΑΡΜΑΚΕΙΟ. Με την πιστοποίηση του έχει πρόσβαση στο περιβάλλον του φαρμακείου που παρέχει η εφαρμογή.

Martingales. 3.1 Ορισμός και παραδείγματα

Εκφωνήσεις και Λύσεις των Θεμάτων

G περιέχει τουλάχιστον μία ακμή στο S. spanning tree στο γράφημα G.

Επιλογή Χαρακτηριστικών Feature selection Αντικειμενική συνάρτηση Φίλτρα Wrappers Διαδικασία Αναζήτησης Σειριακοί αλγόριθμοι Εκθετικοί αλγόριθμοι

Εξαναγκασμένες ταλαντώσεις, Ιδιοτιμές με πολλαπλότητα, Εκθετικά πινάκων. 9 Απριλίου 2013, Βόλος

17 Μαρτίου 2013, Βόλος

21/11/2005 Διακριτά Μαθηματικά. Γραφήματα ΒΑΣΙΚΗ ΟΡΟΛΟΓΙΑ : ΜΟΝΟΠΑΤΙΑ ΚΑΙ ΚΥΚΛΟΙ Δ Ι. Γεώργιος Βούρος Πανεπιστήμιο Αιγαίου

Κληρονομικότητα. Σήμερα! Κλάση Βάσης Παράγωγη κλάση Απλή κληρονομικότητα Protected δεδομένα Constructors & Destructors overloading

Εισαγωγή στη Μιγαδική Ανάλυση. (Πρώτη Ολοκληρωμένη Γραφή)

Φροντιστήριο 2: Ανάλυση Αλγόριθμου. Νικόλας Νικολάου ΕΠΛ432: Κατανεμημένοι Αλγόριθμοι 1 / 10

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ ΜΑΘΗΜΑ: ΟΙΚΟΝΟΜΙΚΗ ΘΕΩΡΙΑ

Ανεξαρτησία Ανεξαρτησία για οικογένειες συνόλων και τυχαίες μεταβλητές

ΑΡΧΗ 1ΗΣ ΣΕΛΙ ΑΣ Β ΤΑΞΗ. ΘΕΜΑ 1ο

Περιεχόμενο μαθήματος Διαδικαστικά Απαλλακτικές Εργασίες Εισαγωγή στο αντικείμενο του μαθήματος

Δ Ι Α Κ Ρ Ι Τ Α Μ Α Θ Η Μ Α Τ Ι Κ Α. 1η σειρά ασκήσεων

Αλγόριθμοι & Βελτιστοποίηση Μεταπτυχιακό Μάθημα ΠΜΣ/ΕΤΥ 2η Ενότητα: Μοντελοποίηση Προβλημάτων ως ΓΠ, Ισοδυναμες Μορφές ΓΠ, Γεωμετρία Χωρου Λύσεων

Αντικειμενοστραφής. Προγραμματισμού

ΣΤΟ ΙΑΤΡΕΙΟ. Με την πιστοποίηση του αποκτά πρόσβαση στο περιβάλλον του ιατρού που παρέχει η εφαρμογή.

Μη επιβλεπόμενη εκπαίδευση (Clustering) Μη παραμετρική Μη επιβλεπόμενη εκπαίδευση Μέτρα εγγύτητας Αλγόριθμος k means ISODATA Ιεραρχικό clustering

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ. Πρώτη Γραπτή Εργασία. Εισαγωγή στους υπολογιστές Μαθηματικά

ΠΡΟΑΓΩΓΙΚΕΣ ΕΞΕΤΑΣΕΙΣ Β ΤΑΞΗΣ ΕΝΙΑΙΟΥ ΛΥΚΕΙΟΥ ΣΑΒΒΑΤΟ 27 ΜΑΪΟΥ 2000 ΕΞΕΤΑΖΟΜΕΝΟ ΜΑΘΗΜΑ ΘΕΤΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ: ΧΗΜΕΙΑ ΣΥΝΟΛΟ ΣΕΛΙ ΩΝ: ΕΞΙ (6)

«Εξατομικεύοντας την επιλογή των πόρων των ψηφιακών βιβλιοθηκών για την υποστήριξη της σκόπιμης μάθησης» Άννα Μαρία Ολένογλου

Συναρτήσεις & Κλάσεις

Παραβολή ψ=αχ 2 +βχ+γ, α 0. Η παραβολή ψ = αχ 2. Γενικά : Κάθε συνάρτηση της μορφής ψ=αχ 2 + βχ +γ, α 0 λέγεται τετραγωνική συνάρτηση.

τους στην Κρυπτογραφία και τα

Ισοπεριμετρικές ανισότητες για το

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ. Εαρινό Εξάμηνο

ΜΑΘΗΜΑ: ΟΙΚΟΝΟΜΙΚΗ ΘΕΩΡΙΑ

"Η απεραντοσύνη του σύμπαντος εξάπτει τη φαντασία μου. Υπάρχει ένα τεράστιο σχέδιο, μέρος του οποίου ήμουν κι εγώ".

Η εξίσωση Black-Scholes

Ring Routing and Wavelength Conversion. Γιώργος Ζώης

Μεγάλες αποκλίσεις* 17.1 Η έννοια της μεγάλης απόκλισης

ΕΙΣΑΓΩΓΗ. H λογική ασχολείται με δύο έννοιες, την αλήθεια και την απόδειξη. Oι έννοιες αυτές έχουν γίνει

Ασκήσεις Ανάλυση Ι Λύσεις ασκήσεων Οµάδας 1

Μεγάλες αποκλίσεις* 17.1 Η έννοια της μεγάλης απόκλισης

Επιχειρησιακή Ερευνα Ι

ΕΙΣΑΓΩΓΗ ΣΤΟN ΣΤΟΧΑΣΤΙΚΟ ΛΟΓΙΣΜΟ

ΕΙΣΑΓΩΓΗ ΣΤΟN ΣΤΟΧΑΣΤΙΚΟ ΛΟΓΙΣΜΟ

ΨΗΦΙΑΚΑ ΗΛΕΚΤΡΟΝΙΚΑ Σχεδίαση Λογικών Κυκλωμάτων

Kατάτμηση εικόνας. Σήμερα!

ΑΠΟΛΥΤΗΡΙΕΣ ΕΞΕΤΑΣΕΙΣ Γ ΤΑΞΗΣ ΕΝΙΑΙΟΥ ΛΥΚΕΙΟΥ ΤΕΤΑΡΤΗ 14 ΙΟΥΝΙΟΥ 2000 ΕΞΕΤΑΖΟΜΕΝΟ ΜΑΘΗΜΑ ΓΕΝΙΚΗΣ ΠΑΙΔΕΙΑΣ: ΦΥΣΙΚΗ ΣΥΝΟΛΟ ΣΕΛΙΔΩΝ: ΕΞΙ (6)

Κεφάλαιο Η εκθετική κατανομή. Η πυκνότητα πιθανότητας της εκθετικής κατανομής δίδεται από την σχέση (1.1) f(x) = 0 αν x < 0.

Transcript:

Αναγνώριση Προτύπων Σημερινό Μάθημα Εκτίμηση Πυκνότητας με k NN k NN vs Bayes classifier k NN vs Bayes classifier Ο κανόνας ταξινόμησης του πλησιέστερου γείτονα (k NN) lazy αλγόριθμοι O k NN ως χαλαρός (lazy) αλγόριθμος k NN vs ΝΝ

Εκτίμηση Πυκνότητας με k NN Επιλέγοντας σταθερή τιμή για το k και ορίζοντας ελάχιστο όγκο V στο σύνολο δεδομένων που περικλείει τα k σημεία, εφαρμόζουμε τη μέθοδο του k πλησιέστερου γείτονα (k Nearest Neighbor knn) Εκτίμηση Πυκνότητας με k NN Στη μέθοδο k NN μεγαλώνουμε τον όγκο που περικλείει το σημείο εκτίμησης ης x εωσότου περικλείει k σημεία δεδομένων. Τότε η εκτίμηση πυκνότητας γίνεται: k k P( x) NV N D c R ( x) Όπου R k (x) είναι η απόσταση μεταξύ του σημείου εκτίμησης και του k στού πλησιέστερου γείτονα. c D είναι ο όγκος της μοναδιαίας σφαίρας στις D διαστάσεις, και είναι: D / π cd ( D / )! c, c π, c 3 4π/3 κλπ D k

Εκτίμηση Πυκνότητας με k NN Vol πr P ( x ) k N πr Εκτίμηση Πυκνότητας με k NN Η εκτίμηση με k NN δεν είναι πολύ ικανοποιητική καθώς: Η προσέγγιση επηρεάζεται από τοπικό θόρυβο Καθώς η συνάρτηση R k (x) δεν είναι παραγωγίσιμη θα υπάρχουν ασυνέχειες. Το αποτέλεσμα θα αποκλίνει σε όλο το δειγματοχώρο 3

Εκτίμηση Πυκνότητας με knn για δύο Gaussians ( 0,) / ( 0,4) P ( x) / N + N Εκτίμηση Πυκνότητας με k NN Για δύο Gaussians όπου: p x) N( μ, Σ) + N( μ, ( Σ ) μ μ [ 0 5] [ 5 0 ] Τ Τ Σ Σ 4 Εκτίμηση για k0 γείτονες και Ν00 δείγματα 4

Εκτίμηση Πυκνότητας με k NN Πραγματικά περιγράμματα Eκτίμησης με knn k NN vs Bayes classifier Το μεγαλύτερο πλεονέκτημα της μεθόδου k NN είναι ότι αποτελεί μια πολύ απλή προσέγγιση του Bayes classifier Ας υποθέσουμε ότι έχουμε ένα σύνολο δεδομένων με N δείγματα και N i ανήκουν στην κλάση ω i και θέλουμε να ταξινομήσουμε άγνωστο δείγμα x u Θεωρούμε όγκο V γύρω από το x u με k δείγματα συνολικά και έστω k i από ω i. 5

knn vs Bayes classifier Μπορούμε να προσεγγίσουμε τη συνάρτηση πιθανότητας με k NN ως: k i P ( x ω i ) NiV Παρόμοια η συνάρτηση πυκνότητας θα είναι: Και οι εκ των προτέρων πιθανότητα Ni P(ω i ) N Αν τα βάλουμε όλα μαζί στο ταξινομητή Bayes P ( ω x) P ( x ωi ) P( ωi ) NiV N ki P( x) k k k i NV N i i P ( x) k NV Ο κανόνας ταξινόμησης του k πλησιέστερου γείτονα (k NN) Ο κανόνας του k Nearest Neighbor Rule (knn) είναι διαισθητική μέθοδο που ταξινομεί άγνωστα δείγματα με βάσει την ομοιότητα τους με τα δείγματα εκπαίδευσης. Για δεδομένο άγνωστο πρότυπο x u βρες τα k «κοντινότερα» δείγματα από τα δεδομένα εκπαίδευσης και απέδωσε το x u στην κλάση που εμφανίζεται πιο πολύ στο k υποσύνολο 6

Κανόνας k NN Απαιτεί μόνο: Έναν ακέραιο k Ένα σετ γνωστών δειγμάτων (σύνολο εκπαίδευσης) Ένα μέτρο «απόστασης» Κανόνας k NN Στο παράδειγμα έχουμε 3 κλάσεις και άγνωστο δείγμα x u Χρησιμοποιείται Ευκλείδεια απόσταση και k5 γείτονες 4 γείτονες ανήκουν στην ω και ανήκει στην ω 3 Το x u κατατάσσεται στην ω 7

k NN παράδειγμα Έχουμε δεδομένα για διδιάστατο πρόβλημα 3 κλάσεων όπως ςφαίνεται στο δείγμα Χρησιμοποιούμε k5 και Ευκλείδεια απόσταση k NN παράδειγμα Το ίδιο για άλλη διάταξη δεδομένων Χρησιμοποιούμε k5 και Ευκλείδεια απόσταση 8

O k NN ως χαλαρός (lazy) αλγόριθμος Ο knn ανήκει στην κατηγορία των χαλαρών αλγορίθμων: Επεξεργάζεται τα δεδομένα εκπαίδευσης αφού ζητηθεί ταξινόμηση Απαντάει στο αίτημα ταξινόμησης συνδυάζοντας τα αποθηκευμένα δεδομένα εκπαίδευσης Δεν λαμβάνει υπόψη λογική ή άλλα αποτελέσματα. lazy αλγόριθμοι Tradeoffs χαλαρών αλγορίθμων Έχουν μικρότερο υπολογιστικό κόστος κατά την εκπαίδευση Έχουν μεγαλύτερες απαιτήσεις αποθήκευσης και υπολογιστικό κόστος κατά την κλήση τους. 9

Χαρακτηριστικά του k NN Πλεονεκτήματα Απλή υλοποίηση Πολύ καλά αποτελέσματα για μεγάλο αριθμό δειγμάτων (N ) Μειονεκτήματα Μεγάλη απαίτηση σε αποθηκευτικό χώρο Υπολογιστικό κόστος στην κλήση Ευάλωτος στην «κατάρα πολυδιάστατων προβλημάτων» k NN vs ΝΝ Μεγάλο k σημαίνει πιο ομαλές περιοχές αποφάσεων Δίνει πιο σωστές πιθανοτικά πληροφορίες Δίνει πιο σωστές πιθανοτικά πληροφορίες Ωστόσο πολύ μεγάλο k μπορεί να χαλάσει την τοπικότητα της απόφασης Αυξάνει το υπολογιστικό κόστος 0

k NN vs ΝΝ Κατηγοριοποίησε τα σημεία A, B και C χρησιμοποιώντας για κατηγοριοποίηση τον κανόνα 5 ΝΝ και Ευκλείδεια απόσταση Άσκηση

Λύση Για το Α, για κάθε σημείο η Ευκλείδειος απόσταση θα είναι: d i ( y y ) + y y ( A) ( i) ( ( A) ( i) ) Άσκηση Αν εφαρμόσουμε τον k NN κανόνα απόφασης στο σχήμα της προηγούμενης ης άσκηση, η θα πάρουμε περιοχές απόφασης και όριο απόφασης για τις δύο κλάσεις. Αν y(i) είναι τα χαρακτηριστικά διανύσματα της κλάσης και s(i) της κλάσης, τότε σύμφωνα με τον ορισμό, κάθε σημείο του ορίου απόφασης θα πρέπει ικανοποιεί τη σχέση: ( i) ( i ) min d ( yˆ, y ) min d( yˆ, s ) Υποθέστε Ευκλείδεια απόσταση Α) ποια είναι η σχέση που καθορίζει το όριο απόφασης για μια περιοχή κοντά στο όριο αν ένα διάνυσμα y (i) είναι πιο κοντά στο όριο για την κλάση και το s (j) για την κλάση Β) σχεδιάστε ένα όριο απόφασης για τις δύο κλάσεις Γ) βρείτε τα στοιχεία που η μετακίνηση τους δεν αλλάζει το όριο i i

Λύση Για κάθε σημείο στο διάγραμμα ισχύει: ( ) ( ) ( ) [ ] Τ [ ] Τ () i () i () i j j j y y y, s s s Για σημείο ŷ του ορίου απόφασης ( i) ( j ) ( yˆ, y ) d yˆ s d, ( ) yˆ () i () i ( j ) ( yˆ y ) + ( yˆ y ) yˆ ˆ s + y ( j ) ( ) ( s ) ( j ) ( i) ( j ) ( i) () i ( j ) () i ( j ) ( ) ˆ s y + y ( s y ) + ( y ) ( s ) + ( y ) s ( ) 0 ( j ) ( i) ( j ) ( i) ( s y ) + yˆ s y () i ( j ) () i ( j ) ( ) + ( y ) ( s ) + ( y ) ( s ) 0 yˆ Λύση Θέτοντας ( j) ( i) ( j) ( i) a ( s y ) b ( s y ) c ( y ( i) ( j) ( i) ( j) ) ( s ) + ( y ) ( s ) Έχουμε ayˆ + byˆ + c 0 3

Λύση 4