Αναγνώριση Προτύπων. Σημερινό Μάθημα

Σχετικά έγγραφα
Αναγνώριση Προτύπων. Σημερινό Μάθημα

όπου ω j η κλάση j και x το διάνυσμα χαρακτηριστικών Ένας τυπικός κανόνας απόφασης είναι να επιλέγουμε την κλάση με τη μέγιστη P[ω j x]

Αναγνώριση Προτύπων. Σημερινό Μάθημα

Αναγνώριση Προτύπων. Σήμερα! Λόγος Πιθανοφάνειας Πιθανότητα Λάθους Κόστος Ρίσκο Bayes Ελάχιστη πιθανότητα λάθους για πολλές κλάσεις

Αναγνώριση Προτύπων. Σημερινό Μάθημα

Ο Ισχυρός Νόμος των Μεγάλων Αριθμών

Εφαρμογές στην κίνηση Brown

Αποδεικτικές Διαδικασίες και Μαθηματική Επαγωγή.

«ΔΙΑΚΡΙΤΑ ΜΑΘΗΜΑΤΙΚΑ»

{ i f i == 0 and p > 0

Επίλυση ειδικών μορφών ΣΔΕ

Ας υποθέσουμε ότι ο παίκτης Ι διαλέγει πρώτος την τυχαιοποιημένη στρατηγική (x 1, x 2 ), x 1, x2 0,

Το κράτος είναι φτιαγμένο για τον άνθρωπο και όχι ο άνθρωπος για το κράτος. A. Einstein Πηγή:

Εισαγωγικά. 1.1 Η σ-αλγεβρα ως πληροφορία

Εξαναγκασμένες ταλαντώσεις, Ιδιοτιμές με πολλαπλότητα, Εκθετικά πινάκων. 9 Απριλίου 2013, Βόλος

ΣΧΟΛΙΚΟ ΕΤΟΣ ΕΥΘΥΓΡΑΜΜΗ ΟΜΑΛΗ ΚΙΝΗΣΗ ΤΡΙΩΡΗ ΓΡΑΠΤΗ ΕΞΕΤΑΣΗ ΣΤΗ ΦΥΣΙΚΗ A ΛΥΚΕΙΟΥ. Ονοματεπώνυμο Τμήμα

ΜΙΚΡΟΟΙΚΟΝΟΜΙΚΗ Η ΚΑΤΑΝΑΛΩΤΙΚΗ ΑΠΟΦΑΣΗ. Άσκηση με θέμα τη μεγιστοποίηση της χρησιμότητας του καταναλωτή

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ ΜΑΘΗΜΑ: ΕΡΩΤΗΣΕΙΣ ΟΙΚΟΝΟΜΙΚΗΣ ΘΕΩΡΙΑΣ

Συναρτήσεις. Σημερινό μάθημα

17 Μαρτίου 2013, Βόλος

602. Συναρτησιακή Ανάλυση. Υποδείξεις για τις Ασκήσεις

5.1 Μετρήσιμες συναρτήσεις

Martingales. 3.1 Ορισμός και παραδείγματα

Αναλυτικές ιδιότητες

Ο όρος εισήχθηκε το 1961 από τον Bellman Αναφέρεται στο πρόβλημα της ανάλυσης δεδομένων πολλών μεταβλητών καθώς αυξάνει η διάσταση.

Ψηφιακή Εικόνα. Σημερινό μάθημα!

Εστω X σύνολο και A μια σ-άλγεβρα στο X. Ονομάζουμε το ζεύγος (X, A) μετρήσιμο χώρο.

Ανεξαρτησία Ανεξαρτησία για οικογένειες συνόλων και τυχαίες μεταβλητές

Ταξινόμηση των μοντέλων διασποράς ατμοσφαιρικών ρύπων βασισμένη σε μαθηματικά κριτήρια.

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ ΜΑΘΗΜΑ: ΟΙΚΟΝΟΜΙΚΗ ΘΕΩΡΙΑ

Αναγνώριση Προτύπων 1

Παντού σε αυτό το κεφάλαιο, αν δεν αναφέρεται κάτι διαφορετικό, δουλεύουμε σε ένα χώρο πιθανότητας (Ω, F, P) και η G F είναι μια σ-άλγεβρα.

Αναγνώριση Προτύπων. Σημερινό Μάθημα

Η εξίσωση Black-Scholes

Η ανισότητα α β α±β α + β με α, β C και η χρήση της στην εύρεση ακροτάτων.

Οι γέφυρες του ποταμού... Pregel (Konigsberg)

Μονάδες α. Να γράψετε στο τετράδιό σας τον παρακάτω πίνακα σωστά συµπληρωµένο.

Γενικό Λύκειο Μαραθοκάμπου Σάμου. Άλγεβρα Β λυκείου. 13 Οκτώβρη 2016

Το υπόδειγμα IS-LM: Εισαγωγικά

Ο τύπος του Itô. f (s) ds (12.1) f (g(s)) dg(s). (12.2) t f (B s ) db s + 1 2

Ανελίξεις σε συνεχή χρόνο

Κεφάλαιο Η εκθετική κατανομή. Η πυκνότητα πιθανότητας της εκθετικής κατανομής δίδεται από την σχέση (1.1) f(x) = 0 αν x < 0.

1. Εστω ότι A, B, C είναι γενικοί 2 2 πίνακες, δηλαδή, a 21 a, και ανάλογα για τους B, C. Υπολογίστε τους πίνακες (A B) C και A (B C) και

Στοχαστικές διαφορικές εξισώσεις

Παραβολή ψ=αχ 2 +βχ+γ, α 0. Η παραβολή ψ = αχ 2. Γενικά : Κάθε συνάρτηση της μορφής ψ=αχ 2 + βχ +γ, α 0 λέγεται τετραγωνική συνάρτηση.

ΨΗΦΙΑΚΑ ΗΛΕΚΤΡΟΝΙΚΑ Σχεδίαση Λογικών Κυκλωμάτων

Ευρωπαϊκά παράγωγα Ευρωπαϊκά δικαιώματα

Ανεξαρτησία Ανεξαρτησία για οικογένειες συνόλων και τυχαίες μεταβλητές

Ανεξαρτησία Ανεξαρτησία για οικογένειες συνόλων και τυχαίες μεταβλητές

Εκφωνήσεις και Λύσεις των Θεμάτων

Έννοια. Η αποδοχή της κληρονομίας αποτελεί δικαίωμα του κληρονόμου, άρα δεν

Χαρακτηριστικές συναρτήσεις

Σχέσεις και ιδιότητές τους

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ. Εαρινό Εξάμηνο

Εισαγωγή στη Μιγαδική Ανάλυση. (Πρώτη Ολοκληρωμένη Γραφή)

Επίλυση δικτύων διανομής

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ. Εαρινό Εξάμηνο

Επιχειρησιακή Ερευνα Ι

Δ Ι Α Κ Ρ Ι Τ Α Μ Α Θ Η Μ Α Τ Ι Κ Α. 1η σειρά ασκήσεων

Μεγάλες αποκλίσεις* 17.1 Η έννοια της μεγάλης απόκλισης

ΑΠΟΛΥΤΗΡΙΕΣ ΕΞΕΤΑΣΕΙΣ Γ ΤΑΞΗΣ ΗΜΕΡΗΣΙΟΥ ΓΕΝΙΚΟΥ ΛΥΚΕΙΟΥ ΕΞΕΤΑΖΟΜΕΝΟ ΜΑΘΗΜΑ: ΑΡΧΕΣ ΟΙΚΟΝΟΜΙΚΗΣ ΘΕΩΡΙΑΣ ΜΑΘΗΜΑ ΕΠΙΛΟΓΗΣ Γ ΛΥΚΕΙΟΥ

ΜΑΘΗΜΑ: ΟΙΚΟΝΟΜΙΚΗ ΘΕΩΡΙΑ

τους στην Κρυπτογραφία και τα

HY 280. θεμελιακές έννοιες της επιστήμης του υπολογισμού ΑΣΚΗΣΕΙΣ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ ΤΜΗΜΑ ΕΠΙΣΤΗΜΗΣ ΥΠΟΛΟΓΙΣΤΩΝ. Γεώργιος Φρ.

ιάσταση του Krull Α.Π.Θ. Θεσσαλονίκη Χ. Χαραλαμπους (ΑΠΘ) ιάσταση του Krull Ιανουάριος, / 27

21/11/2005 Διακριτά Μαθηματικά. Γραφήματα ΒΑΣΙΚΗ ΟΡΟΛΟΓΙΑ : ΜΟΝΟΠΑΤΙΑ ΚΑΙ ΚΥΚΛΟΙ Δ Ι. Γεώργιος Βούρος Πανεπιστήμιο Αιγαίου

Προτεινόμενα θέματα στο μάθημα. Αρχές Οικονομικής Θεωρίας ΟΜΑΔΑ Α. Στις προτάσεις από Α.1. μέχρι και Α10 να γράψετε στο τετράδιό σας τον αριθμό της

E n. (, ) Η χρονοεξαρτώµενη εξίσωση Schrödinger, έχει την µορφή ˆ

Εισαγωγικές Διαλέξεις στην Θεωρία των Αλυσίδων Markov και των Στοχαστικών Ανελίξεων. Οικονομικό Πανεπιστήμιο Αθηνών

ΑΡΧΗ 1ΗΣ ΣΕΛΙΔΑΣ Γ ΤΑΞΗ

Μεγάλες αποκλίσεις* 17.1 Η έννοια της μεγάλης απόκλισης

Συναρτήσεις & Κλάσεις

ΕΦΑΡΜΟΓΗ ΤΗΣ ΠΛΗΡΟΦΟΡΙΑΚΗΣ ΕΝΤΡΟΠΙΑΣ ΣΤΗΝ ΠΥΡΗΝΙΚΗ ΦΥΣΙΚΗ ΚΑΙ ΤΗ ΣΚΕ ΑΣΗ Ι ΑΚΤΟΡΙΚΗ ΙΑΤΡΙΒΗ

Pointers. Σημερινό Μάθημα! Χρήση pointer Τελεστής * Τελεστής & Γενικοί δείκτες Ανάκληση Δέσμευση μνήμης new / delete Pointer σε αντικείμενο 2

ΠΡΟΑΓΩΓΙΚΕΣ ΕΞΕΤΑΣΕΙΣ Β ΤΑΞΗΣ ΕΝΙΑΙΟΥ ΛΥΚΕΙΟΥ ΣΑΒΒΑΤΟ 27 ΜΑΪΟΥ 2000 ΕΞΕΤΑΖΟΜΕΝΟ ΜΑΘΗΜΑ ΘΕΤΙΚΗΣ ΚΑΤΕΥΘΥΝΣΗΣ: ΧΗΜΕΙΑ ΣΥΝΟΛΟ ΣΕΛΙ ΩΝ: ΕΞΙ (6)

Περίληψη. του Frostman 4.1. Τέλος, η ϑεωρία του μέτρου Hausdorff αναπτύσσεται περαιτέρω στην τελευταία παράγραφο. Εισαγωγή 2

Εκφωνήσεις και Λύσεις των Θεμάτων

Πανεπιστήμιο Πειραιώς. Πρόγραμμα Μεταπτυχιακών Σπουδών Αναλογιστική Επιστήμη και Διοικητική Κινδύνου

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ. Πρώτη Γραπτή Εργασία. Εισαγωγή στους υπολογιστές Μαθηματικά

Κατασκευή της κίνησης Brown και απλές ιδιότητες

ΑΣΚΗΣΕΙΣ ΔΙΚΤΥΑ ΠΡΟΣΒΑΣΗΣ ΑΣΚΗΣΗ 1

ΑΡΧΗ 1ΗΣ ΣΕΛΙ ΑΣ Γ ΤΑΞΗ

Πιθανότητες ΙΙ 1 o Μέρος. Οικονομικό Πανεπιστήμιο Αθηνών

Περιγραφή Περιγράμματος

"Η απεραντοσύνη του σύμπαντος εξάπτει τη φαντασία μου. Υπάρχει ένα τεράστιο σχέδιο, μέρος του οποίου ήμουν κι εγώ".

ΣΤΟ ΦΑΡΜΑΚΕΙΟ. Με την πιστοποίηση του έχει πρόσβαση στο περιβάλλον του φαρμακείου που παρέχει η εφαρμογή.

Κληρονομικότητα. Σήμερα! Κλάση Βάσης Παράγωγη κλάση Απλή κληρονομικότητα Protected δεδομένα Constructors & Destructors overloading

Εισαγωγικές Διαλέξεις στην Θεωρία των Αλυσίδων Markov και των Στοχαστικών Ανελίξεων. Οικονομικό Πανεπιστήμιο Αθηνών

Εξέταση Ηλεκτρομαγνητισμού Ι 2 Φεβρουαρίου 2018

Κεφάλαιο 1. Πίνακες και απαλοιφή Gauss

ΕΙΣΑΓΩΓΗ. H λογική ασχολείται με δύο έννοιες, την αλήθεια και την απόδειξη. Oι έννοιες αυτές έχουν γίνει

Αρτιες και περιττές συναρτήσεις

Μεγάλες αποκλίσεις* 17.1 Η έννοια της μεγάλης απόκλισης

ΑΡΧΗ 1ΗΣ ΣΕΛΙ ΑΣ Β ΤΑΞΗ. ΘΕΜΑ 1ο

G περιέχει τουλάχιστον μία ακμή στο S. spanning tree στο γράφημα G.

Τρίτη, 05 Ιουνίου 2001 ΤΕΧΝΟΛΟΓΙΚΗ ΚΑΤΕΥΘΥΝΣΗ Γ ΛΥΚΕΙΟΥ ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ ΠΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ ΠΕΡΙΒΑΛΛΟΝ

ΕΙΣΑΓΩΓΗ ΣΤΟN ΣΤΟΧΑΣΤΙΚΟ ΛΟΓΙΣΜΟ

ΕΙΣΑΓΩΓΗ ΣΤΟN ΣΤΟΧΑΣΤΙΚΟ ΛΟΓΙΣΜΟ

τεσσάρων βάσεων δεδομένων που θα αντιστοιχούν στους συνδρομητές

Αναγνώριση Προτύπων. Σημερινό Μάθημα

Transcript:

Αναγνώριση Προτύπων Σημερινό Μάθημα Μη Παραμετρικός Υπολογισμός πυκνότητας με εκτίμηση Ιστόγραμμα Παράθυρα Parzen Εξομαλυμένη Kernel Ασκήσεις 1

Μη Παραμετρικός Υπολογισμός πυκνότητας με εκτίμηση Κατά τη θεωρία του Bayes υποθέταμε ότι γνωρίζαμε τη συνάρτηση πιθανοφάνειας p(x/ω i ). Υπάρχουν όμως περιπτώσεις που χρειάζεται να εκτιμήσουμε τη συνάρτηση πυκνότητας πιθανότητας από τα δεδομένα ΕΚΤΙΜΗΣΗ Ιστόγραμμα Η πιο απλή μορφή μη παραμετρικής εκτίμησης πυκνότητας είναι το ιστόγραμμα εκτίμησης πυκνότητας είναι το ιστόγραμμα Χωρίζει το δειγματοχώρο σε μικρές περιοχές και προσεγγίζει την πυκνότητα από το πλήθος των δειγμάτων που εμπίπτουν στην κάθε περιοχή. 2

Ιστόγραμμα Μειονεκτήματα Το τελικό σχήμα της συνάρτησης πυκνότητας πιθανότητας εξαρτάται από το σημείο εκκίνησης των περιοχών Η φαινομενική συνέχεια στα δεδομένα εξαρτάται από την επιλογή των περιοχών Σε προβλήματα πολλών διαστάσεων θα απαιτούνται πολλά δείγματα αλλιώς ο σχηματισμός θα είναι ελλιπής. Γενική διατύπωση εκτίμησης Η πιθανότητα ένα διάνυσμα x, με κατανομή p(x), να ανήκει σε μια περιοχή R είναι: P = p( x') dx' R Αν υποθέσουμε ότι Ν είναι τα δείγματα της κατανομής, η πιθανότητα να ανήκουν k σηνπεροχήr στην περιοχή R, είναι: P( k) P k k k = (1 ) P 3

Γενική διατύπωση εκτίμησης Από τις ιδιότητες των διωνυμικών κατανομών έχουμε: k E = P Var k = E P P(1 P) = Που σημαίνει ότι όταν Ν η κατανομή γίνεται πιο αιχμηρή, άρα μπορούμε να θεωρήσουμε ότι μία καλή εκτίμηση της P είναι το μέσο των σημείων που εμπίπτουν στην R: P k k 2 Γενική διατύπωση εκτίμησης Αν υποθέσουμε ότι η περιοχή R είναι τόσο μικρή που η p(x) δεν αλλάζει: R p ( x') dx' p( x) V Και συνδυάζοντας με το προηγούμενο αποτέλεσμα: P = p x dx p x V ( ') ' ( ) R k p x k ( ) P V Ο υπολογισμός είναι πιο ακριβής όσο αυξάνει το πλήθος των δειγμάτων Ν και μικραίνει ο όγκος V 4

Γενική διατύπωση εκτίμησης Στην προηγούμενη σχέση ο συνολικός αριθμός δειγμάτων Ν είναι σταθερός Για να βελτιωθεί η ακρίβεια στην εκτίμηση του p(x) μπορούμε να ελαχιστοποιήσουμε τον όγκο (σχεδόν 0), αλλά τότε η περιοχή R θα γίνει τόσο μικρή που δεν θα περιέχει πρακτικά δείγματα Άρα θα πρέπει να γίνει ένας συμβιβασμός ώστε το V να είναι αρκετά μεγάλο για να περιέχει αρκετά δείγματα και αρκετά μικρό ώστε να στηρίζεται η υπόθεση ότι το p(x) παραμένει σταθερό εντός της R Γενική διατύπωση εκτίμησης Στην πράξη δύο προσεγγίσεις ακολουθούνται: Μπορούμε να επιλέξουμε μια σταθερή τιμή για τον όγκο V και να υπολογίσουμε τα περιεχόμενα δείγματα από τα δεδομένα (Εκτίμηση Πυκνότητας Kernel) Μπορούμε να ορίσουμε σταθερό αριθμό δειγμάτων k και να υπολογίσουμε τον αντίστοιχο όγκο V από τα δεδομένα (k earest eighbours) Αποδεικνύεται ότι και οι δύο πιο πάνω προσεγγίσεις συγκλίνουν στην πραγματική τιμή της συνάρτησης πυκνότητας πιθανότητας όταν, δεδομένου ότι ο όγκος V συρρικνώνεται και το k μεγαλώνει με το, 5

Παράθυρα Parzen Αν υποθέσουμε ότι η περιοχή R που περικλείει k δείγματα είναι ένας κύβος πλευράς h κεντραρισμένος στο σημείο εκτίμησης x, ο όγκος είναι V=h D. Για να βρούμε τον αριθμό των δειγμάτων στην περιοχή ορίζουμε την Kernel συνάρτηση: 1 u < j = D j 1/ 2 1,..., K( u) = 0 αλλιως Παράθυρα Parzen Αυτή η συνάρτηση, μοναδιαίου υπερκύβου κεντραρισμένο στο x, ονομάζεται παράθυρο Parzen Η ποσότητα K((x x (n )/h) ισούται με τη μονάδα αν το σημείο x (n βρίσκεται μέσα στον κύβο. 6

Ο συνολικός αριθμός δειγμάτων μέσα στον κύβο είναι: k = Και αν αντικαταστήσουμε στην έκφραση εκτίμησης η της πυκνότητας πιθανότητας: Παράθυρα Parzen n= 1 x x K h ( n p( x) = 1 h D n= 1 x x K h ( n Παράθυρα Parzen Άσκηση Βάσει των δεδομένων που ακολουθούν, χρησιμοποίησε τα παράθυρα Parzen να υπολογίσετε τη συνάρτηση πυκνότητας πιθανότητας στα σημεία y=3,10,15. Χρησιμοποιήστε h=4 X = (1 (2 ( { x, x,..., x } = { 4,5,5,6,12,14,15,15,16,17} 7

Παράθυρα Parzen Λύση Αν παραστήσουμε τα δεδομένα σε έναν άξονα, έχουμε: Εξομαλυμένη Kernel Το παράθυρο Parzen παρουσιάζει κάποια μειονεκτήματα: Ασυνέχεια Λαμβάνει υπόψη εξίσου όλα τα σημεία ανεξάρτητα απόστασης τους από το x Για το λόγο αυτό χρησιμοποιείται μια εξομαλυμένη Kernel, που ικανοποιεί τη συνθήκη: K( x) dx = 1 R 8

Εξομαλυμένη Kernel Συνήθως η εξομαλυμένη Kernel έχει ακτινική συμμετρία και μοιάζει στη μορφή με τη Gaussian 1 1 K( x) = exp x ( ) Τ x D / 2 2π 2 Τότε η έκφραση εκτίμησης της συνάρτησης πυκνότητας παραμένει η ίδια όπως με τα παράθυρα Parzen ( n 1 p( x) = h D n= 1 x x K h Εξομαλυμένη Kernel Οι εξομαλυμένες συναρτήσεις Kernel μπορούν να θεωρηθούν ως άθροισμα εξογκωμάτων τοποθετημένων στα δεδομένα. Η συνάρτηση ρηηκαθορίζει ρζ το σχήμα και το h το πλάτος. 9

Επιλογή του εύρους ζώνης Το h καλείται παράμετρος εξομάλυνσης ή εύρους ζώνης. Η επιλογή του είναι κρίσιμη καθώς μεγάλη τιμή θα υπερ εξομαλύνει ενώ μικρή τιμή θα δυσκολεύει την προσέγγιση Επιλογή του εύρους ζώνης 10

Άσκηση Σχηματίστε ένα μονοδιάστατο παράθυρο Parzen γιαναεκτιμήσετε την πυκνότητα συνάρτησης p y από τα δείγματα: y (i) : 2.5, 2.8, 3.4, 4.2, 4.5, 4.7, 5.2, 5.6, 7.5 Χρησιμοποιήστε συνάρτηση τετραγωνικού παραθύρου με h1 h=1. y (i) : 2.5, 2.8, 3.4, 4.2, 4.5, 4.7, 5.2, 5.6, 7.5 Σύμφωνα με όσα έχουμε πει είναι: Λύση 1 x x p( x) = K D h n 1 h ( n = 11

Άσκηση Έστω P η πιθανότητα να συμβεί το Α, τότε η πιθανότητα να συμβεί το Α k φορές σε Ν ανεξάρτητα πειράματα δίνεται από τη διώνυμη κατανομή: Δίξ Δείξτε ότι Ε[k]=P k και var[k]=p(1 P) Λύση Θα χρησιμοποιήσουμε τη διώνυμη ταυτότητα Τότε 12

Λύση Επειδή ισχύει Έχουμε: Λύση Και τελικά: 13