HY8-Διακριτά Μαθηματικά Πέμπτη, 04/05/207 Θεωρία πιθανοτήτων Αντώνης Α. Αργυρός e-mal: argyros@csd.uoc.gr 04-May-7 04-May-7 2 2 Τι είδαμε την προηγούμενη φορά Μίατυχαία μεταβλητήvείναι κάθε μεταβλητή η τιμή της οποίας είναι άγνωστη, και η τιμή της οποίας εξαρτάται από τις συγκεκριμένες συνθήκες που επικρατούν κατά την εκτέλεση ενός πειράματος. Το πεδίο τηςv, dom[v] {v,,v n }, είναι το σύνολο όλων των δυνατών τιμών που η V μπορεί να πάρει. Ο δειγματικός χώροςωτου πειράματος είναι το πεδίο της τυχαίας μεταβλητής, Ω dom[v] (όπως είπαμε, το σύνολο όλων των δυνατών ενδεχομένων τιμών της). Ένα ενδεχόμενο Γ είναι ένα υποσύνολο του δειγματικού χώρου Ω Απλά / σύνθετα Ασυμβίβαστα Πιθανότητα: Αξιωματικός ορισμός Έστω p μία συνάρτηση p:ω [0,] τέτοια ώστε s Ω p(s), και 0 p(s), s Ω Τότε, η πιθανότητα κάθε ενδεχομένου Γ Ω είναι: p( ): p( s) Γ s Γ 04-May-7 3 3 04-May-7 4 4
Έστω 000 άτομα παρακολουθούν έναν αγώνα. Από αυτά, 55 είναι γυναίκες και 485 είναι άνδρες. Έστω επίσης ότι γνωρίζουμε ότι από τις 55 γυναίκες, οι 90 είναι φίλαθλοι και ότι από τους 485 άνδρες οι 302 είναι φίλαθλοι Πείραμα: τυχαία επιλογή ενός ατόμου. γφ: όλες οι γυναίκες φίλαθλοι γμ:όλες οι γυναίκες που δεν είναι φίλαθλοι αφ:όλοι οι άντρες φίλαθλοι αμ: όλοι οι άντρες που δεν είναι φίλαθλοι Δειγματικός χώρος Ω γφ γμ αφ αμ Τα γφ, γμ, αφ, αμ είναι ασυμβίβαστα, σύνθετα η ένωση των οποίων δίνει το δειγματικό χώρο 04-May-7 5 5 04-May-7 6 6 Έστω 000 άτομα παρακολουθούν έναν αγώνα. Από αυτά, 55 είναι γυναίκες και 485 είναι άνδρες. Ποια είναι η πιθανότητα να επιλέξουμε άτομο που είναι φίλαθλος ή είναι γυναίκα;(ω{γφ, γμ, αφ, αμ}) ος τρόπος 2 ος τρόπος 3 ος τρόπος 04-May-7 7 7 04-May-7 8 8 2
Ποια είναι η πιθανότητα να επιλέξουμε άντρα που δεν είναι φίλαθλος ή γυναίκα που είναι φίλαθλος; ος τρόπος Ανεξάρτητα Δύο E,Fονομάζονται ανεξάρτηταεάν και μόνο αν p(e F) p(e) p(f). Διαισθητικά, δύο είναι ανεξάρτητα αν και μόνο αν το να συμβεί το ένα δεν κάνει περισσότερο ή λιγότερο πιθανό το να συμβεί το άλλο. 2 ος τρόπος 04-May-7 9 9 04-May-7 0 0 Το προηγούμενο παράδειγμά μας:έστω ότι 000 άτομα παρακολουθούν έναν αγώνα. Από αυτά, 55 είναι γυναίκες και 485 είναι άνδρες. Ανεξάρτητα/ασυμβίβαστα Ερώτηση: Έστω δύο ασυμβίβαστα Α και Β με p(a)>0 και p(β)>0. Eίναι ανεξάρτητα; Φ Γ φίλαθλη γυναίκα > p(φ Γ) 0,09 p(φ) p(γ) 0,20 Αρα τα Φ και Γ δεν είναι ανεξάρτητα 04-May-7 04-May-7 2 2 3
Ανεξάρτητα/ασυμβίβαστα Ερώτηση: Έστω δύο ασυμβίβαστα Α και Β με p(a)>0 και p(β)>0. Eίναι ανεξάρτητα; Όχι! Εφόσον p(α)>0 και p(b)>0 και Α Β, τότε p(α Β) 0 p(α)p(b). Άρα ενώ τα Α και Β είναι ασυμβίβαστα, δεν είναι ανεξάρτητα. Ανεξάρτητα/ασυμβίβαστα Ερώτηση: Έστω δύο ανεξάρτητα Α και Β με p(a)>0 και p(β)>0. Είναι κατ ανάγκη ασυμβίβαστα; 04-May-7 3 3 04-May-7 4 4 Ανεξάρτητα/ασυμβίβαστα Ερώτηση: Έστω δύο ανεξάρτητα Α και Β με p(a)>0 και p(β)>0. Είναι κατ ανάγκη ασυμβίβαστα; Όχι! p(α)>0 και p(b)>0 Επίσης, εφόσον είναι ανεξάρτητα, p(α Β)p(Α)p(B) επομένως p(α Β) 0, Άρα Α Β Άρα ενώ τα Α και Β είναι ανεξάρτητα, δεν είναι ασυμβίβαστα. Έστω E, F. Τότε, η δεσμευμένη πιθανότητα του E δεδομένου του F, συμβολίζεται μεp(e F), και ορίζεται ως p(e F) : p(e F)/p(F). Αυτή είναι η πιθανότητα να συμβεί το E, αν μας δοθεί η πληροφορία ότι το ενδεχόμενο F θα συμβεί (είναι γεγονός). 04-May-7 5 5 04-May-7 6 6 4
, παράδειγμα, παράδειγμα Υποθέστε ότι τελείως τυχαία, επιλέγω ένα γράμμα από το αγγλικό αλφάβητο.ποιά είναι η πιθανότητα αυτό το γράμμα να είναι φωνήεν; z k y u x s o p n φωνήεν w r b c a t e d f g h l j v q m Ω τα γράμματα του Αγγλικού αλφαβήτου Υποθέστε ότι τελείως τυχαία, επιλέγω ένα γράμμα από το αγγλικό αλφάβητο.ποιά είναι η πιθανότητα αυτό το γράμμα να είναι φωνήεν; p(φ) (#φωνηέντων) / (#γραμμάτων) 6/26 φωνήεν z w k b c r y a t u d x e f s o g h l p n j v q m Ω τα γράμματα του Αγγλικού αλφαβήτου 04-May-7 7 7 04-May-7 8 8, παράδειγμα, παράδειγμα Υποθέστε ότι τελείως τυχαία, επιλέγω ένα γράμμα από το αγγλικό αλφάβητο.ποιά είναι η πιθανότητα αυτό το γράμμα να είναι φωνήεν; p(φ) (#φωνηέντων) / (#γραμμάτων) 6/26 Τώρα, υποθέστε ότι σας λέω ότι το επιλεγμένο γράμμα ανήκει στα 9 πρώτα γράμματα του αλφαβήτου. Τώρα, ποιά είναι η πιθανότητα το γράμμα να είναι φωνήεν, δοσμένης της επιπρόσθετης πληροφορίας; z k y u x s o p n φωνήεν α 9 γράμματα w a b c r t e d f g h l j v q m Ω τα γράμματα του Αγγλικού αλφαβήτου 04-May-7 9 9 Υποθέστε ότι τελείως τυχαία, επιλέγω ένα γράμμα από το αγγλικό αλφάβητο.ποιά είναι η πιθανότητα αυτό το γράμμα να είναι φωνήεν; p(φ) (#φωνηέντων) /(#γραμμάτων) 6/26 Τώρα, υποθέστε ότι σας λέω ότι το επιλεγμένο γράμμα ανήκει στα 9 πρώτα γράμματα του αλφαβήτου. Τώρα, ποιά είναι η πιθανότητα το γράμμα να είναι φωνήεν, δοσμένης της επιπρόσθετης πληροφορίας; p(φ 9 πρώτα γράμματα) (#φωνηέντων ΚΑΙ ανήκουν στα 9 α γράμματα) / 9 3/9. Άρα p(φ 9 πρώτα γράμματα) 3/9 z k y u x s o p n φωνήεν α 9 γράμματα w r b c a t d e f g h l j v q m Ω τα γράμματα του Αγγλικού αλφαβήτου 04-May-7 20 20 5
Εξήγηση της δεσμευμένης πιθανότητας Η πιθανότητα να συμβεί το E είναι p(e) (pror probablty) Εάν μας δοθεί η πληροφορία ότι ένα ενδεχόμενο Fσυνέβει, τότε η προσοχή μας εστιάζεται στην περιοχή F. Επομένως, η πιθανότητα να συμβεί το E δεδομένου ότι το F συμβαίνει προσδιορίζεται από εκείνα τα στοιχεία του Ω για τα οποία το Ε και το F συμβαίνουν ταυτόχρονα. Επομένως, η εκ των υστέρων (posteror) πιθανότητα για το E, είναι p(e F)p(E F)/p(F). Ενδεχόμενο E Ενδεχόμενο E F Ενδεχόμενο F Ω 04-May-7 2 2 04-May-7 22 22 Προσοχή! p( A B) p( A B) p( B) p( B A) p( B A) p( A) Επομένως, αν p(a) p(b), τότε p(a B) p(b A) Π.χ., έστω το πείραμα της ρίψης ενός ζαριού. Έστω Α έφερα 5 και Β έφερα περιττό αριθμό. Ποια είναι η p(a B); Ποια είναι η p(b A); p(a B)/3 ενώ p(b Α) 04-May-7 23 23 Έστω ότι ρίχνουμε ένα ζάρι τρεις φορές. Έστω τα Α {κάποια από τις 3 ζαριές κατέληξε σε } Β {οι 3 ζαριές κατέληξαν σε διαφορετικό αποτέλεσμα} Ποια είναι η p(a B); p(a B)p(A B)/p(B) p(b)p(6,3)/6 3 6!/(3!*6 3 ) p(a B)3 P(5,2)/6 3 3*5!/(3!*6 3 ) Άρα p(a B) 3*5!/6! 3/6 /2 04-May-7 24 24 6
Έστω ότι ρίχνουμε ένα ζάρι τρεις φορές. Έστω τα Α {κάποια από τις 3 ζαριές κατέληξε σε } Β {οι 3 ζαριές κατέληξαν σε διαφορετικό αποτέλεσμα} Ποια είναι η p(β Α); Έστω ότι ρίχνουμε ένα ζάρι τρεις φορές. Έστω τα Α {κάποια από τις 3 ζαριές κατέληξε σε } Β {οι 3 ζαριές κατέληξαν σε διαφορετικό αποτέλεσμα} Ποια είναι η p(β Α); p(β Α)p(Β Α)/p(Α) p(α)-p(α) -5 3 /6 3 Άρα 04-May-7 25 25 04-May-7 26 26 για ανεξάρτητα Εάν ταeκαι Fείναι ανεξάρτητα, τότε ισχύει ότι p(e F) p(e). p(e F) p(e F)/p(F) p(e)p(f)/p(f) p(e)...άρα, όταν δύο είναι ανεξάρτητα μεταξύ τους, η γνώση ότι συνέβη το ένα δεν επηρεάζει την εκτίμηση της πιθανότητας να συμβεί το άλλο! Ανεξάρτητα Έστω ότι ρίχνουμε δύο νομίσματα στη σειρά. Α {το ο νόμισμα τυχαίνει κορώνα (Κ)} Β {το 2 ο νόμισμα τυχαίνει διαφορετικό αποτέλεσμα από το ο νόμισμα} Είναι τα Α, Β ανεξάρτητα; Ναι, γιατί p(a B) ½ p(a) Επίσης, p(b A) ½ p(b) 04-May-7 27 27 04-May-7 28 28 7
Νόμος της ολικής πιθανότητας Για οποιαδήποτε δύο γεγονότα Εκαι F ισχύει ότι Ε Ε Ω Ε (F F) (Ε F) (E F) Τα (Ε F) και (E F) είναι ασυμβίβαστα Επομένως p(ε) p(ε F) +p(e F) και άρα p(ε) p(e F)p(F) + p(e F)p(F) Νόμος της ολικής πιθανότητας Γενικότερα, έστω σύνολο nενδεχομένων F που αποτελούν διαμέρισητου δειγματικού χώρου Ω. Έστω επίσης, ένα ενδεχόμενο Ε. Τότε: n p( E) p( E F) p( F) 04-May-7 29 29 04-May-7 30 30 Νόμος του Bayes Γνωρίζουμε ότι για Ε, F: p( F E) p( F E) p( E) Επίσης: p( E F) p( E F) p( E F) p( E F) p( F) p( F) p( E F) p( F) p( F E) p( E) Νόμος του Bayes p( F E) p( E F) p( F) p( E) Thomas Bayes 702-76 Η βάση τωνbayesan μεθόδωνγια πιθανοκρατική εξαγωγή συμπερασμάτων.πολύ ισχυρή και διαδεδομένη μέθοδος στην τεχνητή νοημοσύνη: Για εξόρυξη δεδομένων (data mnng), αυτοματοποιημένη διάγνωση (automated dagnoss), αναγνώριση προτύπων (pattern recognton), στατιστική μοντελοποίηση (statstcal modelng)... Προκύπτει άμεσα από τον ορισμό της δεσμευμένης πιθανότητας 04-May-7 3 3 04-May-7 32 32 8
Νόμος του Bayes Επομένως, λαμβάνοντας υπόψη και το νόμο ολικής πιθανότητας, για ενδεχόμενο Ε και για σύνολο ενδεχομένων F που αποτελούν διαμέρισητου δειγματικού χώρου Ω, ο νόμος του Bayes μπορεί να γραφεί ως: p( F E) p( E F) p( F) n p( E F) p( F) 04-May-7 33 33 Thomas Bayes 702-76 Δύο τσάντες τ και τ 2, περιέχουν άσπρες και μαύρες μπάλες Στην τ έχουμε 75 άσπρες μπάλες και 25 μαύρες. Στην τ 2 τσάντα έχουμε 75 μαύρες μπάλες και 25 άσπρες Επιλέγουμε τυχαία μία από τις δύο τσάντες. Από αυτή την τσάντα, επιλέγουμε τυχαία 5 μπάλες Το αποτέλεσμα είναι 5 άσπρες μπάλες. Ποιά είναι η πιθανότητα να έχουμε επιλέξει την τσάντα τ ; γενικότερα, πως μπορώ από την έκβαση ενός πειράματος να προσδιορίσω την πιθανότητα των ενδεχομένων ενός άλλου πειράματος; 04-May-7 34 34 Λύση:Έστω το πείραμα επιλογής της τσάντας.ο δειγματικός χώρος του πειράματος είναι οω{τ,τ 2 }. Ξέρουμε ότι p(τ )p(τ 2 )/2 αφού επιλέγουμε τυχαία την τσάντα. ΈστωB το ενδεχόμενο 5άσπρες μπάλες επιλέχθηκαν. Τι πρέπει να υπολογίσουμε; Tην p(τ B)η οποία, από τον κανόνα του Bayes είναι: p( B τ) p( τ) p( τ Β ) p( B) 04-May-7 35 35 p( B τ) p( τ) p( B τ) p( τ) p( τ Β ) p( B) p( B τ ) p( τ ) + p( B τ ) p( τ ) p B 2 2 p( B τ ) C(75,5)/ C(00,5) 0,229 ( τ) 0,458 p( τ) /2 /2 p B p( B τ ) C(25,5)/ C(00,5) 0,0007 2 ( τ2) 0,004 p( τ2) /2 /2 0,458 Άρα, pτ ( (!!!) Β ) 0,997 0,458+ 0,004 04-May-7 36 36 9