3. Κατανομές πιθανότητας
Τυχαία Μεταβλητή Τυχαία μεταβλητή (τ.μ.) (X) είναι μια συνάρτηση που σε κάθε σημείο (ω) ενός δειγματικού χώρου (Ω) αντιστοιχεί έναν πραγματικό αριθμό. Ω ω X (ω ) R Διακριτή τ.μ. : παίρνει πεπερασμένο ή αριθμήσιμο πλήθος τιμών Συνεχής τ.μ. : παίρνει άπειρο ή μη-αριθμήσιμο πλήθος τιμών ΒΙΟ39-Κατανομές
Κατανομές πιθανότητας Σε κάθε τ.μ. αντιστοιχεί μια κατανομή πιθανότητας (κ.π.) Διακριτή τ.μ. : η κ.π. παρέχει όλες τις δυνατές τιμές της μεταβλητής μαζί με την πιθανότητα να προκύψει η κάθε μια από αυτές Συνεχής τ.μ. : η κ.π. παρέχει για συγκεκριμένα διαστήματα τιμών την πιθανότητα να πάρει η μεταβλητή μια τιμή σε αυτά ΒΙΟ39-Κατανομές 3
Παράδειγμα- κατανομή πιθανότητας της τ.μ. Χ Χ : Αριθμός φυτών του είδους Α που παρατηρήθηκε σε 5 περιοχές Αριθμός φυτών 118 1 181 97 3 54 4 3 5 και άνω 18 Σύνολο 5 συχνότητα Σχετική συχνότητα P(X=),36,36,194,18,64,36 1, Ισχύουν οι σχέσεις: P( X ) 1, P( X ) 1 4
Διακριτές κατανομές Αν η τ.μ. είναι διακριτή, τότε η συνάρτηση που δίνει την πιθανότητα η τ.μ. Χ να πάρει την τιμή, λέγεται συνάρτηση πιθανότητας της τ.μ. Χ, συμβολίζεται με f ( ) P( X ) και έχει τις ιδιότητες: 1) f ( ) 1, και ) ( ) f 1 ΒΙΟ39-Κατανομές 5
Συνεχείς κατανομές Αν η τ.μ. είναι συνεχής, τότε υπάρχει συνάρτηση f() για την οποία ισχύει f ( ) 1, f ( ) d 1 Και ονομάζεται συνάρτηση πυκνότητας πιθανότητας ή συνάρτηση πιθανότητας της συνεχούς τ.μ. Χ. Προκύπτει ότι P ( a X b) f ( ) d b a ΒΙΟ39-Κατανομές 6
Αθροιστική συνάρτηση κατανομής Ορισμός : Η συνάρτηση F( ) P( X ), R ονομάζεται αθροιστική συνάρτηση κατανομής (α.σ.κ.) της τ.μ. Χ και δίνει την πιθανότητα η τ.μ. Χ να πάρει όλες της τιμές της μέχρι το σημείο. Σε κάθε τ.μ. Χ αντιστοιχεί μονοσήμαντα μια α.σ.κ. F ( ) P( X ) f ( t) t Χ : διακριτή F ( ) P( X ) P( X ) f ( t) dt Χ : συνεχής ΒΙΟ39-Κατανομές 7
Παράδειγμα Χ : Αριθμός φυτών του είδους Α που παρατηρήθηκε σε 5 περιοχές Αριθμός φυτών 1 3 4 5 και άνω Κατανομή πιθανότητας P(X=) P(X ),36,36,36,598,194,79,18,9,64,964,36 1, Ποια είναι η πιθανότητα μια τυχαία επιλεγμένη περιοχή, να έχει λιγότερα από 3 φυτά του είδους Α; P(X ) =,79 Ποια είναι η πιθανότητα μια τυχαία επιλεγμένη περιοχή, να έχει τουλάχιστον φυτά του είδους Α; P(X 1) + P(X ) = 1 Άρα P(X ) = 1- P(X 1) =1 -,598=,4 8
9 Παράμετροι κατανομής Έστω Χ μια τ.μ. με συνάρτηση πιθανότητας f() Η μέση τιμή ή αναμενόμενη τιμή της Χ είναι Η διασπορά της Χ είναι Η θετική τετραγωνική ρίζα της διασποράς, σ, ονομάζεται τυπική απόκλιση. X f X d f X E ), (, ) ( ) ( R X f X d f X E X Var ), ( ) (, ) ( ) ( ) (
Παράμετροι κατανομής Για τη μέση τιμή και τη διασπορά ισχύουν οι ιδιότητες: 1. E( a bx ) a be( X ). Var( a bx ) b Var( X ) 3. E( X Y ) E( X ) E( Y ), X, Y τ.μ. 4. Var( X Y ) Var( X ) Var( Y ), X, Y τ.μ. 5. E( XY) E( X ) E( Y ), X, Y ανεξάρτητες τ.μ. ΒΙΟ39-Κατανομές 1
Θεωρητικές κατανομές Διωνυμική κατανομή (binomial distribution) Poisson κατανομή Κανονική κατανομή (normal distribution) ΒΙΟ39-Κατανομές 11
Διωνυμική κατανομή πείραμα ή δοκιμή Bernoulli: πείραμα όπου τα δυνατά αποτελέσματα είναι μόνο δύο, τα οποία είναι ασυμβίβαστα μεταξύ τους (π.χ. «Επιτυχία» (S) και «Αποτυχία» (F)) τα αποτελέσματα n δοκιμών είναι ανεξάρτητα το ένα από το άλλο η πιθανότητα επιτυχίας είναι ίδια σε κάθε δοκιμή P(S)=p (σταθερή) και P(F)=1-p=q X: ο αριθμός των «επιτυχιών» σε n ανεξάρτητες δοκιμές Η συνάρτηση πιθανότητας της τ.μ. X όπου n n b( ; n, p) P( X ) p q,,1,,..., n n n! k k!( n k)! είναι ο διωνυμικός συντελεστής. E(X)= n p και Var(X)=n p q 1
P(X=) P(X=) P(X=) P(X=) Διωνυμικές κατανομές,45,4,35,3,5,,15,1,5,35,3,5,,15,1,5 n=1; p=,1 1 3 4 5 6 7 8 9 1 n=1; Αριθμός p=,8 επιτυχιών, 1 3 4 5 6 7 8 9 1 Αριθμός επιτυχιών,,16,14,1,1,8,6,4, 3,,18,16,14,1,1,8,6,4, 6 3 9 6 n=3, p=,5 1 15 ΒΙΟ39-Κατανομές 13 Αριθμός επιτυχιών, γεγονότων, 18 1 Αριθμός n=3, επιτυχιών, p=,8 9 1 15 18 4 1 7 4 3 7 3
Poisson κατανομή Μελέτη τυχαίων γεγονότων που συμβαίνουν σπάνια στο χρόνο ή στο χώρο (γεγονότα συμβαίνουν ανεξάρτητα) X: αριθμός εμφάνισης κάποιου γεγονότος στη μονάδα μέτρησης. Η συνάρτηση πιθανότητας της τ.μ. X e p( ; ) P( X ),,1,,...,! λ ο μέσος αριθμός εμφάνισης του γεγονότος E(Χ)= λ και Var(Χ)=λ ΒΙΟ39-Κατανομές 14
P(X=) P(X=) P(X=) Poisson κατανομές λ=,5,7,6,5,4 λ=15,3,1,,1,1 1 3 4 5 6 7 8 9 1,8,6 Αριθμός λ=3 γεγονότων,,4,5,,,15,1 3 6 9 1 15 18 1 4 7 3 33 36 39 Αριθμός γεγονότων,,5 1 3 4 5 6 7 8 9 1 11 1 13 14 15 Αριθμός γεγονότων, ΒΙΟ39-Κατανομές 15
P(X=) P(X=) P(X=) Προσέγγιση της Διωνυμικής με την Poisson Όταν n και p (έτσι ώστε np σταθερό) b(;n,p) p(;λ) με λ = np Poisson λ=1,45,4,35,3,5,,15,1,5 Διωνυμική n=1, p=,1 1 3 4 5 6 7,4,35,3,5,,15,1,5 1 3 4 5 6 7,4,35,3,5,,15,1,5 Διωνυμική n=1, p=,1 ΒΙΟ39-Κατανομές 16 1 3 4 5 6 7
ΒΙΟ39-Κατανομές 17 Κανονική κατανομή - Η τ.μ. X έχει την κανονική κατανομή, αν έχει σ.π.π. : E(X)= μ και Var(X)=σ ), ( N R R e f,,, 1 ) ( ) ( μ μ-σ μ+σ f()
Ιδιότητες της N(, ) f() f() σ 1 σ σ3 μ 1 μ μ 3 μ Σταθερή τυπική απόκλιση και 1 3 Σταθερή μέση τιμή και 1 3 ΒΙΟ39-Κατανομές 18
Τυπική κανονική κατανομή - N(,1) Χ~Ν(μ,σ ) Η τυποποιημένη τ.μ Z έχει σ.π.π. : X f z 1 ( z) e, z R Η συνάρτηση αθροιστικής κατανομής της Z είναι z y 1 ( z) P( Z z) e dy, z R Φ(z) Φ(z) z σ.α.κ. z σ.π.π. Φ(-z)=1-Φ(z) 19
Σχέση μεταξύ N(, ) και N(,1) Αν X ~ N(, ) τότε Z X ~ N(,1) Όταν η X παίρνει τιμές μεταξύ και, η Z παίρνει τιμές μεταξύ z 1 1 και z Ισχύει επίσης 1 P( 1 X ) P( z1 Z z ) P( X 1 ) P( Z z1) P( X 1 ) P( Z z1) ΒΙΟ39-Κατανομές
Κανονική προσέγγιση της Διωνυμικής ΒΙΟ39-Κατανομές 1
Δειγματοληπτικές κατανομές Στατιστική δειγματική συνάρτηση (στατιστική συνάρτηση ή στατιστικό): μια συνάρτηση υπολογισμένη σε όλα τα δυνατά δείγματα του ιδίου μεγέθους που μπορούν να εξαχθούν από ένα πληθυσμό Η κατανομή όλων των δυνατών τιμών μιας στατιστικής συνάρτησης ονομάζεται δειγματοληπτική κατανομή της συγκεκριμένης συνάρτησης. Στατιστικές συναρτήσεις των οποίων μπορούν να υπολογιστούν οι δειγματοληπτικές κατανομές είναι η μέση τιμή, η διασπορά, μια αναλογία, η διαφορά δύο μέσων τιμών ή δύο αναλογιών κ.λ.π. ΒΙΟ39-Κατανομές
Δειγματοληπτική κατανομή της μέσης τιμής Λαμβάνοντας όλα τα δείγματα (μεγάλο αριθμό) μεγέθους n από έναν κανονικά κατανεμημένο πληθυσμό με μέση τιμή μ και διασπορά,, Η δειγματοληπτική κατανομή της μέσης τιμής X έχει τις εξής ιδιότητες: 1. είναι κανονική. η μέση τιμή της,, ισούται με τη μέση τιμή μ του πληθυσμού 3. Η διασπορά της,, ισούται με τη διασπορά του πληθυσμού διαιρούμενη δια του μεγέθους των δειγμάτων: Δηλαδή : X ~ N(, n :τυπική απόκλιση της X ή τυπικό σφάλμα Απόδειξη: Θ1 ) X n X ~ N(, ) X ~ N(, ) 1 1 1 Θεώρημα 1 X1 X ~ N( 1 1, 1 )
Κεντρικό Οριακό Θεώρημα Στην περίπτωση ενός μη κανονικά κατανεμημένου πληθυσμού, ισχύει το Κεντρικό Οριακό Θεώρημα Σε έναν μη κανονικά κατανεμημένο πληθυσμό με μέση τιμή μ και διασπορά, η δειγματοληπτική κατανομή της μέσης τιμής X όλων των δυνατών δειγμάτων του πληθυσμού μεγέθους n είναι κατά προσέγγιση κανονική με μέση τιμή μ και διασπορά X n, εφόσον το μέγεθος n των δειγμάτων είναι επαρκώς μεγάλο. Σημείωση: όταν X ~ N(, ), τότε ~ N(,1) 4
Δειγματοληπτική κατανομή της μέσης τιμής Άγνωστη διασπορά μεγάλο δείγμα ~ N (,1) όπου s s Χ μικρό δείγμα από κανονικά κατανεμημένο πληθυσμό N(, ) T ~ S / n tn Απόδειξη: Θ4 1 s n Θεώρημα 4 Αν Ζ~Ν(,1) και ~ Z T ~ t
Κατανομή Student, t Οικογένεια κατανομών ν : βαθμοί ελευθερίας (β.ε. ή d.f.) t, 1 d.f. t, 1 d.f. N(,1) Συμμετρικές ως προς το Για μεγάλα ν οι κατανομές Student προσεγγίζουν την τυπική κανονική κατανομή t ΒΙΟ39-Κατανομές 6
Κατανομή Student, t P ( T t ; ) t ;a : κρίσιμη τιμή Η τιμή που ορίζει μια περιοχή με εμβαδόν α στο δεξιό άκρο της κατανομής α -t ν;α t α t ν;α Επειδή η κατανομή Student είναι συμμετρική ως προς το μηδέν P( T t ) P( T t ; ; ) και t ; 1 t ; ΒΙΟ39-Κατανομές 7
Δειγματοληπτική κατανομή της διασποράς Αν τα δείγματα (μεγέθους n) επιλέγονται από κανονικά κατανεμημένο πληθυσμό N(, ) τότε X ( n 1) S ~ n1 Απόδειξη: Θ, Θ3, Θ7 ΒΙΟ39-Κατανομές 8
Κατανομή v Οικογένεια κατανομών ν : βαθμοί ελευθερίας (β.ε. ή d.f.) f() =1 = =3 =6 Κατανομές χ για διάφορους β.ε. Έντονα ασύμμετρες για μικρό ν Πιο συμμετρικές όταν το ν αυξάνει Ορίζεται μόνο για θετικές τιμές ΒΙΟ39-Κατανομές 9
Κατανομή v P( X ) ; f() ;a : κρίσιμη τιμή Η τιμή που ορίζει μια περιοχή με εμβαδόν α στο δεξιό άκρο της κατανομής α χ ν,α ΒΙΟ39-Κατανομές 3
Κατανομή F 1, Οικογένεια κατανομών ν 1, ν : βαθμοί ελευθερίας Ασύμμετρες Ορίζεται μόνο για θετικές τιμές f() 1 =1, =3 1 =5, =5 1 =5, =5 ΒΙΟ39-Κατανομές 31
Κατανομή F 1, 1, : βαθμοί ελευθερίας f 1, ;a : κρίσιμη τιμή P ( F f 1, ; ) α f ν 1,ν ;α Ισχύει f, ;1 a 1 f, ; a 1 1 ΒΙΟ39-Κατανομές 3
Θεωρήματα X 1. Αν 1 και X δύο ανεξάρτητες τ.μ. με 1 1 και X ~ (, ), τότε η τ.μ. όπου N Y X1 X ~ N(, ) 1 και.. Αν Z Z,..., είναι ν ανεξάρτητες τ.μ. που ακολουθούν την 1, Z Ν(,1), τότε η τ.μ.. X 1 Z Z Z 1 ~ X1 ~ N(, ) 3. Αν X 1, X,..., X n είναι n ανεξάρτητες τ.μ. που ακολουθούν, αντίστοιχα, τις κατανομές,,,, τότε η τ.μ. 1 n Y X, όπου. 1 X... X n ~ 1... n ΒΙΟ39-Κατανομές 33
Θεωρήματα 4. Αν Ζ~Ν(,1) και ~ είναι ανεξάρτητες τ.μ., τότε η τ.μ. Z T ~ t 5. Αν και W είναι ανεξάρτητες τ.μ., τότε η τ.μ. F W ~ 1 F 1 ~ 1, ~ 6. Αν η τ.μ. X, τότε η τ.μ. ~ F 1, 1 Y ~ X X X 1 X1 ~ 1 ~ 1 X, 1, τότε X ~ 7. Αν και δύο ανεξάρτητες τ.μ με και X 1 F, 1 ΒΙΟ39-Κατανομές 34