Βιομαθηματικά BIO-156 Τυχαίες μεταβλητές Κατανομές Πιθανοτήτων Ντίνα Λύκα Εαρινό Εξάμηνο, 17 lika@biology.uoc.gr
Τυχαία Μεταβλητή τυχαία μεταβλητή (τ.μ.) (X) είναι μια συνάρτηση που σε κάθε απλό ενδεχόμενο (ω) ενός δειγματικού χώρου (Ω) αντιστοιχεί έναν πραγματικό αριθμό. X: Ω R Ω ω X(ω) R Διακριτή τ.μ. : παίρνει πεπερασμένο ή άπειρα αριθμήσιμο πλήθος τιμών Συνεχής τ.μ. : παίρνει μη-αριθμήσιμο πλήθος τιμών
Διακριτές κατανομές Μια τ.μ. ονομάζεται διακριτή αν παίρνει πεπερασμένο ή άπειρα αριθμήσιμο πλήθος τιμών Σε κάθε τ.μ. Χ αντιστοιχεί μια κατανομή πιθανότητας (κ.π.) Ορισμός: Η κατανομή πιθανοτήτων της Χ περιγράφεται από τη συνάρτηση πιθανότητας f() = P(X=) που δίνει την πιθανότητα η τ.μ. Χ να πάρει την τιμή, και έχει τις ιδιότητες: f ( ) 1, f ( ) 1 1) της Χ και ) 3
Παράδειγμα 1 κατανομή πιθανότητας της τ.μ. Χ Χ : αριθμός παιδιών μιας οικογένειας σε κάποια χώρα Τιμές της Χ Πιθανότητες P(X=).1 1.4.3 3.1 4.7 5.3 Ισχύουν οι σχέσεις: P( X ) 1, P( X ) 1 Η συνάρτηση πιθανότητας f() =P(X=) : f() =.1, f(1) =.4, f() =.3, f(3) =.1, f(4) =.7, f(5) =.3.
Αθροιστική συνάρτηση κατανομής Ορισμός : Η συνάρτηση F()=P(X ), R ονομάζεται αθροιστική συνάρτηση κατανομής (α.σ.κ.) της τ.μ. Χ και δίνει την πιθανότητα η τ.μ. Χ να πάρει όλες τις τιμές της μέχρι το σημείο. Σε κάθε τ.μ. Χ αντιστοιχεί μονοσήμαντα μια α.σ.κ. Αν η τ.μ. Χ είναι διακριτή, τότε F ( ) P( X ) f ( t) t 5
Παράδειγμα 1 H συνάρτηση αθροιστικής κατανομής F() =P(X )= f(t) t F() = f() =.1 F(1) = f() + f(1) =.5 F() = f() + f(1) + f() =.8 F(3) = f() + f(1) + f() + f(3) =.9 F(4) = f() + f(1) + f() + f(3) + f(4) =.97 F(5) = f() + f(1) + f() + f(3) + f(4) + f(5) = 1. Για ενδιάμεσες τιμές του, π.χ. για =1.4 F(1.4) = P(X 1.4)= P( X = ή 1) = f() + f(1) =.5 Η συνάρτηση αθροιστικής κατανομής ορίζεται κατά τμήματα,.1,.5, F( ).8,.9,.97, 1., 1 1 3 3 4 4 5 5 1, 1,8,6,4, F( ) -4-4 6 8
Αθροιστική συνάρτηση κατανομής Η αθροιστική συνάρτηση κατανομής (α.σ.κ.) έχει τις ιδιότητες: i) Η F() είναι αύξουσα συνάρτηση του ii) lim F X ( ), lim F X ( ) 1 iii) Η F() είναι δεξιά συνεχής: lim FX ( ) FX ( )
Παράδειγμα 1 Χ : αριθμός παιδιών μιας οικογένειας Τιμές της Χ Συνάρτηση πιθανότητας f()= P(X=) Συνάρτηση αθροιστικής κατανομής F() =P(X ).1.1 1.4.5.3.8 3.1.9 4.7.97 5.3 1. Η πιθανότητα μια οικογένεια να έχει τουλάχιστον ένα παιδί: P(X 1) = 1-P(X=) = 1-f() = 1-.1 =.9 Η πιθανότητα μια οικογένεια να έχει τουλάχιστον δύο και το πολύ τέσσερα παιδιά: P( X 4) = P(X 4) - P(X 1) = F(4)-F(1) =.97-.5 =.47
Παράμετροι κατανομής Έστω Χ μια διακριτή τ.μ. με συνάρτηση κατανομής f() Ορισμός: Η μέση ή αναμενόμενη τιμή της Χ είναι E ( X ) f ( ) Θεώρημα: Η μέση ή αναμενόμενη τιμή της g(χ) είναι g ( X ) g( X ) E g( ) f ( )
Παράμετροι κατανομής Ορισμός: Η διασπορά της Χ είναι var( X ) E X var( X ) ( ) f ( ) Θεώρημα: Η διασπορά της τ.μ. Χ υπολογίζεται από E ( X ) Η θετική τετραγωνική ρίζα της διασποράς ονομάζεται τυπική απόκλιση. var( X )
Παράδειγμα 1 Χ : αριθμός παιδιών μιας οικογένειας Τιμές της Χ Πιθανότητες P(X=)=f().1 1.4.3 3.1 4.7 5.3 Na υπολογιστεί ο μέσος αριθμός παιδιών ανά οικογένεια, η διασπορά και η τυπική απόκλιση E( X ) E( X 1.175 f ( ).11.4.3 3.1 ) 4 4.7 5.3 1.73.11.7 5.4.3 3.3 (1.73).1 1.38
Παράμετροι κατανομής Αν α και b είναι σταθερές, τότε E(α +bx)= α +be(x) Αν θέσουμε b=1, τότε E(α+X)= α+e(x), και Αν θέσουμε α=, τότε E(bX) = be(x) Αν α και b είναι σταθερές, τότε var(α +bx) = b var (X) Αν θέσουμε b=1, τότε var(α +X)=var(X). (Η διασπορά δεν αλλάζει αν προσθέσουμε ή αφαιρέσουμε μια σταθερά από μια τυχαία μεταβλητή). Αν θέσουμε α=, τότε var(bx) = b var(x). (Αν πολλαπλασιάσουμε ή διαιρέσουμε μια τυχαία μεταβλητή με μία σταθερά ( ), τότε η διασπορά πολλαπλασιάζεται ή διαιρείται με το τετράγωνο της σταθεράς)
Διωνυμική κατανομή πείραμα ή δοκιμή Bernoulli: πείραμα όπου τα δυνατά αποτελέσματα είναι μόνο δύο Επιτυχία (S ή 1) Αποτυχία (F ή ) X: ο αριθμός των επιτυχιών σε n ανεξάρτητες δοκιμές P(S)=p (σταθερή) Η συνάρτηση πιθανότητας της τ.μ. X n n b( ; n, p) P( X ) p (1 p),,1,,..., n n n! όπου!( n )! ονομάζεται διωνυμικός συντελεστής.! =1 και n! 1 3...( n 1) n E(X)= n p και var(x)=n p(1-p)
P(X=) P(X=) P(X=) P(X=) Διωνυμικές κατανομές n=1; p=,1 n=3, p=,5,45,16,4,35,3,5,,15,1,5 μ=1 σ =.9 1 3 4 5 6 7 8 9 1,14,1,1,8,6,4, 3 6 9 1 15 18 1 μ=15 σ =7.5 4 7 3 Αριθμός επιτυχιών, Αριθμός επιτυχιών, n=1; p=,8 n=3, p=,8,35,3,5,,15,1,5 μ=8 σ =1,6 1 3 4 5 6 7 8 9 1 Αριθμός Αριθμός επιτυχιών,,,18,16,14,1,1,8,6,4, 3 μ=4 σ =4,8 6 9 1 15 18 1 Αριθμός Αριθμός επιτυχιών, γεγονότων, 4 7 3 14
Παράδειγμα Το σύνδρομο Down είναι μια γενετική ανωμαλία στην οποία υπάρχουν 3 αντίγραφα του χρωμοσώματος 1 αντί για δύο. Στις ΗΠΑ, 1 στις 7 εγκυμοσύνες έχει παρατηρηθεί η γενετική ανωμαλία. Ποια είναι η πιθανότατα : Να μη παρατηρηθεί το σύνδρομο Down σε καμία από τις 1 εγκυμοσύνες; Να παρατηρηθεί το σύνδρομο Down σε τουλάχιστον 1 στις 1; Χ : εγκυμοσύνες με σύνδρομο Down στις 1 p=1/7 πιθανότητα μια εγκυμοσύνη να έχει την γενετική ανωμαλία Χ~Διωνυμική κατανομή με n=1 και p=1/7 P( X ) 1 p (1 p).8668 P(X 1) =1- P(X =)=1-.8668=.133 1
Προτεινόμενη Βιβλιογραφία C. Neuhauser Calculus for biology and medicine Pearson/Prentice Hall, 4 Chapter 1: 1.4 και 1.5