. Σύντοµη επισκόπηση θεωρίας πιθανοτήτων Α. Τυχαίες µεταβητές Τυχαία µεταβητή καείται µια µεταβητή η τιµή της οποίας καθορίζεται από το αποτέεσµα κάποιου στοχαστικού πειράµατος. Αν Ω ο δειγµατικός χώρος του στοχαστικού πειράµατος, τότε η τιµή µιας τυχαίας µεταβητής Χ καθορίζεται από το στοιχειώδες ενδεχόµενο ω Ω που πραγµατοποιήθηκε, δη. Χ = Χ(ω). Αυστηρότερα έχουµε τον επόµενο ορισµό. Ορισµός. Κάθε απεικόνιση Χ από το δειγµατικό χώρο Ω (σύνοο των δυνατών αποτεεσµάτων ε- νός πειράµατος τύχης) σε κάποιο υποσύνοο των πραγµατικών αριθµών R θα καείται τυχαία µεταβητή (τ.µ.). [ A] Ω ω Χ A Η απεικόνιση αυτή µπορεί να θεωρηθεί ότι «µεταφέρει» πιθανότητα από τον Ω στο R. Για παράδειγµα στο Α R µεταφέρεται η πιθανότητα των σηµείων του Ω που µέσω της τ.µ. απεικονίζονται µέσα στο Α (δη. των σηµείων {ω Ω: (ω) A}). ηαδή, P( A) {ω Ω: (ω) A}). Με αυτό τον τρόπο, η συνοική πιθανότητα ( ή %) «κατανέµεται» στα στοιχεία του συνόου τιµών της τ.µ. Χ. Συνήθως δεν µας ενδιαφέρει από ποια στοιχεία του Ω έχει προέθει η πιθανότητα που έχει κατανεµηθεί στα διάφορα σηµεία του R, αά µόνο η «κατανοµή» της πιθανότητας στον R. Μία περιγραφή της «κατανοµής» αυτής γίνεται µέσω της συνάρτησης κατανοµής. ( ) ), R καείται (αθροιστική) συνάρτη- Ορισµός. Η συνάρτηση F Χ : R [,] µε ση κατανοµής (σ.κ.) της τ.µ.. Για παράδειγµα: F Χ(ω) R /8 3/8 3/8 /8-3 4 R F() ) (,]) Υπενθυµίζουµε ορισµένες ιδιότητες της συνάρτησης κατανοµής F µιας τ.µ., ) F( ) για κάθε R. ) lim F( ) = F( ) =, lim F( ) = F( ) =, 3) Η F είναι µη φθίνουσα συνάρτηση, δηαδή για κάθε > y ισχύει ότι F() F(y). Επίσης, αν Χ είναι µία τ.µ. και α < R τότε, P( < ) ) P( ) = F( ) F( ). Σχηµατικά: Boutsiks M.V. (3), Σηµειώσεις Στατιστικής ΙΙΙ,
F() ) P( < ) ( F() ) R Β. ιακριτές τυχαίες µεταβητές ιακριτές καούνται οι τ.µ. που έχουν ως πεδίο τιµών κάποιο υποσύνοο του Ζ ή του Ν ή γενικότερα παίρνουν αριθµήσιµο πήθος τιµών (αριθµήσιµο καείται ένα σύνοο όταν µπορεί να γραφεί στην µορφή {,,, n } ή {,, }). Ορισµός. Έστω µία διακριτή τ.µ. µε τιµές στο αριθµήσιµο Β =Χ(Ω) R. Η συνάρτηση Χ :Β [,], ( ) = ), B θα καείται συνάρτηση πιθανότητας (σ.π.) της τ.µ. Χ. () 3 4 5 6 7 8 9 Αν π.χ. Χ {,,,...} = Β τότε = ( ) =, F ( ) ) = P( = i) = ( i), =,,... ) = ) = F ( ) F ( ), =,,3,..., () = F (). ( i= Γ. Συνεχείς τυχαίες µεταβητές Συνεχείς καούνται οι τ.µ. που έχουν ως πεδίο τιµών ένα διάστηµα του R, ή όο το R ενώ επιπέον έχουν παραγωγίσιµες συναρτήσεις κατανοµής. Ορισµός. Μία τ.µ. Χ (ή αντίστοιχα η κατανοµή της) θα καείται συνεχής αν υπάρχει µία µη αρνητική συνάρτηση (δη. ), ώστε F i= ( ) F ( ) = ( ) d, α, R Η συνάρτηση θα καείται συνάρτηση πυκνότητας πιθανότητας (ή πυκνότητα) της συνεχούς τ.µ. Χ. Υπενθυµίζεται επίσης ότι d ( ) d = και F ( ) = t dt ( ), F ( ) = ( ). d Στην περίπτωση των συνεχών τ.µ., η συνοική πιθανότητα δεν κατανέµεται πάνω σε ένα αριθµήσιµο υποσύνοο {α,α,...} του R (όπως στις διακριτές τ.µ.) αά «απώνεται» µε συνεχή τρόπο πάνω σε όα τα σηµεία ενός διαστήµατος του R (ή ακόµη και σε οόκηρο το R) και η σ.π.π. δείχνει την «πυκνότητα» µε την οποία έχει κατανεµηθεί («απωθεί») η συνοική πιθανότητα στον R Boutsiks M.V. (3), Σηµειώσεις Στατιστικής ΙΙΙ,
.8.6 F() F() ) F ( ) = ( ) d.4.. Παράµετροι θέσης και κίµακας µιας κατανοµής Εισάγουµε δύο παραµέτρους που προσφέρουν σηµαντική πηροφορία για τη µορφή της κατανο- µής µιας τ.µ. Την µέση τιµή η οποία προσδιορίζει το «βαρύκεντρο» της κατανοµής (η τ.µ. παίρνει τιµές «γύρω» από αυτήν) και τη διακύµανση η οποία εκφράζει τη «µεταβητότητα» της τ.µ. γύρω από τη µέση τιµή. - Μέση τιµή Μέση τιµή µιας τ.µ. Χ καείται η ποσότητα = µ = E ( ) ( ) (διακριτές τ.µ. στο Ν), µ = E( ) = ( ) d (συνεχείς τ.µ.) = Γενικότερα αποδεικνύεται ότι η µέση τιµή µιας τ.µ. Υ = g() θα είναι = E ( g( )) g( ) ( ) (διακριτές τ.µ. στο Ν), E( g( )) = g( ) ( ) d (συνεχείς τ.µ.) = - ιασπορά Η ποσότητα (και για διακριτές και για συνεχείς τ.µ.) σ = V ( ) = E(( µ ) ) = E( ) E( ) καείται διασπορά ή διακύµανση της τ.µ. Χ, ενώ η σ = V ( ) καείται τυπική απόκιση της τ.µ. Χ. - Ιδιότητες µέσης τιµής: α) E()= c c, β) E ( + ) = E( ) + - Ιδιότητες διασποράς: α) V ( c) =, β) V ( + ) = V ( ), Ε. Συνήθεις διακριτές κατανοµές Ε.. Η οµοιόµορφη διακριτή κατανοµή. ( i ) =, i =,,..., n n καείται διακριτή οµοιόµορφη κατανοµή στο σύνοο A={α,α,...,α n } (συµβοίζεται και µε DU(A)). 3 n- n Boutsiks M.V. (3), Σηµειώσεις Στατιστικής ΙΙΙ, 3
Αν η τ.µ. Χ εκφράζει έναν «τυχαία» επιεγµένο αριθµό από ένα πεπερασµένο σύνοο A={α,α,...,α n } (δη. κάθε στοιχείο του Α έχει την ίδια πιθανότητα εκογής) τότε ~ DU(A). Αν π.χ. η τ.µ. Χ ~ DU(A), Α= {,,...,n} τότε E ( ) = n +, V ( ) = n. Ε.. Η ιωνυµική κατανοµή. n n ( ) = p ( p), =,,..., n καείται διωνυµική κατανοµή µε παραµέτρους n, p (συµβοίζεται και µε B(n,p))..5. () n=, p=..5. () n=3, p=.6.5..5..5 5 5.5 5 5 5 3 Υπενθυµίζεται ότι αν µία τ.µ. Χ εκφράζει το πήθος των επιτυχιών σε n ανεξάρτητες δοκι- µές σε κάθε µία από τις οποίες εµφανίζεται επιτυχία µε πιθ. p και αποτυχία µε πιθ. p τότε ~ B(n, p). Αν Χ ~ B(n,p) τότε E ) = np V ( ) = np p. (, ( ) Για n= η κατανοµή B(,p) είναι γνωστή και ως κατανοµή Βernoulli. Αν Χ ~ Β(,p) τότε Χ {,} και P( = ) = p και P ( = ) = p ενώ E( ) = p, V ( ) = p( p). Ε.3. Η Γεωµετρική κατανοµή ( ) = ( p) p, =,,... καείται γεωµετρική κατανοµή µε παράµετρο p (συµβοίζεται και µε Ge(p))..4.3 () p =..4 ().3 p =.4.... 3 4 4 6 8 4 Υπενθυµίζεται ότι αν µία τ.µ. Χ µπορεί να θεωρηθεί ότι εκφράζει το πήθος των δοκιµών µέχρι και την εµφάνιση της πρώτης επιτυχίας σε µία ακοουθία ανεξάρτητων δοκιµών µε πιθανότητα επιτυχίας p τότε ~ Ge(p). Επίσης, αν Χ ~ Ge(p) τότε Boutsiks M.V. (3), Σηµειώσεις Στατιστικής ΙΙΙ, 4
p E( ) =, V ( ) =. p p Ε.4. Η κατανοµή Poisson. ( ) = e, =,,,...! καείται κατανοµή Poisson µε παράµετρο (συµβοίζεται και µε Po())..5. () = 3...8 () = 5.5.6..4.5 4 6 8. 5 5 5 3 Υπενθυµίζεται ότι αν n, p = / n τότε η διωνυµική κατανοµή Β(n,p) «συγκίνει» στην κατανοµή Poisson Po() = Po(np), δηαδή, n k p ( p) k n k e k, k =,,,... k! Με άα όγια, αν µία τ.µ. Χ µπορεί να θεωρηθεί ότι εκφράζει το πήθος των επιτυχιών σε ένα µεγάο αριθµό δοκιµών (n ) µε πιθανότητα επιτυχίας p σε κάθε δοκιµή τότε προσεγγιστικά ~ Po(np). Αν Χ ~ Po() τότε E ( ) =, V ( ) =. Ε.5. Η Υπεργεωµετρική κατανοµή. Λ N Λ n ( ) =, = m{, n + Λ N},...,min{ Λ, n} N n καείται υπεργεωµετρική κατανοµή µε παραµέτρους Λ, Ν, n (Λ, n < N). (συµβ. και µε h(λ,ν,n)). Υπενθυµίζεται ότι αν µία τ.µ. Χ εκφράζει το πήθος των ευκών σφαιρών ανάµεσα σε n τυχαία επιεγµένες σφαίρες (χωρίς επανάθεση) από µία κάπη µε Λ ευκές και N Λ µαύρες τότε η τ.µ. θα ακοουθεί την υπεργεωµετρική κατανοµή µε παραµέτρους Λ, Ν, n. (υπενθυµίζεται ότι αν η επιογή των n σφαιρών γίνει µε επανάθεση, τότε η τ.µ. Χ ~ Β(n, Λ/Ν) ) Αν µία τ.µ. ~ h(λ,ν,n) τότε Λ E ( ) = n και Ν Λ Λ N n V ( ) = n. Ν Ν N Boutsiks M.V. (3), Σηµειώσεις Στατιστικής ΙΙΙ, 5
ΣΤ. Συνήθεις συνεχείς κατανοµές ΣΤ.. Η οµοιόµορφη συνεχής κατανοµή. Ορισµός. Η συνεχής κατανοµή µε σ.π.π. ( ) =, [, ], ( ) =, [, ] καείται συνεχής οµοιόµορφη κατανοµή στο διάστηµα [,] (συµβοίζεται και µε U(,)). () F() /( ) Αν Χ εκφράζει έναν «τυχαία» επιεγµένο αριθµό από ένα διάστηµα [α,] (κάθε «σηµείο» ή καύτερα κάθε «απειροστό διάστηµα» του [α,β] έχει την ίδια πιθανότητα εκογής) τότε ~ U(,). Αν ~ U(,) τότε + ( ) E( ) =, V ( ) =. ΣΤ.. Η εκθετική κατανοµή. Ορισµός. Η συνεχής κατανοµή µε σ.π.π. ( ) = e, ( > ) ( ( ) =, < ) καείται εκθετική κατανοµή µε παράµετρο (συµβοίζεται και µε Ep()). () F() Η εκθετική κατανοµή εµφανίζεται συνήθως σε περιπτώσεις όπου µεετάµε το χρόνο ανα- µονής µέχρι την πραγµατοποίηση ενός γεγονότος. Πιο συγκεκριµένα, έστω ότι κάποια γεγονότα πραγµατοποιούνται σε τυχαίες στιγµές στο χρόνο, δηαδή σε κάθε πού µικρό χρονικό διάστηµα µήκους h, η πραγµατοποίηση ενός γεγονότος συµβαίνει µε πιθανότητα περίπου h ενώ είναι ανεξάρτητη από το τι έχει συµβεί στα υπόοιπα διαστήµατα. Αν Χ ο χρόνος αναµονής µέχρι την εµφάνιση του πρώτου τέτοιου γεγονότος τότε αποδεικνύεται ότι Χ ~ Εp(). Η συνάρτηση κατανοµής της εκθετικής κατανοµής είναι F( ) = e, ενώ F() = αν <. Η µέση τιµή και διασπορά της εκθετικής κατανοµής είναι E ( ) = και V ( ) =. Boutsiks M.V. (3), Σηµειώσεις Στατιστικής ΙΙΙ, 6