Πανεπιστήμιο Πελοποννήσου Τυχαίες μεταβλητές Κατανομές
Τυχαία Μεταβλητή (τ.μ.) Τυχαία μεταβλητή (τ.μ.) ονομάζεται η συνάρτηση που απεικονίζει το σύνολο των δυνατών αποτελεσμάτων ενός πειράματος στο σύνολο των πραγματικών αριθμών Οι τμ συμβολίζονται με κεφαλαία γράμματα πχ Χ,Υ,Ζ
Δειγματικός Χώρος Ω Τυχαία Μεταβλητή Τυχαίο Πείραμα (Φύλο παιδιού) Αγόρι Κορίτσι
Ποσοτικά και Ποιοτικά Δεδομένα Τυχαία μεταβλητή Ποιοτικά δεδομένα Ποσοτικά δεδομένα Διακριτά δεδομένα Συνεχή δεδομένα Διακριτή Τυχαία Μεταβλητή Συνεχής Τυχαία Μεταβλητή
Συνάρτηση Πιθανότητας Αν η τμ είναι διακριτή, τότε η συνάρτηση που δίνει την πιθανότητα ητμχ να παίρνει την τιμή x, λέγεται συνάρτηση πιθανότητας (σ.π.) της τμ Χ, Συμβολίζεται με f(x)=p(=x)
Ιδιότητες της Συνάρτησης Πιθανότητας. f(x) 0, για κάθε τιμή x της τμ Χ. Το άθροισμα των πιθανοτήτων για όλες τις τιμές της τμ Χ, πρέπει να είναι ίσο με x f ( x) P( = x) = = x
Άσκηση Έστω η διακριτή τμ Χ. Ποια η πιθανότητα P(>3) Χ P(=x) 4a 3a 3 a 4 a
Συνάρτηση Αθροιστικής Κατανομής Η συνάρτηση F(x) που ορίζεται: F(x)=P( x), για κάθε x που ανήκει στο R ονομάζεται συνάρτηση αθροιστικής κατανομής (σ.α.κ) της τμ Χ και δίνει την πιθανότητα η τμχ να πάρει όλες τις τιμές της μέχρι το σημείο x
Συνάρτηση Πυκνότητας Πιθανότητας Αν η τμχ είναι συνεχής, τότε υπάρχει συνάρτηση f(x) που ονομάζεται συνάρτηση πυκνότητας πιθανότητας (σ.π.π.) της τμ Χ, τέτοια ώστε: x F ( x) = P( x) = f ( t) dt, x R
Ιδιότητες της Συνάρτησης Πυκνότητας Πιθανότητας. f(t) 0. Το εμβαδόν κάτω από την καμπύλη f(t) ισούται με f ( t) dt =
Μέση τιμή ή Αναμενόμενη τιμή Μέση τιμή ή αναμενόμενη τιμή (ή μαθηματική ελπίδα) της τμ Χ ορίζεται η συνάρτηση E( ) x = ℵ x x f ( x), αν η Χ είναι διακριτή f ( x) dx, αν η Χ είναι συνεχής
Πείραμα Bernoulli Το τυχαίο πείραμα που έχει μόνο δύο πιθανά αποτελέσματα (επιτυχία ή αποτυχία), ονομάζεται πείραμα Bernoulli.
Αναμενόμενη τιμή μιας συνάρτησης της τμ Χ Μέση τιμή ή αναμενόμενη τιμή μιας συνάρτησης g() της τμ Χ συμβολίζεται σαν Ε(Χ) ή μ και ορίζεται: E ( g( )) x = ℵ g g ( x) f ( x) ( x) f ( x), dx, αν η Χ είναι διακριτή αν η Χ είναι συνεχής
Ιδιότητες της αναμενόμενης τιμής. E(c )=c, όπου c είναι μία σταθερά. E(a*)=a*E() 3. Ε(a*g())=a*E(g()) 4. E(±Y)=E()±E(Y) 5. E(g()±h(Y))=E(g())±E(h(Y)) 6. E(a±b)=a*E()±b
Διασπορά της τμ Χ Η διασπορά ή διακύμανση της τμ Χ συμβολίζεται V() ή σ και δίνεται από την παρακάτω σχέση: V ( ) = E( μ ) = x x ( x μ ) f ( x) ( x μ ) f ( x), dx, διακριτή συνεχής
Ιδιότητες της διασποράς. V(c )=0, όπου c είναι μία σταθερά. V(a)=a V() 3. V(a±b)=a V() 4. V()=E( )-μ 5. V(±Y)=V()+V(Y), αν οι τμ Χ και Υ είναι ανεξάρτητες 6. Η θετική τετραγωνική ρίζα της διασποράς ονομάζεται τυπική απόκλιση και συμβολίζεται με σ
Ροπές ν-οστή ροπή της τμ Χ ως προς το α δίνεται από την σχέση Ε(Χ-α) ν ν-οστή κεντρική ροπή της τμ Χ δίνεται από την σχέση Ε(Χ-μ) Η δεύτερη κεντρική ροπή είναι η διασπορά
Κατανομές Διακριτές Κατανομές
Πείραμα ή δοκιμή Bernoulli Το τυχαίο πείραμα που έχει μόνο δύο αποτελέσματα (επιτυχία ή αποτυχία) ονομάζεται πείραμα ή δοκιμή Bernoulli
Κατανομή Bernoulli B(,p) ΗτμΧ του ενός πειράματος Bernoulli παίρνει τιμή όταν έχουμε επιτυχία και τιμή 0 όταν έχουμε αποτυχία. Όταν p είναι η πιθανότητα επιτυχίας, η κατανομή της τμ Χ δίνεται: P(=x)=p x (-p) -x, x=0,
Διωνυμική (Bionomial) Β(n,p) Η διωνυμική κατανομή είναι μια διαδικασία n ανεξάρτητων δοκιμών Bernoulli με την ίδια πιθανότητα επιτυχίας p σε κάθε δοκιμή. Η τμχ που ακολουθεί διωνυμική κατανομή, εκφράζει το πλήθος των επιτυχιών στις n δοκιμές (επαναλήψεις) Bernoulli και παίρνει τιμές x=0,,,n. Η συνάρτηση πιθανότητας δίνεται από τον τύπο: P n x ( ) x ( ) n x = x = p p E()=np V()=np(-p)
Γεωμετρική (Pascal) ΗτμΧ που ακολουθεί Γεωμετρική κατανομή, εκφράζει το πλήθος των επαναλήψεων που πρέπει να γίνουν σε μια διαδικασία Bernoulli μέχρι την πρώτη επιτυχία. Το πλήθος των δοκιμών είναι άγνωστο και το πείραμα σταματά στην πρώτη επιτυχία, δηλ x=,, Η συνάρτηση πιθανότητας είναι: P(=x)=p(-p) x- E()=/p V()=(-p)/p
Αρνητική Διωνυμική (Negative Bionomial) ΗτμΧ που ακολουθεί Αρνητική Διωνυμική κατανομή, εκφράζει το πλήθος των επαναλήψεων Bernoulli που πρέπει να γίνουν για να συμπληρωθούν r επιτυχίες. Το πλήθος των δοκιμών είναι άγνωστο και το πείραμα σταματά στην r επιτυχία, δηλ x=r,+,r+, Η συνάρτηση πιθανότητας είναι: E()=r/p V()=r(-p)/p P x r ( ) ( ) x = x = p p r r Όταν r=, τότε έχουμε τη Γεωμετρική κατανομή
Poisson P(λ) Η κατανομή Poisson είναι η κατανομή των σπάνιων γεγονότων και χρησιμοποιείται όταν θέλουμε να μετρήσουμε τον αριθμό των συμβάντων στη μονάδα μέτρησης Τα συμβάντα μπορεί να είναι: τυπογραφικά λάθη ανά σελίδα, τηλεφωνικές κλήσεις στη μονάδα του χρόνου, αυτοκίνητα που περνούν από ένα σημείο στη μονάδα του χρόνου, κτλ
Poisson P(λ) ΗτμΧ που ακολουθεί την Poisson κατανομή εκφράζει το πλήθος των γεγονότων στην μονάδα του χρόνου. Η παράμετρος λ της Poisson είναι η μέση τιμή εμφάνισης των γεγονότων στην μονάδα του χρόνου Η συνάρτηση πιθανότητας δίνεται από: P ( = x ) = e λ x λ x! x=0,,, και λ>0 Ε()=λ V()=λ
Υπεργεωμετρική Hypergeometrical Έστω ένας πληθυσμός Ν ατόμων ή αντικειμένων Από τον πληθυσμό αυτό, k μέλη έχουν μια συγκεκριμένη ιδιότητα (πχ από τους 00 φοιτητές, 0 είναι από τον νομό Λακωνίας), και κατά συνέπεια Ν-k μέλη δεν έχουν την συγκεκριμένη ιδιότητα Τυχαίο δείγμα ν ατόμων επιλέγεται (χωρίς επανάθεση) ΗτμΧ που εκφράζει τον αριθμό των μελών που έχουν την ιδιότητα και ανήκουν στο τυχαίο δείγμα ακολουθεί την Υπεργεωμετρική κατανομή
Υπεργεωμετρική Η συνάρτηση πιθανότητας της Υπεργεωμετρικής κατανομής δίνεται από τον παρακάτω τύπο: ( ) ( ) ( ),...,,, 0 = = = = = N N N k N N k V N k E x N x k N x k x P ν ν ν ν ν ν
Συνεχείς Κατανομές
Ομοιόμορφη U(a,b) Uniform Η συνεχής τμ Χ ακολουθεί την ομοιόμορφη κατανομή (με παραμέτρους a και b) με σ.π.π και αθροιστική κατανομή: f E F ( x ) = b a a 0, + b ( ) =, V ( ) ( x ) = P ( x ), a otherwise = x b x = a a b ( b a )
Εκθετική Exp(λ) Exponential Η συνεχής τμ Χ ακολουθεί την εκθετική κατανομή (με παράμετρο λ) με σ.π.π και αθροιστική κατανομή: f ( x ) = λ x λ e, x > 0 otherwise 0 F ( x ) = e λ x E ( ) = / λ, V ( ) = / λ
Γραφική Παράσταση
Κανονική Κατανομή Ν(μ,σ ) Normal Η συνεχής τμ Χ ακολουθεί την κανονική κατανομή (με παραμέτρους μ και σ ) με σ.π.π : ( ) ( ) ( ), 0,,, σ μ σ μ π σ σ μ = = > < < < < = V E x e x f x
Γραφική Παράσταση
Τυπική Κανονική Κατανομή Ν(0,) Standard Normal Η συνεχής τμ Ζ ακολουθεί την τυπική κανονική κατανομή (με παραμέτρους μ=0 και σ = ) με σ.π.π : f ( z ) = z π e E ( ) = 0, V ( ) =
Ιδιότητες Κανονικής Κατανομής Αν η τμ Χ ακολουθεί κανονική κατανομή Ν(μ,σ ), τότε η τμ Ζ=(Χ-μ)/σ ακολουθεί την τυπική κατανομή Ν(0,) Η κανονική κατανομή είναι συμμετρική κατανομή σε σχέση με την μέση τιμή μ Η αθροιστική κατανομή της κανονικής κατανομής συμβολίζεται Φ(z) Φ(-α)=-Φ(α)
Γραφική Παράσταση
Λογαριθμο-Κανονική Κατανομή LogNormal LΝ(μ,σ ) Έστω ότι η τμ W ακολουθεί την κανονική κατανομή με παραμέτρους μ και σ. Τότε η τμ =exp(w) ακολουθεί την λογαριθμό-κανονική κατανομή (με παραμέτρους μ και σ ) με σ.π.π : f ( x) = e xσ π x ( ) ln x μ σ 0,, 0, > < μ < σ > ( ) ( = μ + σ ) E exp, ( ) = exp + exp ( ) ( ) ( μ σ σ ) V
Γάμμα κατανομή G(a,b) Η συνεχής τμ Χ ακολουθεί την γάμμα κατανομή (με παραμέτρους a, b) με σ.π.π: b f x x e x Γ a a a bx ( ) =, > 0 ( ) Η εκθετική κατανομή είναι ειδική περίπτωση της Γάμμα. ~exp( λ) ~ G(, λ)
Άλλες συνεχείς Κατανομές Student ή t με παράμετρο ν που ονομάζεται βαθμοί ελευθερίας (t ν ) Χ με παράμετρο ν που ονομάζεται βαθμοί ελευθερίας F n,m με n και m βαθμούς ελευθερίας
Σχέσεις μεταξύ κατανομών Έστω η τμχ με σππ f(x), και θεωρούμε την τμ Υ=g(), όπου g() είναι μία συνάρτηση της Χ. Τότε Αν η y=g(x) λύνεται μονοσύμαντα, δηλαδή x=g - (y), τότε η σππ της τμ Υ είναι f Y ( ) dy ( ) y = f g ( y) dx Αν η y=g(x) έχει παραπάνω από μία λύση, τότε η σππ της Υ είναι f Y = ( ) ( ) y f g ( y) i i dxi dy
Σχέσεις μεταξύ κατανομών () Έστω ανεξάρτητες τμ Χ και Χ όπου: Τότε ~ N ~ N ( μ ), σ ( μ, σ ) Z = N ±, ( ) μ ± + ~ μ σ σ
Σχέσεις μεταξύ κατανομών () Έστω ανεξάρτητες τμ Χ και Χ όπου: Τότε ~ N ~ Χ ( 0,) n Y = ~ n t n
Σχέσεις μεταξύ κατανομών (3) Έστω ανεξάρτητες τμ Χ, Χ,,Χ n που ακολουθούν την τυπική κανονική κατανομή Ν(0,) η κάθε μία. Τότε: Y n = i = ~ Χ i n
Σχέσεις μεταξύ κατανομών (4) Έστω ανεξάρτητες τμ Χ, Χ,,Χ n που ακολουθούν την Χ με k, k,,k n βαθμούς ελευθερίας αντίστοιχα. Τότε: Y n = i= i ~ Χ r r = k + k +... + k n
Σχέσεις μεταξύ κατανομών (5) Έστω ανεξάρτητες τμ Χ και Χ όπου: Τότε ~ Χ + k ~ Χ n Χ ~ n k
Σχέσεις μεταξύ κατανομών (6) Έστω ανεξάρτητες τμ Χ και Χ όπου: Τότε ~ Χ ~ Χ k n Y = k ~ F k, n n
Σχέσεις μεταξύ κατανομών (7) Έστω τμ Χ ~F k,n. Τότε Υ=/Χ ~F n,k
Τυχαίο Δείγμα Τυχαίο δείγμα τδ είναι μία ακολουθία n ανεξάρτητων τμ (Χ, Χ,,Χ n ) που έχουν όλες την ίδια κατανομή, αυτή του πληθυσμού
Στατιστικό Κάθε συνάρτηση του τδ που δεν περιέχει άγνωστες παραμέτρους, ονομάζεται στατιστική συνάρτηση ή στατιστικό. Τα στατιστικά είναι και αυτά τυχαίες μεταβλητές αφού προέρχονται από τυχαίο δείγμα που είναι μία συλλογή τυχαίων μεταβλητών
Τυχαίο δείγμα από την Κανονική κατανομή Έστω Χ, Χ,,Χ n τδ από την κανονική κατανομή Ν(μ,σ ). Τότε η μέση τιμή και η διασπορά του δείγματος είναι ανεξάρτητες τμ και: ~ ( n ) S σ N μ, ~ σ n ( μ ) Τότε: t n = ~ t n S n
Τυχαία δείγματα από την Κανονική κατανομή Έστω Χ, Χ,,Χ n και Υ, Υ,,Υ m ανεξάρτητα τδ όπου: ( ) ( ), ~, ~ σ μ σ μ N Y N i i Τότε ( ) ( ) ( ) ~ + + + + = m t n m n m n S m S n Y t μ μ
Τυχαία δείγματα από την Κανονική κατανομή Έστω Χ, Χ,,Χ n και Υ, Υ,,Υ m ανεξάρτητα τδ όπου: ( ) ( ), ~, ~ σ μ σ μ N Y N i i Τότε ( ) ( ) ( ) ( ), ~ = = m F n S S m S m n S n F σ σ σ σ
Κεντρικό Οριακό Θεώρημα Αν οι τμ Χ, Χ,,Χ n είναι ανεξάρτητες και ισόνομες (ακολουθούν την ίδια κατανομή) με Ε(Χ i )=μ και V( i )=σ, i=,,n. Τότε η δειγματική μέση τιμή ακολουθεί ασυπτωτικά την κανονική κατανομή: ( μ ) i = σ n when ~ N n i ~ n μ ~ N, σ n N ( 0, ) ( n μ, n σ ) ( n 30 )