Περιεχόμενα της Ενότητας Στατιστική Ι Ενότητα 5: Συνεχείς Κατανομές Πιθανότητας Δρ. Χρήστος Εμμανουηλίδης Επίκουρος Καθηγητής Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης. Συνεχείς Τυχαίες Μεταβλητές. Συνεχείς Κατανομές Πιθανότητας 3. Μέτρα Θέσης και Διασποράς Κατανομών Μέση Τιμή Διακύμανση και Τυπική Απόκλιση 4. Κανονική Κατανομή 5. Κεντρικό Οριακό Θεώρημα 6. Προσέγγιση της Δυωνυμικής Κατανομής με την Κανονική Κατανομή Χ. Εμμανουηλίδης, cemman@econ.auth.gr Συνεχείς Τυχαίες Μεταβλητές Μια συνεχής τυχαία μεταβλητή μπορεί να λάβει οποιαδήποτε τιμή σε ένα ή περισσότερα διαστήματα πραγματικών αριθμών. Δεν έχει νόημα να αναφερόμαστε στην πιθανότητα η τυχαία μεταβλητή να λάβει συγκεκριμένη τιμή: αυτή είναι πρακτικά μηδενική (αμελητέα). Έχει όμως νόημα να αναφερόμαστε στην πιθανότητα η τυχαία μεταβλητή να λάβει τιμή σε συγκεκριμένο διάστημα. Η πιθανότητα η τυχαία μεταβλητή να λάβει τιμή σε διάστημα από έως ορίζεται ως το εμβαδόν της περιοχής κάτω από την καμπύλη της συνάρτησης πυκνότητας πιθανότητας μεταξύ των και. Συνεχείς Κατανομές Πιθανότητας Συνεχείς Κατανομές Πιθανότητας Έστω συνεχής τυχαία μεταβλητή Χ με πεδίο τιμών R. Συνάρτηση πυκνότητας πιθανότητας της Χ ή απλά συνάρτηση πυκνότητας είναι η συνάρτηση f που ικανοποιεί τις συνθήκες: α) f() 0για κάθε τιμή R, β) f ( ) d= R Συνάρτηση πυκνότητας πιθανότητας Δίνεται από έναν μαθηματικό τύπο και το γράφημά της είναι μια καμπύλη: f() α Πυκνότητα πιθανότητας τιμή β Χ Η σχέση f ( ) d= R δηλώνει απλά ότι το εμβαδόν κάτω από την καμπύλη είναι μονάδα Η f() δεν είναι η πιθανότητα της τιμής, αλλά η πυκνότητα πιθανότητας της τιμής : η f()d είναι η πιθανότητα η τ.μ. Χ να λάβει τιμή στο διάστημα (,+d), δηλαδή η P( +d) με d πολύ μικρό (d 0). Χ. Εμμανουηλίδης, cemman@econ.auth.gr PDF processed with CutePDF evaluation edition www.cutepdf.com
Συνεχείς Κατανομές Πιθανότητας Πιθανότηταδιαστήματος: Για κάθε, του R ορίζεται P( ) = δηλαδή η πιθανότητα η τ.μ. να λάβει τιμή στο διάστημα [, ] είναι το εμβαδόν κάτω από την καμπύλη της συνάρτησης πυκνότητας πιθανότητας και μεταξύ των σημείων και. f() f ( ) d P( ) f() Συνεχείς Κατανομές Πιθανότητας Αθροιστική συνάρτηση πιθανότητας ή απλά συνάρτηση κατανομής της τ.μ. Χ ονομάζεται η συνάρτηση F() για την οποία ισχύει F ( ) = P( ) = f ( u) du P( ).0 0.8 0.6 F() 0.4 Χ Χ 0. 0.0-9 -5-3 7 Συνεχείς Κατανομές Πιθανότητας Ιδιότητες συνάρτησης κατανομής Από τον ορισμό προκύπτουν οι παρακάτω ιδιότητες για τη συνάρτηση κατανομής τ.μ. Χ με R = [α,β] R: Ι. lim F( ) = 0 και α lim F( ) = β Ι. για κάθε <, F( ) F( ) και P( ) = P( ) P( ) = F( ) F( ) f ( u) du= f ( u) du f ( u) du f() P( ) Χ Μέτρα Θέσης και Διασποράς Συνεχών Κατανομών Κύριο μέτρο θέσης είναι η αναμενόμενη ή μέση τιμή και κύριο μέτρο διασποράς είναι η διακύμανση. Αναμενόμενη τιμή συνεχούς τ.μ. Χ : = E ( ) = µ f ( ) d Διακύμανση συνεχούς τ.μ. Χ : = σ = R H τυπική απόκλιση, σ Χ,ορίζεται ως R [ ] ( E( )) f ( ) d= E( E( )) Var( ) σ = Var( ) Μέτρα Θέσης και Διασποράς Συνεχών Κατανομών Για την εκτίμηση της μέσης τιμής και της διακύμανσης ισχύουν όσα αναφέρθηκαν για τις διακριτές τ.μ. Το ίδιο ισχύει και για τις ιδιότητές τους. Κανονική Κατανομή Πιθανότητας Χ. Εμμανουηλίδης, cemman@econ.auth.gr
Χρησιμότητα της κανονικής κατανομής α) περιγράφει καλά την μεταβλητότητα των μετρήσεων πολλών τυχαίων μεταβλητών που εμφανίζονται σε πρακτικά προβλήματα ή φαινόμενα Παραδείγματα προσεγγιστικά κανονικών εμπειρικών κατανομών β) είναι καλή προσέγγιση άλλων θεωρητικών κατανομών πιθανοτήτων κάτω από ορισμένες συνθήκες γ) είναι βασικό εργαλείο της επαγωγικής στατιστικής για τον έλεγχο υποθέσεων Χαρακτηριστικά της Κανονικής Κατανομής Το σχήμα της είναι συμμετρική καμπανοειδής καμπύλη. Η θέση και το σχήμα της κατανομής καθορίζονται από δύο παραμέτρους, τις µ (μέση τιμή) και σ (διακύμανση). Το μέγιστο της κανονικής καμπύλης αντιστοιχεί στη μέση τιμή, η οποία ταυτίζεται με την διάμεσο και τον τύπο. Η τυχαία μεταβλητή έχει άπειρο f() εύρος Ο μέσος μπορεί να λάβει οποιαδήποτε πραγματική τιμή. Χαρακτηριστικά της Κανονικής Κατανομής Η διακύμανση καθορίζει το εύρος της καμπύλης: μεγάλες τιμές της αντιστοιχούν σε πιο απλωμένες κατανομές μικρότερου ύψους. Το εμβαδόν κάτω από την καμπύλη είναι (0.5 αριστερά της μέσης τιμής και 0.5 δεξιά). Οι πιθανότητες για την κανονικά f() κατανεμημένη τυχαία μεταβλητή δίνονται από εμβαδά κάτω από την καμπύλη. µ µ Συνάρτηση Πυκνότητας Πιθανότητας Σχήμα και θέση της κατανομής(καθορίζεται από τα μκαι σ) όπου: f ( ) = e σ π ( µ ) σ, για - + µ = μέση τιμή σ = τυπική απόκλιση π = 3.459 e =.788 (βάση νεπέρειων λογαρίθμων) Όταν η τ.μ. Χ κατανέμεται σύμφωνα με την κανονική κατανομή μεπαραμέτρουςμκαισ γράφουμε συμπαγώς Χ ~ Ν(μ,σ ) Χ. Εμμανουηλίδης, cemman@econ.auth.gr 3
Αθροιστική κανονική κατανομή ή κανονική συνάρτηση κατανομής: ( u µ ) σ F( ) = P( ) = e du σ π Σχήμα της αθροιστικής κατανομής(καθορίζεται από τα μ και σ) Έχει τις γνωστές ιδιότητες κάθε συνάρτησης κατανομής: Σιγμοειδής καμπύλη με κάτω ασύμπτωτη στο F(- ) = 0 και άνω ασύμπτωτη στο F( ) = Για κάθε <, F( ) < F( ) και P( ) = P( ) P( ) = F( ) F( ) Η πιθανότητα είναι το εμβαδόν κάτω από την κανονική καμπύλη: f() P( ) = f ( ) d= F( ) F( ) Υπολογισμός πιθανότητας : Γίνεται με τη χρήση της αθροιστικής κανονικής κατανομής και πινάκων που την καταγράφουν. Για κάθε δυνατό ζεύγος (μ,σ ) έχουμε μια διαφορετική κανονική κατανομή που θα απαιτούσε τον δικό της πίνακα (δηλ. υπολογισμούς του ολοκληρώματος που δίνει τις τιμές της F() ) f() Υπολογισμός πιθανότητας : Η λύση είναι να τυποποιήσουμε την κανονική κατανομή, χρησιμοποιώντας την τυποποιημένη τυχαία μεταβλητή Ζ: Αν μ = σ ~ N( µ, σ ) ~ N( 0, ) Χ ΚανονικήΚατανομή f() 0.00 0.0 0.0 0.03 0.04 ~N(μ,σ^), μ=00, σ=0 60 80 00 0 40 60 µ = σ Τυποποιημένη ή τυπική Κανονική Κατανομή f(z) 0.0 0. 0. 0.3 0.4 ~N(0,) -4-0 4 Ένας πίνακας αρκεί. Χ. Εμμανουηλίδης, cemman@econ.auth.gr 4
Υπολογισμός πιθανότητας : Όταν Χ ~ Ν(μ,σ ), τότε µ F( ) = F z= σ δηλαδή η τιμή της αθροιστικής συνάρτησης κατανομής της Χ για Χ= ισούται με την τιμή της αθροιστικής συνάρτησης κατανομής της Ζ για Ζ = z = (-μ)/σ. Η τιμή z που αντιστοιχεί στην τιμή ονομάζεται z-τιμή της Υπολογισμός πιθανότητας : Επειδή για κάθε συνεχή τ.μ. Χ ισχύει τότε P( ) = F ( ) F ( ) P( ) = P( z z) = F( z) F( z) όπου z = ( -μ)/σ και z = ( -μ)/σ Άρα, αν Χ ~ Ν(μ,σ ), ο υπολογισμός των πιθανοτήτων μπορεί να γίνει χρησιμοποιώντας τις αθροιστικές πιθανότητες της τυπικής κανονικής κατανομής. Παράδειγμα Τυποποίησης Παράδειγμα Τυποποίησης Κανονική Κατανομή σ= 0 µ= 5 µ 6. 5 z= = = 0. σ 0 6. µ= 0 σ= 0. Πίνακας Αθροιστικής Τυπικής Κανονικής Κατανομής.00.0.0 0.0.5000.5040.5080 0..5398.5438.5478 0..5793.583.587 0.3.679.67.655 µ= 0 Πιθανότητες σ= 0.5478 0. Η σκιασμένη περιοχή είναι σε μεγέθυνση Υπολογισμός πιθανότητας : Εξαιτίας της συμμετρίας της τυπικής κανονικής κατανομής, ισχύει για οποιαδήποτε τιμή z της Ζ η σχέση F( z) = P( z) = P( z) = P( z) = F( z) Παράδειγμα για z= Μερικές χρήσιμες πιθανότητες : Οι παρακάτω πιθανότητες για μια τ.μ. ~Ν(μ,σ ) χρησιμοποιούνται συχνά στη δειγματοληψία και στη στατιστική συμπερασματολογία. P ( µ σ <Χ< µ + σ ) = 0. 683 P ( µ. 645σ <Χ< µ +. 645σ ) = 0. 90 P ( µ. 96σ < Χ< µ +. 96σ ) = 0. 95 P ( µ. 58σ <Χ< µ +. 58σ ) = 0. 99 Χ. Εμμανουηλίδης, cemman@econ.auth.gr 5
Μερικές χρήσιμες πιθανότητες: Κανονική Κατανομή Παράδειγμα - P(3.8 5) µ 3.8 5 µ 5 5 z = = = 0. z = = = 0 σ 0 σ 0 σ = 0 σ =.0478 3.8 µ = 5 -. Η σκιασμένη περιοχή είναι σε μεγέθυνση Παράδειγμα - P(3.8 5) P(3.8 5)=P( 5)- P( 3.8) Για =5, z = (5-5)/0 = 0, Για =3.8, z = (3.8-5)/0 = -0. P(3.8 5)= P( 0) - P( -0.) = 0.5 P( 0.) = 0.5 ( - P( 0.)) = -0.5 + P( 0.)) = -0.5 + 0.5478 = 0.0478 Παράδειγμα - P(.9 7.).9 5 7. 5 z = = = 0. z = = = 0. σ 0 σ 0 Κανονική Κατανομή σ = 0 µ µ.9 5 7. Η σκιασμένη περιοχή είναι σε μεγέθυνση 0.583 σ = 0.664 -. 0. Παράδειγμα - P(.9 7.) P(.9 7.)=P( 7.)- P(.9) Για =.9, z = -0., Για =7., z = 0. P(.9 7.) = P( 0.) - P( - 0.) = P( 0.) P( 0.) = P( 0.) ( - P( 0.)) = P( 0.) = 0.583 - = 0.664 Κανονική Κατανομή σ = 0 µ = 5 Παράδειγμα - P( 8) µ 8 5 z= = = 0.30 σ 0 8 Η σκιασμένη περιοχή είναι σε μεγέθυνση 0.679 σ =.30 0.38 Χ. Εμμανουηλίδης, cemman@econ.auth.gr 6
Παράδειγμα - P( 8) P( 8)= - P( 8) Για =8, z = 0.30, P( 8) = - P( 0.30) = 0.679 = 0.38 Παράδειγμα* Εργάζεστε στον Έλεγχο Ποιότητας εταιρίας κατασκευής λαμπτήρων. Ο χρόνος ζωής τους ακολουθεί κανονική κατανομή με 00 ημέρες και σ = 00 ημέρες. Ποια είναι η πιθανότητα ένας λαμπτήρας να λειτουργήσει α) από000 έως400 ημέρες; β) λιγότερο από 470 ημέρες; Παράδειγμα* - P(000 400) µ 000 000 µ 400 000 z = = = 0.0 z = = =.0 σ 00 σ 00 Παράδειγμα* - P(000 400) P(000 400)=P( 400)- P( 000) Κανονική Κατανομή σ = 00 00 400 σ = 0.477.0 Για = 000, z = 0.00, Για = 400, z =.00 P(000 400) = P( ) - P( 0) = 0.977-0.5 = 0.477 σ = 0.477.0 Κανονική Κατανομή σ = 00 470 Παράδειγμα* - P( 470) µ 470 000 z= = =.65 σ 00 00 0.0040 -.65 0.9960 960 σ =.65 0.0040 Παράδειγμα* - P( 470) P( 470) Για = 470, z = -.65, P( 470) = P( -.65) = P(.65) = - P(.65) = - 0.9960 = 0.0040 0.0040 -.65 0.9960 960 σ =.65 0.0040 Χ. Εμμανουηλίδης, cemman@econ.auth.gr 7
Εύρεση τιμών της Ζ από Γνωστές Πιθανότητες Εύρεση τιμών της Ζ από Γνωστές Πιθανότητες Ποιο είναι τοz δεδομένου ότι F(z) = 0.67; Πίνακας Αθρ.Τυπικής Κανονικής Κατανομής Ποιο είναι τοz δεδομένου ότι F(z) = 0.67; Πίνακας Αθρ.Τυπικής Κανονικής Κατανομής 0.67 σ=.00.0 0. 0.0.5000.5040.5080 0.67 σ=.00.0 0. 0.0.5000.5040.5080 0..5398.5438.5478 0..5398.5438.5478 µ= 0 Η σκιασμένη περιοχή είναι σε μεγέθυνση z 0..5793.583.587 0.3.679.67.655 µ= 0 0.3 Η σκιασμένη περιοχή είναι σε μεγέθυνση 0..5793.583.587 0.3.679.67.655 Εύρεση τιμών της Ζ από Γνωστές Πιθανότητες Aν η τιμή πιθανότητας δεν υπάρχει στον Πίνακα; F(z) = 0.63 0.3 z 0.3 (από τον Πίνακα), Επειδή η τιμή 0.63 είναι κοντύτερα στην τιμή 0.67 (για z = 0.3) απ ότι στην 0.655 (για z = 0.3) μπορούμε να θέσουμε προσεγγιστικά z 0.3 Εναλλακτικά: z 0.35 Ακριβέστερη είναι η μέθοδος της γραμμικής παρεμβολής Εύρεση τιμών της Χ από Γνωστές Πιθανότητες Ποιο είναι το δεδομένου ότι F() = 0.67; 0.67 µ= 5 Η σκιασμένη περιοχή είναι σε μεγέθυνση σ= 0 0.67 µ= 0 σ= 0.3 Εύρεση τιμών της Χ από Γνωστές Πιθανότητες Ποιο είναι το δεδομένου ότι F() = 0.67; 0.67 σ= 0 0.67 σ= Εύρεση τιμών της Χ από Γνωστές Πιθανότητες F()=P( ) = 0.67 F(z) = 0.67 z = 0.3 (από τον Πίνακα), z = (-μ)/σ = μ+σ z = 5 + (0.3)(0) = 8. µ= 5 µ= 0 0.3 Η σκιασμένη περιοχή είναι σε μεγέθυνση ( 0 3)( 0) = µ + z σ = 5+. = 8. Χ. Εμμανουηλίδης, cemman@econ.auth.gr 8
Κεντρικό Οριακό Θεώρημα Κεντρικό Οριακό Θεώρημα (Central Limit Theorem) Κ.Ο.Θ.: Αν οιχ,χ,,χ n είναι ανεξάρτητες και ισόνομες τυχαίες μεταβλητές με μέση τιμή μ και πεπερασμένη διακύμανση σ, και S n = i= είναι το άθροισμά τους και S = ο αριθμητικός τους μέσος, n τότε όσο αυξάνει ο αριθμός n των τ.μ. Χ ( nµ, n ) S ~ N σ i σ ~ N µ, n Κεντρικό Οριακό Θεώρημα Παρατηρείστε ότι η κατανομή του μέσου προσεγγίζει την κανονική κατανομή όσο το πλήθος n των ανεξάρτητων και ισόνομων μεταβλητών Χ αυξάνει, ανεξάρτητα από την κατανομή της Χ. Κεντρικό Οριακό Θεώρημα Σημασία του Κ.Ο.Θ. Ανεξάρτητα από την κατανομή των ανεξάρτητων και ισόνομων τ.μ.χ i, το άθροισμα και ο αριθμητικός τους μέσος ακολουθούν την κανονική κατανομή ασυμπτωτικά, δηλαδή όσο αυξάνει το πλήθος τους. Το ΚΟΘ εξηγεί: το ότι πολλές τυχαίες μεταβλητές ακολουθούν στην πράξη την κανονική κατανομή το ότι σημαντικές κατανομές μπορούν να προσεγγιστούν από την κανονική κατανομή την ευρύτατη χρήση της κανονικής κατανομής στη δειγματοληψία την ευρύτατη χρήση της κανονικής κατανομής στην στατιστική συμπερασματολογία. Κανονική Προσέγγιση της Δυωνυμικής Κατανομής Κανονική Προσέγγιση της Δυωνυμικής Κατανομής. Πώς υπολογίζουμε δυωνυμικές πιθανότητες όταν το μέγεθος δείγματος n είναι μεγάλο;. Όταν το n είναι μεγάλο η δυωνυμική κατανομή τείνει να γίνει συμμετρική ακόμη και για μικρά p, και προσεγγίζεται με την κανονική κατανομή. 3. Οι τιμές των πιθανοτήτων είναι προσεγγιστικές. 4. Απαιτείται Διόρθωση Συνέχειας..3...0 P() Παράδειγμα συμμετρίας n= 0 p= 0.50 0 4 6 8 0 Χ. Εμμανουηλίδης, cemman@econ.auth.gr 9
Η Πιθανότητα είναι Προσεγγιστική P().3...0 Δυωνυμική Πιθανότητα: Ύψος Παραλληλογράμμου = Εμβαδόν Παρ/μου 0 4 6 8 0 Κανονική Πιθανότητα: Εμβαδόν κάτω από την καμπύλη από το 3.5 έως το 4.5 Η Πιθανότητα είναι Προσεγγιστική P().3...0 Δυωνυμική Πιθανότητα: Ύψος Παραλληλογράμμου = Εμβαδόν Παρ/μου Πιθανότητα που προστίθεται από την Κανονική Καμπύλη 0 4 6 8 0 Πιθανότητα που χάνεται από την Κανονική Καμπύλη Κανονική Πιθανότητα: Εμβαδόν κάτω από την καμπύλη από το 3.5 έως το 4.5. Ρύθμιση / μονάδας στη Διακριτή Τιμή. Χρησιμοποιείται όταν προσεγγίζουμε μια Διακριτή Κατανομή με μια Συνεχή Κατανομή Διόρθωση Συνέχειας Περίπου ίσα εμβαδά 3. Εξασφαλίζει καλύτερη ακρίβεια. 3.5 4.5 4 (4-0.5) (4 + 0.5) Κανονική Προσέγγιση Διαδικασία. Υπολογίστε την μικρότερη από τις δύο ποσότητες: np, n p ( ) Αν η τιμή της είναι μεγαλύτερη ή ίση του 5, η Κανονική Προσέγγιση μπορεί να χρησιμοποιηθεί. Αυτό πρακτικά σημαίνει ότι το διάστημα είναι μεταξύ 0 και n και η δυωνυμική κατανομή είναι περίπου συμμετρική Άρα, αν Χ~Β(n,p), τότε προσεγγιστικά ισχύει Χ~Ν( np,np(-p) ) ( ) µ ± 3σ = np± 3 np p Κανονική Προσέγγιση Διαδικασία Κανονική Προσέγγιση Παράδειγμα. Εκφράστε τη Δυωνυμική Πιθανότητα με Μορφή Αθροιστικών Πιθανοτήτων: P( ) ή P( ) P( ) Ποια είναι η Κανονική Προσέγγιση της P( = 4) όταν n = 0, και p = 0.5; P() 3. Για κάθε τιμή που μας ενδιαφέρει, = ή/και =, χρησιμοποιείστε:.3. ( + 0.5) np z=. np( p).0 0 4 6 8 0 3.5 4.5 Χ. Εμμανουηλίδης, cemman@econ.auth.gr 0
Κανονική Προσέγγιση Παράδειγμα. Υπολογίστε την ελάχιστη από τις np, n(-p) : Είναι μεγαλύτερη ή ίση του 5, άρα η Κανονική Προσέγγιση μπορεί να χρησιμοποιηθεί Το διάστημα ( ) np= n( p) = 0 0.5 = 5 ( ) ( ) ( )( ) = 5± 3.35= (.64, 8.35) np± 3 np p = 0 0.5 ± 3 0 0.5 0.5 όντως βρίσκεται ανάμεσα στο 0 και το 0 Κανονική Προσέγγιση Παράδειγμα. Εκφράστε τη δυωνυμική πιθανότητα στη μορφή: P = 4 = P 4 P 3 ( ) ( ) ( ) 3. Υπολογίστε τις z τιμές της τυπικής κανονικής κατανομής: z ( + 0.5) np (3+ 0.5) 5 = = = z np( p) 5(0.5) ( + 0.5) np (4+ 0.5) 5 = = = np( p) 5(0.5) 0.95 0.3 Κανονική Προσέγγιση Παράδειγμα 4. Σχεδιάστε την Προσεγγιστική Τυπική Κανονική Κατανομή :.3745 -.7.034.3745.7 -.95 σ = -.3 Κανονική Προσέγγιση Παράδειγμα 5. Η Ακριβής Πιθανότητα από την Δυωνυμική Κατανομή είναι 0.05 (Προσεγγιστική = 0.034) P().3...0 0 4 6 8 0 Κανονική Προσέγγιση Παράδειγμα Για τα δεδομένα του παραδείγματός μας υπολογίστε τις πιθανότητες : P( 4) P( > 4) P( 4) P( < 4) P( 4) P( < 4) Τέλος Ενότητας Χ. Εμμανουηλίδης, cemman@econ.auth.gr
Τέλος Ενότητας Χ. Εμμανουηλίδης, cemman@econ.auth.gr 67 Χ. Εμμανουηλίδης, cemman@econ.auth.gr