. Η κανονική κατανοµή Η κανονική κατανοµή είναι η ηµαντικότερη κατανοµή πιθανοτήτων µε τις περιότερες εφαρµογές. Μελετήθηκε αρχικά από τον De Moire (667-754) και από τον Lple (749-87) οι οποίοι απέδειξαν ότι η διωνυµική κατανοµή Β(n,p) προεγγίζεται, για µεγάλο n, από την κανονική κατανοµή. Το 809 ο Guss (777-855) µελετώντας τη θεωρία τυχαίων φαλµάτων παρατήρηε ότι οι κατανοµές των φαλµάτων των µετρήεων µπορούαν να προεγγιτούν ικανοποιητικά από µία υνεχή καµπύλη, η οποία αναφερόταν ως «κανονική καµπύλη των φαλµάτων» και αποδίδονταν τους νόµους της τύχης. Η χρηιµότητα της κανονικής κατανοµής θα γίνει περιότερο φανερή από το κεντρικό οριακό θεώρηµα που θα αναφέρουµε ε επόµενο κεφάλαιο. Σύµφωνα µε το θεώρηµα αυτό, κάθε φυική ποότητα της οποίας η τιµή µπορεί να θεωρηθεί ότι διαµορφώνεται από ένα µεγάλο αριθ- µό (ανεξάρτητων) παραγόντων ακολουθεί προεγγιτικά κανονική κατανοµή. Οριµός.. Η υνεχής κατανοµή µε.π.π. ( µ) f ( ) e, R (µ R, > 0) π καλείται κανονική κατανοµή µε παραµέτρους µ,. (υµβ. µε Ν(µ, )). Αποδεικνύεται ότι η µέη τιµή αυτής της κατανοµής είναι ίη µε µ ενώ η διαπορά της ίη µε. Πράγµατι, αν Χ ~ Ν(µ, ), τότε E( X ) f ( ) d π e ( µ) d π ( µ) e και θέτοντας y µ το πρώτο ολοκλήρωµα, θα έχουµε ότι ( µ) d + π µ e ( µ) d y ( ) E X + µ ( ) 0 + µ π ye dy f d Η παραπάνω ιότητα ιχύει διότι το πρώτο ολοκλήρωµα είναι το ολοκλήρωµα µιας υνάρτηης g για την οποία ιχύει ότι g(y) g(y) (υµµετρική ως προς το ηµείο (0,0)) και εποµένως είναι ίο µε 0. Επίης, το δεύτερο ολοκλήρωµα είναι ίο µε διότι η f είναι.π.π. Τέλος, V ( X ) E(( X µ) ) ( µ) f ( ) d π ( µ) µ. y y ( µ)/ y e dy y e y π π dy e ( µ) διότι το τελευταίο ολοκλήρωµα είναι γνωτό (π.χ. από πίνακες ολοκληρωµάτων) ότι είναι ίο µε π. Το γράφηµα της υνάρτηης πυκνότητας πιθανότητας της N(µ, ) δίνεται το επόµενο χήµα για α) µ 8,, β) µ 5,, γ) µ 5, 4. d Boutsiks M.V. (00), Σηµειώεις Στατιτικής ΙΙΙ, Τµήµα Οικονοµικής Επιτήµης, Πανεπιτήµιο Πειραιώς. 7
0.5 µ8, 0. 0. µ5, µ5, 4 0. -5 0 5 8 5 Μία ηµαντική ιδιότητα της κανονικής κατανοµής δίνεται την παρακάτω πρόταη. Πρόταη.. Αν η τ.µ. Χ ακολουθεί κανονική κατανοµή Ν(µ, ) τότε και η τ.µ. Χ + b (α, b R, α 0) ακολουθεί κανονική κατανοµή Ν(µ+b, ). Απόδειξη. Έτω Y αχ+b. Αν α > 0 θα ιχύει ότι Εποµένως, f ( y) Y F ( y) P( Y y) P( X + b y) P( X Y d dy F ( y) Y d dy y b FX ( ) f X y b ( ) d dy (( yb) / µ) ( y( µ + b)) ( ) e π ( ) e π y b ) F y b f X X y b ( ) y b ( ) και εποµένως η τ.µ. αχ+b ~ Ν(µ+b, ). Ανάλογα γίνεται η απόδειξη και για α < 0. ιαφορετικά, θα µπορούαµε άµεα να υπολογίουµε τη µέη τιµή και τη διαπορά της τ.µ. Χ+b ως εξής: και E ( X + b) E( X ) + E( b) E( X ) + b µ + b V ( X + b) V ( X ). (Οι παραπάνω δύο χέεις µας δίνουν τη µέη τιµή και τη διαπορά της τ.µ. Χ+b χωρίς να µας δίνουν κάποια άλλη πληροφορία για την κατανοµή της, ενώ η Πρόταη.. µας δίνει την επιπρόθετη πληροφορία ότι η τ.µ. Χ+b ακολουθεί και αυτή κανονική κατανοµή). - Η τυπική κανονική κατανοµή. Η κανονική κατανοµή Ν(0,) (δηλ. µ0, ) θα καλείται τυπική κανονική κατανοµή µε υνάρτηη πυκνότητας πιθανότητας f N ( 0, )( ) e, R. π Η υνάρτηη πυκνότητας πιθανότητας και η αθροιτική υνάρτηη κατανοµής της Ν(0,) θα υµβολίζονται για ευκολία µε φ() και Φ() αντίτοιχα. Η υνάρτηη κατανοµής της τυπικής κανονικής u Φ e ( ) φ( u) du π du, R Boutsiks M.V. (00), Σηµειώεις Στατιτικής ΙΙΙ, Τµήµα Οικονοµικής Επιτήµης, Πανεπιτήµιο Πειραιώς. 8
θα έχει τη µορφή: 0.9986 0.977 0.84 0.8 Φ () 0.6 0.5 0. 0.587 0.08-4 - 0.004 4 υτυχώς, το ολοκλήρωµα που εκφράζει την Φ() δεν µπορεί να γραφεί ε απλούτερη µορφή. Για το λόγο αυτό ο υπολογιµός των τιµών της Φ γίνεται χρηιµοποιώντας προεγγιτικές µεθόδους. Ενδεικτικά, έχει βρεθεί ότι: Φ(-) 0.004, Φ(-) 0.08, Φ(-) 0.587, Φ(0)0.5, Φ() 0.84, Φ() 0.977, Φ() 0.9986. Συνήθως, το τέλος κάθε υγγράµµατος τατιτικής υπάρχει ένας πίνακας που περιέχει (προεγγιτικές) τιµές της Φ() για διάφορες τιµές του. Όπως θα γίνει φανερό τη υνέχεια, η χρηιµότητα αυτού του πίνακα είναι µεγάλη για την κατακευή διατηµάτων εµπιτούνης και για τους ελέγχους τατιτικών υποθέεων. Η υνάρτηη πυκνότητας πιθανότητας της τυπικής κανονικής θα έχει τη µορφή: Συνάρτηη πυκνότητας πιθανότητας της Ν(0,) 0.5 0. φ() 0. 0. -4 - - - 0 4 68.8% 95.44% 99.7% Παρατηρούµε ότι αν Χ ~ Ν(0,) τότε, π.χ., P ( X ) φ( ) d Φ() Φ( ) 0.997, P ( X ) φ( ) d Φ() Φ( ) 0.9544, Boutsiks M.V. (00), Σηµειώεις Στατιτικής ΙΙΙ, Τµήµα Οικονοµικής Επιτήµης, Πανεπιτήµιο Πειραιώς. 9
P ( X ) φ( ) d Φ() Φ( ) 0.688. Επίης, από το χήµα γίνεται φανερό ότι η υνάρτηη φ πυκνότητας πιθανότητας της Ν(0,) είναι υµµετρική περί τον κάθετο άξονα που περνά από το 0. Εποµένως το εµβαδόν κάτω από την φ (.π.π. της Ν(0,)) από το ως το 0 είναι ίο µε το εµβαδόν από το 0 έως το και επειδή ως γνωτό το υνολικό εµβαδόν είναι ίο µε θα ιχύει ότι Φ(0) 0 φ ( ) d 0.5 (όπως έχει γίνει ήδη φανερό και από τις ενδεικτικές τιµές της Φ που δίνονται παραπάνω). Επίης, λόγω της υµµετρίας θα είναι Φ ( ) Φ( ), R. 0. 0. φ() Φ() 0. Φ() - 0 Η χρηιµότητα της τυπικής κανονικής κατανοµής γίνεται φανερή από την ακόλουθη παρατήρηη. H αθροιτική υνάρτηη κατανοµής της κανονικής κατανοµής µε µέη τιµή µ και διαπορά δίνεται από τον τύπο ( yµ) F ( ) f y dy e dy N ( ) (µ, ) N (µ, ). π Το ολοκλήρωµα αυτό δεν µπορεί να γραφεί ε απλούτερη µορφή. Συνεπώς, ο απευθείας υπολογιµός της αθροιτικής υνάρτηης κατανοµής της Ν(µ, ) δεν είναι δυνατός. Για το λόγο αυτό θα ήταν αρκετά χρήιµη η κατακευή πινάκων που να δίνουν την τιµή της F ( ) για όλες τις N ( µ, ) τιµές των παραµέτρων, µ,, όπως και την περίπτωη της Φ που εξετάαµε παραπάνω. Ευτυχώς, παρατηρούµε ότι αρκεί να βαιτούµε τον πίνακα τιµών της FN ( 0, )( ) Φ(). Πράγµατι, αν η τ.µ. X ~ N(µ, ) τότε από την Πρόταη. θα ιχύει ότι X µ µ µ Z X ~ N µ, N(0,) και υνεπώς, X µ µ µ µ µ F ( ) P( X ) P( ) P( Z ) F (0,) ( ) Φ( ) N(µ, ) N Συνοψίζοντας θα έχουµε την επόµενη πρόταη Πρόταη.. ) Αν η τ.µ. Χ ~N(µ, ) τότε η τ.µ. X µ Z N ~ ( 0, ). ) Η υνάρτηη κατανοµής της N(µ, ) εκφράζεται µέω της υνάρτηης κατανοµής Φ της τυπικής κανονικής από τη χέη µ F ( ) Φ, R N(µ, ). Boutsiks M.V. (00), Σηµειώεις Στατιτικής ΙΙΙ, Τµήµα Οικονοµικής Επιτήµης, Πανεπιτήµιο Πειραιώς.
Εποµένως, για την εύρεη των τιµών της αθροιτικής υνάρτηης κατανοµής της Ν(µ, ) αρκούν οι πίνακες για την Φ(), R. Επειδή όµως, όπως έχει ήδη επιηµανθεί, ιχύει ότι Φ() Φ(), αρκεί να κατακευάουµε πίνακες για την Φ(), 0. Άρα, αν Χ ~ Ν(µ, ), τότε Τέλος, παρατηρούµε ότι, αν Χ ~ Ν(µ, ), τότε µ Φ( ), µ P( X ) ( µ ), < Φ µ X µ P ( µ X µ + ) P( ) Φ() Φ( ) 0.997 X µ P( µ X µ + ) P( ) Φ() Φ( ) 0.9544 X µ P ( µ X µ + ) P( ) Φ() Φ( ) 0.688 Εποµένως, αν µία τ.µ. Χ ακολουθεί Ν(µ, ) τότε παίρνει τιµές µεταξύ του µ και του µ+ µε πιθανότητα χεδόν, τιµές µεταξύ του µ και του µ+ µε πιθανότητα περίπου 95% και τιµές µεταξύ του µ και του µ+ µε πιθανότητα περίπου 68%. µ µ µ µ 68.8% 95.44% 99.7% µ+ µ+ µ+ Άκηη.. Αν η τ.µ. Χ ~ Ν(6,4) να υπολογιτούν οι πιθανότητες α) P(X < 6), β) P(X ), γ) P( < X < 8) δ) P( X 5 <.5), ε) P(X ) X 6 Λύη. Σύµφωνα µε την Πρόταη. η τ.µ. Z ~ N ( 0, ). Άρα, α) P X P X 6 6 6 ( < 6 ) ( < ) PZ ( < 0) Φ ( 0) 05. X 6 6 β) P ( X ) P( > ) P( Z.5) Φ(.5) Φ(.5) 0. 9 6 X 6 8 6 γ) P( < X < 8) P( < < ) P( < Z < ) Φ ( ) Φ ( ) Φ () + Φ() 0.84+ 0.977 0.885 Boutsiks M.V. (00), Σηµειώεις Στατιτικής ΙΙΙ, Τµήµα Οικονοµικής Επιτήµης, Πανεπιτήµιο Πειραιώς.
5 X δ) P( X. ) P(. X. ) P(. X. ) P(. 6 6 85 < < < < <. 6 5 5 5 5 5 5 85 < < ) P(. 5< Z < 5. ) Φ(. 5) Φ(. 5) Φ(. 5) + Φ (. 5) 0.8944 + 0.9878 0.88 ε) P(X) 0 διότι η πιθανότητα ε ηµείο όταν η τ.µ. είναι υνεχής είναι 0. Άκηη.. Αν η τ.µ. Χ ~ Ν(50,0) να βρεθεί το : i) P(X ) 0.840, ii) P(50 X 50 + ) 0.9660 X 50 Λύη. Σύµφωνα µε την Πρόταη. η τ.µ. Z ~ N ( 0, ). Συνεπώς, P X P X 50 ( ) ( 50 ) PZ ( 50 50 ) Φ ( ). ηλαδή, 50 50 Φ( ) 0840. ή ιοδύναµα Φ ( ) 0.840 0. 860 Από τον πίνακα της Φ βρίκουµε ότι Φ(0.9) 0. 860 και εποµένως (χρηιµοποιώντας και το γεγονός ότι η Φ είναι γνήια αύξουα και εποµένως αντιτρέψιµη) 50 Φ( ) Φ(0.9) 50 0.9 4. 5050 X 50 50+ 50 ii) P( 50 X 50+ ) P( ) P( Z ) Φ( ) Φ( ) Φ( ) + Φ( ) Φ( ) ηλαδή, Φ ( ) 0.9660 Φ( ) 0.98 Από τον πίνακα της Φ βρίκουµε ότι Φ(.) 0. 98 και εποµένως Φ( ) Φ(.).. Άκηη.. Μηχανή κατακευάζει βίδες που το µήκος τους ε m ακολουθεί την Ν(5,0. ). Εάν το µήκος µίας βίδας είναι έξω από το διάτηµα 5±0. η βίδα θεωρείται ελαττωµατική. α) Ποια η πιθανότητα µια τυχαία επιλεγµένη βίδα να είναι ελαττωµατική; β) Ποια η πιθανότητα ανάµεα ε τυχαία επιλεγµένες βίδες, το πολύ µία να είναι ελαττωµατική; X 5 Λύη Αν Χ είναι η τ.µ. που εκφράζει το µήκος µιας βίδας, η τ.µ. Z ~ N ( 0, ) (βλ. Πρόταη 0..) 48 X α) P( X. X.) P(. X.) P(. 5 5 5. 5 >+ 5 0ή < 5 0 48< < 5 < < ) 0. 0. 0. P( < Z < ) ( Φ( ) Φ( )) ( Φ( ) + Φ ( )) Φ( ) 0. Boutsiks M.V. (00), Σηµειώεις Στατιτικής ΙΙΙ, Τµήµα Οικονοµικής Επιτήµης, Πανεπιτήµιο Πειραιώς.
β) Είναι γνωτό ότι αν Υ είναι το πλήθος των επιτυχιών ε ν ανεξάρτητες δοκιµές η κάθε µία από τις οποίες έχει πιθανότητα επιτυχίας p και πιθανότητα αποτυχίας p, τότε η τ.µ. Υ ακολουθεί διωνυµική κατανοµή B(ν,p). Ειδικότερα, PY y y p y p y ( ) ( ), y,,..., 0 (αποδεικνύεται ότι Ε(Υ)νp, Vr(Y)νp(p)) Στη υγκεκριµένη άκηη, αν Υ εκφράζει το πλήθος των ελαττωµατικών βιδών το δείγµα των βιδών, τότε Υ~Β(ν,p0.). (εδώ θεωρούµε ως «επιτυχία» την καταγραφή ελαττωµατικής βίδας). Συνεπώς ζητάµε την πιθανότητα PY PY PY p p p p p p p ( ) ( ) + ( ) ( ) ( ) ( ) ( ) + + 0 0 0 0 9 ( 0. ) + 0. ( 0. ) 0. 68 +. 0. 68 0. 0+ 0. 0994 0. Άκηη.4. Το ύψος των ανδρών ενός πληθυµού ακολουθεί κανονική κατανοµή N(67, ). i) Ποια η πιθανότητα ένας τυχαία επιλεγµένος άνδρας να έχει ύψος α) µεγαλύτερο από 67m β) µεταξύ 64m και 7m γ) µεγαλύτερο από 70m ii) Σε ένα τυχαίο δείγµα 4 ανδρών ποια η πιθανότητα α) να έχουν όλοι ύψος πάνω από 70 β) δύο να έχουν ύψος πάνω από τη µέη τιµή και δύο κάτω από τη µέη τιµή; Λύη. Αν Χ είναι η τ.µ. που εκφράζει το ύψος ενός άνδρα ε m τότε, από την Πρόταη. ιχύει ότι X 67 Z ~ N ( 0, ). i) Θα είναι α) P X P X 67 6767 ( > 67) ( > ) PZ ( > 0) Φ ( 0) 05. 6467 X 67 767 β) P( 64< X < 7) P( < < ) P( < Z < ) Φ( ) Φ( ) Φ( ) + Φ( ) 0. 977 + 084. 0885. γ) P X P X 67 7067 ( > 70) ( > ) PZ ( > ) Φ ( ) 0. 84 0587. ii) α) Όπως και την προηγούµενη άκηη, θα χρηιµοποιήουµε τη διωνυµική κατανοµή. Αν θέουµε Υ την τ.µ. που εκφράζει το πλήθος των ανδρών µε ύψος πάνω από 70, τότε Υ~Β(ν4, p0.587) και υνεπώς ζητείται η πιθανότητα, PY p p ( ) ( ) p ( p ) p.. 4 4 4 4 44 4 4 4 4 4 0587 0 0006 β) Αν W δηλώνει το πλήθος των ανδρών που είναι ψηλότεροι του 67, τότε W~B(ν4, p0.5) και εποµένως ζητείται η πιθανότητα PW p p ( ) ( ) p ( p ).. 4 6 4 05 0 75. Boutsiks M.V. (00), Σηµειώεις Στατιτικής ΙΙΙ, Τµήµα Οικονοµικής Επιτήµης, Πανεπιτήµιο Πειραιώς.