Βασικές συνεχείς κατανομές και το Κεντρικό Οριακό Θεώρημα

Σχετικά έγγραφα
7. Βασικές Συνεχείς Κατανομές και το Κεντρικό Οριακό Θεώρημα

Το Κεντρικό Οριακό Θεώρημα

Το Κεντρικό Οριακό Θεώρημα

Το Κεντρικό Οριακό Θεώρημα

Η Κανονική Κατανομή κανονική κατανομή (normal distribution) Κεντρικό Οριακό Θεώρημα (Central Limit Theorem) συνδέει οποιαδήποτε άλλη κατανομή

Η Κανονική Κατανομή. Εργαστήριο Μαθηματικών & Στατιστικής/ Γ. Παπαδόπουλος ( 81

{[ 140,150 ),[ 160,170 ),...,[ 200, 210]

5. Περιγραφική Στατιστική

5. Περιγραφική Στατιστική

Μάθημα: Γεωργικός Πειραματισμός-Βιομετρία (Κωδ. 2860) 1. Περιγραφική Στατιστική

Μάθημα: Γεωργικός Πειραματισμός-Βιομετρία (Κωδ. 2860) 2. Τυχαίες μεταβλητές-βασικές κατανομές

Ε 1. Διαφορικός λογισμός (Κανόνες παραγώγισης)

4. Βασικές κατανομές και το Κεντρικό Οριακό Θεώρημα

ΕΠΑΝΑΛΗΠΤΙΚΕΣ ΑΣΚΗΣΕΙΣ ΣΤΑ ΜΑΘΗΜΑΤΙΚΑ ΤΗΣ ΓΕΝΙΚΗΣ ΠΑΙΔΕΙΑΣ

ΜΑΘΗΜΑΤΙΚΑ & ΣΤΟΙΧΕΙΑ ΣΤΑΤΙΣΤΙΚΗΣ

είναι οι τιμές μιας μεταβλητής Χ, που αφορά τα άτομα ενός δείγματος μεγέθους v,. Συχνότητα (απόλυτη) νi

ΓΙΑ ΜΙΑ ΕΠΑΝΑΛΗΨΗ ΣΤΗΝ ΥΛΗ ΤΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΓΕΝΙΚΗΣ ΠΑΙΔΕΙΑΣ

ΓΕΝΙΚΗΣ ΠΑΙΔΕΙΑΣ ΘΕΜΑΤΑ ΕΠΑΝΑΛΗΨΗΣ Γ ΛΥΚΕΙΟΥ

lim f (x) = +. ΣΗΜΕΙΩΣΕΙΣ Μη πεπερασμένο όριο στο x 0 R

ΕΠΑΝΑΛΗΠΤΙΚΑ ΘΕΜΑΤΑ 2013 Γ ΓΕΝΙΚΟΥ ΛΥΚΕΙΟΥ ΜΑΘΗΜΑΤΙΚΑ & ΣΤΟΙΧΕΙΑ ΣΤΑΤΙΣΤΙΚΗΣ / ΓΕΝΙΚΗΣ ΠΑΙ ΕΙΑΣ ΕΚΦΩΝΗΣΕΙΣ

ΑΡΧΗ 1ΗΣ ΣΕΛΙΔΑΣ ΕΠΑΝΑΛΗΠΤΙΚΕΣ Γ ΗΜΕΡΗΣΙΩΝ

Τι είναι εκτός ύλης. Σχολικό έτος

ΑΡΧΗ 1ΗΣ ΣΕΛΙ ΑΣ Γ ΗΜΕΡΗΣΙΩΝ

14/11/2016. Στατιστική Ι. 7 η Διάλεξη (Βασικές συνεχείς κατανομές)

ΑΡΧΗ 1ΗΣ ΣΕΛΙ ΑΣ Γ ΗΜΕΡΗΣΙΩΝ

Επίπεδο εκπαίδευσης πατέρα 2

ΑΣΚΗΣΕΙΣ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ

4. Δεσμευμένη Πιθανότητα - Ανεξαρτησία Ενδεχομένων

c f(x) = c f (x), για κάθε x R

(c f (x)) = c f (x), για κάθε x R

υπολογισθούν οι πιθανότητες των ενδεχομένων: Α, Β, ΑΒ, Α, Β, Α Β, Α Β, ΑΒ,

ΨΗΦΙΑΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΒΟΗΘΗΜΑ «ΜΑΘΗΜΑΤΙΚΑ ΚΑΙ ΣΤΟΙΧΕΙΑ ΣΤΑΤΙΣΤΙΚΗΣ» 2 o ΔΙΑΓΩΝΙΣΜΑ ΦΕΒΡΟΥΑΡΙΟΣ 2013: ΕΝΔΕΙΚΤΙΚΕΣ ΑΠΑΝΤΗΣΕΙΣ

ΑΠΑΝΤΗΣΕΙΣ. Επιµέλεια: Οµάδα Μαθηµατικών της Ώθησης

5 η ΕΚΑ Α ΓΕΝΙΚΕΣ ΑΣΚΗΣΕΙΣ 41.

Πανελλαδικες Εξετασεις Γ Λυκειου Μαθηµατικα Γενικης Παιδειας

Ιγνάτιος Ιωαννίδης. Στατιστική Όριο - Συνέχεια συνάρτησης Παράγωγοι Ολοκληρώματα

5.5 ΠΟΛΥΩΝΥΜΙΚΕΣ ΕΞΙΣΩΣΕΙΣ ΣΤΟ C

Μαθηματικά κατεύθυνσης Γ Λυκείου. Όλη η θεωρία και οι ασκήσεις των πανελλαδικών εξετάσεων. Στέλιος Μιχαήλογλου Δημήτρης Πατσιμάς

Ορισμός και Ιδιότητες

{[ 140,150 ),[ 160,170 ),...,[ 200, 210]

ΑΠΑΝΤΗΣΕΙΣ. ευτέρα, 17 Μα ου 2010 Γ ΛΥΚΕΙΟΥ ΓΕΝΙΚΗΣ ΠΑΙ ΕΙΑΣ ΜΑΘΗΜΑΤΙΚΑ. Οµάδα Μαθηµατικών της Ώθησης. Επιµέλεια:

Τυπολόγιο Σχετική συχότητα: = = κ f,,..., Αθροιστική συχότητα: Ν = και Ν, 2... = Ν + = κ Αθροιστική σχετική συχότητα: Ν F = f και F = F + f, = 2,...,

ΑΡΧΗ 1ΗΣ ΣΕΛΙΔΑΣ Γ ΗΜΕΡΗΣΙΩΝ

(, )

o Γενικό Λύκειο Χανίων Γ τάξη. Γενικής Παιδείας. Ασκήσεις για λύση

2.5 ΠΟΛΥΩΝΥΜΙΚΕΣ ΕΞΙΣΩΣΕΙΣ ΣΤΟ R

Κάνουμε πρώτα διαλογή και κατασκευάζουμε τον πίνακα συχνοτήτων: και επίσης κατασκευάζουμε το ραβδόγραμμα: Αυτοκίνητο Τραμ Τρόλεϊ Μετρό Λεωφορείο

Ασκήσεις στη Στατιστική

Μιγαδικοί Αριθμοί. Μαθηματικά Γ! Λυκείου Θετική και Τεχνολογική Κατεύθυνση. Θεωρία - Μέθοδοι

ΜΙΓΑΔΙΚΟΙ ΑΡΙΘΜΟΙ. Θεωρία Άλυτες Ασκήσεις Θέματα εξετάσεων

ΣΥΝΔΥΑΣΜΟΙ Ορισμός Συνδυασμός ν στοιχείων ανά κ είναι μια μη διατεταγμένη συλλογή κ στοιχείων από τα ν.

c f(x) = c f (x), για κάθε x R

Επαναληπτικό Διαγώνισμα Μαθηματικών Γενικής Παιδείας Γ Λυκείου

Ανάλυση Παλινδρόμησης. Εργαστήριο. Μαθηματικών & Στατιστικής / Γ. Παπαδόπουλος ( 252

Παρατηρήσεις 1 Για α ααζητήσουµε το όριο της f στο, πρέπει η f α ορίζεται όσο θέλουµε κοτά στο, δηλαδή η f α είαι ορισµέη σ έα σύολο της µορφής ( α, )

ΟΜΟΣΠΟΝ ΙΑ ΕΚΠΑΙ ΕΥΤΙΚΩΝ ΦΡΟΝΤΙΣΤΩΝ ΕΛΛΑ ΟΣ (Ο.Ε.Φ.Ε.) ΕΠΑΝΑΛΗΠΤΙΚΑ ΘΕΜΑΤΑ ΕΠΑΝΑΛΗΠΤΙΚΑ ΘΕΜΑΤΑ 2013

Α2. Πότε μια συνάρτηση f λέγεται γνησίως φθίνουσα σε ένα διάστημα Δ του πεδίου ορισμού της; Μονάδες 4

Στον πίνακα που ακολουθεί φαίνονται οι παρατηρήσεις που πήραμε για το ύψος και το βάρος 16 εργατών μιας βιομηχανίας.

, θα παίρνουμε πάντα την ίδια τιμή για το Υ. Για παράδειγμα, Υ 12

Μάθημα: Στατιστική ανάλυση δεδομένων με χρήση Η/Υ (του 8 ου Εξαμήνου Σπουδών του Τμήματος Βιοτεχνολογίας) Διδάσκων: Γιώργος Κ.

ΑΣΕΠ ΕΚΠΑΙΔΕΥΤΙΚΩΝ ΚΛΑΔΟΣ: ΠΕ 03 Μαθηματικών

Δεσμευμένη πιθανότητα και Ανεξαρτησία ενδεχομένων

Περιγραφική Στατιστική

ΜΑΘΗΜΑΤΙΚΑ ΓΕΝΙΚΗΣ ΠΑΙΔΕΙΑΣ Γ ΛΥΚΕΙΟΥ του Κώστα Βακαλόπουλου ΣΤΑΤΙΣΤΙΚΗ

10. Στατιστικές συναρτήσεις και δειγματοληπτικές κατανομές

Κι όµως, τα Ρολόγια «κτυπούν» και Εξισώσεις: Η Άλγεβρα των εικτών του Ρολογιού

2.3 ΜΕΤΡΑ ΘΕΣΗΣ ΚΑΙ ΙΑΣΠΟΡΑΣ. 1. Μέση τιµή x = Σταθµικός Μέσος x = 3. ιάµεσος (δ) ενός δείγµατος ν παρατηρήσεων, οι οποίες έχουν διαταχθεί σε

ΣΤΟΙΧΕΙΑ ΠΙΘΑΝΟΤΗΤΩΝ ΚΑΙ ΣΤΑΤΙΣΤΙΚΗΣ

ΘΕΜΑ Α Α1. Έστω t 1,t 2,...,t ν οι παρατηρήσεις μιας ποσοτικής μεταβλητής Χ ενός δείγματος μεγέθους ν, που έχουν

ΒΑΣΙΚΕΣ ΣΥΝΕΧΕΙΣ ΚΑΤΑΝΟΜΕΣ

ΣΤΑΤΙΣΤΙΚΗ. φυσικός αριθµός, που δείχνει πόσες φορές εµφανίζεται η τιµή x i της µεταβλητής αυτής. Σ Λ

Ο μαθητής που έχει μελετήσει τo κεφάλαιο αυτό θα πρέπει να είναι σε θέση:

ΜΑΘΗΜΑΤΙΚΑ Γ ΓΥΜΝΑΣΙΟΥ

1. [0,+ , >0, ) 2. , >0, x ( )

ΜΑΘΗΜΑΤΙΚΑ Γ ΛΥΚΕΙΟΥ

Όταν πραγματοποιείται το Α πραγματοποιείται και το Β.

21/11/2016. Στατιστική Ι. 8 η Διάλεξη (Κεντρικό Οριακό Θεώρημα)

Εκφωνήσεις Λύσεις των θεμάτων

9. Περιγραφική Στατιστική

Ε π ι μ έ λ ε ι α Κ Ο Λ Λ Α Σ Α Ν Τ Ω Ν Η Σ

Στατιστική Επιχειρήσεων Ι. Βασικές συνεχείς κατανομές

Γ Λυκείου Μαθηματικά Γενικής Παιδείας o Γενικό Λύκειο Χανίων Γ τάξη. Γενικής Παιδείας Ασκήσεις για λύση. M. Παπαγρηγοράκης 1 11.

Βασικές διακριτές κατανομές

i) Αν ο φυσικός αριθμός n δεν είναι τετράγωνο ακεραίου, τότε ο n είναι άρρητος.

Δυνάμεις πραγματικών αριθμών

Εκφωνήσεις Λύσεις των θεμάτων

4 ΘΕΩΡΙΑ ΑΡΙΘΜΩΝ 4.1 Η ΜΑΘΗΜΑΤΙΚΗ ΕΠΑΓΩΓΗ. Εισαγωγή

ΑΛΓΕΒΡΑ. Για να βρούµε την δύναµη i (όπου κ ακέραιος), διαιρούµε το κ µε το 4 και σύµφωνα µε την ταυτότητα της διαίρεσης ισχύει κ=4ρ+υ όπου ρ Ζ

ΣΗΜΕΙΩΣΕΙΣ ΘΕΩΡΗΜΑ BOLZANO. και επιπλέον. Αν μία συνάρτηση f είναι ορισμένη σε ένα κλειστό διάστημα [α,β] η f είναι συνεχής στο [α,β]

2. Πιθανότητα και Δεσμευμένη Πιθανότητα

1.5 ΑΞΙΟΣΗΜΕΙΩΤΕΣ ΤΑΥΤΟΤΗΤΕΣ

78 Ερωτήσεις Θεωρίας Στα Μαθηματικά Γενικής Παιδείας

ΜΑΘΗΜΑΤΙΚΑ ΚΑΙ ΣΤΟΙΧΕΙΑ ΣΤΑΤΙΣΤΙΚΗΣ ΓΕΝΙΚΗΣ ΠΑΙ ΕΙΑΣ Γ ΤΑΞΗΣ ΕΝΙΑΙΟΥ ΛΥΚΕΙΟΥ 2002

στους μιγαδικούς αριθμούς

«Χρηματοδοτική Ανάλυση και Διοικητική», Τόμος A

Παρουσίαση 1 ΜΕΤΡΑ ΘΕΣΗΣ

ΛΥΚΕΙΟ ΜΕΤΑΜΟΡΦΩΣΗΣ 2014 ΒΑΣΙΚΗ ΘΕΩΡΙΑ ΑΛΓΕΒΡΑΣ Α ΛΥΚΕΙΟΥ

β± β 4αγ 2 x1,2 x 0.

ΤΜΗΜΑ ΣΤΑΤΙΣΤΙΚΗΣ ΚΑΙ ΑΣΦΑΛΙΣΤΙΚΗΣ ΕΠΙΣΤΗΜΗΣ Σ

1. Το σύνολο των μιγαδικών αριθμών

Transcript:

Βασικές συεχείς καταομές και το Κετρικό Οριακό Θεώρημα 7. Καοική καταομή 7. Το Κετρικό Οριακό Θεώρημα 7.. Καοική προσέγγιση της Διωυμικής καταομής 7.. Καοική προσέγγιση της καταομής Posson 7..3 Διόρθωση συέχειας 7.3 Οι καταομές χ, t και F 7.3. Καταομή χ 7.3. Καταομή t (Student) 7.3.3 Καταομή F 7.4 Σύτομη αασκόπηση βασικώ εοιώ, προτάσεω και τύπω 7.5 Προβλήματα και ασκήσεις

Γεωποικό Παεπιστήμιο Αθηώ/Γιώργος Κ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) 50

Στο 5 ο Κεφάλαιο, ότα στη Εότητα 5.4 μιλήσαμε για τις συεχείς τυχαίες μεταβλητές, είδαμε ότι μια τυχαία μεταβλητή, έστω Χ, με συάρτηση πυκότητας, α x β f ( x) = β -α 0, αλλού οομάζεται ομοιόμορφη συεχής τυχαία μεταβλητή και δείξαμε (Παράδειγμα 5.4.4) ότι έχει μέση τιμή α + β μ = E ( X ) = και διακύμαση ( β α) σ = Var ( X ) =. Εξηγήσαμε επίσης, ότι πρόκειται για έα μοτέλο πιθαοτήτω το οποίο σε ίσου πλάτους υποδιαστήματα του [ α, β ] εκχωρεί ίσες πιθαότητες, ή αλλιώς, η πιθαότητα που εκχωρεί σε έα οποιοδήποτε υποδιάστημα του [ α, β ] είαι αάλογη του πλάτους του, αφού στο [ α, β ] η f είαι σταθερή (Σχήμα 7.). Μια τέτοια καταομή/μοτέλο πιθαοτήτω οομάζεται ομοιόμορφη συεχής καταομή, συμβολίζεται με U ( α, β ) και είαι μια από τις βασικές και με εδιαφέρουσες εφαρμογές συεχείς καταομές. Σχήμα 7. Η συάρτηση πυκότητας της ομοιόμορφης καταομής συεχούς τ.μ. Στο κεφάλαιο αυτό, στις Εότητες 7.&7.3 θα γωρίσουμε τέσσερις ακόμη βασικές συεχείς καταομές. Τη καοική καταομή, τη καταομή χ, τη καταομή t (Student) και τη καταομή F. Πρόκειται για μοτέλα πιθαοτήτω τα οποία έχου μελετηθεί συστηματικά, χρησιμοποιούται ευρύτατα στη στατιστική συμπερασματολογία και καλύπτου πολύ μεγάλο φάσμα εφαρμογώ. Βέβαια, όπως εξηγήσαμε στη Εότητα 5.4 (Σχόλιο 5.4.β), αλλά και όπως στη συέχεια θα διαπιστώσουμε, σε ατίθεση με τα διακριτά μοτέλα πιθαοτήτω, τα συεχή μοτέλα κατά καόα δε «γειούται» από τη περιγραφή ατίστοιχω τυχαίω πειραμάτω, αλλά εισάγοται απευθείας μέσω μιας συάρτησης πυκότητας. Έτσι, το α μια συεχής τυχαία μεταβλητή περιγράφεται από συγκεκριμέη συάρτηση πυκότητας, όπως θα διαπιστώσουμε, είαι «προς απόδειξη». Για παράδειγμα, ίσως το πιο χαρακτηριστικό, η ομοιόμορφη καταομή είαι κατάλληλη για τη περιγραφή τυχαίω μεταβλητώ που εκφράζου χρόους ααμοής σε κυκλικές διαδικασίες. Άλλες συεχείς καταομές, στις οποίες όμως δε θα ααφερθούμε, είαι (μεταξύ άλλω) η εκθετική καταομή, η καταομή Γάμμα και η καταομή Βήτα. Γεωποικό Παεπιστήμιο Αθηώ/Γιώργος Κ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) 5

7. Καοική καταομή H καοική καταομή (normal dstrbuton) θεωρείται η σπουδαιότερη καταομή της Θεωρίας Πιθαοτήτω και της Στατιστικής. Οι λόγοι που εξηγού τη εξέχουσα θέση της είαι βασικά δύο. ) Πολλές τυχαίες μεταβλητές περιγράφοται ικαοποιητικά από τη καοική καταομή ή περιγράφοται από καταομές που μπορού α προσεγγισθού από τη καοική καταομή. ) Οι ιδιότητες της καοικής καταομής αξιοποιούται στη στατιστική συμπερασματολογία. Ουσιαστικά, η καοική καταομή αποτελεί το θεμέλιο της στατιστικής συμπερασματολογίας. Στο Β Μέρος, θα έχουμε τη ευκαιρία α διαπιστώσουμε πόσο σηματική είαι η καοική καταομή στη στατιστική συμπερασματολογία. Προς το παρό, ας σταθούμε λίγο περισσότερο στο πρώτο από τους παραπάω λόγους. Ας προσπαθήσουμε δηλαδή, α εξηγήσουμε γιατί η καοική καταομή βρίσκει εφαρμογή σε πολλά στοχαστικά φαιόμεα και πειράματα. Το «μυστικό» που εξηγεί το μεγάλο εύρος εφαρμογώ της καοικής καταομής, βρίσκεται σε έα εκπληκτικά ισχυρό θεωρητικό αποτέλεσμα της Θεωρίας Πιθαοτήτω το οποίο επιβεβαιώεται και πειραματικά. Πρόκειται για το Κετρικό Οριακό Θεώρημα τις βάσεις του οποίου έθεσα δύο μεγάλοι Μαθηματικοί. Ο Abraham De Movre το 733 και έα αιώα περίπου αργότερα, το 8, ο Perre- Smon Laplace. Σε αυτό το σημείο δε θα διατυπώσουμε αυστηρά ούτε θα αποδείξουμε το Κετρικό Οριακό Θεώρημα. Θα προσπαθήσουμε α εξηγήσουμε μόο το όημα και τη σημασία του. Αργότερα, θα δώσουμε μια πληρέστερη διατύπωση. Σύμφωα με το Κετρικό Οριακό Θεώρημα, το άθροισμα και επομέως - η μέση τιμή, μεγάλου αριθμού αεξάρτητω παρατηρήσεω, ακολουθεί κατά προσέγγιση καοική καταομή, αεξαρτήτως από το ποια καταομή ακολουθού οι παρατηρήσεις. Πώς όμως, αυτό το αποτέλεσμα ερμηεύει τη μεγάλη εφαρμοσιμότητα της καοικής καταομής; Είαι απλό. Σε πολλά φαιόμεα και πειράματα, οι τιμές διαφόρω χαρακτηριστικώ (μεταβλητώ) είαι αποτέλεσμα αθροιστικής επίδρασης πολλώ αεξάρτητω αιτίω-παραγότω καέα από τα οποία δε υπερισχύει τω άλλω. Για παράδειγμα, ο χρόος ααμοής σε μια ουρά είαι αποτέλεσμα πολλώ παραγότω όπως, η ημέρα της εβδομάδας, η ώρα της ημέρας, η αποτελεσματικότητα του υπαλλήλου, το είδος της συαλλαγής που διεκπεραιώεται, κ.ά. Επίσης, το βάρος τω ζώω μιας κτηοτροφικής μοάδας, οφείλεται σύμφωα με τους ειδικούς, σε πληθώρα παραγότω όπως, η ατομικότητα του ζώου, η φυλή, το γέος, οι συθήκες διατροφής, οι συθήκες εσταυλισμού, κ.ά. Καθέας από τους παράγοτες αυτούς επιφέρει έα θετικό ή αρητικό αποτέλεσμα και όλοι μαζί αθροιστικά συτελού στη διαμόρφωση του τελικού αποτελέσματος. Τέτοια χαρακτηριστικά (μεταβλητές), εμφαίζοται σε πολλά φαιόμεα και πειράματα. Το Κετρικό Οριακό Θεώρημα μας διαβεβαιώει ότι αυτά ακριβώς τα χαρακτηριστικά περιγράφοται ικαοποιητικά από τη καοική καταομή. Επιπλέο, το Κετρικό Οριακό Θεώρημα συδέει τη καοική καταομή με οποιαδήποτε άλλη καταομή (αφού δε προϋποθέτει α ακολουθού οι παρατηρήσεις καοική καταομή), γεγοός το οποίο απατάει επίσης στο ερώτημα, γιατί η καοική καταομή βρίσκει εφαρμογή σε μεγάλο πλήθος φαιομέω και πειραμάτω. Πρέπει α τοίσουμε ότι για α αποδειχθεί ότι έα συγκεκριμέο χαρακτηριστικό (μεταβλητή) προσεγγίζεται ικαοποιητικά από τη καοική καταομή, πρέπει α γίου μετρήσεις που α επαληθεύου έα τέτοιο συμπέρασμα 3. Μια από τις πρώτες εφαρμογές της καοικής καταομής, έγιε το 809 από το μεγάλο Γερμαό 3 Θυμηθείτε το Σχόλιο 5.4. (β) και επίσης δείτε το Σχόλιο 7.. στη συέχεια. Γεωποικό Παεπιστήμιο Αθηώ/Γιώργος Κ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) 5

Μαθηματικό Carl F. Gauss ο οποίος διαπίστωσε ότι τα σφάλματα που γίοται σε αστροομικές παρατηρήσεις μπορού α περιγραφού ικαοποιητικά από τη καοική καταομή. Στη συέχεια, διαπιστώθηκε επίσης, ότι τα τυχαία σφάλματα (όχι τα συστηματικά) που εμφαίζοται σε διάφορες μετρήσεις ακολουθού με ικαοποιητική προσέγγιση καοική καταομή. Για το λόγο αυτό, η καοική καταομή οομάζεται και καταομή τω σφαλμάτω (law of errors). Επίσης, είαι γωστή ως καταομή του Gauss (Gaussan dstrbuton), για τη μεγάλη συεισφορά του Gauss στη αάδειξη τω ιδιοτήτω και της σημασίας της. Καοική καταομή οομάσθηκε στις αρχές του 0 ου αιώα από το Pearson. Όμως, για το πώς και από ποιό εισήχθη η καοική καταομή, θα ααφερθούμε αργότερα ότα μιλήσουμε πιο ααλυτικά για το Κετρικό Οριακό Θεώρημα. Τέλος, ως πρόσθετη σχετική πληροφορία 4, ααφέρουμε ότι στο γερμαικό χαρτοόμισμα τω δέκα μάρκω υπήρχα, φωτογραφία του Gauss, η καοική καμπύλη και ο μαθηματικός τύπος της!! Η συάρτηση πυκότητας της καοικής καταομής δίεται από το τύπο, ( x μ ) σ f ( x) = e, < x < + σ π σ η τυπική απόκλιση και μ (, + ) η μέση τιμή της καταομής 5. όπου, > 0 Η γραφική της παράσταση (Σχήμα 7...) είαι γωστή ως καοική καμπύλη και έχει κωδωοειδή μορφή. Σχήμα 7.. Η καοική καμπύλη Παρατηρείστε ότι στο τύπο της συάρτησης πυκότητας της καοικής καταομής, εμφαίζοται δύο πολύ «διάσημοι» άρρητοι αριθμοί: ο π 3. 4 και ο e. 7. 7.. Ιδιότητες της καοικής καμπύλης Η καοική καμπύλη είαι συμμετρική και οι «ουρές» της πλησιάζου το οριζότιο άξοα ομαλά (ασυμπτωτικά). Η μέση τιμή και η διάμεσος ταυτίζοται. Επίσης, η κορυφή ταυτίζεται με τη μέση τιμή και τη διάμεσο. Έτσι, η περιοχή που παρουσιάζει τη μεγαλύτερη πυκότητα, βρίσκεται και αυτή στο μέσο της καταομής. Δηλαδή, ότα οι τιμές μιας μεταβλητής είαι καοικά καταεμημέες, τότε γύρω από τη μέση τιμή τους υπάρχου σχετικά πολλές τιμές εώ μακριά από τη μέση τιμή βρίσκοται σχετικά λίγες τιμές. Για παράδειγμα, α το ύψος τω ελλήω ηλικίας 8 έως 5 ετώ είαι καοικά καταεμημέο, με μέση τιμή 70cm και τυπική απόκλιση 5cm (δες Σχήμα 7..), τότε μεταξύ 70cm και 75cm βρίσκοται περισσότερα άτομα από όσα 4 Εδεικτική της ααγώρισης της σημασίας της καοικής καταομής και του έργου του Gauss. 5 Αυτός ο τύπος υπήρχε στο χαρτοόμισμα τω δέκα μάρκω!! Γεωποικό Παεπιστήμιο Αθηώ/Γιώργος Κ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) 53

βρίσκοται μεταξύ 80cm και 85cm. Επίσης, πολύ λίγα άτομα έχου ύψος μεγαλύτερο από 85cm ή μικρότερο από 55cm. Σχήμα 7.. Το ύψος παίρει τιμές κοτά στη μέση τιμή με πολύ μεγαλύτερη πιθαότητα απ ότι μακριά από τη μέση τιμή (προς τις ουρές) Παρατηρείστε (δες Σχήμα 7..3) ότι η καμπύλη της συάρτησης πυκότητας της καοικής καταομής, στη θέση x = μ παρουσιάζει μέγιστη τιμή, ίση με 0.399 = σ π σ και στις θέσεις x = μ σ και x = μ + σ παρουσιάζει σημεία καμπής. Σχήμα 7..3 Οι θέσεις τω σημείω καμπής (και της κορυφής) της καοικής καμπύλης Ερώτηση: Α μια καοική καταομή έχει, για παράδειγμα, τυπική απόκλιση σ = 0. 5 τότε η συάρτηση πυκότητας της έχει μέγιστη τιμή ίση με 0.399 0.399 f ( μ) = = = =.596. σ π σ 0.5 Είαι άραγε λογικό αυτό; Δηλαδή, μπορεί αυτή η τιμή α είαι μεγαλύτερη του ; Είαι φαερό, ότι η συάρτηση πυκότητας της καοικής καταομής δε ορίζει μια συγκεκριμέη καοική καμπύλη αλλά μια οικογέεια καοικώ καμπύλω. Έτσι, για διαφορετικές τιμές τω παραμέτρω μ και σ παίρουμε διαφορετικές καοικές καμπύλες. Για παράδειγμα, οι καταομές στα Σχήματα 7..4 είαι όλες καοικές καταομές. Στο 7..4α έχου ίδια μέση τιμή και διαφορετικές τυπικές αποκλίσεις εώ στο 7..4β έχου ίδιες τυπικές αποκλίσεις και διαφορετικές μέσες τιμές. 0 0 0 0 0 (α) (β) Ίδια μέση τιμή και διαφορετική τυπική Ίδια τυπική απόκλιση και διαφορετική απόκλιση μέση τιμή Σχήμα 7..4 Καοικές καμπύλες Γεωποικό Παεπιστήμιο Αθηώ/Γιώργος Κ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) 54

Είαι φαερό, ότι αλλαγή της μέσης τιμής προκαλεί μόο μετατόπιση της καοικής καμπύλης σε μια έα θέση. Όμως αλλαγή της τυπικής απόκλισης, προκαλεί αλλαγή στη καοική καμπύλη (χωρίς, φυσικά α αλλάζει η κωδωοειδής μορφή της). Όσο μικρότερη είαι η τυπική απόκλιση, τόσο ψηλότερη και τόσο πιο στεή είαι η καοική καμπύλη, δηλαδή, τόσο μικρότερο είαι το διάστημα στο οποίο, πρακτικά, εκτείεται η καταομή. Επισημαίουμε ότι οι παράμετροι μ και σ χαρακτηρίζου τη καοική καταομή, δηλαδή, μπορούμε α τη προσδιορίσουμε πλήρως α γωρίζουμε μόο τη μέση τιμή της μ και τη τυπική απόκλισή της σ. Η καοική καταομή με μέση τιμή μ και τυπική απόκλιση σ (δηλαδή διακύμαση σ ) συμβολίζεται με N ( μ, σ ). Tο εμβαδό του χωρίου που περικλείεται από τη καμπύλη της συάρτησης πυκότητας και το άξοα τω τιμώ μιας συεχούς τυχαίας μεταβλητής Χ είαι, όπως γωρίζουμε. ίσο με και εκφράζει τη πιθαότητα η Χ α πάρει κάποια τιμή μεταξύ και +. Αάλογα, το εμβαδό του σκιαγραφημέου χωρίου Α στο Σχήμα 7..5, εκφράζει τη πιθαότητα η Χ α πάρει κάποια τιμή μεταξύ τω τιμώ α και β, δηλαδή, A = P( α X β ). Σχήμα 7..5: P ( α X β ) το εμβαδό του σκιαγραφημέου χωρίου Β στο Σχήμα 7..6, εκφράζει τη πιθαότητα η Χ α πάρει κάποια τιμή μικρότερη ή ίση του α, δηλαδή, B = P( X α). Σχήμα 7..6: P ( X α) το εμβαδό του σκιαγραφημέου χωρίου Γ στο Σχήμα 7..7, εκφράζει τη πιθαότητα η Χ α πάρει κάποια τιμή μεγαλύτερη ή ίση του α, δηλαδή, Γ = P( X a). Σχήμα 7..7: P ( X a) Γεωποικό Παεπιστήμιο Αθηώ/Γιώργος Κ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) 55

7.. Η τυποποιημέη καοική καταομή Στο 5 ο Κεφάλαιο είδαμε ότι μια τυχαία μεταβλητή με μέση τιμή 0 και τυπική απόκλιση οομάζεται τυποποιημέη τυχαία μεταβλητή. Έτσι, η καοική καταομή που έχει μέση τιμή 0 και τυπική απόκλιση (άρα και διακύμαση ) οομάζεται τυποποιημέη (ή τυπική) καοική καταομή (standard normal dstrbuton) και συμβολίζεται με N (0,). Η τυχαία μεταβλητή που ακολουθεί τη τυποποιημέη καοική καταομή, έχει επικρατήσει α συμβολίζεται με Ζ, η συάρτηση πυκότητάς της με ϕ (z) και η συάρτηση καταομής της με Φ (z). Έτσι, ϕ ( z) = e, π z < z < + και η γραφική της παράσταση (Σχήμα 7..8) παρουσιάζει, σύμφωα με τις ιδιότητες της καοικής καμπύλης, μέγιστη τιμή (ίση με π = 0. 399 ) στη θέση z = 0 και σημεία καμπής στις θέσεις z = και z =. Σχήμα 7..8 Η συάρτηση πυκότητας ϕ (z) της Ζ ~ N(0,) Στο Σχήμα 7..9 φαίεται η γραφική παράσταση της συάρτησης καταομής, t z ( e Φ z) = P( Z z) = π της Ζ. Παρατηρείστε ότι έχει σιγμοειδή μορφή. dt, < z < +, Σχήμα 7..9 Η συάρτηση καταομής Φ (z) της Ζ ~ N(0,) 7..3 Υπολογισμός πιθαοτήτω Ο υπολογισμός πιθαοτήτω συεχούς τυχαίας μεταβλητής αάγεται, όπως γωρίζουμε, στο υπολογισμό εμβαδώ επίπεδω χωρίω κάτω από τη γραφική παράσταση της συάρτησης πυκότητάς της και επομέως στο υπολογισμό κατάλληλω ολοκληρωμάτω. Δυστυχώς, καμία από τις γωστές τεχικές ολοκλήρωσης δε μας επιτρέπει το ααλυτικό υπολογισμό του κατάλληλου, κατά περίπτωση, ορισμέου ολοκληρώματος της συάρτησης πυκότητας της καοικής Γεωποικό Παεπιστήμιο Αθηώ/Γιώργος Κ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) 56

καταομής. Στη πράξη, για α υπολογίσουμε πιθαότητες μιας τυχαίας μεταβλητής που ακολουθεί μια καοική καταομή N ( μ, σ ), χρησιμοποιούμε το πίακα της τυποποιημέης καοικής καταομής N (0,). Ο πίακας της τυποποιημέης καοικής καταομής (Παράρτημα-Α) μας δίει τις τιμές Φ ( z) = P ( Z z) της συάρτησης καταομής της τυποποιημέης καοικής καταομής, δηλαδή, το εμβαδό του σκιαγραφημέου χωρίου που φαίεται στο Σχήμα 7..0, για κάθε z από 0 έως 3.59 (ή έως 3.49 ή 3.09) με βήμα 0.0. Σχήμα 7..0 Φ ( z) = P ( Z z) Από τη συμμετρία της καοικής καμπύλης, εύκολα προκύπτει (Σχήμα 7..) ότι Φ ( z) = Φ( z) δηλαδή P ( Z z) = Φ( z) = Φ( z). Σχήμα 7.. Φ ( z) = Φ( z) Η ιδιότητα αυτή εξηγεί γιατί ο πίακας της τυποποιημέης καοικής καταομής δίει τιμές της Φ (z) μόο για μη αρητικά z. Εύκολα επίσης, προκύπτει ότι: P ( α Z β ) = Φ( β ) Φ( α) P ( α Z α) = Φ( α) Φ( α ) = Φ( α) P ( Z > a) = P( Z α) = Φ( α). Είαι φαερό, ότι μπορούμε πλέο α υπολογίσουμε οποιαδήποτε πιθαότητα για τη Ζ με βάση μόο τις τιμές Φ (z) του πίακα της τυποποιημέης καοικής καταομής. Ας δούμε μερικά παραδείγματα. P ( Z 0) = Φ(0) = 0.5 P ( Z.37) = Φ(.37) = 0.947 P ( Z >.37) = P( Z.37) = Φ(.37) = 0.947 = 0.0853 P ( Z.55) = Φ(.55) = Φ(.55) = 0.9394 = 0.0606 P (.55 Z.) = Φ(.) Φ(.55) = Φ(.) [ Φ(.55)] = = Φ(.) + Φ(.55) = 0.98 + 0.9394 = 0.95 Γεωποικό Παεπιστήμιο Αθηώ/Γιώργος Κ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) 57

P ( Z ) = Φ() = 0.843 = 0.686 68.3% P ( Z ) = Φ() = 0.977 = 0.9544 95.5% P ( 3 Z 3) = Φ(3) = 0.9987 = 0.9974 99.7% Ερώτηση: Μπορείτε α εξηγήσετε γιατί ο πίακας της τυποποιημέης καοικής καταομής δίει τιμές της Φ (z) μόο μέχρι z = 3. 59 (ή μόο μέχρι 3.49 ή 3.09); Ας δούμε τώρα πώς μπορούμε με βάση το πίακα της τυποποιημέης καοικής καταομής, α υπολογίζουμε πιθαότητες για οποιαδήποτε καοική τυχαία μεταβλητή N ( μ, σ ). Πρόταση 7..: Α η τυχαία μεταβλητή Χ ακολουθεί μια καοική καταομή N ( μ, σ ) τότε η τυχαία μεταβλητή μ Z = X σ ακολουθεί τη τυποποιημέη καοική N (0,). Αξιοποιώτας αυτό το αποτέλεσμα, μπορούμε πλέο α υπολογίσουμε πιθαότητες για οποιαδήποτε καοική τ.μ. Ας δούμε για παράδειγμα, πώς για οποιαδήποτε καοική τυχαία μεταβλητή X ~ N( μ, σ ) μπορούμε α υπολογίσουμε τη πιθαότητα P ( α X β ). Προφαώς α μ X μ β μ P ( α X β ) = P ( ) σ σ σ και επειδή X μ = Z ~ N(0,) σ έχουμε α μ X μ β μ α μ β μ P ( α X β ) = P ( ) = P ( Z ) = σ σ σ σ σ β μ α μ = Φ ( ) Φ( ). σ σ Ασφαλώς, μπορούμε α υπολογίσουμε μέσω της Ζ και οποιαδήποτε άλλη πιθαότητα για τη Χ. Για παράδειγμα, X μ β μ β μ β μ P ( X β ) = P ( ) = P ( Z ) = Φ( ). σ σ σ σ Έτσι, α X ~ N(.5,. ), τότε για τη πιθαότητα P ( 3 X 4) έχουμε 3.5 X.5 4.5 P (3 X 4) = P ( ) = P(0.4 Z.5) =... = Φ(.5) Φ(0.4) = 0.8944 0.668 = 0.36. Δείτε στο Σχήμα 7.. το χωρίο κάτω από τη N (.5,. ) που ατιστοιχεί στη πιθαότητα P ( 3 X 4) και το χωρίο κάτω από τη N (0,) που ατιστοιχεί στη πιθαότητα P ( 0.4 Z.5). Τα δύο χωρία είαι ισεμβαδικά. Αυτό εξάλλου μας διαβεβαιώει η Πρόταση 7... Γεωποικό Παεπιστήμιο Αθηώ/Γιώργος Κ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) 58

Σχήμα 7.. Τα σκιαγραφημέα χωρία έχου ίδιο εμβαδό Παράδειγμα 7..: Έχει παρατηρηθεί ότι ο χρόος, έστω Χ, που χρειάζεται έα ασθεοφόρο για α φθάσει από έα κέτρο υγείας στο πλησιέστερο περιφερειακό οσοκομείο, ακολουθεί κατά προσέγγιση καοική καταομή με μέση τιμή μ = 7 mn και τυπική απόκλιση σ = 3 mn. Να βρεθεί η πιθαότητα ο χρόος που θα χρειασθεί το ασθεοφόρο για α φθάσει στο περιφερειακό οσοκομείο α είαι α) το πολύ 5 mn β) περισσότερο από mn και γ) τουλάχιστο 3 mn και το πολύ mn. X 7 5 7 Απάτηση: α) P ( X 5) = P( ) = P( Z 0.67) = Φ( 0.67) = 3 3 = Φ(0.67) = 0.7486 = 0.5. X 7 7 β) P ( X > ) = P( > ) = P( Z >.67) = P( Z.67) = 3 3 = Φ(.67) = 0.955 = 0.0475. 3 7 X 7 7 γ) P ( 3 X ) = P ( ) = P(.33 Z.33) = 3 3 3 = Φ(.33) = 0.908 = 0.864. Παράδειγμα 7..: Στη Περιγραφική Στατιστική, όπως θα δούμε στη συέχεια, χρησιμοποιείται έας καόας, γωστός ως εμπειρικός καόας (emprcal rule) γιατί πολύ συχά επαληθεύεται εμπειρικά σε διάφορα πειράματα και φαιόμεα, σύμφωα με το οποίο, α η καταομή εός δείγματος τιμώ μιας τυχαίας μεταβλητής προσομοιάζει με μια καοική καταομή (έχει κωδωοειδή μορφή), τότε το ποσοστό τω τιμώ του δείγματος που απέχου από το μέσο τους (α) λιγότερο από μια τυπική απόκλιση είαι περίπου 68% (β) λιγότερο από δύο τυπικές αποκλίσεις είαι περίπου 95% και (γ) λιγότερο από τρεις τυπικές αποκλίσεις είαι περίπου 99%. Ας αποδείξουμε αυτό το καόα για μια τυχαία μεταβλητή, έστω Χ, που ακολουθεί μια καοική καταομή N ( μ, σ ). Απάτηση: Α X ~ N( μ, σ ), θα δείξουμε ότι P( μ kσ X μ + kσ ) = Φ( k). Πράγματι X μ P( μ kσ X μ + kσ ) = P( kσ X μ + kσ ) = P( k + k) = σ = P( k Z + k) = Φ( k). Έτσι (δες και Σχήμα 7..3), για k =,, 3 έχουμε P ( μ σ X μ + σ ) = Φ() = 0.686 68.3% P ( μ σ X μ + σ ) = Φ() = 0.9544 95.5% P ( μ 3σ X μ + 3σ ) = Φ(3) = 0.9974 99.7% Γεωποικό Παεπιστήμιο Αθηώ/Γιώργος Κ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) 59

Σχήμα 7..3 Επιβεβαίωση του εμπειρικού καόα Σχόλιο 7..: Ίσως σας έχει δημιουργηθεί το εξής ερώτημα: πώς είαι δυατό τυχαίες μεταβλητές που παίρου μόο θετικές τιμές ή πεπερασμέου πλήθους τιμές, όπως μεταβλητές που εκφράζου μήκη, χρόους ζωής, χροική διάρκεια φαιομέω κτλ., α περιγράφοται από τη καοική καταομή η οποία θεωρητικά παίρει άπειρου πλήθους τιμές και μάλιστα από το μέχρι το + ; Για παράδειγμα, η πιθαότητα P ( X > α) έχει κάποια τιμή όσο μεγάλο και α είαι το α. Α όμως Χ είαι το ύψος του αθρώπου και έχει διαπιστωθεί ότι προσεγγίζεται από τη καοική καταομή, τότε αυτό σημαίει ότι με βάση το μoτέλο μας (τη καοική καταομή) θα υπήρχε έα ποσοστό αθρώπω, έστω πολύ μικρό, με ύψος Χ>0 μέτρα! Επίσης, η πιθαότητα P ( X < 0) έχει κάποια τιμή. Δηλαδή, θα υπήρχε έα ποσοστό αθρώπω, έστω πολύ μικρό, με αρητικό ύψος! Τι μπορεί α συμβαίει; Μια πρώτη απάτηση είαι η εξής. Οι πιθαότητες αυτές είαι πολύ μικρές και στη πράξη θεωρούται μηδέ. Για παράδειγμα, η πιθαότητα α είαι αρητικός ο χρόος που θα χρειασθεί το ασθεοφόρο για α φθάσει στο περιφερειακό οσοκομείο (Παράδειγμα 7..) είαι X 7 0 7 P ( X < 0) = P( < ) = P( Z < 5.7) = Φ( 5.7) = Φ(5.7) 3 3 η οποία πρακτικά είαι μηδέ. Όμως, αυτή η απάτηση/εξήγηση δε φαίεται ικαοποιητική, αφού μπορεί οι πιθαότητες αυτές πρακτικά α είαι μηδέ, αλλά θεωρητικά δε είαι μηδέ και επομέως το θεωρητικό μοτέλο φαίεται «προβληματικό». Η απάτηση είαι η εξής: πρέπει α διακρίουμε τη καοική καταομή αυτή καθαυτή, από τα τυχαία φαιόμεα που προσεγγίζοται ικαοποιητικά από τη καοική καταομή. Η καοική καταομή δε είαι «όμος της φύσης». Είαι, απλά, έα μοτέλο το οποίο ορίζεται με μια μαθηματική συάρτηση. Τίποτε περισσότερο και τίποτε λιγότερο. Η καοική καταομή δηλαδή, δε εκφράζειπεριγράφει απολύτως και εξ ορισμού το τυχαίο φαιόμεο που μας εδιαφέρει. Το πόσο «καλά» το εκφράζει, δηλαδή το πόσο μας βοηθάει α το καταοήσουμε, είαι πρόβλημα δικό μας και της Στατιστικής (όπως θα δούμε στο Β Μέρος) και όχι της καοικής καταομής! Ας δούμε έα διαφορετικό παράδειγμα. Παράδειγμα 7..3: Οι υποψήφιοι για εγγραφή σε έα Μεταπτυχιακό Τμήμα Παεπιστημίου, υποβάλλοται σε έα τεστ. Το τεστ έχει σχεδιασθεί έτσι ώστε οι βαθμοί τω υποψηφίω στο τεστ α καταέμοται καοικά με μέση τιμή 300 και τυπική απόκλιση 60. α) Α η πολιτική του Παεπιστημίου είαι α δέχεται ως φοιτητές το 5% τω υποψηφίω με το μεγαλύτερο βαθμό στο τεστ, ποιος είαι ο μικρότερος βαθμός που επιτρέπει τη εισαγωγή στο Μεταπτυχιακό Τμήμα; β) Τι βαθμό πρέπει α έχει γράψει Γεωποικό Παεπιστήμιο Αθηώ/Γιώργος Κ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) 60

έας υποψήφιος στο τεστ για α κατατάσσεται στο 0% τω υποψηφίω με το μικρότερο βαθμό στο τεστ; Απάτηση: Έστω Χ η βαθμολογία εός υποψηφίου στο τεστ. Δίεται ότι X ~ N(300, 60 ). α) Ζητάμε εκείη τη τιμή x της Χ για τη οποία P ( X x) = 0. 5 ( Σχήμα 7..4). Σχήμα 7..4 P ( X x) = 0.5 Έτσι, έχουμε X 300 x 300 x 300 P ( X x) = 0.5 P( ) = 0.5 P( Z ) = 0. 5 60 60 60 x 300 x 300 x 300 P ( Z < ) = 0.5 P( Z < ) = 0.5 P( Z < ) = 0. 85 60 60 60 300 Φ( x ) = 0.85. 60 Κάοτας «ατίστροφη ααζήτηση» στο πίακα της τυποποιημέης καοικής καταομής, παρατηρούμε ότι η πιθαότητα 0.85 δε υπάρχει στο πίακα όμως οι πλησιέστερες σε αυτή (που υπάρχου στο πίακα) είαι οι 0.8485 και 0.8508 οι οποίες ατιστοιχού στις τιμές z =. 03 και z =. 04 οπότε ή επιλέγουμε μια από αυτές τις δύο τιμές ή κάουμε παρεμβολή και βρίσκουμε z = (.03 +.04) =. 035. Έτσι, έχουμε x 300 =.035 x = 36.. 60 Άρα, η ζητούμεη βαθμολογία είαι 36.. Δηλαδή, για α αήκει έας υποψήφιος στο 5% τω υποψηφίω με το μεγαλύτερο βαθμό στο τεστ, πρέπει α πάρει βαθμό τουλάχιστο ίσο με 36.. β) Έστω x εκείη η τιμή της Χ για τη οποία ισχύει P ( X x) = 0. 0 (Σχήμα 7..5). Σχήμα 7..5 P ( X x) = 0.0 Έχουμε X 300 x 300 x 300 P ( X x) = 0.0 P( ) = 0.0 P( Z ) = 0. 0 60 60 60 x 300 x 300 300 x Φ( ) = 0.0 Φ( ) = 0.0 Φ( ) = 0.90. 60 60 60 Έτσι, με «ατίστροφη ααζήτηση» στο πίακα της τυποποιημέης καοικής καταομής, βρίσκουμε z = (.8 +.9) =. 85 και επομέως 300 x =.85 x =.9. 60 Γεωποικό Παεπιστήμιο Αθηώ/Γιώργος Κ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) 6

Άρα, έας υποψήφιος κατατάσσεται στο 0% τω υποψηφίω με το μικρότερο βαθμό στο τεστ, α έχει πάρει βαθμό το πολύ ίσο με.9. Σημείωση 7.. (άω α-ποσοστιαίο σημείο): Είαι προφαές ότι με τη προηγούμεη μέθοδο υπολογίζουμε ποσοστημόρια της καοικής καταομής. Η τιμή z της Z ~ N(0,) για τη οποία ισχύει P ( Z > z) = α, 0 < α < οομάζεται άω α -ποσοστιαίο σημείο της τυποποιημέης καοικής καταομής και συμβολίζεται με z α. Δηλαδή, P ( Z > zα ) = α. Προφαώς, λόγω συμμετρίας της καταομής (δες Σχήμα 7..6) z = α z α. Σχήμα 7..6 P ( Z > zα ) = α και z α = zα Άσκηση 7..: Δείξτε ότι α) z. 33 και β) z =. 33. 0.0 = 0.99 Απάτηση: α) Από το ορισμό του z α, για α = 0. 0, έχουμε P ( Z > z0.0) = 0.0 P( Z z0.0) = 0.0 Φ( z0.0) = 0.0 Φ( z0. 0) = 0.99 και επομέως με «ατίστροφη ααζήτηση» στο πίακα της τυποποιημέης καοικής καταομής παίρουμε z 0.0 =.33. β) Από το ορισμό του άω α -ποσοστιαίου σημείου z α, για α = 0. 99, έχουμε P( Z > z0.99 ) = 0.99 P( Z z0.99 ) = 0.99 Φ( z0.99 ) = 0.99 Φ( z0. 99 ) = 0.99 και επομέως με «ατίστροφη ααζήτηση» στο πίακα της τυποποιημέης καοικής καταομής παίρουμε z 0.99 =.33 z0. 99 =.33. (Ασφαλώς, μπορούσαμε α χρησιμοποιήσουμε τη σχέση z α = zα και άμεσα α πάρουμε z 0.99 = z 0.0 = z0.0 =. 33). Παράδειγμα 7..4: Μια αυτόματη μηχαή συσκευασίας τροφίμω έχει προγραμματισθεί α συσκευάζει δημητριακά σε συσκευασίες τω.5kg. Έχει παρατηρηθεί ότι η ποσότητα δημητριακώ αά συσκευασία ακολουθεί μια καοική καταομή με μέση τιμή μ =. 5 kg και τυπική απόκλιση σ = 0. kg. α) Τι ποσοστό τω συσκευασιώ περιέχει ποσότητα που υπερβαίει τα.6kg; β) Σε τι ποσότητα πρέπει α ρυθμισθεί η μηχαή έτσι ώστε μόο στο 0.00 τω περιπτώσεω η ποσότητα δημητριακώ στη συσκευασία α υπερβαίει τα.6kg; Απάτηση: Έστω Χ η ποσότητα που περιέχεται αά συσκευασία. α) Γωρίζουμε ότι X ~ N(.5, 0. ) και επομέως εύκολα υπολογίζεται το ποσοστό συσκευασιώ που υπερβαίου τα.6kg (για εξάσκηση, επαληθεύστε ότι P ( X >.6) = 0.587 ). Γεωποικό Παεπιστήμιο Αθηώ/Γιώργος Κ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) 6

β) Έστω X ~ N( μ, 0. ). Πρέπει α προσδιορισθεί η μέση τιμή μ ώστε P ( X >.6) = 0.00 (δες και Σχήμα 7..7).. Σχήμα 7..7 P ( X >.6) = 0.00 Έχουμε X μ.6 μ P( X.6) = 0.00 P( X.6) = 0.999 P( ) = 0.999 0. 0..6 μ.6 μ P( Z ) = 0.999 Φ( ) = 0.999. 0. 0. Άρα.6 μ = 3.09 μ =.9 0. δηλαδή, η μηχαή πρέπει α ρυθμισθεί στα.9kg. Συχά, σε πρακτικά προβλήματα, εδιαφέρου πιθαότητες κάποιας τυχαίας μεταβλητής η οποία εκφράζει το άθροισμα άλλω αεξάρτητω τυχαίω μεταβλητώ που η κάθε μια ακολουθεί καοική καταομή. Ας δούμε έα τέτοιο πρόβλημα και πώς ατιμετωπίζεται. Παράδειγμα 7..5: Στα ζώα μιας κτηοτροφικής μοάδας δίεται τροφή τρεις φορές τη ημέρα. Η ποσότητα θερμίδω που παίρου κάθε φορά ακολουθεί καοική τυχαία μεταβλητή. Το διαιτολόγιο έχει ρυθμισθεί έτσι, ώστε τη πρώτη φορά που δίεται τροφή η μέση ποσότητα θερμίδω που παίρου α είαι μ = 500 cal με τυπική απόκλιση σ = 50cal, τη δεύτερη α είαι μ = 700 cal με σ = 00 cal και τη τρίτη α είαι μ 3 = 800cal με σ 3 = 00cal. Α οι ποσότητες θερμίδω που παίρου τα ζώα τις τρεις φορές είαι αεξάρτητες μεταξύ τους, ποια είαι η πιθαότητα η συολική ημερήσια ποσότητα θερμίδω που παίρει έα τυχαία επιλεγμέο ζώο της μοάδας α είαι μεταξύ 975cal και 305cal. Απάτηση: Έστω X, X, X 3 η ποσότητα θερμίδω που παίρει το ζώο τη η, τη η και τη 3 η φορά ατίστοιχα (ημερησίως). Γωρίζουμε ότι το διαιτολόγιο έχει ρυθμισθεί έτσι ώστε X ~ N(500, 50 ), X ~ N(700, 00 ) και X 3 ~ N(800, 00 ). Η συολική ημερήσια ποσότητα θερμίδω S 3 που παίρει το ζώο, προφαώς εκφράζεται από το άθροισμα X + X + X 3, δηλαδή S 3 = X + X + X 3. Είαι προφαές ότι για α απατήσουμε στο ερώτημα που τίθεται (και σε άλλα παρόμοια) πρέπει α γωρίζουμε τη καταομή της S. 3 Γι αυτή τη καταομή, μας πληροφορεί η ακόλουθη πρόταση (δίεται χωρίς απόδειξη). Γεωποικό Παεπιστήμιο Αθηώ/Γιώργος Κ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) 63

Πρόταση 7..: Α X, X, K, X αεξάρτητες τυχαίες μεταβλητές με X ~ N( μ, σ ), =,, K,, τότε S = X ~ N( μ + μ +... + μ, σ + σ +... + σ ). = Α X ~ N( μ, σ ), =,, K,, τότε S = X ~ N( μ, σ ). = Γεικότερα, α X, X, K, X αεξάρτητες τυχαίες μεταβλητές με X ~ N( μ, σ ), =,, K, και α, α, K, α, β πραγματικοί αριθμοί, τότε = α X + β ~ N( α μ + α μ +... + α μ + β, α σ + α σ +... + α σ ). Επειδή οι X, X, X 3 είαι αεξάρτητες, από τη προηγούμεη πρόταση έχουμε ότι S 3 ~ N(500 + 700 + 800, 50 + 00 + 00 ) ή S 3 ~ N(3000, 5500). Άρα για τη ζητούμεη πιθαότητα έχουμε 975 3000 S3 3000 305 3000 P(975 < S3 < 305) = P( < < ) = 5500 5500 5500 = P ( 0. < Z < 0.) = Φ(0.) = 0.733. Από τη Πρόταση 7.. εύκολα προκύπτει η ακόλουθη. Πρόταση 7..3: Α X, X, K, X αεξάρτητες τυχαίες μεταβλητές με X ~ N( μ, σ ) για κάθε =,, K,, τότε X = σ X = ~ N( μ, ). Παράδειγμα 7..5 (συέχεια): Ποια είαι η πιθαότητα, η μέση ποσότητα θερμίδω που παίρει ημερησίως έα τυχαία επιλεγμέο ζώο σε έα χρόο (365 ημέρες) α είαι μεταξύ 975cal και 305cal. Απάτηση: Έστω S η συολική ποσότητα θερμίδω που παίρει το ζώο τη ημέρα, =,,...,365. Επειδή, S ~ N(3000, 5500) θα έχουμε 365 S = 5500 S = ~ N(3000, ) 365 365 και επομέως, 975 3000 S 3000 305 3000 P (975 < S < 305) = P( < < ) = 5500 365 5500 365 5500 365 = P (.08 < Z <.08) = Φ(.08) = 0.964. Παράδειγμα 7..6: Οι ακαθάριστες εβδομαδιαίες εισπράξεις μιας κτηοτροφικής μοάδας από τη πώληση του γάλακτος που παράγει είαι καοική τυχαία μεταβλητή με μέση τιμή 00 και τυπική απόκλιση 30. Ποια είαι η πιθαότητα τις επόμεες δύο εβδομάδες οι συολικές ακαθάριστες εισπράξεις της μοάδας από τη πώληση του γάλακτος που παράγει α ξεπερού τις 5000 ; Γεωποικό Παεπιστήμιο Αθηώ/Γιώργος Κ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) 64

Απάτηση: Έστω X οι ακαθάριστες εισπράξεις από τη πώληση του γάλακτος τη πρώτη εβδομάδα και X οι ακαθάριστες εισπράξεις από τη πώληση του γάλακτος τη δεύτερη εβδομάδα. Δίεται ότι X ~ N(.00, 30 ) και X ~ N(.00, 30 ). Οι συολικές εισπράξεις στις δύο εβδομάδες είαι S = X + X. Με τη υπόθεση ότι οι εισπράξεις από εβδομάδα σε εβδομάδα είαι αεξάρτητες μεταξύ τους έχουμε S ~ N(4400, 30 ) και επομέως για τη ζητούμεη πιθαότητα έχουμε 5000 4000 P( S > 5000) = P( Z > ) = P( Z >.84) = Φ(.84) = 0.039. 30 Σημείωση 7.. (η καταομή von Mses). Στις κυκλικές μεταβλητές, δηλαδή, στις μεταβλητές που μετρώται σε κυκλική κλίμακα, η πλέο χρησιμοποιούμεη καταομή είαι η καταομή von Mses. Η καταομή von Mses, έχει αάλογα χαρακτηριστικά με τη καοική καταομή (και ατίστοιχα μεγάλη χρησιμότητα), γι αυτό στη βιβλιογραφία συατάται και ως κυκλική καοική καταομή (crcular normal). Α η καταομή μιας τυχαίας κυκλικής μεταβλητής, για παράδειγμα, μιας τυχαίας μεταβλητής κατεύθυσης Θ, περιγράφεται από τη καταομή von Mses, τότε η συάρτηση πυκότητας της Θ δίεται από το τύπο kσυ ( ϑ μ ) f ( ϑ) = e πi 0 ( k) όπου μ η μέση κατεύθυση (με τιμές σε διάστημα πλάτους π όπως και η Θ), k παράμετρος που παίρει μη αρητικές τιμές ( κ 0) και εκφράζει τη συγκέτρωση τω τιμώ της Θ γύρω από τη μέση κατεύθυση και π k Ι k e συϑ 0 ( ) = dϑ π. 0 Σχήμα 7..8 Η συάρτηση πυκότητας της καταομής von Mses για διάφορες τιμές της παραμέτρου k Για μεγάλα k η καταομή von Mses προσεγγίζει τη καοική καταομή με μ = θ και σ = k (όσο αυξάεται το k, τόσο αυξάεται και η πιθαότητα α πάρει η μεταβλητή Θ, τιμή κοτά στη μέση κατεύθυση). Για μικρά k, δηλαδή ότα το k πλησιάζει στο 0, η καταομή von Mses προσεγγίζει τη ομοιόμορφη καταομή (σε διάστημα πλάτους π), δηλαδή, στη περίπτωση αυτή, για κάθε κατεύθυση ϑ, η πιθαότητα α πάρει η μεταβλητή Θ τιμή κοτά στη ϑ είαι για όλα τα ϑ ίδια. Γεωποικό Παεπιστήμιο Αθηώ/Γιώργος Κ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) 65

7. Το Κετρικό Οριακό Θεώρημα Στη προηγούμεη εότητα δώσαμε τη γεική ιδέα για το πώς το Κετρικό Οριακό Θεώρημα (Central Lmt Theorem) εξηγεί το μεγάλο εύρος εφαρμογής της καοικής καταομής και πώς συδέει οποιαδήποτε καταομή με τη καοική καταομή. Επίσης, στο 5 ο Κεφάλαιο (στη εότητα 5.5) εξηγήσαμε ότι λέγοτας «από έα πληθυσμό παίρουμε έα τυχαίο δείγμα μεγέθους» εοούμε αεξάρτητες τυχαίες μεταβλητές X, X, K, X που ακολουθού τη ίδια καταομή. Ας δούμε τώρα μια πληρέστερη διατύπωσή του Κετρικού Οριακού Θεωρήματος (Κ.Ο.Θ). Θεώρημα 7.. (Το Κετρικό Οριακό Θεώρημα): Α X, τυχαίες μεταβλητές που ακολουθού τη ίδια καταομή με Var ( X ) = σ, =,, K, έχουμε, X, K X αεξάρτητες E ( X ) = μ και, τότε για μεγάλα (θεωρητικά ), κατά προσέγγιση X = σ X = ~ N( μ, ) και S = X ~ N( μ, σ ). = Έτσι, α από έα πληθυσμό (δηλαδή, από τη καταομή τω τιμώ μιας τ.μ.) που έχει μέση τιμή μ και διακύμαση σ, επιλέξουμε τυχαία δείγματα μεγέθους και υπολογίσουμε τους μέσους τους, το Κ.Ο.Θ. μας διαβεβαιώει ότι για μεγάλα (θεωρητικά ), η καταομή αυτώ τω μέσω (τω δειγματικώ) είαι κατά προσέγγιση καοική με μέση τιμή επίσης μ και διακύμαση σ. Δείτε, για παράδειγμα 6, στο Σχήμα 7..α τέσσερις πληθυσμούς (τις καταομές τεσσάρω τ.μ.) και στο Σχήμα 7..β τις ατίστοιχες καταομές τω δειγματικώ μέσω για = 4. Δείτε επίσης στο Σχήμα 7..γ τις καταομές τω δειγματικώ μέσω για = 5. (α) (β) (γ) Σχήμα 7.. Τέσσερις πληθυσμοί (Σχήματα (α)) και οι ατίστοιχες καταομές τω δειγματικώ μέσω για = 4 (Σχήματα (β)) και για = 5 (Σχήματα (γ)) 6 Lapn, L.L., 98, Statstcs for Modern Busness Decsons, Harcourt Brace Jovanovch, Inc. New York (από το Davs, J.C., 00). Γεωποικό Παεπιστήμιο Αθηώ/Γιώργος Κ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) 66

Όσο πιο μεγάλο είαι το μέγεθος τω δειγμάτω, τόσο καλύτερη είαι η προσέγγιση της καταομής τω δειγματικώ μέσω από τη καοική καταομή (δες και τη Παρατήρηση 7.. στη συέχεια). Ας δούμε όμως, με συγκεκριμέα παραδείγματα, τι σημαίου τα παραπάω στη πράξη. Παράδειγμα 7..: Μας είαι γωστό ότι τα μήλα στάρκι που παράγοται στο οροπέδιο της Τεγέας έχου μέσο βάρος μ = 0gr με τυπική απόκλιση σ = 80gr. Στο συσκευαστήριο του τοπικού συεταιρισμού τα μήλα συσκευάζοται σε κιβώτια τω 60 μήλω και προωθούται στα ψυγεία και τη αγορά. Μπορούμε α υπολογίσουμε ποιο ποσοστό (κατά προσέγγιση) τω κιβωτίω περιέχει μήλα με μέσο βάρος μεταξύ 00 και 50gr; Απάτηση: Τα βάρη τω μήλω κάθε κιβωτίου είαι έα τυχαίο δείγμα μεγέθους = 60 από το πληθυσμό τω βαρώ τω μήλω όλης της παραγωγής. Η μορφή της καταομής τω βαρώ τω μήλω δε μας είαι γωστή. Μπορεί α είαι οποιαδήποτε. Για τη άγωστη αυτή καταομή γωρίζουμε μόο τη μέση τιμή της μ = 0 gr και τη τυπική απόκλισή της σ = 80gr. Μπορούμε με αυτά τα δεδομέα α απατήσουμε στο ερώτημα που θέσαμε; Η απάτηση είαι αι και ας δούμε πώς. Το ερώτημά μας μπορεί α επααδιατυπωθεί ως εξής: ποιο ποσοστό (κατά προσέγγιση) τω δειγματικώ μέσω βρίσκεται μεταξύ 00 και 50gr;. Είαι φαερό ότι για α μπορέσουμε α απατήσουμε στο ερώτημα που θέσαμε (και σε άλλα παρόμοια) πρέπει α γωρίζουμε τη καταομή τω δειγματικώ μέσω. Το Κ.Ο.Θ. μας βεβαιώει ότι παρότι δε γωρίζουμε τη καταομή τω βαρώ τω μήλω, ετούτοις, γωρίζουμε τη καταομή τω δειγματικώ μέσω αφού τα δείγματά μας έχου μέγεθος αρκετά μεγάλο. Δηλαδή, αρκεί μόο ότι γωρίζουμε τη μέση τιμή και τη τυπική απόκλιση της καταομής τω βαρώ τω μήλω. Έτσι, α συμβολίσουμε με Χ τη τυχαία μεταβλητή που εκφράζει το βάρος εός τυχαία επιλεγμέου μήλου στάρκι που παράγεται στο οροπέδιο της Τεγέας και με X τη τυχαία μεταβλητή που εκφράζει τους μέσους τω δειγμάτω μεγέθους 60 (από τη καταομή της Χ), το Κ.Ο.Θ. μας βεβαιώει ότι η X ακολουθεί κατά προσέγγιση καοική καταομή με μέση τιμή μ = μ = 0gr και διακύμαση X 80 σ σ X = = = 06.67 gr. 60 Αφού γωρίζουμε ότι X ~ N(0, 06.67) η απάτηση πλέο στο ερώτημά μας είαι πολύ απλή. Ζητάμε τη πιθαότητα P ( 00 < X < 50) επομέως έχουμε 00 0 50 0 P( 00 < X < 50) = P( < Z < ) = P(.94 < Z <.90) = 06.67 06.67 = Φ(.90) Φ(.94) = Φ(.90) [ Φ(.94)] = Φ(.90) + Φ(.94) = 0.975. Δηλαδή, το ποσοστό τω κιβωτίω που περιέχου μήλα με μέσο βάρος μεταξύ 00 και 50gr είαι (κατά προσέγγιση) 97.5%. Παράδειγμα 7..: Η ποσότητα ραδιεέργειας που δέχεται κάθε ημέρα έας ερευητής είαι τυχαία μεταβλητή με μέση τιμή μ = 0. μοάδες και τυπική απόκλιση σ = 0. 0 Γεωποικό Παεπιστήμιο Αθηώ/Γιώργος Κ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) 67

μοάδες. Ποια είαι η πιθαότητα το συολικό ποσό ραδιεέργειας που θα δεχθεί ο ερευητής σε 00 ημέρες α ξεπεράει τις 0.0 μοάδες. Απάτηση: Έστω X η ποσότητα ραδιεέργειας που δέχεται ο ερευητής τη ημέρα ( =,, K, 00 ). Η καταομή της X, =,, K, 00 δε είαι γωστή. Είαι γωστή μόο η μέση τιμή και η τυπική απόκλισή της (0. και 0.0 ατίστοιχα). Η συολική ποσότητα ραδιεέργειας που θα δεχθεί ο ερευητής στις 00 ημέρες είαι S 00 = X + X + K + X 00 και επειδή το είαι αρκετά μεγάλο, από το Κ.Ο.Θ. (κατά προσέγγιση) έχουμε S 00 ~ N(00 0., 00 0.0 ) ή S 00 ~ N(0, 0. ). Άρα η ζητούμεη πιθαότητα είαι 0.0 0 P ( S 00 > 0.0) = P( Z > ) = P( Z > 0.) = Φ(0.) = 0.407. 0. Παρατήρηση 7..: Όπως ήδη ααφέραμε, όσο πιο μεγάλο είαι το μέγεθος τω δειγμάτω, τόσο καλύτερη (ακριβέστερη) είαι η προσέγγιση της καταομής τω δειγματικώ μέσω από τη καοική καταομή. Πρακτικά, όμως, πόσο μεγάλο πρέπει α είαι το ; Απόλυτη απάτηση στο ερώτημα αυτό δε υπάρχει. Γεικά, το πόσο μεγάλο πρέπει α είαι το, εξαρτάται από το πληθυσμό. Για παράδειγμα, α πρόκειται για λοξή (ασύμμετρη) καταομή απαιτείται μεγαλύτερο μέγεθος δείγματος από αυτό που απαιτείται α είαι περίπου συμμετρική. Γεικά, το μέγεθος του δείγματος πρέπει α είαι τουλάχιστο 30, δηλαδή, 30. Όμως, όπως φαίεται και στα Σχήματα 7.., υπάρχου περιπτώσεις όπου καλές προσεγγίσεις παίρουμε και για μικρότερα. Για διερεύηση τω παραπάω μπορείτε α πειραματιστείτε με λογισμικό προσομοίωσης του Κ.Ο.Θ. που μπορείτε α βρείτε στο Διαδίκτυο. Τέλος, επισημαίουμε τη περίπτωση όπου ο πληθυσμός από το οποίο γίεται η δειγματοληψία είαι καοικός. Στη περίπτωση αυτή, όπως ήδη έχουμε ααφέρει (Πρόταση 7.. και Πρόταση 7..3), αποδεικύεται ότι η καταομή τω δειγματικώ μέσω (και της S ), είαι καοική καταομή αεξάρτητα από το πόσο μεγάλο είαι το. Γεωποικό Παεπιστήμιο Αθηώ/Γιώργος Κ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) 68

7.. Καοική προσέγγιση της Διωυμικής καταομής Ας δούμε έα ακόμη εδιαφέρο αποτέλεσμα της Θεωρίας Πιθαοτήτω, γωστό ως οριακό θεώρημα τω De Movre-Laplace στο οποίο οφείλεται και η «γέηση» της καοικής καταομής. Θεώρημα 7.. (Οριακό θεώρημα De Movre-Laplace): Για μεγάλα (θεωρητικά ), η διωυμική καταομή μπορεί α προσεγγισθεί από μια καοική καταομή με ίδια μέση τιμή και ίδια διακύμαση. Δηλαδή, α X ~ B(, p) τότε, για μεγάλες τιμές του, η καταομή της Χ προσεγγίζεται από τη N ( μ, σ ) με μ = p και σ =p( p). Το αποτέλεσμα αυτό εύκολα προκύπτει ως ειδική περίπτωση του Κ.Ο.Θ 7. Όμως, δε προέκυψε έτσι. Ατιθέτως, αποδεικύοτάς το ο Abraham De Movre το 733 για p = 0.5 και, εκατό περίπου χρόια αργότερα, το 8 ο Perre-Smon Laplace για κάθε p (0, ), έθεσα τις βάσεις για τη διατύπωση και απόδειξη του Κ.Ο.Θ. Δηλαδή, η πορεία ήτα ατίστροφη. Πρώτα αποδείχθηκε το οριακό θεώρημα De Movre-Laplace και πολύ αργότερα διατυπώθηκε και αποδείχθηκε το Κ.Ο.Θ. από το Ρώσο μαθηματικό Lyapunov τη περίοδο 90-90 (είχα προηγηθεί και άλλες γεικεύσεις του οριακού θεωρήματος De Movre-Laplace από τους Chebysev και Markov). Μάλιστα, το οριακό θεώρημα De Movre-Laplace προέκυψε όπως και το οριακό θεώρημα Posson - από τη αάγκη ατιμετώπισης τω δυσκολιώ που παρουσιάζοται στο υπολογισμό πιθαοτήτω της διωυμικής καταομής. Έτσι «γεήθηκε» και η καοική καταομή (όπως και η καταομή Posson από το οριακό θεώρημα Posson). Δηλαδή, οι δυσκολίες της διωυμικής «γέησα» δύο διάσημες καταομές! Πρι δώσουμε παραδείγματα εφαρμογής, σε πρακτικά προβλήματα, της καοικής προσέγγισης της διωυμικής καταομής, ας δούμε πάλι το ερώτημα: πόσο μεγάλο πρέπει α είαι το για α μπορεί πρακτικά α χρησιμοποιηθεί καοική προσέγγιση της διωυμικής καταομής. Το πόσο μεγάλο πρέπει α είαι το, εξαρτάται από τη τιμή της παραμέτρου p. Α για παράδειγμα, p = 0. 5 ή κοτά στο 0. 5, τότε και για όχι πολύ μεγάλες τιμές του παίρουμε εξαιρετικές προσεγγίσεις της διωυμικής. Ατίθετα, α το p είαι πολύ μικρό ή πολύ μεγάλο, για καλή προσέγγιση, απαιτούται πολύ μεγαλύτερες τιμές του. Έας πρακτικός, γεικός, καόας είαι ο ακόλουθος. Για α πάρουμε μέσω του οριακού θεωρήματος De Movre-Laplace καλές προσεγγίσεις της διωυμικής καταομής αρκεί p 5 και ( p) 5. Στη βιβλιογραφία συατάται επίσης και ο καόας ότι αρκεί p( p) 0. Στα Σχήματα 7.. δίεται η συάρτηση πιθαότητας της διωυμικής καταομής με p = 0.5 και = 8,6, 30 καθώς και η συάρτηση πυκότητας της καοικής καταομής με τη ατίστοιχη μέση τιμή και διακύμαση, δηλαδή, με μ = p και σ =p( p). Παρατηρείστε ότι όσο μεγαλύτερο γίεται το τόσο πιο καλή και η προσέγγιση. 7 Θυμηθείτε ότι η διωυμική καταομή ορίζεται ως άθροισμα αεξάρτητω δίτιμω τυχαίω μεταβλητώ. Γεωποικό Παεπιστήμιο Αθηώ/Γιώργος Κ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) 69

Σχήμα 7.. Η διωυμική καταομή για p = 0. 5 και = 8,6, 30 και ατίστοιχα η καοική με μ = p και σ =pq Δείτε επίσης πάλι το Σχήμα 6.. και παρατηρείστε τη μορφή της διωυμικής καταομής για p = 0. 5. Παράδειγμα 7..4: Ο επιθυμητός/ιδαικός αριθμός πρωτοετώ φοιτητώ σε έα παεπιστήμιο είαι 50. Το παεπιστήμιο, γωρίζοτας από προηγούμεη εμπειρία ότι από τους φοιτητές που κάει δεκτούς για εγγραφή μόο το 30% παρακολουθεί τα μαθήματα, κάει δεκτούς 450 φοιτητές. Ποια είαι η πιθαότητα από τους 450 πρωτοετείς φοιτητές, α παρακολουθού τελικά τα μαθήματα περισσότεροι από 50. Απάτηση: Α Χ ο αριθμός τω πρωτοετώ φοιτητώ (από τους 450) που παρακολουθού τα μαθήματα, τότε προφαώς X ~ B(, p) με = 450 και p = 0. 3, δηλαδή, X ~ B(450, 3). Επειδή, το είαι μεγάλο και p = 450 0.3 = 35 5 και ( p) = 450 0.7 = 35 5, η Χ προσεγγίζεται ικαοποιητικά από τη καοική με μ = p = 450 0.3 = 35 και σ = p( p) = 450 0.3 0.7 = 94. 5 δηλαδή από τη N (35, 94.5). Άρα, για τη ζητούμεη πιθαότητα έχουμε X 35 5 35 P( X 5) = P( ) = P( Z.64) = Φ(.64) = 0.0505. 94.5 94.5 Όπως ήδη έχουμε ααφέρει στο εισαγωγικό κεφάλαιο ( ο Κεφάλαιο), έα κρίσιμο θέμα στη στατιστική προσέγγιση προβλημάτω είαι το μέγεθος του δείγματος. Τα δύο παραδείγματα που ακολουθού δίοται για α πάρουμε μια πρώτη ιδέα για το πώς μπορούμε α εφαρμόσουμε αποτελέσματα της θεωρίας πιθαοτήτω για το καθορισμό του κατάλληλου μεγέθους δείγματος. Παράδειγμα 7..5: Προκειμέου α εκτιμήσουμε το ποσοστό p τω ατόμω εός πληθυσμού που έχου μια συγκεκριμέη ιδιότητα (π.χ. καπίζου, πάσχου από μια ασθέεια, είαι άεργοι, ψηφίζου έα συγκεκριμέο κόμμα κτλ.) χρησιμοποιούμε έα Γεωποικό Παεπιστήμιο Αθηώ/Γιώργος Κ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) 70

δείγμα μεγέθους. Πόσο πρέπει α είαι το έτσι ώστε το ποσοστό τω ατόμω του δείγματος που έχου τη ιδιότητα, α διαφέρει, κατ απόλυτη τιμή, από το (άγωστο) πραγματικό ποσοστό p λιγότερο από % με πιθαότητα τουλάχιστο 95%. Απάτηση: Ας συμβολίσουμε με Χ το αριθμό τω ατόμω του δείγματος που έχου τη συγκεκριμέη ιδιότητα. Η τυχαία μεταβλητή Χ ακολουθεί τη διωυμική καταομή 8 με παραμέτρους και p, δηλαδή X ~ B(, p). Προφαώς, το ποσοστό τω ατόμω του δείγματος που έχου τη συγκεκριμέη ιδιότητα είαι Χ. Σύμφωα με τις απαιτήσεις που θέτει το πρόβλημα πρέπει X X P p < 0.0 0.95 ή P 0.0< p < 0.0 0. 95 ή P ( 0.0 < X p < 0.0 ) 0.95 ή P ( p 0.0 < X < p + 0.0 ) 0. 95. Χρησιμοποιώτας τη καοική προσέγγιση της διωυμικής έχουμε ( p 0.0 ) p X p ( p + 0.0 ) p P( p 0.0 < X < p + 0.0 ) = P < < = p( p) p( p) p( p) 0.0 = Φ. ( ) p p Άρα, σύμφωα με τις απαιτήσεις που θέτει το πρόβλημα, πρέπει 0.0 Φ 0.95 ( ) p p ή ισοδύαμα 0.0 Φ 0.975 ( ) p p και επομέως 0.0.96 ή 3846 p( p). p( p) Επειδή το πραγματικό ποσοστό στο πληθυσμό, p, είαι άγωστο, για α εξασφαλίσουμε για κάθε τιμή του p τη ισχύ της τελευταίας αισότητας πρέπει α βρούμε τη μέγιστη τιμή του p( p). Αυτή είαι 4 (γιατί;) 9 άρα πρέπει 3846 4 δηλαδή, το δείγμα πρέπει α έχει μέγεθος τουλάχιστο 9604. Παράδειγμα 7..6: Έας αστροόμος θέλει α μετρήσει (σε έτη φωτός) τη απόσταση μεταξύ του αστεροσκοπείου που εργάζεται και εός άστρου. Παρότι εφαρμόζει μια ααγωρισμέη μέθοδο μέτρησης, γωρίζει ότι κάθε φορά που μετράει τη απόσταση δε παίρει τη πραγματική τιμή της αλλά μόο μια εκτίμησή της (αυτό συμβαίει για διάφορους λόγους, όπως αλλαγές στις ατμοσφαιρικές συθήκες, κ.ά.). Γι αυτό σχεδιάζει α κάει έα αριθμό μετρήσεω, α υπολογίσει τη μέση τιμή τους και α τη χρησιμοποιήσει για α εκτιμήσει τη άγωστη πραγματική απόσταση d. Α οι μετρήσεις, X, X, K, X, είαι αεξάρτητες τυχαίες μεταβλητές που ακολουθού τη ίδια (άγωστη) καταομή με μέση τιμή d (τη άγωστη πραγματική απόσταση) και 8 Στις περιπτώσεις αυτές, το μέγεθος του δείγματος είαι μικρό σε σχέση με το μέγεθος του πληθυσμού και επομέως μπορούμε α υποθέσουμε ότι η δειγματοληψία γίεται με επαάθεση. 9 Πρόκειται για τη εύρεση ακρότατης τιμής συάρτησης του p. Γεωποικό Παεπιστήμιο Αθηώ/Γιώργος Κ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) 7

διακύμαση 4 έτη φωτός, πόσες μετρήσεις πρέπει α κάει ο αστροόμος ώστε η μέση τιμή τους α διαφέρει, κατ απόλυτη τιμή, από τη άγωστη πραγματική απόσταση d, λιγότερο από 0.5 έτη φωτός με πιθαότητα 95%. Απάτηση: Για μεγάλες τιμές του, από το Κ.Ο.Θ. έχουμε ότι κατά προσέγγιση = X 4 X = ~ N( d, ). Σύμφωα με τις απαιτήσεις που θέτει το πρόβλημα πρέπει P X d < 0.5 = 0.95 P( 0.5 < X d < 0.5) = 0. 95 ( ) P( 0.5 + d < X < 0.5 + d) = 0.95 0.5 0.5 P( < Z < ) = 0.95 Φ( 4) = 0.95 Φ( 4) = 0.975 και επομέως =.96 = 6.46. 4 Άρα ο αστροόμος πρέπει α πάρει 6 μετρήσεις. 7.. Καοική προσέγγιση της καταομής Posson Με εφαρμογή του Κ.Ο.Θ., αποδεικύεται ότι και η καταομή Posson μπορεί α προσεγγισθεί ικαοποιητικά από τη καοική καταομή. Πιο συγκεκριμέα, α Χ είαι μια τυχαία μεταβλητή που ακολουθεί τη καταομή Posson με παράμετρο λ, τότε η καταομή της Χ προσεγγίζεται, για μεγάλες τιμές του λ (στη πράξη για λ > 0), από τη N ( μ, σ ) με μ = λ και σ = λ. Ας δούμε έα παράδειγμα. Παράδειγμα 7..7: Σε μια αγροτική καλλιέργεια κηπευτικώ, έχει παρατηρηθεί ότι ο αριθμός τω φυτώ που δε ααπτύσσοται (ξεραίοται) είαι τυχαία μεταβλητή Χ που ακολουθεί καταομή Posson με μέση τιμή λ = 00 φυτά/καλλιεργητική περίοδο. Ποια είαι η πιθαότητα σε μια καλλιεργητική περίοδο ο αριθμός τω φυτώ που δε θα ααπτυχθού α είαι τουλάχιστο 0. Απάτηση: Επειδή η τιμή του λ είαι μεγάλη, η καταομή της Χ προσεγγίζεται ικαοποιητικά από τη καοική με μ = λ = 00 και σ = λ = 00, δηλαδή, από τη N (00, 00). Άρα, για τη ζητούμεη πιθαότητα έχουμε X 00 0 00 P ( X 0) = P( ) = P( Z ) = Φ() = 0.08. 00 00 7..3 Διόρθωση συέχειας Τόσο στη περίπτωση της καοικής προσέγγισης της διωυμικής καταομής όσο και στη περίπτωση της καοικής προσέγγισης της καταομής Posson, γίεται προσέγγιση διακριτής καταομής από συεχή. Στις περιπτώσεις αυτές (που γίεται προσέγγιση διακριτής καταομής από συεχή), καλό είαι α εσωματώεται στο προσεγγιστικό τύπο η λεγόμεη διόρθωση συέχειας. Έτσι, ότα για παράδειγμα, η διωυμική X ~ B(, p) προσεγγίζεται από τη N( p, p( p) ) οι πιθαότητες P( a X b), P( X b) και P( X a) με διόρθωση συέχειας υπολογίζοται ως εξής: Γεωποικό Παεπιστήμιο Αθηώ/Γιώργος Κ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) 7

P( a X b) P( a 0.5 X b + 0.5) = 0.5 0.5 0.5 0.5 a p X p b + p b + p a p = P = Φ Φ. ( ) ( ) ( ) ( ) ( ) p p p p p p p p p p 0.5 0.5 ( ) ( 0.5) X p b + p b + p P X b P X b + = P = Φ. ( ) ( ) ( ) p p p p p p 0.5 0.5 ( ) ( 0.5) X p a p a p P X a P X a = P = Φ. ( ) ( ) ( ) p p p p p p Χρησιμοποιώτας στο Παράδειγμα 7..4 τη διόρθωση συέχειας έχουμε X 35 50.5 35 P ( X 5) P( X 5 0.5) = P( > ) = P( Z >.59) = 0.0559. 94.5 94.5 Ομοίως, χρησιμοποιώτας στο Παράδειγμα 7..7 τη διόρθωση συέχειας έχουμε X 00 9.5 00 P ( X 0) P( X 0 0.5) = P( ) = P( Z.95) = 0.056. 00 00 Τέλος, σημειώουμε ότι χρησιμοποιώτας τη διόρθωση συέχειας, μπορούμε α υπολογίζουμε και τις πιθαότητες P ( X = a), a = 0,,... μιας διακριτής τυχαίας μεταβλητής Χ, μέσω της καοικής καταομής, ως εξής: P ( X = a) P( a 0.5 X a + 0.5) =... Σχόλιο 7..: Το πόσο σηματικό είαι το γεγοός ότι το Κ.Ο.Θ. μας πληροφορεί για τη καταομή της X και της S, θα φαεί και στη συέχεια ότα ααφερθούμε στα διαστήματα εμπιστοσύης και τους στατιστικούς ελέγχους υποθέσεω. Για προβληματισμό Σε πολλά μουσεία επιστημώ, έα από τα εκθέματα (μοτέλα/κατασκευές) που ετυπωσιάζου μικρούς και μεγάλους επισκέπτες και προκαλού το εδιαφέρο και τη περιέργειά τους, είαι η μηχαή του Galton (Galton s machne) γωστή και ως Galton s board, quncunx και bean machne 0 (Σχήμα 7..3 και Εικόα 7..). Πρόκειται για έα κατακόρυφο πίακα στο πάω μισό του οποίου υπάρχει μια συστοιχία από καρφιά/πείρους καταεμημέα σε σειρές και σε ίσες μεταξύ τους αποστάσεις. Το κάτω μισό του πίακα έχει διαιρεθεί με ορθογώιες κατακόρυφες υποδοχές τοποθετημέες σε ίσες αποστάσεις επίσης. Στη κορυφή της συστοιχίας καρφιώ υπάρχει μια χοάη από τη οποία ότα ο μηχαισμός αρχίσει α λειτουργεί, πέφτου σφαιρίδια τα οποία προσκρούου στα καρφιά και κιούμεα στα κεά μεταξύ τω καρφιώ καταλήγου στις υποδοχές. Η εμπρός επιφάεια του πίακα έχει διαφαές κάλυμμα ώστε η όλη κατασκευή α είαι ορατή (όπως και η λειτουργία της). Ο τρόπος που είαι τοποθετημέα τα καρφιά (αλλά και γεικότερα η όλη κατασκευή) διασφαλίζει ότι κάθε φορά που έα σφαιρίδιο προσκρούει σε έα καρφί κιείται με ίδια πιθαότητα, ίση με, προς τα δεξιά ή προς τα αριστερά και πέφτει στη επόμεη σειρά καρφιώ. Ότα φθάσει στη τελευταία σειρά πέφτει σε μια από τις υποδοχές που υπάρχου στο κάτω μέρος όπου και στοιβάζεται μαζί με άλλα σφαιρίδια (Σχήμα 7..3). Ότα αφεθού πολλά σφαιρίδια α πέσου, το μοτέλο που δημιουργείται από τις κατακόρυφες στοίβες σφαιριδίω έχει κωδωοειδή μορφή που προσομοιάζει με αυτή της καοικής καταομής. Δηλαδή, παρότι η διαδρομή κάθε σφαιριδίου είαι τυχαία και 0 Ο Sr Francs Galton (8-9) ήτα Άγγλος αθρωπολόγος με πολυσχιδή επιστημοική δραστηριότητα. Συεργάσθηκε με το Karl Pearson και χρησιμοποίησε τη καοική καταομή για τη μελέτη και τη ερμηεία αθρωπομετρικώ δεδομέω. Γεωποικό Παεπιστήμιο Αθηώ/Γιώργος Κ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) 73

επομέως όχι προβλέψιμη, το μοτέλο που αυτά δημιουργού είαι πάτοτε (σε κάθε δηλαδή επαάληψη του πειράματος) προβλέψιμο. Μάλιστα όσο περισσότερα είαι τα σφαιρίδια που κάθε φορά αφήοται α πέσου, τόσο καλύτερα το μοτέλο που δημιουργείται προσαρμόζεται στη καοική καμπύλη. Ετυπωσιακό πράγματι αποτέλεσμα. Εικόα 7.. Η μηχαή του Galton στο Μουσείο Επιστημώ της Βοστόης Πρόκειται για έα ευφυέστατο στη σύλληψη και τη υλοποίησή του πείραμα που επιβεβαιώει και ααδεικύει με πολύ απλό και παραστατικό τρόπο πώς προκύπτει (τι εκφράζει) η διωυμική καταομή και πώς αυτή προσεγγίζεται από τη καοική (οριακό θεώρημα De Movre-Laplace). Προσομοιώει επίσης, το όμο τω μεγάλω αριθμώ (στατιστική ομαλότητα)! Τι λέτε, μπορείτε α εξηγήσετε πώς τα καταφέρει όλα αυτά η μηχαή του Galton ; Σχήμα 7..3 Η μηχαή του Galton Το ότι προς τις ακραίες υποδοχές στοιβάζοται πολύ λιγότερα σφαιρίδια από ότι στις κετρικές, είαι βέβαια κάτι προφαώς ααμεόμεο αφού οι διαδρομές που οδηγού στις ακραίες υποδοχές είαι πολύ λιγότερες. Γεωποικό Παεπιστήμιο Αθηώ/Γιώργος Κ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) 74

Υπόδειξη-: Σκεφθείτε ότι η πρόσκρουση εός σφαιριδίου σε έα καρφί είαι μια δοκιμή Bernoull με δύο δυατά αποτελέσματα: κίηση προς τα δεξιά, κίηση προς τα αριστερά. Η διαδρομή επομέως εός σφαιριδίου ορίζεται από αεξάρτητες δοκιμές Bernoull, όσες οι σειρές καρφιώ. Σκεφθείτε επίσης ότι έα σφαιρίδιο θα καταλήξει στη υποδοχή 0 (δες Σχήμα 7..3) α σε κάθε πρόσκρουση κιηθεί προς τα αριστερά, δηλαδή α σε καμία από τις προσκρούσεις δε κιηθεί προς τα δεξιά. Ατίστοιχα, θα καταλήξει στη υποδοχή α κιηθεί προς τα δεξιά σε μία μόο (οποιαδήποτε) από τις προσκρούσεις, στη υποδοχή α κιηθεί προς τα δεξιά σε δύο μόο (οποιεσδήποτε) από τις προσκρούσεις, κ.ο.κ. Έτσι, είαι προφαές ότι η θέση στη οποία καταλήγει έα σφαιρίδιο καθορίζεται από το αριθμό τω επιτυχιώ στις αεξάρτητες δοκιμές Bernoull. Πρόκειται επομέως για έα μοτέλο που περιγράφεται από τη διωυμική καταομή B (, ) (δείτε επίσης πάλι στο Σχήμα 6..β το διάγραμμα πιθαοτήτω της B (8, ) ). Τέλος, όσο περισσότερες είαι οι σειρές καρφιώ και επίσης όσα περισσότερα τα σφαιρίδια που πέφτου σε μια εκτέλεση του πειράματος τόσο καλύτερη είαι η προσαρμογή του μοτέλου στη καοική καμπύλη (σκεφθείτε γιατί). Υπόδειξη-: Μπορείτε μέσω του διαδικτύου α βρείτε Java applets τα οποία προσομοιώου τη μηχαή του Galton σε υπολογιστικό περιβάλλο. Προσπαθήστε. Η παρακάτω εικόα είαι έα στιγμιότυπο από έα τέτοιο πρόγραμμα. Θεωρείστε ως επιτυχία τη κίηση προς τα δεξιά και ότι ο αριθμός τω υποδοχώ είαι +. Γεωποικό Παεπιστήμιο Αθηώ/Γιώργος Κ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) 75