3. Οριακά θεωρήµατα. Κεντρικό Οριακό Θεώρηµα (Κ.Ο.Θ.)

Σχετικά έγγραφα
2. Στοιχεία Πολυδιάστατων Κατανοµών

2.6 ΟΡΙΑ ΑΝΟΧΗΣ. πληθυσµού µε πιθανότητα τουλάχιστον ίση µε 100(1 α)%. Το. X ονοµάζεται κάτω όριο ανοχής ενώ το πάνω όριο ανοχής.

Εργαστήριο Μαθηµατικών & Στατιστικής. 1 η Πρόοδος στο Μάθηµα Στατιστική 5/12/08 Α ΣΕΙΡΑ ΘΕΜΑΤΩΝ. 3 ο Θέµα

Σηµειώσεις στις σειρές

Το Κεντρικό Οριακό Θεώρημα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

εξαρτάται από το θ και για αυτό γράφουµε την σ.π.π. στην εξής µορφή: ( θ, + ) θ θ n 2n (θ,+ ) 1, 0, x θ.

Το Κεντρικό Οριακό Θεώρημα

ΚΑΤΑΝΟΜΕΣ ΠΙΘΑΝΟΤΗΤΑΣ ΤΥΧΑΙΩΝ ΜΕΤΑΒΛΗΤΩΝ (Συνέχεια)

Περίληψη ϐασικών εννοιών στην ϑεωρία πιθανοτήτων

ΒΑΣΙΚΕΣ ΙΑΚΡΙΤΕΣ ΚΑΤΑΝΟΜΕΣ (Συνέχεια)

Το Κεντρικό Οριακό Θεώρημα

Οι θεµελιώδεις έννοιες που απαιτούνται στη Επαγωγική Στατιστική (Εκτιµητική, ιαστήµατα Εµπιστοσύνης και Έλεγχοι Υποθέσεων) είναι:

MEΤΑΣΧΗΜΑΤΙΣΜΟΙ ΤΗΣ ΜΟΡΦΗΣ Y= g( X1, X2,..., Xn)

1. Εισαγωγή Ο έλεγχος υποθέσεων αναφέρεται στις ιδιότητες µιας άγνωστης παραµέτρους του πληθυσµού: Ο κατηγορούµενος είναι αθώος

Σχολικός Σύµβουλος ΠΕ03

Στατιστική Συμπερασματολογία

X = = 81 9 = 9

Περιεχόμενα της Ενότητας. Δειγματοληψία. Δειγματοληψίας. Δειγματοληψία. Τυχαία Δειγματοληψία. Χ. Εμμανουηλίδης, 1.

& 4/12/09 Α ΣΕΙΡΑ ΘΕΜΑΤΩΝ

3. Κατανομές πιθανότητας

ΕΡΓΑΣΤΗΡΙΟ ΠΙΘΑΝΟΤΗΤΩΝ

ΣΕΙΡΕΣ TAYLOR. Στην Ενότητα αυτή θα ασχοληθούµε µε την προσέγγιση συναρτήσεων µέσω πολυωνύµων. Πολυώνυµο είναι κάθε συνάρτηση της µορφής:

Τυχαία μεταβλητή (τ.μ.)

Ανάλυση Δεδοµένων µε χρήση του Στατιστικού Πακέτου R

( ) = inf { (, Ρ) : Ρ διαµέριση του [, ]}

Χρησιμότητα ανισοτήτων - οριακών θεωρημάτων

f x = f a + Df a x a + R1 x, a, x U και από τον ορισµό της 1 h f a h f a h a h h a R h a i i j

Μάθηµα Θεωρίας Αριθµών Ε.Μ.Ε

Στατιστική ΙΙ Ενότητα 2: ειγµατοληψία

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΚΕΦΑΛΑΙΟ 9. Κατανομές Δειγματοληψίας

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΟΧΑΣΤΙΚΑ ΜΟΝΤΕΛΑ

4 η ΕΚΑ Α ΓΕΝΙΚΕΣ ΑΣΚΗΣΕΙΣ 31.

Κεφάλαιο 6. Πεπερασµένα παραγόµενες αβελιανές οµάδες. Z 4 = 1 και Z 2 Z 2.

ΣΤΑΤΙΣΤΙΚΗ ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ

Πανεπιστήμιο Πελοποννήσου

Έλεγχος Υποθέσεων. Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς

ΠΟΣΟΤΙΚΕΣ ΜΕΘΟΔΟΙ στη Ναυτιλία και τις Μεταφορές

Ορισμός και Ιδιότητες

(365)(364)(363)...(365 n + 1) (365) k

ΜΑΘΗΜΑΤΙΚΑ ΓΕΝΙΚΗΣ ΠΑΙ ΕΙΑΣ

Πανεπιστήµιο Κρήτης - Τµήµα Επιστήµης Υπολογιστών. ΗΥ-217: Πιθανότητες-Χειµερινό Εξάµηνο ιδάσκων : Π. Τσακαλίδης

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Έγιναν καλά εν έγιναν καλά Οµάδα Α (µε φάρµακο) Οµάδα Β (χωρίς φάρµακο) 35 15

ΕΙΣΑΓΩΓΗ. Μη Παραµετρική Στατιστική, Κ. Πετρόπουλος. Τµήµα Μαθηµατικών, Πανεπιστήµιο Πατρών

ΕΛΕΓΧΟΙ ΠΡΟΣΑΡΜΟΓΗΣ & ΥΠΟΘΕΣΕΩΝ

f x = f a + Df a x a + R1 x, a, x U και από τον ορισµό της 1 h f a h f a h a h h a R h a i i j


Εισαγωγή στην Τοπολογία

Στατιστική Συμπερασματολογία

στατιστική θεωρεία της δειγµατοληψίας


Πιθανότητες Γεώργιος Γαλάνης Κωνσταντίνα Παναγιωτίδου

ΘΕΩΡΙΑ ΠΙΘΑΝΟΤΗΤΩΝ Ι Φεβρουάριος 2018 Σειρά Α Θέματα 3 ως 7 και αναλυτικές (ή σύντομες) απαντήσεις

Ανάλυση Δεδοµένων µε χρήση του Στατιστικού Πακέτου R

Κεφάλαιο 9 Κατανομές Δειγματοληψίας

Βασικά στοιχεία της θεωρίας πιθανοτήτων

ρ. Ευστρατία Μούρτου

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 14 Μαρτίου /34

5. Έλεγχοι Υποθέσεων

1 Ορισµός ακολουθίας πραγµατικών αριθµών

11ο Πανελλήνιο Συνέδριο της ΕΕΦ, Λάρισα 30-31/03, 1-2/04/2006. Πρακτικά Συνεδρίου

ΤΥΠΟΛΟΓΙΟ ΣΤΑΤΙΣΤΙΚΗΣ

ΠΙΘΑΝΟΤΗΤΕΣ -ΤΥΧΑΙΕΣ ΜΕΤΑΒΛΗΤΕΣ(τελικές εξετάσεις πλη12)

ΛΥΣΕΙΣ ΘΕΜΑΤΩΝ ΣΤΑΤΙΣΤΙΚΗ Ι ΜΕΡΟΣ Α (Σ. ΧΑΤΖΗΣΠΥΡΟΣ) . Δείξτε ότι η στατιστική συνάρτηση T = X( n)

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Κεφάλαιο 2: ιατάξεις και Συνδυασµοί.

KΕΦΑΛΑΙΟ 6 ΥΝΑΜΟΣΕΙΡΕΣ-ΣΕΙΡΕΣ TAYLOR

3. ΠΑΡΑΜΕΤΡΟΙ ΚΑΤΑΝΟΜΩΝ

ΜΑΘΗΜΑΤΙΚΑ ΚΑΙ ΣΤΟΙΧΕΙΑ ΣΤΑΤΙΣΤΙΚΗΣ Γ' ΛΥΚΕΙΟΥ ΓΕΝΙΚΗΣ ΠΑΙ ΕΙΑΣ 2006 ΕΚΦΩΝΗΣΕΙΣ

, µπορεί να είναι η συνάρτηση. αλλού. πλησιάζουν προς την τιµή 1, η διασπορά της αυξάνεται ή ελαττώνεται; (Εξηγείστε γιατί).

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ Τµήµα Επιστήµης Υπολογιστών. HY-217: Πιθανότητες - Χειµερινό Εξάµηνο 2017 ιδάσκων : Π. Τσακαλίδης

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

P(200 X 232) = =

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ


Στατιστική. Εκτιμητική

ΟΜΟΣΠΟΝ ΙΑ ΕΚΠΑΙ ΕΥΤΙΚΩΝ ΦΡΟΝΤΙΣΤΩΝ ΕΛΛΑ ΟΣ (Ο.Ε.Φ.Ε.) ΕΠΑΝΑΛΗΠΤΙΚΑ ΘΕΜΑΤΑ ΕΠΑΝΑΛΗΠΤΙΚΑ ΘΕΜΑΤΑ 2014

0. Σύντοµη επισκόπηση θεωρίας πιθανοτήτων

ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ ΣΤΗΝ ΠΛΗΡΟΦΟΡΙΚΗ ΜΑΘΗΜΑΤΙΚΑ Ι (ΘΕ ΠΛΗ 12) ΕΡΓΑΣΙΑ 6 η Ημερομηνία Αποστολής στο Φοιτητή: 23 Απριλίου 2012

ΠΙΘΑΝΟΤΗΤΑ ΚΑΙ ΒΑΣΙΚΕΣ Ι ΙΟΤΗΤΕΣ ΤΗΣ

Τυχαίες Μεταβλητές Γεώργιος Γαλάνης Κωνσταντίνα Παναγιωτίδου

Ορισµός. (neighboring) καταστάσεων. ηλαδή στην περίπτωση αλυσίδας Markov. 1.2 ιαµόρφωση µοντέλου

ΤΥΧΑΙΟΙ ΑΡΙΘΜΟΙ - ΠΡΟΣΟΜΟΙΩΣΗ

Όρια συναρτήσεων. ε > υπάρχει ( ) { } = ± ορίζονται αναλόγως. Η διατύπωση αυτών των ορισµών αφήνεται ως άσκηση. x y = +. = και για κάθε (, ) ( 0,0)

ΒΑΣΙΚΕΣ ΙΑΚΡΙΤΕΣ ΚΑΤΑΝΟΜΕΣ (Συνέχεια)

Όνοµα: Λιβαθινός Νικόλαος 2291

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ

cov(x, Y ) = E[(X E[X]) (Y E[Y ])] cov(x, Y ) = E[X Y ] E[X] E[Y ]

ΔΕΣΜΕΥΜΕΝΕΣ Ή ΥΠΟ ΣΥΝΘΗΚΗ ΠΙΘΑΝΟΤΗΤΕΣ

Επαναληπτικό Διαγώνισµα Μαθηµατικά Γενικής Παιδείας Γ Λυκείου

Υπολογισµός διπλών ολοκληρωµάτων µε διαδοχική ολοκλήρωση

Βασικά στοιχεία της θεωρίας πιθανοτήτων

ιωνυµική Κατανοµή(Binomial)

3 η ΕΚΑ Α ΓΕΝΙΚΕΣ ΑΣΚΗΣΕΙΣ 21. (1)

ΑΠΑΝΤΗΣΕΙΣ - ΥΠΟ ΕΙΞΕΙΣ ΣΤΙΣ ΕΡΩΤΗΣΕΙΣ

Θέµατα Μαθηµατικών & Στ. Στατ/κής Γενικής Παιδείας Γ Λυκείου 2000

( t) ( ) ( 0,1) ( ) ( ) ( ) ( ) Κεντρικό Οριακό Θεώρημα (Central Limit Theorem Lindeberg Levy) τότε η τ.μ. Sn

ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ ΓΙΑ AΝΑΛΟΓΙΕΣ

Transcript:

3 Οριακά θεωρήµατα Κεντρικό Οριακό Θεώρηµα (ΚΟΘ) Ένα από τα πιο συνηθισµένα προβλήµατα που ανακύπτουν στη στατιστική είναι ο προσδιορισµός της κατανοµής ενός µεγάλου αθροίσµατος ανεξάρτητων τµ Έστω Χ Χ Χ ανεξάρτητες τµ που ακολουθούν την ίδια κατανοµή (ισόνοµες τµ) µε Ε(Χ ) µ V( ) σ Είναι γνωστό ότι στην περίπτωση που Χ Χ Χ ~ N(µσ ) τότε ~ N( µ σ ) Το ερώτηµα που προκύπτει είναι το εξής: αν οι ανεξάρτητες και ισόνοµες Χ Χ Χ δεν ακολουθούν την κανονική κατανοµή αλλά κάποια άλλη κατανοµή (ίσως και άγνωστη) τότε ποια µπορεί να είναι προσεγγιστικά η κατανοµή του αθροίσµατος Χ +Χ ++Χ για µεγάλο ; Απάντηση σε αυτό το ερώτηµα δίνει το περίφηµο Κεντρικό Οριακό Θεώρηµα (ΚΟΘ) που καταδεικνύει τη σπουδαιότητα της κανονικής κατανοµής Εκτός από το θεωρητικό του ενδιαφέρον και τη σπουδαιότητά του το θεώρηµα αυτό παρέχει µία απλή µέθοδο για τον προσεγγιστικό υπολογισµό πιθανοτήτων που αφορούν αθροίσµατα από ανεξάρτητες τυχαίες µεταβλητές Θεώρηµα 3 (ΚΟΘ) Αν οι τµ Χ Χ Χ είναι ανεξάρτητες και ισόνοµες µε Ε(Χ ) µ V( ) σ < τότε η τµ Z µ σ ακολουθεί ασυµπτωτικά (για µεγάλο συνήθως µεγαλύτερο του 30) την τυπική κανονική κατανοµή Ν(0) Λέγοντας παραπάνω ότι η κατανοµή της τµ Ζ ακολουθεί ασυµπτωτικά τυπική κανονική εννοούµε ότι η σκ F Z της Ζ συγκλίνει στην σκ Φ της τυπικής κανονικής (δηλ F ( x) Φ( x) x R ) Z Παρατήρηση 3 Είµαστε τώρα σε θέση να απαντήσουµε στο ερώτηµα που τέθηκε πριν το ΚΟΘ Συγκεκριµένα το άθροισµα ανεξάρτητων και ισόνοµων τµ Χ +Χ + +Χ µε Ε(Χ )µ V( )σ < και αρκετά µεγάλο θα ακολουθεί προσεγγιστικά κανονική κατανοµή άσχετα µε το ποια είναι η κατανοµή των (κανονική η οποιαδήποτε άλλη) Πράγµατι από το ΚΟΘ ισχύει ότι για µεγάλο Z µ ~ N ( 0 ) σ και εποµένως η τµ Σ σ Z + µ θα ακολουθεί και αυτή κανονική κατανοµή µε µέση τιµή και διασπορά E( ) σ E( Z) + µ µ V ( ) V (σ Z + µ) σ V ( Z) Άρα τελικά για οποιεσδήποτε ανεξάρτητες και ισόνοµες τµ Χ (που ακολουθούν ο- ποιαδήποτε κατανοµή) σ Boutss MV (003) Σηµειώσεις Στατιστικής ΙΙΙ Τµήµα Οικονοµικής Επιστήµης Πανεπιστήµιο Πειραιώς 3

~ N( µ σ ) για µεγάλο Σύµφωνα λοιπόν µε το ΚΟΘ κάθε φυσική ποσότητα η τιµή της οποίας µπορεί να θεωρηθεί ότι διαµορφώνεται από ένα µεγάλο αριθµό ανεξάρτητων παραγόντων (δηλαδή µπορεί να γραφεί σαν άθροισµα ενός µεγάλου αριθµού ανεξάρτητων και ισόνοµων τµ) ακολουθεί προσεγγιστικά την κανονική κατανοµή Παρατήρηση 3 Η τµ καλείται δειγµατικός µέσος του δείγµατος Σύµφωνα µε το ΚΟΘ και ο δειγµατικός µέσος (που προέρχεται από παρατηρήσεις που ακολουθούν οποιαδήποτε κατανοµή) ακολουθεί ασυµπτωτικά κανονική κατανοµή Πράγµατι από το ΚΟΘ θα είναι σ Z N + µ~ ( µ σ ) για µεγάλο Ισοδύναµα µε το ΚΟΘ µπορούµε να γράψουµε ότι η τµ για µεγάλο µ µ µ ~ N( 0 ) σ σ σ Πόρισµα 3 Η διωνυµική κατανοµή B( p) προσεγγίζεται ικανοποιητικά από την κανονική κατανοµή Ν(p p(p)) όταν p(p) µεγάλο ( >0 ή καλύτερα >30) Απόδειξη Έστω ανεξάρτητες και ισόνοµες δίτιµες τµ Χ Χ Χ έτσι ώστε P( ) p P( 0) p Αν W + ++ τότε είναι φανερό ότι η W µπορεί να θεωρηθεί ως το πλήθος των επιτυχιών σε ανεξάρτητες δοκιµές η κάθε µία από τις οποίες έχει πιθανότητα επιτυχίας p και πιθανότητα αποτυχίας p (θεωρούµε το επιτυχία και το 0 αποτυχία) Εποµένως W~B(p) Από το ΚΟΘ όµως θα ισχύει επίσης ότι για µεγάλο W N( E( ) V ( )) και επειδή ~ E( ) 0P( 0) + P( ) p E( ) 0 P( 0) + P( ) p V ( ) E( ) E( ) p p p( p) έπεται ότι W ~ N( p p( p)) και τελικά θα είναι B( p) N( p p( p)) Με παρόµοιο τρόπο αποδεικνύεται και το επόµενο πόρισµα Πόρισµα 3 Η κατανοµή Posso µε µέση τιµή λ προσεγγίζεται ικανοποιητικά από την κανονική κατανοµή Ν(λλ) όταν λ µεγάλο (>0 ή καλύτερα >30) Άσκηση 3 Ο χρόνος ζωής µιας ηλεκτρονικής λυχνίας που κατασκευάζει µία βιοµηχανία είναι µία τµ Χ µε συνάρτηση κατανοµής λ x F ( x) e x> 0 Boutss MV (003) Σηµειώσεις Στατιστικής ΙΙΙ Τµήµα Οικονοµικής Επιστήµης Πανεπιστήµιο Πειραιώς 4

µε λ0005 ) Αν 49 λυχνίες χρησιµοποιηθούν διαδοχικά η µία µετά την άλλη να βρεθεί η πιθανότητα ο συνολικός χρόνος λειτουργίας των λυχνιών αυτών να ξεπερνά τις 7700 ώρες ) Ποια είναι η πιθανότητα ανάµεσα στις 49 αυτές λυχνίες το πολύ 4 να έχουν ζωή µικρότερη των 40 ωρών Λύση Έστω Χ Χ Χ 49 οι τµ που εκφράζουν τους χρόνους ζωής των 49 πρώτων λυχνιών Οι τµ Χ Χ είναι ανεξάρτητες και ισόνοµες Επειδή ακολουθούν εκθετική κατανοµή µε παράµετρο λ0005/00 έπεται ότι E ( ) 00 V ( ) 00 λ λ 49 Η τµ παριστά το συνολικό χρόνο λειτουργίας (σε ώρες) των 49 λυχνιών όταν αυτές χρησιµοποιηθούν διαδοχικά Σύµφωνα µε το ΚΟΘ θα ισχύει ότι (49>30) µε µεγάλη προσέγγιση Ζητείται η πιθανότητα Z 49 49 00 ~ N ( 0 ) 49 00 49 49 00 770049 00 P( > 7700) P( > ) PZ ( > 5 ) PZ ( 5 ) 7 00 7 00 49 Φ( 5) Φ(5) 0933 ) Αν Υ είναι το πλήθος των λυχνιών (από τις 49) µε ζωή µικρότερη των 40 ωρών τότε θα ισχύει ότι Y ~ B(ν 49 p P( 40)) Αυτό συµβαίνει διότι αν ως επιτυχία θεωρήσουµε το ενδεχόµενο 40 τότε η τµ Υ µπορεί να θεωρηθεί ως το πλήθος των επιτυχιών σε ν 49 ανεξάρτητες και ισόνοµες δοκιµές µε πιθανότητα επιτυχίας σε κάθε δοκιµή ίση µε P( 40) H πιθανότητα ανάµεσα στις 49 λυχνίες το πολύ 4 να έχουν ζωή µικρότερη των 40 ωρών είναι P(Y 4) Σε αυτό το σηµείο θα µπορούσαµε να χρησιµοποιήσουµε τον ακριβή τύπο: 4 ν v P( Y 4) p ( p) µε ν 49 p P( 40) 0 0 005 40 0 7 και P( 40) F( 40) e e 05 Παρατηρούµε όµως ότι είναι αρκετά δύσκολο να υπολογίσουµε το παραπάνω άθροισµα (ιδιαίτερα τους συνδυασµούς) και είναι προτιµότερο να χρησιµοποιήσουµε την προσέγγιση της διωνυµικής από την κανονική κατανοµή Συγκεκριµένα από το Πόρισµα γνωρίζουµε ότι B(νp) N(νpνp(p)) (νp(p) 49 05 5 > 0) Άρα προσεγγιστικά Z Y 49 p 49 p( p) Y Y 49 0 5 4 5 ~ N ( 0 ) 705 35 και συνεπώς η ζητούµενη πιθανότητα προσεγγιστικά θα είναι PY ( ) P( Y 4 5 44 5 4 ) P ( Z 3) Φ( 3) Φ(3) 09987 0003 35 35 (ο παραπάνω ακριβής τύπος µε την διωνυµική κατανοµή δίνει P(Y 4) 0009) Άσκηση 3 Έστω ότι εστιατόρια συναγωνίζονται για τους εργάτες ενός γειτονικού εργοστασίου Αν κάθε εργάτης εκλέγει για το γεύµα του τυχαία ένα από τα εστιατόρια αυτά να προσδιο- Boutss MV (003) Σηµειώσεις Στατιστικής ΙΙΙ Τµήµα Οικονοµικής Επιστήµης Πανεπιστήµιο Πειραιώς 5

ριστεί ο ελάχιστος αριθµός καθισµάτων που πρέπει να διαθέτει ένα εστιατόριο ώστε µε πιθανότητα τουλάχιστο 095 να είναι σε θέση να εξυπηρετήσει όλους τους πελάτες που έρχονται σε αυτό (500 5) Λύση Ας κάνουµε τη µελέτη µας για ένα συγκεκριµένο εστιατόριο έστω το ο Θεωρούµε τις τµ έτσι ώστε αν ο εργάτης εκλέγει το ο εστιατόριο και 0 αν ο εργάτης δεν εκλέγει το ο εστιατόριο Οι δίτιµες τµ είναι ανεξάρτητες και ισόνοµες µε P P E Vr ( ) ( 0) ( ) ( ) Το πλήθος των πελατών που εκλέγουν το ο εστιατόριο θα είναι ίσος µε Από το ΚΟΘ θα ισχύει όµως ότι E( ) / Z ~ N(0) V ( ) ( ) Σύµφωνα µε την εκφώνηση αν α είναι ο αριθµός καθισµάτων του εστιατορίου θα πρέπει ή ισοδύναµα και άρα θα πρέπει P( ) 095 P( Για 500 5 θα είναι / / ( ) ( ) ) 095 / PZ ( ( ) ) ( ) ( / 0 95 Φ 645 Φ ( ) ) Φ ( 645 ) / ( ) ( ) 645 + 645 ( ) 500 500 5 645 500 5 5 + 4 7 5 και εποµένως ο ελάχιστος αριθµός καθισµάτων που πρέπει να διαθέτει το ο εστιατόριο είναι 5 Προφανώς το ίδιο ισχύει και για τα υπόλοιπα εστιατόρια Άσκηση 33 Σε µία πόλη 4000 κατοίκων έστω ότι 0 άτοµα την ηµέρα κατά µέσο όρο χρειάζεται να εισαχθούν στο νοσοκοµείο Να υπολογιστεί (κατά προσέγγιση) ο µικρότερος αριθµός των ε- λεύθερων κρεβατιών που πρέπει να διαθέτει ηµερησίως το νοσοκοµείο για να είναι σε θέση να εξυπηρετεί την πόλη µε πιθανότητα τουλάχιστον 95% Λύση Έστω οι τµ έτσι ώστε αν ο κάτοικος χρειάζεται εισαγωγή (κάποια συγκεκριµένη ηµέρα) και 0 διαφορετικά (4000) Οι δίτιµες τµ είναι ανεξάρτητες και ισόνοµες µε Boutss MV (003) Σηµειώσεις Στατιστικής ΙΙΙ Τµήµα Οικονοµικής Επιστήµης Πανεπιστήµιο Πειραιώς 0 P( ) 0 005 P( 0) 0 9975 4000 ( ) 0005 V ( ) 0005 09975 0005 E Το πλήθος των κατοίκων που χρειάζεται κρεβάτι θα είναι ίσο µε Από το ΚΟΘ θα ισχύει ότι 6

E( ) 0 Z ~ N(0) V ( ) 0 Σύµφωνα µε την εκφώνηση αν α είναι ο αριθµός των κλινών του νοσοκοµείου θα πρέπει και 0 P( ) P( 0 095 ) 095 0 0 0 Φ( ) Φ( ) 0 645 645 0+ 645 0 5 0 0 Άρα ο µικρότερος αριθµός των ελεύθερων κρεβατιών που πρέπει να διαθέτει ηµερησίως το νοσοκοµείο είναι 6 Άσκηση 34 Μία εταιρία κινητής τηλεφωνίας έχει σε µία πόλη 0000 συνδροµητές Έχει βρεθεί ότι η πιθανότητα να χρησιµοποιήσει κάποιος το κινητό του τηλέφωνο (µία συγκεκριµένη ώρα της ηµέρας και κάτω από κανονικές συνθήκες) είναι 3% Να βρεθεί ο αριθµός των ελεύθερων γραµ- µών που πρέπει να διαθέτει το τηλεφωνικό κέντρο της εταιρίας ώστε το πολύ µία στις 00 κλήσεις να βρίσκει το δίκτυο κατειληµµένο Λύση Έστω οι τµ έτσι ώστε αν ο συνδροµητής χρησιµοποιεί το τηλέφωνό του (τη συγκεκριµένη ώρα) και 0 διαφορετικά (0000) Οι δίτιµες τµ είναι ανεξάρτητες και ισόνοµες µε P( ) 0 03 P( 0) 0 97 E ( ) 003 V ( ) 003 097 009 Το πλήθος των συνδροµητών που χρησιµοποιεί το τηλέφωνό του θα είναι ίσος µε Από το ΚΟΘ θα ισχύει ότι E( ) 300 Z ~ N(0) V ( ) 9 Έστω α ο αριθµός των ελεύθερων γραµµών που έχει το τηλεφωνικό κέντρο Σύµφωνα µε την εκφώνηση θα πρέπει η πιθανότητα να είναι το δίκτυο κατειληµµένο να είναι % ή ισοδύναµα και P( 300 > ) 00 P( ) P( 300 099 ) 099 9 9 300 Φ( ) Φ( ) 300 33 33 300+ 33 9 339 74 9 9 Άρα ο µικρότερος αριθµός ελεύθερων γραµµών που πρέπει να έχει το τηλεφωνικό κέντρο της ε- ταιρίας είναι 340 Άσκηση 35 Έστω ότι κάποιος θέλει να προσθέσει πραγµατικούς αριθµούς (µε αρκετά δεκαδικά ψηφία ο καθένας) Για συντοµία όµως δεν χρησιµοποιεί όλα τα ψηφία αλλά πριν κάνει την πρόσθεση τους στρογγυλοποιεί προς τον πλησιέστερο ακέραιο Ποια είναι η πιθανότητα το συνολικό σφάλµα (διαφορά πραγµατικού αθροίσµατος από το άθροισµα µετά τις στρογγυλοποιήσεις) να είναι µικρότερο του 0 εάν υποθέσουµε ότι τα σφάλµατα των στρογγυλοποιήσεων είναι ανεξάρτητα και ακολουθούν την οµοιόµορφη στο (05 05) κατανοµή ( 00) Boutss MV (003) Σηµειώσεις Στατιστικής ΙΙΙ Τµήµα Οικονοµικής Επιστήµης Πανεπιστήµιο Πειραιώς 7

Λύση Έστω Χ Χ Χ τα σφάλµατα των στρογγυλοποιήσεων Θα ισχύει ότι 05 05 (05 + 05) E ( ) 0 V ( ) Το συνολικό σφάλµα θα είναι ίσο µε Από το ΚΟΘ θα ισχύει ότι Ζητείται η πιθανότητα E( ) 0 Z ~ N(0) V ( ) 00 0 P( 0 < < 0) P ( < Z < ) Φ() Φ( ) Φ() 0 68 Ανισότητες Mrov Chebyshev Ας υποθέσουµε ότι γνωρίζουµε τη µέση τιµή Ε(Χ) µιας τυχαίας µεταβλητής και ίσως ακό- µη και τη διασπορά της V(Χ) Mπορούµε σε αυτή την περίπτωση να εξάγουµε κάποια συµπεράσµατα για την (άγνωστη) κατανοµή της; Ας δούµε στη συνέχεια δύο αποτελέσµατα που µας βοηθούν να βρούµε φράγµατα πιθανοτήτων όταν είναι γνωστή µόνο η Ε(Χ) ή οι Ε(Χ) V(Χ) της κατανοµής Πρόταση 3 (Ανισότητα Mrov) Αν Χ είναι µία θετική τµ (Χ 0) τότε για κάθε > 0 ισχύει ότι E( ) P( ) > 0 Απόδειξη Θα δώσουµε µία απόδειξη για τη συνεχή περίπτωση Έστω ότι η Χ έχει συνάρτηση πυκνότητας πιθανότητας f (επειδή Χ 0 θα είναι f (x) 0 για x < 0) Θα ισχύει ότι E( ) xf ( x) dx xf ( x) dx + xf ( x) dx xf ( x) dx 0 από το οποίο προκύπτει το ζητούµενο 0 Ως πόρισµα της παραπάνω ανισότητας έχουµε το ακόλουθο αποτέλεσµα f ( x) dx P( ) Πρόταση 3 (Ανισότητα Chebyshev) Αν Χ είναι µία τµ µε µέση τιµή µε(χ) και διασπορά V() τότε για κάθε ε > 0 V ( ) P( µ ε) ε Απόδειξη Η τµ Υ (Χµ) είναι θετική και εποµένως από την ανισότητα Mrov θα έχουµε ότι (θέτουµε ε ) E( Υ ) E(( Χ µ ) ) V ( Χ ) ) P(( Χ µ ) ε ) P ( Y ε ε ε ε από όπου προκύπτει το ζητούµενο παρατηρώντας ότι P (( Χ µ ) ε ) P( µ ε) Οι παραπάνω ανισότητες είναι αρκετά χρήσιµες στην περίπτωση που επιθυµούµε να κατασκευάσουµε φράγµατα για πιθανότητες µιας κατανοµής όταν είναι γνωστή µόνο η µέση τιµή ή µόνο η µέση τιµή και η διασπορά της κατανοµής αυτής Είναι προφανές ότι αν είναι γνωστή η κατανοµή (πχ είναι κανονική) τότε οι εν λόγω πιθανότητες µπορούν να υπολογιστούν ακριβώς Boutss MV (003) Σηµειώσεις Στατιστικής ΙΙΙ Τµήµα Οικονοµικής Επιστήµης Πανεπιστήµιο Πειραιώς 8

και δεν υπάρχει ανάγκη χρήσης των παραπάνω ανισοτήτων Ας δούµε τα παραπάνω µέσα από µία άσκηση Άσκηση 36 Γνωρίζουµε ότι το πλήθος Χ των µονάδων που κατασκευάζει ένα εργοστάσιο κατά τη διάρκεια µίας εβδοµάδας είναι µία τµ µε µέση τιµή 500 (α) Τι µπορούµε να πούµε για την πιθανότητα αυτή την εβδοµάδα η παραγωγή να είναι τουλάχιστον 000 µονάδες; (b) Αν επιπλέον γνωρίζουµε ότι η διασπορά της εβδοµαδιαίας παραγωγής Χ είναι 00 τότε τι µπορούµε να πούµε για την πιθανότητα αυτή την εβδοµάδα η παραγωγή να είναι µεταξύ 400 και 600 µονάδων Λύση (α) Από την ανισότητα Mrov προκύπτει ότι E( ) 500 P ( 000) 50% 000 000 (β) Από την ανισότητα Chebyshev θα είναι V ( ) P( 400 < < 600) P( 500 00) 99% 00 00 Η χρησιµότητα όµως των παραπάνω ανισοτήτων δεν εξαντλείται µόνο σε περιπτώσεις όπως αυτή της παραπάνω άσκησης Με τη βοήθεια της ανισότητας Chebyshev µπορούµε να αποδείξουµε ένα πολύ σηµαντικό οριακό θεώρηµα το γνωστό ως νόµο των µεγάλων αριθµών Το νόµο αυτό τον είχαµε επικαλεστεί και στο παρελθόν χωρίς να τον έχουµε διατυπώσει αυστηρά Πριν προχωρήσουµε ας θέσουµε έναν προβληµατισµό σχετικά µε την έννοια της «πιθανότητας» ενός ενδεχοµένου ή της «µέση τιµής» µιας τµ Τι καταλαβαίνουµε διαισθητικά ή τι εννοούµε πρακτικά όταν λέµε ότι η πιθανότητα ενός ενδεχοµένου Α είναι πχ 30% ή όταν λέµε ότι µία τµ Χ έχει µέση τιµή πχ 0; Συνήθως αυτό που έχουµε στο µυαλό µας είναι ότι αν εκτελεστεί το ίδιο πείραµα (που αφορά το Α) πάρα πολλές φορές τότε το ενδεχόµενο Α θα πραγµατοποιηθεί στο 30% των περιπτώσεων Αυτός όµως είναι στην ουσία ο ορισµός κατά τον Vo Mses της πιθανότητας ως οριακής σχετικής συχνότητας (βλ Κεφ Ι σηµειώσεις Στατ ΙΙ) Όµως η θεωρία την ο- ποία αναπτύσσουµε δεν βασίζεται στον ορισµό του Vo Mses αλλά στα αξιώµατα Kolmogorov τα οποία δεν κάνουν κανένα λόγο για συχνότητα εµφάνισης ενδεχοµένων Αυτό που πραγµατικά συµβαίνει είναι ότι ο κανόνας υπολογισµού της πιθανότητας ως ο- ριακής σχετικής συχνότητας από τον Vo Mses αποτελεί (και αυτός όπως και ο κατά Lplce ορισµός της πιθανότητας) πόρισµα των αξιωµάτων Kolmogorov Το αξιοσηµείωτο αυτό γεγονός καθώς και άλλα συµπεράσµατα που θα εξετάσουµε στη συνέχεια προκύπτουν το «νόµο των µεγάλων αριθµών» Θεώρηµα 3 (Νόµος µεγάλων αριθµών) Έστω Χ Χ µία ακολουθία ανεξάρτητων και ισόνο- µων τµ µε Ε( ) µ Τότε µε πιθανότητα Boutss MV (003) Σηµειώσεις Στατιστικής ΙΙΙ Τµήµα Οικονοµικής Επιστήµης Πανεπιστήµιο Πειραιώς + + + µ όταν Απόδειξη (Για απλότητα θα αποδείξουµε το παραπάνω χρησιµοποιώντας τη λεγόµενη «ασθενή» σύγκλιση και θεωρώντας επιπλέον ότι V( ) σ < ) Από την ανισότητα Chebyshev για την τµ θα ισχύει ότι αλλά V ( ) P( µ ε) για κάθε ε > 0 ε 9

και άρα τελικά σ V ( ) V ( ) V ( ) V ( ) σ σ P ( µ ε) 0 για κάθε ε > 0 ε Άρα τελικά P ( µ ε < < µ + ε) για κάθε ε > 0 Με άλλα λόγια οσοδήποτε µικρή περιοχή γύρω από το µ και αν θεωρήσουµε το θα ανήκει σε αυτήν για µεγάλο µε πιθανότητα «σχεδόν» Με απλά λόγια αν εκτελέσουµε το ίδιο τυχαίο πείραµα φορές και Χ είναι η τµ που εκφράζει το αποτέλεσµα του -πειράµατος τότε σύµφωνα µε το νόµο των µεγάλων αριθµών ο µέσος όρος των Χ συγκλίνει στη µέση τιµή Ε(Χ ) όταν Έτσι όταν λέµε ότι µία κατανο- µή µε σκ F έχει µέση τιµή µ υπονοούµε ότι ο µέσος όρος ενός µεγάλου δείγµατος από την κατανοµή αυτή (µέσος όρος ανεξάρτητων τµ Χ Χ Χ ~ F) θα συγκλίνει στο µ Έστω τώρα ότι έχουµε έναν µεγάλο (θεωρητικά άπειρο) πληθυσµό (του οποίου εξετάζου- µε ένα χαρακτηριστικό) και επιλέγουµε από αυτόν τυχαία άτοµα µε χαρακτηριστικά Χ Χ Χ Σύµφωνα µε το νόµο των µεγάλων αριθµών ο µέσος του δείγµατος θα συγκλίνει (για µεγάλο ) στη µέση τιµή µ Ε(Χ ) Θεωρητικά αν επιλέξουµε όλο τον πληθυσµό (δηλ ) τότε ο µέσος του πληθυσµού θα είναι ίσος µε µ Ε(Χ ) Για το λόγο αυτό η µέση τιµή Ε(Χ ) µερικές φορές καλείται και πληθυσµιακή µέση τιµή (η µέση τιµή του χαρακτηριστικού σε «ολόκληρο» τον πληθυσµό) Αντίθετα η καλείται δειγµατική µέση τιµή (η µέση τιµή του χαρακτηριστικού στο τυχαίο δείγµα) Ας δούµε τώρα πως προκύπτει ο ορισµός κατά Vo Mses της πιθανότητας από το νόµο των µεγάλων αριθµών Έστω Ω ο δειγµατικός χώρος ενός πειράµατος τύχης και Α ένα ενδεχόµενο υποσύνολο του Ω Αν θεωρήσουµε ότι το πείραµα αυτό επαναλαµβάνεται φορές (ανεξάρτητες µεταξύ τους) και θέσουµε Χ ή 0 ανάλογα µε το αν στο -πείραµα πραγµατοποιηθεί το Α ή όχι τότε από το νόµο των µεγάλων αριθµών θα ισχύει ότι E( ) για Αλλά το εκφράζει το πλήθος των πραγµατοποιήσεων του Α στα πειράµατα δια Συνεπώς εκφράζει τη σχετική συχνότητα εµφάνισης του Α στα πειράµατα Επίσης ισχύει ότι E( ) 0 P( 0) + P( ) P( ) P( A) και εποµένως η παραπάνω σχέση στην ουσία εκφράζει το γεγονός ότι η οριακή σχετική συχνότητα εµφάνισης του Α συγκλίνει στην πιθανότητα του Α Boutss MV (003) Σηµειώσεις Στατιστικής ΙΙΙ Τµήµα Οικονοµικής Επιστήµης Πανεπιστήµιο Πειραιώς 30