5 ιατήµατα Εµπιτούνης Στο προηγούµενο κεφάλαιο αχοληθήκαµε εκτενώς µε την εκτίµηη των παραµέτρων διαφόρων κατανοµών Για παράδειγµα είδαµε ότι η καλύτερη εκτιµήτρια για την εκτίµηη της µέης τιµής ενός κανονικού πληθυµού N(µ είναι η εδοµένου λοιπόν ενός τδ Χ Χ Χ από Ν(µ πχ ωµατικά βάρη 0 φοιτητών (ε kgr: 73 8 84 77 7 75 7 76 63 69 85 77 7 8 7 76 79 68 7 7 µπορούµε να εκτιµήουµε το µέο βάρος των φοιτητών της χολής: 7455 (73+8+84+77+7+75+7+76+63+6+85+77+7+8+7+76+79+68+7+7 0 Άρα εκτιµούµε ότι το µέο βάρος µ των φοιτητών («πληθυµιακό» βάρος είναι 7455 kgr («δειγµατικό» βάρος Εκτιµήεις αυτής της µορφής καλούνται ηµειακές εκτιµήεις διότι εκτι- µούµε την άγνωτη παράµετρο µίας κατανοµής µέω κάποιου ηµείου (εδώ το 7455 το οποίο θεωρητικά πρέπει να είναι «κοντά» την παράµετρο µε «µεγάλη» πιθανότητα (ύµφωνα µε τα όα γνωρίζουµε αν πάρουµε αρκετά δείγµατα τότε τα αντίτοιχα που θα υπολογίζουµε θα παίρνουν τιµές «κοντά» και «γύρω» από το µ µε «µεγάλη» πιθανότητα Όλες οι εκτιµήεις που µελετήαµε το προηγούµενο κεφάλαιο ήταν προφανώς ηµειακές Η εκτίµηη µίας παραµέτρου θ ή µίας παραµετρικής υνάρτηης g(θ γίνονταν µε τη βοήθεια µίας εκτιµήτριας υνάρτηης (τυχαίας µεταβλητής T( που βάει ενός τδ προφέρει µία ηµειακή εκτίµηη του g(θ Η ηµειακή όµως εκτίµηη αν και µας δίνει µία τιµή T( (ένα ηµείο που πρέπει να είναι κοντά την υπό εκτίµηη υνάρτηη g(θ δεν µας δίνει καµία ιδέα για την ακρίβεια ή το φάλµα της εκτίµηης Στο παράδειγµα που αναφέραµε παραπάνω είδαµε ότι βάει του υγκεκριµένου δείγµατος που πήραµε µία εκτίµηη του µέου βάρους είναι το 7455 Πόο κοντά όµως το πραγµατικό πληθυµιακό βάρος µ είναι αυτή η τιµή; Πόο πιθανό είναι πχ το µ να α- πέχει από το περιότερα από 5 kgr; Θα ήταν υνεπώς προτιµότερο αν µπορούαµε να πούµε ότι βάει του υγκεκριµένου τυχαίου δείγµατος το µ βρίκεται µε κάποια «πιθανότητα» µεταξύ δύο τιµών (πχ 7 kgr < µ < 78 kgr µε υντελετή εµπιτούνης 95% Έτι για παράδειγµα θα µπορούαµε να πούµε µε κάποια βεβαιότητα ότι το πραγµατικό πληθυµιακό βάρος δεν µπορεί να είναι µικρότερο πχ των 7 kgr Ένα τέτοιο διάτηµα µέα το οποίο βρίκεται η υπό εκτίµηη παράµετρος µε µεγάλη πιθανότητα καλείται διάτηµα εµπιτούνης Πιο υγκεκριµένα έχουµε τον επόµενο οριµό Οριµός 5 Έτω ένα τυχαίο δείγµα Χ Χ Χ από µία κατανοµή µε π ή ππ f(x;θ και g(θ µία παραµετρική υνάρτηη που θέλουµε να εκτιµήουµε Έτω επίης δύο τατιτικές υναρτήεις L( L( και U ( U( Το τυχαίο διάτηµα L( U( ] καλείται διάτηµα εµπιτούνης (δε για την παραµετρική υνάρτηη g(θ ε επίπεδο ηµαντικότητας α αν ιχύει ότι Boutsks MV (003 Σηµειώεις Στατιτικής ΙΙΙ Τµήµα Οικονοµικής Επιτήµης Πανεπιτήµιο Πειραιώς P( g(θ L( U ( ] P( L( g(θ U ( (πχ α% 5% ή 0% Αν η τελευταία χέη ιχύει ως ιότητα τότε το α θα καλείται υντελετής εµπιτούνης Εποµένως αν δεδοµένου ενός τδ Χ Χ Χ βρούµε τατιτικές υναρτήεις L(Χ και U(Χ όπως παραπάνω τότε µπορούµε να πούµε ότι η παραµετρική υνάρτηη την οποία επιθυ- µούµε να εκτιµήουµε βρίκεται µέα το διάτηµα L(Χ U(Χ] µε πιθανότητα (τουλάχιτον 53
α Αν δηλαδή παίρναµε πάρα πολλά δείγµατα και υπολογίζαµε κάθε φορά το L(Χ U(Χ] τότε θεωρητικά το g(θ θα βρικόταν µέα ε τουλάχιτον 00(α% των διατηµάτων αυτών Σχη- µατικά: δε από ο δείγµα δε από ο δείγµα κοκ δε από k-οτό δείγµα L( g(θ U( Στη υνέχεια θα επικεντρώουµε το ενδιαφέρον µας ε διατήµατα εµπιτούνης για παραµέτρους κανονικών πληθυµών αφού ως γνωτό η υνηθέτερη κατανοµή που υναντάται τις εφαρµογές (λόγω και του ΚΟΘ είναι η κανονική α ιάτηµα εµπιτούνης για το µέο κανονικής κατανοµής όταν γνωτό Έτω Χ Χ Χ από Ν(µ µε γνωτό Ζητάµε να βρούµε ένα διάτηµα µέα το οποίο βρίκεται το µ µε πιθανότητα α Επειδή ο δειγµατικός µέος είναι µία αµερόληπτη εκτιµήτρια του µ θα αναζητήουµε ένα διάτηµα της µορφής d + d] Σύµφωνα µε τα παραπάνω το d θα πρέπει να είναι τέτοιο ώτε να ιχύει P( µ d + d] P( d µ + d Είναι γνωτό ότι ο δειγµατικός µέος προερχόµενος από κανονικό δείγµα είναι κανονικός (κάθε γραµµική υνάρτηη ανεξάρτητων τµ από την κανονική κατανοµή ακολουθεί κανονική κατανοµή Και επειδή ως γνωτό ιχύει ότι E( µ Vr( ~ N( µ ή ιοδύναµα Z Εποµένως το d θα πρέπει να είναι τέτοιο ώτε P( d µ + d P( d µ d µ ~ N ( 0 / Boutsks MV (003 Σηµειώεις Στατιτικής ΙΙΙ Τµήµα Οικονοµικής Επιτήµης Πανεπιτήµιο Πειραιώς 54
d µ d d d P( P( Z / / / / / d d d d Φ( Φ( Φ( + Φ( / / / / d Φ( / / Εποµένως αν Φ - είναι η αντίτροφη υνάρτηη της Φ (η Φ ως γνήια αύξουα υνάρτηη είναι - και άρα αντιτρέφεται θα ιχύει ότι d - Φ d Φ - ( / ( / / Εποµένως ένα δε για το µ υντελετού α θα είναι το d + d] Φ - ( + Φ - ( ] Αξίζει να παρατηρήουµε ότι το παραπάνω δε εξακολουθεί να ιχύει και την περίπτωη που τα προέρχονται από οποιονδήποτε πληθυµό (όχι απαραίτητα κανονικό υπό την προϋπόθεη ότι το είναι χετικά µεγάλο (από το ΚΟΘ βλ και Ακ 57 Παράδειγµα (υνέχεια Ένα διάτηµα εµπιτούνης υντελετού α95% για το µέο βάρος των φοιτητών το παραπάνω παράδειγµα θα είναι (0 7455 και πχ γνωρίζουµε ότι 5 5 74 55 ( 005 74 55 ( 005 Φ - 5 + Φ - ] 0 0 Από πίνακες της τυπικής κανονικής κατανοµής βρίκουµε ότι Φ - ( 005 / Φ - ( 0 975 96 (δηλαδή Φ( 96 0 975 και εποµένως το παραπάνω διάτηµα θα είναι ίο µε το 5 5 7455 967455 + 96] 7455 97455 + 9] 7367674] 0 0 Μπορούµε λοιπόν να πούµε ότι ύµφωνα µε το τυχαίο δείγµα που πήραµε και δεδοµένου ότι 5 το µέο βάρος των φοιτητών βρίκεται µεταξύ του 736 και 7674 µε υντελετή εµπιτούνης 95% Αξίζει ε αυτό το ηµείο να παρατηρήουµε ότι την παραπάνω άκηη αλλά και ε ό- ες ακολουθούν χρηιµοποιούµε εκφράεις της µορφής: «το µ βρίκεται µεταξύ του 736 και 7674 µε υντελετή εµπιτούνης 95%» υποδηλώνοντας ότι αν παίρναµε ένα µεγάλο πλήθος από δείγµατα και για το καθένα κατακευάζαµε ένα δε για το µ τότε θα αναµέναµε ότι το 95% των δε θα υµπεριλάµβανε το µ Επειδή τη υνέχεια θα υναντάµε υχνά ποότητες της µορφής F - ( όπου F είναι µία υνάρτηη κατανοµής (πχ Φ - ( / θα χρηιµοποιούµε ειδικό υµβολιµό Πιο υγκεκριµένα έχουµε τον επόµενο οριµό Οριµός 5 Έτω µία τµ µε κ F Άνω α-ηµείο της κατανοµής µε κ F καλείται το η- µείο h για το οποίο ιχύει ότι P( > h Boutsks MV (003 Σηµειώεις Στατιτικής ΙΙΙ Τµήµα Οικονοµικής Επιτήµης Πανεπιτήµιο Πειραιώς 55
ή ιοδύναµα Fh ( h F ( και εποµένως το άνω α-ηµείο µιας κατανοµής F θα είναι το F ( Το άνω α-ηµείο της τυπικής κανονικής κατανοµής υνήθως υµβολίζεται µε Ζ α Φ ( Επειδή ως γνωτό η κ της τυπικής κανονικής Φ δεν δίνεται από κάποιο εύκολα αντιτρέψιµο τύπο για την εύρεη άνω α-ηµείων της Ν(0 θα χρηιµοποιούµε κατάλληλους πίνακες ή πχ τον πίνακα της αθροιτικής υνάρτηης κατανοµής Φ Μερικές τιµές του Z για υνήθη α είναι: α 00 005 005 0005 Ζ α 8 645 96 58 Για να δούµε χηµατικά ποιο είναι το άνω α-ηµείο µιας κατανοµής παίρνουµε το γράφηµα της υνάρτηης πυκνότητας πιθανότητας αυτής της κατανοµής Έτω ότι έχουµε τυπική κανονική κατανοµή Το άνω α-ηµείο Z θα βρίκεται τον άξονα των x έτι ώτε το εµβαδόν κάτω από τη ππ από το Z έως το άπειρο να είναι ίο µε α: 05 04 03 0 0-4 - 0 4 Z Είτε από το παραπάνω χήµα είτε από τη γνωτή χέη Φ(xΦ(x αποδεικνύεται εύκολα ότι Z - Z Πράγµατι αν Χ ~ Ν(0 - P( > Z Φ( Z Φ( Z Φ(Φ ( και εποµένως το Z είναι το α-ηµείο της τυπικής κανονικής εδοµένου λοιπόν ενός τδ Χ Χ Χ ~ Ν(µ ένα δε υντελετού α για το µέο µ (όταν γνωτό θα είναι το / / ] Z Z + Παρατηρούµε ότι η γνώη του είναι προαπαιτούµενη διότι η τιµή της είναι αναγκαία για τον υπολογιµό των άκρων του διατήµατος Επίης παρατηρούµε ότι όο το δείγµα µεγαλώνει τόο το εύρος του διατήµατος µικραίνει (τενεύει δηλαδή έχουµε καλύτερη εκτίµηη του µ Τέλος αν αυξήουµε το υντελετή εµπιτούνης (θέλουµε πχ να έχουµε αφαλέτερη πρόβλεψη τότε το εύρος του δε αυξάνεται Αναφερόµενοι το αρχικό παράδειγµα µε την εκτίµηη του µέου βάρους αν πάρουµε ως α99% τότε το δε για το µέο βάρος θα είναι: / / ] ] Z Z Z Z + 5 + 5 74 55 0005 74 55 0005 0 0 x Boutsks MV (003 Σηµειώεις Στατιτικής ΙΙΙ Τµήµα Οικονοµικής Επιτήµης Πανεπιτήµιο Πειραιώς 56
5 74 55 + ] ] 0 587455 5 58 766 7734 0 Το νέο δε είναι ευρύτερο από το 7 36 76 74 ] που είχαµε βρει για ε α95% Αυτό υµβαίνει διότι µε το ίδιο δείγµα θέλουµε να έχουµε ένα αφαλέτερο άνω και κάτω όριο για το µ Για να ελαττωθεί λοιπόν η πιθανότητα το µ να µην βρίκεται εντός των ορίων του δε αυτό που γίνεται είναι ότι αυξάνεται το εύρος του δε Γενική µέθοδος κατακευής διατηµάτων εµπιτούνης: Στην προηγούµενη παράγραφο είδαµε πως κατακευάζουµε ένα δε για το µέο µ µιας Ν(µ όταν γνωτό Πως όµως µπορούµε γενικά να κατακευάουµε ένα δε για µία παρα- µετρική υνάρτηη g(θ από οποιονδήποτε πληθυµό; Έτω Χ Χ Χ ένα τδ από την F(x;θ Μία γενική µέθοδος κατακευής δε υντελετού α για το g(θ είναι η ακόλουθη: Βρίκουµε µία τατιτική υνάρτηη Τ( της οποίας η κατανοµή να εξαρτάται από το θ Συνήθως ως Τ εκλέγουµε µία εκτιµήτρια του θ ή του g(θ Κατακευάζουµε υνάρτηη Υ h(τ g(θ η κατανοµή της οποίας να µην εξαρτάται από το θ 3 Υπολογίζουµε δύο ταθερές c c έτι ώτε να ιχύει P(c Y c 4 Εφόον έχουν βρεθεί τα c c λύνουµε τη χέη c Y h(τ g(θ c ως προς g(θ Έτι προκύπτει µία ανιότητα της µορφής L L( g(θ U( U Το παραπάνω ενδεχόµενο θα έχει και αυτό πιθανότητα α και εποµένως το διάτηµα (L U θα είναι ένα δε για το g(θ υντελετού α Tα c c υνήθως επιλέγονται έτι ώτε P(Y > c P(Y < c α/ ηλαδή το c είναι το άνω α/-ηµείο της κατανοµής της Υ ενώ το c είναι το άνω α/-ηµείο της ίδιας κατανοµής 05 04 N(0 03 / 0 / 0 Z / Z / -4 0 4 Ας δούµε τη υνέχεια πως µπορούµε να βρούµε δε για τις παραµέτρους κανονικών πληθυµών β ιάτηµα εµπιτούνης για τη διαπορά κανονικής κατανοµής όταν µ γνωτό Έτω Χ Χ Χ από Ν(µ µε µ γνωτό Ζητάµε να βρούµε ένα διάτηµα µέα το οποίο βρίκεται x Boutsks MV (003 Σηµειώεις Στατιτικής ΙΙΙ Τµήµα Οικονοµικής Επιτήµης Πανεπιτήµιο Πειραιώς 57
το µε πιθανότητα α Θα ακολουθήουµε τη γενική µεθοδολογία που περιγράφεται παραπάνω για την κατακευή ενός δε Εφόον το µ είναι γνωτό θα χρηιµοποιήουµε την εκτιµήτρια του : T ( µ Παρατηρούµε ότι η υνάρτηη T ht µ ( ( ~ χ ακολουθεί χ κατανοµή µε βαθµούς ελευθερίας η οποία δεν εξαρτάται από το 3 Υπολογίζουµε τις ταθερές c c έτι ώτε T Pc ( c Σύµφωνα µε παραπάνω παρατήρηη επιλέγουµε τα c c έτι ώτε Εποµένως P( T c P T > / ( < c / c χ ( / c χ ( / όπου µε χ ( υµβολίζουµε το άνω α-ηµείο της κατανοµής χι-τετράγωνο µε βαθµούς ελευθερίας (τα άνω α-ηµεία της χ είναι πινακοποιηµένα για διάφορες τιµές των α και Για >00 µπορούµε προεγγιτικά να πάρουµε ότι χ ( + Z Z - Z βλ Άκ 53 4 Βρήκαµε λοιπόν ότι T P( χ ( / χ ( / και λύνοντας ως προς θα έχουµε ότι και εποµένως το T T P( χ ( / χ ( / ( µ ( µ χ ( / χ ( / ] είναι ένα δε υντελετού α για το όταν το µ είναι γνωτό Παράδειγµα (υνέχεια Ένα διάτηµα εµπιτούνης υντελετού α95% για τη διαπορά του βάρους των φοιτητών το παραπάνω παράδειγµα (δεδοµένου ότι το µέο βάρος µ75 θα είναι ( µ ( µ ] χ ( 0 05 χ ( 0 975 Boutsks MV (003 Σηµειώεις Στατιτικής ΙΙΙ Τµήµα Οικονοµικής Επιτήµης Πανεπιτήµιο Πειραιώς 58
Αρκεί να υπολογίουµε το άθροιµα χ ( 0 05 χ ( 0 975 Θα έχουµε ότι 0 0 και χ µ ( µ και να βρούµε από πίνακες τις τιµές των ( (7375 +(875 +(8475 + +(775 60 ( 0 05 347 χ ( 0 975 9 59 Άρα 0 0 ( µ ( µ 60 60 ] ] χ (005 χ (0975 347 959 759667] Μπορούµε λοιπόν να πούµε ότι ύµφωνα µε το τυχαίο δείγµα που πήραµε και δεδοµένου ότι µ75 η διαπορά του βάρους των φοιτητών βρίκεται µεταξύ του 759 και 667 µε υντελετή εµπιτούνης 95% Μπορούµε ιοδύναµα να πούµε ότι η τυπική απόκλιη του βάρους των φοιτητών θα είναι µεταξύ του 49 και του 79 µε υντελετή εµπιτούνης 95% γ ιάτηµα εµπιτούνης για τη διαπορά κανονικής κατανοµής όταν µ άγνωτο Έτω Χ Χ Χ από Ν(µ µε µ άγνωτο Ζητάµε να βρούµε ένα διάτηµα µέα το οποίο βρίκεται το µε πιθανότητα α Ακολουθώντας τα ίδια ακριβώς βήµατα µε την προηγούµενη παράγραφο (εύρεη δε για το µε µ γνωτό και χρηιµοποιώντας τη αντί της Σ ( µ προκύπτει ότι το 0 ( ( χ ( / χ ( / ] είναι ένα δε υντελετού α για το όταν το µ είναι άγνωτο Παράδειγµα (υνέχεια Χρηιµοποιώντας και πάλι το παράδειγµα µε το βάρος των φοιτητών θα έχουµε ότι ένα δε υντελετού α95% για τη διαπορά του βάρους των φοιτητών θα είναι ( ( ] χ ( 0 05 χ ( 0 975 Αρκεί να υπολογίουµε το άθροιµα χ ( 0 05 χ ( 0 975 Θα έχουµε ότι 9 9 και χ ( και να βρούµε από πίνακες τις τιµές των ( (737455 +(87455 + +(77455 59695 ( 0 05 3 85 χ ( 0 975 8 9 Άρα 9 9 ( ( χ ( 0 05 χ ( 0 975 9 596 95 596 95 ] ] 87 70 00] 3 85 89 9 Μπορούµε λοιπόν να πούµε ότι ύµφωνα µε το τυχαίο δείγµα που πήραµε η διαπορά του βάρους των φοιτητών βρίκεται µεταξύ του 87 και 70 µε υντελετή εµπιτούνης 95% Μπορούµε ιοδύναµα να πούµε ότι η τυπική απόκλιη του βάρους των φοιτητών θα είναι µεταξύ του 87 46 και του 70 836 µε υντελετή εµπιτούνης 95% δ ιάτηµα εµπιτούνης για το µέο µ κανονικής κατανοµής όταν άγνωτο Έτω Χ Χ Χ από Ν(µ µε άγνωτο Ζητάµε να βρούµε ένα διάτηµα µέα το οποίο βρίκεται το µ µε πιθανότητα α Θα ακολουθήουµε τη γενική µεθοδολογία που περιγράφεται παραπάνω για τη κατακευή ενός δε Boutsks MV (003 Σηµειώεις Στατιτικής ΙΙΙ Τµήµα Οικονοµικής Επιτήµης Πανεπιτήµιο Πειραιώς 59
Θα χρηιµοποιήουµε και πάλι την εκτιµήτρια του µ Θα πρέπει να βρούµε µία υνάρτηη των και µ έτω h ( µ της οποίας η κατανο- µή να µην εξαρτάται από το µ Αν όµως χρηιµοποιήουµε την µ / που την ουία χρηιµοποιήαµε την παράγραφο (α (δε για µ όταν γνωτό θα φτάουµε ε ένα δε του οποίου τα άκρα εξαρτώνται από το Κάτι τέτοιο όµως δεν θα ήταν αποδεκτό αφού τη υγκεκριµένη περίπτωη θεωρούµε ότι το είναι άγνωτο και άρα δεν θα µπορούα- µε να υπολογίουµε τα άκρα του δε Αντί λοιπόν του τον παραπάνω τύπο θα χρηιµοποιήουµε µία εκτιµήτριά του και υγκεκριµένα το Έτι λοιπόν θεωρούµε τη υνάρτηη T µ / Θα πρέπει όµως πριν προχωρήουµε να προδιορίουµε την κατανοµή της παραπάνω τµ Αυτή γράφεται ιοδύναµα και ως εξής: µ T / µ / Αποδεικνύεται ότι ο δειγµατικός µέος και η δειγµατική διαπορά ενός κανονικού δείγµατος είναι ανεξάρτητες τµ και εποµένως και οι τµ που εµφανίζονται το πηλίκο µ και ( / είναι ανεξάρτητες ως υναρτήεις ανεξάρτητων τµ Η πρώτη τµ µπορεί πολύ εύκολα να δειχθεί ότι ακολουθεί κατανοµή Ν(0 Επίης η δεύτερη τµ ύµφωνα µε παραπάνω πρόταη ακολουθεί κατανοµή χ - Εποµένως εδώ έχουµε µία νέα κατανοµή η οποία προέρχεται είναι το πηλίκο δύο ανεξάρτητων τµ που ακολουθούν γνωτές κατανοµές: µιας N(0 δια τη ρίζα µιας χ - προς τους βαθµούς ελευθερίας της Η νέα αυτή κατανοµή έχει µελετηθεί και πινακοποιηθεί για διάφορες τιµές του Καλείται κατανοµή του tudet ή κατανοµή t και υµβολίζεται µε t - (κατανοµή t µε βαθµούς ελευθερίας ηλαδή χηµατικά: T µ / N χ - Η ππ της νέας αυτής κατανοµής δίνεται παρακάτω για διάφορες τιµές της παραµέτρου : ( 0 t Boutsks MV (003 Σηµειώεις Στατιτικής ΙΙΙ Τµήµα Οικονοµικής Επιτήµης Πανεπιτήµιο Πειραιώς 60
t 00 04 03 ππ κατανοµής t για 4000 t 4 0 t 0-3 - - 3 Παρατηρούµε ότι η κατανοµή αυτή είναι υµµετρική (αντίθετα από την χ για µικρές τιµές του και µοιάζει αρκετά µε την N(0 Αποδεικνύεται µάλιτα ότι για µεγάλες τιµές του (>30 η t υµπίπτει µε την Ν(0 (βλ Άκηη 53 παρακάτω Άρα χωρίς να χρηιµοποιήουµε το έχουµε τελικά ότι T µ ~ t / ενώ η κατανοµή αυτή δεν εξαρτάται από το µ Προχωράµε λοιπόν το επόµενο βήµα για την κατακευή δε για το µ 3 Υπολογίζουµε τις ταθερές c c έτι ώτε µ Pc ( c / ή ύµφωνα µε παραπάνω παρατήρηη έτι ώτε από βρίκουµε ότι P µ ( / c P µ > / ( < c / / c t ( / c t ( / t ( / (λόγω υµµετρικότητας της t κατανοµής όπου µε t ( υµβολίζουµε το άνω α-ηµείο της κατανοµής t µε βαθµούς ελευθερίας (τα άνω α-ηµεία της κατανοµής t είναι πινακοποιηµένα για διάφορες τιµές των α και Για >30 µπορούµε προεγγιτικά να πάρουµε ότι t ( Z 4 Βρήκαµε λοιπόν ότι µ P( t( / t( / / και λύνοντας ως προς µ θα έχουµε ότι και εποµένως το P t ( t ( / µ + ( / Boutsks MV (003 Σηµειώεις Στατιτικής ΙΙΙ Τµήµα Οικονοµικής Επιτήµης Πανεπιτήµιο Πειραιώς 6
( / ( / ] t t + είναι ένα δε υντελετού α για το µ όταν το είναι άγνωτο Σηµειώνεται ότι αν το δείγµα είναι αρκετά µεγάλο (πχ >30 τότε t ( Z και το παραπάνω διάτηµα είναι χεδόν ίο µε το / / ] Z Z + Αξίζει και εδώ να παρατηρήουµε ότι το παραπάνω δε εξακολουθεί να ιχύει και την περίπτωη που τα προέρχονται από οποιονδήποτε πληθυµό (όχι απαραίτητα κανονικό υπό την προϋπόθεη ότι το είναι χετικά µεγάλο (από το ΚΟΘ βλ και Ακ 57 Παράδειγµα (υνέχεια Αναφερόµενοι για άλλη µια φορά το παράδειγµα µε το βάρος των φοιτητών προκύπτει ότι ένα δε υντελετού α95% για το µέο βάρος µ θα είναι t 9 ( 0 05 + t 9 ( 0 05] 0 0 Σηµειώνεται ότι τώρα δεν είναι απαραίτητη η ακριβής γνώη της τιµής του Αρκεί λοιπόν να υπολογίουµε το άθροιµα και να βρούµε από πίνακες την τιµή του t 9 ( 005 Θα έχουµε ότι ( 9 ((737455 +(87455 + +(77455 34 (ή εναλλακτικά ( ((73 + + 7 0 7455 3 4 9 και t 9 (005 093 Άρα το παραπάνω δε θα είναι της µορφής 34 34 7455 0937455 + 093] 79777] 0 0 Μπορούµε λοιπόν να πούµε ότι ύµφωνα µε το τυχαίο δείγµα που πήραµε το µέο βάρος των φοιτητών της χολής βρίκεται µεταξύ του 79 και του 777 µε υντελετή εµπιτούνης 95% Άκηη 5 Θέλοντας να εκτιµήουµε τη µέη τιµή µ του λίτρου της βενζίνης τα πρατήρια των Αθηνών επικεφτήκαµε τυχαία 0 βενζινάδικα από όπου καταγράψαµε τις τιµές (ε δρχ: 803 88 785 83 900 849 844 798 9 867 α Να δώετε ένα δε υντελετού 95% για τη µέη τιµή µ του λίτρου της βενζίνης τα πρατήρια του λεκανοπεδίου Ποίο θα ήταν το αντίτοιχο δε αν ήταν γνωτό ότι 4; β Να δώετε δε υντελετού 95% για τη διαπορά και την τυπική απόκλιη της τιµής το λεκανοπέδιο Ποίο θα ήταν το αντίτοιχο δε αν ήταν γνωτό ότι µ80; (Υποθέτε ότι οι τιµές της βενζίνης τα διάφορα πρατήρια ακολουθούν κανονική κατανοµή Λύη Από τις παραπάνω 0 παρατηρήεις βρίκουµε ότι 0 (803+88+785+83+900+849+844+798+9+867846 και ( ((803846 +(88846 + +(867846 7587 9 Boutsks MV (003 Σηµειώεις Στατιτικής ΙΙΙ Τµήµα Οικονοµικής Επιτήµης Πανεπιτήµιο Πειραιώς 6
(ή εναλλακτικά ( ((803 + + 86 0 846 7 587 9 α Το δείγµα είναι χετικά µικρό και για αυτό θα χρηιµοποιήουµε την κατανοµή t Ένα δε υντελετού 95% µια το µ όταν το είναι άγνωτο θα είναι 758 ( / + t ( / ] 846 6846 + 0 t 86876] 758 6] 0 όπου α95% και t 9 (005 6 Στην περίπτωη που είναι γνωτό ότι 4 θα έχουµε το δε 95% για το µ: / / ] ] ] Z Z 4 4 + 84 6 + 0 96 84 6 96 868 86 64 0 β Ένα δε για το όταν µ άγνωτο είναι ( ( ( / ( / ] ( ( ( χ χ χ 0 05 χ ( 0 975 ] 9 7 587 9 7 587 ] 8 3 58 609 ] 9 0 70 Επίης ένα δε για το θα είναι το 9 9 8 3 58 609] 88 7 65] Στην περίπτωη που είναι γνωτό ότι µ80 θα έχουµε το δε 95% για το : Υπολογίζουµε ότι ( µ ( µ ] χ ( / χ ( / ( µ ((80380 +(8880 + +(86780 333 (ή εναλλακτικά ( µ ( + ( µ 9 758 + 0 (846 80 333 και επειδή χ0( 0 05 0 48 χ0( 0 975 35 θα έχουµε τελικά τα δε 95% για το και για το αντίτοιχα: 333 333 ] 67093] και 67 093] 40009] 048 35 Άκηη 5 Έτω ότι επιθυµούµε να εκτιµήουµε το µέο χρόνο που κάνει ένα τρένο του Μετρό για να µεταβεί από το ταθµό Α το ταθµό Β Χρονοµετρώντας τη διαδροµή αυτή 0 φορές ηµειώνουµε τους χρόνους (ε secods 357 337 35 357 350 35 360 353 377 37 α Να δοθεί ένα δε υντελετού 99% για το µέο χρόνο µετάβαης β Να δοθεί ένα δε υντελετού 99% για την τυπική απόκλιη του χρόνου µετάβαης (Υποθέτε ότι οι χρόνοι είναι κανονικοί Λύη Από τις παραπάνω 0 παρατηρήεις βρίκουµε ότι (357 + 337 +35 + 357 + 350 + 35 + 360 + 353 + 377 + 37 3566 0 Boutsks MV (003 Σηµειώεις Στατιτικής ΙΙΙ Τµήµα Οικονοµικής Επιτήµης Πανεπιτήµιο Πειραιώς 63
και ((3573566 +(3373566 + +(373566 87 9 α Το δείγµα είναι χετικά µικρό και για αυτό θα χρηιµοποιήουµε την κατανοµή t Ένα δε υντελετού 99% µια το µ θα είναι ( / ( / ] ] t t 8 7 8 7 + 356 6 350 356 6+ 350 0 0 344 9 368 ] 5m 45sec 6m8 sec] όπου α99% και t 9 (0005 350 β Ένα δε για το όταν µ άγνωτο είναι ( ( ( / ( / ]( ( ( χ χ χ 0 005 χ ( 0 995 ] 9 8 7 9 8 7 ] 490 669 59 ] 359 73 9 Εποµένως ένα δε για το υντελετού 99% θα είναι το 490 669 59] 7 587 ] 9 Άκηη 53 Αποδείξτε ότι χ ( + Z για µεγάλες τιµές του Λύη Γνωρίζουµε ότι αν οι τµ Υ Υ Υ ακολουθούν τυπική Ν(0 κανονική κατανοµή τότε η τµ Y Y ακολουθεί κατανοµή χι-τετράγωνο µε βαθµούς ελευθερίας (από οριµό Θέτοντας Y γνωρίζουµε από το ΚΟΘ ότι για µεγάλα ιχύει ~ χ E( ~ N(0 V ( Επειδή οι τµ Y ακολουθούν χ κατανοµή (βλ παραπάνω πρόταη και η µέη τιµή και διαπορά µιας χ k είναι k και k αντίτοιχα θα έχουµε ότι για µεγάλα Y Z ~ N ( 0 Άρα αυµπτωτικά ιχύει ότι χ N ( Το γεγονός αυτό µπορεί να επαληθευτεί και από το γράφηµα της ππ της κατανοµής χ που παρουιάζεται το προηγούµενο κεφάλαιο Στο γράφηµα αυτό παρατηρούµε ότι για >30 η ππ της χ υµπίπτει µε την ππ µιας κανονικής κατανοµής Το άνω α-ηµείο χ ( ορίζεται ύµφωνα µε τα παραπάνω ώτε: Για µεγάλο η παραπάνω ιοδυναµεί µε P( Y > χ ( P( Y Y χ ( > χ ( P( > χ ( P( Z > Boutsks MV (003 Σηµειώεις Στατιτικής ΙΙΙ Τµήµα Οικονοµικής Επιτήµης Πανεπιτήµιο Πειραιώς 64
χ ( Z χ ( + Z Άκηη 54 Έτω ότι θέλουµε να εκτιµήουµε το µέο χρόνο ζωής των αρρένων κατοίκων µιας υγκεκριµένης περιοχής Για το κοπό αυτό ελήφθη τδ µεγέθους 00 ανδρών Βρέθηκε ότι 00 00 39596 97765 Υποθέτοντας ότι οι χρόνοι ζωής είναι κανονικοί α Να βρείτε ένα δε υντελετού 95% για το µέο χρόνο ζωής και β Να βρείτε ένα δε υντελετού 95% για την τυπική απόκλιη του χρόνου ζωής των ανδρών της περιοχής Λύη Πριν προχωρήουµε θα πρέπει να υπολογίουµε τις εκτιµήτριες και Για το δειγµατικό µέο θα ιχύει ότι 00 00 00 3959 6 69798 ενώ για τη δειγµατική διαπορά θα έχουµε + ( ( ( + ( + ( ( 97765 00 69 798 4 63 99 α Σύµφωνα µε τα παραπάνω ένα δε υντελετού 95% για το µ θα είναι ( / ( / ] t t 463 463 + 69798 t 99(00569798 + t99(005] 00 00 Επειδή το µέγεθος του δείγµατος είναι αρκετά µεγάλο (>30 προκύπτει ότι t 99 ( 0 05 Ζ 005 96 και άρα τελικά το παραπάνω δε υντελετού 95% για το µέο χρόνο ζωής θα είναι: 69 798 4 63 ] ] 00 96 69 798+ 4 63 96 697 7033 00 β Ένα δε για το όταν µ άγνωτο είναι ( ( χ ( / χ ( / ] Επειδή το µέγεθος του δείγµατος είναι αρκετά µεγάλο (>00 είναι γνωτό ότι χ ( + Z και εποµένως ένα δε για το όταν το είναι µεγάλο θα είναι το ( ( + ( Z / ( ( + ( Z / ] + Z / Z / (χρηιµοποιήαµε και ότι Z - Z και αντικαθιτώντας θα έχουµε τελικά το δε ] Boutsks MV (003 Σηµειώεις Στατιτικής ΙΙΙ Τµήµα Οικονοµικής Επιτήµης Πανεπιτήµιο Πειραιώς 65
4 63 + 99 96 Τέλος ένα δε για το υντελετού 95% θα είναι το 4 63 ] 8 0] 99 96 8 0] 349 4 6] Άκηη 55 Έτω ότι θέλουµε να κατακευάουµε δε υντελετού α για το µέο µ κανονικής κατανοµής α Να βρείτε το ελάχιτο µέγεθος του δείγµατος που πρέπει να πάρουµε ώτε το δε να έχει πλάτος το πολύ c (το είναι γνωτό Να γίνει εφαρµογή για α 99% c0 β Να βρείτε το ελάχιτο ώτε το δε να έχει πλάτος το πολύ (α99% γ Αν το (α το είναι άγνωτο εκτιµήτε το µέγεθος του δείγµατος που πρέπει να πάρουµε χρηιµοποιώντας ένα αρχικό βοηθητικό δείγµα µεγέθους (υποθ ότι : µεγάλο Λύη α Το δε υντελετού α για το µέο µ όταν το είναι γνωτό είναι της µορφής / / ] Z Z + Ζητάµε το µέγεθος του δείγµατος που πρέπει να πάρουµε ώτε το εύρος του παραπάνω διατή- µατος είναι το πολύ c δηλαδή Z c / και εποµένως θα πρέπει 4 c Z / Αντικαθιτώντας όπου α99% και c0 θα πρέπει 4 4 Z 58 66 56 0 0 005 00 Άρα τελικά 663 β Λαµβάνοντας c το πρώτο ερώτηµα θα έχουµε άµεα ότι 4 Z/ 4Z/ Άρα για α99% θα έχουµε ότι 458 66 και άρα 7 γ Από το (α είδαµε ότι το µέγεθος του δείγµατος που πρέπει να πάρουµε ώτε το δε να έχει πλάτος c είναι c Z 0 4 / Ζητείται η εκτίµηη της παραπάνω ποότητας η οποία µπορεί να θεωρηθεί ως µία παραµετρική υνάρτηη g( του (άγνωτου Θα χρηιµοποιήουµε αντί του την εµπ του Για το κοπό αυτό θα χρηιµοποιήουµε ύµφωνα µε υπόδειξη της εκφώνηης ένα αρχικό βοηθητικό δείγµα µεγέθους Γνωρίζουµε ότι η εµπ της διαποράς κανονικού δείγµατος µεγέθους είναι η Boutsks MV (003 Σηµειώεις Στατιτικής ΙΙΙ Τµήµα Οικονοµικής Επιτήµης Πανεπιτήµιο Πειραιώς 66
( και από την Πρόταη 48 (αναλλοίωτου της εµπ θα έχουµε ότι η εµπ του 0 g( είναι 0 g 4Z / 4Z / ( g( 4 Z / c c c Αξίζει εδώ να επιηµάνουµε ότι ε ανάλογες περιπτώεις όπου είναι αναγκατική η εκλογή ενός αρχικού δείγµατος µεγέθους λαµβάνουµε το χετικά µικρό ώτε το τελικό 0 να είναι µεγαλύτερο του αρχικού Συνήθως αφού εκτιµήουµε το 0 παίρνουµε ακόµη δείγµα µεγέθους 0 και χρηιµοποιώντας και το αρχικό δείγµα µεγέθους χηµατίζουµε το τελικό δείγµα µεγέθους 0 Άκηη 56 Μία εταιρία υκευαίας ενός προϊόντος (πχ ζάχαρης ή chps επιθυµεί να εκτιµήει το µέο βάρος της υκευαίας ενός οριµένου τύπου (πχ υκευαία που αναγράφει ότι περιέχει 00γρ η οποία εξέρχεται από την παραγωγική διαδικαία Για να µπορέει η εταιρία αξιόπιτα να κρίνει αν η παραγωγή γίνεται ορθά επιθυµεί να εκτιµήει το µέο βάρος έχοντας ακρίβεια δέκατου του γραµµαρίου µε υντελετή εµπιτούνης 95% Λαµβάνοντας ένα αρχικό (βοηθητικό δείγµα µεγέθους 00 (και βρίκοντας να βρεθεί µία ηµειακή εκτίµηη και ένα δε 90% για το τελικό µέγεθος του δείγµατος που πρέπει να ληφθεί (υποθ ότι τα βάρη κατανέµονται κανονικά Λύη Από την Άκηη 55 γνωρίζουµε ότι το µέγεθος του δείγµατος που πρέπει να πάρουµε είναι 4 c Z / όπου εδώ το εύρος c 0 και α 005 Η διαπορά του βάρους τις υκευαίες είναι άγνωτη Οπότε ύµφωνα και µε υπόδειξη της εκφώνηης λαµβάνουµε αρχικό δείγµα µεγέθους από όπου βρίκουµε δειγµατική διαπορά Μία ηµειακή εκτίµηη για το (ύµφωνα και µε την Άκηη 55 θα είναι 4 Z / 4 96 6906 c 0 Οπότε πρέπει να πάρουµε ακόµη δείγµα περίπου 690600 6800 υκευαιών Γνωρίζουµε ότι ένα δε υντελετού α 90% για το βάει του αρχικού δείγµατος µεγέθους είναι Αναζητούµε ένα δε υντελετού α για το Επειδή PL ( U θα έχουµε ότι ( ( / ( ( / ] LU χ χ ] c Z / 4 P L c Z c Z U ( c Z 4 / 4 / 4 / Boutsks MV (003 Σηµειώεις Στατιτικής ΙΙΙ Τµήµα Οικονοµικής Επιτήµης Πανεπιτήµιο Πειραιώς 67
και εποµένως ένα δε υντελετού α90% (α0 για το θα είναι L U 4Z / ( 4Z / ( 4 Z / 4 / ] ] Z c c c χ ( / c χ ( / ( χ ( / χ ( ( / ] 6906 99 434 99 6906 7793 ] 54988773] Άρα τελικά για να έχουµε µία εκτίµηη του µέου βάρους κάθε υκευαίας ακρίβειας δέκατου του γραµµαρίου µε υντελετή εµπιτούνης 95% θα πρέπει ύµφωνα µε το βοηθητικό δείγµα που ελήφθη να εκλέξουµε τελικό δείγµα µεγέθους περίπου 6906 υκευαιών Επιπλέον µπορούµε να πούµε ότι το τελικό µέγεθος του δείγµατος δεν µπορεί να είναι µικρότερο από 5498 η µεγαλύτερο του 8773 µε υντελετή εµπιτούνης 90% Άκηη 57 Έτω Χ Χ Χ τδ από µία άγνωτη κατανοµή µε µέο µ και διαπορά εδο- µένου ότι το µέγεθος του δείγµατος είναι αρκετά µεγάλο να κατακευάετε προεγγιτικό δε για το µ υντελετού α Λύη Παρατηρούµε ότι εδώ το τδ δεν είναι απαραίτητα κανονικό και για αυτό δεν µπορούµε να χρηιµοποιήουµε απευθείας το γνωτό δε για το µέο κανονικής κατανοµής όταν το είναι γνωτό Μπορούµε όµως µέω του ΚΟΘ να χρηιµοποιήουµε κανονική προέγγιη και να φτάουµε ε παρόµοιο δε Πράγµατι από το ΚΟΘ θα ιχύει ότι µ µ ~ N ( 0 / και εποµένως µ P( Z / Z / / Άρα ένα προεγγιτικό δε υντ α για το µ όταν το είναι γνωτό θα είναι και πάλι το Z / + Z / ] Τέλος την περίπτωη που το είναι άγνωτο υποθέτοντας ότι (η είναι υνεπής ε- κτιµήτρια του και άρα για προκύπτει το (προεγγιτικό δε για το µ υντελετού α ε διάτηµα εµπιτούνης για ποοτό p Z / + Z / ] Έτω ότι θέλουµε να κατακευάουµε δε για το ποοτό p ενός πληθυµού που έχει κάποιο χαρακτηριτικό Αν πάρουµε ένα τδ Χ Χ Χ από αυτόν τον πληθυµό και θέουµε Χ αν το -άτοµο του δείγµατος έχει το προς εξέταη χαρακτηριτικό και Χ 0 διαφορετικά τότε ως γνωτό οι παρατηρήεις θα ακολουθούν διωνυµική κατανοµή Β(νp Ειδικότερα x x P( p P( 0 p ή ιοδύναµα P( x p ( p x 0 Γνωρίζουµε ότι το δειγµατικό ποοτό ή δειγµατικός µέος αποτελεί µία υνεπή εκτιµήτρια του p (αποδεικνύεται ότι είναι και αµερόληπτη εκτιµήτρια ελαχίτης διαποράς Επίης από το ΚΟΘ υµπεραίνουµε ότι για µεγάλο (>30 Boutsks MV (003 Σηµειώεις Στατιτικής ΙΙΙ Τµήµα Οικονοµικής Επιτήµης Πανεπιτήµιο Πειραιώς 68
E( E( p ~ N(0 V ( V ( / p( p / Άρα έχουµε βρει µία υγκεκριµένα την της οποίας η κατανοµή εξαρτάται από το p και επίης έχουµε βρει µία υνάρτηη αυτής h( p ( p/ p( p/ της οποίας η κατανοµή δεν εξαρτάται από το p Σύµφωνα µε τη γενική µέθοδο κατακευής δε αρκεί το επόµενο βήµα να βρούµε ταθερές c c τέτοιες ώτε P( c p c p( p/ Είναι εύκολο να δούµε όπως και την περίπτωη (α ότι για µεγάλο P( Z p Z p( p/ / / και αν λύουµε ως προς p την παραπάνω διπλή ανιότητα προκύπτει ένα δε υντελετού α για το p της µορφής Z Z / / Z / / Z / ( / Z / ( / + + 4 4 + ] Z / Z / Z / Z / + + + + το οποίο επειδή έχουµε εξαρχής υποθέει ότι το είναι µεγάλο και άρα Z / / 0 θα είναι χεδόν ίο µε το ( ( Z/ + Z/ ] Εξάλλου το παραπάνω δε προκύπτει και αν θεωρήουµε ότι για µεγάλο ιχύει ότι ( p( p και άρα από την παραπάνω αρχική ανιότητα p Z/ Z/ p( p/ θα παίρναµε ότι ( p( p p( p ( Z Z p + Z + Z / / / / Η παραπάνω παραδοχή γίνεται πάντα αποδεκτή την πράξη για αρκετά µεγάλα δείγµατα ( 00 ενώ για µέτρια δείγµατα (30<<00 µπορούµε αν θέλουµε να ακολουθήουµε µία πιο υντηρητική διαδικαία και να πάρουµε δε µε επίπεδο ηµαντικότητας α αντί υντελετού α (δηλαδή η πιθανότητα το p να ανήκει το δε να είναι τουλάχιτον α αντί να είναι ίη µε α Αυτό γίνεται εύκολα λαµβάνοντας ως δε το µεγαλύτερο διάτηµα Z/ / ] Z + 4 4 Πράγµατι το παραπάνω δε περιέχει πάντα το Z p( p p( p Z/ + Z/ ] Boutsks MV (003 Σηµειώεις Στατιτικής ΙΙΙ Τµήµα Οικονοµικής Επιτήµης Πανεπιτήµιο Πειραιώς 69
διότι αποδεικνύεται εύκολα ότι p( p / 4 για p 0] Άρα τελικά ως δε για το p υντελετού α έχοντας δείγµα >30 θα θεωρούµε το ( ( Z/ + Z/ ] εκτός από την περίπτωη κατά την οποία 30<<00 και δεν µας πειράζει να πάρουµε ένα πιο «µεγάλο» δε προκειµένου να διαφαλίουµε ότι αυτό θα έχει υντελετή εµπιτούνης ίγουρα µεγαλύτερο του α (και όχι προεγγιτικά ίο µε α όπως το παραπάνω Σε αυτή τη δεύτερη περίπτωη ως δε για το p ε επίπεδο ηµαντικότητας α θα θεωρούµε το Z/ / ] Z + 4 4 Άκηη 58 Έτω ότι ένα µεγάλο κόµµα θέλει να εκτιµήει το ποοτό p των ψηφοφόρων µιας µεγάλης πόλης που προτίθενται να το ψηφίουν τις επερχόµενες βουλευτικές εκλογές Το αντίτοιχο ποοτό ε ένα τυχαίο δείγµα 500 ψηφοφόρων βρέθηκε ίο µε 40% α Μεταξύ ποίων ορίων βρίκεται το πραγµατικό ποοτό p µε υντελετή εµπιτούνης 95%; β Αν η πόλη έχει m 000000 ψηφοφόρους να δώετε δε 95% για τον αριθµό των ψήφων που θα λάβει το κόµµα γ Πόο περίπου παραπάνω δείγµα πρέπει να πάρουµε για να έχουµε δε 95% εύρους % Λύη α Έτω Χ Χ Χ οι απαντήεις των 500 ψηφοφόρων του τδ ώτε Χ αν o - ψηφοφόρος προτίθεται να ψηφίει το υγκεκριµένο κόµµα και Χ διαφορετικά Προφανώς το τδ Χ Χ Χ προέρχεται από Β(p κατανοµή (P( p P( 0p Ζητάµε δε υντελετού 95% για το p To δε ύµφωνα µε τα παραπάνω θα είναι: ( ( Z/ + Z/ ] 04 0406 + ] ] 500 96 04 0406 96 0 357 0 443 500 Άρα το πραγµατικό ποοτό p βρίκεται µεταξύ του 357% και του 443% µε υντελετή εµπιτούνης 95% β Ο αριθµός των ψήφων του κόµµατος θα είναι m p και εποµένως ζητάµε δε 95% για το m p Γνωρίζουµε ότι ( ( P( L p U όπου L Z / U + Z / και εποµένως P( ml mp mu Άρα ένα δε 95% για τον αριθµό των ψήφων του κόµ- µατος θα είναι το m L U ] 000000 03570443] 357000443000] γ Το εύρος του διατήµατος το (α είναι ίο µε 443%357% 86% Έτω ότι για να γίνει ίο µε % πρέπει να πάρουµε δείγµα µεγέθους Έτω επίης το αντίτοιχο δειγµατικό ποοτό από το δείγµα αυτό Θα πρέπει να ιχύει ότι ή ιοδύναµα ( Z / 00 ( 4 Z 00 / Boutsks MV (003 Σηµειώεις Στατιτικής ΙΙΙ Τµήµα Οικονοµικής Επιτήµης Πανεπιτήµιο Πειραιώς 70
και αν υποθέουµε ότι θα βρούµε και πάλι περίπου ίο µε 40% θα έχουµε τελικά ότι 04 ( 04 4 00 96 90 Άρα θα πρέπει να πάρουµε παραπάνω δείγµα περίπου 90500870 ψηφοφόρων Άκηη 59 Ένα ποοτό της παραγωγής ηλεκτρικών λαµπτήρων ενός εργοταίου είναι ελαττωµατικό Για την εκτίµηη του άγνωτου αυτού ποοτού λαµβάνεται δείγµα από 00 λυχνίες από τις οποίες οι βρέθηκαν ελαττωµατικές α Να βρεθεί δε εντός του οποίου µε υντελετή εµπιτούνης 95% θα περιέχεται το πραγµατικό ποοτό ελαττωµατικών του πληθυµού β Πόο περίπου δείγµα πρέπει να πάρουµε ώτε να έχουµε δε 99% εύρους 3%; Λύη Έτω Χ Χ Χ το τδ µεγέθους 00 λαµπτήρων ώτε Χ αν ο -λαµπτήρας είναι ελαττωµατικός και Χ 0 διαφορετικά Το τδ Χ Χ Χ προέρχεται από Β(p κατανοµή (P( p P( 0p Σύµφωνα µε την εκφώνηη βρέθηκε ότι 0 00 Το δε υντελετού 95% για το p θα είναι: ( ( Z + Z / / ] 0 088 0 088 0 960 + 96] 00560837] 00 00 δηλαδή το ποοτό ελαττωµατικών λαµπτήρων της παραγωγής βρίκεται µεταξύ του 56% και του 84% µε υντελετή εµπιτούνης 95% γ Έτω ότι για να πάρουµε δε υντελετού και εύρους 3% πρέπει να πάρουµε δείγ- µα µεγέθους Έτω επίης το αντίτοιχο δειγµατικό ποοτό από το δείγµα αυτό Θα πρέπει να ιχύει ότι + ( Z Z ( / / ( Z / 003 ή ιοδύναµα ( 4 Z / 003 και υποθέτοντας ότι θα βρούµε και πάλι περίπου ίο µε 0 θα έχουµε τελικά ότι (α% 0 ( 0 4 003 58 34 Άρα θα πρέπει να πάρουµε δείγµα περίπου 34 λυχνιών Άκηη 50 Σε µία έρευνα απαχολήεως επιθυµούµε να προδιορίουµε το ποοτό των α- νέργων p κατά τρόπο ώτε η εκτίµηή µας να αποκλίνει του πραγµατικού ποοτού λιγότερο του 0% αυτού µε πιθανότητα 95% (Στην τελευταία απογραφή είχε βρεθεί ποοτό ανέργων 5% Πόο περίπου είναι το απαιτούµενο µέγεθος δείγµατος; Boutsks MV (003 Σηµειώεις Στατιτικής ΙΙΙ Τµήµα Οικονοµικής Επιτήµης Πανεπιτήµιο Πειραιώς 7
Λύη Αν είναι το απαιτούµενο µέγεθος του δείγµατος και το αντίτοιχο δειγµατικό ποοτό θα πρέπει να ιχύει P( p 0 p 095 Γνωρίζουµε όµως ότι για µεγάλο δείγµα ιχύει ότι p ~ p( p/ N ( 0 και εποµένως P( p 0 p 095 P( 0 p p 0 p 095 P( 0 p p p( p/ p( p/ 0p p( p / Z 005 / 0 p 095 p( p/ p( p p 005 Z005 Z005 96 7300 0 p 0 p 0 005 τ ιάτηµα εµπιτούνης για τη διαφορά των µέων δύο ανεξάρτητων κανονικών πληθυµών Έτω και YY Y δύο ανεξάρτητα δείγµατα από Ν(µ και Ν(µ αντίτοιχα Ζητάµε δε υντελετού α για τη διαφορά των µέων µ µ ιατήµατα αυτής της µορφής χρηιµοποιούνται υνήθως για τη ύγκριη των δύο µέων Θα εξετάουµε αρχικά την περίπτωη που οι διαπορές είναι γνωτές Θα χρηιµοποιήουµε τους δειγµατικούς µέους και Y των δειγµάτων και YY Y αντίτοιχα Είναι γνωτό ότι ~ N( µ και Y~ N( µ και οι τµ και Y είναι ανεξάρτητες διότι προέρχονται από ανεξάρτητα µεταξύ τους τδ Συνεπώς ύµφωνα µε την Πρόταη 3 η τµ Y θα ακολουθεί και αυτή κανονική κατανοµή µε µέη τιµή Ε( Y Ε( Ε(Y µ µ και διαπορά V ( Y V ( + ( Y V ( + V ( Y V ( + ( V ( Y V ( + V ( Y + Εποµένως από την Πρόταη Y ( µ µ ~ N ( 0 + Άρα όµοια και µε τις προηγούµενες περιπτώεις P( Z Y ( µ µ Z + / / και υνεπώς λύνοντας ως προς µ µ βρίκουµε ότι το Boutsks MV (003 Σηµειώεις Στατιτικής ΙΙΙ Τµήµα Οικονοµικής Επιτήµης Πανεπιτήµιο Πειραιώς 7
/ / ( Y + Z ( Y + + Z ] είναι δε υντελετού α για τη διαφορά µ µ όταν τα είναι γνωτά Στην περίπτωη τώρα που τα είναι άγνωτα αλλά ία δηλαδή προχωράµε ακολουθώντας τα ίδια βήµατα µε παραπάνω και άρα Επίης αν ότι και Y ( µ µ ~ N ( 0 + είναι οι δειγµατικές διαπορές από τα δύο δείγµατα τότε διαπιτώνουµε ( + ( ~ χ + (το άθροιµα ανεξάρτητων χι-τετράγωνο κατανοµών µε βε και b αντίτοιχα ακολουθεί και αυτό χι-τετράγωνο κατανοµή µε βε + b βλ ιδιότητες της κατανοµής Γάµµα Κεφ 4 Επειδή όπως έχουµε ήδη αναφέρει και παραπάνω οι δειγµατικοί µέοι και οι δειγµατικές διαπορές από κανονικά δείγµατα είναι ανεξάρτητες µεταξύ τους τµ θα έχουµε τελικά ότι ( Y ( (µ µ + + ( + και όµοια και µε την παράγραφο (δ βρίκουµε ότι ~ t + ( N(0 χ + + Y (µ µ P( t + ( / t + ( / ( + ( + + και τελικά λύνοντας ως προς µ µ βρίκουµε ότι το ( (( ( ( (( ( ( ( / ( + + + + Y t Y + t ( / ] ( + + ( + + είναι δε υντελετού α για τη διαφορά µ µ όταν τα είναι άγνωτα αλλά ία Συνήθως θα υποθέτουµε ότι οι διαπορές των προς εξέταη πληθυµών είναι ίες εκτός εάν υπάρχει αφής ένδειξη για το αντίθετο Άκηη 5 Έτω µ και µ οι µέοι χρόνοι εξυπηρέτηης των πελατών από δύο ταµίες µιας τράπεζας Αν 34 99 34 74 88 07 73 7 και 05 94 77 33 59 50 67 7 69 66 είναι δειγµατοληπτικά κάποιοι χρόνοι (ε sec εξυπηρέτηης των δύο αυτών υπαλλήλων αντίτοιχα να βρείτε δε υντελετού 95% για τη διαφορά µ µ υποθέτοντας ότι οι χρόνοι εξυπηρέτηης είναι κανονικοί Ν(µ και Ν(µ µε 40 sec Με βάη το υγκεκριµένο δε µπορούµε να πούµε ότι οι δύο υπάλληλοι έχουν διαφορετική απόδοη; Boutsks MV (003 Σηµειώεις Στατιτικής ΙΙΙ Τµήµα Οικονοµικής Επιτήµης Πανεπιτήµιο Πειραιώς 73
Λύη Από την παραπάνω παράγραφο έχουµε ότι το δε υντελετού α για τη διαφορά µ µ είναι / / ( Y + Z ( Y + + Z ] Οι αντίτοιχοι δειγµατικοί µέοι από τα δύο παραπάνω δείγµατα υπολογίζονται 7 65 και Y 34 7 και υνεπώς το παραπάνω δε θα είναι ίο µε ( 7 6534 7 40 + 96 ( 7 65 34 7 + 40 + 96 ] 8 0 8 0 073 75 ] Παρατηρούµε ότι η πραγµατική διαφορά βρίκεται µεταξύ του 073 και του 75 µε υντελετή εµπιτούνης 95% Εποµένως µ µ >073 µε υντελετή εµπιτούνης 95% και άρα µπορούµε να πούµε ότι οι δύο υπάλληλοι έχουν διαφορετική απόδοη µε «βεβαιότητα» ή υντελετή εµπιτούνης τουλάχιτον 95% Μάλιτα ο πρώτος υπάλληλος φαίνεται να έχει µικρότερη απόδοη από το δεύτερο Άκηη 5 Έτω µ η µέη τιµή πώληης ενός προϊόντος ε µία περιοχή Α και µ η µέη τιµή πώληης του ίδιου προϊόντος ε µία περιοχή Β Η µέη τιµή και η διαπορά ενός τδ 0 τιµών πώληης από την περιοχή Α βρέθηκε 009 και 876667 αντίτοιχα Επίης η µέη τιµή και η διαπορά ενός τδ 0 τιµών πώληης από την περιοχή Β βρέθηκε 0445 και 9974 αντίτοιχα Αν υποθέουµε ότι οι τιµές κατανέµονται κανονικά και µε ίη (αλλά άγνωτη διαπορά και τις δύο περιοχές να βρείτε δε υντελετού 95% για τη διαφορά µ µ Μπορούµε µε βάη το δε να πούµε ότι η µέη τιµή πώληης την περιοχή Α είναι διαφορετική από την αντίτοιχη την περιοχή Β; Λύη Είναι γνωτό ότι ένα δε υντελετού α για τη διαφορά µ µ όταν οι διαπορές των δύο πληθυµών είναι άγνωτες αλλά ίες είναι ( (( ( ( (( ( ( ( / ( + + + + Y t Y + t ( / ] ( + + ( + + Αρκεί να βρούµε το t + ( / t ( 0 05 048 και άρα το δε θα είναι 8 ( 0+ 0( 9876 + 999 ( ( 00 904 45 048 00 9 04 45 + 048] 0 0( 0+ 0 355 705 355 + 705] 6 55 0845 ] ( 0+ 0( 9 8 76+ 9 99 0 0( 0+ 0 Μπορούµε τελικά να πούµε ότι η µέη τιµή πώληης την περιοχή Α είναι διαφορετική και µάλιτα χαµηλότερη από τη µέη τιµή πώληης την περιοχή Β µε υντελετή εµπιτούνης τουλάχιτον 95% ζ ιάτηµα εµπιτούνης για το λόγο των διαπορών δύο ανεξάρτητων κανονικών πληθυµών Έτω και YY Y δύο ανεξάρτητα δείγµατα από Ν(µ και Ν(µ αντίτοιχα Ζητάµε δε υντελετού α για το πηλίκο / ιατήµατα αυτής της µορφής χρηιµοποιούνται υνήθως για τη ύγκριη των δύο διαπορών Θα εξετάουµε αρχικά την περίπτωη που οι µέες τιµές µ και µ είναι γνωτές Όπως είναι αναµενόµενο θα χρηιµοποιήουµε τις εκτιµήτριες των διαπορών Boutsks MV (003 Σηµειώεις Στατιτικής ΙΙΙ Τµήµα Οικονοµικής Επιτήµης Πανεπιτήµιο Πειραιώς 74
T ( µ και T ( Y µ αντί των δειγµατικών διαπορών γνωτά Είναι γνωτό ότι διότι την περίπτωη που εξετάζουµε τα µ και µ είναι T ~ χ και T ~ χ και οι τµ T και T είναι ανεξάρτητες διότι προέρχονται από ανεξάρτητα µεταξύ τους τδ Σχηµατίζουµε τη νέα τµ T / T T T / η οποία γράφεται ως το πηλίκο δύο ανεξάρτητων χι-τετράγωνο κατανοµών διαιρεµένων δια τους βαθµούς ελευθερίας τους Η νέα αυτή κατανοµή ονοµάζεται κατανοµή edecor ή κατανοµή F µε και βε Σχηµατικά: T T χ ~ χ / / F Η κατανοµή edecor έχει µελετηθεί και έχουν πινακοποιηθεί τα άνω α-ηµεία της F ( για διάφορες τιµές του α και των βε και Η ππ της κατανοµής αυτής έχει την ακόλουθη µορφή για υγκεκριµένες τιµές των : f (x 5 F 0 05 F 30 F 00 F 000 Boutsks MV (003 Σηµειώεις Στατιτικής ΙΙΙ Τµήµα Οικονοµικής Επιτήµης Πανεπιτήµιο Πειραιώς 05 5 5 Αποδεικνύεται επίης ότι F F ( / ( και F t ( ( ( Όµοια µε τις προηγούµενες παραγράφους καταλήγουµε το ότι T PF ( ( F ( T και υνεπώς λύνοντας ως προς / ένα δε υντελετού α για το πηλίκο / όταν µ και µ είναι γνωτά θα είναι το ( Y µ ( Y µ F ( F ( ] ( µ ( µ 75 Στην περίπτωη τώρα που τα µ µ είναι άγνωτα ακολουθώντας τα ίδια βήµατα µε παραπάνω (χρηιµοποιώντας τις εκτιµήτριες αντί των Τ Τ προκύπτει ότι το x
( ( ( ( Y Y ( ( ( F Y Y ( ( F είναι ένα δε υντελετού α για το πηλίκο ( ( ] F F / όταν µ και µ είναι άγνωτα Άκηη 53 Στην Άκηη 5 που αφορούε τις τιµές πώληης ενός προϊόντος ε δύο περιοχές Α και Β υποθέαµε ότι οι διαπορές και των τιµών τις περιοχές αυτές είναι ίες Βρείτε ένα δε υντελετού 95% για το πηλίκο / Μπορούµε να πούµε µε υντελετή εµπιτούνης 95% ότι οι διαπορές αυτές είναι άνιες; Λύη Γνωρίζουµε ότι το δε υντελετού α για το πηλίκο / είναι ( ( ] F F Από πίνακες των άνω α-ηµείων της κατανοµής F βρίκουµε ότι: F ( F 99 ( 0 05 84 F ( F 99 ( 0 975 0 73 και υνεπώς το δε θα είναι 997 997 0 73 84] 0 404 4 ] 8 766 8 766 Το διάτηµα αυτό περιέχει το και άρα δεν µπορούµε να αποκλείουµε ότι / µε υντελετή εµπιτούνης 95% η ιάτηµα εµπιτούνης για τη διαφορά αναλογιών δύο ανεξάρτητων πληθυµών Σε αυτή την παράγραφο θα αναζητήουµε δε υντελετού α για τη διαφορά δύο ποοτών p p από ανεξάρτητους πληθυµούς ιατήµατα αυτής της µορφής χρηιµοποιούνται υνήθως για τη ύγκριη δύο ποοτών Έτω λοιπόν και YY Y δύο ανεξάρτητα τυχαία δείγµατα από Β( p και Β( p αντίτοιχα Γνωρίζουµε ότι για µεγάλα και (από ΚΟΘ ιχύει για τα δειγµατικά ποοτά ότι (βλ και παράγραφο (ε N p p p ( ~ ( και Y N p p p ( ~ ( Τα δειγµατικά ποοτά Y προέρχονται από ανεξάρτητα δείγµατα και εποµένως είναι ανεξάρτητα Εποµένως για µεγάλα και ιχύει ότι Y N p p p p ( p( p ~ ( + και άρα Y ( p p N p p p p ~ ( 0 ( ( + ( ] Boutsks MV (003 Σηµειώεις Στατιτικής ΙΙΙ Τµήµα Οικονοµικής Επιτήµης Πανεπιτήµιο Πειραιώς 76
Συµπεραίνουµε λοιπόν ότι για µεγάλα και P( Z Y ( p p p p + Z / p ( p ( / και επειδή για µεγάλα και θα ιχύει προεγγιτικά ότι p ( p / ( / και p ( p / Y( Y/ θα έχουµε Λύνοντας ως προς p p θα έχουµε ότι το Y ( p p P( Z / Z / ( Y (Y + Y + Z Y + + Z ] ( Y ( Y ( Y ( Y / θα είναι ένα προεγγιτικό δε (για µεγάλα υντελετού α για τη διαφορά των πληθυµιακών ποοτών p p Άκηη 54 Από τα 400 εξαρτήµατα που παίρνουµε την τύχη από µία µηχανή που τα κατακευάζει τα 6 είναι ελαττωµατικά ενώ από τα 300 µιας άλλης µηχανής τα 4 βρέθηκαν ελαττωµατικά Να βρεθεί 99% δε για τη διαφορά των ποοτών των ελαττωµατικών εξαρτηµάτων που παράγουν οι δύο µηχανές Μπορούµε µε βάη το δε να πούµε ότι υπάρχει ηµαντική διαφορά την παραγωγή ελαττωµατικών µεταξύ των δύο µηχανών; Λύη Τα δειγµατικά ποοτά των ελαττωµατικών εξαρτηµάτων από τις δύο αυτές µηχανές είναι ύµφωνα µε τα παραπάνω 6 400 004 και Y 4 300 008 Τα δείγµατα 400 και 300 είναι αρκετά µεγάλα οπότε µπορούµε να χρηιµοποιήουµε το παραπάνω προεγγιτικό δε υντελετού α για το p p ( Y ( Y ( Y ( Y / / Y + Z Y + + Z ] και αντικαθιτώντας παίρνουµε το δε 004( 004 008( 008 004( 004 008( 008 400 300 400 300 004008 + 58 004 008 + + 58 ] / 0 087 0 0076 ] Επειδή το 0 ανήκει ε αυτό το δε δεν µπορούµε να πούµε ότι τα ποοτά διαφέρουν µε υντελετή εµπιτούνης 99% Άκηη 55 Βρέθηκε ότι 78 από 00 τυχαία επιλεγµένους ψηφοφόρους µιας µεγάλης πόλης Α προτίθενται να ψηφίουν ένα υγκεκριµένο κόµµα ενώ 40 από 500 τυχαία επιλεγµένους ψηφοφόρους µιας άλλης µεγάλης πόλης Β προτίθενται να ψηφίουν το ίδιο κόµµα Να βρείτε δε υντελετού 95% για τη διαφορά p p των ποοτών των ψηφοφόρων του υγκεκριµένου κόµµατος τις δύο αυτές πόλεις Μπορούµε µε βάη το δε να πούµε ότι υπάρχει ηµαντική διαφορά µεταξύ των δύο ποοτών; Λύη Τα δειγµατικά ποοτά των ψηφοφόρων του κόµµατος τις δύο αυτές πόλεις θα είναι 78 00 039 και Y 40 500 048 Boutsks MV (003 Σηµειώεις Στατιτικής ΙΙΙ Τµήµα Οικονοµικής Επιτήµης Πανεπιτήµιο Πειραιώς 77
Τα δείγµατα 00 και 500 είναι αρκετά µεγάλα οπότε µπορούµε να χρηιµοποιήουµε το παραπάνω προεγγιτικό δε υντελετού α για το p p ( Y (Y ( Y (Y Y + Z / Y + + Z / ] και αντικαθιτώντας παίρνουµε άµεα το δε 039 ( 039 048 ( 048 039 ( 039 048 ( 048 00 500 00 500 0 39 0 48 + 96 0 39 0 48+ + 96 ] 07 0 0094 ] Επειδή το 0 δεν ανήκει ε αυτό το δε µπορούµε να πούµε ότι τα δύο ποοτά διαφέρουν µε υντελετή εµπιτούνης 95% Άκηη 56 Μια µεγάλη εταιρία µε κοπό να βελτιώει την απόδοη των υπαλλήλων της έδωε κάποια υγκεκριµένα κίνητρα Έτω Χ Χ Χ και Υ Υ Υ είναι οι αποδόεις ενός τυχαίου δείγµατος υπαλλήλων της εταιρίας πριν και µετά την παροχή των κινήτρων (Χ απόδοη - υπαλλήλου «πριν» Υ απόδοη -υπαλλήλου «µετά» Να δώετε δε υντελετού α για τη διαφορά µ µ των µέων αποδόεων των υπαλλήλων της εταιρίας πριν και µετά την εφαρµογή των κινήτρων (υπόθ ότι οι αποδόεις κατανέµονται κανονικά Να εφαρµόετε τα παραπάνω για α95% και : 5 49 47 43 5 55 34 49 40 48 46 5 5 4 47 53 49 55 5 5 Υ : 53 50 47 40 55 58 33 55 4 5 46 53 53 4 46 55 50 6 53 53 αντίτοιχα Επήλθε αλλαγή τη µέη απόδοη των υπαλλήλων της εταιρίας; Λύη Στη υγκεκριµένη περίπτωη δεν µπορούµε να χρηιµοποιήουµε το γνωτό δε για τη διαφορά των µέων διότι δεν έχουµε δύο ανεξάρτητα µεταξύ τους δείγµατα Συγκεκριµένα οι τµ Χ και Υ είναι εξαρτηµένες διότι αφορούν τον ίδιο υπάλληλο (πχ αν γνωρίζουµε ότι ο - υπάλληλος έχει υψηλή απόδοη πριν τότε αυξάνεται η πιθανότητα να έχει υψηλή απόδοη και µετά: oι τµ Y έχουν θετική υχέτιη Παρατηρούµε όµως ότι οι νέες τµ U Y που εκφράζουν τις διαφορές τις αποδόεις των υπαλλήλων του δείγµατος αποτελούν ένα τυχαίο δείγµα το οποίο µπορεί να θεωρηθεί ότι ακολουθεί N(µµ µ Εποµένως δεδοµένου ενός τδ U U U από N(µµ µ ζητείται δε για το µµ µ Από την παράγραφο (δ θα έχουµε ότι το U ( / ( / ] t U U U + t όπου U είναι η δειγµατική διαπορά του τδ U U U είναι ένα τέτοιο διάτηµα υντελετού α Εφαρµόζοντας τα παραπάνω για τις δοθείες παρατηρήεις θα έχουµε ότι τα U θα είναι 535 5049 4747 535 535 δηλαδή τα 0 3 3 3 6 3 0 6 Εποµένως U 65 και U 455 Άρα ένα δε για τη διαφορά µ µ υντελετού 95% θα είναι το 65 455 ] ] 0 093 65+ 455 093 0 65 64 0 Άρα τελικά η µέη βελτίωη τις αποδόεις των υπαλλήλων της εταιρίας βρίκεται µεταξύ του 065 και του 64 µε υντελετή εµπιτούνης 95% Παρατηρούµε ότι το 0 δεν περιέχεται το διάτηµα αυτό και εποµένως υπάρχει (θετική διαφορά τις αποδόεις των υπαλλήλων της εταιρίας µε υντελετή εµπιτούνης 95% Boutsks MV (003 Σηµειώεις Στατιτικής ΙΙΙ Τµήµα Οικονοµικής Επιτήµης Πανεπιτήµιο Πειραιώς 78