Σ ΤΑΤ Ι Σ Τ Ι Κ Η i Statisticum collegium iv
Στατιστική Συμπερασματολογία Ι Σημειακές Εκτιμήσεις Διαστήματα Εμπιστοσύνης
Στατιστική Συμπερασματολογία (Statistical Inference) Το πεδίο της Στατιστικής Συμπερασματολογία, αποτελείται από όλες εκείνες τις μεθόδους που μας επιτρέπουν να εξάγουμε συμπεράσματα για τον πληθυσμό και να λαμβάνουμε αποφάσεις. Αυτές οι μέθοδοι, xρησιμοποιούν την πληροφορία που περιέχεται σε ένα δείγμα που λαμβάνεται από τον πληθυσμό για να εξάγουν συμπεράσματα. Η Στατιστική Συμπερασματολογία μπορεί να χωριστεί σε δύο κύριους κλάδους. o Εκτίμηση Παραμέτρων (Parameter Estimation) Σημειακές Εκτιμήσεις (Point Estimates) Διαστήματα Εμπιστοσύνης (Confidence Intervals) o Έλεγχοι Υποθέσεων (Hypothesis Testing) 3
Σημειακή Εκτίμηση (Point Estimate) Σημειακή εκτίμηση μιας παραμέρου του πληθυσμού, ονομάζεται η μοναδική τιμή ˆ που παράγεται από ένα δείγμα με τη βοήθεια του κατάλληλου στατιστικού (statistic) (ή σημειακού εκτιμητή (point estimator) ) Για παράδειγμα, έστω η τυχαία μεταβλητή X, η οποία ακολουθεί Κανονική Κατανομή με άγνωστη μέση τιμή. Η συνάρτηση δειγματικού μέσου, που δίνεται από τον τύπο 1 2 n n είναι ο σημειακός εκτιμητής, της παραμέτρου. Όταν αντικαταστήσουμε στον παραπάνω τύπο τις τιμές από ένα δείγμα, η δειγματική μέση τιμή X που προκύπτει θα είναι μία σημειακή εκτίμηση της παραμέτρου. ˆ X Σημειακή Εκτίμηση της παραμέτρου 4
Παράμετροι Πληθυσμού Η μέση τιμή, ενός πληθυσμού Σημειακές Εκτιμήσεις Ο δειγματικός μέσος X x x x ˆ X 1 2 n n Η διασπορά 2, ενός πληθυσμού Η δειγματική διασπορά ˆ n 2 2 1 2 s X i X n 1 i 1 2 s Η αναλογία (ποσοστό) p των ατόμων ενός πληθυσμού που ανήκουν σε μία κατηγορία. Η δειγματική αναλογία x pˆ n όπου x το πλήθος παρατηρήσεων σε ένα δείγμα μεγέθους n, που ανήκουν στην κατηγορία. Παράμετροι πληθυσμού και οι σημειακές τους εκτιμήσεις 5
Παράμετροι Πληθυσμού Σημειακές Εκτιμήσεις Η διαφορά των μέσων τιμών δύο πληθυσμών 1 2 Η διαφορά ανάμεσα στους δειγματικούς μέσους δύο τυχαίων ανεξάρτητων δειγμάτων X X ή ˆ ˆ 1 2 1 2 Η διαφορά της αναλογίας ανάμεσα σε δύο πληθυσμούς p p 1 2 Η διαφορά ανάμεσα σε δύο δειγματικές αναλογίες που υπολογίζονται από δύο τυχαία ανεξάρτητα δείγματα x1 x2 ή pˆ pˆ 1 2 n n 1 2 Παράμετροι του πληθυσμού και οι σημειακές τους εκτιμήσεις 6
Πλεονεκτήματα Μειονεκτήματα των Σημειακών Εκτιμητών Οι σημειακοί εκτιμητές κατασκευάζονται με τέτοιο τρόπο ώστε να ικανοποιούν συγκεκριμένες ιδιότητες, όπως η αμεροληψία, η συνέπεια και η αποτελεσματικότητα. Έτσι εξασφαλίζεται ότι η σημειακή εκτίμηση που παράγουν, είναι η βέλτιστη εκτίμηση της παραμέτρου που θα μπορούσαμε να πάρουμε από το μοναδικό δείγμα που διαθέτουμε. Παρόλα αυτά, οι σημειακές εκτιμήσεις παρουσιάζουν κάποια μειονεκτήματα. 1) Στην πραγματικότητα, μια σημειακή εκτίμηση είναι πάντα εσφαλμένη. Είναι, δηλαδή, απίθανο να πετύχουμε ακριβώς τον στόχο. 2) Δεν γνωρίζουμε πόσο κοντά στην πραγματική τιμή της παραμέτρου βρίσκεται η σημειακή μας εκτίμηση. 3) Δεν μας δίνουν πληροφορίες για την επίδραση του μεγέθους του δείγματος στην εκτίμηση της παραμέτρου. 7
Διαστήματα Εμπιστοσύνης (Confidence Intervals) Το Διάστημα Εμπιστοσύνης μιας παραμέτρου, είναι ένα διάστημα τιμών LU,, για το οποίο η πιθανότητα να περιέχει (να έχει εντοπίσει) την πραγματική τιμή της παραμέτρου είναι αυξημένη και ίση με μια δεδομένη τιμή 1 α. Δηλαδή Καθώς το διάστημα εμπιστοσύνης μιας παραμέτρου κατασκευάζεται από τον σημειακό της εκτιμητή, λαμβάνει υπόψη του την κατανομή δειγματοληψίας του εκτιμητή και αντανακλά τις συνέπειες του μεγέθους το δείγματος. Τα άκρα ενός διαστήματος εμπιστοσύνης είναι τυχαίες μεταβλητές. Αυτό σημαίνει ότι διαφορετικά δείγματα του ίδιου μεγέθους θα δώσουν διαφορετικά διαστήματα εμπιστοσύνης, κάποια από τα οποία θα έχουν αποτύχει να εντοπίσουν την τιμή της παραμέτρου στον πληθυσμό. 8
Διαστήματα Εμπιστοσύνης Συμβολισμοί και Ερμηνεία Η πιθανότητα (1 α) το διάστημα εμπιστοσύνης να περιέχει την πραγματική τιμή της παραμέτρου στον πληθυσμό, ονομάζεται συντελεστής (ή επίπεδο) εμπιστοσύνης (confidence coefficient / level). Τότε, η πιθανότητα α δεν είναι τίποτα άλλο παρά η πιθανότητα σφάλματος, δηλαδή η πιθανότητα το διάστημα εμπιστοσύνης να μην περιέχει την πραγματική τιμή της παραμέτρου. Ονομάζουμε αυτή την πιθανότητα επίπεδο σημαντικότητας (significance level). Ονομάζουμε ένα διάστημα εμπιστοσύνης από τον συντελεστή εμπιστοσύνης του. Για παράδειγμα, όταν λέμε 95% δ.ε., αυτό σημαίνει ότι η πιθανότητα το διάστημα εμπιστοσύνης να περιέχει την πραγματική τιμή της παραμέτρου είναι 95% (1 α = 0.95) Το εύρος ενός διαστήματος εμπιστοσύνης εξαρτάται από το συντελεστή εμπιστοσύνης, το μέγεθος του δείγματος και το τυπικό σφάλμα της σημειακής εκτίμησης. Το εύρος αυξάνεται όταν αυξάνεται το τυπικό σφάλμα της εκτιμήτριας ή ο συντελεστής εμπιστοσύνης, ενώ μειώνεται όταν αυξάνει το μέγεθος του δείγματος. 9
Διάστημα Εμπιστοσύνης για τη μέση τιμή ενός πληθυσμού Επιλογή μεγέθους δείγματος
100(1 α )% Διάστημα Εμπιστοσύνης του μέσου μ όταν η Διασπορά σ 2 είναι γνωστή Πληθυσμός Κανονικός και δείγμα οποιουδήποτε μεγέθους ή Πληθυσμός μη Κανονικός και μεγάλο δείγμα (n > 30) όπου: Το επίπεδο σημαντικότητας Το μέγεθος του δείγματος Ο δειγματικός μέσος Η διασπορά στον πληθυσμό Τιμές που βρίσκονται από τον πίνακα της Κανονικής Κατανομής και τη σχέση 11
Παράδειγμα 1 Λύση 12
100(1 α )% Διάστημα Εμπιστοσύνης του μέσου μ όταν η Διασπορά σ 2 είναι άγνωστη Πληθυσμός Κανονικός όπου: Η δειγματική τυπική απόκλιση τιμή από τον πίνακα της Κατανομής t - Student Όταν έχουμε μεγάλο δείγμα (n > 30), τότε η τιμή μπορεί να αντικατασταθεί από την τιμή 13
n 1 Πίνακας της Κατανομής t - Student 14
Παράδειγμα 2 Λύση 15
Σημαντική Παρατήρηση Η πιθανότητα σφάλματος, είναι η πιθανότητα το διάστημα εμπιστοσύνης που εκτιμήσαμε να μην περιέχει την πραγματική τιμή της παραμέτρου, και όχι η πιθανότητα η πραγματική τιμή της παραμέτρου να μην περιέχεται στο διάστημα εμπιστοσύνης!!! Παρόλο που φαίνεται ότι οι παραπάνω δύο εκφράσεις αναφέρονται στο ίδιο γεγονός, για τη Θεωρία των Πιθανοτήτων και τη Στατιστική έχουν μία σημαντική διαφορά. Η πραγματική τιμή της παρμέτρου είναι μοναδική και βρίσκεται σε συγκεκριμένο σταθερό σημείο. Το ερώτημα, λοιπόν, είναι εάν το διάστημα εμπιστοσύνης που εκτιμούμε έχει καταφέρει να «κλείσει» μέσα στα όριά του, αυτό το σημείο. Η πιθανότητα σφάλματος χαρακτηρίζει το διάστημα εμπιστοσύνης και όχι την παράμετρο. Με άλλα λόγια, είναι η πιθανότητα το διάστημα εμπιστοσύνης που εκτιμούμε να αποτύχει, τελικά, στο σκοπό του. 16
Επιλογή του συντελεστή εμπιστοσύνης. Στο παράδειγμα 2, επιλέξαμε συντελεστή εμπιστοσύνης 90% για την εκτίμηση του διαστήματος εμπιστοσύνης, το οποίο βρέθηκε (4934.263, 5065.738) Τί θα γινόταν, αν επιλέγαμε έναν πολύ μεγαλύτερο συντελεστή εμπιστοσύνης, για παράδειγμα 99%; Το μόνο που θα άλλαζε, θα ήταν η τιμή t ;n1 η οποία τώρα θα 2 ήταν μεγαλύτερη από πρίν. t t 2. 947 αντί t t 1. 753 ; 16 1 0. 005; 15 ; 161 0. 05; 15 0. 01 0. 10 2 2 Αυτό θα είχε σαν αποτέλεσμα να πάρουμε ένα διάστημα εμπιστοσύνης το οποίο θα ήταν μεγαλύτερο από το προηγούμενο. Δηλαδή το (4906.363, 5093.638) αντί του (4934.263, 5065.738) Και αυτό συμβαίνει πάντα. Για δεδομένο μέγεθος δείγματος και για την ίδια διασπορά, το μόνο που καταφέρνουμε όταν επιλέγουμε μεγαλύτερους συντελεστές εμπιστοσύνης, είναι να εκτιμούμε μεγαλύτερα διαστήματα. Στην πράξη όμως, ένα μεγάλο διάστημα εμπιστοσύνης μπορεί να μην έχει καμία χρησιμότητα. 17
Επιλογή του συντελεστή εμπιστοσύνης Επιθυμούμε ακρίβεια στις εκτιμήσεις μας. Όταν το διάστημα εμπιστοσύνης μεγαλώνει, η ακρίβεια χάνεται. Και μαζί της ο στόχος. Κατασκευάσαμε διαστήματα εμπιστοσύνης, για να μπορούμε να πούμε κάτι καλύτερο, π.χ. από το ότι «το μέσο ύψος των καταθέσεων όψεως είναι περίπου 5000». Κατασκευάσαμε διαστήματα εμπιστοσύνης, ακριβώς για να προσδιορίσουμε, να «ποσοτικοποιήσουμε», να δώσουμε νόημα σε αυτό το «περίπου». Θέλουμε να έχουμε διαστήματα αρκετά μικρά, ώστε να ικανοποιούν την ανάγκη μας για ακρίβεια, και ταυτόχρονα να έχουν έναν υψηλό συντελεστή εμπιστοσύνης. Αυτά όμως τα δύο κριτήρια βρίσκονται σε σύγκρουση. Στην πράξη, οι ποιό συνηθισμένες επιλογές συντελεστή εμπιστοσύνης είναι 0.90 (α = 0.10) και 0.95 (α = 0.05) 18
Επιλογή μεγέθους δείγματος Ένας δεύτερος τρόπος για πετύχουμε την επιθυμητή ακρίβεια είναι να επιλέξουμε ένα δείγμα μεγάθους n, που να είναι ικανό να μας δώσει ένα διάστημα εμπιστοσύνης συγκεκριμένου μήκους με προκαθορισμένο συντελεστή εμπιστοσύνης. Το μήκος του διαστήματος εμπιστοσύνης είναι 2Z 2 n Ονομάζουμε σφάλμα εκτίμησης την απόσταση της μέσης τιμής στον πληθυσμό από το δειγματικό μέσο. Δηλαδή την ποσότητα e X. Η μέγιστη τιμή που μπορεί να πάρει το σφάλμα εκτίμησης είναι Z, 2 n δηλαδή ίση με το μισό του μήκους του διαστήματος εμπιστοσύνης. Από τη στιγμή που το σφάλμα εκτίμησης και το μήκος του διαστήματος εμπιστοσύνης συνδέονται, μπορούμε, μέσω του σφάλματος εκτίμησης να ελέγξουμε το μήκος του διαστήματος και επομένως την ακρίβεια της πρόβλεψης. 19
Επιλογή μεγέθους δείγματος Από τη σχέση e Z, λύνοντας ως προς το μέγεθος του δείγματος n, 2 n παίρνουμε Z n 2 e Η τελευταία σχέση μας λέει ότι: Για επιλεγμένες τιμές σφάλματος και συντελεστή εμπιστοσύνης, αρκεί να πάρουμε δείγμα μεγέθους n για να εκτιμήσουμε διάστημα εμπιστοσύνης με επιθυμητή ακρίβεια. 2 Επειδή τις περισσότερες φορές η τυπική απόκλιση δεν είναι γνωστή, χρησιμοποιείται η εκτίμησή της. s στον πληθυσμό Εάν ο πληθυσμός από τον οποίο επιλέγουμε το δείγμα είναι πεπεραμένος, το μέγεθος του δείγματος προσδιορίζεται από τη σχέση nn n* n N 1, όπου Ν το μέγεθος του πληθυσμού. 20
Παράδειγμα 3 Έστω ότι θέλουμε να εκτιμήσουμε το μέσο χρόνο συναρμολόγησης των κινητών τηλεφώνων του παραδείγματος 1, με συντελεστή εμπιστοσύνης 95% και σφάλμα εκτίμησης 1 min. Τότε θα πρέπει να επιλέξουμε δείγμα μεγέθους 2 2 Z Z0. 05 Z 2 2 2 2 0. 025 1. 965 n. e e e 96 04 1 Εάν για μέγεθος δείγματος n = 96 εκτιμήσουμε ξανά το διάστημα εμπιστοσύνης για το μέσο χρόνο συναρμολόγησης των κινητών τηλεφώνων θα βρούμε (19.000 min, 21.000 min) Το μήκος (ακρίβεια) αυτού του διαστήματος είναι 2 min και είναι, πράγματι, το διπλάσιο του επιλεγμένου σφάλματος εκτίμησης που ήταν 1 min. 21
Διάστημα Εμπιστοσύνης για την Αναλογία σε έναν πληθυσμό Επιλογή μεγέθους δείγματος
Διάστημα Εμπιστοσύνης Μεγάλου Δείγματος για την αναλογία p, σε έναν πληθυσμό Πολλές φορές ενδιαφερόμαστε για την αναλογία (ή το ποσοστό) των ατόμων ή των αντικειμένων ενός πληθυσμού που ανήκουν σε μία κατηγορία. Για παράδειγμα, το ποσοστό των ατόμων που προτιμούν κάποιο προϊόν, ή το ποσοστό των ελαττωματικών αντικειμένων σε μία γραμμή παραγωγής. Ο σημειακός εκτιμητής για το ποσοστό p της αναλογίας στον πληθυσμό είναι ˆ x p n όπου, n το μέγεθος του δείγματος και x το πλήθος των ατόμων στο δείγμα που ανήκουν στην κατηγορία που μας ενδιαφέρει. Αποδεικνύεται ότι για μεγάλα δείγματα η κατανομή δειγματοληψίας της αναλογίας ˆp προσεγγίζει την Κανονική Κατανομή. pˆ p 1 p pˆ p N p, n p1 p N 01, n 2 23
100(1 α )% Διάστημα Εμπιστοσύνης για την αναλογία p στον πληθυσμό και επιλογή μεγέθους δείγματος. όταν Για την επιλογή του μεγέθους του δείγματος, χρησιμοποιείται ο οι τύποι ή nn n*, για πληθυσμό πεπερασμένου μεγέθους N n N 1 Επειδή η αναλογία p είναι κατά κανόνα άγνωστη, στον υπολογισμό του μεγέθους δείγματος χρησιμοποιούμε είτε μια προγενέστερη εκτίμηση της αναλογίας p, είτε δίνουμε την τιμή p = 0.5. 24
Παράδειγμα 3 Μια εταιρεία καλλυντικών, ενδιαφέρεται να εκτιμήσει το ποσοστό των γυναικών που χρησιμοποιούν την κρέμα προσώπου Α. Από ένα δείγμα 50 γυναικών, οι 26 απάντησαν θετικά. Έτσι, για τον υπολογισμό του 95% δ.ε. για την αναλογία στον πληθυσμό έχουμε: Επομένως, με πιθανότητα σφάλματος α = 0.05, γνωρίζουμε ότι το ποσοστό των γυναικών που χρησιμοποιούν την κρέμα προσώπου Α, βρίσκεται εντός των ορίων 13.68% και 38.32%. Παρατηρούμε ότι το μήκος αυτού του διαστήματος είναι πολύ μεγάλο. Εάν η εταιρεία επιθυμεί να υπολογίσει το δ.ε. εμπιστοσύνης με ακρίβεια 5% τότε θα πρέπει να πάρει ένα δείγμα, μεγέθους 25