.4 ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ ΓΙΑ ΜΙΑ ΠΙΘΑΝΟΤΗΤΑ Η μέθοδος για τον προσδιορισμό ενός διαστήματος εμπιστοσύνης για την άγνωστη πιθανότητα =P(A) ενός ενδεχομένου A συνδέεται στενά με τον διωνυμικό έλεγχο. Ένα δείγμα παρατηρήσεων πάνω σε ανεξάρτητες δοκιμές εξετάζεται και καταγράφεται η συχνότητα Τ με την οποία το συγκεκριμένο ενδεχόμενο εμφανίζεται. Οι δοκιμές είναι αμοιβαία ανεξάρτητες και η πιθανότητα του εν λόγω ενδεχομένου παραμένει σταθερή από δοκιμή σε δοκιμή. Είναι προφανές, ότι η κατανομή της τυχαίας μεταβλητής Τ είναι η διωνυμική με παραμέτρους και. Ένα διάστημα εμπιστοσύνης για την πιθανότητα είναι προφανές ότι θα αποτελείται από όλες τις τιμές του οι οποίες είναι τέτοιες ώστε τα δεδομένα του δείγματος θα οδηγούσαν σε μη απόρριψη της μηδενικής υπόθεσης H : = έναντι της εναλλακτικής H :. Ειδικότερα, εάν επιθυμούμε την κατασκευή ενός ( α)% διαστήματος εμπιστοσύνης, παρατηρούμε το δείγμα των αποτελεσμάτων των δοκιμών, καταγράφουμε την τιμή τ της μεταβλητής Τ και ρωτάμε: «Για την δοθείσα τιμή τ της μεταβλητής Τ, ποιες είναι οι τιμές εκείνες που θα μπορούσε να πάρει το στην υπόθεση H : = ώστε ένας αμφίδρομος διωνυμικός έλεγχος σε επίπεδο σημαντικότητας α να μην οδηγήσει σε απόρριψη της μηδενικής υπόθεσης;»
Το σύνολο αυτών των τιμών αποτελούν το ( α)% διάστημα εμπιστοσύνης. Οι τιμές του που οδηγούν σε απόρριψη της μηδενικής υπόθεσης Η δεν θα ανήκουν στο διάστημα εμπιστοσύνης. Επομένως, αν (, ) είναι ένα ( α)% διάστημα εμπιστοσύνης για την παράμετρο, τότε οι προτάσεις «H/ σε επίπεδο σημαντικότητας α» και «(, )» είναι ισοδύναμες. Καθορισμός των Άκρων, του ( α)% Διαστήματος Εμπιστοσύνης Τα άκρα, του ( α)% διαστήματος εμπιστοσύνης καθορίζονται έτσι ώστε η παρατηρούμενη τιμή τ της μεταβλητής Τ να αποτελεί ταυτόχρονα ακραία τιμή των διωνυμικών μεταβλητών T ~ διωνυμική (, ) και T ~ διωνυμική (, ), δηλαδή P(T t, = ) α/ και P(T t, = ) α/. = = t + Σχήμα.4. Επομένως, τα άκρα και του διαστήματος εμπιστοσύνης ορίζονται έτσι ώστε P(T t, = ) α/
και P(T t, = ) α/ ή, ισοδύναμα, P(T t, ) α/. Επομένως, ο κανόνας απόρριψης του παραπάνω ελέγχου σε επίπεδο σημαντικότητας α μπορεί να διατυπωθεί μέσω του ( α)% διαστήματος εμπιστοσύνης (, ) ως εξής: Η υπόθεση Η απορρίπτεται σε επίπεδο σημαντικότητας α αν (, ). Παράδειγμα.4.: Ένα τυχαίο δείγμα τέως καπνιστών έδειξε ότι, ένα χρόνο μετά, 6 άτομα ξανάρχισαν το κάπνισμα. Να κατασκευασθεί ένα 99% διάστημα εμπιστοσύνης για το πραγματικό ποσοστό των τέως καπνιστών που ξαναρχίζουν το κάπνισμα. Λύση: Θεωρούμε ως επιτυχία την επιστροφή στο κάπνισμα. Η παρατηρηθείσα τιμή της στατιστικής συνάρτησης Τ= αριθμός τέως καπνιστών που ξανάρχισαν το κάπνισμα είναι τ=6. Έστω το πραγματικό ποσοστό των τέως καπνιστών, που ξαναρχίζουν το κάπνισμα. Τα άκρα, του 99% διαστήματος εμπιστοσύνης για το θα καθορισθούν από τις σχέσεις: και P(T 6 =, = ).5 P(T 5 =, = ).995 Από τον πίνακα της διωνυμικής κατανομής (πίνακας του παραρτήματος) για = και για την τιμή τ=6 έχουμε ότι η τιμή του 3
που αντιστοιχεί στην τιμή.5 της πιθανότητας P(T 6 =, = ) βρίσκεται στο διάστημα (.9,.95). Συγκεκριμένα, :.9.95 P(Τ 6 =, ):.8.5. Επομένως, =.9 + Δ, όπου η τιμή του Δ προκύπτει από την σχέση Δ.8.5 =.95.9.8. ίση με Δ =.33. Επομένως, =.9+.33 =.933. Με τον ίδιο τρόπο, προκύπτει ότι =.89. Κατά συνέπεια, το 99% διάστημα εμπιστοσύνης για την πιθανότητα είναι το διάστημα (.89,.933). Αν στο προηγούμενο παράδειγμα μας ενδιέφερε να ελέγξουμε τις υποθέσεις: Η : =.5 H :.5, τότε, επειδή (.89,.933), η Η δεν θα απορριπτόταν σε επίπεδο σημαντικότητας %. Παρατήρηση: Στην περίπτωση κατά την οποία το μέγεθος του δείγματος είναι αρκετά μεγάλο ( >) και η κατανομή πιθανότητας της στατιστικής συνάρτησης Τ είναι περίπου συμμετρική ( 5) και (( ) 5), το ( α)% διάστημα εμπιστοσύνης μπορεί να προσδιορισθεί κατά προσέγγιση με βάση την συνάρτηση κατανομής της 4
κανονικής κατανομής με παραμέτρους μ = και σ = ( ), η οποία προσεγγίζει την διωνυμική κατανομή της Τ. Ισχύει, δηλαδή, ότι T ( ) ~ N(,). Η τελευταία σχέση οδηγεί στο συμπέρασμα ότι ή, ισοδύναμα, T z α/ < < z ) = α, ( ) P( α/ T ( ) T ( ) z z α/ < < + = α. P α/ - -z α/ z α/ + Σχήμα.4. Τα άκρα του διαστήματος εμπιστοσύνης περιέχουν την άγνωστη παράμετρο. Είναι βέβαια δυνατόν να γραφεί η ανισότητα με τρόπο ώστε τα άκρα της να είναι ανεξάρτητα του. Στην πράξη, όμως, επιτυγχάνουμε 5
μία ικανοποιητική προσέγγιση αν αντικαταστήσουμε την παράμετρο με την εκτιμήτριά της T. Δηλαδή, το ( α)% διάστημα εμπιστοσύνης για την παράμετρο έχει άκρα: T T/ ( T/) ± z α/. Παράδειγμα.4.: Αν στο παράδειγμα με τους καπνιστές είχαμε ότι στους = τέως καπνιστές τ=6 ξανάρχισαν να καπνίζουν, το 99% διάστημα εμπιστοσύνης θα είχε άκρα 6 + z.995 6/ ( 6/). Δηλαδή, το 99% διάστημα εμπιστοσύνης θα ήταν το (.474,.76). Σημείωση: Ο έλεγχος υποθέσεων για την μέση τιμή μιας διωνυμικής κατανομής με παραμέτρους N και είναι ισοδύναμος με τον έλεγχο των υποθέσεων για την παράμετρο. Αυτό είναι συνέπεια του γεγονότος ότι από το οποίο συνάγεται ότι H H : μ = μ : μ μ H H μ = E(X) = N, : N : N = N N H H : : =. 6