Στατιστική Συμπερασματολογία Διαφάνειες 4 ου κεφαλαίου Ελεγχοσυναρτήσεις Γενικευμένου Λόγου Πιθανοφανειών Σταύρος Χατζόπουλος 27/03/2017, 03/04/2017, 24/04/2017 1
Εισαγωγή Έστω το τ.δ. X,,, από την κατανομή x ;, Ω, 1και Ω. Ζητείται να ελεγχθεί η αλήθεια της υπόθεσης Η : ως προς την εναλλακτική Η :, Ω, σε κάποια σ.σ. a (0 a1). Αν και, δηλαδή τα σύνολα και είναι μονοσύνολα, ο έλεγχος γίνεται με τη βοήθεια του λήμματος Neyman Pearson και στηρίζεται στο λόγο πιθανοφανειών ;. ; Αν όμως τα σύνολα και δεν είναι μονοσύνολα, τότε δε μπορεί να χρησιμοποιηθεί το θεμελιώδες λήμμα των Neyman Pearson και χρησιμοποιείται μiα παραπλήσια μέθοδος. 2
Εισαγωγή Έστω sup x ; : και Ω sup x ; : Ω. Θα περίμενε κανείς, αν η υπόθεση Η είναι αληθής, τα δύο αυτά μέγιστα να συμπίπτουν. Επειδή πάντα τα συμπεράσματα στηρίζονται σε κάποια δείγματα, θα περίμενε κανείς, όταν η Η είναι αληθής, οι δύο τιμές, και Ω να είναι σχεδόν ίσες. Ισχύει ότι: sup x ; :, όπου είναι ο Ε.Μ.Π. του, όταν και sup x ; : Ω, όπου είναι ο Ε.Μ.Π. του Ω, Ω 4.1. 3
Εισαγωγή Προφανώς, 01. Αν η υπόθεση Η : είναι αληθής αναμένονται μεγάλες τιμές του, ενώ όταν το παίρνει μικρές τιμές, φαίνεται «πιο πιθανό» να μην ισχύει η Η. Επομένως, η μηδενική υπόθεση Η απορρίπτεται, όταν ο λόγος παίρνει τιμές μικρότερες από μία σταθερά, που προσδιορίζεται με τη βοήθεια της σ.σ. a. Για να προσδιοριστεί η τιμή της σταθεράς, πρέπει να είναι γνωστή η κατανομή που ακολουθεί ο λόγος. Αν ο λόγος είναι συνάρτηση κάποιας στ.σ., της οποίας η κατανομή είναι γνωστή, τότε είναι δυνατό να βρεθεί «σχετικά εύκολα» η ελεγχοσυνάρτηση. 4
Εισαγωγή Σε διαφορετική περίπτωση, αντί του λόγου χρησιμοποιείται η ποσότητα 2ln, που ακολουθεί ασυμπτωτικά την κατανομή, και η περιοχή απόρριψης της υπόθεσης Η θα καθοριστεί από μία σταθερά για την οποία θα ισχύει ότι: 2ln 4.2. Οι ελεγχοσυναρτήσεις που προκύπτουν με αυτό τον τρόπο ονομάζονται Ελεγχοσυναρτήσεις Γενικευμένου Λόγου Πιθανοφανειών (Γ.Λ.Π.). Προφανώς, για και οι ελεγχοσυναρτήσεις γενικευμένου λόγου πιθανοφανειών συμπίπτουν με τις ελεγχοσυναρτήσεις που δίνονται απότοθεμελιώδεςλήμμαneyman Pearson. 5
Εισαγωγή Οι ελεγχοσυναρτήσεις Γ.Λ.Π., πολλές φορές έχουν βέλτιστες ιδιότητες, δηλαδή είναι ομοιόμορφα ισχυρότατες και αμερόληπτα ομοιόμορφα ισχυρότατες. Ηκατασκευήτης Ω ανάγεται ουσιαστικά στην εύρεση του Ε.Μ.Π. της, ενώ της στην εύρεση μίας τιμής, που να μεγιστοποιεί την ποσότητα x ;,, πράγμα που πολλές φορές δεν είναι εύκολο. Βέβαια, στις περισσότερες περιπτώσεις δεν υπάρχει αυτή η δυσκολία διότι το λαμβάνεται ως μονοσύνολο, δηλαδή η μηδενική υπόθεση έχει τη μορφή: Η : με συνέπεια. 6
Οταν η μηδενική υπόθεση Η : είναι αληθής, τότε ασυμπωτικά η κατανομή της τ.μ. 2ln είναι η. Η γενική περίπτωση, όπου το σύνολο Ω είναι ένα πολυδιάστατο σύνολο, είναι αρκετά περίπλοκη. Για το λόγο αυτό στη συγκεκριμένη παράγραφο, θα μελετηθεί η περίπτωση Ω και. Έστω η τ.μ. από κατανομή x ;, Ω, όπου το σύνολο Ω είναι ένα ανοικτό διάστημα της ευθείας των πραγματικών αριθμών και έστω X,,, τ.δ. από την παραπάνω κατανομή. Οι συνθήκες ομαλότητας είναι: 7
1. Για όλα τα, όπου είναι ένα υποσύνολο του, τέτοιο ώστε P 0 και για κάθε Ω υπάρχουν οι παράγωγοι: ln;, ln;, 2. Υπάρχει μετρήσιμη συνάρτηση : τέτοια ώστε: ln; για κάθε Ω και, για κάποιο ανεξάρτητο του. ln;. 3. Για κάθε Ω ισχύει ότι ln; 0. 4. Για κάθε Ω ισχύει ότι: ln; ln ; και 0, όπου είναι ο πληροφοριακός αριθμός του Fisher. 8
Θεώρημα 4.1 1. Έστω ότι ισχύουν οι συνθήκες ομαλότητας, ότι το μέγεθος του δείγματος είναι αρκούντως μεγάλο και ότι υπάρχει μονοσήμαντα ορισμένος Ε.Μ.Π. του. Για τον έλεγχο της μηδενικής υπόθεσης Η : ηασυμπτωτική κατανομή της στ. σ. 2ln είναι η, όταν η Η είναι αληθής, δηλαδή: P 2ln P και η σταθερά στην ανισότητα (4.2) υπολογίζεται από τη σχέση: με ;. a X P 2ln 9
2. Αν το σύνολο Ω είναι ένα διάστατο ανοικτό υποσύνολο του, 1 καιζητείταιναελεγχθείημηδενικήυπόθεσηη :, όπου είναι ένα διάστατο υποσύνολο του Ω ( ), τότε εφόσον ισχύουν οι συνθήκες ομαλότητας και η Η είναι αληθής η κατανομή της στατιστικής συνάρτησης 2ln είναι η, δηλαδή: P 2ln P. και η σταθερά στην ανισότητα (4.2) ισούται με ;. 10
Παρατήρηση 4.1 Το θεώρημα 4.1 είναι διατυπωμένο ως δύο ξεχωριστές προτάσεις. Φυσικά, η δεύτερη είναι γενικότερη της πρώτης. Η πρώτη προκύπτει ως μερική περίπτωση της δεύτερης (για 1και 0). Στη δεύτερη περίπτωση, όπου το σύνολο Ω είναι ένα υποσύνολο του για τον υπολογισμό του Ω, δηλαδή για τον υπολογισμό του απαιτούνται υπολογισμοί για τις συνιστώσες του,,,. Εφόσον ισχύει η μηδενική υπόθεση Η και το θεωρείται ότι ανήκει στο, τότε, για τον υπολογισμό του απαιτούνται υπολογισμοί (εκτίμηση ανεξάρτητων παραμέτρων). Άρα, αν η μηδενική υπόθεση Η γίνεται δεκτή, υπολείπονται υπολογισμοί. Συνεπώς, οι βαθμοί ελευθερίας της Χι τετράγωνο κατανομής της στ.σ. 2lnλ είναι (πλήθος εκτιμώμενων παραμέτρων για τον υπολογισμό του Ω μείον πλήθος εκτιμώμενων παραμέτρων για τον υπολογισμό του. 11
Παράδειγμα 4.1. Δίνεται τυχαίο δείγμα,,, που ακολουθεί την κατανομή βήτα,. Να ελεγχθεί η μηδενική υπόθεση :, έναντι της εναλλακτικής : με τη χρήση ελεγχοσυνάρτησης γενικευμένου λόγου πιθανοφανειών. Λύση Η σ.π.π. είναι: ; 1, 0,1 H πιθανοφάνεια του τ.δ. X είναι: x ; 1 ΟΕ.Μ.Π. της παραμέτρου είναι: Ω 1, 1 12
Ω 1 1 ln ln ln Έστω 0και 0. Θεωρούμε την συνάρτηση ln. Η παρουσιάζει μέγιστο για και στρέφει τα κοίλα κάτω, διότι: 1 0, 1 2 1 0. 13
H μηδενική υπόθεση απορρίπτεται, όταν ή ισοδύναμα όταν ή, ή ln 1 ή ln 1, όπου τα κρίσιμα σημεία και ικανοποιούν τις σχέσεις: P ln 1 P ln 1 a και:, P ln 1 a 2 P ln 1. 14
Από την άσκηση 1.3 προκύπτει ότι η τ.μ. 2 κατανομή. ln1 ακολουθεί την Από τον ορισμό του σημείου ; : P ; a προκύπτει ότι: 2 ; και η ζητούμενη ελεγχοσυνάρτηση είναι:, 2 ; x 1, αν 2 ln 1 ; 0, αλλού ή 2 ln1 1 2 ; 15
Παράδειγμα 4.2. Δίνεται τυχαίο δείγμα,,, που ακολουθεί την εκθετική κατανομή ;,,. Να ελεγχθεί η μηδενική υπόθεση :, έναντι της εναλλακτικής : σε στάθμη σημαντικότητας. με τη χρήση ελεγχοσυνάρτησης γενικευμένου λόγου πιθανοφανειών. Λύση Η σ.π.π. είναι: ; exp, 0, H πιθανοφάνεια του τ.δ. X είναι: x ; exp ΟΕ.Μ.Π. της παραμέτρου είναι (Παράδειγμα 1.12): Ω 1 exp, 1 exp 16
exp exp 1 Έστω 0και 0. Θεωρούμε την συνάρτηση. Η παρουσιάζει μέγιστο για και στρέφει τα κοίλα κάτω, διότι: 1 0, 1 2 0. Η μηδενική υπόθεση Η απορρίπτεται, όταν ήισοδύναμαόταν ήόταν. Τα κρίσιμα σημεία και υπολογίζονται από τη σχέση: a X P P. 17
Από την άσκηση 1.2 είναι γνωστό ότι, αν οι τ.μ. ακολουθούν την κατανομή 1,, τότε οι τ.μ. ακολουθούν την κατανομή και η τ.μ. ακολουθεί την κατανομή. ap ap P 2 2 P 2 2, όπου οι τιμές των και υπολογίζονται από τη λύση του συστήματος: exp 1 exp 1 1a, να είναι η σ.π.π. της κατανομής. 18
Προφανώς, η λύση του παραπάνω συστήματος δεν είναι εύκολο να βρεθεί. Για το λόγο αυτό οι τιμές των και θα υπολογιστούν από τις σχέσεις: a 2 P a 2 P 2 Από τον ορισμό του σημείου ; : P ; 2 ;, x 1, αν P 2 P 2, aπροκύπτει ότι: 2 ; 2 ; ή 0, αλλού 2.. 2 ;. 19
Παράδειγμα 4.3. Η τυχαία μεταβλητή ακολουθεί τη διωνυμική κατανομή,,,. Με τη βοήθεια της ελεγχοσυνάρτησης του γενικευμένου λόγου πιθανοφανειών να γίνει ο έλεγχος της μηδενικής υπόθεσης :, έναντι της εναλλακτικής :. Λύση Η σ.π. είναι: ; 1, 0, 1,,, 0 1 Η τιμή της παραμέτρου που μεγιστοποιεί την ; προκύπτει από τη λύση της εξίσωσης: δηλαδή, ο Ε.Μ.Π. του είναι. 1, Ω 1 1 20
1 Η μηδενική υπόθεση Η απορρίπτεται, όταν. Εύκολα αποδεικνύεται ότι η μέγιστη τιμή της συνάρτησης είναι 1. 21
Η συνθήκη ισοδυναμεί με ή. Οι τιμές των και υπολογίζονται από τις σχέσεις: a P P P P. Επειδή το παραπάνω σύστημα εξισώσεων είναι πολύ δύσκολο να λυθεί, και επειδή η συνάρτηση είναι σχεδόν συμμετρική ως προς την ευθεία, οι συνθήκες μπορούν να διαφοροποιηθούν ως εξής: P a 2, P a 2. 22
Τα σημεία και είναι, αντίστοιχα, ο μεγαλύτερος και ο μικρότερος ακέραιος για τα οποία ισχύει P P 1. Οι σταθερές και υπολογίζονται από τις σχέσεις: a 2 P P, Τελικά, η ελεγχοσυνάρτηση δίνεται από τη σχέση a 2 P P. 1, ή,, 1,2 0, αλλού. 23
Άσκηση 4.1. Έστω τυχαία μεταβλητή από διωνυμική κατανομή με δοκιμές και πιθανότητα επιτυχίας. 1. Να υπολογιστεί ο γενικευμένος λόγος πιθανοφανειών για τον έλεγχο των υποθέσεων : 0.5, έναντι της εναλλακτικής : 0.5. 2. Να αποδειχθεί ότι ο έλεγχος οδηγεί σε απόρριψη της μηδενικής υπόθεσης για μεγάλες τιμές της ποσότητας /2. 3. Χρησιμοποιώντας την κατανομή της τυχαίας μεταβλητής κάτω από τη μηδενική υπόθεση να ερμηνευτεί η στάθμη σημαντικότητας η οποία αντιστοιχεί στην κρίσιμη περιοχή /2. 4. Αν 10και το κρίσιμο σημείο είναι 2ποια είναι η στάθμη σημαντικότητας του ελέγχου; 5. Χρησιμοποιώντας την προσέγγιση της διωνυμικής από την κανονική κατανομή να βρεθεί η στάθμη σημαντικότητας για 100 και το κρίσιμο σημείο είναι 10. 24
Άσκηση 4.2. Η διάρκεια ζωής ενός εξαρτήματος ακολουθεί την εκθετική κατανομή ; exp, 0,. Αν η συνολική διάρκεια ζωής 25 εξαρτημάτων ήταν 30, να ελεγχθεί αν η τιμή της παραμέτρου μπορεί να είναι 5, σε στάθμη σημαντικότητας a 0.05. Άσκηση 4.3. Δίνεται τυχαίο δείγμα,,, που ακολουθεί την κατανομή Bernoulli 1,. Με τη βοήθεια ελεγχοσυνάρτησης γενικευμένου λόγου πιθανοφανειών να ελεγχθεί η μηδενική υπόθεση :, έναντι της εναλλακτικής : σε στάθμη σημαντικότητας a 0.05. Να γίνει εφαρμογή για 0.85, 100 και 90. Άσκηση 4.4. Δίνεται τυχαίο δείγμα,,, που ακολουθεί γεωμετρική κατανομή με παράμετρο. Με τη βοήθεια ελεγχοσυνάρτησης γενικευμένου λόγου πιθανοφανειών να ελεγχθεί η μηδενική υπόθεση :, έναντι της εναλλακτικής : σε στάθμη σημαντικότητας a 0.05. 25
Άσκηση 4.5. Έναβιβλίοθεωρείταιότιδενέχειλάθηανημέσητιμήτωνλαθώνανά20 σελίδες είναι 1. Σ ένα βιβλίο 200 σελίδων βρέθηκαν 23 λάθη. Μπορεί να θεωρηθεί ότι το βιβλίο δεν έχει λάθη; Δίνεται a 0.05. Άσκηση 4.6. Δίνεται τυχαίο δείγμα,,, που ακολουθεί την κατανομή γάμμα,. Να ελεγχθεί η μηδενική υπόθεση :, έναντι της εναλλακτικής : με τη χρήση ελεγχοσυνάρτησης γενικευμένου λόγου πιθανοφανειών. Άσκηση 4.7. Δίνεται τυχαίο δείγμα,,, που ακολουθεί την κατανομή βήτα, 1. Να ελεγχθεί η μηδενική υπόθεση :, έναντι της εναλλακτικής : με τη χρήση ελεγχοσυνάρτησης γενικευμένου λόγου πιθανοφανειών. Άσκηση 4.8. Δίνεται τυχαίο δείγμα,,, που ακολουθεί την κατανομή Weibull με σταθερό. Να ελεγχθεί η μηδενική υπόθεση :, έναντι της εναλλακτικής : με τη χρήση ελεγχοσυνάρτησης γενικευμένου λόγου 26 πιθανοφανειών.
Άσκηση 4.9. Δίνεται τυχαίο δείγμα,,, που ακολουθεί την κατανομή Pareto με σταθερό. Να ελεγχθεί η μηδενική υπόθεση :, έναντι της εναλλακτικής : με τη χρήση ελεγχοσυνάρτησης γενικευμένου λόγου πιθανοφανειών. Άσκηση 4.10. Έστωσαν,,, και,,, δύο ανεξάρτητα τυχαία δείγματα από εκθετική κατανομή και, αντίστοιχα. Σε στάθμη σημαντικότητας να γίνει ο έλεγχος των υποθέσεων :, έναντι της εναλλακτικής :. Άσκηση 4.11. Έστωσαν και δύοανεξάρτητατυχαίαδείγματαμεγέθους και από κατανομή 1, και 1,, αντίστοιχα. Σε στάθμη σημαντικότητας να γίνει ο έλεγχος των υποθέσεων :, έναντι της εναλλακτικής :. 27
Άσκηση 4.12. Έστωσαν και δύο ανεξάρτητα τυχαία δείγματα μεγέθους και από κατανομή Weibull με παραμέτρους, και,, αντίστοιχα, όπου και είναι γνωστά. Σε στάθμη σημαντικότητας να γίνει ο έλεγχος των υποθέσεων :, έναντι της εναλλακτικής :. Άσκηση 4.13. Έστωσαν και δύοανεξάρτητατυχαίαδείγματαμεγέθους και από κατανομή Pareto με παραμέτρους, και,, αντίστοιχα, όπου και είναι γνωστά. Σε στάθμη σημαντικότητας να γίνει ο έλεγχος των υποθέσεων :, έναντι της εναλλακτικής :. 28
29
30