5. Έλεγοι Υποθέσεων
Υποθέσεις Η : μηδενική υπόθεση Η (ή ΗΑ): εναλλακτική υπόθεση Σφάλματα εόμαστε Η Απορρίπτουμε Η Η σωστή Σωστή απόφαση -α Σφάλμα τύπου Ι α Η λάθος Σφάλμα τύπου ΙΙ β Σωστή απόφαση -β ΒΙΟ39-Έλεγος Υποθέσεων
Σφάλματα : μ = μ : μ > μ Η -β Η μ β α μ α=p(απόρριψη της Η μ = μ ) β=p(αποδοή της Η μ = μ ) ΒΙΟ39-Έλεγος Υποθέσεων 3
Σφάλματα Σφάλμα τύπου Ι : απόρριψη της μηδενικής υπόθεσης ενώ είναι σωστή Σφάλμα τύπου ΙΙ : αποδοή της μηδενικής υπόθεσης ενώ είναι λάθος α : πιθανότητα σφάλματος τύπου Ι (επίπεδο / στάθμη σημαντικότητας) β : πιθανότητα σφάλματος τύπου ΙΙ -β : ισύς ενός στατιστικού ελέγου ΒΙΟ39-Έλεγος Υποθέσεων 4
ιαδικασία ελέγου υπόθεσης για μια παράμετρο θ Ορίζουμε τη μηδενική υπόθεση : θ = θ Ορίζουμε την εναλλακτική υπόθεση : θ > θ ή θ < θ ή θ θ Καθορίζουμε το επίπεδο σημαντικότητας α Ορίζουμε ένα κατάλληλο στατιστικό (ελεγοσυνάρτηση) και υπολογίζουμε την τιμή του με βάση τα στοιεία ενός τυαίου δείγματος. Καθορίζουμε την περιοή απόρριψης R, της μηδενικής υπόθεσης Η, απότησέση P Θ ˆ R ) = Ελέγουμε αν η τιμή του στατιστικού ανήκει στην κρίσιμη περιοή R, οπότε απορρίπτουμε την Η. ( 5
Παράδειγμα Μηδενική υπόθεση Π.. στατιστικό : : μ > μ T : μ = μ X = ~ t S / μ : μ < μ Περιοή αποδοής της Η -α α Περιοή απόρριψης της Η Περιοή απόρριψης της Η α Περιοή αποδοής της Η -α t α -t α P( T R : > t { t > t } ) = P( T R : < t { t < t } ) = 6
Παράδειγμα : μ = μ : μ μ Περιοή απόρριψης Περιοή αποδοής της Η της Η -α Περιοή απόρριψης της Η P( T R : α/ α/ -t α/ t α/ > t / ) { t < t } { t > t } / = / 7
p-vlue Παρατηρούμενο επίπεδο σημαντικότητας (ή απλάσημαντικότητα) ενός ελέγου, ονομάζεται η πιθανότητα να παρατηρηθεί μια τιμή του στατιστικού τόσο ή και περισσότερο ακραία από αυτήν που έδωσε το δείγμα, δεδομένου ότι η Η είναι αληθής. Η Η απορρίπτεται εάν η παρατηρούμενη σημαντικότητα (p-vlue) είναι μικρότερη ή ίση με το α. ΒΙΟ39-Έλεγος Υποθέσεων 8
Ε.Υ. για τη μέση τιμή ενός πληθυσμού Μηδενική υπόθεση: : μ = μ μεγάλο δείγμα, γνωστή ή άγνωστη σ Στατιστικό Χ μ Χ μ Ζ = ή Ζ = ~ (,) σ / S / N Περιοές Απόρριψης της Η Μονόπλευρος έλεγος ίπλευρος έλεγος : μ > μ : μ < μ R : R : { z > z} { z < z } { z z } > : μ μ R : / ΒΙΟ39-Έλεγος Υποθέσεων 9
Ε.Υ. για τη μέση τιμή ενός πληθυσμού Μηδενική υπόθεση: : μ = μ Χ μ μικρό δείγμα, σ άγνωστη Στατιστικό T = ~ t Προϋπόθεση: Ο πληθυσμός από τον οποίο προέρεται το δείγμα πρέπει να είναι κανονικά κατανεμημένος S / Μονόπλευρος έλεγος Περιοές Απόρριψης της Η ίπλευρος έλεγος : μ > μ : μ < μ R : R : { t > t ; } { t < t } ; { t > } : μ μ R : t ; / ΒΙΟ39-Έλεγος Υποθέσεων
Σετικά με Ε.Υ. για τη μ.τ. ενός πληθυσμού α=p(απόρριψης της Η Η σωστή) β=p(αποδοής της Η Η λάθος) -β=p(απόρριψης της Η Η λάθος) (ισύς του ελέγου) δ = ελάιστη διαφορά μεταξύ μ και μ Μονόπλευρος έλεγος ίπλευρος έλεγος Ελάιστος αριθμός μετρήσεων Ισύς του ελέγου Ελάιστη διαφορά = ( t ; α + t ; β ) δ δ = ( t ; α / + t ; β ) t ; β = t ; α t ; β = t ; α / δ / = ( t ; α + t ; β ) δ / δ δ = ( t ; α / + t ; β )
ΒΙΟ39-Έλεγος Υποθέσεων Ε.Υ. για τη διασπορά ενός πληθυσμού Μηδενική υπόθεση: Στατιστικό. Τιμή στατιστικού Προϋπόθεση: Ο πληθυσμός από τον οποίο προέρεται το δείγμα πρέπει να είναι κανονικά κατανεμημένος Περιοές Απόρριψης της Η : σ σ = Μονόπλευρος έλεγος ίπλευρος έλεγος { } { } ; ; : : : : R R < < > > σ σ σ σ ~ ) ( S σ ) ( σ = { } { } / ; / ; : : R > < σ σ
Σετικά με Ε.Υ. για τη διασπορά ενός πληθυσμού Ισύς ελέγου και μέγεθος δείγματος για ελέγους σετικούς με τη διασπορά J.. Zr, Biottiticl Alyi, Pretice-ll Itertiol, Ic. W. P. Grdier, Sttitic for the Biociece Pretice ll 3
Ε.Υ. για τη διαφορά δύο πληθυσμιακών μέσων τιμών Ανεξάρτητα δείγματα Θεωρούμε δύο ανεξάρτητα δείγματα μεγέθους και επιλεγμένα από δύο πληθυσμούς με μέσες τιμές μ και και μ διασπορές και, αντίστοια. σ σ Μηδενική υπόθεση: : μ μ = δ Μεγάλα δείγματα, γνωστές ή άγνωστες διασπορές Στατιστικό ( X X ) δ ( X X ) δ ή ~ N σ σ + + (,) ΒΙΟ39-Έλεγος Υποθέσεων 4
Ε.Υ. για τη διαφορά δύο πληθυσμιακών μέσων τιμών Περιοές Απόρριψης της Η Μονόπλευρος έλεγος ίπλευρος έλεγος { z > z} { z < z } : μ μ > δ R : : μ μ δ R :{ z > z / } : μ μ < δ R : ΒΙΟ39-Έλεγος Υποθέσεων 5
Ε.Υ. για τη διαφορά δύο πληθυσμιακών μέσων τιμών Μικρά δείγματα, άγνωστες αλλά ίσες διαπορές Τιμή στατιστικού t = x x p + δ ( / ) (/ ) Περιοές Απόρριψης της Η Εκτιμήτρια κοινής διασποράς S p ( = ) S + ( ) S + Μονόπλευρος έλεγος : μ μ > δ R : : μ μ < δ R : { t > t } + ; { t < t } + ; ίπλευρος έλεγος { t > } : μ μ δ R : t + ; / Προϋπόθεση: Οι πληθυσμοί από τους οποίους προέρονται τα δείγματα πρέπει να είναι κανονικά κατανεμημένοι 6
7 Ε.Υ. για τη διαφορά δύο πληθυσμιακών μέσων τιμών Μικρά δείγματα, άγνωστες και άνισες διασπορές Τιμή στατιστικού Βαθμοί ελευθερίας Περιοές Απόρριψης της Η Προϋπόθεση: Οι πληθυσμοί από τους οποίους προέρονται τα δείγματα πρέπει να είναι κανονικά κατανεμημένοι Μονόπλευρος έλεγος ίπλευρος έλεγος { } { } t t R t t R ; ; : : : : ν ν δ μ μ δ μ μ < < > > { } / ; : : t t R ν δ μ μ > / / x x t + = δ ( ) )] /( ) / [( )] /( ) / [( / / + + = ν
Ε.Υ. για τη διαφορά δύο πληθυσμιακών μέσων τιμών είγματα εξαρτημένα - Ζευγαρωτές παρατηρήσεις Θεωρούμε δύο τυαία δείγματα επιλεγμένα από δύο πληθυσμούς με μέσες τιμές και και διασπορές και, αντίστοια. Επιπλέον, κάθε στοιείο του ενός δείγματος σετίζεται με ένα στοιείο του δευτέρου δείγματος. Έστω μ μ x, x, K, x σ σ τα στοιεία του ου δείγματος και x i τα στοιεία του ου δείγματος. Αν και σετίζονται, τότε η και δεν είναι ανεξάρτητες, ενώ οι διαφορές ανεξάρτητες και αποτελούν ένα τυαίο δείγμα. x, x, K, x x i x i x i x x i είναι i = i i, =,, L, d ΒΙΟ39-Έλεγος Υποθέσεων 8
Ε.Υ. για τη διαφορά δύο πληθυσμιακών μέσων τιμών Μικρά δείγματα Τιμή στατιστικό t d δ = d = i= d / d i d = ( d i d ) i= Περιοές Απόρριψης της Η Μονόπλευρος έλεγος ίπλευρος έλεγος : μ μ > δ R : : μ μ < δ R : { t > t ; } { t < t } ; { t > } : μ μ δ R : t ; / Προϋπόθεση: Η κατανομή των διαφορών είναι κανονική Γιαμεγάλαδείγματαισύει t = ; z 9
Ε.Υ. για το λόγο δύο πληθυσμιακών διασπορών Μηδενική υπόθεση: Στατιστικό F σ S σ = ~ F, S σ : = ή σ = σ σ. Τιμή στατιστικού f = : σ : σ Περιοές Απόρριψης της Η Μονόπλευρος έλεγος ίπλευρος έλεγος > σ < σ R : R : { f > f }, ; { f < f }, ; R : : σ σ { f < f } { f f }, ; / >, ; / Προϋπόθεση: Οι πληθυσμοί από τους οποίους προέρονται τα δείγματα πρέπει να είναι κανονικά κατανεμημένοι ΒΙΟ39-Έλεγος Υποθέσεων
Ε.Υ. για το λόγο δύο πληθυσμιακών διασπορών- Εναλλακτικά Εναλλακτική υπόθεση Τιμή στατιστικού Περιοές Απόρριψης της Η : σ > σ : σ < σ : σ σ f = { f > } R : f, ; R f = R :{ f > f, ; } f =, όταν > f, όταν < { f > } : f, ; / = R :{ f > f, ; / } ΒΙΟ39-Έλεγος Υποθέσεων
E.Y. για μια πληθυσμιακή αναλογία Μιαεκτιμήτριατηςαναλογίαςp σεέναδιωνυμικόπείραμαείναι X το στατιστικό P ˆ =, όπου Χ είναι ο αριθμός των επιτυιών σε δοκιμές. x Σημειακή εκτίμηση της p είναι η δειγματική αναλογία p ˆ = (το ποσοστό των επιτυιών σε ένα τ.δ. μεγέθους ). Όταν το p δεν περιμένουμε να είναι κοντά στο ή, τότε για μεγάλο (από το Κ. Ο. Θ.) ητ.μ. Pˆ έει προσεγγιστικά κανονική κατανομή με μέση τιμή και διασπορά μ ˆ σ = E( Pˆ ) = P Pˆ = Vr( Pˆ) p p( = p) Z = Pˆ μ σ Pˆ Pˆ ~ N(,) ΒΙΟ39-Έλεγος Υποθέσεων
E.Y. για μια πληθυσμιακή αναλογία Μηδενική υπόθεση: : p = p Τιμή στατιστικό z = pˆ p p ( p ) / = x p p ( p ) Περιοές Απόρριψης της Η Μονόπλευρος έλεγος ίπλευρος έλεγος : : p p > < p p R : R : { z > z} { z < z } { z z } > : p p R : / ΒΙΟ39-Έλεγος Υποθέσεων 3
E.Y. για μια πληθυσμιακή αναλογία Όταν το μέγεθος του δείγματος είναι μικρό η παραπάνω προσέγγιση δεν μπορεί να ρησιμοποιηθεί. Σε αυτές τις περιπτώσεις είμαστε υπορεωμένοι να ρησιμοποιήσουμε τη διωνυμική κατανομή. Επειδή η τ.μ. Χ ( αριθμός των επιτυιών σε ένα τ.δ. μεγέθους ) είναι διακριτή δεν μπορούμε να βρούμε μια κρίσιμη περιοή για προκαθορισμένο επίπεδο σημαντικότητας. Ο έλεγος της υπόθεσης βασίζεται στη σημαντικότητα του ελέγου (p-vlue). Ο υπολογισμός της πιθανότητας p βασίζεται στη διωνυμική κατανομή και εξαρτάται από την εναλλακτική υπόθεση. ΒΙΟ39-Έλεγος Υποθέσεων 4
E.Y. για μια πληθυσμιακή αναλογία Εναλλακτική υπόθεση : p > p P-vlue p = P = ( X x p p ) : p < p p = P( X x p = p ) : p p p = P( X x p = p ) αν x < p p = P( X x p = p ) αν x p Όταν το p είναι μικρότερο από ένα προκαθορισμένο α, η Η απορρίπτεται ΒΙΟ39-Έλεγος Υποθέσεων 5
Ε.Υ. για τη διαφορά δύο πληθυσμιακών αναλογιών : p p = δ Θεωρούμε δύο πληθυσμούς που έουν διωνυμική κατανομή με αναλογίες p, αντίστοια. Μια εκτιμήτρια της διαφοράς p είναι το στατιστικό που έει προσεγγιστικά κανονική κατανομή, όταν τα δείγματα είναι μεγάλα και Pˆ Pˆ p( p) p ( p ) N p p, + Επιλέγουμε από κάθε πληθυσμό ανεξάρτητα τ.δ. μεγέθους και, αντίστοια. Αν x και x είναι ο αριθμός των ``επιτυιών'' σε κάθε δείγμα, τότε αν δ= x + x τότε η καλύτερη σημειακή εκτίμηση της p = p = p είναι pˆ = x x + και αν δ οι δειγματικές αναλογίες p ˆ = και p ˆ = είναι καλύτερες σημειακές εκτιμήσεις των και. p p p p ΒΙΟ39-Έλεγος Υποθέσεων 6
= Ε.Υ. για τη διαφορά δύο πληθυσμιακών αναλογιών Τιμή του στατιστικού: pˆ( pˆ) + z = p p ˆ ˆ δ, όπου pˆ ( pˆ ) pˆ ˆ ( p ) όταν δ= και = + όταν δ Περιοές Απόρριψης της Η Μονόπλευρος έλεγος ίπλευρος έλεγος : : p p p p { z > z} { z < z } > δ R : : p p δ R :{ z > z / } < δ R : ΒΙΟ39-Έλεγος Υποθέσεων 7
Έλεγος Πολυωνυμικές δοκιμές Ανεξάρτητες δοκιμές (πλήθους ) με κ δυνατά αποτελέσματα. Κάθε δοκιμή έει αποτέλεσμα που ανήκει σε μια από τις κ κατηγορίες p i ( i =,,..., κ) πιθανότητα της i-κατηγορίας, με και σταθερή σε όλες τις δοκιμές p i κ i= p i = i : πλήθος δοκιμών που το αποτέλεσμά τους ανήκει στην i-κατηγορία (συνότητα της i-κατηγορίας) κ i= i = ΒΙΟ39-Έλεγος Υποθέσεων 8
Έλεγος - καλής προσαρμογής,..., = : p = p, p = p p κ pκ όπου p i δοσμένες πιθανότητες, τέτοιες ώστε κ i= p = i p i p : i για κάποιο i ΒΙΟ39-Έλεγος Υποθέσεων 9
Έλεγοι x, x,..., x Έστω οι τιμές ενός δείγματος. Σηματίζουμε την κατανομή συνοτήτων με κ κατηγορίες. κατηγορία i θ i θ M κ M κ θ M θ κ i θ i : παρατηρούμενη συνότητα της i-κατηγορίας : θεωρητική (αναμενόμενη) συνότητα της i-κατηγορίας, ότανημηδενικήυπόθεσηείναισωστήκαι θ = i p i 3
Έλεγος - καλής προσαρμογής,..., = : p = p, p = p p κ pκ p i p : i κ i= p = i Το στατιστικό ( θ ) κ κ i i i = = ~ κ i= θ i i= θ i όταν θ 5, i =,, L,κ i Ανητιμήτουστατιστικού επίπεδο σημαντικότητας α. > κ ;, η Η απορρίπτεται σε ΒΙΟ39-Έλεγος Υποθέσεων 3
Έλεγος - καλής προσαρμογής Ο περιορισμός θ i 5, i =,, L,κ είναι αρκετά αυστηρός. Ισύει και ο περιορισμός του Cochr που είναι ελαστικότερος. Ο Cochr συνιστά για την εφαρμογή του ελέγου, θ i, i =,, L,κ και το πολύ % των να είναι μικρότερα του 5. θ i Πολλές φορές στον υπολογισμό των θεωρητικών μεγεθών ρειάζεται να εκτιμήσουμε (απότοδείγμαπουέουμε) κάποια ή κάποιεςπαραμέτρουςτηςκατανομήςπουελέγεταιστηνη. Τότε η βαθμοί ελευθερίας της κατανομής είναι : βε. = κ- πλήθος εκτιμώμενων παραμέτρων - ΒΙΟ39-Έλεγος Υποθέσεων 3