5. Έλεγχοι Υποθέσεων
Υποθέσεις Η μηδενική υπόθεση Η (ή ΗΑ) εναλλακτική υπόθεση Δεχόμαστε Η Απορρίπτουμε Η Η σωστή Σωστή απόφαση -α Σφάλμα τύπου Ι α Η λάθος Σφάλμα τύπου ΙΙ β Σωστή απόφαση -β ΒΙΟ39-Έλεγχος Υποθέσεων
Σφάλματα-παράδειγμα Η Η -β μ β α α=p(απόρριψη της Η ) β=p(αποδοχή της Η ) μ Τα δύο σφάλματα μειώνονται ταυτόχρονα αν αυξηθεί το μέγεθος του δείγματος 3
Σφάλματα Σφάλμα τύπου Ι απόρριψη της μηδενικής υπόθεσης ενώ είναι σωστή Σφάλμα τύπου ΙΙ αποδοχή της μηδενικής υπόθεσης ενώ είναι λάθος α β πιθανότητα σφάλματος τύπου Ι (επίπεδο / στάθμη σημαντικότητας) πιθανότητα σφάλματος τύπου ΙΙ -β ισχύς ενός στατιστικού ελέγχου ΒΙΟ39-Έλεγχος Υποθέσεων 4
Διαδικασία ελέγχου υπόθεσης για μια παράμετρο θ () Ορίζουμε τη μηδενική υπόθεση και την εναλλακτική υπόθεση ή ή Ορίζουμε ένα κατάλληλο στατιστικό (ελεγχοσυνάρτηση) Z, T για μέση τιμή, χ, F για διασπορά κλπ. Καθορίζουμε το επίπεδο σημαντικότητας α Από σύμβαση =.5 (5%). Άλλες τιμές μπορούν να χρησιμοποιηθούν (π.χ..,.) Συλλογή δεδομένων 5
Διαδικασία ελέγχου υπόθεσης για μια παράμετρο θ () Υπολογίζουμε την τιμή του με βάση τα στοιχεία του δείγματος. Καθορίζουμε την περιοχή απόρριψης, της μηδενικής υπόθεσης Η, από τη σχέση P ˆ ) ( Ελέγχουμε αν η τιμή του στατιστικού ανήκει στην κρίσιμη περιοχή, οπότε απορρίπτουμε την Η. 6
Παράδειγμα Μηδενική υπόθεση Π.χ. στατιστικό T X S / ~ μικρό δείγμα από κανονικά κατανεμημένο πληθυσμό Περιοχή αποδοχής της Η -α α α ; Περιοχή απόρριψης της Η Περιοχή απόρριψης της Η Περιοχή αποδοχής της Η -α α - α ; P( T ; ; ) P( T ; ; ) 7
Παράδειγμα Περιοχή αποδοχής Περιοχή της Η απόρριψης της Η -α Περιοχή απόρριψης της Η P( T α/ α/ - α/ α/ ; / ; / ) ; / ; / ; / 8
-vlue Παρατηρούμενο επίπεδο σημαντικότητας (ή απλά σημαντικότητα) ενός ελέγχου, ονομάζεται η πιθανότητα να παρατηρηθεί μια τιμή του στατιστικού τόσο ακραία ή και περισσότερο από αυτήν που έδωσε το δείγμα, δεδομένου ότι η Η είναι αληθής. Μετράει το ενδεχόμενο οι διαφορές που βλέπουμε να είναι απλή σύμπτωση (τυχαία) Συγκρίνουμε το -vlue με το προκαθορισμένο επίπεδο σημαντικότητας (α) Αν α, συμπεραίνουμε ότι η Η είναι «απίθανο» να είναι αληθής και την απορρίπτουμε (στατιστικά σημαντικό αποτέλεσμα) διαφορετικά, συμπεραίνουμε ότι η είναι «πιθανό» να είναι αληθής και δεν την απορρίπτουμε (στατιστικά μη σημαντικό αποτέλεσμα) ΒΙΟ39-Έλεγχος Υποθέσεων 9
Δ.Ε. v E.Y. Τα Δ.Ε. δίνουν ένα εύρος τιμών μέσα στο οποίο με μια ορισμένη βεβαιότητα θα βρίσκεται η πληθυσμιακή τιμή της παραμέτρου, και άρα αυτή μπορεί ή δεν μπορεί να πάρει πιθανολογικά μια προκαθορισμένη τιμή. Οι Ε.Υ. ελέγχουν με μια συγκεκριμένη πιθανότητα σφάλματος α - αν μια προκαθορισμένη τιμή μπορεί να είναι τιμή της πληθυσμιακής παραμέτρου (χωρίς να κάνουν καμιά αναφορά στο εύρος των τιμών της πληθυσμιακής παραμέτρου). ΒΙΟ39-Έλεγχος Υποθέσεων
Ε.Υ. για τη μέση τιμή ενός πληθυσμού Μηδενική υπόθεση μεγάλο δείγμα, γνωστή ή άγνωστη Στατιστικό ή ~ (,) / S / N Περιοχές Απόρριψης της Η Μονόπλευρος έλεγχος Δίπλευρος έλεγχος / ΒΙΟ39-Έλεγχος Υποθέσεων
Ε.Υ. για τη μέση τιμή ενός πληθυσμού Μηδενική υπόθεση T ~ μικρό δείγμα, άγνωστη Στατιστικό Προϋπόθεση Ο πληθυσμός από τον οποίο προέρχεται το δείγμα πρέπει να είναι κανονικά κατανεμημένος S / Περιοχές Απόρριψης της Η Μονόπλευρος έλεγχος Δίπλευρος έλεγχος ; ; ; / ΒΙΟ39-Έλεγχος Υποθέσεων
ΒΙΟ39-Έλεγχος Υποθέσεων 3 Ε.Υ. για τη διασπορά ενός πληθυσμού Μηδενική υπόθεση Στατιστικό. Τιμή στατιστικού Προϋπόθεση Ο πληθυσμός από τον οποίο προέρχεται το δείγμα πρέπει να είναι κανονικά κατανεμημένος Περιοχές Απόρριψης της Η Μονόπλευρος έλεγχος Δίπλευρος έλεγχος ; ; ~ ) ( S ) ( / ; / ;
Ε.Υ. για τη διαφορά δύο πληθυσμιακών μέσων τιμών Ανεξάρτητα δείγματα Θεωρούμε δύο ανεξάρτητα δείγματα μεγέθους και επιλεγμένα από δύο πληθυσμούς με μέσες τιμές και και διασπορές και, αντίστοιχα. Μηδενική υπόθεση Μεγάλα δείγματα, γνωστές ή άγνωστες διασπορές Στατιστικό ( X X ) ( X X ) ή ~ N, ΒΙΟ39-Έλεγχος Υποθέσεων 4
ΒΙΟ39-Έλεγχος Υποθέσεων 5 Ε.Υ. για τη διαφορά δύο πληθυσμιακών μέσων τιμών Περιοχές Απόρριψης της Η Μονόπλευρος έλεγχος Δίπλευρος έλεγχος /
6 Ε.Υ. για τη διαφορά δύο πληθυσμιακών μέσων τιμών Μικρά δείγματα, άγνωστες αλλά ίσες διαπορές Τιμή στατιστικού Εκτιμήτρια κοινής διασποράς Περιοχές Απόρριψης της Η Προϋπόθεση Οι πληθυσμοί από τους οποίους προέρχονται τα δείγματα πρέπει να είναι κανονικά κατανεμημένοι Μονόπλευρος έλεγχος Δίπλευρος έλεγχος ; ; / ; ) (/ ) / ( x x ) ( ) ( S S S
7 Ε.Υ. για τη διαφορά δύο πληθυσμιακών μέσων τιμών Μικρά δείγματα, άγνωστες και άνισες διασπορές Τιμή στατιστικού Βαθμοί ελευθερίας (η τιμή ν στρογγυλεύεται στον πλησιέστερο ακέραιο ) Περιοχές Απόρριψης της Η Προϋπόθεση Οι πληθυσμοί από τους οποίους προέρχονται τα δείγματα πρέπει να είναι κανονικά κατανεμημένοι Μονόπλευρος έλεγχος Δίπλευρος έλεγχος ; ; / ; / / x x )] /( ) / [( )] /( ) / [( / /
Ε.Υ. για τη διαφορά δύο πληθυσμιακών μέσων τιμών Δείγματα εξαρτημένα - Ζευγαρωτές παρατηρήσεις Θεωρούμε δύο τυχαία δείγματα επιλεγμένα από δύο πληθυσμούς με μέσες τιμές και και διασπορές και, αντίστοιχα. Επιπλέον, κάθε στοιχείο του ενός δείγματος σχετίζεται με ένα στοιχείο του δευτέρου δείγματος. Έστω x, x,, x τα στοιχεία του ου δείγματος και x i τα στοιχεία του ου δείγματος. Αν και σχετίζονται, τότε η και δεν είναι ανεξάρτητες, ενώ οι διαφορές ανεξάρτητες και αποτελούν ένα τυχαίο δείγμα. x, x,, x x i x i x i x x i είναι i i i,,,, d ΒΙΟ39-Έλεγχος Υποθέσεων 8
9 Ε.Υ. για τη διαφορά δύο πληθυσμιακών μέσων τιμών Μικρά δείγματα Τιμή στατιστικό Περιοχές Απόρριψης της Η Προϋπόθεση Η κατανομή των διαφορών είναι κανονική Για μεγάλα δείγματα ισχύει Μονόπλευρος έλεγχος Δίπλευρος έλεγχος ; ; / ; d d / i d i d i i d d d ;
ΒΙΟ39-Έλεγχος Υποθέσεων Ε.Υ. για το λόγο δύο πληθυσμιακών διασπορών Μηδενική υπόθεση Στατιστικό. Τιμή στατιστικού Περιοχές Απόρριψης της Η Προϋπόθεση Οι πληθυσμοί από τους οποίους προέρχονται τα δείγματα πρέπει να είναι κανονικά κατανεμημένοι ή Μονόπλευρος έλεγχος Δίπλευρος έλεγχος f f f f ;, ;, / ;, / ;, f f f f, ~ F S S F f
Ε.Υ. για το λόγο δύο πληθυσμιακών διασπορών- Εναλλακτικά Εναλλακτική υπόθεση Τιμή στατιστικού Περιοχές Απόρριψης της Η f f f f f, ; f f f, ;, όταν f f, ; /, όταν f f, ; / ΒΙΟ39-Έλεγχος Υποθέσεων
E.Y. για μια πληθυσμιακή αναλογία Μια εκτιμήτρια της αναλογίας σε ένα διωνυμικό πείραμα είναι X το στατιστικό Pˆ, όπου Χ είναι ο αριθμός των επιτυχιών σε δοκιμές. x Σημειακή εκτίμηση της είναι η δειγματική αναλογία ˆ (το ποσοστό των επιτυχιών σε ένα τ.δ. μεγέθους ). Όταν το δεν περιμένουμε να είναι κοντά στο ή, τότε για μεγάλο (από το Κ. Ο. Θ.) η τ.μ. Pˆ έχει προσεγγιστικά κανονική κατανομή με μέση τιμή και διασπορά Pˆ Pˆ E( Pˆ ) Vr( Pˆ) ( ) Z Pˆ Pˆ Pˆ ~ N(,) ΒΙΟ39-Έλεγχος Υποθέσεων
E.Y. για μια πληθυσμιακή αναλογία Μηδενική υπόθεση Τιμή στατιστικό ˆ ( ) / x ( ) Περιοχές Απόρριψης της Η Μονόπλευρος έλεγχος Δίπλευρος έλεγχος / ΒΙΟ39-Έλεγχος Υποθέσεων 3
Ε.Υ. για τη διαφορά δύο πληθυσμιακών αναλογιών Θεωρούμε δύο πληθυσμούς που έχουν διωνυμική κατανομή με αναλογίες, αντίστοιχα. Μια εκτιμήτρια της διαφοράς είναι το στατιστικό που έχει προσεγγιστικά κανονική κατανομή, όταν τα δείγματα είναι μεγάλα και Pˆ Pˆ ( ) ( ) N, Επιλέγουμε από κάθε πληθυσμό ανεξάρτητα τ.δ. μεγέθους και, αντίστοιχα. Αν x και x είναι ο αριθμός των ``επιτυχιών'' σε κάθε δείγμα, τότε αν δ= x x τότε η καλύτερη σημειακή εκτίμηση της είναι ˆ x x και αν οι δειγματικές αναλογίες ˆ και ˆ είναι καλύτερες σημειακές εκτιμήσεις των και. ΒΙΟ39-Έλεγχος Υποθέσεων 4
ΒΙΟ39-Έλεγχος Υποθέσεων 5 Ε.Υ. για τη διαφορά δύο πληθυσμιακών αναλογιών Τιμή του στατιστικού, όπου όταν δ= και όταν Περιοχές Απόρριψης της Η Μονόπλευρος έλεγχος Δίπλευρος έλεγχος / ˆ ˆ ˆ) ˆ( ) ˆ ( ˆ ) ˆ ( ˆ
Έλεγχος Πολυωνυμικές δοκιμές Ανεξάρτητες δοκιμές (πλήθους ) με κ δυνατά αποτελέσματα. Κάθε δοκιμή έχει αποτέλεσμα που ανήκει σε μια από τις κ κατηγορίες i ( i,,..., ) πιθανότητα της i-κατηγορίας, με και σταθερή σε όλες τις δοκιμές i i i i πλήθος δοκιμών που το αποτέλεσμά τους ανήκει στην i-κατηγορία (συχνότητα της i-κατηγορίας) i i ΒΙΟ39-Έλεγχος Υποθέσεων 6
Έλεγχος - καλής προσαρμογής,...,, όπου i δοσμένες πιθανότητες, τέτοιες ώστε i i i i για κάποιο i ΒΙΟ39-Έλεγχος Υποθέσεων 7
Έλεγχοι Έστω x, x,..., x κατανομή συχνοτήτων με κ κατηγορίες. κατηγορία i οι τιμές ενός δείγματος. Σχηματίζουμε την i κ i i παρατηρούμενη συχνότητα της i-κατηγορίας θεωρητική (αναμενόμενη) συχνότητα της i-κατηγορίας, όταν η μηδενική υπόθεση είναι σωστή και i i 8
Έλεγχος - καλής προσαρμογής,...,, i i i i Το στατιστικό i ( i ) i i i i i ~ όταν 5, i,,, i Αν η τιμή του στατιστικού επίπεδο σημαντικότητας α. ;, η Η απορρίπτεται σε ΒΙΟ39-Έλεγχος Υποθέσεων 9
Έλεγχος - καλής προσαρμογής Ο περιορισμός 5, i,,, i είναι αρκετά αυστηρός. Ισχύει και ο περιορισμός του Cochr που είναι ελαστικότερος. Ο Cochr συνιστά για την εφαρμογή του ελέγχου, i και το πολύ % των να είναι μικρότερα του 5., i,,, i Πολλές φορές στον υπολογισμό των θεωρητικών μεγεθών χρειάζεται να εκτιμήσουμε (από το δείγμα που έχουμε) κάποια ή κάποιες παραμέτρους της κατανομής που ελέγχεται στην Η. Τότε η βαθμοί ελευθερίας της κατανομής είναι β ε. = κ- πλήθος εκτιμώμενων παραμέτρων - ΒΙΟ39-Έλεγχος Υποθέσεων 3