Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ. (Power of a Test) ΚΕΦΑΛΑΙΟ 21



Σχετικά έγγραφα
ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ ΚΕΦΑΛΑΙΟ 17

Έλεγχος Υποθέσεων. Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς

Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης

Στατιστικός έλεγχος υποθέσεων (Μέρος 1 ο ) 24/2/2017

Στατιστικός έλεγχος υποθέσεων (Μέρος 1 ο )

Στατιστική Ι. Ενότητα 9: Κατανομή t-έλεγχος Υποθέσεων. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

2.5.1 ΕΚΤΙΜΗΣΗ ΠΟΣΟΣΤΙΑΙΩΝ ΣΗΜΕΙΩΝ ΜΙΑΣ ΚΑΤΑΝΟΜΗΣ

Κεφάλαιο 9. Έλεγχοι υποθέσεων

6 ο ΜΑΘΗΜΑ Έλεγχοι Υποθέσεων

2.5 ΕΛΕΓΧΟΣ ΠΟΣΟΣΤΙΑΙΩΝ ΣΗΜΕΙΩΝ ΜΙΑΣ ΚΑΤΑΝΟΜΗΣ (The Quantile Test)

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

Έλεγχος Υποθέσεων (Hypothesis Testing)

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Εργαστήριο Μαθηματικών & Στατιστικής 2η Πρόοδος στο Μάθημα Στατιστική 28/01/2011 (Για τα Τμήματα Ε.Τ.Τ. και Γ.Β.) 1ο Θέμα [40] α) στ) 2ο Θέμα [40]

Κεφάλαιο 9. Έλεγχοι υποθέσεων

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Στατιστική Επιχειρήσεων ΙΙ

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 22 Μαΐου /32

2.4 ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ ΓΙΑ ΜΙΑ ΠΙΘΑΝΟΤΗΤΑ

ΠΕΡΙΓΡΑΦΙΚΗ και ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

Στατιστική Ι. Ενότητα 1: Στατιστική Ι (1/4) Αναπλ. Καθηγητής Νικόλαος Σαριαννίδης Τμήμα Διοίκησης Επιχειρήσεων (Κοζάνη)

Έλεγχοι Υποθέσεων. Χρήση της Στατιστικής. Η λογική του Ελέγχου Υπόθεσης Ο Έλεγχος Υπόθεσης 7-2

5 o Μάθημα Έλεγχοι Υποθέσεων

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Γ. Πειραματισμός - Βιομετρία

Οικονομετρία. Απλή Παλινδρόμηση. Έλεγχοι υποθέσεων και διαστήματα εμπιστοσύνης των συντελεστών. Τμήμα: Αγροτικής Οικονομίας & Ανάπτυξης

Εισαγωγή στην Εκτιμητική

5.1 Ο ΕΛΕΓΧΟΣ SMIRNOV

Μεθοδολογία των Επιστημών του Ανθρώπου: Στατιστική

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΑΠΟ ΤΟ ΔΕΙΓΜΑ ΣΤΟΝ ΠΛΗΘΥΣΜΟ

ΕΛΕΓΧΟΣ ΣΤΑΤΙΣΤΙΚΩΝ ΥΠΟΘΕΣΕΩΝ. Επαγωγική στατιστική (Στατιστική Συμπερασματολογία) Εκτιμητική Έλεγχος Στατιστικών Υποθέσεων

Ανάλυση διακύμανσης (Μέρος 1 ο ) 17/3/2017

Έλεγχος υπόθεσης: διαδικασία αποδοχής ή απόρριψης της υπόθεσης

Περιγραφική Ανάλυση ποσοτικών μεταβλητών

Διάλεξη 1 Βασικές έννοιες

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Εισόδημα Κατανάλωση

Για το δείγμα από την παραγωγή της εταιρείας τροφίμων δίνεται επίσης ότι, = 1.3 και για το δείγμα από το συνεταιρισμό ότι, x

Γραπτή Εξέταση Περιόδου Φεβρουαρίου 2013 στη Στατιστική

Κεφάλαιο 10 Εισαγωγή στην Εκτίμηση

Σύγκριση μέσου όρου πληθυσμού με τιμή ελέγχου. One-Sample t-test

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium Iii

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΚΕΦΑΛΑΙΟ 9. Κατανομές Δειγματοληψίας

3. ΣΕΙΡΙΑΚΟΣ ΣΥΝΤΕΛΕΣΤΗΣ ΣΥΣΧΕΤΙΣΗΣ

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ. Κεφάλαιο 10. Εισαγωγή στην εκτιμητική

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

Περιπτώσεις που η στατιστική συνάρτηση ελέγχου είναι η Ζ: 1. Η σ είναι γνωστή και ο πληθυσμός κανονικός.

Πινάκες συνάφειας. Βαρύτητα συμπτωμάτων. Φύλο Χαμηλή Υψηλή. Άνδρες. Γυναίκες

ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ

Στατιστική. Ανάλυση ιασποράς με ένα Παράγοντα. One-Way Anova. 8.2 Προϋποθέσεις για την εφαρμογή της Ανάλυσης ιασποράς

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

Δειγματοληπτικές κατανομές

Κεφάλαιο 9 Κατανομές Δειγματοληψίας

1. Εισαγωγή Ο έλεγχος υποθέσεων αναφέρεται στις ιδιότητες µιας άγνωστης παραµέτρους του πληθυσµού: Ο κατηγορούµενος είναι αθώος

6.3 Ο ΑΜΦΙΠΛΕΥΡΟΣ ΕΛΕΓΧΟΣ SMIRNOV ΓΙΑ k ΑΝΕΞΑΡΤΗΤΑ ΔΕΙΓΜΑΤΑ

ΚΕΦΑΛΑΙΟ II ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ 1. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΕΝΑ ΚΡΙΤΗΡΙΟ 2. ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΔΥΟ ΚΡΙΤΗΡΙΑ

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 14 Μαρτίου /34

Μέρος IV. Ελεγχοι Υποθέσεων (Hypothesis Testing)

Διαστήματα εμπιστοσύνης. Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς

2. ΕΠΙΛΟΓΗ ΜΟΝΤΕΛΟΥ ΜΕ ΤΗ ΜΕΘΟΔΟ ΤΟΥ ΑΠΟΚΛΕΙΣΜΟΥ ΜΕΤΑΒΛΗΤΩΝ (Backward Elimination Procedure) Στην στατιστική βιβλιογραφία υπάρχουν πολλές μέθοδοι για

Αναλυτική Στατιστική

Δειγματοληψία. Πρέπει να γνωρίζουμε πως πήραμε το δείγμα Το πλήθος n ij των παρατηρήσεων σε κάθε κελί είναι τ.μ. με μ ij συμβολίζουμε την μέση τιμή:

Στατιστική Ι. Ενότητα 8: Επαγωγική Στατιστική. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ. ΜΑΘΗΜΑ 4ο

Ενότητα 2: Έλεγχοι Υποθέσεων Διαστήματα Εμπιστοσύνης

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 2 Μαΐου /23

Διαδικασία Ελέγχου Μηδενικών Υποθέσεων

ΤΕΙ Αθήνας Μεθοδολογία της έρευνας και Ιατρική στατιστική

Στατιστική Συμπερασματολογία

4 o Μάθημα Διάστημα Εμπιστοσύνης του Μέσου

4.3.3 Ο Έλεγχος των Shapiro-Wilk για την Κανονική Κατανομή

Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 19/5/2017

Ανάλυση Διασποράς Ανάλυση Διασποράς διακύμανση κατά παράγοντες διακύμανση σφάλματος Παράδειγμα 1: Ισομεγέθη δείγματα

ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Τραπεζικής & Χρηματοοικονομικής

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium iv

Στατιστική για Οικονομολόγους ΙΙ ΛΥΜΕΝΑ ΘΕΜΑΤΑ παλαιοτέρων ετών από «ανώνυμο φοιτητή» (Στις ΛΥΣΕΙΣ ενδεχομένως να υπάρχουν λάθη. )

4 o Μάθημα Διάστημα Εμπιστοσύνης του Μέσου

Ενότητα 3. Έλεγχος υπόθεσης. Σύγκριση μέσων τιμών

3.4.2 Ο Συντελεστής Συσχέτισης τ Του Kendall

X = = 81 9 = 9

Μεθοδολογία των επιστημών του Ανθρώπου : Στατιστική Εργαστήριο 6 :

συγκέντρωση της ουσίας στον παραπόταμο είναι αυξημένη σε σχέση με τον ίδιο τον ποταμό;

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης

Χρονικές σειρές 2 Ο μάθημα: Εισαγωγή στις χρονοσειρές

10.7 Λυμένες Ασκήσεις για Διαστήματα Εμπιστοσύνης

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Σημειακή εκτίμηση και εκτίμηση με διάστημα. 11 η Διάλεξη

ΣΧ0ΛΗ ΤΕΧΝ0Λ0ΓΙΑΣ ΤΡΟΦΙΜΩΝ & ΔΙΑΤΡΟΦΗΣ ΤΜΗΜΑ ΤΕΧΝΟΛΟΓΙΑΣ ΤΡΟΦΙΜΩΝ ΕΡΓΑΣΤΗΡΙΟ: ΟΡΓΑΝΟΛΗΠΤΙΚΟΥ ΕΛΕΓΧΟΥ ΓΙΑΝΝΑΚΟΥΡΟΥ ΜΑΡΙΑ ΤΑΛΕΛΛΗ ΑΙΚΑΤΕΡΙΝΗ

Η Διωνυμική Κατανομή. μαθηματικών. 2 Ο γονότυπος μπορεί να είναι ΑΑ, Αα ή αα.

ΜΕΤΑ-ΑΝΑΛΥΣΗ (Meta-Analysis)

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS)

21/11/2016. Στατιστική Ι. 8 η Διάλεξη (Κεντρικό Οριακό Θεώρημα)

Στατιστικός έλεγχος υποθέσεων (Μέρος 2 ο ) 3/3/2017

Ενδεικτικές ασκήσεις ΔΙΠ 50

Οι στατιστικοί έλεγχοι x τετράγωνο, t- test, ANOVA & Correlation. Σταμάτης Πουλακιδάκος

ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ. Παπάνα Αγγελική

Transcript:

ΚΕΦΑΛΑΙΟ 21 Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ (Power of a Test) Όπως είδαμε προηγουμένως, στον Στατιστικό Έλεγχο Υποθέσεων, ορίζουμε δύο είδη πιθανών λαθών (κινδύνων) που μπορεί να συμβούν όταν παίρνουμε αποφάσεις για κάποια παράμετρο του πληθυσμού με βάση ενδείξεις από ένα δείγμα. Το α αναφέρεται στην πιθανότητα απόρριψης της μηδενικής υπόθεσης παρ ότι η μηδενική υπόθεση είναι σωστή και δεν θα έπρεπε να είχε απορριφθεί, ενώ το β εκφράζει την πιθανότητα της μη απόρριψης της μηδενικής υπόθεσης παρ ότι η μηδενική υπόθεση είναι λανθασμένη και θα έπρεπε να έχει απορριφθεί. Με 1-β ορίσαμε την ισχύ ενός ελέγχου. Η ισχύς ενός ελέγχου (1-β) αποτελεί μια ένδειξη της ευαισθησίας της στατιστικής διαδικασίας με μέτρo την πιθανότητα απόρριψης της μηδενικής υπόθεσης όταν αυτή είναι λανθασμένη και θα πρέπει πράγματι να απορριφθεί. Η ισχύς του στατιστικού ελέγχου εξαρτάται από το πόσο διαφέρει η πραγματική τιμή της παραμέτρου από την υποθετική τιμή της (την τιμή της κάτω από την υπόθεση Η 0 ). Εάν υπάρχει μεγάλη διαφορά μεταξύ της πραγματικής και της υποτιθέμενης τιμής της παραμέτρου, η ισχύς του ελέγχου θα είναι πολύ μεγαλύτερη από όσο όταν η διαφορά μεταξύ της πραγματικής και της υποτιθέμενης τιμής της παραμέτρου είναι μικρή. Στην συνέχεια, επικεντρώνουμε την προσοχή μας στην μελέτη της ισχύος ελέγχων για την μέση τιμή ενός πληθυσμού. (Αντίστοιχη είναι η προσέγγιση του προβλήματος για άλλες παραμέτρους). Ας εξετάσουμε πάλι το παράδειγμα της βιομηχανίας παρασκευής καφέ και την συγκεκριμένη συσκευασία που η εταιρεία ισχυρίζεται ότι έχει βάρος 368gr. Ένας πιο κατάλληλος τρόπος ορισμού της μηδενικής και της εναλλακτικής υπόθεσης από πλευράς της εταιρείας προστασίας καταναλωτών θα ήταν ο εξής: H 0 : μ 368 449

H 1 : μ < 368 Αυτή είναι μια σύνθετη υπόθεση και έχει έννοια δεδομένου ότι οι καταναλωτές δεν θα ενοχληθούν εάν η ποσότητα καφέ που περιέχεται στην συσκευασία είναι μεγαλύτερη από αυτή που αναγράφεται στην συσκευασία. Για τις δοθείσες τιμές σ=15 και α=0.05, έχουμε ότι η μηδενική υπόθεση θα πρέπει να απορριφθεί αν σ Χ < μ 0 Ζ 1 a n ή, μετά την αντικατάσταση, ισοδύναμα αν 15 Χ < 368 ( 1. 645) 25 ή, ισοδύναμα, αν Χ < 363.065 Σύμφωνα με αυτό τον κανόνα λήψης απόφασης, αν σε ένα τυχαίο δείγμα 25 συσκευασιών έχουμε μέσο βάρος λιγότερο από 363.065gr, θα πρέπει να απορρίψουμε την μηδενική υπόθεση και, επομένως, η εταιρεία προστασίας καταναλωτών θα μπορεί να ισχυρισθεί ότι θα έχει τεκμηριώσει στατιστικά ότι ο ισχυρισμός της βιομηχανίας δεν ισχύει. Σε μια τέτοια περίπτωση, η ισχύς του ελέγχου μετρά την πιθανότητα να οδηγηθούμε στο συμπέρασμα ότι η διαδικασία δεν λειτουργεί κανονικά (ο ισχυρισμός της βιομηχανίας δεν ευσταθεί) για διαφορετικές τιμές του πραγματικού μέσου του πληθυσμού. Έστω, για παράδειγμα, ότι μας ενδιαφέρει να καθορίσουμε την πιθανότητα του ενδεχομένου να απορρίψουμε την μηδενική υπόθεση όταν η μέση τιμή του πληθυσμού είναι 360gr. Με βάση τον κανόνα απόκλισης που προαναφέραμε, θα πρέπει να καθορίσουμε την πιθανότητα (ή την περιοχή κάτω από την κανονική καμπύλη) που βρίσκεται αριστερά από την τιμή 363.065gr κάτω βέβαια από την υπόθεση ότι μ = μ 1 = 360gr. Χρησιμοποιώντας το κεντρικό οριακό θεώρημα, θα έχουμε ότι Ισχύς = P [ Χ < 363.065 μ = μ = 1 360 ] = 450

= P [ Χ 360 15 25 = P [Z < 1.02] = 363065. 60 < 15 25 ] = = 0.8461 (84.61%) Επομένως, η τιμή του β (πιθανότητα λάθους τύπου II) είναι: β = P (λάθους τύπου ΙΙ) = = 1-0.8461 = 0.1539 (15.39%) Με την ίδια διαδικασία, μπορούμε να καθορίσουμε την ισχύ του ελέγχου για οποιαδήποτε πραγματική τιμή μ της μέσης τιμής του πληθυσμού. Για να δώσουμε ένα ακόμη αριθμητικό παράδειγμα, έστω ότι η μέση τιμή μ ήταν ίση με 352gr. Έστω, δηλαδή, ότι μ = μ 2 = 352gr. Στην περίπτωση αυτή, η ισχύς του ελέγχου είναι: Ισχύς = P (Η 0 Η 1 ) = = P [ Χ < 363.065 μ = μ2 = 352] = = P [Z < 3.69] = 0.99989 (99.989%) Προφανώς, ισχύει ότι β = 1-0.99989 = 0.00011 (0.011%) Ας δοκιμάσουμε τώρα να υπολογίσουμε την ισχύ του ελέγχου όταν η πραγματική τιμή μ βρίσκεται κοντά στην τιμή που υποθέτει η μηδενική υπόθεση. Έστω, π.χ. ότι η πραγματική μέση τιμή είναι μ = μ3 = 367gr Τότε, Ισχύς = P (Η 0 Η 1 ) = = P [ Χ < 363.065 μ = μ3 = 367] = P [Z < -1.31] = = 0.951 (95.1%) Έτσι, θα είναι β = 1-0.951 = 0.9048 (90.48%) Όπως έχουμε ήδη αναφέρει, η γραφική παράσταση της ισχύος για διάφορες τιμές της πραγματικής μέσης τιμής μ ονομάζεται 451

καμπύλη ισχύος (power chart). Η καμπύλη αυτή για το παράδειγμά μας, και για διάφορες τιμές του μ, εμφανίζεται στο σχήμα που ακολουθεί. α = 0.005, σ = 15, n = 25 Περιοχή απόρριψης Ισχύς α = 0.05 Ισχύς = α = 0.951 368 Ισχύς = α = 0.8461 367 Ισχύς = α =0.99989 360 352 Καμπύλη ισχύος για τις συσκευασίες καφέ με εναλλακτική υπόθεση H 1 : μ < 368 452

Από το σχήμα αυτό, παρατηρούμε ότι στην περίπτωση μονόπλευρων (one-sided) ελέγχων υποθέσεων, η ισχύς αυξάνει απότομα (και πλησιάζει το 100%) όσο η πραγματική μέση τιμή του πληθυσμού θεωρείται ότι παίρνει τιμές μικρότερες από την υποθετική τιμή των 368gr. Είναι φανερό, ότι για αυτόν τον μονόπλευρο στατιστικό έλεγχο, όσο μικρότερη είναι η πραγματική μέση τιμή του πληθυσμού σε σχέση με την υποτιθέμενη μέση τιμή, τόσο μεγαλύτερη θα είναι η ισχύς του ελέγχου να επισημάνει αυτή την αναντιστοιχία. Σημείωση: Για τις περιπτώσεις βέβαια μονόπλευρων ελέγχων στις οποίες η πραγματική τιμή μ είναι μεγαλύτερη από την υποτιθέμενη θα ισχύει το αντίθετο. Όσο μεγαλύτερη είναι η πραγματική τιμή μ σε σχέση με την υποτιθέμενη, τόσο μεγαλύτερη θα είναι η ισχύς. Προφανώς, επίσης, για αμφίπλευρους ελέγχους, όσο μεγαλύτερη είναι η απόσταση μεταξύ της πραγματικής τιμής μ και της υποτιθέμενης τιμής μ 0, τόσο μεγαλύτερη θα είναι η ισχύς του ελέγχου. Από το άλλο μέρος, για τιμές του μ πλησίον της τιμής 368gr, η ισχύς είναι μάλλον μικρή, δοθέντος ότι ο έλεγχος δεν έχει την δυνατότητα να διαπιστώσει αποτελεσματικά μικρές διαφορές μεταξύ του πραγματικού μέσου του πληθυσμού και της υποτιθέμενης τιμής του, των 368gr. Εάν η πραγματική μέση τιμή του πληθυσμού ήταν 368gr, τότε η ισχύς του ελέγχου θα ήταν ίση με α, δοθέντος ότι η μηδενική υπόθεση θα ανταποκρινόταν στην πραγματικότητα. Οι δραστικές μεταβολές στην ισχύ ενός ελέγχου για διαφορετικές τιμές του πραγματικού μέσου του πληθυσμού γίνονται καλύτερα αντιληπτές με την παρατήρηση του παραπάνω σχήματος. Στο σχήμα αυτό βλέπουμε ότι, για το παράδειγμά μας, όταν ο πραγματικός μέσος του πληθυσμού δεν διαφέρει σημαντικά από την τιμή των 368gr, το ενδεχόμενο απόρριψης της μηδενικής υπόθεσης με βάση τον συγκεκριμένο κανόνα, έχει μικρή πιθανότητα. Αντίθετα, όταν ο πραγματικός μέσος του πληθυσμού απομακρυνθεί σημαντικά από την υποτεθείσα τιμή των 368gr, η ισχύς του ελέγχου αυξάνει σημαντικά πλησιάζοντας την μέγιστη τιμή του 100%. 453

Σημείωση: Η ανάπτυξη της έννοιας της ισχύος ενός ελέγχου έγινε μέχρι τώρα για μονόπλευρους ελέγχους σε ένα συγκεκριμένο επίπεδο σημαντικότητας (α=0.05) και για ένα συγκεκριμένο μέγεθος δείγματος (n=25). Στην συνέχεια, θα δούμε πως επηρεάζεται η ισχύς ενός ελέγχου όταν μεταβάλλονται: 1. το είδος του στατιστικού ελέγχου (μονόπλευρος σε αντίθεση με αμφίπλευρο έλεγχο) 2. το επίπεδο σημαντικότητας α και 3. το μέγεθος του δείγματος n. Η Ισχύς ενός Ελέγχου σε Σχέση με το Είδος του Ελέγχου Επιστρέφοντας στην αρχική θεώρηση του προβλήματος των συσκευασιών καφέ, ας θεωρήσουμε τον αμφίπλευρο στατιστικό έλεγχο H 0 : μ = 368 H 1 : μ 368 Για το ίδιο επίπεδο σημαντικότητας, την ίδια διακύμανση του πληθυσμού και το ίδιο μέγεθος του δείγματος, θα είχαμε ότι η μηδενική υπόθεση θα έπρεπε να απορριφθεί αν σ Χ < μ 0 Ζ1 α/2 n ή, αν σ Χ > μ 0 + Ζ1 α/2 n Αντικαθιστώντας, βρίσκουμε ότι για το συγκεκριμένο πρόβλημα, η Η 0 θα πρέπει να απορριφθεί αν Χ < 362.12 ή, αν Χ > 373.88 Επομένως, αν υποθέσουμε ότι η πραγματική μέση τιμή του υπό μελέτη πληθυσμού είναι μ = μ 1 = 360gr θα έχουμε ότι Ισχύς = P( Η 0 Η 1 ) = 454

= P ( Χ< 362.12 ή Χ > 373.88 μ=360) = = P (Ζ < 0.71 ή Ζ > 4.63) = = 0.7612 (76.12%) δηλαδή ότι β = 1-0.7612 = 0.2388 (23.88%) Η σύγκριση του αποτελέσματος αυτού με το αντίστοιχο αποτέλεσμα για μονόπλευρο έλεγχο και για τις ίδιες τιμές των α, σ και n, οδηγεί στο συμπέρασμα ότι ο μονόπλευρος έλεγχος είναι περισσότερο ισχυρός από τον αντίστοιχο αμφίπλευρο έλεγχο για μια συγκεκριμένη μέση τιμή του πληθυσμού. Οδηγούμεθα επομένως στο συμπέρασμα ότι αν δεν έχουμε κάποιες προηγούμενες πληροφορίες ή περιορισμόυς που μας επιτρέπουν, ή μας επιβάλλουν, να χρησιμοποιήσουμε μια συγκεκριμένη εναλλακτική υπόθεση, τότε ένας μονόπλευρος έλεγχος θα είναι περισσότερο ισχυρός από ό,τι ο αντίστοιχος αμφίπλευρος έλεγχος. Σε κάθε περίπτωση βέβαια εάν μας ενδιαφέρουν οι διαφορές από την μηδενική υπόθεση και όχι η κατεύθυνση της διαφοράς αυτής, τότε ο αμφίπλευρος έλεγχος είναι ο καταλληλότερος. Ισχύς και Επίπεδο Σημαντικότητας Έχουμε ήδη εξηγήσει ότι για ένα δoθέν μέγεθος δείγματος, ελάττωση του επιπέδου σημαντικότητας α συνεπάγεται αύξηση του β και επομένως μείωση της ισχύος του ελέγχου. Αυτό μπορεί να επιβεβαιωθεί με το παράδειγμα συσκευασιών καφέ. Ας εξετάσουμε πάλι την περίπτωση n=25 συσκευασιών, αλλά ας θεωρήσουμε για επίπεδο σημαντικότητας το α=0.01 (αντί της τιμής α=0.05 που είχαμε θεωρήσει μέχρι τώρα). Τότε, ο μονόπλευρος έλεγχος που είχαμε θεωρήσει αρχικά Η 0 : μ 368 Η 1 : μ < 368 θα οδηγεί σε απόρριψη της Η 0 αν σ X < μ 0 Z1 α n 455

ή, ισοδύναμα, αν 15 X < 368 (2.33) 15 25 ή, ισοδύναμα, αν Χ< 361.01 Επομένως, αν η πραγματική μέση τιμή του πληθυσμού είναι μ = μ 1 = 360gr, τότε η ισχύς του ελέγχου θα είναι Ισχύς = P (Η 0 Η 1 ) = = P ( Χ < 361.01 μ = μ 1 = 360gr) = = 0.6331 (63.31%) και β = 1-0.6331 = 0.36669 (36.69%) Αν συγκρίνουμε την ισχύ του ελέγχου (63.31%) στην οποία καταλήξαμε για α=0.01 με την ισχύ (84.61%) στην οποία είχαμε καταλήξει για α=0.05, παρατηρούμε ότι η ελάττωση της τιμής του επιπέδου σημαντικότητας από 0.05 σε 0.01 οδήγησε σε μία σημαντική μείωση της ισχύος του ελέγχου (και, προφανώς, αύξηση της τιμής του β). Ισχύς και Μέγεθος του Δείγματος Ας εξετάσουμε τώρα πώς μεταβάλλεται η ισχύς ενός ελέγχου σε σχέση με μεταβολές στο μέγεθος του δείγματος. Αναφερόμενοι και πάλι στον μονόπλευρο έλεγχο Η 0 : μ 368 Η 1 : μ < 368 των συσκευασιών καφέ, ας υποθέσουμε ότι για δεδομένο επίπεδο σημαντικότητας α=0.05 και σ=15, αυξάνουμε το μέγεθος του δείγματος σε 100 συσκευασίες. Στην περίπτωση αυτή, θα απορρίπτουμε τη μηδενική υπόθεση αν σ X < μ 0 Z1 α n ή, ισοδύναμα, αν 456

15 X < 368 (1.645 ) 15 100 ή, ισοδύναμα, αν Χ < 365.5325 Επομένως, αν η πραγματική μέση τιμή του πληθυσμού είναι μ = μ 1 = 360gr τότε η ισχύς του ελέγχου θα είναι Ισχύς = P(Η 0 Η 1 ) = = P ( Χ< 365.5325 μ = μ 1 = 360gr) = = P (Z < 3.69) = = 0.99989 (99.989%) και β = 1-0.99989 = 0.00011 (0.011%) Σύγκριση της ισχύος του ελέγχου αυτού με την ισχύ στην οποία είχαμε καταλήξει για τον ίδιο έλεγχο, αλλά με δείγμα μεγέθους n=25 οδηγεί στο συμπέρασμα ότι, όταν όλοι οι άλλοι παράγοντες παραμένουν σταθεροί, αύξηση του μεγέθους του δείγματος οδηγεί σε απότομη αύξηση της ισχύος του ελέγχου. Παράγοντες που Επηρεάζουν την Ισχύ των Ελέγχων: Συνοπτικά Συμπεράσματα Από τα παραδείγματα που εξετάσαμε και τα συμπεράσματα στα οποία καταλήξαμε, θα μπορούσαμε συνοπτικά να πούμε τα εξής για την ισχύ των ελέγχων υποθέσεων: Συμπέρασμα 1: Για ένα μονόπλευρο έλεγχο υπόθεσης με καθορισμένα τα α, σ και n, η ισχύς του ελέγχου είναι τόσο μεγαλύτερη όσο μεγαλύτερη είναι η απόσταση μεταξύ του πραγματικού μέσου μ 1 και του υποτιθέμενου μέσου μ 0 κάτω από την μηδενική υπόθεση. (Αυτό φυσικά ισχύει με την προϋπόθεση ότι έχει επιλεγεί η κατάλληλη κατεύθυνση για την εναλλακτική υπόθεση). Για ένα αμφίπλευρο έλεγχο υπόθεσης με καθορισμένα τα α, σ και n, η ισχύς του ελέγχου αυξάνεται όσο αυξάνεται η απόσταση μεταξύ του πραγματικού μέσου μ 1 και του υποτιθέμενου μ 0. 457

Συμπέρασμα 2: Για καθορισμένα α, σ και n και πραγματική μέση τιμή μ 1, ένας μονόπλευρος έλεγχος είναι περισσότερο ισχυρός από ό,τι ο αντίστοιχος αμφίπλευρος και, επομένως, θα πρέπει να χρησιμοποιείται σε περιπτώσεις που ο ερευνητής έχει την ευχέρεια να επιλέξει την κατεύθυνση της εναλλακτικής υπόθεσης. Συμπέρασμα 3: Για καθορισμένα σ και n και πραγματική μέση τιμή μ 1, όσο μεγαλύτερο είναι το επίπεδο σημαντικότητας α που επιλέγουμε, τόσο μικρότερη είναι η πιθανότητα λάθους τύπου II και, επομένως, τόσο μεγαλύτερη είναι η ισχύς του ελέγχου. Συμπέρασμα 4: Για ελέγχους με καθορισμένα α και σ, και πραγματική μέση τιμή μ 1, η ισχύς του ελέγχου αυξάνεται όταν αυξάνεται το μέγεθος του δείγματος n. Συμπέρασμα 5: Στους μονόπλευρους σύνθετους ελέγχους, το α παίρνει τη μέγιστη τιμή του όταν μ=μ 0. Επομένως, ελέγχοντας (καθορίζοντας) το α όταν μ=μ 0, εξασφαλίζουμε ότι η πιθανότητα λάθους τύπου I σε οποιαδήποτε άλλη τιμή του μ για την οποία ισχύει η Η 0 είναι μικρότερη από το α. (Αυτός είναι και ο λόγος που για τέτοιες μορφές ελέγχων ορίσαμε προηγουμένως το α=maxp(h 0 H 0 ). Το β σε παρόμοιους ελέγχους παίρνει τη μέγιστη τιμή όταν το μ πάρει μια τιμή πλησίον του μ 0. Σε πρακτικά προβλήματα όμως η πιθανότητα του λάθους που εκφράζεται με το β μας απασχολεί για τιμές του μ που απέχουν αρκετά από το μ 0, οπότε και ένα λάθος τύπου II θα είναι περισσότερο δαπανηρό. Σημείωση: Σε μερικές εφαρμογές, όπως π.χ. στον έλεγχο ποιότητας, ενδιαφέρει κυρίως η πιθανότητα αποδοχής της Η 0 για διαφορετικές τιμές του μ. Η πιθανότητα αυτή ονομάζεται πιθανότητα αποδοχής (acceptance probability) ή λειτουργικό χαρακτηριστικό (operating characteristic) του κανόνα απόφασης στο σημείο μ και συμβολίζεται, από πολλούς συγγραφείς, με P (H 0 ; μ) Η γραφική παράσταση της συνάρτησης αυτής ώς συνάρτησης του μ είναι αυτό που ονομάσαμε νωρίτερα καμπύλη λειτουργικών χαρακτηριστικών (operating characterisitc curve) ή, αλλιώς καμπύλη 458

πιθανότητας αποδοχής (acceptance probability curve). Επειδή οι δύο πιθανότητες από τις οποίες προκύπτουν η καμπύλη ισχύος και η καμπύλη λειτουργικών χαρακτηριστικών είναι συμπληρωματικές, είναι προφανές ότι γνωρίζοντας την μία είναι δυνατόν να κατασκευάσουμε την άλλη. Σημείωση: Στην μέχρι τώρα παρουσίαση της έννοιας της ισχύος ενός ελέγχου υποθέσαμε ότι η τυπική απόκλιση του πληθυσμού σ ήταν γνωστή. Στις περισσότερες εφαρμογές βέβαια το σ είναι άγνωστο και, επομένως, δεν μπορούμε να υπολογίσουμε τις ακριβείς πιθανότητες. Παρ όλα αυτά, είναι δυνατόν να κατασκευάσουμε και να μελετήσουμε την καμπύλη ισχύος χρησιμοποιώντας την δειγματική τυπική απόκλιση στην θέση της απόκλισης του πληθυσμού και την κατανομή t στην θέση της κανονικής κατανομής, με την προϋπόθεση βέβαια ότι οι πληθυσμοί που μελετάμε προσεγγίζουν την κανονική κατανομή. Για μεγάλα, βέβαια, δείγματα μπορούμε να εξακολουθούμε να χρησιμοποιούμε την κανονική κατανομή προκειμένου να μελετήσουμε την ισχύ λόγω της ικανοποιητικής προσέγγισης της κατανομής t από την κανονική κατανομή. Σημείωση: Ένα γενικό σχόλιο για την έννοια της ισχύος είναι ότι δεν χρησιμοποιείται ποτέ απευθείας στην ανάλυση των δεδομένων. Όταν μας ενδιαφέρει η μελέτη της σχέσης ενός συνόλου δεδομένων και τιμών της παραμέτρου διαφορετικών από τη γενική υπόθεση, χρειάζεται η κατασκευή κάποιου διαστήματος ή κάποιας άλλης μορφής εκτίμησης. Η συνάρτηση ισχύος είναι μια γενική ιδιότητα ενός ελέγχου και δεν μας παρέχει συγκεκριμένες πληροφορίες για το δεδομένο σύνολο των παρατηρήσεων. 459