Μέρος IV. Ελεγχοι Υποθέσεων (ypothesis Testig) Βασικές έννοιες Γενική μεθοδολογία Σφάλμα τύπου Ι και -vlue Στατιστικοί έλεγχοι υποθέσεων για ειδικές περιπτώσεις Εφαρμοσμένη Στατιστική Μέρος 4 ο - Κ. Μπλέκας ()
Βασικές έννοιες Στατιστικός έλεγχος υποθέσεων μία συμπερασματική διαδικασία / μέθοδος σε στοχαστικά προβλήματα αποφάσεων μεταξύ δύο εναλλακτικών υποθέσεων μηδενική υπόθεση (ull hypothesis) εναλλακτική υπόθεση (ltertive hypothesis) Η βασική ιδέα είναι να θέτουμε ως μηδενική υπόθεση αυτή που αμφισβητούμε (αμφιβάλλουμε) και εξετάζοντας ένα τυχαίο δείγμα να δούμε εάν είναι ακραίο και προκύπτει σοβαρός λόγος απόρριψης της Η. Είδη σφαλμάτων (σφάλμα τύπου Ι)=(type I error)=(απόρριψη της Η Η true) (σφάλμα τύπου ΙI)=(type II error)=(μη απόρριψη της Η Η true) Εφαρμοσμένη Στατιστική Μέρος 4 ο - Κ. Μπλέκας (2)
Βασικές έννοιες (συν.) 2 μορφές ελέγχου Μονόπλευρος έλεγχος (oe tiled) Αμφίπλευρος έλεγχος (two tiled) 2 μεθοδολογίες Καθορίζοντας μία ανεκτή τιμή σφάλματος τύπου Ι Υπολογισμός της -τιμής του δείγματος Εφαρμοσμένη Στατιστική Μέρος 4 ο - Κ. Μπλέκας (3) ' δεξιόπλευρος αριστερόπλευρος
η μέθοδος με βάση τη τιμή σφάλματος τύπου Ι Βήματα της διαδικασίας ελέγχου. Ορίζουμε τις υποθέσεις, 2. Ορίζουμε το επίπεδο σημαντικότητας του ελέγχου 3. Ορίζουμε τη στατιστική συνάρτηση ελέγχου T(X) 4. Επιλογή τυχαίου δείγματος από τον πληθυσμό και υπολογισμός της τιμής της στατιστικής συνάρτησης ελέγχου 5. Ορίζουμε την περιοχή απόρριψης ή κρίσιμη περιοχή (criticl regio) του ελέγχου 6. Εξετάζουμε αν η τιμή της T(X) του τ.δ. βρίσκεται ή όχι στην κρίσιμη περιοχή, ώστε να αποφασίσουμε αν η θα απορριφθεί ή όχι Παρατηρήσεις Όταν απορρίπτεται η τότε το τυχαίο δείγμα ονομάζεται στατιστικά σημαντικό (sttisticlly sigifict) και σημαίνει ότι διαφέρει σημαντικά από αυτό που αναμενόταν από την Όσο πιο μικρή είναι η τιμή του επιπέδου σημαντικότητας, τόσο πιο σημαντικό στατιστικά είναι το αποτέλεσμα του ελέγχου. Εφαρμοσμένη Στατιστική Μέρος 4 ο - Κ. Μπλέκας (4)
2 η μέθοδος Υπολογισμός της -τιμής Υπολογίζουμε την πιθανότητα να εμφανιστεί η τιμή της στατιστικής συνάρτησης T(X) που εμφανίστηκε στο δείγμα ή κάποια τιμή μεγαλύτερη από αυτή, με δεδομένο ότι ισχύει η συνθήκη Η Αυτή η πιθανότητα ονομάζεται -τιμή (-vlue) του δείγματος Υπολογίζοντας την -τιμή γνωρίζουμε πόσο πιθανή είναι η εμφάνιση του δείγματος που πήραμε από την υπόθεση ότι η Η είναι αληθής. Ετσι, όσο πιο μικρή είναι η -τιμή, τόσο πιο ισχυρές είναι οι ενδείξεις απόρριψης της Η, ή αλλιώς τόσο πιο σημαντική είναι η τιμή της στατιστικής συνάρτησης ελέγχου. Αν -vlue => σε επίπεδο σημαντικότητας η Η απορρίπτεται Αν -vlue > => σε επίπεδο σημαντικότητας η Η δεν απορρίπτεται Δηλαδή -τιμή η ελάχιστη τιμή του επιπέδου σημαντικότητας για να απορριφθεί η Η -τιμή το μέτρο το οποίο εκφράζει πόσο ισχυρές είναι οι ενδείξεις που προκύπτουν από το δείγμα εναντίον της Η Εφαρμοσμένη Στατιστική Μέρος 4 ο - Κ. Μπλέκας (5)
Έλεγχοι υποθέσεων για συγκεκριμένες περιπτώσεις (Α) Στατιστικοί έλεγχοι υποθέσεων για τη μέση τιμή (μ) ενός πληθυσμού Ελέγχουμε την υπόθεση μ=μ (η άγνωστη μέση τιμή έχει τιμή μ) Διακρίνουμε 2 περιπτώσεις (α) γνωστή διασπορά (z-test) Βασιζόμαστε στο γνωστή σχέση του δειγματικού μέσου Εξετάζουμε τις 3 πιθανές εναλλακτικές υποθέσεις X Z ~ / N, (α) Η μ>μ X is true X / z όπου z = Φ - (-α) Εφαρμοσμένη Στατιστική Μέρος 4 ο - Κ. Μπλέκας (6)
Έλεγχοι υποθέσεων για συγκεκριμένες περιπτώσεις (συν.) (α2) Η μ<μ Φ - (α) = -Φ - (-α) = -z (α3) Η μ μ άρα περιοχή απόρριψης Εφαρμοσμένη Στατιστική Μέρος 4 ο - Κ. Μπλέκας (7) z X X / is true 2 / true is z Z Z Z X / 2 / 2 z z
Έλεγχοι υποθέσεων για συγκεκριμένες περιπτώσεις (β) άγνωστή διασπορά (t-test) Βασιζόμαστε στο γνωστή σχέση X ~ / όπου Παρόμοια για τις 3 πιθανές εναλλακτικές υποθέσεις έχουμε τις κρίσιμες περιοχές (περιοχές απόρριψης) Y t 2 X i X i 2 (β) Η = μ > μ (β2) Η = μ < μ β(3) Η = μ μ t t t / 2 t / 2 Εφαρμοσμένη Στατιστική Μέρος 4 ο - Κ. Μπλέκας (8)