ΠΑΝΕΠΙΣΤΗΜΙΟ ΙΩΑΝΝΙΝΩΝ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Εφαρμοσμένη Στατιστική Έλεγχοι υποθέσεων Διδάσκων: Επίκουρος Καθηγητής Κωνσταντίνος Μπλέκας
Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Cretive Commos. Για εκπαιδευτικό υλικό, όπως εικόνες, που υπόκειται σε άλλου τύπου άδειας χρήσης, η άδεια χρήσης αναφέρεται ρητώς.
Μέρος IV. Ελεγχοι Υποθέσεων (Hypothesis Testig) Βασικές έννοιες Γενική μεθοδολογία: Σφάλμα τύπου Ι και P-vlue Στατιστικοί έλεγχοι υποθέσεων για ειδικές περιπτώσεις Εφαρμοσμένη Στατιστική Μέρος 4 ο -1 Κ. Μπλέκας (1)
Βασικές έννοιες Στατιστικός έλεγχος υποθέσεων: μία συμπερασματική διαδικασία / μέθοδος σε στοχαστικά προβλήματα αποφάσεων μεταξύ δύο εναλλακτικών υποθέσεων: H : μηδενική υπόθεση (ull hypothesis) H 1 : εναλλακτική υπόθεση (ltertive hypothesis) Η βασική ιδέα είναι να θέτουμε ως μηδενική υπόθεση αυτή που αμφισβητούμε (αμφιβάλλουμε) και εξετάζοντας ένα τυχαίο δείγμα να δούμε εάν είναι ακραίο και προκύπτει σοβαρός λόγος απόρριψης της Η. Είδη σφαλμάτων P(σφάλμα τύπου Ι)=P(type I error)=p(απόρριψη της Η Η true) P(σφάλμα τύπου ΙI)=P(type II error)=p(μη απόρριψη της Η Η 1 true) Εφαρμοσμένη Στατιστική Μέρος 4 ο -1 Κ. Μπλέκας (2)
Βασικές έννοιες (συν.) 2 μορφές ελέγχου: Μονόπλευρος έλεγχος (oe tiled) Αμφίπλευρος έλεγχος (two tiled) 2 μεθοδολογίες Καθορίζοντας μία ανεκτή τιμή σφάλματος τύπου Ι Υπολογισμός της P-τιμής του δείγματος Εφαρμοσμένη Στατιστική Μέρος 4 ο -1 Κ. Μπλέκας (3) 1 : : ' : : H H H H δεξιόπλευρος αριστερόπλευρος 1 : : H H
1 η μέθοδος: με βάση τη τιμή σφάλματος τύπου Ι Βήματα της διαδικασίας ελέγχου: 1. Ορίζουμε τις υποθέσεις H, H 1 2. Ορίζουμε το επίπεδο σημαντικότητας του ελέγχου 3. Ορίζουμε τη στατιστική συνάρτηση ελέγχου T(X) 4. Επιλογή τυχαίου δείγματος από τον πληθυσμό και υπολογισμός της τιμής της στατιστικής συνάρτησης ελέγχου 5. Ορίζουμε την περιοχή απόρριψης ή κρίσιμη περιοχή (criticl regio) του ελέγχου 6. Εξετάζουμε αν η τιμή της T(X) του τ.δ. βρίσκεται ή όχι στην κρίσιμη περιοχή, ώστε να αποφασίσουμε αν η H θα απορριφθεί ή όχι Παρατηρήσεις Όταν απορρίπτεται η H τότε το τυχαίο δείγμα ονομάζεται στατιστικά σημαντικό (sttisticlly sigifict) και σημαίνει ότι διαφέρει σημαντικά από αυτό που αναμενόταν από την H Όσο πιο μικρή είναι η τιμή του επιπέδου σημαντικότητας, τόσο πιο σημαντικό στατιστικά είναι το αποτέλεσμα του ελέγχου. Εφαρμοσμένη Στατιστική Μέρος 4 ο -1 Κ. Μπλέκας (4)
2 η μέθοδος: Υπολογισμός της P-τιμής Υπολογίζουμε την πιθανότητα να εμφανιστεί η τιμή της στατιστικής συνάρτησης T(X) που εμφανίστηκε στο δείγμα ή κάποια τιμή μεγαλύτερη από αυτή, με δεδομένο ότι ισχύει η συνθήκη Η Αυτή η πιθανότητα ονομάζεται P-τιμή (P-vlue) του δείγματος Υπολογίζοντας την P-τιμή γνωρίζουμε πόσο πιθανή είναι η εμφάνιση του δείγματος που πήραμε από την υπόθεση ότι η Η είναι αληθής. Ετσι, όσο πιο μικρή είναι η P-τιμή, τόσο πιο ισχυρές είναι οι ενδείξεις απόρριψης της Η, ή αλλιώς τόσο πιο σημαντική είναι η τιμή της στατιστικής συνάρτησης ελέγχου. Αν P-vlue => σε επίπεδο σημαντικότητας η Η απορρίπτεται Αν P-vlue > => σε επίπεδο σημαντικότητας η Η δεν απορρίπτεται Δηλαδή P-τιμή: η ελάχιστη τιμή του επιπέδου σημαντικότητας για να απορριφθεί η Η P-τιμή: το μέτρο το οποίο εκφράζει πόσο ισχυρές είναι οι ενδείξεις που προκύπτουν από το δείγμα εναντίον της Η Εφαρμοσμένη Στατιστική Μέρος 4 ο -1 Κ. Μπλέκας (5)
Έλεγχοι υποθέσεων για συγκεκριμένες περιπτώσεις (Α) Στατιστικοί έλεγχοι υποθέσεων για τη μέση τιμή (μ) ενός πληθυσμού Ελέγχουμε την υπόθεση H: μ=μ (η άγνωστη μέση τιμή έχει τιμή μ) Διακρίνουμε 2 περιπτώσεις: (α) γνωστή διασπορά (z-test) Βασιζόμαστε στο γνωστή σχέση του δειγματικού μέσου Εξετάζουμε τις 3 πιθανές εναλλακτικές υποθέσεις: X Z ~ / N,1 (α1) Η 1 : μ>μ P X x H is true PX x x / 1 x z 1 όπου z = Φ -1 (1-α) Εφαρμοσμένη Στατιστική Μέρος 4 ο -1 Κ. Μπλέκας (6)
Έλεγχοι υποθέσεων για συγκεκριμένες περιπτώσεις (συν.) (α2) Η 1 : μ<μ Φ -1 (α) = -Φ -1 (1-α) = -z (α3) Η 1 : μ μ άρα περιοχή απόρριψης Εφαρμοσμένη Στατιστική Μέρος 4 ο -1 Κ. Μπλέκας (7) z x x x X P H x X P / is true 2 / true is z Z P Z P Z P H X P / 2 / 2 z x z x
Έλεγχοι υποθέσεων για συγκεκριμένες περιπτώσεις (β) άγνωστή διασπορά (t-test) Βασιζόμαστε στο γνωστή σχέση X ~ S / όπου Παρόμοια για τις 3 πιθανές εναλλακτικές υποθέσεις έχουμε τις κρίσιμες περιοχές (περιοχές απόρριψης): Y t 1 S 2 1 1 X i X i1 2 (β1) Η 1 = μ 1 > μ (β2) Η 1 = μ 1 < μ β(3) Η 1 = μ 1 μ S x t 1 S t x t 1 / 2 x 1 x S S t 1 / 2 Εφαρμοσμένη Στατιστική Μέρος 4 ο -1 Κ. Μπλέκας (8)
Τέλος Ενότητας
Χρηματοδότηση Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα. Το έργο «Ανοικτά Ακαδημαϊκά Μαθήματα στο Πανεπιστήμιο Ιωαννίνων» έχει χρηματοδοτήσει μόνο τη αναδιαμόρφωση του εκπαιδευτικού υλικού. Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος «Εκπαίδευση και Δια Βίου Μάθηση» και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους.
Σημειώματα
Σημείωμα Ιστορικού Εκδόσεων Έργου Το παρόν έργο αποτελεί την έκδοση 1.. Έχουν προηγηθεί οι κάτωθι εκδόσεις: Έκδοση 1. διαθέσιμη εδώ. http://ecourse.uoi.gr/course/view.php?id=152.
Σημείωμα Αναφοράς Copyright Πανεπιστήμιο Ιωαννίνων, Διδάσκων: Επίκουρος Καθηγητής Κωνσταντίνος Μπλέκας. «Εφαρμοσμένη Στατιστική. Έλεγχοι υποθέσεων». Έκδοση: 1.. Ιωάννινα 214. Διαθέσιμο από τη δικτυακή διεύθυνση: http://ecourse.uoi.gr/course/view.php?id=152.
Σημείωμα Αδειοδότησης Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Cretive Commos Αναφορά Δημιουργού - Παρόμοια Διανομή, Διεθνής Έκδοση 4. [1] ή μεταγενέστερη. [1] https://cretivecommos.org/liceses/by-s/4./.