Έλεγχοι Χ 2 (Μέρος 1 ο ) 28/4/2017
2 Έλεγχοι Χ 2 Οι έλεγχοι που μπορούν να πραγματοποιηθούν είναι οι εξής: 1. Έλεγχος Χ 2 καλής προσαρμογής 2. Έλεγχος Χ 2 ανεξαρτησίας 3. Έλεγχος Χ 2 ομογένειας Αυτό που ελέγχεται και στις τρεις περιπτώσεις Χ 2 ελέγχων είναι η στατιστική σημαντικότητα των αποκλίσεων (διαφορών) μεταξύ των συχνοτήτων που παρατηρήθηκαν στο δείγμα και των αντίστοιχων συχνοτήτων που αναμένονται με βάση τη μηδενική υπόθεση
3 Έλεγχος Χ 2 καλής προσαρμογής (1) Έστω ότι μια πειραματική δειγματοληπτική μονάδα μπορεί να ταξινομηθεί ως προς ένα χαρακτηριστικό σε ακριβώς μία από k κατηγορίες r 1, r 2,, r k και έστω p i η πιθανότητα ταξινόμησής της στην κατηγορία r i, i = 1, 2,, k ή αλλιώς, έστω ότι σε μία εκτέλεση μιας πολυωνυμικής δοκιμής εμφανίζεται ακριβώς ένα από k δυνατά αποτελέσματα r 1, r 2,, r k και έστω p i η πιθανότητα εμφάνισης του αποτελέσματος r i, i = 1, 2,, k
4 Έλεγχος Χ 2 καλής προσαρμογής (2) Έστω επίσης, ότι n πειραματικές / δειγματοληπτικές μονάδες ταξινομήθηκαν ως προς το χαρακτηριστικό αυτό και οι Ο 1 ταξινομήθηκαν στην κατηγορία r 1, οι Ο 2 στην κατηγορία r 2, και οι Ο k στην κατηγορία r k ή αλλιώς, έστω Ο 1, Ο 2,, Ο k οι παρατηρηθείσες συχνότητες των αποτελεσμάτων r 1, r 2,, r k σε n ανεξάρτητες επαναλήψεις μιας πολυωνυμικής δοκιμής
5 Έλεγχος Χ 2 καλής προσαρμογής (3) Αν p 10, p 20,, p k0 γνωστές πιθανότητες με σk i=1 p i0 = 1, τότε, σε επίπεδο σημαντικότητας α, η μηδενική υπόθεση είναι η H 0 : p 1 = p 10, p 2 = p 20,, p k = p k0 με εναλλακτική την H 1 : p i p i0, για τουλάχιστον ένα i, i = 1,2,,k H H 0 απορρίπτεται αν X 2 = σk i=1 O i E i 2 και εφόσον Ε i = n p i0 5, για κάθε i = 1,2,,k E i 2 χ k 1;a Με Ε 1, Ε 2,, Ε k συμβολίζουμε τις αναμενόμενες συχνότητες των αποτελεσμάτων r 1, r 2,, r k αν θεωρήσουμε ότι η μηδενική υπόθεση Η 0 είναι αληθής
6 Έλεγχος Χ 2 καλής προσαρμογής (4) Αν οι υπό τη μηδενική υπόθεση πιθανότητες p 10, p 20,, p k0 δεν είναι γνωστές, εκτιμώνται από τις p i0 (με βάση το δείγμα) και η απορριπτική περιοχή του ελέγχου σε επίπεδο σημαντικότητας α ορίζεται από την ανισότητα k X 2 = i=1 O i E i 2 E i 2 χ k 1 m;a και εφόσον Ε ι = n p i0 5, για κάθε i = 1, 2,, k Με m συμβολίζουμε τον αριθμό των παραμέτρων που πρέπει να εκτιμηθούν για να μπορούν να εκτιμηθούν οι αναμενόμενες συχνότητες
7 Παράδειγμα 1 Σύμφωνα με ένα μοντέλο κληρονομικότητας, οι τρεις τύποι απογόνων Α, Β και Γ που προκύπτουν από διασταύρωση ορισμένου είδους πειραματόζωων, πρέπει να βρίσκονται σε αναλογία 9:3:4, αντίστοιχα Σε ένα σχετικό πείραμα, από 64 απογόνους που προέκυψαν, 34 βρέθηκαν να είναι τύπου Α, 10 τύπου Β και 20 τύπου Γ Σε επίπεδο σημαντικότητας 1%, αυτά τα πειραματικά δεδομένα δίνουν άραγε σημαντικές αποδείξεις εναντίον του μοντέλου κληρονομικότητας
8 Παράδειγμα 2 (1) Από τα αρχεία της Επιθεώρησης Εργασίας καταγράφηκε ο αριθμός εργατικών ατυχημάτων που συνέβησαν ανά ημέρα στη βιομηχανική ζώνη Α τα έξι περίπου τελευταία χρόνια (1500 εργάσιμες ημέρες) Τα αποτελέσματα αυτής της καταγραφής φαίνονται στον πίνακα που ακολουθεί Αριθμός ατυχημάτων σε μια ημέρα 0 1 2 3 4 5 Παρατηρηθείσα συχνότητα 549 555 273 93 24 6
9 Παράδειγμα 2 (2) Έστω Υ η τυχαία μεταβλητή που εκφράζει τον αριθμό εργατικών ατυχημάτων που συμβαίνουν σε μια ημέρα στη συγκεκριμένη βιομηχανική ζώνη Μας αναφέρουν ότι οι πιθανότητες που προκύπτουν για τις τιμές της Υ από τα παραπάνω δεδομένα, περιγράφονται πολύ ικανοποιητικά από την κατανομή Poisson με λ=1 Ελέγξτε την υπόθεση αυτή σε επίπεδο σημαντικότητας 5%
10 Παράδειγμα 3 Δίνεται ένα τυχαίο δείγμα 28 μετρήσεων της συγκέντρωσης υδραργύρου στο συκώτι αρσενικών δελφινιών (σε microgr/gr) 1.70 101 168 481 252 278 397 1.72 85.40 218 485 329 286 209 8.80 118 180 221 316 315 314 5.90 183 264 406 445 241 318 Μπορούμε άραγε σε επίπεδο σημαντικότητας 5% να ισχυριστούμε ότι το δείγμα αυτό προέρχεται από μια κανονική κατανομή;
11 Έλεγχος Χ 2 ανεξαρτησίας (1) Έστω ότι μια πειραματική δειγματοληπτική μονάδα μπορεί να ταξινομηθεί ως προς δύο χαρακτηριστικά Α και Β από τα οποία το Α μπορεί να πάρει r 2 διαφορετικές τιμές (κατηγορίες) Α 1, Α 2,, Α r και το Β μπορεί να πάρει c 2 διαφορετικές τιμές (κατηγορίες) Β 1, Β 2,, Β c Έστω δηλαδή ότι μια πειραματική / δειγματοληπτική μονάδα μπορεί να ταξινομηθεί σε ακριβώς μία από r c διαφορετικές κατηγορίες (Α i, B j ), i =1,2,...,r και j = 1,2,,c
12 Έλεγχος Χ 2 ανεξαρτησίας (2) Αν n πειραματικές / δειγματοληπτικές μονάδες ταξινομήθηκαν ως προς τα δύο αυτά χαρακτηριστικά Α και Β και Ο ij από αυτές ταξινομήθηκαν στην κατηγορία (Α i, B j ), ή αλλιώς, αν Ο ij η παρατηρηθείσα συχνότητα της κατηγορίας (Α i, B j ), τότε σε επίπεδο σημαντικότητας α, η μηδενική υπόθεση είναι η H 0 : τα χαρακτηριστικά Α και Β είναι ανεξάρτητα με εναλλακτική την H 1 : τα χαρακτηριστικά Α και Β δεν είναι ανεξάρτητα 2 H H 0 απορρίπτεται αν X 2 O = σ ij E ij 2 i,j χ E r 1 c 1 ;a ij και εφόσον Ε ij 5, για όλα τα i και j Με Ε ij συμβολίζουμε την εκτιμώμενη αναμενόμενη συχνότητα της κατηγορίας (Α i, B j ) αν θεωρήσουμε ότι η μηδενική υπόθεση Η 0 είναι αληθής
13 Έλεγχος Χ 2 ανεξαρτησίας (3) Αν p i είναι η πιθανότητα μια πειραματική μονάδα να ταξινομηθεί στην κατηγορία Α i του χαρακτηριστικού Α, q j η πιθανότητα μια πειραματική μονάδα να ταξινομηθεί στην κατηγορία Β j του χαρακτηριστικού Β και p ij η πιθανότητα μια πειραματική μονάδα να ταξινομηθεί στην κατηγορία Α i του χαρακτηριστικού Α και συγχρόνως στην κατηγορία B j του χαρακτηριστικού Β, τότε οι υποθέσεις του ελέγχου ανεξαρτησίας των χαρακτηριστικών Α και Β είναι ως εξής: H 0 : p ij = p i q j, για κάθε i και j με εναλλακτική την H 1 : p ij p i q j, για τουλάχιστον ένα i και j Επίσης πρέπει να ισχύει E ij = n p i q j 5, όπου p i = R i και q n j = C j n (R i είναι η παρατηρηθείσα συχνότητα της κατηγορίας Α i και C j η παρατηρηθείσα συχνότητα της κατηγορίας B j )
14 Παράδειγμα 4 (1) Στο πλαίσιο της έρευνας για την πρόληψη της γρίπης, έγινε μια μελέτη για να ελεγχθεί η αποτελεσματικότητα ενός νέου αντιγριπικού εμβολίου το οποίο χορηγείται σε δύο δόσεις Σε 1000 τυχαία επιλεγμένους κατοίκους μιας περιοχής δόθηκε η δυνατότητα να κάνουν το εμβόλιο δωρεάν και εθελοντικά Για κάθε κάτοικο, η ερευνητική ομάδα κατέγραψε πόσες δόσεις του εμβολίου έκανε (καμία, μία ή δύο) και αν αρρώστησε ή όχι από τη γρίπη Τα καταγεγραμμένα αποτελέσματα φαίνονται στον πίνακα που ακολουθεί
15 Παράδειγμα 4 (2) Αριθμός δόσεων 0 1 2 Ανθεκτικότητα Αρρώστησε 24 9 13 Δεν αρρώστησε 289 100 565 Σε επίπεδο σημαντικότητας 5%, δίνουν αυτά τα δεδομένα σημαντικές αποδείξεις ότι η ανθεκτικότητα των κατοίκων στον ιό της γρίπης εξαρτάται από τον αριθμό των δόσεων αντιγριπικού εμβολίου που έκαναν;
16 Παράδειγμα 5 Μια πολιτική παράταξη παρήγγειλε μια δημοσκόπηση για να μπορέσει να ανακαλύψει εάν η εικόνα της είναι η ίδια σε όλα τα οικονομικά στρώματα του πληθυσμού Από τη δημοσίευση προέκυψαν τα παρακάτω αποτελέσματα Αρνητική εικόνα Θετική εικόνα Χαμηλό εισόδημα 105 180 Μέσο εισόδημα 98 194 Υψηλό εισόδημα 135 142 Είναι η εικόνα της παράταξης, σε επίπεδο σημαντικότητας 5%, ανεξάρτητη από το εισόδημα των πολιτών;