Έλεγχος Ανεξαρτησίας x του Parso Έστω ότι λαμβάνουμε δείγμα μεγέθους. Η πιθανότητα π εμφάνισης ενός χαρακτηριστικού να βρεθεί στο κελί (i,j) κάτω από την υπόθεση Η 0 της ανεξαρτησίας δίνεται από την σχέση i.. j Για να χρησιμοποιήσουμε το κριτήριο x του Parso χρειαζόμαστε τις αναμενόμενες συχνότητες κάτω από το μοντέλο της ανεξαρτησίας. Οι αναμενόμενες τιμές των κελιών i, j κάτω από την υπόθεση της ανεξαρτησίας θα είναι ίσες με: H0 i. j E.
Έλεγχος Ανεξαρτησίας x του Parso οι οποίες θα εκτιμηθούν στο δείγμα από τις ποσότητες: Αν υποθέσουμε ότι ο αριθμός των παρατηρήσεων σε κάθε κελί ακολουθεί Poisso κατανομή, δηλαδή: τότε: Συνεπώς: i.. j i.. j ~ Pois ~ N 0,1 ~ x 1
Έλεγχος Ανεξαρτησίας x του Parso και το άθροισμα τους ακολουθεί τη x κατανομή με (Ι 1)(J 1) βαθμούς ελευθερίας: x obs I J i1 j1 ~ x I 1 J 1 Απορρίπτουμε την υπόθεση της ανεξαρτησίας όταν x x obs ( I 1)( J 1), 1 a Η παραπάνω προσέγγιση είναι ικανοποιητική για 5. Έλεγχος ανεξαρτησίας στην πολυωνυμική δειγματοληψία
Έλεγχος Ανεξαρτησίας x του Parso Για να υπολογίσουμε τους βαθμούς ελευθερίας πρέπει να σκεφτούμε ότι Ο συνολικός αριθμός των κελιών είναι IJ και Ο αριθμός των παραμέτρων που εκτιμούμε είναι (I-1) και (J- 1) Επομένως ο αριθμός των περιθωρίων πιθανοτήτων που εκτιμάται είναι ίσος με τον αριθμό των επιπέδων μείον ένα, μιας και η τελευταία πιθανότητα ισούται άμα αφαιρέσουμε από το ένα το άθροισμα όλων των άλλων περιθωρίων πιθανοτήτων. Άρα IJ 1 I 1 J 1 I 1 J 1..
Έλεγχος Ανεξαρτησίας x του Parso Όσον αφορά τους πίνακες συνάφειας, η συνάρτηση ελέγχου μπορεί να απλοποιηθεί στην ακόλουθη ποσότητα 11 1 x obs Στους πίνακες για λόγους καλύτερης προσέγγισης χρησιμοποιείται το χ τεστ με τη διόρθωση του Yats το οποίο δίνεται από τον τύπο: 1...1. x Yats 0.5 ~ x1 i j
Άσκηση Σε μια προοπτική μελέτη κατά την οποία εξετάσθηκαν 368 άνδρες καπνιστές ηλικίας κάτω των 60 ετών οι οποίοι έπαθαν μια καρδιακή ανακοπή και επιβίωσαν. Μετά από έτη εξετάσθηκαν πόσοι από αυτούς είχαν επιβιώσει και τους χωρίσαμε ανάλογα εάν είχαν κόψει το τσιγάρο ή όχι. Έτσι εδώ μας ενδιαφέρει να εξετάσουμε αν το σταμάτημα του καπνίσματος (X) είχε ευνοϊκή επίδραση στην επιβίωση μετά από δύο έτη (Y). Τα δεδομένα δίνονται στον Πίνακα που ακολουθεί: Χ: Υ: Επιβίωση σε χρόνια Συνέχισαν το κάπνισμα 1: Πεθαμένος : Ζωντανός Σύνολο 1: Ναι 19 (1.3%) 135 (87.7%) 154 (41.8%) : Όχι 15 (7.0%) 199 (93.0%) 14 (58.%) Σύνολο 34 (9.%) 334 (90.8%) 368
Άσκηση Έχουμε: 368 19 199 15 135 x obs 3. 03 x 1, 0. 95 3. 841 154 14 34 334 άρα δεν απορρίπτουμε την υπόθεση ανεξαρτησίας. Εναλλακτικά μπορούμε να χρησιμοποιήσουμε 154 34 14 3 368 1.. 1 11. 14 34 19 77 368.. 1 1. 154 334 139 77 368 1.. 1. 14 334 194 3 368....... 19 14 3 135 139 77 15 19 77 199 194 3 xobs 14. 3 139. 77 19. 77 194. 3 3. 03 p valu 0. 08
Άσκηση Τέλος αν χρησιμοποιήσουμε το χ με τη διόρθωση του Yats έχουμε:........ 19 14 3 0 5 135 139 77 0 5 15 19 77 0 5 199 194 3 0 5 xyats 14. 3 139. 77 19. 77 194. 3. 43 p valu 0. 119 Συνεπώς δεν απορρίπτουμε την υπόθεση της ανεξαρτησίας για επίπεδο στατιστικής σημαντικότητας α = 5%.
Άσκηση 1000 φοιτητές και 1000 φοιτήτριες ρωτήθηκαν πως πάνε από το σπίτι τους στο Πανεπιστήμιο. Οι απαντήσεις είναι οι παρακάτω Μεταφορικό Μέσο Φοιτητές Φοιτήτριες Πόδια 407 30 Ποδήλατο 313 66 Αυτοκίνητο 171 44 Λεωφορείο 109 188
Απάντηση Μπορούμε να ισχυριστούμε ότι ο τρόπος μετάβασης είναι ο ίδιος στους φοιτητές και στις φοιτήτριες? Μέσω του x tst θα απαντήσουμε το παραπάνω ερώτημα Μεταφορικό Μέσο Φοιτητές Φοιτήτριες Σύνολο Πόδια 407 (354.5) 30 (354.5) 709 Ποδήλατο 313 (89.5) Αυτοκίνητο 171 (07.5) Λεωφορείο 109 (148.5) 66 (89.5) 44 (07.5) 188 (148.5) 579 415 97 i.... j Σύνολο 1000 1000 000 11 1....1
Απάντηση Η συνάρτηση ελέγχου δίνεται από την σχέση * X 053. 000 53. x3,0.05 7.81 7.81<53. άρα απορρίπτω την Η 0
Έλεγχος ανεξαρτησίας κάτω από γινόμενο πολυωνυμικής δειγματοληψίας Στην περίπτωση της πολυωνυμικής δειγματοληψίας λαμβάνουμε δείγμα μεγέθους i. χωριστά για κάθε μια τιμή i της επεξηγηματικής μεταβλητής Χ. Οι πιθανότητες π αναπαριστούν δεσμευμένες πιθανότητες Y j X i j i P Η υπόθεση της ανεξαρτησίας μετατρέπεται σε υπόθεση της ισότητας των δεσμευμένων κατανομών της Υ για κάθε τιμή της Χ=i Μεταβλητές Υ1 Υ Χ1 π 11 π 1 Χ π 1 π ανεξαρτησία Χ3 π 31 π 3 j i. j i 1,...,I
Έλεγχος ανεξαρτησίας κάτω από γινόμενο πολυωνυμικής δειγματοληψίας Άρα η μηδενική υπόθεση γίνεται H : j1 j... j 0 I Οι αναμενόμενες τιμές κάτω από την υπόθεση αυτή γίνονται H 0 i. j i E Κάτω από την μηδενική υπόθεση η δεσμευμένη πιθανότητα π j i εκτιμάται από j i. j..
Έλεγχος ανεξαρτησίας κάτω από γινόμενο πολυωνυμικής δειγματοληψίας Επομένως οι αναμενόμενες τιμές εκτιμώνται από H0 i. j i E j i. j.. E H 0 i.... j Όπως Πολυωνυμική δειγματοληψία
Έλεγχος ανεξαρτησίας κάτω από γινόμενο πολυωνυμικής δειγματοληψίας Το κριτήριο x υπολογίζεται με τον ίδιο τρόπο. Αν ο πίνακας συνάφειας είναι x τότε ο έλεγχος είναι ισοδύναμος με το z-tst ελέγχου ισότητας δύο ποσοστών με p 1 p1 p z0 ~ N 1 1 p1 p 1.. 11 1. p 1. p.1.. 0,1
Έλεγχος ανεξαρτησίας κάτω από γινόμενο πολυωνυμικής δειγματοληψίας Απόδειξη p 1. p 1... p 1. 11 1.... 1. 11.. 1.1..
Έστω ο παρακάτω πίνακας Παράδειγμα Στάση απέναντι στην νόμιμη έκτρωση Φύλο Υποστηρίζουν Δεν υποστηρίζουν Σύνολο Γυναίκες 309 191 500 Άνδρες 319 81 600 Σύνολο 68 47 1100 68*500 1100 1..1 11.. 85.5 Αναμενόμενες συχνότητες Στάση απέναντι στην νόμιμη έκτρωση Φύλο Υποστηρίζουν Δεν υποστηρίζουν Σύνολο Γυναίκες 309 (85.5) 191 (14.5) 500 Άνδρες 319 (34.5) 81 (57.5) 600 Σύνολο 68 47 1100
Παράδειγμα Το ποσοστό των γυναικών που υποστηρίζουν την νόμιμη έκτρωση είναι 309 0.618 500 319 0. 600 53 Το αντίστοιχο ποσοστό των ανδρών είναι Από τα ποσοστά φαίνεται ότι υπάρχει στατιστικά σημαντική διαφορά μεταξύ των ποσοστών x 8.3 με x1 και p 0. 004 * Άρα οι γυναίκες και οι άνδρες δεν φαίνεται να έχουν ίδια ποσοστά υποστήριξης της νόμιμης έκτρωσης Στάση απέναντι στην νόμιμη έκτρωση Φύλο Υποστηρίζουν Δεν υποστηρίζουν Σύνολο Γυναίκες 309 (85.5) 191 (14.5) 500 Άνδρες 319 (34.5) 81 (57.5) 600 Σύνολο 68 47 1100
Άσκηση Ψηλά κομμένα φύλα ντομάτας διασταυρώθηκαν με νάνους κομμένα φύλα πατάτας-φύλα ντομάτας όπου 1611 παρατηρήσεις διαχωρίστηκαν ανάλογα με τον γονότυπό τους Τύπος Ψηλά κομμένα φύλα ντομάτας Ψηλά κομμένα φύλα πατάτας Νάνοι κομμένα φύλα ντομάτας Ψηλά κομμένα φύλα ντομάτας Γενετική θεωρία αναφέρει ότι η σχέση μεταξύ των 4 γονότυπων είναι 9:3:3:1 Ισχύει η υπόθεση της σχέσης? Παρατηρήσεις 96 88 93 104
Λύση Κάτω από την μηδενική υπόθεση έχουμε: p 9 3 1 p p3 16 16 με αναμενόμενες συχνότητες 1 4 p 1 p p 4 1611* p 3 1611* 9 16 1611* 1 16 906. 3 16 100.7 p 4 1 16 x * 1.47 7. 81 x 3,0.05 7.81>1.47 άρα αποδέχομαι την Η 0 30.1 αποδέχομαι απορρίπτω 1.47 7.81