Θέματα Στατιστικής στη γλώσσα R Μη παραμετρικοί έλεγχοι στοιχεία της θεωρίας που χρειάζονται προσοχή προϋποθέσεις για το μέγεθος του δείγματος προϋποθέσεις για το σχήμα της κατανομής των δεδομένων παραμετρικοί έλεγχοι που είναι «κρυμμένοι» συνήθως μετασχηματίζονται σε ελέγχους για κάποιο ποσοστό ANOVA βασικές γραφικές παραστάσεις εκτιμήσεις 1
Pearson s Χ 2 έλεγχος και το Fisher (tea) test 2
Pearson s Χ 2 έλεγχος και το Fisher (tea) test 3
Pearson s Χ 2 έλεγχος και το Fisher (tea) test Η ακριβής πιθανότητα εμφάνισης του συγκεκριμένου 2x2 πίνακα, δεδομένου ότι τα περιθώρια αθροίσματα n 1, n 2, s 1, s 2 παραμένουν σταθερά, δίνεται από την υπεργεωμετρική κατανομή : s1 s2 a b P = = N n1 n! n! s! s! 1 2 1 2 N! a! b! c! d! n n n L α n U L U = max = min { 0, n + s N} 1 1 { n, s } 1 1 4
Pearson s Χ 2 έλεγχος και το Fisher (tea) test Τραυματισμένοι και μη στρατιώτες κατά την διάρκεια άσκησης σε δυο περιοχές. Ο έλεγχος υπολογίζει την πιθανότητα πιο ακραίων περιπτώσεων με τα ίδια περιθώρια αθροίσματα. Ο αριθμός των ακραίων πιθανών πινάκων με σταθερά τα περιθώρια αθροίσματα είναι ίσος με την μικρότερη παρατήρηση + 1. Έτσι : Εάν, η διαφορά αd bc είναι αρνητική, τότε οι ακραίες περιπτώσεις λαμβάνονται αν σταδιακά μειώσουμε τα κελιά των α, d και αυξήσουμε τα κελιά των b, c με την ίδια ποσότητα (συνήθως μονάδα). Εάν, η διαφορά αd bc είναι θετική, τότε οι ακραίες περιπτώσεις λαμβάνονται αν σταδιακά αυξάνουμε τα κελιά των α, d και μειώνουμε τα κελιά των b, c. Τραυμ/νοι Μη τραυμ/νοι Σύνολο Περιοχή Β 2 38 40 Περιοχή Α 4 11 15 Σύνολο 6 49 55 5
Pearson s Χ 2 έλεγχος και το Fisher (tea) test a d c b = 2 11 4 38 = 130 < 0 Όποτε μειώνουμε τα κελιά α, d σταδιακά και έχουμε : p 1 39 40 5 10 15 6 49 55 40! 15!6!49! 55!2!38!4! 11! = = 2 0.0357269 0 40 40 6 9 15 6 49 55 40! 15!6!49! 40! 15!6!49! p = = 0.0051794 p = = 0. 0001726 1 0 551!!39!5! 10! 55!0!40!6!9! p value = p + p + p = = 0 0.041 1 2 = 0.0001726 + 0.0051794 + 0.0357269 = 6
Pearson s Χ 2 έλεγχος και το Fisher (tea) test 7
Pearson s Χ 2 έλεγχος και το Fisher (tea) test 8
Pearson s Χ 2 έλεγχος και το Fisher (tea) test 9
Pearson s Χ 2 έλεγχος πολλαπλοί 2x2 πίνακες Ο Mantel-Haenszel είναι ένας Χ 2 έλεγχος ανεξαρτησίας, εφαρμόζεται όταν έχουμε τρεις παράγοντες. O τρίτος παράγοντας έχει k στάθμες, κάθε μια αποτελείται από έναν 2 2 πίνακα. Successes Failures Totals Sample 1 O 11i O 12i n 1.i Sample 2 O 21i O 22i n 2.i Totals n.1i n.2i n..i Οι γραμμές του 2 2 πίνακα προέρχονται από δυο ανεξάρτητες διωνυμικές κατανομές με πιθανότητες επιτυχίας (p 1 (i),p 2 (i) ), i=1,,k. Κάνουμε τον έλεγχο ότι σε κάθε στάθμη i οι πιθανότητες επιτυχίας είναι ίσες. Η 0 : p 1 (1) =p 2 (1),p 1 (2) =p 2 (2),,p 1 (k) =p 2 (k) Η 1 : p i p ή p p για i=1,...,k () i () 1 2 () i () i 1 2 10
Pearson s Χ 2 έλεγχος πολλαπλοί 2x2 πίνακες θ = i E O p 1 p 1 Για Η 1 : Για Η 1 : Για Η 1 : () i 1 () i p1 () i 2 () i p2 ( n )( n ) = 1. i.1i 0( 11i ) n.. i p p p Τότε η μηδενική υπόθεση γίνεται: Η 0 : θ 1 =θ 2 =...=θ κ =1 var ( O ) = 1. i 2. i.1 i.2i 0 11i 2 n.. i( n.. i 1) MH p = k ( n )( n )( n )( n ) i= 1 { O E ( O )} 11i 0 11i k i= 1 var ( O ) 0 11i () i () i 1 2 () i () i 1 p2 () i () i () i () i 1 p2 ή p1 p2 απορρίπτουμε απορρίπτουμε PO ( = x) = 11i n 1. i 2. i x n.1i x n n.. i.1i n MH z a MH z a χ 2 2 ( MH ) a,1 11
Pearson s Χ 2 έλεγχος πολλαπλοί 2x2 πίνακες Λευκοί και μαύροι ασθενείς που υποβάλλονται ή όχι σε εξετάσεις για το συκώτι σε διαφορετικά νοσοκομεία (τρία χαρακτηριστικά) Hospital 1 Hospital 2 Hospital 3 Hospital 4 4 9 13 4 6 10 7 2 9 5 5 10 12 34 46 34 33 67 6 7 13 59 56 115 59 43 59 38 39 77 13 9 22 64 61 125 Hospital 5 Hospital 6 Hospital 19 7 7 14 5 6 11 15 15 30 22 69 91 41 80 121 43 129 172 29 76 105 46 86 132 58 144 202 12
Pearson s Χ 2 έλεγχος πολλαπλοί 2x2 πίνακες 13
Pearson s Χ 2 έλεγχος πολλαπλοί 2x2 πίνακες 14
Pearson s Χ 2 έλεγχος πολλαπλοί 2x2 πίνακες Δημοσκόπηση πραγματοποιήθηκε σε 3 εκλογικά κέντρα. Ρωτήθηκαν συνολικά 62 άνδρες και γυναίκες για την προτίμησή τους μεταξύ δύο κομμάτων 1 ο Εκλογικό Κέντρο 1 ο Κόμμα 2 ο Κόμμα Σύνολο Άνδρες 2 5 7 Γυναίκες 1 6 7 Σύνολο 3 11 14 2 ο Εκλογικό Κέντρο 3 ο Εκλογικό Κέντρο 4 11 15 1 7 8 5 18 23 3 11 14 2 9 11 5 20 25 15
Έλεγχος McNemar 16
Έλεγχος McNemar Experimental units are 17
Έλεγχος McNemar 18
Έλεγχος McNemar 19
Έλεγχος McNemar Υπάρχει ακριβής έλεγχος (exact McNemar test) ώστε να αποφασίσουμε στηριζόμενοι σε αυτόν; https://cran.r-project.org/web/packages/exact2x2/exact2x2.pdf 20
Έλεγχος McNemar το p-value δεν επηρεάζεται από το μέγεθος του δείγματος!!! ποιος είναι ο ΑΕΛΠ για αυτήν την περίπτωση; εξαρτάται από το μέγεθος του δείγματος; 21
Έλεγχος McNemar 22
Έλεγχος McNemar 23
Έλεγχος McNemar ; 24
Έλεγχος McNemar 25
Έλεγχος McNemar 26
Έλεγχος McNemar 27
ANOVA 28
ANOVA γραφικές παραστάσεις 29
ANOVA γραφικές παραστάσεις 30
ANOVA ανάλυση 31
ANOVA ανάλυση 32
ANOVA ανάλυση 33