Μη Παραµετρικοί Έλεγχοι Επιστηµονική Επιµέλεια: ρ. Γεώργιος Μενεξές Τοµέας Φυτών Μεγάλης Καλλιέργειας και Οικολογίας Εργαστήριο Γεωργίας Viola adorata
Καταρχήν
Μη Παραµετρικοί Έλεγχοι εν απαιτούν κανονικότητα στις κατανοµές των µεταβλητών. Η κλίµακα µέτρησης των µεταβλητών πρέπει να είναι τουλάχιστον διάταξης (ordinal). Μπορούν να εφαρµοστούν όταν τα δείγµατα είναι µικρά. εν απαιτούνται εκτιµήσεις των παραµέτρων των κατανοµών. Εφαρµόζονται στις περιπτώσεις που δεν µπορούν να εφαρµοστούν έλεγχοι της Παραµετρικής Στατιστικής.
Παραδείγµατα Ελέγχων
Έλεγχος Kruskal-Wallis (1) Ο έλεγχος Kruskal-Wallis είναι Μη Παραµετρική διαδικασία που µπορεί να εφαρµοστεί για τη σύγκριση τριών ή περισσότερων πληθυσµών. Πιο συγκεκριµένα: Η ο : Τα k δείγµατα προέρχονται από τον ίδιο πληθυσµό. Η 1 : Τουλάχιστον ένα δείγµα προέρχεται από διαφορετικό πληθυσµό. σε ε.σ. α
Έλεγχος Kruskal-Wallis (2) Αν η µηδενική υπόθεση απορριφθεί τότε τουλάχιστον δύο πληθυσµοί διαφέρουν στατιστικά σηµαντικά ως προς τη διάµεση τιµή τους (και µε χαλαρή ερµηνεία ως προς τους αντίστοιχους µέσους όρους).
Προεργασία (1) Τα k δείγµατα-οµάδες ενοποιούνται σε ένα µεγάλο δείγµα-οµάδα µεγέθους n, n=n 1 +n 2 + +n k Για κάθε µία από τις n µετρήσεις τιµές τιµές-παρατηρήσεις υπολογίζεται η βαθµίδα της (τάξη ή σειρά κατάταξης- rank). ηλαδή, στις αρχικές µετρήσεις αποδίδονται βαθµοί από το 1 µέχρι το n. Το 1 αποδίδεται στη µέτρηση-τιµή τιµή-παρατήρηση µε τη µικρότερη αριθµητική τιµή. Σε περίπτωση ισοπαλίας-δεσµού (tie) αποδίδεται ο µέσος όρος των αρχικών βαθµίδων. Υπάρχει και διορθωµένη εκδοχή του ελέγχου σε περίπτωση ισοπαλιών. Για κάθε δείγµα-οµάδα υπολογίζεται το άθροισµα Τ i των βαθµίδων των αντίστοιχων µετρήσεων-τιµών τιµών- παρατηρήσεων.
Ισοπαλίες- εσµοί (1) Όταν η µεταβλητή που εξετάζεται έχει πολλαπλές τιµές. ηλαδή, ορισµένες τιµές της επαναλαµβάνονται δύο ή περισσότερες φορές. Καταγράφουµε: Το πλήθος των πολλαπλών τιµών (π.χ.. 10 από τις 100 τιµές επαναλαµβάνονται δύο ή περισσότερες φορές). Την πολλαπλότητα ρ (πόσες φορές εµφανίζεται) της κάθε πολλαπλής τιµής (π.χ. αν η τιµή 38 έχει πολλαπλότητα 4, εµφανίζεται 4 φορές ή 4 τιµές της εξεταζόµενης µεταβλητής είναι ίσες µε 38).
Ισοπαλίες- εσµοί (2) 3 5 5 10 12??a?µat???? t?µ?? 1 2,5 2,5 4 5? a?µ?de? 2?a?3??????s?ßa?µ?a (?s?p a??a, desµ??)
Παράδειγµα ανάθεσης βαθµίδας (χωρίς ισοπαλίες-δεσµούς δεσµούς)
Παράδειγµα ανάθεσης βαθµίδας (µε ισοπαλίες-δεσµούς δεσµούς) Υπάρχουν 3 πολλαπλές τιµές: η 3090 µε πολλαπλότητα 2, η 4312 µε πολλαπλότητα 3 και η 3850 µε πολλαπλότητα 2
ιαδικασία Υπολογίζεται το στατιστικό: H 2 = 12 Ti 3( n 1) nn ( + 1) n + i Κάτω από την ορθότητα της µηδενικής υπόθεσης το στατιστικόh ακολουθεί προσεγγιστικάχ 2 κατανοµή µε k-1 β.ε. Η µηδενική υπόθεση απορρίπτεται σε ε.σ. α=0,05 ανh>χ 2 0,05 για k-1 β.ε. Η προσέγγιση είναι ικανοποιητική αν κάθε οµάδα-δείγµα δείγµα έχει τουλάχιστον 5 µετρήσεις-τιµές τιµές-παρατηρήσεις.
Περιοχή Απόρριψης της Ηο α 0 Αποδοχή Ηο Απόρριψη H 0 χ 2
Παράδειγµα Περιοχή Αποδοχής της Η 0 Περιοχή Απόρριψης της Η 0 Κρίσιµή τιµή Τιµή είγµατος
Προϋποθέσεις Εφαρµογής είγµατα τυχαία Παρατηρήσεις ανεξάρτητες Κλίµακα µέτρησης της µεταβλητής τουλάχιστον διάταξης (ordinal) Συµµετρικές κατανοµές µέσα σε κάθε οµάδα-δείγµα δείγµα
Παρατηρήσεις (1) Αποτελεί τη Μη Παραµετρική εκδοχή της one-way ANOVA. Εφαρµόζεται σε Πλήρως Τυχαιοποιηµένα Πειραµατικά Σχέδια. Eν γένει, έχει µικρότερη ισχύ (power) από την Παραµετρική ANOVA. εν απαιτεί κανονικότητα στην κατανοµή των µετρήσεων µέσα σε κάθε οµάδα.
Παρατηρήσεις (2) εν έχουµε εκτιµήσεις των παραµέτρων των αντίστοιχων πληθυσµών. Χρησιµοποιεί λιγότερη πληροφορία από ότι η Παραµετρική ANOVA. Μπορεί να εφαρµοστεί σε περιπτώσεις που τα δείγµατα είναι µικρά σε µέγεθος. Η παρατηρούµενη στάθµη σηµαντικότητας του ελέγχου (p-value) µπορεί να υπολογιστεί είτε µε τη µέθοδο Exact είτε µε τη µέθοδο προσοµοίωσης Monte-Carlo (SPSS, Exact tests)
Παρατηρήσεις (3) Ο στατιστικός έλεγχος συχνά εµφανίζεται και ως: Η ο : Τ 1 = Τ 2 = = Τ k H 1 : Τουλάχιστον δύο ιάµεσες Τιµές ( Τ) διαφέρουν σε ε.σ. α
Παράδειγµα Σε 4 ποικιλίες ενός φυτού µετρήθηκαν οι τιµές ενός αγρονοµικού χαρακτηριστικού. Τα στοιχεία δίνονται στον παρακάτω πίνακα. ιαφέρουν στατιστικά σηµαντικά οι 4 ποικιλίες σε ε.σ. α=0,05 ως προς το αγρονοµικό χαρακτηριστικό;
Παράδειγµα (συνέχεια) Πίνακας εδοµένων Π1 Π2 Π3 Π4 65 75 59 94 87 69 78 89 73 83 67 80 79 81 62 88
Παράδειγµα Παράδειγµα (συνέχεια συνέχεια) 88 62 81 79 67 78 59 Π3 83 69 75 Π2 73 87 65 Π1 80 89 94 Π4 55 15 35 31 T i (14) (2) (11) (9) (4) (8) (1) (12) (5) (7) (6) (13) (3) (10) (15) (16) Βοηθητικοί Βοηθητικοί Υπολογισµοί Υπολογισµοί
Παράδειγµα (συνέχεια) H 2 = 12 Ti 3( n 1) nn ( + 1) n + i 2 2 2 2 12 31 + 35 + 15 + 55 = 3(17) = 8,96 16(17) 4 Η κρίσιµη τηςχ 2 κατανοµής σε ε.σ. α=0,05 για 4-1=3 β.ε. είναι 7,81. Απόφαση: 8,96>7,81 Απορρίπτεται η Η ο. Συµπέρασµα: Υπάρχουν στατιστικά σηµαντικές διαφορές µεταξύ των 4 ποικιλιών (τουλάχιστον δύο διαφέρουν).
Παράδειγµα (συνέχεια)
Παράδειγµα µε Ισοπαλίες- εσµούς (2+3)/2 3 οµάδες-δείγµατα (ΙΝ, CA και MD) Κατατάσσουµε τις µετρήσεις Χ σε αύξουσα σειρά Αναθέτουµε βαθµίδες
Σύνοψη Αντί τουt i ιόρθωση για δεσµούς
Παράδειγµα µε το SPSS Miles per Gallon Country of Origin American European Japanese Total 1 Report Minimum Maximum Mean Median Std. Deviation N 10 39 20,13 18,55 6,377 248 16 44 27,89 26,50 6,724 70 18 47 30,45 31,60 6,090 79 10 47 23,55 23,00 7,792 397 2 Miles per Gallon Ranks Country of Origin American European Japanese Total N Mean Rank 248 148,10 70 264,56 79 300,70 397 Αφού Sig. (p-value) =0,000 <α=0,05 η Μηδενική Υπόθεση Απορρίπτεται. Συνεπώς τουλάχιστον δύο χώρες διαφέρουν στατιστικά σηµαντικά ως προς την κατανάλωση καυσίµου Chi-Square df 3 Asymp. Sig. Monte Carlo Sig. Sig. Test Statistics b,c 99% Confidence Interval Lower Bound Upper Bound a. Based on 10000 sampled tables with starting seed 2000000. b. Kruskal Wallis Test c. Grouping Variable: Country of Origin Miles per Gallon 133,793 2,000,000 a,000,000
Απορίες-Ερωτήσεις
Ο Συντελεστής Συσχέτισης των Τάξεων του Spearman (1)
Ο Συντελεστής Συσχέτισης των Τάξεων του Spearman (2)
Ο Συντελεστής Συσχέτισης των Τάξεων του Spearman (3)
Ο Συντελεστής Συσχέτισης των Τάξεων του Spearman (4)
Ο Συντελεστής Συσχέτισης των Τάξεων του Spearman (5)
Παράδειγµα
Παράδειγµα (συνέχεια)
Παράδειγµα (συνέχεια)
Οπτικοποίηση της σχέσης (1) Πιθανό outlier
Οπτικοποίηση της σχέσης (2) Καµπύλη Loess (90%)
Παράδειγµα (συνέχεια)
Παράδειγµα (συνέχεια)
Παράδειγµα (συνέχεια)
Παράδειγµα (συνέχεια)
Παράδειγµα µε το SPSS (1) είκτης Συγκοµιδής Εκατολιτρικό Βάρος Στάχυα m 2 Αρ. κόκκων / στάχυ Βάρος 1000 κόκκων y x1 x2 x3 x4
Παράδειγµα µε το SPSS (2) Συντελεστές Συσχέτισης των Τάξεων Spearman Correlations Spearman's rho είκτης Συγκοµιδής Εκατολιτρικό βάρος Στάχυα / m2 Αριθµός κόκκων/στάχυ Βάρος κόκκων Correlation Coefficient Sig. (2-tailed) N Correlation Coefficient Sig. (2-tailed) N Correlation Coefficient Sig. (2-tailed) N Correlation Coefficient Sig. (2-tailed) N Correlation Coefficient Sig. (2-tailed) N **. Correlation is significant at the 0.01 level (2-tailed). είκτης Εκατολιτρικό Αριθµός Βάρος Συγκοµιδής βάρος Στάχυα / m2 κόκκων/στάχυ κόκκων 1,000,194,449,238,022.,456,071,358,933 17 17 17 17 17,194 1,000,404 -,299,289,456.,107,244,260 17 17 17 17 17,449,404 1,000 -,681**,228,071,107.,003,379 17 17 17 17 17,238 -,299 -,681** 1,000 -,375,358,244,003.,138 17 17 17 17 17,022,289,228 -,375 1,000,933,260,379,138. 17 17 17 17 17 Στατιστικά Σηµαντική Αρνητική Συσχέτιση p=0,003<a=0,05
Παράδειγµα µε το SPSS (3) Ευθεία Γραµµικής Συµµεταβολής (Ελαχίστων Τετραγώνων) Ισχυρή Συσχέτιση Καµπύλη Loess (90%)
Παράδειγµα µε το SPSS (4) Καµπύλη Loess (90%) εν φαίνεται να υπάρχει συσχέτιση (γραµµική ή των τάξεων)
Παράδειγµα µε το SPSS (5) Συντελεστές Γραµµικής Συµµεταβολής Pearson Correlations είκτης Συγκοµιδής Εκατολιτρικό βάρος Στάχυα / m2 Αριθµός κόκκων/στάχυ Βάρος κόκκων είκτης Συγκοµιδής Pearson Correlation 1,185,414,088,060 Sig. (2-tailed),477,099,737,820 N 17 17 17 17 17 Εκατολιτρικό βάρος Pearson Correlation,185 1,378 -,350,304 Sig. (2-tailed),477,135,169,236 N 17 17 17 17 17 Στάχυα / m2 Pearson Correlation,414,378 1 -,771**,223 Sig. (2-tailed),099,135,000,389 N 17 17 17 17 17 Αριθµός κόκκων/στάχυ Pearson Correlation,088 -,350 -,771** 1 -,380 Sig. (2-tailed),737,169,000,132 N 17 17 17 17 17 Βάρος κόκκων Pearson Correlation,060,304,223 -,380 1 Sig. (2-tailed),820,236,389,132 N 17 17 17 17 17 **. Correlation is significant at the 0.01 level (2-tailed).
Συσχέτιση είκτη Συγκοµιδής µε τα άλλα χαρακτηριστικά (n=17) 0,500 0,450 0,400 0,449 1,0000 0,9500 0,9000 0,8500 0,8000 0,7500 Συντελεστής Συσχέτισης Spearman 0,350 0,300 0,250 0,200 0,194 0,238 0,7000 0,6500 0,6000 0,5500 0,5000 0,4500 0,4000 0,3500 P-values Spearmans' r p 0,150 0,3000 0,2500 0,100 0,2000 0,1500 0,050 0,000 0,022 Εκατολιτρικό Βάρος Στάχυα m2 Αρ. κόκκων / στάχυ Βάρος 1000 κόκκων 0,1000 0,0500 0,0000
Επισηµοποίηση
Προϋποθέσεις Εφαρµογής του Ελέγχου Σηµαντικότητας είγµατα τυχαία Παρατηρήσεις ανεξάρτητες Κλίµακα µέτρησης της µεταβλητής τουλάχιστον διάταξης (ordinal) Συµµετρικές κατανοµές µεταβλητών
Περιοχή Απόρριψης (δίπλευρος έλεγχος)
Παράδειγµα (n µικρό) Beef Rank Lamb Rank d d 2 63.4 1 74.5 3-2 4 68.6 3 79.8 4-1 1 71.3 4 66.9 1 3 9 66.5 2 74.1 2 0 0 79.7 5 94.4 5 0 0 85.8 6 101.0 6 0 0 89.7 7 110.0 7 0 0 Σd 2 = 14
Παράδειγµα (συνέχεια) α=
Παράδειγµα (συνέχεια) r s = 1 6 2 d 2 nn ( 1) 6(14) 1 0.75 = = 7(7 2 1)
Παράδειγµα (συνέχεια) Από πίνακες (n=7) βρίσκουµε ότι η κρίσιµη τιµή σε ε.σ. α=0,05 είναι 0,786. Η µηδενική υπόθεση δεν µπορεί να απορριφθεί αφού 0,750<0,786. Σε επίπεδο σηµαντικότητας α=0,05 δεν µπορούµε να ισχυριστούµε ότι υπάρχει στατιστικά σηµαντική συσχέτιση των τάξεων µεταξύ των δύο µεταβλητών.
Απορίες-Ερωτήσεις
Αντιστοιχίες Ελέγχων Παραµετρικοί Έλεγχοι t-test δείγµατα ανεξάρτητα t-test ζευγαρωτές παρατηρήσεις ANOVA (one-way) Συντελεστής Γραµµικής Συµµεταβολής (Pearson) Μη Παραµετρικοί Έλεγχοι Mann-Whitney test Wilcoxon test Kruskal-Wallis test Συντελεστής Συσχέτισης των Τάξεων (Spearman)
Μη Παραµετρικοί Έλεγχοι
Ποια είναι τα µειονεκτήµατα των Μη Παραµετρικών ελέγχων;
Βιβλιογραφία Φωτιάδης, Ν.. (1995). Εισαγωγή στη Στατιστική για Βιολογικές Επιστήµες. Θεσσαλονίκη: University Studio Press. Κολυβά, Φ. και Μπόρα-Σέντα Σέντα, Ε. (1995). Στατιστική: Θεωρία- Εφαρµογές. Θεσσαλονίκη: Εκδόσεις ΖΗΤΗ.