Πολλαπλές Συγκρίσεις Μέσων Γενικά Η ANOVA αποκαλύπτει εάν υπάρχουν διαφορές μεταξύ των επεμβάσεων, αλλά ποιες ακριβώς είναι αυτές? Κατηγορίες συγκρίσεων A posteriori συγκρίσεις (αφού δούμε τα δεδομένα) Ακολουθούνται κατάλληλες δοκιμές σύγκρισης μέσων Προσχεδιασμένες συγκρίσεις ( α priori -πριν δούμε τα δεδομένα) Χρησιμοποιούνται ορθογώνιες συγκρίσεις για ομάδες επεμβάσεων ή πραγματοποιείται ένας περιορισμένος αριθμός προσχεδιασμένων συγκρίσεων μέσων Ποσοτικές επεμβάσεις με ισαπέχοντα βήματα Αξιοποιούνται αναλύσεις απόκρισης επιφάνειας (γραμμική παλινδρόμηση, πολυώνυμα)
Α posteriori συγκρίσεις μέσων Συγκρίσεις κατά ζεύγη Ελάχιστη σημαντική διαφορά ΕΣΔ (LSD) Άλλες πολλαπλές συγκρίσεις Προστατευμένη ΕΣΔ του Fisher Δοκιμή του Duncan Δοκιμή Student-Newman- Keuls (SNK) Δοκιμή του Tukey -έντιμη σημαντική διαφορά (HSD) Δοκιμή του Scheffe Δοκιμή του Dunnett (όλες οι συγκρίσεις με τον μάρτυρα) Συχνά χρησιμοποιούνται λανθασμένα!! Πρέπει να εφαρμόζονται μόνο σε δεδομένα πειραμάτων όπου οι επεμβάσεις δεν παρουσιάζουν συγκεκριμένη δομή
Σφάλμα I vs Σφάλμα II (υπενθύμιση) Σφάλμα I συμπεραίνουμε ότι κάτι είναι διαφορετικό ενώ στην πραγματικότητα είναι το ίδιο η πιθανότητα διάπραξής του είναι το επίπεδο σημαντικότητας της δοκιμής α Σφάλμα II - συμπεραίνουμε ότι κάτι είναι το ίδιο ενώ στην πραγματικότητα είναι διαφορετικό η πιθανότητα διάπραξής του είναι το b Η πιθανότητα ότι η σύγκριση θα αποκαλύψει μια πραγματική διαφορά αποτελεί την ισχύ της δοκιμής και ισούται με 1-b Οι συχνότητες των σφαλμάτων I και II είναι αντιστρόφως ανάλογες Για δεδομένη πιθανότητα σφάλματος I, η πιθανότητα διάπραξης σφάλματος II εξαρτάται από Το μέγεθος του δείγματος (επαναλήψεις) Τη τυχαία διακύμανση Τις πραγματικές διαφορές μεταξύ των μέσων των επεμβάσεων
Κανείς δε θέλει να κάνει λάθη Η προστασία έναντι του σφάλματος I παρέχεται από το επιλεγμένο επίπεδο σημαντικότητας Η προστασία έναντι του σφάλματος ΙI είναι δυσκολότερη διότι εξαρτάται από το πραγματικό μέγεθος της άγνωστης διαφοράς Επιλέγεται δοκιμασία με ικανοποιητικά υψηλή ισχύ Οι λόγοι που δεν επιτρέπουν τη χρήση της ΕΣΔ για περισσότερες από t -1 συγκρίσεις οι πιθανότητες σφάλματος I αυξάνονται δραστικά με την αύξηση των κατά ζεύγη συγκρίσεων π.χ. μόνο με 20 μέσους, μπορεί να διαπραχθεί σφάλμα Ι με πιθανότητα 95% (σε 95 από τα 100 πειράματα)
Σφάλμα κατά σύγκριση και Σφάλμα κατά πείραμα Βαθμός σφάλματος κατά σύγκριση (α ΚΣ = α ) - Εκφράζει το ποσοστό όλων των διαφορών που αναμένεται να θεωρηθούν σημαντικές ενώ στην πραγματικότητα δεν είναι (δηλ. το επίπεδο σημαντικότητας της δοκιμής) Βαθμός σφάλματος κατά πείραμα (α ΚΠ ) - Ο κίνδυνος να διαπραχθεί τουλάχιστον ένα σφάλμα τύπου I στην ομάδα των συγκρίσεων στο πείραμα - Μετρά το ποσοστό των πειραμάτων στο οποία μια ή περισσότερες διαφορές θεωρούνται λανθασμένα ως σημαντικές - Η πιθανότητα σφάλματος αυξάνεται με την αύξηση του αριθμού των μέσων που συγκρίνονται
Σφάλμα κατά σύγκριση vs Σφάλμα κατά πείραμα (συν.) Βαθμός σφάλματος κατά πείραμα (α ΚΠ ) Η πιθανότητα μη διάπραξης σφάλματος τύπου Ι είναι (1-α) c Άρα η πιθανότητα διάπραξης τουλάχιστον ενός σφάλματος τύπου Ι σε μία ομάδα συγκρίσεων (βαθμός σφάλματος κατά πείραμα) είναι α ΚΠ = 1- (1-α) c όπου c = ο αριθμός των συγκρίσεων ανά ζεύγη μέγιστο c για t επεμβάσεις = t (t-1)/2 Εάν πχ. t = 10, μέγιστο c = 45 άρα α ΚΠ = 90% Για μικρό c α ΚΠ = c (α ) Βαθμός σφάλματος κατά σύγκριση α ΚΣ = 1- (1-α ΚΠ ) 1/c
Α posteriori πολλαπλές συγκρίσεις μέσων Όλες οι μέθοδοι προσπαθούν να αντιμετωπίσουν τον αυξημένο α ΚΠ μειώνοντας το μέγεθος της κρίσιμης περιοχής, δηλ. καθιστώντας δυσκολότερη την απόρριψη της Η 0. Έτσι, λιγότερα σφάλματα τύπου Ι οδηγούν σε μικρότερο α ΚΠ Στη μέθοδο ΕΣΔ δεν γίνεται καμιά διόρθωση για το α ΚΠ Στις μεθόδους Tukey και Scheffe μειώνεται πραγματικά το α ΚΣ = α. Με τον τρόπο αυτό διατηρείται το α ΚΠ σε επιθυμητό επίπεδο για όλες τις δυνατές συγκρίσεις ανεξάρτητα από το εάν γίνουν όλες ή μόνο ορισμένες Στις μεθόδους Duncan και SNK, το μέγεθος της κρίσιμης περιοχής εξαρτάται από τον αριθμό των μέσων όρων που παρεμβάλλονται μεταξύ αυτών που συγκρίνονται όταν οι μ.ο. κατατάσσονται κατά αύξουσα σειρά
Ελάχιστη Σημαντική Διαφορά (ΕΣΔ) Υπολογισμός του t για τον έλεγχο της διαφοράς δύο μέσων όρων t = (Y Y ) / s 2 1 2 Y Y 1 2 Κάθε διαφορά για την οποία το t > t α είναι σημαντική Επιπλέον, σημαντική 2 tα s Y Y 1 2 είναι η μικρότερη διαφορά που μπορεί να θεωρηθεί - Επομένως 2 LSD = t α s Y Y 1 2 - Ή με ίσο αριθμό επαναλήψεων r LSD = t α 2 MSE / r
Πότε χρησιμοποιείται η ΕΣΔ Η ΕΣΔ είναι μια σωστή δοκιμασία όταν - Γίνονται συγκρίσεις που έχουν σχεδιασθεί πριν δούμε τα δεδομένα (περιλαμβάνει και τη σύγκριση κάθε επέμβασης με τον μάρτυρα) - Συγκρίνονται γειτονικού μέσοι όροι που έχουν καταταχθεί με σειρά μεγέθους Η ΕΣΔ δεν πρέπει να χρησιμοποιείται - Για συγκρίσεις όλων των δυνατών ζευγών μέσων - Για περισσότερες συγκρίσεις από όσοι είναι οι ΒΕ των επεμβάσεων
Παράδειγμα Προσδιορισμός της καλύτερης επέμβασης Θελήσαμε να αξιολογήσουμε συγκριτικά την ανθεκτικότητα έξι ποικιλιών σίτου στη σκωρίαση: κάθε ποικιλία σπάρθηκε σε τέσσερα δοχεία (5 σπόροι σε κάθε δοχείο) τα 24 δοχεία τοποθετήθηκαν τυχαία σε πάγκο θερμοκηπίου ακολούθησε, σε κατάλληλο στάδιο, μόλυνση με σκωρίαση στην ωρίμανση, μετρήθηκε η απόδοση σε κάθε δοχείο Εντελώς τυχαίο σχέδιο, 6 επεμβάσεις, 4 επαναλήψεις
Παράδειγμα (συνέχεια) Οι μέσες αποδόσεις (g/δοχείο) κατά τάξη μεγέθους Ποικιλία Τάξη Απόδοση Y i F 1 95.3 Διαφορά Y i-1 - Y i D 2 94.0 1.3 E 3 75.0 19.0 B 4 69.0 6.0 A 5 50.3 18.7 C 6 24.0 26.3 ANOVA Πηγή ΒΕ ΜΤ F Ποικιλία 5 2,976.44 24.80 Σφάλμα 18 120.00
Υπολογισμός ΕΣΔ στο 5% και 1% LSD t α = 2 MSE / r = 2.101 ( 2 * 120 ) / 4 = 16.27 LSD = t α 2 MSE / r = 2.878 ( 2 * 120 ) / 4 = 22.29 Ποικιλία Τάξη Απόδοση Διαφορά LSD α=0.05 = 16.27 LSD α=0.01 = 22.29 Συγκρίσεις κατά ζεύγη Y i Y i-1 - Y i F 1 95.3 D 2 94.0 1.3 E 3 75.0 19.0* B 4 69.0 6.0 A 5 50.3 18.7* C 6 24.0 26.3** Εάν δοκιμάζονται 10 ποικιλίες και θέλουμε να εξετάσουμε όλες τις δυνατές συγκρίσεις κατά ζεύγη, ο αριθμός τους είναι t(t-1)/2 or 10(9)/2 = 45 - Σαφώς περισσότερες από t-1 ΒΕ = 9 - Η ΕΣΔ επιτρέπει μόνο 9 συγκρίσεις
Προστατευμένη ΕΣΔ (Fisher s protected LSD) Χρησιμοποιεί το βαθμό σφάλματος κατά σύγκριση Είναι η γνωστή ΕΣΔ αλλά, σε αντίθεση με τις προσχεδιασμένες συγκρίσεις, η χρήση της προϋποθέτει σημαντικό F για τις επεμβάσεις από τη σχετική ANOVA. LSD = t α 2MSE / r Επομένως, στο προηγούμενο παράδειγμα, κάθε διαφορά μεταξύ των μέσων όρων που είναι μεγαλύτερη από το 16.27 είναι στατιστικώς σημαντική.
Δοκιμή του Duncan ( Multiple-Range) Η μέθοδος δέχεται ένα επίπεδο προστασίας για την ομάδα συγκρίσεων που γίνονται και όχι για την κάθε σύγκριση χωριστά. Το επίπεδο σημαντικότητας για κάθε σύγκριση διαφέρει ανάλογα με την κατάταξη των μέσων όρων που συγκρίνονται στα διάφορα στάδια - οι μέσοι όροι κατατάσσονται κατά μέγεθος - υπολογίζεται το τυπικό σφάλμα του μέσου όρου - από τον Πιν.2 βρίσκουμε τις κρίσιμες τιμές R για κάθε σύγκριση μέσων όρων, για το ειδικό επίπεδο προστασίας που επιθυμούμε, με βάση την απόσταση των μέσων όρων που υπεισέρχονται στις συγκρίσεις (πχ για τη σύγκριση του 1 ου με τον 4 ο μ.ο. το R είναι 3.649) - οι τιμές αυτές πολλαπλασιάζονται με το τυπικό σφάλμα του μ.ο. και προκύπτει η ελάχιστη σημαντική περιοχή (ΕΣΠ) για κάθε σύγκριση
Δοκιμή του Duncan. ( Παράδειγμα 6 επεμβάσεις, 2 επαναλήψεις) Επίπεδο σημαντικότητας 0.05 ΜΤ Σφάλματος 113.08 ΒΕ Σφάλματος 6 Τυπ. σφάλμα μ.ο = = 7.52 Αριθμός μέσων (p) 2 3 4 5 6 Τιμή του Πινάκα 2 3.46 3.586 3.649 3.68 3.694 Τυπ. σφάλμα μ.ο. 7.52 7.52 7.52 7.52 7.52 Κρίσιμη περιοχή 26.02 26.97 27.44 27.67 27.78 Επέμβαση Μ.όρος Ομαδοποίηση 6 95.30 a 4 94.00 a 5 75.00 a b 2 69.00 a b 1 50.30 b 3 22.50 c
Δοκιμή Student-Newman- Keuls (SNK) Η μέθοδος είναι πιο συντηρητική από αυτή του Duncan και διατηρεί το επίπεδο σημαντικότητας το πολύ στο επίπεδο α για κάθε σύγκριση. Το επίπεδο για όλες τις συγκρίσεις ως ομάδα είναι πολύ μικρότερο Χρησιμοποιεί το α ΚΠ για τις ακραίες τιμές και το α ΚΣ για τις γειτονικές τιμές - ταξινομούνται οι μέσοι όροι όπως και πριν και υπολογίζονται t-1 σημαντικές διαφορές, SNK j, με χρήση της έντιμης σημαντική ς διαφοράς (HSD) SNK j = Q α, k, ν * όπου το Q βρίσκεται από τον Πιν. 3 για κ = 2,3,..t-1 και ν τους ΒΕ του σφάλματος -συγκρίνεται ο μεγαλύτερος με τον μικρότερο μ.ο. : εάν η διαφορά είναι μικρότερη από τηνsnk, δεν υπάρχει καμία σημαντική διαφορά, εάν είναι μεγαλύτερη από την SNK, συγκρίνεται ο επόμενος μεγαλύτερος με τον επόμενο μικρότερο μ.ο. χρησιμοποιώντας την επόμενη SNK κοκ.
Δοκιμή Student-Newman- Keuls (SNK) k 2 3 4 5 6 Q 2.97 3.61 4.00 4.28 4.49 SNK 16.27 19.77 21.91 23.44 24.59 Μέση απόδοση 5 4 3 2 1 Ποικιλία Τάξη Y i = 15 συγκρίσεις F 1 95.3 18 ΒΕ σφάλματος D 2 94.0 E 3 75.0 Τυπικό σφάλμα (SE) =SQRT(120/4) = 5.477 B 4 69.0 SNK=Q*SE A 5 50.3 C 6 24.0
Η έντιμη σημαντική διαφορά (HSD) του Tukey Επιλέγεται μια τιμή Q (από τον Πίν.3) που αντιστοιχεί στον ολικό αριθμό των μ.ο και τους ΒΕ του σφάλματος και υπολογίζεται η έντιμη σημαντική διαφορά HSD = Q * Για κάθε ζεύγος μ.ο., όταν η διαφορά τους είναι μεγαλύτερη από την HSD η διαφορά αυτή κρίνεται σημαντική Η μέθοδος χρησιμοποιεί τον βαθμό σφάλματος κατά πείραμα α ΚΠ
Πίνακας 1. Η κατανομή t του Student αμφίπλευρη δοκιμασία 0,2 0,1 0,05 0,02 0,01 0,002 0,001 μονόπλευρη δοκιμασία ΒΕ 0,1 0,05 0,025 0,01 0,005 0,001 0,0005 1 3,078 6,314 12,706 31,821 63,657 318,313 636,589 2 1,886 2,92 4,303 6,965 9,925 22,327 31,598 3 1,638 2,353 3,182 4,541 5,841 10,215 12,924 4 1,533 2,132 2,776 3,747 4,604 7,173 8,61 5 1,476 2,015 2,571 3,365 4,032 5,893 6,869 6 1,44 1,943 2,447 3,143 3,707 5,208 5,959 7 1,415 1,895 2,365 2,998 3,499 4,785 5,408 8 1,397 1,86 2,306 2,896 3,355 4,501 5,041 9 1,383 1,833 2,262 2,821 3,25 4,297 4,781 10 1,372 1,812 2,228 2,764 3,169 4,144 4,587 11 1,363 1,796 2,201 2,718 3,106 4,025 4,437 12 1,356 1,782 2,179 2,681 3,055 3,93 4,318 13 1,35 1,771 2,16 2,65 3,012 3,852 4,221 14 1,345 1,761 2,145 2,624 2,977 3,787 4,14 15 1,341 1,753 2,131 2,602 2,947 3,733 4,073 16 1,337 1,746 2,12 2,583 2,921 3,686 4,015 17 1,333 1,74 2,11 2,567 2,898 3,646 3,965 18 1,33 1,734 2,101 2,552 2,878 3,61 3,922 19 1,328 1,729 2,093 2,539 2,861 3,579 3,883 20 1,325 1,725 2,086 2,528 2,845 3,552 3,849 21 1,323 1,721 2,08 2,518 2,831 3,527 3,819 22 1,321 1,717 2,074 2,508 2,819 3,505 3,792 23 1,319 1,714 2,069 2,5 2,807 3,485 3,768 24 1,318 1,711 2,064 2,492 2,797 3,467 3,745 25 1,316 1,708 2,06 2,485 2,787 3,45 3,725 26 1,315 1,706 2,056 2,479 2,779 3,435 3,707 27 1,314 1,703 2,052 2,473 2,771 3,421 3,69 28 1,313 1,701 2,048 2,467 2,763 3,408 3,674 29 1,311 1,699 2,045 2,462 2,756 3,396 3,659 30 1,31 1,697 2,042 2,457 2,75 3,385 3,646 40 1,303 1,684 2,021 2,423 2,704 3,307 3,551 60 1,296 1,671 2 2,39 2,66 3,232 3,46 120 1,289 1,658 1,98 2,358 2,617 3,16 3,373 1,282 1,645 1,96 2,327 2,576 3,091 3,291
Πίνακας 2. Κρίσιμες τιμές R για την δοκιμασία Duncan α =0,05 k 2 3 4 5 6 7 8 9 10 BE 1 17,97 17,97 17,97 17,97 17,97 17,97 17,97 17,97 17,97 2 6,085 6,085 6,085 6,085 6,085 6,085 6,085 6,085 6,085 3 4,501 4,516 4,516 4,516 4,516 4,516 4,516 4,516 4,516 4 3,926 4,013 4,033 4,033 4,033 4,033 4,033 4,033 4,033 5 3,635 3,749 3,796 3,814 3,814 3,814 3,814 3,814 3,814 6 3,46 3,586 3,649 3,68 3,694 3,697 3,697 3,697 3,697 7 3,344 3,477 3,548 3,588 3,611 3,622 3,625 3,625 3,625 8 3,261 3,398 3,475 3,521 3,549 3,566 3,575 3,579 3,579 9 3,199 3,339 3,42 3,47 3,502 3,523 3,536 3,544 3,547 10 3,151 3,293 3,376 3,43 3,465 3,489 3,505 3,516 3,522 11 3,113 3,256 3,341 3,397 3,435 3,462 3,48 3,493 3,501 12 3,081 3,225 3,312 3,37 3,41 3,439 3,459 3,474 3,484 13 3,055 3,2 3,288 3,348 3,389 3,419 3,441 3,458 3,47 14 3,033 3,178 3,268 3,328 3,371 3,403 3,426 3,444 3,457 15 3,014 3,16 3,25 3,312 3,356 3,389 3,413 3,432 3,446 16 2,998 3,144 3,235 3,297 3,343 3,376 3,402 3,422 3,437 17 2,984 3,13 3,222 3,285 3,331 3,365 3,392 3,412 3,429 18 2,971 3,117 3,21 3,274 3,32 3,356 3,383 3,404 3,421 19 2,96 3,106 3,199 3,264 3,311 3,347 3,375 3,397 3,415 20 2,95 3,097 3,19 3,255 3,303 3,339 3,368 3,39 3,409 25 2,913 3,059 3,154 3,221 3,271 3,31 3,341 3,366 3,386 30 2,888 3,035 3,131 3,199 3,25 3,29 3,322 3,349 3,371 40 2,858 3,005 3,102 3,171 3,224 3,266 3,3 3,328 3,352 60 2,829 2,976 3,073 3,143 3,198 3,241 3,277 3,307 3,333 120 2,8 2,947 3,045 3,116 3,172 3,217 3,254 3,286 3,313 2,772 2,918 3,017 3,089 3,146 3,193 3,232 3,265 3,294
Πίνακας 3. Κρίσιμες τιμές της στατιστικής Q για τις δοκιμασίες Student-Newman-Keul και Tukey α = 0,05 k 2 3 4 5 6 7 8 9 10 ΒΕ 1 17,97 27 32,8 37,1 40,4 43,1 45,4 47,4 49,1 2 6,08 8,33 9,8 10,88 11,73 12,43 13,03 13,54 13,99 3 4,5 5,91 6,82 7,5 8,04 8,48 8,85 9,18 9,46 4 3,93 5,04 5,76 6,29 6,71 7,05 7,35 7,6 7,83 5 3,64 4,6 5,22 5,67 6,03 6,33 6,58 6,8 6,99 6 3,46 4,34 4,9 5,3 5,63 5,9 6,12 6,32 6,49 7 3,34 4,16 4,68 5,06 5,36 5,61 5,82 6 6,16 8 3,26 4,04 4,53 4,89 5,17 5,4 5,6 5,77 5,92 9 3,2 3,95 4,41 4,76 5,02 5,24 5,43 5,59 5,74 10 3,15 3,88 4,33 4,65 4,91 5,12 5,3 5,46 5,6 11 3,11 3,82 4,26 4,57 4,82 5,03 5,2 5,35 5,49 12 3,08 3,77 4,2 4,51 4,75 4,95 5,12 5,27 5,39 13 3,06 3,73 4,15 4,45 4,69 4,88 5,05 5,19 5,32 14 3,03 3,7 4,11 4,41 4,64 4,83 4,99 5,13 5,25 15 3,01 3,67 4,08 4,37 4,59 4,78 4,94 5,08 5,2 16 3 3,65 4,05 4,33 4,56 4,74 4,9 5,03 5,15 17 2,98 3,63 4,02 4,3 4,52 4,7 4,86 4,99 5,11 18 2,97 3,61 4 4,28 4,49 4,67 4,82 4,96 5,07 19 2,96 3,59 3,98 4,25 4,47 4,65 4,79 4,92 5,04 20 2,95 3,58 3,96 4,23 4,45 4,62 4,77 4,9 5,01 24 2,92 3,53 3,9 4,17 4,37 4,54 4,68 4,81 4,92 30 2,89 3,49 3,85 4,1 4,3 4,46 4,6 4,72 4,82 40 2,86 3,44 3,79 4,04 4,23 4,39 4,52 4,63 4,73 60 2,83 3,4 3,74 3,98 4,16 4,31 4,44 4,55 4,65 120 2,8 3,36 3,68 3,92 4,1 4,24 4,36 4,47 4,56 2,77 3,31 3,63 3,86 4,03 4,17 4,29 4,39 4,47