ΑΝΑΛΥΣΗ ΙΑΣΠΟΡΑΣ (Oe-way aalysis of variace) Να γίνει µια εισαγωγή στη µεθοδολογία της ανάλυσης > δειγµάτων Να εφαρµοσθεί και να κατανοηθεί η ανάλυση διασποράς µε ένα παράγοντα. Να κατανοηθεί η χρήση των post-hoc ελέγχων Να σκιαγραφηθούν πιο πολύπλοκες τεχνικές ανάλυσης διασποράς όπως η ανάλυση µε δύο ή περισσότερους παράγοντες, (-way ANOVA), η ανάλυση διασποράς επαναληπτικών µετρήσεων (repeated measuremets ANOVA) Χαρακτηριστικά της ανάλυσης διασποράς Η ανάλυση διασποράς (ANOVA) είναι µια τεχνική που χρησιµοποιείται για να καθορίσουµε κατά πόσο ένας µελετώµενος παράγοντας συνεισφέρει στη µεταβλητότητα ενός δείγµατος. Ο παράγοντας χωρίζεται σε > οµάδες ή κατηγορίες (groups) Μοντέλο Ι (Model I) Συγκεκριµένες κατηγορίες (Fixed effects) Π.χ. 4 υπερτασικά φάρµακα µε ίδια δραστική. Μοντέλο ΙΙ (Model II) Τυχαίες κατηγορίες (Radom effects) Π.χ. 4 από ένα σύνολο υπερτασικών φάρµακων. Ανεξαρτήτως µοντέλου η µαθηµατική προσέγγιση είναι η ίδια Προϋποθέσεις της ανάλυσης διασποράς Οι διασπορές των κατηγοριών είναι σ = σ =. = σ κ = σ και άγνωστες Οι µετρήσεις (τιµές) σε κάθε κατηγορία ακολουθούν κανονική κατανοµή Οι πληθυσµοί είναι ανεξάρτητοι µεταξύ τους. Γιατί δεν εφαρµόζουµε έλεγχο t; H διαδικασία των t-ελέγχων είναι αρκετά επίπονη. Για οµάδες τιµών θα πρέπει να εφαρµοσθούν! = ( )!! έλεγχοι. Π.χ. για =5 πρέπει να γίνουν 0 t-έλεγχοι. Αυξάνεται η πιθανότητα λάθους Τύπου Ι. ιαφορετικά η πιθανότητα να αποδεχθούµε την Ηο ενώ αυτή είναι λανθασµένη. Π.χ. για 5 οµάδες (-0,05) 0 =0,403. Τι είναι η Ανάλυση ιασποράς; Είναι η εκτίµηση κατά πόσο η διασπορά οφείλεται σε παράγοντες εντός των οµάδων ή µεταξύ των οµάδων. Παράδειγµα 7.. Σε ένα πείραµα µετρήθηκε η έκκριση ινσουλίνης σε δείγµατα παγκρεατικού ιστού πειραµατόζωων. Τα δείγµατα χωρίστηκαν σε 5 οµάδες µε βάση τα επίπεδα γλυκόζης. Οµάδα,53,69 375,89 3,6,83,86,59 Οµάδα 3,5 3,96 3,59,89,45 3,49,56,44 Οµάδα 3 3,89 4,80 3,68 5,70 5,6 5,79 4,75 5,33 Οµάδα 4 8,8 5,64 7,36 5,33 8,8 5,6 8,75 7,0 Οµάδα 5 5,86 5,46 5,69 6,49 7,8 9,03 7,49 8,98 Κάθε µία οµάδα αντιστοιχεί σε διαφορετικά επίπεδα γλυκόζης. Θέλουµε να εξετάσουµε ένα υπάρχει στατιστικά σηµαντική διαφορά στις µέσες τιµές των κατηγοριών αυτών. 3 4
ΟΡΟΛΟΓΙΑ-ΣΥΜΒΟΛΙΣΜΟΙ : ο συνολικός αριθµός των µετρήσεων i : ο αριθµός µετρήσεων της οµάδας i : ο αριθµός των οµάδων (κατηγοριών) x ij : η µέτρηση i από την οµάδα j x j SS w : η µέση τιµή της οµάδας j η µέση τιµή που προκύπτει από όλες τις µέσες τιµές Withi Sum of squares (άθροισµα τετραγώνων εντός των οµάδων). i ( xij xj ) = ( ) s + ( ) s +... + ( ) s j= i= SS B : Betwee Sum of squares (άθροισµα τετραγώνων µεταξύ των οµάδων) ( x ) = ( x ) + ( x ) +... + ( x ) j = x + x +... + x = + +... + j 5 SS T : ΟΡΟΛΟΓΙΑ-ΣΥΜΒΟΛΙΣΜΟΙ Total Sum of squares (άθροισµα τετραγώνων όλων των µετρήσεων) SS T =SS w +SS B w : Mea Sum of squares withi groups. (Μέσο άθροισµα τετραγώνων εντός των οµάδων) B : Mea Sum of squares betwee groups (Μέσο άθροισµα τετραγώνων µεταξύ των οµάδων) F: Τιµή στατιστικού F crit : j= i= ( x ) Το κρίσιµο σηµείο της συνάρτησης F a,, i ij SS w - SS B - 6 B w Ν(µ, σ ) Ν(µ, σ ) Ν(µ 3, σ 3 ) Ν(µ, σ ) Ν(µ, σ ) Ν(µ 3, σ 3 ) Ho: µ =µ =µ 3 =µ Hα: µ µ =µ 3 =µ Η κατανοµή F() Πρόκειται για µια ασύµµετρη κατανοµή Το πεδίο ορισµού της F-κατανοµής είναι το (0, + ) Οι αναµενόµενες τιµές για τη µέση τιµή και τη διασπορά της είναι: f(χ) EF ( ) = >, ( + ) Var( F ) = > 4, ( ) ( 4) Ν(µ, σ ) Ν(µ, σ ) -α α SS b ~=SS w SS b > SS w Fcrit 7 8
F a,, = Η κατανοµή F() Αν Χ Χ δύο τυχαίες µεταβλητές που ακολουθούν µία χ -κατανοµή µε και βαθµούς ελευθερίας τότε ο λόγος F a,, ακολουθεί µια F-κατανοµή µε και βαθµούς ελευθερίας. Μια σηµαντική ιδιότητα της F είναι: a,, = F a,, Όπως και στις υπόλοιπες κατανοµές οι τιµές της F δίνονται από κατάλληλους στατιστικούς πίνακες F Κατανοµή F Για α= 0,0 ν 3 4 5 6 7 8 9 0 5 0 4 30 40 60 0 if ν 405 4999 5404 564 5764 5859 598 598 60 6056 607 657 609 634 660 686 633 6340 6366 98,5 99,0 99, 99,3 99,3 99,3 99,4 99,4 99,4 99,4 99,4 99,4 99,4 99,5 99,5 99,5 99,5 99,5 99,5 3 34, 30,8 9,5 8,7 8, 7,9 7,7 7,5 7,3 7, 7, 6,9 6,7 6,6 6,5 6,4 6,3 6, 6, 4, 8,0 6,7 6,0 5,5 5, 5,0 4,8 4,7 4,5 4,4 4, 4,0 3,9 3,8 3,7 3,7 3,6 3,5 5 6,3 3,3,,4,0 0,7 0,5 0,3 0, 0, 9,9 9,7 9,6 9,5 9,4 9,3 9, 9, 9,0 6 3,7 0,9 9,8 9, 8,7 8,5 8,3 8, 8,0 7,9 7,7 7,56 7,40 7,3 7,3 7,4 7,06 6,97 5,65 7, 9,55 8,45 7,85 7,46 7,9 6,99 6,84 6,7 6,6 6,47 6,3 6,6 6,07 5,99 5,9 5,8 5,74 6,65 8,3 8,65 7,59 7,0 6,63 6,37 6,8 6,03 5,9 5,8 5,67 5,5 5,36 5,8 5,0 5, 5,03 4,95 4,86 9 0,6 8,0 6,99 6,4 6,06 5,80 5,6 5,47 5,35 5,6 5, 4,96 4,8 4,73 4,65 4,57 4,48 4,40 4,3 0 0,0 7,56 6,55 5,99 5,64 5,39 5,0 5,06 4,94 4,85 4,7 4,56 4,4 4,33 4,5 4,7 4,08 4,00 3,9 9,65 7, 6, 5,67 5,3 5,07 4,89 4,74 4,63 4,54 4,40 4,5 4,0 4,0 3,94 3,86 3,78 3,69 3,60 9,33 6,93 5,95 5,4 5,06 4,8 4,64 4,50 4,39 4,30 4,6 4,0 3,86 3,78 3,70 3,6 3,54 3,45 3,36 3 9,07 6,70 5,74 5, 4,86 4,6 4,44 4,30 4,9 4,0 3,96 3,8 3,66 3,59 3,5 3,43 3,34 3,5 3,7 4 8,86 6,5 5,56 5,04 4,69 4,46 4,8 4,4 4,03 3,94 3,80 3,66 3,5 3,43 3,35 3,7 3,8 3,09 3,00 5 8,68 6,36 5,4 4,89 4,56 4,3 4,4 4,00 3,89 3,80 3,67 3,5 3,37 3,9 3, 3,3 3,05,96,87 6 8,53 6,3 5,9 4,77 4,44 4,0 4,03 3,89 3,78 3,69 3,55 3,4 3,6 3,8 3,0 3,0,93,84,75 7 8,40 6, 5,9 4,67 4,34 4,0 3,93 3,79 3,68 3,59 3,46 3,3 3,6 3,08 3,00,9,83,75,65 8 8,9 6,0 5,09 4,58 4,5 4,0 3,84 3,7 3,60 3,5 3,37 3,3 3,08 3,00,9,84,75,66,57 9 8,8 5,93 5,0 4,50 4,7 3,94 3,77 3,63 3,5 3,43 3,30 3,5 3,00,9,84,76,67,58,49 0 8,0 5,85 4,94 4,43 4,0 3,87 3,70 3,56 3,46 3,37 3,3 3,09,94,86,78,69,6,5,4 8,0 5,78 4,87 4,37 4,04 3,8 3,64 3,5 3,40 3,3 3,7 3,03,88,80,7,64,55,46,36 7,95 5,7 4,8 4,3 3,99 3,76 3,59 3,45 3,35 3,6 3,,98,83,75,67,58,50,40,3 3 7,88 5,66 4,76 4,6 3,94 3,7 3,54 3,4 3,30 3, 3,07,93,78,70,6,54,45,35,6 4 7,8 5,6 4,7 4, 3,90 3,67 3,50 3,36 3,6 3,7 3,03,89,74,66,58,49,40,3, 5 7,77 5,57 4,68 4,8 3,85 3,63 3,46 3,3 3, 3,3,99,85,70,6,54,45,36,7,7 30 7,56 5,39 4,5 4,0 3,70 3,47 3,30 3,7 3,07,98,84,70,55,47,39,30,,,0 40 7,3 5,8 4,3 3,83 3,5 3,9 3,,99,89,80,66,5,37,9,0,,0,9,80 60 7,08 4,98 4,3 3,65 3,34 3,,95,8,7,63,50,35,0,,03,94,84,73,60 0 6,85 4,79 3,95 3,48 3,7,96,79,66,56,47,34,9,03,95,86,76,66,53,38 if 6,63 4,6 3,78 3,3 3,0,80,64,5,4,3,8,04,88,79,70,59,47,3,00 9 0 Κατανοµή F Για α= 0,05 ν 3 4 5 6 7 8 9 0 5 0 4 30 40 60 0 if ν 6 99 6 5 30 34 37 39 4 4 44 46 48 49 50 5 5 53 54 8,5 9,0 9, 9, 9,3 9,3 9,4 9,4 9,4 9,4 9,4 9,4 9,4 9,5 9,5 9,5 9,5 9,5 9,5 3 0, 9,6 9,3 9, 9,0 8,9 8,9 8,8 8,8 8,8 8,7 8,7 8,7 8,6 8,6 8,6 8,6 8,5 8,53 4 7,7 6,9 6,6 6,4 6,3 6, 6, 6,0 6,0 6,0 5,9 5,9 5,8 5,8 5,7 5,7 5,7 5,7 5,63 5 6,6 5,8 5,4 5, 5, 5,0 4,9 4,8 4,8 4,7 4,7 4,6 4,6 4,5 4,5 4,5 4,4 4,4 4,37 6 6,0 5, 4,8 4,5 4,4 4,3 4, 4, 4, 4, 4,00 3,94 3,87 3,84 3,8 3,77 3,74 3,70 3,67 7 5,6 4,74 4,35 4, 3,97 3,87 3,79 3,73 3,68 3,64 3,57 3,5 3,44 3,4 3,38 3,34 3,30 3,7 3,3 8 5,3 4,46 4,07 3,84 3,69 3,58 3,50 3,44 3,39 3,35 3,8 3, 3,5 3, 3,08 3,04 3,0,97,93 9 5, 4,6 3,86 3,63 3,48 3,37 3,9 3,3 3,8 3,4 3,07 3,0,94,90,86,83,79,75,7 0 5,0 4,0 3,7 3,48 3,33 3, 3,4 3,07 3,0,98,9,85,77,74,70,66,6,58,54 4,84 3,98 3,59 3,36 3,0 3,09 3,0,95,90,85,79,7,65,6,57,53,49,45,40 4,75 3,89 3,49 3,6 3, 3,00,9,85,80,75,69,6,54,5,47,43,38,34,3 3 4,67 3,8 3,4 3,8 3,03,9,83,77,7,67,60,53,46,4,38,34,30,5, 4 4,60 3,74 3,34 3,,96,85,76,70,65,60,53,46,39,35,3,7,,8,3 5 4,54 3,68 3,9 3,06,90,79,7,64,59,54,48,40,33,9,5,0,6,,07 6 4,49 3,63 3,4 3,0,85,74,66,59,54,49,4,35,8,4,9,5,,06,0 7 4,45 3,59 3,0,96,8,70,6,55,49,45,38,3,3,9,5,0,06,0,96 8 4,4 3,55 3,6,93,77,66,58,5,46,4,34,7,9,5,,06,0,97,9 9 4,38 3,5 3,3,90,74,63,54,48,4,38,3,3,6,,07,03,98,93,88 0 4,35 3,49 3,0,87,7,60,5,45,39,35,8,0,,08,04,99,95,90,84 4,3 3,47 3,07,84,68,57,49,4,37,3,5,8,0,05,0,96,9,87,8 4,30 3,44 3,05,8,66,55,46,40,34,30,3,5,07,03,98,94,89,84,78 3 4,8 3,4 3,03,80,64,53,44,37,3,7,0,3,05,0,96,9,86,8,76 4 4,6 3,40 3,0,78,6,5,4,36,30,5,8,,03,98,94,89,84,79,73 5 4,4 3,39,99,76,60,49,40,34,8,4,6,09,0,96,9,87,8,77,7 30 4,7 3,3,9,69,53,4,33,7,,6,09,0,93,89,84,79,74,68,6 40 4,08 3,3,84,6,45,34,5,8,,08,00,9,84,79,74,69,64,58,5 60 4,00 3,5,76,53,37,5,7,0,04,99,9,84,75,70,65,59,53,47,39 0 3,9 3,07,68,45,9,8,09,0,96,9,83,75,66,6,55,50,43,35,5 if 3,84 3,00,60,37,,0,0,94,88,83,75,67,57,5,46,39,3,,00 ΛΥΣΗ ΠΑΡΑ ΕΙΓΜΑΤΟΣ 7. Βήµα ο. H o : µ = µ =µ 3 =µ 4 =µ 5 εναντίον Η α : ένα τουλάχιστον από τα µ i είναι διαφορετικό. Βήµα ο. Υπολογίζουµε τα περιγραφικά στατιστικά µέσες τιµές x i τις διασπορές σ ι κλπ για κάθε οµάδα ξεχωριστά. Οµάδες i Σx i j S Οµάδα 8,40,68 0,56 Οµάδα 8,53,69 0,97 Οµάδα 3 8 39,56 4,95 0,67 Οµάδα 4 8 56,44 7,06, Οµάδα 5 8 56,8 7,0,07 Στη συνέχεια υπολογίζουµε τη µέση τιµή τις διαφορές και τα αθροίσµατα τετραγώνων για τον πληθυσµό. SS (w) SS (b) = 4.89 3,89 39,374 6,79 38,799 4,660 0,0 5,549 37,377 4,503 38,993 45,394 54,564 3
Βήµα 3ο. Υπολογισµός των και της τιµής του στατιστικού F SSw 45,39 SSB 54,56 w = = =,30 B = =38,64-35 - = 5 B 38,64 F= = = 9,79,30 Βήµα 4ο. ΛΥΣΗ ΠΑΡΑ ΕΙΓΜΑΤΟΣ 7. w Επιλογή της κρίσιµης τιµής F crit Η κρίσιµη τιµή F crit υπολογίζεται για α=0,05 και κ-=4 και -=40-5=35 βαθµούς ελευθερίας. Από πίνακες της F- κατανοµής Fα, 4, 35 =,64 Βήµα 5ο. Από τη σύγκριση των F και F crit προκύπτει ότι : Ηο απορρίπτεται. Τουλάχιστον µία οµάδα έχει διαφορετική µέση τιµή από τις υπόλοιπες. Εκ των υστέρων έλεγχοι (post-hoc tests) Η ανάλυση διασποράς µας δείχνει εάν υπάρχει στατιστικά σηµαντική διαφορά µεταξύ των κατηγοριών (οµάδων). Πως µπορούµε να ελέγξουµε ποια ή ποιες από τις οµάδες διαφοροποιείται; Έχει αναπτυχθεί µια µεθοδολογία εκ των υστέρων (post-hoc tests). Τα γνωστότερα post-hoc tests είναι Boferroi Tuey s LSD (Least Square Differece) Duett Studets-Neuma-Keuls (SNK) Waller-Duca. 3 Καλούνται και adjusted t-tests. 4 Εκ των υστέρων έλεγχοι (post-hoc tests) Ho: µ i =µ j εναντίον H A : µ i µ j Boferroi correctio. έχεται µικρότερο (πιο ισχυρό) επίπεδο σηµαντικότητας α, a 0,05 0, 05 ab = Π. χ. ab = = = 0,005 5 0 x i xj tij = w( + ) i j Duett. Για σύγκριση µε µία οµάδα ελέγχου. Tueys HSD και SNK Χρησιµοποιούνται αρκετά συχνά. Στο Tueys HSD υπολογίζεται µια νέα κρίσιµη τιµή d T. Αν η διαφορά των µέσων τιµών είναι µεγαλύτερη από το d T τότε η Ho απορρίπτεται. 5 Πρόβληµα Παράδειγµα. Σε 36 άτοµα που αρχικώς συµµετείχαν σε εγχειρήσεις υπερµετρωπίας µελετήθηκε η αλλαγή διοπτριών. Προκειµένου να ελέγξουµε την βελτίωση των ασθενών έγιναν µετρήσεις διοπτρίας στις εξής χρονικές στιγµές: προεγχειρητικά, -, 3-, 6-, 9- και - µήνες µετά τις εγχειρήσεις. Από την αρχική οµάδα 36 ατόµων που µετρήθηκαν προεγχειρητικά, 9/36 άτοµα µετρήθηκαν τον ο, 3ο και 6ο µήνα, 6/36 τον 9ο µήνα και 3/36 τον ο µήνα µετά την εγχείρηση. Μπορεί να υποστηριχθεί ότι υπάρχει διαφορά στις διοπτρίες µεταξύ των µετρήσεων σε διαφορετικούς µήνες; Που παρουσιάζεται αν παρουσιάζεται- αυτή η διαφορά; Από δηµιοσιευµένο άρθρο. Paliaris IG, Naoumidi TL, Paagopoulou SI, Alegais AK. Astyraais NI (003) Coductive eratoplasty for low to moderate hyperopia: -year results. Joural of Refractive Surgery, 9: 496-506. 6 4
ΛΥΣΗ ΠΑΡΑ ΕΙΓΜΑΤΟΣ (ΜΕ ΧΡΗΣΗ ECEL) ΛΥΣΗ ΠΑΡΑ ΕΙΓΜΑΤΟΣ (ΜΕ ΧΡΗΣΗ ECEL) Επιλέγουµε Εργαλεία-Ανάλυση εδοµένων-ανάλυση διακύµανσης κατά ένα παράγοντα (Tools-Data Aalysis-Oe way Aova) 7 Το ECEL δεν εκτελεί post-hoc tests. 8 ONEWAY dioptr BY oper_mo /STATISTICS DESCRIPTIVES /MISSING ANALYSIS /POSTHOC = SNK TUKEY DUNNETT () ALPHA(.05). 9 0 5
Oeway DIOPTR Moth Moths Total DIOPTR Betwee Groups Withi Groups Total Descriptives 95% Cofidece Iterval for Mea N Mea Std. Deviatio Std. Error Lower Boud Upper Boud Miimum Maximum 36,847,5945,09874,6468,0477,00 3,5 9 -,483,6497,055 -,495 -,003 -,88,3 9 -,05,7465,3863 -,389,788 -,38,3 9 -,0457,68940,80 -,3079,65 -,50,3 6,047,7990,5674 -,757,3699 -,50,3 3 -,0598,79447,6566 -,4033,838 -,50,83 7,385,05563,08049,596,4773 -,50 3,5 ANOVA Sum of Squares df Mea Square F Sig. 07,705 5,54 43,60,000 8,850 66,499 90,556 7 Multiple Comparisos Depedet Variable: DIOPTR Tuey HSD Mea Differece 95% Cofidece Iterval (I) OPER_MON (J) OPER_MON (I-J) Std. Error Sig. Lower Boud Upper Boud Moth,0955*,768,000,587,6038,954*,768,000,444,4607,899*,768,000,3846,40,800*,88,000,759,344 Moths,9070*,8858,000,3633,4507 Moth -,0955*,768,000 -,6038 -,587 -,43,8553,97 -,6780,398 -,06,8553,884 -,7375,333 -,954,9080,634 -,8455,548 Moths -,885,976,93 -,757,3803 -,954*,768,000 -,4607 -,444 Moth,43,8553,97 -,398,6780 -,0595,8553,000 -,5944,4754 -,53,9080,967 -,704,3979 Moths -,0454,976,000 -,64,534 -,899*,768,000 -,40 -,3846 Moth,06,8553,884 -,333,7375,0595,8553,000 -,4754,5944 -,098,9080,997 -,6430,4573 Moths,04,976,000 -,5547,588 -,800*,88,000 -,344 -,759 Moth,954,9080,634 -,548,8455,53,9080,967 -,3979,704,098,9080,997 -,4573,6430 Moths,069,03,995 -,476,6900 Moths -,9070*,8858,000 -,4507 -,3633 Moth,885,976,93 -,3803,757,0454,976,000 -,534,64 -,04,976,000 -,588,5547 -,069,03,995 -,6900,476 *. The mea differece is sigificat at the.05 level. Multiple Comparisos Depedet Variable: DIOPTR Duett t (-sided) a ΠΕΡΙΛΗΨΗ Mea Differece 95% Cofidece Iterval (I) OPER_MON (J) OPER_MON (I-J) Std. Error Sig. Lower Boud Upper Boud Moth -,0955*,768,000 -,5458 -,645 -,954*,768,000 -,407 -,50 -,899*,768,000 -,343 -,446 -,800*,88,000 -,645 -,3357 Moths -,9070*,8858,000 -,3887 -,453 *. The mea differece is sigificat at the.05 level. a. Duett t-tests treat oe group as a cotrol, ad compare all other groups agaist it. DIOPTR a,b Studet-Newma-Keuls Subset for alpha =.05 OPER_MON N Moth 9 -,483 9 -,05 Moths 3 -,0598 9 -,0457 6,047 36,847 Sig.,50,000 Meas for groups i homogeeous subsets are displayed. a. Uses Harmoic Mea Sample Size = 8,47. b. The group sizes are uequal. The harmoic mea of the group sizes is used. Type I error levels are ot guarateed. 3 ANOVA: Μας επιτρέπει να γνωρίζουµε εάν η µεταβλητότητα βρίσκεται µεταξύ των οµάδων ή µέσα στις οµάδες Είναι καλύτερο από το t-testt test Μπορεί να συγκρίνει κανείς περισσότερες από δύο οµάδες εν εφαρµόζεται σε επαναλαµβανόµενες µετρήσεις εν µας «δείχνει» ποιες οµάδες είναι διαφορετικές. Για να απαντήσω στο τελευταίο χρειάζοµαι τη χρήση των post-hoc tests. 4 6