3. ΑΝΑΛΥΣΗ ΠΟΣΟΤΙΚΩΝ Ε ΟΜΕΝΩΝ: ΣΥΓΚΡΙΣΕΙΣ ΜΕΤΑΞΥ ΟΜΑ ΩΝ Σκοπός είναι στο τέλος του µαθήµατος να - µπορείτε να ερµηνεύσετε αποτελέσµατα απλών ποσοτικών ελέγχων υποθέσεων (one sample t-test, independent samples t-test, t-test for paired data, Μann- Whitney test, Wilcoxon signed-ranks test, one-way ANOVA, Kruskal-Wallis). - γνωρίζετε πότε, για έναν συγκεκριµένο σχεδιασµό µελέτης, θα πρέπει να εφαρµοστεί ένας έλεγχος υπόθεσης για ανεξάρτητα δείγµατα και πότε ένας έλεγχος για παρατηρήσεις κατά ζεύγη. - να γνωρίζετε ότι συχνά µετασχηµατίζονται τα δεδοµένα µε στόχο να πετύχουµε µία κανονική κατανοµή. - µπορείτε να αποφασίσετε εάν για τη συγκεκριµένη σύγκριση δύο οµάδων παρατηρήσεων είναι προτιµότερη η µη-παραµετρική ανάλυση. ΑΣΚΗΣΕΙΣ Μέρος Α Κάθε µια από τις παρακάτω φράσεις (1α, 1β, 1γ, α κτλ) µπορεί να είναι σωστή ή λανθασµένη. Ποιες είναι σωστές και ποιες όχι; 1. Για να είναι έγκυρος ένας έλεγχος t σύγκρισης µέσων τιµών δύο ανεξαρτήτων δειγµάτων, πρέπει: α) οι µέσες τιµές να είναι περίπου ίδιες στα δύο δείγµατα. β) οι παρατηρήσεις να προέρχονται από κανονικές κατανοµές. γ) τα δείγµατα να είναι µικρά (<10 περίπου). δ) ο αριθµός των παρατηρήσεων να είναι ακριβώς ίδιος σε κάθε οµάδα.. ηµοσιεύθηκαν τα αποτελέσµατα µελέτης της έκφρασης του αντιγόνου όγκου PRAME (αντιγόνο εκλεκτικά εκφραζόµενο στο µελάνωµα, preferentially expressed antigen of melanoma) σε ασθενείς µε χρόνια µυελοειδή λευχαιµία (S Paydas et al, Leukemia Res 007). Μέρος της µελέτης ήταν η σύγκριση του επίπεδου έκφρασης PRAME σε ασθενείς που είναι σε χρόνια φάση της νόσου (chronic phase disease, CP) και ασθενείς σε βλαστική φάση της νόσου (blastic phase disease, BP). Τα συνοπτικά στοιχεία φαίνονται στον Πίνακα 1 παρακάτω, όπου δίνεται και µία τιµή p. Πίνακας 1. Επίπεδα PRAME mrna (αντίγραφα/10.000 κύτταρα) σε άτοµα σε διαφορετικές φάσεις της CML. n Ελάχιστη-µέγιστη τιµή Μέση τιµή TA ιάµεσος P CP 56 0-1050 45,11 166,8 0 BP 14 0-1100 84,36 9,6 0 0,80 Από τα στοιχεία του Πίνακα 1 φαίνεται ότι: α) ένας κατάλληλος έλεγχος για τη σύγκριση των επιπέδων PRAME στις δύο οµάδες ασθενών είναι ο έλεγχος t για ανεξάρτητα δείγµατα (independent samples t-test). β) υπάρχει πιθανότητα περίπου 80% ότι δεν ισχύει η µηδενική υπόθεση. γ) δεν υπάρχει απόδειξη ότι οι δύο οµάδες διαφέρουν όσον αφορά τα επίπεδα PRAME (µε βάση την τιµή p). δ) τουλάχιστον 35 ασθενείς έχουν µηδενική έκφραση της PRAME. 3. Θα µπορούσαν (πιθανά) να χρησιµοποιηθούν οι ακόλουθες µέθοδοι σύγκρισης των συγκεντρώσεων µιας συνεχούς µέτρησης µεταξύ δύο ανεξάρτητων οµάδων: α) ο έλεγχος t για παρατηρήσεις κατά ζεύγη. β) ο έλεγχος Ζ για ανεξάρτητες παρατηρήσεις. γ) υπολογισµός του συντελεστή συσχέτισης του Pearson. δ) ο έλεγχος Mann-Whitney. ΙΜοσχανδρέα 1
4. Σε µία µικρή κλινική δοκιµή όπου δόθηκαν δύο θεραπείας, σε ξεχωριστές οµάδες ασθενών (όπου τα άτοµα δεν ήταν ταιριασµένα), το κύριο µέτρο της έκβασης ήταν µια ποσοτική µεταβλητή µε ιδιαίτερα θετικά λοξή κατανοµή. Για να συγκριθεί η διαφορά στην έκβαση των δύο οµάδων, θα µπορούσαν πιθανά να χρησιµοποιηθούν (ορθώς) οι ακόλουθες στατιστικές δοκιµασίες: α) ο µη-παραµετρικός έλεγχος Μann-Whitney (ή Wilcoxon rank-sum test) β) o έλεγχος t για ανεξάρτητα δείγµατα (independent samples t-test) έπειτα από τον κατάλληλο µετασχηµατισµό. γ) o έλεγχος t για παρατηρήσεις κατά ζεύγη (paired samples t-test). δ) ο έλεγχος του McNemar. Μέρος B Στην παρακάτω παράγραφο διαγράψετε όσες από τις λέξεις µε bold (µαύρα στοιχεία) χρειάζεται ώστε να σχηµατιστούν οι σωστές φράσεις. Σε δηµοσιευµένη µελέτη χορηγήθηκε 10ml µουρουνέλαιο (πλούσιο σε ω3 λιπαρά οξέα) και 10ml καλαµποκέλαιο (πλούσιο σε ω6 λιπαρά οξέα) σε 48 και 36 γυναίκες αντιστοίχως, σε ηµερήσια βάση καθ όλη τη διάρκεια της εγκυµοσύνης τους. Παρακολουθήθηκαν τα παιδιά τους και στην ηλικία των τεσσάρων ετών έγινε σύγκριση των οµάδων όσον αφορούσε µια διάσταση της νοητικής τους ανάπτυξης (Mental Processing Composite). Στον Πίνακα 1 παρακάτω παρουσιάζονται οι µέσες τιµές και τυπικές αποκλίσεις των µετρήσεων των δύο οµάδων, και η τιµή p που προέκυψε από την εφαρµογή του κατάλληλου t-test. Πίνακας 1. Μέση τιµή [ΤΑ] νοητικής δοκιµασίας 84 αγοριών ανάλογα µε το εάν οι µητέρες τους κατανάλωσαν µουρουνέλαιο ή καλαµποκέλαιο κατά την διάρκεια της εγκυµοσύνης τους. Βαθµολογία διανοητικής δοκιµασίας. Μουρουνέλαιο (n=48) Καλαµποκέλαιο (n=36) τιµή p από t- test 106,4 [7,4] 10,3 [11,3] 0,048 Η µηδενική υπόθεση της στατιστικής δοκιµασίας είναι ότι η µέση/µέγιστη βαθµολογία δεν διαφέρει µεταξύ των παιδιών των οποίων η µητέρα λαµβάνει µουρουνέλαιο και αυτών των οποίων η µητέρα λαµβάνει καλαµποκέλαιο. Η διαφορά µεταξύ των µέσων τιµών των δύο δειγµάτων είναι 9, µονάδες/ 4,1 µονάδες / ανύπαρκτη. Έχει εφαρµοστεί t-test για ανεξάρτητα δείγµατα/ t-test για παρατηρήσεις κατά ζεύγη. Το αποτέλεσµα είναι στατιστικά σηµαντικό/ δεν είναι στατιστικά σηµαντικό σε επίπεδο 5%. Οπότε, υπάρχει κάποια απόδειξη / δεν υπάρχει καµία απόδειξη ότι υπάρχει πραγµατική διαφορά στη µέση/µέγιστη βαθµολογία µεταξύ των παιδιών των οποίων η µητέρα λαµβάνει µουρουνέλαιο και αυτών των οποίων η µητέρα λαµβάνει καλαµποκέλαιο. Συνεπώς, απορρίπτεται η µηδενική υπόθεση / δεν απορρίπτεται η µηδενική υπόθεση (σε επίπεδο 5%). Ένα 95% Ε της διαφοράς θα µπορούσε να είναι/ δεν θα µπορούσε να είναι από -10 έως 50 µονάδες. ΙΜοσχανδρέα
Μέρος Γ 1. O παρακάτω πίνακας (Table 4) δίνει τις µέσες τιµές, ΤΑ και διαµέσους πέντε συγκεντρώσεων αιµατολογικών παραµέτρων. MG Alexandrakis et al (004) Interleukin-18 in multiple myeloma patients: serum levels in relation to response to treatment & survival Leukemia Research 8: 59-66 α) Εξετάζοντας τα στοιχεία του πίνακα, πιστεύετε ότι ο καταλληλότερος έλεγχος για κάθε µία από τις 5 µεταβλητές είναι ο έλεγχος t για ανεξάρτητα δείγµατα, ο έλεγχος για παρατηρήσεις κατά ζεύγη ή κάποιος άλλος; β) Ποια είναι η µηδενική υπόθεση στον έλεγχο που επιλέξατε;. Ο παρακάτω πίνακας (Table 1) δίνει µέσες τιµές (και ΤΑ) των εβδοµαδιαίων ωρών που δαπανούν σε διάφορες δραστηριότητες έφηβοι της ΗΠΑ (µέση ηλικία 13,7 έτη, ΤΑ 0,5) στον ελεύθερο χρόνο τους. Τα παιδιά χωρίστηκαν σε τρεις οµάδες ανάλογα µε το εάν είχαν µυωπία (67 παιδιά), υπερµετρωπία (8 παιδιά) ή δεν είχαν πρόβληµα όρασης (δεν είχαν διαθλαστικό σφάλµα, refractive error) (71 παιδιά). DO Mutti et al (00) Parental Myopia, Near Work, School Achievement and Children s Refractive Error. IOVS 43: 3633-3640. Εξετάζοντας τις τιµές του πίνακα, α) Ποιο επιπλέον συνοπτικό µέτρο θα ήταν χρήσιµο να παρουσιάζεται στον πίνακα, και γιατί; β) ποιος έλεγχος πιστεύετε ότι είναι κατάλληλος για τη σύγκριση των ωρών που περνούν στο διάβασµα οι τρεις οµάδες; ΙΜοσχανδρέα 3
Μέρος 1. Πραγµατοποιήθηκε µια µελέτη, βασιζόµενη στον πληθυσµό δύο περιοχών της Φινλανδίας, που είχε ως σκοπό να εξετασθούν οι σχέσεις των µετρήσεων της χοληστερίνης και της συστολικής πίεσης στη µέση ηλικία µε την µετέπειτα εµφάνιση της νόσου του Alzheimer (Kivipelto et al, BMJ 001). Μέρος των αποτελεσµάτων παρουσιάζεται στον Πίνακα 1. Πίνακας 1. Σύνοψη της συγκέντρωσης της χοληστερίνης (mmol/l) στη µέση ηλικία (40-64 ετών), σε σχέση µε την µετέπειτα παρουσία ή απουσία της νόσου του Alzheimer. Νόσος του Alzheimer (n=48) Χωρίς τη νόσο (n=136) Τιµή p µ.τ. (ΤΑ) µ.τ. (ΤΑ) Χοληστερίνη σε ηλικία 40-64 ετών (mmol/l) µ.τ. = µέση τιµή, ΤΑ = τυπική απόκλιση (SD) 7, (1,0) 6,7 (1,) 0,001 α) Ένα διάστηµα αναφοράς για µία µέτρηση είναι το διάστηµα µέσα στο οποίο αναµένεται να βρίσκονται οι φυσιολογικές τιµές της µέτρησης. Tο 95% διάστηµα αναφοράς συχνά υπολογίζεται µε τον τύπο µ.τ. ± ΤΑ. Ποιο είναι το 95% διάστηµα αναφοράς για τα επίπεδα χοληστερίνης ορού στη µέση ηλικία σε υγιείς µεσήλικες Φιλανδούς; β) Κάνετε ένα πρόχειρο σχέδιο των κατανοµών της συγκέντρωσης χοληστερίνης (σε ηλικία 40-64 ετών) στις δυο οµάδες (άτοµα µε τη νόσο του Alzheimer και άτοµα χωρίς άνοια) υποθέτοντας ότι η κάθε κατανοµή είναι περίπου κανονική. Πιστεύετε ότι µπορούµε να χρησιµοποιήσουµε τις τιµές της χοληστερόλης για να προβλέψουµε εάν κάποιος θα αναπτύξει Alzheimer αργότερα, δηλαδή ότι είναι καλό διαγνωστικό τεστ; γ) Πώς ορίζεται το τυπικό σφάλµα µιας µέσης τιµής (ΤΣ) όσον αφορά τη δειγµατοληπτική κατανοµή της µέσης τιµής; Γενικά, τι µας δείχνει το ΤΣ; δ) Tο Ε µιας µέσης τιµής (όταν το δείγµα είναι αρκετά µεγάλο) έχει την µορφή µ.τ. ± 1,96 SE. Σηµειώσετε 3 παράγοντες που µπορούν να επηρεάσουν το εύρος του Ε ενός µέσου όρου. ε) Υπολογίσετε το Ε για την µέση τιµή της χοληστερίνης κατά τη µέση ηλικία στα άτοµα χωρίς άνοια. στ) Πώς συγκρίνετε το Ε του ε) µε το διάστηµα αναφοράς του β); Σχολιάσετε. ζ) Ποια είναι η διαφορά στις µέσες τιµές της χοληστερίνης της µέσης ηλικίας των δύο οµάδων; η) Αν το ΤΣ της διαφοράς των µέσων τιµών δίδεται από τον τύπο s 1 n 1 s + ποιο είναι το ΤΣ της διαφοράς (στη µέση χοληστερόλη) εδώ 1 ; n θ) Οπότε, το ανώτερο και το κατώτερο όριο του 95% διαστήµατος εµπιστοσύνης της διαφοράς είναι + 1,96 επί = mmol/l και - 1,96 επί = mmol/l αντιστοίχως. ι) Ερµηνεύστε τα αποτελέσµατα που βρήκατε στο θ. κ)θα συµφωνούσατε µε το συµπέρασµα ότι «φαίνεται ότι τα αυξηµένα επίπεδα χοληστερίνης στη µέση ηλικία ευθύνονται για την µετέπειτα εµφάνιση της νόσου του Alzheimer». 1 O τύπος διαφέρει από αυτόν που έχω στις σηµειώσεις (µπορεί να χρησιµοποιηθεί όταν οι οµάδες είναι µεγάλες σε µέγεθος). ΙΜοσχανδρέα 4
. Ο παρακάτω πίνακας (Πίνακας ) δείχνει την ηµερήσια πρόσληψη ενέργειας και τριών θρεπτικών συστατικών (σε µονάδες ποσοστού ενέργειας) από δείγµα 951 φοιτητών. Το επίπεδο σηµαντικότητας ορίστηκε στο 5%. Πίνακας. Μέση ηµερήσια πρόσληψη ενέργειας και µακροθρεπτικών συστατικών σε φοιτητές. Άνδρες (n=500) Γυναίκες (n=451) Τιµή p Μέση τιµή (ΤΣ*) Μέση τιµή (ΤΣ) Ενέργεια (kcal) 493 (44,4) 1675 (31,7) <0,0001 Πρωτείνη (% ενέργειας) 14, (0,18) 14,1 (0,3) 0,77 Υδατάνθρακες 44,8 (0,43) 46,7 (0,53) 0,005 (% ενέργειας) Ολικό λίπος (% ενέργειας) 40, (0,38) 39,4 (0,48) 0,185 *ΤΣ = τυπικό σφάλµα (standard error) α) Το 95% διάστηµα εµπιστοσύνης ( Ε) για τη διαφορά στην πρόσληψη υδατανθράκων µεταξύ ανδρών και γυναικών είναι από 0,5 έως 3,3 µονάδες. Πώς συνδέεται αυτό το διάστηµα µε την τιµή p που δίνεται στον πίνακα; Γενικώς, ποιο θεωρείται ότι είναι πιο χρήσιµο, το Ε ή η τιµή p; Γιατί; β) Ποιες από τις συγκρίσεις του Πίνακα θεωρούνται στατιστικά σηµαντικές; γ) Ποιος στατιστικός έλεγχος είναι πιθανό να έχει χρησιµοποιηθεί για τη σύγκριση της πρόσληψης ολικού λίπους (στον Πίνακα ); Ποια είναι η µηδενική υπόθεση στον έλεγχο που αναφέρατε; δ) Ποιο είναι το στατιστικό πρόβληµα που δηµιουργείται όταν γίνονται πολλές στατιστικές συγκρίσεις (multiple comparisons); Πώς µπορεί να αντιµετωπιστεί; ε) Σε ποια περίπτωση µπορεί να προτιµηθεί ένας µη-παραµετρικός έλεγχος από έναν παραµετρικό έλεγχο σε µια µικρή µελέτη; ώστε ένα πλεονέκτηµα των παραµετρικών µεθόδων σε µία µεγάλη µελέτη. στ) Είναι δυνατόν το ΤΣ της µέσης τιµής (ενός ποσοτικού χαρακτηριστικού) να είναι πολύ µικρό όταν η ΤΑ είναι µεγάλη; Εξηγήστε την απάντησή σας. ΙΜοσχανδρέα 5