3. Ανάλυση Ποσοτικών Δεδομένων: συγκρίσεις μεταξύ ομάδων. Στατιστικές δοκιµασίες για ποσοτικές εκβάσεις

Σχετικά έγγραφα
3. Ανάλυση Ποσοτικών Δεδομένων: συγκρίσεις μεταξύ ομάδων

Η ΣΤΑΤΙΣΤΙΚΗ ΣΤΟ ΕΡΓΑΣΤΗΡΙΟ ΣΠΕΡΜΑΤΟΣ

ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ

ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΧΡΗΣΗ SPSS

Έλεγχος υποθέσεων ΚΛΑΣΙΚΟΙ ΈΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ. Ημέσητιμήενόςπληθυσμούείναιίσημε δοθείσα γνωστή τιμή. Έλεγχος για τις μέσες τιμές δύο πληθυσμών.

Ανάλυση ποσοτικών δεδομένων. ΕΡΓΑΣΤΗΡΙΟ 2 ΔΙΟΙΚΗΣΗ & ΚΟΙΝΩΝΙΚΟΣ ΣΧΕΔΙΑΣΜΟΣ ΣΤΗΝ ΤΟΞΙΚΟΕΞΆΡΤΗΣΗ Dr. Ρέμος Αρμάος

ΠΕΡΙΕΧΟΜΕΝΑ 1 ΕΙΣΑΓΩΓΗ ΤΟ PASW ΜΕ ΜΙΑ ΜΑΤΙΑ ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ: Η ΜΕΣΗ ΤΙΜΗ ΚΑΙ Η ΔΙΑΜΕΣΟΣ... 29

Πίνακας 1. Επίπεδα PRAME mrna (αντίγραφα/ κύτταρα) σε άτοµα σε διαφορετικές φάσεις της CML. n Ελάχιστη-µέγιστη

Ερμηνεία αποτελεσμάτων Ανάλυση διακύμανσης κατά ένα παράγοντα

Εισαγωγή στην Ανάλυση Δεδομένων

Ανάλυση διακύμανσης (Μέρος 1 ο ) 17/3/2017

Μονοπαραγοντική Ανάλυση Διακύμανσης Ανεξάρτητων Δειγμάτων

Ποιοτική και ποσοτική ανάλυση ιατρικών δεδομένων

Έλεγχος ύπαρξης στατιστικά σημαντικών διαφορών μεταξύ δύο εξαρτημένων δειγμάτων, που δεν ακολουθούν την κανονική κατανομή (Wilcoxon test)

ΚΟΙΝΩΝΙΟΒΙΟΛΟΓΙΑ, ΝΕΥΡΟΕΠΙΣΤΗΜΕΣ ΚΑΙ ΕΚΠΑΙΔΕΥΣΗ

Ασκήσεις Εξετάσεων. Μεταπτυχιακό Πρόγραμμα Σπουδών στη. Διοίκηση των Επιχειρήσεων

Γ. Πειραματισμός - Βιομετρία

ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗΣ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥ ΩΝ «ΦΡΟΝΤΙ Α ΣΤΟ ΣΑΚΧΑΡΩ Η ΙΑΒΗΤΗ» ΑΝΑΛΥΤΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

Παράδειγμα: Γούργουλης Βασίλειος, Επίκουρος Καθηγητής Τ.Ε.Φ.Α.Α. Δ.Π.Θ.

Ιατρικά Μαθηματικά & Βιοστατιστική

Α Ν Ω Τ Α Τ Ο Σ Υ Μ Β Ο Υ Λ Ι Ο Ε Π Ι Λ Ο Γ Η Σ Π Ρ Ο Σ Ω Π Ι Κ Ο Υ Ε Ρ Ω Τ Η Μ Α Τ Ο Λ Ο Γ Ι Ο

2.1 Μεγάλο δείγµα: ο έλεγχος-ζ µιας οµάδας Υπολογισµός του Ε για µια µέση τιµή όταν το δείγµα είναι µικρό. 9

ΣΤΑΤΙΣΤΙΚΕΣ ΕΦΑΡΜΟΓΕΣ

Στατιστική. Ανάλυση ιασποράς με ένα Παράγοντα. One-Way Anova. 8.2 Προϋποθέσεις για την εφαρμογή της Ανάλυσης ιασποράς

Έλεγχος για τις παραμέτρους θέσης δύο πληθυσμών με εξαρτημένα δείγματα

ΜΕΡΟΣ Α Κάθε µια από τις παρακάτω φράσεις (1α, 1β, 1γ, 2α κτλ) µπορεί να είναι σωστή ή λανθασµένη. Ποιες είναι σωστές και ποιες όχι;

3. Ανάλυση Ποσοτικών εδοµένων: Συγκρίσεις µεταξύ οµάδων

Έλεγχος για τις παραμέτρους θέσης δύο πληθυσμών με ανεξάρτητα δείγματα

Κλωνάρης Στάθης. ΠΜΣ: Οργάνωση & Διοίκηση Επιχειρήσεων Τροφίμων και Γεωργίας

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΣΤΟΧΟΙ ΤΗΣ ΕΝΟΤΗΤΑΣ ΒΑΣΙΚΑ ΣΤΟΙΧΕΙΑ ΜΗ ΠΑΡΑΜΕΤΡΙΚΩΝ ΕΛΕΓΧΩΝ

ΤΕΙ Αθήνας Μεθοδολογία της έρευνας και Ιατρική στατιστική

Στατιστική Ι. Ενότητα 9: Κατανομή t-έλεγχος Υποθέσεων. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Δρ. Βασίλης Π. Αγγελίδης Τμήμα Μηχανικών Παραγωγής & Διοίκησης Δημοκρίτειο Πανεπιστήμιο Θράκης

Διάλεξη 1 Βασικές έννοιες

ΕΚΠΑΙΔΕΥΤΙΚΗ ΤΕΧΝΟΛΟΓΙΑ ΚΑΙ ΑΝΑΠΤΥΞΗ ΑΝΘΡΩΠΙΝΩΝ ΠΟΡΩΝ

Έλεγχος ότι η παράμετρος θέσης ενός πληθυσμού είναι ίση με δοθείσα γνωστή τιμή. μεγέθους n από έναν πληθυσμό με μέση τιμή μ

Λίγα λόγια για τους συγγραφείς 16 Πρόλογος 17

ΜΗ ΠΑΡΑΜΕΤΡΙΚΕΣ ΣΥΓΚΡΙΣΕΙΣ

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS)

ΠΕΡΙΕΧΟΜΕΝΑ. Πρόλογος... 13

Κεφάλαιο 12. Σύγκριση μεταξύ δύο δειγμάτων: Το κριτήριο t

Είδη Μεταβλητών. κλίµακα µέτρησης

2 ο Εξάμηνο του Ακαδημαϊκού Έτους ΟΔ 055 ΣΤΑΤΙΣΤΙΚΗ ΓΙΑ ΤΙΣ ΚΟΙΝΩΝΙΚΕΣ ΕΠΙΣΤΗΜΕΣ Διδασκαλία: κάθε Τετάρτη 12:00-15:00 Ώρες διδασκαλίας (3)

Είδη Μεταβλητών Κλίμακα Μέτρησης Οι τεχνικές της Περιγραφικής στατιστικής ανάλογα με την κλίμακα μέτρησης Οι τελεστές Π και Σ

α) t-test µε ίσες διακυµάνσεις β) ανάλυση διακύµανσης µε έναν παράγοντα Έλεγχος t δύο δειγμάτων με υποτιθέμενες ίσες διακυμάνσεις

Ενότητα 2: Έλεγχοι Υποθέσεων Διαστήματα Εμπιστοσύνης

Υ: Νόσος. Χ: Παράγοντας Κινδύνου 1 (Ασθενής) 2 (Υγιής) Σύνολο. 1 (Παρόν) n 11 n 12 n 1. 2 (Απών) n 21 n 22 n 2. Σύνολο n.1 n.2 n..

Τίτλος Μαθήματος: Στατιστική Ανάλυση Δεδομένων

ΕΡΓΑΣΤΗΡΙΟ ΣΤΑΤΙΣΤΙΚΗΣ

Γ. Πειραματισμός Βιομετρία

Παράδειγμα: Γούργουλης Βασίλειος, Επίκουρος Καθηγητής Τ.Ε.Φ.Α.Α.-Δ.Π.Θ.

Κεφάλαιο 10 Εισαγωγή στην Εκτίμηση

Μεθοδολογία των επιστημών του Ανθρώπου : Στατιστική Εργαστήριο 6 :

ΠΕΡΙΓΡΑΦΙΚΗ και ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

Περιεχόμενα. Πρόλογος... 15

Για να ελέγξουµε αν η κατανοµή µιας µεταβλητής είναι συµβατή µε την κανονική εφαρµόζουµε το test Kolmogorov-Smirnov.

Δειγματοληπτικές κατανομές

Κεφάλαιο 7. Επαγωγική Στατιστική

Έλεγχος ύπαρξης στατιστικά σημαντικών διαφορών μεταξύ δύο ανεξάρτητων δειγμάτων, που ακολουθούν την κανονική κατανομή (t-test για ανεξάρτητα δείγματα)

Μενύχτα, Πιπερίγκου, Σαββάτης. ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 5 ο

Στατιστική Ι. Ενότητα 1: Στατιστική Ι (1/4) Αναπλ. Καθηγητής Νικόλαος Σαριαννίδης Τμήμα Διοίκησης Επιχειρήσεων (Κοζάνη)

Μη Παραμετρικοί Έλεγχοι & Η Δοκιμασία Χ 2

Στατιστικοί Έλεγχοι Υποθέσεων. Σαλαντή Γεωργία Εργαστήριο Υγιεινής και Επιδημιολογίας Ιατρική Σχολή

Αντικείμενο του κεφαλαίου είναι: Ανάλυση συσχέτισης μεταξύ δύο μεταβλητών. Εξίσωση παλινδρόμησης. Πρόβλεψη εξέλιξης

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

Απαραμετρική Στατιστική. Το βαθμονομικό κριτήριο του Wilcoxon, για ζευγαρωτες παρατηρήσεις Ο βαθμονομικός συντελεστής συσχέτισης του Spearman

T-tests One Way Anova

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 11 Μαρτίου /24

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

Στατιστική Συμπερασματολογία

Υ: Νόσος. Χ: Παράγοντας Κινδύνου 1 (Ασθενής) 2 (Υγιής) Σύνολο. 1 (Παρόν) n 11 n 12 n 1. 2 (Απών) n 21 n 22 n 2. Σύνολο n.1 n.2 n..

ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ 1

Πρόλογος... xv. Κεφάλαιο 1. Εισαγωγικές Έννοιες... 1

Στατιστική Ι. Ενότητα 2: Στατιστική Ι (2/4) Αναπλ. Καθηγητής Νικόλαος Σαριαννίδης Τμήμα Διοίκησης Επιχειρήσεων (Κοζάνη)

Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης

Αναλυτική Στατιστική

Τι κάνουμε μετά τη συλλογή των δεδομένων

Περιγραφική Ανάλυση ποσοτικών μεταβλητών

6 ο ΜΑΘΗΜΑ Έλεγχοι Υποθέσεων

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS)

Μαντζούνη, Πιπερίγκου, Χατζή. ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 5 ο

Εισαγωγή στη Στατιστική

Ενότητα 3: Ανάλυση Διακύμανσης κατά ένα παράγοντα One-Way ANOVA

Κεφάλαιο 14. Ανάλυση ιακύµανσης Μονής Κατεύθυνσης. Ανάλυση ιακύµανσης Μονής Κατεύθυνσης

Εισαγωγή στη Βιοστατιστική Βασικές έννοιες Στατιστικής. Μαρία Γκριζιώτη Μsc Ιατρικής Ερευνητικής Μεθοδολογίας

ΚΕΦΑΛΑΙΟ 1 ο ΒΑΣΙΚΕΣ ΤΕΧΝΙΚΕΣ ΔΕΙΓΜΑΤΟΛΗΨΙΑΣ ΚΑΙ ΑΝΑΛΥΣΗ ΕΡΩΤΗΜΑΤΟΛΟΓΙΩΝ ΜΕ ΧΡΗΣΗ ΕΛΕΓΧΩΝ (STUDENT S T).. 21

Γ. Πειραματισμός Βιομετρία

Κεφάλαιο 9. Έλεγχοι υποθέσεων

Εισόδημα Κατανάλωση

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ. Κεφάλαιο 10. Εισαγωγή στην εκτιμητική

Διερευνητική Ανάλυση Δεδομένων Exploratory Data Analysis

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium iv

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Kruskal-Wallis H

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

Απαραμετρική Στατιστική. Έλεγχοι για k 2 ανεξάρτητους πληθυσμούς

ΠΕΡΙΓΡΑΦΙΚΗ και ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

Σύγκριση μέσου όρου πληθυσμού με τιμή ελέγχου. One-Sample t-test

Transcript:

3. Ανάλυση Ποσοτικών Δεδομένων: συγκρίσεις μεταξύ ομάδων - Στατιστικές δοκιμασίες για ποσοτικές εκβάσεις - Η σύγκριση δύο ανεξάρτητων ομάδων, ΔΕ για τη σύγκριση μέσων τιμών. - Η σύγκριση δύο ομάδων με παρατηρήσεις κατά ζεύγη - Συγκρίσεις με >2 ομάδες ατόμων - Μετασχηματισμοί Στατιστικές δοκιµασίες για ποσοτικές εκβάσεις - Extra παράδειγμα ελέγχου υπόθεσης: σύγκριση δύο μέσων τιμών σε μια πειραματική μελέτη. 1 2 Στατιστικές δοκιμασίες (έλεγχοι στατιστικής σημαντικότητας) Συνηθισμένες τεχνικές ανάλυσης ποσοτικών δεδομένων: έλεγχοι στατιστικής σημαντικότητας Σύγκριση 2 ομάδων* Σύγκριση >= 3 ομάδων Παραμετρικές Λέγονται οι δοκιμασίες όπου εκτιμάμε τις τιμές των παραμέτρων της κατανομής που υποθέτουμε ότι έχουν τα δεδομένα. π.χ. κανονική κατανομή με ίσες διακυμάνσεις για τον έλεγχο t για δύο ανεξάρτητα δείγματα. Μη-παραμετρικές Λέγονται οι δοκιμασίες όπου δεν υποθέτουμε ότι τα δεδομένα ακολουθούν συγκεκριμένη κατανομή. Συνήθως χρησιμοποιείται ο δείκτης διάταξης (rank) των παρατηρήσεων κι όχι οι ίδιες οι τιμές. Ανεξάρτητες παρατηρήσεις Independent samples t-test Mann-Whitney test (Wilcoxon rank sum test) Παρατηρήσεις κατά ζεύγη Paired t-test Wilcoxon signed rank test One-way ANOVA Kruskal Wallis test Parametric v non-parametric tests for data analysis,bmj 2009, Altman 3 & Bland Με μεγάλα δείγματα μπορεί να χρησιμοποιηθεί το z test* 4 Η σύγκριση δύο ανεξάρτητων ομάδων Temple R et al (2002) Association between outcome of pregnancy and glycaemic control in early pregnancy in type I diabetes: population based study. BMJ 325:1275-6 5 6 1

T-TEST ΓΙΑ ΑΝΕΞΑΡΤΗΤΑ ΔΕΙΓΜΑΤΑ Προϋποθέσεις 1. Κανονικές κατανομές στους πληθυσμούς 2. Ίσες διακυμάνσεις στους πληθυσμούς 3. (ανεξάρτητες παρατηρήσεις) Όταν θέλουμε να συγκρίνουμε τις μέσες τιμές από δύο ανεξάρτητες ομάδες (οποιουδήποτε μεγέθους), 1) ελέγχουμε αν οι κατανομές σε κάθε ομάδα φαίνονται περίπου κανονικές. 2) ελέγχουμε ότι οι ΤΑ στις 2 ομάδες δε διαφέρουν πολύ. Εφαρμόζουμε t-test για ανεξάρτητα δείγματα Η 0 : μ 1 =μ 2 ΠΑΡΑΔΕΙΓΜΑ 1 Η 0 : Η μέση σ.π. δεν διαφέρει ανάλογα με το φύλο στην ηλικία των 10 ετών. Η Α : Η μέση σ.π. διαφέρει ανάλογα με το φύλο στην ηλικία των 10 ετών. Συμβατικά επιλέγουμε το 5% επίπεδο σημαντικότητας, δηλαδή α=0,05. Ομάδα 1 54 κορίτσια = 117,78 s 1 =10,62 Ομάδα 2 46 αγόρια = 112,92 s 2 =9,44 Η 0 : μ 1 =μ 2 Η Α : μ 1 μ 2 Ο στατιστικός δείκτης ελέγχου (το στατιστικό κριτήριο ελέγχου) για τον έλεγχο t για ανεξάρτητα δείγματα είναι 7 8 Το ΤΣ της διαφοράς εκτιμάται Και αν ισχύει η Η 0, ο δείκτης ακολουθεί κατανομή t με n 1 +n 2-2 βαθμούς ελευθερίας. όπου θεωρούμε ότι οι διακυμάνσεις των πληθυσμών είναι ίσες. s 2 = Pooled estimate of variance (η καλύτερη εκτίμηση της σ)= «κοινή» εκτίμηση, ουσιαστικά μία «ζυγισμένη μέση τιμή» των 2 διακυμάνσεων όπου περισσότερο βάρος δίνεται στην εκτίμηση από το μεγαλύτερο δείγμα. Οπότε Και 9 10 ΠΑΡΑΔΕΙΓΜΑ 1 (συν). Συγκρίνουμε την τιμή με την κατανομή t με 54+46-2=98 β.ε. Από τον πίνακα της κατανομής του t, βρίσκουμε ότι: Όσο μεγαλύτερη είναι η απόλυτη τιμή του στατιστικού κριτηρίου, τόσο περισσότερες είναι οι ενδείξεις ότι δεν ισχύει η Η0. Με 98 βε, t 0,05 = 1,99 & t 0,01 = 2,64 οπότε 0,01<p<0,05. {δείτε τον πίνακα στις αναλυτικές σημειώσεις} P= 0,018 από το SPSS. Petrie & Sabin page 42 11 12 2

ΠΑΡΑΔΕΙΓΜΑ 1 (συν). SPSS 20: Analyse->Compare Means->Independent samples t-test 1.99 2.4 13 14 Αν το output του SPSS* μας βάζει σε υποψία ότι οι διακυμάνσεις δεν είναι ίσες, να προχωρήσουμε με το διορθωμένο t-test που δεν υποθέτει ισότητα διακυμάνσεων; *Levene s test for equality of variance Μάλλον όχι, γιατί οι άνισες διακυμάνσεις πολύ πιθανόν να συνοδεύονται από ισχυρή λοξότητα στα δεδομένα. ΣΤΗ ΠΡΑΞΗ όταν θέλουμε να συγκρίνουμε τις μέσες τιμές από δύο ανεξάρτητες ομάδες, 1) ελέγχουμε αν οι κατανομές φαίνονται κανονικές. 2) Αν ναι, ελέγχουμε ότι οι διακυμάνσεις των 2 ομάδων δεν διαφέρουν πολύ και εφαρμόζουμε t-test Αν όχι, μπορούμε να εφαρμόσουμε κάποιο μετασχηματισμό σε μια προσπάθεια να «κανονικοποιήσουμε» τα δεδομένα ή να προχωρήσουμε σε μη-παραμετρικές μεθόδους. 15 16 Ζ test for 2 independent samples Είδαμε στο παράδειγμα ότι τα δείγματα είχαν παρόμοιο μέγεθος. Υπάρχει κανένας λόγος για να έχουμε τα ίδια ή παρόμοια μεγέθη; Αν τα δείγματα έχουν το ίδιο μέγεθος, η μέθοδος t είναι πολύ ανθεκτική σε παρεκκλίσεις από την κανονική κατανομή, αλλά η προσέγγιση χειροτερεύει όσο τα δείγματα γίνονται πιο άνισα σε μέγεθος. Μια μελέτη με δείγματα που έχουν το ίδιο μέγεθος (ν1=ν2) θα έχει μεγαλύτερη ισχύ απ ότι αν τα δείγματα είναι άνισα (με το ίδιο συνολικό μέγεθος ν1+ν2). 17 Όταν το δείγμα είναι αρκετά μεγάλο, τότε 1) η μτ αναμένεται να έχει κανονική κατανομή, όποια και να είναι η κατανομή της μεταβλητής και 2) η εκτίμηση της ΤΑ θα πλησιάζει την ΤΑ του πληθυσμού. Σ αυτήν την περίπτωση, μπορεί να χρησιμοποιηθούν οι ιδιότητες της κανονικής κατανομής και να εφαρμοστεί ένας έλεγχος Ζ (Ζ-test, large sample normal method) στη διαφορά μεταξύ μέσων τιμών. Οι προϋποθέσεις είναι 2: 1) τα δείγματα να είναι αρκετά μεγάλα για να είναι καλές οι εκτιμήσεις των ΤΣ και να έχουν κανονική κατανομή οι μτ. [>100 παρατηρήσεις συνολικά ο Τριχόπουλος λεει 500] 2) οι παρατηρήσεις πρέπει να είναι ανεξάρτητες ΣΗΜΕΙΩΣΗ Το t-test δίνει τα ίδια αποτελέσματα με το Z-test όταν τα 18 δείγματα είναι μεγάλα. 3

Ομάδα 1 54 κορίτσια = 117,78 s 1 =10,62 Ομάδα 2 46 αγόρια = 112,92 s 2 =9,44 Η 0 : μ 1 =μ 2 Η Α : μ 1 μ 2 Ο στατιστικός δείκτης ελέγχου (το στατιστικό κριτήριο ελέγχου) για τον έλεγχο Z για ανεξάρτητα δείγματα είναι Διαστήματα εμπιστοσύνης για τη σύγκριση 2 μέσων τιμών Το ΤΣ της διαφοράς εκτιμάται 2,422 τυπικές αποκλίσεις από τη μ.τ. Η οποία αντιστοιχεί* σε p=0,0154 (cf 0,018). *Η συνάρτηση NORMSDIST στο Excel δίνει p(ζ<=2,422)= 0,9923. Οπότε, 2*(1-0,9923)=0,0154. 19 Δ.Ε. για τη διαφορά μεταξύ των μέσων τιμών μ 1 και μ 2 (σε 2 ανεξάρτητα δείγματα) Με μεγάλα δείγματα (περίπου >50 σε κάθε δείγμα), θεωρούμε ότι η διαφορά προέρχεται από μια κανονική κατανομή και η εκτιμώμενη ΤΑ είναι καλή εκτίμηση της ΤΑ της κατανομής. Οπότε έχουμε 95% Δ.Ε. Όπου ΔΕ για τη σύγκριση 2 μέσων τιμών Για μικρά δείγματα, χρησιμοποιούμε την κατανομή t, υποθέτοντας όμως ότι τα 2 δείγματα προέρχονται από κανονικές κατανομές με την ίδια διασπορά. Εκτιμούμε την TA, s Το ΤΣ της διαφοράς είναι To 100(1-α)% Δ.Ε. για τη διαφορά μεταξύ των μέσων όρων των 2 πληθυσμών είναι έως το t α είναι τιμή από την κατανομή t με n 1 +n 2-2 βαθμούς ελευθερίας. α=0,05 => z=1.96 Το t α βρίσκεται από την κατανομή t με n 1 +n 2-2 β.ε. 21 22 ΠΑΡΑΔΕΙΓΜΑ 2. Σύγκριση μέσων τιμών σπειρομέτρησης (FEV 1 %pred) σε πρώην καπνιστές (53 άτομα) και καπνιστές (38 άτομα) με ΧΑΠ. Οι κατανομές της FEV 1 φαίνονται κανονικές. ΠΑΡΑΔΕΙΓΜΑ 2. Λύση Σύγκριση μέσων τιμών σπειρομέτρησης σε πρώην καπνιστές και καπνιστές με ΧΑΠ. Δείγμα 0. 53 πρώην καπνιστές Δείγμα 1. 38 τωρινοί καπνιστές 1) Ποια είναι η μηδενική υπόθεση εδώ; 2) Υπάρχει στατιστικά σημαντική διαφορά μεταξύ των μέσων τιμών των 2 ομάδων όσον αφορά τη μέτρηση FEV 1 %pred (σε επίπεδο 5%); 3) Δημιουργήσετε ένα διάστημα εμπιστοσύνης για τη διαφορά και ερμηνεύσετε το ΔΕ. 4) Θα άλλαζε το ΔΕ αν είχαμε τον διπλάσιο αριθμό ατόμων σε κάθε 23 24 ομάδα; Βρείτε το νέο ΔΕ. 4

-1 18-1.75 1.99 1.75 Έχουμε 95% εμπιστοσύνη ότι η πραγματική διάφορα στην μέση FEV 1 %pred κυμαίνεται από μια μείωση 1 μονάδας μέχρι μια αύξηση 18 μονάδων στους καπνιστές σε σχέση με τους μηκαπνιστές (της Κρήτης) στους οποίους γίνεται διάγνωση ΧΑΠ. 25 26 ΠΑΡΑΔΕΙΓΜΑ 2. Λύση Θα άλλαζε το ΔΕ αν είχαμε τον διπλάσιο αριθμό ατόμων σε κάθε ομάδα; Δείγμα 0. 53x2=106 πρώην καπνιστές; μ.τ.52; ΤΑ 22,6 Δείγμα 1. 38x2=76 τωρινοί καπνιστές; μ.τ.61; ΤΑ 22,6 MANN-WHITNEY U TEST Προϋπόθεση Ανεξαρτησία παρατηρήσεων H0: οι κατανομές (στους πληθυσμούς) είναι ίδιες. Το κριτήριο ελέγχου υπολογίζεται χρησιμοποιώντας τους δείκτες διάταξης των δεδομένων. Με μικρά δείγματα χρησιμοποιούνται ακριβείς πιθανότητας. Με μεγαλύτερα δείγματα (πχ >15 σε κάθε ομάδα) χρησιμοποιείται η κανονική προσέγγιση στη διωνυμική. Ο έλεγχος είναι αντίστοιχος του Wilcoxon Rank sum test (το κριτήριο ελέγχου έχει άλλη μορφή αλλά τα αποτελέσματα είναι τα ίδια). Το 95% ΔΕ για τη διαφορά στην μέση FEV 1 %pred μεταξύ καπνιστών και μη-καπνιστών είναι από 2 έως 15 %pred. 27 28 29 30 5

Η σύγκριση δύο ομάδων με παρατηρήσεις κατά ζεύγη 31 ΠΑΡΑΔΕΙΓΜΑ 3. Σε 10 άτομα με χρόνια αϋπνία δίδεται ένα φάρμακο για 3 εβδομάδες και μετά από 1 μήνα (wash-out) ένα δεύτερο φάρμακο για 3 εβδομάδες. Τα άτομα βαθμολογούν τα 2 φάρμακα (με πιθανές τιμές από 0 έως 40). Ασθενείς Α Β Διαφορά 1 33 36-3 2 24 24 0 3 37 20 17 4 11 12-1 5 12 14-2 6 22 36-14 7 24 26-2 8 16 17-1 9 20 21-1 10 15 18-3 32 Θα ήταν σωστό να χρησιμοποιήσουμε τη μέθοδο «t-test for independent samples» όταν τα δεδομένα μας είναι σε ζεύγη; Όχι, διότι οι συστηματικές διαφορές μεταξύ ζευγών δεν θα μπορούσαν να αποκλειστούν, και μάλιστα θα ήταν μέρος της διακύμανσης (στον παρανομαστή του κριτηρίου t). - κατά συνέπεια, η ανάλυση θα ήταν λιγότερο ευαίσθητη. Παρατηρούμε στα δεδομένα μας ότι μερικά άτομα έχουν δυο χαμηλές τιμές (ID 5 και 6) ενώ άλλα έχουν δυο αυξημένες τιμές (ID 1 και 3). Αυτού του είδους οι συστηματικές διαφορές μεταξύ ατόμων είναι άσχετες με τη σύγκριση των δύο φαρμάκων, και η μέθοδος οφείλει να μηδενίσει την επίδρασή τους. Γιατί χρησιμοποιούνται «παρατηρήσεις κατά ζεύγη»; Σκοπός είναι να γίνει πιο ακριβής μία σύγκριση. Το «ζευγάρωμα» χρησιμοποιείται σε μια προσπάθεια να περιοριστούν οι εξωγενείς πηγές μεταβλητότητας. Εάν δύο μετρήσεις παίρνονται από το ίδιο άτομο, τότε κάποια ποσότητα της βιολογικής μεταβλητότητας που υπάρχει μεταξύ διαφορετικών ατόμων εξαλείφεται. 33 34 Ποιες είναι οι παρατηρήσεις «κατά ζεύγη»; Υπάρχουν 3 γενικές κατηγορίες: 1) Μετρήσεις σε κάθε άτομο πριν και μετά από κάποια παρέμβαση ή, γενικότερα, σε διαφορετικούς χρόνους. 2) Μετρήσεις σε κάθε άτομο την ίδια χρονική περίοδο αλλά με διαφορετικές παρεμβάσεις σε δύο διαφορετικά σημεία του σώματός του. 3) Δεδομένα τα οποία είναι ταιριασμένα ένα προς ένα π.χ. α) για φύλο και ηλικία - περιπτώσεις και controls β) δίδυμα. Το εάν κάποιες μετρήσεις είναι «κάτα ζεύγη» εξαρτάται από το σχεδιασμό της μελέτης. Δεν έχει να κάνει με τις τιμές των McKane MH et al (1995) Anesth Analg :81:179-82 δεδομένων, αλλά με τον τρόπο που συλλέχτηκαν τα δεδομένα. 35 36 6

PAIRED SAMPLES T-TEST Όταν θέλουμε να συγκρίνουμε τις τιμές από δύο ομάδες όπου οι παρατηρήσεις είναι κατά ζεύγη ελέγχουμε αν η κατανομή των διαφορών φαίνεται περίπου κανονική. Αν ναι, εφαρμόζουμε έλεγχο t κατά ζεύγη Η 0 : η μέση διαφορά είναι μηδέν. Αν όχι - εφαρμόζουμε κάποιο μετασχηματισμό σε μια προσπάθεια να «κανονικοποιήσουμε» τα δεδομένα ή - προχωράμε σε μη-παραμετρικές μεθόδους (Π.Χ. Wilcoxon signed ranks test). Έχουμε δύο δείγματα μεγέθους n και Οι x 1i και x 2i είναι με κάποια έννοια «ζευγαρωμένες». Οι διαφορές d i = x 1i -x 2i έχουν κανονική κατανομή στον πληθυσμό. H 0 : η μέση διαφορά είναι 0. Ο στατιστικός δείκτης t έχει κατανομή t με n-1 βαθμούς ελευθερίας. 37 38 SPSS 13.0: Analyze - Compare means ->Paired samples t-test... Οπότε στη σύγκριση των κατά ζεύγη παρατηρήσεων, χρησιμοποιείται μόνο μία μεταβλητή (η μεταβλητή που δίνει τις διαφορές). Αυτή η δοκιμασία αντιστοιχεί στην δοκιμασία t για ένα δείγμα (one-sample t test), με Η0: μ=0. 39 40 ΣΗΜΕΙΩΣΗ Οι «κατά ζεύγη» στατιστικές αναλύσεις απαιτούνται όταν η μεταβλητή της έκβασης μετριέται στα ίδια άτομα (ή στα ταιριασμένα άτομα). Κάποιες φορές τα δεδομένα είναι κατά ζεύγη αλλά η στατιστική ανάλυση που χρησιμοποιείται δεν είναι κάποια «κατά ζεύγη» ανάλυση. Π.χ. SPSS Άσκηση (lanreo.sav). Η ένταση (intensity) της hyperfluorescence μετρήθηκε πριν την έναρξη της θεραπείας (baseline) και 6 μήνες μετά την έναρξη της θεραπείας. Είκοσι ασθενείς (20 μάτια) έλαβαν μέρος στη μελέτη και εφαρμόστηκε τυχαίος καταμερισμός σε μια από τις δύο ομάδες (θεραπευτική αγωγή ή placebo). Κύρια έκβαση = η αλλαγή στα ένταση. Υπάρχουν 2 ανεξάρτητα δείγματα των αλλαγών (στη hyperfluorescence). Ζ test for paired samples Οι προϋποθέσεις είναι 2: 1) οι παρατηρήσεις πρέπει να είναι ανεξάρτητες 2) το δείγμα είναι αρκετά μεγάλο [>100] Σ αυτήν την περίπτωση, μπορεί να χρησιμοποιηθούν οι ιδιότητες της κανονικής κατανομής και να εφαρμοστεί ένας έλεγχος Ζ (Ζ-test, large sample normal method). 41 42 7

ΜΗ-ΠΑΡΑΜΕΤΡΙΚΟΣ ΕΛΕΧΓΟΣ WILCOXON SIGNED-RANKS Προϋπόθεση Ανεξαρτησία παρατηρήσεων Οι διαφορές έχουν συμμετρική κατανομή στον πληθυσμό H0: η διάμεση διαφορά στον πληθυσμό = 0 Το κριτήριο ελέγχου υπολογίζεται χρησιμοποιώντας τους δείκτες διάταξης των δεδομένων. Με μικρά δείγματα χρησιμοποιούνται ακριβείς πιθανότητας. Με μεγαλύτερα δείγματα (πχ >15 σε κάθε ομάδα) χρησιμοποιείται η κανονική προσέγγιση στη διωνυμική. Συγκρίσεις με >2 ομάδες ατόμων Parametric v non-parametric tests for data analysis BMJ 2009 Altman 43 & Bland 44 Όταν θέλουμε να συγκρίνουμε >2 ομάδες, τότε χρησιμοποιούμε μια τεχνική που ονομάζεται Ανάλυση διασποράς (ANOVA), εφ όσον τηρούνται κάποιες προϋποθέσεις. Γιατί όχι t-tests, παίρνοντας τις ομάδες σε ζευγάρια; Διότι: 1) Είναι πολλές οι συγκρίσεις. Για κ ομάδες, οι συγκρίσεις είναι Κ(κ- 1)/2. Οπότε αυξάνεται η πιθανότητα ότι θα βρεθεί κάποια «σημαντική» σύγκριση ακόμα και όταν ισχύει η Η0 (ότι δεν διαφέρουν οι μ.τ.). Δείτε παρακάτω. 2) Όταν οι ομάδες είναι μικρές, η εκτίμηση της διακύμανσης δεν θα έχει πολλούς βαθμούς ελευθερίας ενώ αν χρησιμοποιηθούν όλα τα δεδομένα θα έχουμε περισσότερους β.ε. και μια σύγκριση με περισσότερη ισχύ (more powerful). 45 One-way ANOVA Όταν θέλουμε να συγκρίνουμε τις τιμές από περισσότερες από 2 ομάδες 1) η μεταβλητή πρέπει να έχει κανονική κατανομή στον πληθυσμό της κάθε ομάδας [όποια και να είναι τα μεγέθη των δειγμάτων] και 2) οι διακυμάνσεις στους πληθυσμούς να είναι ίδιες. Αν ναι, εφαρμόζουμε one-way ANOVA Η Η 0 είναι ότι οι μέσες τιμές στους πληθυσμούς είναι ίσες. Η εναλλακτική υπόθεση είναι ότι τουλάχιστον μία μέση τιμή διαφέρει από τις άλλες. Αν όχι - εφαρμόζουμε κάποιο μετασχηματισμό σε μια προσπάθεια να «κανονικοποιήσουμε» τα δεδομένα ή - προχωράμε σε μη-παραμετρικές μεθόδους (Π.Χ. Kruskal-Wallis test). 46 ΠΑΡΑΔΕΙΓΜΑ 4. Το αρχείο thrombo.sav περιέχει δεδομένα από 27 ασθενείς με essential θρομβοκυττάρωση (ΕΤ), 52 με reactive θρομβοκυττάρωση (RT) και 25 controls. Σκοπός είναι να εξετασθεί εάν τα μέσα επίπεδα της αιμοσφαιρίνης (Ηb, g/dl) διαφέρουν μεταξύ των 3 ομάδων. Οι κατανομές φαίνονται περίπου κανονικές και οι διακυμάνσεις όχι πολύ διαφορετικές. H 0 : οι μέσες τιμές της αιμοσφαιρίνης είναι ίδιες στους πληθυσμούς των τριών ομάδων. Επιλέγουμε επίπεδο σημαντικότητας 5%. ΠΑΡΑΔΕΙΓΜΑ 4 (συν). Επιλέγουμε επίπεδο σημαντικότητας 5%. Η στατιστική συνάρτηση ελέγχου είναι ο λόγος της διακύμανσης μεταξύ ομάδων προς την διακύμανση εντός ομάδων. Όταν αληθεύει η Η 0, αναμένεται ότι ο λόγος αυτός = 1 και η συνάρτηση αύτη ακολουθεί την κατανομή F. 47 Εφ όσον ισχύει η Η0, περιμένουμε ότι όλες οι ομάδες έχουν την ίδια μτ και διακύμανση, όποτε η μεταξύ-ομάδων διακύμανση και η εντόςομάδων διακύμανση αναμένεται να είναι ίδιες (επειδή και οι 2 είναι εκτιμήσεις της διακύμανσης σ 2 ). Βλέπουμε ότι ο λόγος των διακυμάνσεων είναι περίπου 55. Δηλαδή η παρατηρούμενη διακύμανση μεταξύ ομάδων είναι 55 φορές της τιμής που θα 48 περιμέναμε, εάν ισχύει η Η0. 8

ΠΑΡΑΔΕΙΓΜΑ 4 (συν). Θέλουμε όμως να ξέρουμε ποιες ομάδες διαφέρουν μεταξύ τους. Μπορούμε να χρησιμοποιήσουμε post-hoc συγκρίσεις όπως Scheffe, Bonferroni, Tukey s Honestly Significant Difference, Newman-Keuls sequential procedure, Duncan. p<0,0001. Υπάρχει πολύ ισχυρή απόδειξη εναντίων της μηδενικής υπόθεσης. Απορρίπτεται η Η0. Τουλάχιστον η μία μέση συγκέντρωση διαφέρει από τις υπόλοιπες. Οι παραπάνω τεχνικές στοχεύουν στο να ελέγχουν το συνολικό σφάλμα τύπου Ι ώστε να μην είναι περισσότερο από 5%. 49 50 Εφαρμόζοντας post-hoc Scheffe συγκρίσεις, έχουμε τα εξής αποτελέσματα: Εφαρμόζοντας post-hoc LSD συγκρίσεις, έχουμε τα εξής αποτελέσματα: ΣΗΜΕΙΩΣΗ Στις συγκρίσεις LSD δεν γίνεται τροποποίηση για το γεγονός ότι γίνονται πολλαπλές συγκρίσεις (δεν κάνει διαφορά στην τιμή p αν γίνονται 2 ή 200 συγκρίσεις). 51 52 Εφαρμόζοντας post-hoc Bonferroni συγκρίσεις, έχουμε τα εξής αποτελέσματα: KRUSKAL WALLIS TEST Προϋπόθεση Ανεξαρτησία παρατηρήσεων H0: οι κατανομές (στους πληθυσμούς) είναι ίδιες. Το κριτήριο ελέγχου υπολογίζεται χρησιμοποιώντας τους δείκτες διάταξης των δεδομένων. ΣΗΜΕΙΩΣΗ Οι τιμές p είναι οι τιμές που προκύπτουν από τις LSD συγκρίσεις επί τον αριθμό των συγκρίσεων, δηλαδή J *(J-1) / 2 επί LSD p-value. Π.χ. 3*0,001=0,003. 53 54 9

ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΙ Συχνά χρειαζόμαστε μία περίπου κανονική κατανομή των δεδομένων για παραμετρικές δοκιμασίες π.χ. συσχετίσεις, παλινδρόμηση, t-tests, ΑΝΟVA...). Πολλές παραμετρικές μέθοδοι επίσης υποθέτουν ότι διαφορετικές ομάδες παρατηρήσεων έχουν την ίδια τυπική απόκλιση. Μετασχηματισμοί Πώς βλέπουμε αν η κατανομή είναι περίπου κανονική; 55 56 Πώς βλέπουμε αν η κατανομή είναι περίπου κανονική; 1) οπτική εξέταση της κατανομής των δεδομένων & μέση τιμή + ΤΑ (+ διάμεσος + δείκτες λοξότητας & κύρτωσης.). 2) γράφημα ποσοστημορίων (quantile-quantile plot) (λέγεται επίσης Normal plot= γράφημα κανονικής κατανομής ή το ισότιμο p- p plot =standardized Normal probability plot=τυποποιημένο γ.κ.κ.) Αναμενόμενη Κανονική τιμή Γράφημα ποσοστημορίων (Quantile-quantile plot) της κατανομής ινσουλίνης (185 μετρήσεις). Παρατηρούμενη τιμή 57 58 Γραφήματα ποσοστημορίων (Quantile-quantile plots) της κατανομής ινσουλίνης και λογ(ινσουλίνης) στο SPSS ΠΡΙΝ ΜΕΤΑ ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΙ C & D: λοξότητα Αν τα δεδομένα προέρχονται από κανονική κατανομή, οι τιμές θα βρίσκονται πάνω σε μια ευθεία γραμμή. Το γράφημα ποσοστημορίων είναι καταλληλότερο για μεγάλα δείγματα (n>50). 59 Sokal & Rohlf pg 117 Λεπτοκυρτική 60 10

ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΙ Υπάρχουν κι άλλοι τρόποι: π.χ. μέθοδος Box-Cox Τ(Y)=(Y λ -1)/ λ (για λ 0) Τ(Y)=ln(Y) (για λ=0) όπου βρίσκεται η τιμή λ που μεγιστοποιεί την λογαριθμική συνάρτηση πιθανοφάνειας ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΙ 3) δοκιμασία Shapiro-Wilks ή Kolmogorov-Smirnov Το SPSS εφαρμόζει τη δοκιμασία Lilliefors για την κανονική κατανομή (τροποποίηση του ελέγχου Kolmogorov-Smirnov). Ο έλεγχος των Shapiro-Wilk επίσης εφαρμόζεται. Είναι μέθοδος διαδοχικών προσεγγίσεων. Δεν εφαρμόζεται στο SPSS. λ 61 62 Τι γίνεται αν τα δεδομένα δεν είναι συμβατά με μια κανονική κατανομή; Μπορούν να μετασχηματιστούν ώστε η κατανομή να πλησιάσει την κανονική... Πώς μετασχηματίζουμε τα δεδομένα; Ο συνηθισμένος μετασχηματισμός: Αντικατάσταση των αριθμητικών τιμών με τους αντίστοιχους λογάριθμους (& ο μετασχηματισμός τετραγωνικής ρίζας χρησιμοποιείται για απαριθμήσεις). Ένας γενικός κανόνας είναι για θετικά λοξές κατανομές, δοκιμάσετε τους μετασχηματισμούς ln(υ), Υ και για αρνητικά λοξές κατανομές, δοκιμάσετε τους μετασχηματισμούς Υ 2,Υ 3 63... ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΙ ΠΑΡΑΔΕΙΓΜΑ Το γράφημα δείχνει ατομικές απαριθμήσεις του δειγματολήπτη του ενδο-ρινικού αέρα. Δεν υπήρχαν σημαντικές διαφορές μεταξύ του αριθμού των μορίων που εντοπίστηκαν για κάθε αλλεργιογόνο (Der p1, Der p2 και Der p1 και Der p2 μαζί). Στο γράφημα φαίνονται οι 3 επαναμετασχηματισμένοι μέσοι όροι. Gore, R. B., Hadi, E. A., Craven, M., Smillie, F. I., O'Meara, T. J., Tovey, E. R., Woodcock, A. & Custovic, A. Personal exposure to house dust mite allergen in bed: nasal air sampling and reservoir allergen levels. Clinical & Experimental Allergy 32 (6), 856-859. June 64 2002 Έχουμε πει ότι στα βιοιατρικά δεδομένα, οι πιο πολλές κατανομές είναι περίπου κανονικές ή θετικά λοξές. Μια ειδική περίπτωση μετασχηματισμού Η KANONIKH ΚΑΤΑΝΟΜΗ Armitage & Berry (σελ 69) Γνωστός στατιστικολόγος (Bland, σελ 167) προτείνει ότι ο λογαριθμικός μετασχηματισμός είναι αυτός που πρέπει να χρησιμοποιείται κατά προτίμηση, εκτός αν είναι σαφές ότι υστερεί. Ο λογαριθμικός μετασχηματισμός είναι ο μόνος που δίνει χρήσιμα διαστήματα εμπιστοσύνης. Λέγεται z-τιμή (z value ή z- score) Δεν έχει μονάδες. BMJ 1996; 312:770 (23 March) Transforming data Altman J M Bland, D G 65 Π.χ. Τιμή z= -2 σημαίνει ότι η μέτρηση βρίσκεται 2 τυπικές αποκλίσεις κάτω από το μέσο όρο. 66 11

Σκοπός είναι στο τέλος του μαθήματος να -μπορείτε να ερμηνεύσετε αποτελέσματα απλών ποσοτικών ελέγχων υποθέσεων (one sample t-test, independent samples t-test, t-test for paired data, Μann-Whitney test, Wilcoxon signed-ranks test, one-way ANOVA, Kruskal-Wallis). -γνωρίζετε πότε, για συγκεκριμένο σχεδιασμό μελέτης, θα πρέπει να εφαρμοστεί ένας έλεγχος υπόθεσης για ανεξάρτητα δείγματα και πότε ένας έλεγχος για παρατηρήσεις κατά ζεύγη. Extra παράδειγμα ελέγχου υπόθεσης: σύγκριση μέσων τιμών σε μια πειραματική μελέτη. -να γνωρίζετε ότι συχνά μετασχηματίζονται τα δεδομένα με στόχο να πετύχουμε μία κανονική κατανομή. -μπορείτε να αποφασίσετε εάν για τη συγκεκριμένη σύγκριση δύο ομάδων παρατηρήσεων είναι προτιμότερη η μη-παραμετρική ανάλυση. 67 68 ΠΑΡΑΔΕΙΓΜΑ 5. Σε μελέτη σύγκρισης της αποτελεσματικότητας της trabeculectomy (TrabMMC) με της phacotrabeculactomy (PhacotrabMMC) με τη χρήση της mitomycin-c, υποβλήθηκαν 85 μάτια σε TrabMMC και 105 σε PhacotrabMMC. Όλα τα μάτια είχαν γλαύκωμα. Μια έκβαση που ενδιέφερε ήταν η πιθανή διαφορά στη μείωση της ενδοφθάλμιας πίεσης (IOP) σε διάφορους χρόνους παρακολούθησης. (κύρια έκβαση = αναλογίες των ασθενών που πετυχαίνουν το στόχο τους όσον αφορά την IOP δύο χρόνια μετά την επέμβαση) Murthy et al, Can J Opthalmol (2006) 11.54 6.23 = 5.31mmHg (pre-op mean περίπου 25mmHg) Σκέψεις... Απ ότι φαίνεται, τα άτομα που κάνουν trabeculectomy έχουν περισσότερη μείωση της ΙΟP μετά από 12 μήνες. Αλλά αυτά τα αποτελέσματα προήλθαν από ένα δείγμα. Αν είχε παρθεί άλλο δείγμα οι εκτιμήσεις θα ήταν διαφορετικές (ακόμα και με την εφαρμογή τυχαίας δειγματοληψίας). Πόσο σίγουροι μπορούμε να είμαστε για το συμπέρασμά μας; Μετά από 12 μήνες: Μέση μείωση από τις αρχικές τιμές της IOP (mmhg). TrabMMC 11.55 (ΤΑ 9.03) PracotrabMMC 6.23 (ΤΑ 8.83) *Έχει ελεγχθεί ότι οι κατανομές των τιμών φαίνονται περίπου κανονικές στις 2 69 ομάδες. Όσο μεγαλύτερη είναι η διαφορά μεταξύ των μέσων τιμών των 2 ομάδων, τόσο ισχυρότερη απόδειξη έχουμε ότι υπάρχει πραγματική διαφορά στον πληθυσμό. Αλλά, πόσο μεγάλη πρέπει να είναι η διαφορά για να υπάρχει ισχυρή απόδειξη; Θέτουμε την εξής ερώτηση: 11.54 6.23 = 5.31mmHg Γενική διαδικασία έλεγχου μιας στατιστικής υπόθεσης (ελέγχου στατιστικής σημαντικότητας). «Ποια είναι η πιθανότητα ότι θα βρίσκαμε μια διαφορά τέτοιου μεγέθους (ή μεγαλύτερη) μεταξύ των μέσων όρων, αν δεν υπήρχε διαφορά μεταξύ των μέσων τιμών στους πληθυσμούς από τους οποίους επιλέχτηκαν τα δείγματα;» 1. Σχηματισμός της μηδενικής υπόθεσης (Η 0 ) και της εναλλακτικής της υπόθεσης. Μηδενική υπόθεση (null hypothesis) Υποθέτουμε ότι η μηδενική υπόθεση ΑΛΗΘΕΥΕΙ. 71 72 12

ΠΑΡΑΔΕΙΓΜΑ 5 (συν) Μηδενική υπόθεση (Η 0 ): δεν υπάρχει διαφορά μεταξύ της επέμβασης trabeculectomy και phacotrabeculectomy, όσον αφορά τη μέση μείωση στην IOP 12 μήνες μετά την επέμβαση. Η 0 : μ 1 -μ 2 =0 ή αλλιώς Η 0 : μ 1 =μ 2. Εναλλακτική υπόθεση: υπάρχει διαφορά μεταξύ της επέμβασης trabeculectomy και phacotrabeculectomy, όσον αφορά τη μέση μείωση στην IOP 12 μήνες μετά την επέμβαση. Γενική διαδικασία έλεγχου μιας στατιστικής υπόθεσης (ελέγχου στατιστικής σημαντικότητας). 1. Σχηματισμός της μηδενικής υπόθεσης (Η 0 ) και της εναλλακτικής της υπόθεσης. 2. Έλεγχος των προϋποθέσεων της στατιστικής δοκιμασίας. 3. Ορισμός του επιπέδου στατιστικής σημαντικότητας (α) 4. Υπολογισμός της τιμής του «στατιστικού κριτηρίου ελέγχου» (test statistic) που αντιστοιχεί στη συγκεκριμένη Η 0. 5. Σύγκριση της τιμής του κριτηρίου ελέγχου με τιμές από μια γνωστή κατανομή πιθανοτήτων. 6. Εύρεση της πιθανότητας να προκύψει, όταν η Η 0 αληθεύει, μια τιμή του στατιστικού δείκτη ελέγχου που είναι όσο ή και περισσότερο ακραία από την παρατηρημένη τιμή. 7. Ερμηνεία της τιμής p. 73 74 Παράδειγμα 5 (συν). Για να συγκρίνουμε τις μέσες τιμές του δείγματος (εδώ, τις διαφορές) με την υποθετική διαφορά 0 (Η 0 : μ 1 -μ 2 =0) ορίζουμε το στατιστικό κριτήριο ελέγχου Τ όπου Στη σύγκριση 2 μέσων τιμών, η στατιστική συνάρτηση ελέγχου ακολουθεί την κατανομή t με n 1 +n 2-2 β.ε. Η δειγματοληπτική κατανομή του Τ είναι η κατανομή t με n 1 +n 2-2 β.ε. Εδώ Τ=3,23 Η κατανομή t είναι συμμετρική αλλά πιο φαρδιά και πιο επίπεδη στις άκρες της από την κανονική κατανομή. 75 76 Όσο μεγαλύτερη είναι η τιμή της στατιστικής συνάρτησης ελέγχου (αγνοώντας το πρόσημο), τόσο περισσότερη είναι η απόδειξη ότι δεν ισχύει η μηδενική υπόθεση. ΠΑΡΑΔΕΙΓΜΑ 5 (συν) Χρησιμοποιώντας τα δεδομένα του δείγματος μπορούμε να υπολογίσουμε τη τιμή του κριτηρίου και έτσι να βρούμε την πιθανότητα ότι θα έχουμε μία διαφορά μεταξύ μέσων τιμών που είναι τουλάχιστον 5,32 mmhg. - από πίνακες ή - με τη χρήση κάποιου στατιστικού πακέτου. «Η μέση μείωση της IOP της ομάδας που έκαναν trabmmc 11,55 (TA 9,03) mmhg ενώ ήταν 6,23 (ΤΑ 8,83) στην ομάδα που έκανε phacotrabmmc (p=0,0016)». Petrie & Sabin σελ 42 77 «Η πιθανότητα ότι θα βρίσκαμε μια δειγματική διαφορά τουλάχιστόν 5,3 mmhg είναι 0,0016 (2 φορές στις 1000) αν δεν υπάρχει διαφορά στον πληθυσμό από τον οποίον προήλθε το δείγμα.» 78 13

Όσο μεγαλύτερη είναι η τιμή της στατιστικής συνάρτησης ελέγχου (αγνοώντας το πρόσημο), τόσο περισσότερη είναι η απόδειξη ότι δεν ισχύει η μηδενική υπόθεση. ΠΑΡΑΔΕΙΓΜΑ 5(συν) Η πιθανότητα p=0,0016 είναι πολύ μικρή και συμπεραίνουμε ότι υπάρχει ισχυρή απόδειξη ότι υπάρχει πραγματική διαφορά στις μέσες μειώσεις στην IOP στους 12 μήνες μεταξύ των 2 ειδών επεμβάσεων. Σε αυτό το παράδειγμα συνεπώς, απορρίπτουμε τη μηδενική υπόθεση (we reject the null hypothesis). 1,96 3,23 Λέμε ότι το αποτέλεσμα είναι στατιστικά σημαντικό (statistically significant). 79 80 ΠΑΡΑΔΕΙΓΜΑ 4 (συν) Σχεδιασμός της μελέτης: Διαδοχική δειγματοληψία: όλα τα άτομα με γλαύκωμα που εγχειρίστηκαν από συγκεκριμένο χειρουργό από 8/96 μέχρι 6/03. Οι συγγραφείς αναφέρουν ότι η μελέτη ήταν αναδρομική. Στους 12 μήνες δεν υπήρχαν στοιχεία για όλους τους ασθενείς (μονο 49/85 TrabMMC και 73/105 PhacotrabMMC). Τελικό σημείο της μελέτης = 24 μήνες, αλλά μόνο 39 και 59 ασθενείς. Στο baseline (πριν την επέμβαση), η IOC ήταν σημαντικά υψηλότερη (p<0,0001) στα άτομα που υποβλήθηκαν σε TrabMMC (26,1 mmhg, TA 9,0) από αυτούς που υποβλήθηκαν σε PhacotrabMMC (20,3 mmhg, TA 7,0). => Ίσως είναι αναμενόμενη η μεγαλύτερη μείωση σ αυτή την ομάδα. Λύση: Randomization 81 14