Νίκος Πανταζής Βιοστατιστικός, PhD ΕΔΙΠ Ιατρικής Σχολής ΕΚΠΑ Εργαστήριο Υγιεινής, Επιδημιολογίας & Ιατρικής Στατιστικής

Σχετικά έγγραφα
ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ

Ασκήσεις Εξετάσεων. Μεταπτυχιακό Πρόγραμμα Σπουδών στη. Διοίκηση των Επιχειρήσεων

Αναλυτική Στατιστική

Λογαριθµιστική εξάρτηση

ΚΟΙΝΩΝΙΟΒΙΟΛΟΓΙΑ, ΝΕΥΡΟΕΠΙΣΤΗΜΕΣ ΚΑΙ ΕΚΠΑΙΔΕΥΣΗ

Π.Μ.Σ. ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΔΙΑΣΠΟΡΑΣ ΚΑΙ ΠΑΛΙΝΔΡΟΜΗΣΗΣ ΤΕΛΙΚΟ ΔΙΑΓΩΝΙΣΜΑ 27/6/2016

Ποιοτική και ποσοτική ανάλυση ιατρικών δεδομένων

Σύγκριση HIV-1 Οροθετικών ανάλογα με χώρα προέλευσης: Διαχρονικές τάσεις και χαρακτηριστικά

Για να ελέγξουµε αν η κατανοµή µιας µεταβλητής είναι συµβατή µε την κανονική εφαρµόζουµε το test Kolmogorov-Smirnov.

Ανάλυση ποσοτικών δεδομένων. ΕΡΓΑΣΤΗΡΙΟ 2 ΔΙΟΙΚΗΣΗ & ΚΟΙΝΩΝΙΚΟΣ ΣΧΕΔΙΑΣΜΟΣ ΣΤΗΝ ΤΟΞΙΚΟΕΞΆΡΤΗΣΗ Dr. Ρέμος Αρμάος

Γενικευμένα Γραμμικά Μοντέλα (GLM) Επισκόπηση

2. ΧΡΗΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΠΑΚΕΤΩΝ ΣΤΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

Λογαριθμικά Γραμμικά Μοντέλα Poisson Παλινδρόμηση Παράδειγμα στο SPSS

ΣΥΣΧΕΤΙΣΗ και ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

Ενότητα 3: Ανάλυση Διακύμανσης κατά ένα παράγοντα One-Way ANOVA

Μαντζούνη, Πιπερίγκου, Χατζή. ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 5 ο

ΟΙΚΟΝΟΜΕΤΡΙΑ 2 ΦΡΟΝΤΙΣΤΗΡΙΟ 2 BASICS OF IV ESTIMATION USING STATA

!"!"!!#" $ "# % #" & #" '##' #!( #")*(+&#!', & - #% '##' #( &2(!%#(345#" 6##7

Μενύχτα, Πιπερίγκου, Σαββάτης. ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 5 ο

ΑΝΑΛΥΣΗ Ε ΟΜΕΝΩΝ. 5. Στατιστική συµπερασµατολογία για ποσοτικές µεταβλητές: Έλεγχοι υποθέσεων και διαστήµατα εµπιστοσύνης

Μπεττίνα Χάιδιτς. Επίκουρη Καθηγήτρια Υγιεινής Ιατρικής Στατιστικής e mail:

Μακροχρόνια εξέλιξη του λόγου CD4/CD8 σε HIV οροθετικούς υπό συνδυασμένη αντριρετροϊκή αγωγή

Μέθοδοι δειγματοληψίας, καθορισμός μεγέθους δείγματος, τύποι σφαλμάτων, κριτήρια εισαγωγής και αποκλεισμού

1991 US Social Survey.sav

Έλεγχος υποθέσεων - Ισχύς και Μέγεθος είγματος Sample Size and Power. Γρηγόρης Χλουβεράκης, Ph.D. Αναπληρωτής Καθηγητής Πανεπιστήμιο Κρήτης

ΤΕΛΙΚΗ ΕΞΕΤΑΣΗ ΔΕΙΓΜΑ ΟΙΚΟΝΟΜΕΤΡΙΑ Ι (3ο Εξάμηνο) Όνομα εξεταζόμενου: Α.Α. Οικονομικό Πανεπιστήμιο Αθήνας -- Τμήμα ΔΕΟΣ Καθηγητής: Γιάννης Μπίλιας

ΤΕΙ Αθήνας Μεθοδολογία της έρευνας και Ιατρική στατιστική

Οι στατιστικοί έλεγχοι x τετράγωνο, t- test, ANOVA & Correlation. Σταμάτης Πουλακιδάκος

Στατιστικοί Έλεγχοι Υποθέσεων. Σαλαντή Γεωργία Εργαστήριο Υγιεινής και Επιδημιολογίας Ιατρική Σχολή

Άσκηση 10, σελ Για τη μεταβλητή x (άτυπος όγκος) έχουμε: x censored_x 1 F 3 F 3 F 4 F 10 F 13 F 13 F 16 F 16 F 24 F 26 F 27 F 28 F

MATHACHij = γ00 + u0j + rij

ΕΚΠΑΙΔΕΥΤΙΚΗ ΤΕΧΝΟΛΟΓΙΑ ΚΑΙ ΑΝΑΠΤΥΞΗ ΑΝΘΡΩΠΙΝΩΝ ΠΟΡΩΝ

Έλεγχος υποθέσεων ΙI ANOVA

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΚΑΙ ΕΛΕΓΧΟΣ ΥΠΟΘΕΣΕΩΝ

Ενότητα 2: Έλεγχοι Υποθέσεων Διαστήματα Εμπιστοσύνης

Υ: Νόσος. Χ: Παράγοντας Κινδύνου 1 (Ασθενής) 2 (Υγιής) Σύνολο. 1 (Παρόν) n 11 n 12 n 1. 2 (Απών) n 21 n 22 n 2. Σύνολο n.1 n.2 n..

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS)

Σκοπός του μαθήματος. Έλεγχος μηδενικής υπόθεσης OR-RR. Έλεγχος μηδενικής υπόθεσης. Σφάλαμα τύπου Ι -Σφάλμα τύπου ΙΙ 20/4/2013

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

Στατιστική. Ανάλυση ιασποράς με ένα Παράγοντα. One-Way Anova. 8.2 Προϋποθέσεις για την εφαρμογή της Ανάλυσης ιασποράς

T-tests One Way Anova

Μη Παραμετρικοί Έλεγχοι & Η Δοκιμασία Χ 2

Πέτρος Γαλάνης, MPH, PhD Εργαστήριο Οργάνωσης και Αξιολόγησης Υπηρεσιών Υγείας Τμήμα Νοσηλευτικής, Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών

Ιστορικό, πορεία και εξέλιξη μίας μελέτης Στατιστική ανάλυση των δεδομένων. Σ. Μακρυγιάννης, Γ.Ν Πειραιά«Τζάνειο»

ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Δρ. Βασίλης Π. Αγγελίδης Τμήμα Μηχανικών Παραγωγής & Διοίκησης Δημοκρίτειο Πανεπιστήμιο Θράκης

Εργαστήριο Υγιεινής και Επιδημιολογίας Ι. "Επιδημιολογικά Σφάλματα"

Πρόλογος... xv. Κεφάλαιο 1. Εισαγωγικές Έννοιες... 1

Συγγραφή και κριτική ανάλυση επιδημιολογικής εργασίας

Υ: Νόσος. Χ: Παράγοντας Κινδύνου 1 (Ασθενής) 2 (Υγιής) Σύνολο. 1 (Παρόν) n 11 n 12 n 1. 2 (Απών) n 21 n 22 n 2. Σύνολο n.1 n.2 n..

Παράδειγμα: Γούργουλης Βασίλειος, Επίκουρος Καθηγητής Τ.Ε.Φ.Α.Α.-Δ.Π.Θ.

Ενότητα 5 η : Επαγωγική Στατιστική ΙΙ Ανάλυση ποσοτικών δεδομένων. Δημήτριος Σταμοβλάσης Φιλοσοφίας Παιδαγωγικής

Μεθοδολογία της Έρευνας και Εφαρμοσμένη Στατιστική

ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΧΡΗΣΗ SPSS

Ερμηνεία αποτελεσμάτων Ανάλυση διακύμανσης κατά ένα παράγοντα

Έλεγχος ύπαρξης στατιστικά σημαντικών διαφορών μεταξύ δύο ανεξάρτητων δειγμάτων, που ακολουθούν την κανονική κατανομή (t-test για ανεξάρτητα δείγματα)

ΚΕΦΑΛΑΙΟ ΙΙΙ ΠΟΛΛΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

Εισαγωγή στη Βιοστατιστική Βασικές έννοιες Στατιστικής. Μαρία Γκριζιώτη Μsc Ιατρικής Ερευνητικής Μεθοδολογίας

Φαρμακευτική αλλεργία σε ασθενείς με ΗΙV λοίμωξη. Συσχέτιση με κλινικά και δημογραφικά στοιχεία.

Η ΣΤΑΤΙΣΤΙΚΗ ΣΤΟ ΕΡΓΑΣΤΗΡΙΟ ΣΠΕΡΜΑΤΟΣ

Εισαγωγή στην Ανάλυση Δεδομένων

ΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ. Γρηγόρης Χλουβεράκης, Ph.D. Αναπληρωτής Καθηγητής Πανεπιστήμιο Κρήτης

ΑΝΑΛΥΣΗ ΕΠΙΒΙΩΣΗΣ ΜΕ ΜΟΝΤΕΛΑ ΑΝΑΛΟΓΙΚΏΝ ΚΙΝΔΥΝΩΝ COX

Αν οι προϋποθέσεις αυτές δεν ισχύουν, τότε ανατρέχουµε σε µη παραµετρικό τεστ.

Επαγωγική Στατιστική. Εισαγωγή Βασικές έννοιες

Λίγα λόγια για τους συγγραφείς 16 Πρόλογος 17

Μεθοδολογία των επιστημών του Ανθρώπου : Στατιστική Εργαστήριο 6 :

Βοήθημα Εξετάσεων. Μεταπτυχιακό Πρόγραμμα Σπουδών στη Διοίκηση των Επιχειρήσεων

Κλινική Επιδηµιολογία

Μενύχτα, Πιπερίγκου, Σαββάτης. ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 6 ο

ΣΧΕΣΗ ΜΕΤΑΞΥ ΠΟΙΟΤΙΚΩΝ ΜΕΤΑΒΛΗΤΩΝ

Στατιστική και Θεωρία Πιθανοτήτων (ΓΓ04) ΑΝΤΩΝΙΟΣ ΧΡ. ΜΠΟΥΡΑΣ Εαρινό Εξάμηνο

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

Λογιστική Παλινδρόµηση

Ιατρικά Μαθηματικά & Βιοστατιστική

ΠΕΡΙΓΡΑΦΙΚΗ και ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

Απλή Ευθύγραµµη Συµµεταβολή

Στατιστική Ι (ΨΥΧ-1202) Διάλεξη 7. Στατιστικός έλεγχος υποθέσεων

τατιστική στην Εκπαίδευση II

Biostatistics for Health Sciences Review Sheet

Στατιστική Ι. Ενότητα 2: Στατιστική Ι (2/4) Αναπλ. Καθηγητής Νικόλαος Σαριαννίδης Τμήμα Διοίκησης Επιχειρήσεων (Κοζάνη)

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

Ερωτήσεις κατανόησης στην Οικονομετρία (Με έντονα μαύρα γράμματα είναι οι σωστές απαντήσεις)

Παράδειγμα: Γούργουλης Βασίλειος, Επίκουρος Καθηγητής Τ.Ε.Φ.Α.Α. Δ.Π.Θ.

Έλεγχος Υποθέσεων. Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς

Εισαγωγή στη Στατιστική

Μονοπαραγοντική Ανάλυση Διακύμανσης Ανεξάρτητων Δειγμάτων

Κλωνάρης Στάθης. ΠΜΣ: Οργάνωση & Διοίκηση Επιχειρήσεων Τροφίμων και Γεωργίας

Περιγραφική Ανάλυση ποσοτικών μεταβλητών

Κεφάλαιο 12. Σύγκριση μεταξύ δύο δειγμάτων: Το κριτήριο t

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS)

Ενότητα 1: Εισαγωγή. ΤΕΙ Στερεάς Ελλάδας. Τμήμα Φυσικοθεραπείας. Προπτυχιακό Πρόγραμμα. Μάθημα: Βιοστατιστική-Οικονομία της υγείας Εξάμηνο: Ε (5 ο )

ΕΡΓΑΣΤΗΡΙΟ ΣΤΑΤΙΣΤΙΚΗΣ

Εκπαιδευτική Έρευνα: Μέθοδοι Συλλογής και Ανάλυσης εδομένων Έλεγχοι Υποθέσεων

Άσκηση 11. Δίνονται οι παρακάτω παρατηρήσεις:

Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης

χ 2 test ανεξαρτησίας

519.22(07.07) 78 : ( ) /.. ; c (07.07) , , 2008

Συνάφεια μεταξύ ποιοτικών μεταβλητών. Εκδ. #3,

ΠΕΡΙΓΡΑΦΙΚΗ και ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

Transcript:

Νίκος Πανταζής Βιοστατιστικός, PhD ΕΔΙΠ Ιατρικής Σχολής ΕΚΠΑ Εργαστήριο Υγιεινής, Επιδημιολογίας & Ιατρικής Στατιστικής

Η έννοια της στατιστικής για τον απλό άνθρωπο: Πολιτικές δημοσκοπήσεις (π.χ. το Χ κόμμα προηγείται κατά y ποσοστιαίες μονάδες από το Ζ κόμμα) Κοινωνικό-οικονομικές έρευνες [π.χ. Οι Έλληνες εργάζονται 5,5 ώρες περισσότερο κάθε εβδομάδα σε σχέση με τους Ευρωπαίους (κατά μέσο όρο)] Έρευνες υγείας (π.χ. οι γυναίκες που καταναλώνουν κρασί διατρέχουν 44% χαμηλότερο κίνδυνο από καρδιαγγειακά νοσήματα σε σχέση με γυναίκες που δεν καταναλώνουν καθόλου κρασί)

Στατιστικές έννοιες στα προηγούμενα παραδείγματα: Περιγραφή-Σύνοψη αποτελεσμάτων από ένα δείγμα του πληθυσμού Εκτίμηση παραμέτρων-συσχετίσεων και συμπεράσματα για τον πληθυσμό Επιστήμη που επιχειρεί να εξαγάγει έγκυρη γνώση χρησιμοποιώντας εμπειρικά δεδομένα Αντικείμενα έρευνας: συλλογή, επεξεργασία, παρουσίαση, ανάλυση, ερμηνεία δεδομένων με στόχο την εξαγωγή συμπερασμάτων ή/και λήψη αποφάσεων Κύριοι κλάδοι στατιστικής: Περιγραφική στατιστική Εκτιμητική/Συμπερασματολογία

Θεωρητικός πληθυσμός (theoretical/target population): αυτοί στους οποίους θέλουμε να γενικεύσουμε τα συμπεράσματά μας Ο πληθυσμός της μελέτης (study population): αυτοί στους οποίους έχουμε πρόσβαση Δειγματοληπτικό πλαίσιο (sampling frame): ο τρόπος με τον οποίο αποκτούμε πρόσβαση Δείγμα (sample): αυτοί που συμπεριλαμβάνονται στη μελέτη

Ορισμός ερευνητικού ερωτήματος Καθορισμός πληθυσμού Δειγματοληψία Περιγραφή/σύνοψη χαρακτηριστικών στο δείγμα Περαιτέρω στατιστική ανάλυση Εξαγωγή συμπερασμάτων για τον πληθυσμό Παρουσίαση-Σχολιασμός αποτελεσμάτων και συμπερασμάτων

ΣΤΑΤΙΣΤΙΚΗ Περιγραφική στατιστική: Συνοπτική παρουσίαση δεδομένων π.χ. Μέσα επίπεδα CD4 σε ένα πληθυσμό ενηλίκων HIV+ Ποσοστό θεραπευομένων HIV+ με μη ανιχνεύσιμο φορτίο Στατιστική συμπερασματολογία: Συναγωγή συμπερασμάτων για τη σχέση π.χ. μίας μεταβλητής με μία άλλη π.χ. Διαφέρει η ανταπόκριση στη θεραπεία ανάλογα με τον υπότυπο του HIV; Μειώθηκαν τα ποσοστά καθυστερημένης διάγνωσης μέσα στην τελευταία 10-ετία;

Περιγραφική στατιστική Μεταβλητές Ποιοτικές (π.χ. Φύλο, Ομάδα κινδύνου κλπ) Ποσοτικές (Ηλικία, BMI, CD4 count, Viral load κλπ)

Mean (SD) Age 43.4 (11.4) CD4 count (cells/microl) 639.5 (337.1) Median (IQR) Age 42.4 (34.8, 50.3) CD4 count (cells/microl) 604 (418, 822)

Density 0 5.0e-04.001.0015 Q1 Q2 Q3 Q4 0 500 1000 1500 2000 CD4 count (cells/microl)

0.01.02.03.04 Density 0 500 1,000 1,500 2,000 CD4 count (cells/microl) 20 40 60 80 100 Age 20 40 60 80 100 Age 0 500 1000 1500 2000 CD4 count (cells/microl) 0 5.0e-04.001.0015 Density

N (%) Risk group MSM 2722 (55.4) IVDU 435 (8.9) MSW 1130 (23.0) Other 40 (0.8) NA 583 (11.9) MSW NA Other IVDU MSM Total 4910 (100.0) percent 0 20 40 60 Risk group MSM MSW NA IVDU Other

20 40 60 80 100 CD4 count (cells/microl) lpoly smooth: CD4 count (cells/microl) 18-29 30-39 40-49 50-59 60-69 70+ 0 500 1000 1500 2000 0 500 1,000 1,500 2,000 CD4 count (cells/microl)

Density 0.2.4.6 0 2 4 6 x Κάποια ποσοτική μεταβλητή έχει στο δείγμα μας την κατανομή που φαίνεται αριστερά. Τι θα χρησιμοποιούσατε για να την περιγράψετε; Α) Mean (SD) B) Median (IQR) Γ) Ν(%)

Η κατανομή των CD4 σε ένα δείγμα έχει median (IQR) 604 (418, 822) cells/μl Αν σας έλεγαν ότι 27% των ατόμων του δείγματος είχαν CD4<350 cells/μl A) Θα σας φαινόταν λογικό Β) Όχι, θα περιμένατε το ποσοστό αυτών με CD4<350 cells/μl να είναι μικρότερο από 27% Γ) Όχι, θα περιμένατε το ποσοστό αυτών με CD4<350 cells/μl να είναι μεγαλύτερο από 27%

Τα μέτρα θέσης (και διασποράς) ή τα ποσοστά μιας κατηγορικής μεταβλητής μας δίνουν πληροφορίες για το δείγμα Ωστόσο: Η μέση τιμή μιας ποσοτικής μεταβλητής στο δείγμα είναι (υπό προϋποθέσεις) μια «καλή» εκτίμηση της μέσης τιμής του πληθυσμού Τα ποσοστά μιας κατηγορικής στο δείγμα είναι (υπό προϋποθέσεις) «καλές» εκτιμήσεις των αντίστοιχων στον πληθυσμό Οι εκτιμήσεις έχουν πάντα αβεβαιότητα και αυτή πρέπει να δηλώνεται 95% Δ.Ε.

Density 0.002.004.006.008 ΠΛΗΘΥΣΜΟΣ Ν=1.000.000, μέσος=190 0 100 200 300 400 Cholesterol

Μέση τιμή 1000 δειγμάτων n=50 n=100 Density 0.02.04.06.08 Density 0.02.04.06.08.1 160 170 180 190 200 210 220 mcholesterol 160 170 180 190 200 210 220 mcholesterol n=500 n=1000 Density 0.05.1.15.2 Density 0.1.2.3 160 170 180 190 200 210 220 mcholesterol 160 170 180 190 200 210 220 mcholesterol

n mean SE(mean) 95% CI 50 180.1 6.5 166.8-193.3 100 195.5 4.4 186.7-204.4 500 190.9 2.0 186.9-194.9 1000 188.8 1.4 186.0-191.6 Standard Error of the mean = SD/ n 95% C.I.: mean±1.96*se

Έχουμε δύο εντελώς τυχαία δείγματα Α και Β από έναν πληθυσμό, με μέγεθος δείγματος Να=100 και Νβ=400, αντίστοιχα. Εκτιμούμε το μέσο κάποιας ποσοτικής μεταβλητής από αυτά τα δείγματα. Περιμένετε το πλάτος του 95% Διαστήματος Εμπιστοσύνης για το μέσο να είναι: Α) Περίπου 4 φορές μικρότερο στο δείγμα Β Β) Περίπου 2 φορές μικρότερο στο δείγμα Β Γ) Περίπου το ίδιο και στα δύο δείγματα Δ) Περίπου 2 φορές μεγαλύτερο στο δείγμα Β Ε) Περίπου 4 φορές μεγαλύτερο στο δείγμα Β

Έλεγχος υποθέσεων π.χ. διαφέρουν τα CD4 κατά τη διάγνωση μεταξύ ανδρών και γυναικών; Μηδενικές υποθέσεις (Ho) Η μέση τιμή των CD4 στον πληθυσμό των νεοδιαγνωσθέντων είναι ίδια για άνδρες και γυναίκες Γενικός τρόπος ελέγχου (κλασική στατιστική) Έστω ότι ισχύει η Ho (ίδια CD4 σε άνδρες γυναίκες). Ποια η πιθανότητα να δω, εκ τύχης, διαφορές σαν κι αυτές που έχω στο δείγμα μου (ή μεγαλύτερες): p- value Αν p-value < 0.05 => απορρίπτω H0 και αποδέχομαι την εναλλακτική (Ha) δηλαδή ότι τα CD4 ανδρών διαφέρουν από αυτά των γυναικών στον πληθυσμό των νεοδιαγνωσθέντων

Σφάλμα τύπου Ι (α): η απόρριψη της μηδενικής υπόθεσης ενώ αυτή ισχύει Δέχομαι ότι η θεραπεία Α υπερτερεί της Β ενώ οι θεραπείες είναι ισοδύναμες Σφάλμα τύπου ΙΙ (β): η αποδοχή της μηδενικής υπόθεσης ενώ αυτή δεν ισχύει Δέχομαι ότι οι θεραπείες Α και Β δε διαφέρουν ενώ η Α υπερτερεί της Β (ή το αντίστροφο) Ισχύς (Power=1-β): Η πιθανότητα να απορρίψω τη μηδενική υπόθεση όταν αυτή δεν ισχύει Μέτρο της ικανότητας μιας μελέτης να ανιχνεύσει μια πραγματική διαφορά/σχέση (εντονότερη από κάποιο ελάχιστο «κλινικά σημαντικό» επίπεδο)

Τα p-values δεν δίνουν κάποια πληροφορία σχετικά με την εναλλακτική υπόθεση (π.χ. ύπαρξη πραγματικής διαφοράς/σχέσης) Τα p-values δείχνουν τη συμβατότητα των δεδομένων με τη μηδενική υπόθεση Στατιστική σημαντικότητα κλινική σημαντικότητα Με μεγάλα μεγέθη δείγματος μπορούμε να απορρίψουμε οποιαδήποτε υπόθεση Το p=0.049 δε διαφέρει ιδιαίτερα από το p=0.051 Συνιστάται πάντα: συνυπολογισμός διαστημάτων εμπιστοσύνης, σχεδιασμού μελέτης, προηγούμενης γνώσης, βιολογικών μηχανισμών, αποτελεσμάτων άλλων σχετικών μελετών

Διαφέρουν τα επίπεδα μιας ποσοτικής μεταβλητής μεταξύ δύο ή περισσοτέρων ομάδων; (CD4 ~ Φύλο) Διαφέρει η κατανομή μιας ποιοτικής μεταβλητής σε δύο ή περισσότερες ομάδες; (HIV subtype ~ Ομάδα κινδύνου) Η αύξηση μιας ποσοτικής μεταβλητής συνδέεται με αύξηση (ή μείωση μιας άλλης); (επίπεδα Χοληστερόλης ~ έτη λήψης θεραπείας) Διαφέρει η πιθανότητα παρουσίας κάποιου χαρακτηριστικού μεταξύ ομάδων ή ανάλογα με τα επίπεδα μιας ποσοτικής μεταβλητής (Καθυστερημένη διάγνωση ~ Τρόπος μεταδοσης, ηλικία, φύλο, έτος διάγνωσης)

«Συσχέτιση» Ποσοτική ~ Κατηγορική (2 επίπεδα) Ποσοτική ~ Κατηγορική (n επίπεδα) Ποσοτική ~ Ποσοτική Ποσοτική ~ Ποσοτικές και κατηγορικές μεταβλητές Ποσοτική ~ Ποσοτικές και κατηγορικές μεταβλητές (επαναλαμβανόμενες μετρήσεις) Κατηγορική ~ Κατηγορική Δίτιμη κατηγορική ~ Ποσοτικές και κατηγορικές μεταβλητές Χρόνος έως εμφάνιση event ~ Kατηγορική Χρόνος έως εμφάνιση event ~ Ποσοτικές και κατηγορικές μεταβλητές Μέθοδοι ανάλυσης t-test (Mann-Whitney U-test) One-way ANOVA (Kruskal- Wallis test) Pearson (r) / Spearman (ρ) correlation Linear regression (median regression) Mixed (random effects) linear models Chi-square test (Fisher s exact) Logistic regression (conditional logistic regression σε matched-case control μελέτες) Log-rank test, Kaplan-Meier Cox models

Συγχυτικά σφάλματα Συγχυτικοί παράγοντες Ηλικία Είδος Θεραπείας Ανταπόκριση Στην πιο πάνω περίπτωση η ηλικία μπορεί να δρα ως συγχυτικός παράγοντας στη σχέση Θεραπείας ανταπόκρισης αν σχετίζεται με το είδος της θεραπείας και ταυτόχρονα είναι ανεξάρτητος προγνωστικός παράγοντας για ανταπόκριση

Σύγκριση θεραπειών Α και Β (έκθεση) Έκβαση: πιθανότητα 5-ετούς επιβίωσης Συγχυτικός παράγοντας: ηλικία (χαμηλότερες πιθανότητες επιβίωσης σε πιο ηλικιωμένους & η θεραπεία Α έτεινε να δίνεται σε πιο ηλικιωμένους) Πραγματική σχέση: Α αποτελεσματικότερη της Β Πραγματική σχέση: Α ισοδύναμη της Β Πραγματική σχέση: Β αποτελεσματικότερη της Α Θεραπεία Α Μέση ηλικία 60 έτη Θεραπεία Β Μέση ηλικία 45 έτη Θεραπεία Α Μέση ηλικία 60 έτη Θεραπεία Β Μέση ηλικία 45 έτη Θεραπεία Α Μέση ηλικία 60 έτη Θεραπεία Β Μέση ηλικία 45 έτη Επιβίωση 70% Επιβίωση 70% Επιβίωση 50% Επιβίωση 70% Επιβίωση 30% Επιβίωση 80% Συμπέρασμα: Α ισοδύναμη με Β (ψευδώς αρνητικό εύρημα) Συμπέρασμα : Β αποτελεσματικότερη της Α (ψευδώς θετικό εύρημα) Συμπέρασμα : Β αποτελεσματικότερη της Α (ορθή κατεύθυνση αλλά υπερεκτίμηση της υπεροχής της Β)

Ενδιαφερόμαστε να διαπιστώσουμε εάν η ηλικία των νεοδιαγνωσθέντων HIV+ ήταν διαφορετική για το διάστημα 2005-09 σε σχέση με το διάστημα 2010-15 και διαθέτουμε αντίστοιχα τυχαία δείγματα ικανοποιητικού μεγέθους Τι έλεγχο/μοντέλο/μέθοδο θα χρησιμοποιούσαμε για να απαντήσουμε στο πιο πάνω ερώτημα; Α) Chi-square test B) Pearson correlation coefficient Γ) t-test (δύο ανεξάρτητων δειγμάτων) Δ) Linear regression

Ενδιαφερόμαστε να διαπιστώσουμε εάν η ηλικία των νεοδιαγνωσθέντων HIV+ ήταν διαφορετική για το διάστημα 2005-09 σε σχέση με το διάστημα 2010-15, έχοντας σταθμίσει για πιθανές αλλαγές στην κατανομή της ομάδας μετάδοσης στα δύο διαστήματα Τι έλεγχο/μοντέλο/μέθοδο θα χρησιμοποιούσαμε για να απαντήσουμε στο πιο πάνω ερώτημα; Α) Chi-square test B) Pearson correlation coefficient Γ) t-test (δύο ανεξάρτητων δειγμάτων) Δ) Linear regression

Μηδενική υπόθεση H 0 : μ 1 =μ 2 Eναλλακτική υπόθεση H 1 : μ 1 μ 2 Male Female Density 0.05 20 40 60 80 20 40 60 80 Age Graphs by Sex

Two-sample t test with equal variances ------------------------------------------------------------------------------ Group Obs Mean Std. Err. Std. Dev. [95% Conf. Interval] ---------+-------------------------------------------------------------------- Male 576 48.86173.4875729 11.70175 47.90409 49.81937 Female 554 46.48874.5116005 12.04165 45.48382 47.49365 ---------+-------------------------------------------------------------------- combined 1130 47.69833.3547043 11.92355 47.00238 48.39429 ---------+-------------------------------------------------------------------- diff 2.372993.7063325.9871198 3.758866 ------------------------------------------------------------------------------ diff = mean(male) - mean(female) t = 3.3596 Ho: diff = 0 degrees of freedom = 1128 Ha: diff < 0 Ha: diff!= 0 Ha: diff > 0 Pr(T < t) = 0.9996 Pr( T > t ) = 0.0008 Pr(T > t) = 0.0004 Η ηλικία διέφερε στατιστικά σημαντικά (p<0.001) μεταξύ ανδρών και γυναικών. Οι άνδρες είχαν κατά μέσο όρο 2.37 (95% Δ.Ε. 0.99 3.76) έτη μεγαλύτερη ηλικία.

Μηδενική υπόθεση H 0 : μ 1 =μ 2 =μ 3 Eναλλακτική υπόθεση H 1 : μ 1 μ 2 ή μ 1 μ 3 ήμ 3 μ 3 MSM IVDU MSW Density 0.02.04.06.08 20 40 60 80 20 40 60 80 20 40 60 80 Age Graphs by Risk group

Summary of Age Risk group Mean Std. Dev. Freq. ------------+------------------------------------ MSM 41.955144 10.67977 2722 IVDU 35.905434 7.7130766 435 MSW 47.698332 11.923553 1130 ------------+------------------------------------ Total 42.855116 11.290933 4287 Analysis of Variance Source SS df MS F Prob > F ------------------------------------------------------------------------ Between groups 49720.4693 2 24860.2347 214.43 0.0000 Within groups 496680.959 4284 115.938599 ------------------------------------------------------------------------ Total 546401.428 4286 127.485168 Bartlett's test for equal variances: chi2(2) = 103.7463 Prob>chi2 = 0.000 Η ηλικία διέφερε στατιστικά σημαντικά (p<0.001) μεταξύ των τριών ομάδων μετάδοσης.

50 100 150 200 250 300 0 5 10 15 20 Years on ART Total Chol. (mg/dl) Fitted values

r X i Yi i i X iyi i n ( X ) ( Y ) ( X )( ) i 2 2 i i 2 i 2 i i Yi n i n Y=b 0 +b 1 *X+ε Χοληστερόλη=b 0 + b 1 *Ετη ART +ε Pearson s r=0.208, p<0.001 Source SS df MS Number of obs = 3334 -------------+------------------------------ F( 1, 3332) = 150.08 Model 243813.922 1 243813.922 Prob > F = 0.0000 Residual 5413197.17 3332 1624.60899 R-squared = 0.0431 -------------+------------------------------ Adj R-squared = 0.0428 Total 5657011.09 3333 1697.27305 Root MSE = 40.306 --------------------------------------------------------------------------------- chol_2013 Coef. Std. Err. t P> t [95% Conf. Interval] ----------------+---------------------------------------------------------------- yrs_on_art_2013 1.587603.1295946 12.25 0.000 1.333509 1.841696 _cons 183.1414 1.142038 160.36 0.000 180.9022 185.3805 Βρέθηκε ασθενής θετική συσχέτιση μεταξύ επιπέδων ολικής χοληστερόλης και χρόνου λήψης ART (Pearson r=0.208; p<0.001). Ανάλυση παλινδρόμησης έδειξε ότι η εκτιμώμενη (95% Δ.Ε.) αύξηση της ολικής χοληστερόλης ήταν 1.59 (1.33-1.84) mg/dl για κάθε έτος αύξησης στο χρόνο λήψης ART

AIDS (CDC C) Risk group No Yes Total -----------+----------------------+---------- MSM 1,322 258 1,580 1,302.1 277.9 1,580.0 83.67 16.33 100.00 -----------+----------------------+---------- IVDU 25 8 33 27.2 5.8 33.0 75.76 24.24 100.00 -----------+----------------------+---------- MSW 626 155 781 643.7 137.3 781.0 80.15 19.85 100.00 -----------+----------------------+---------- Total 1,973 421 2,394 1,973.0 421.0 2,394.0 82.41 17.59 100.00 Βρέθηκε ενδεικτική (p=0.059) διαφορά στα ποσοστά HIV+ ατόμων με κλινικό AIDS μεταξύ των τριών ομάδων μετάδοσης. Pearson chi2(2) = 5.4843 Pr = 0.064 Fisher's exact = 0.059

log[pr/(1-pr)]=b 0 +b 1 *X1+ log[odds of AIDS]= b 0 +b 1 *IVDU+b 2 *MSW exp(b 1 )=Odds Ratio of AIDS (IVDU vs. MSM) exp(b 2 )=Odds Ratio of AIDS (MSW vs. MSM) ----------------------------------------------------------------------------- Covariate Odds Ratio Std. Err. P> z 95% Conf. Interval ----------------------------------------------------------------------------- Risk group MSM* 1 IVDU 1.640 0.675 0.230 (0.731 to 3.676) MSW 1.269 0.143 0.035 (1.017 to 1.582) ----------------------------------------------------------------------------- * Baseline category Η εκτιμώμενη πιθανότητα ανάπτυξης AIDS ήταν αυξημένη κατά 27% (95% Δ.Ε. 2%-58%) σε MSW σε σχέση με MSM (p=0.035)

Ανάλυση χρόνου μέχρι ιολογική ανταπόκριση (διαφορές ανά φύλο) Cumulative probability of virological response 1.00 0.90 0.80 0.70 0.60 0.50 0.40 0.30 0.20 0.10 0.00 Kaplan-Meier failure estimates 0 1 2 analysis time 3 4 Years since HAART initiation Log-rank test for equality of survivor functions Events Events sex observed expected ------+------------------------- M 168 173.08 F 25 19.92 ------+------------------------- Total 193 193.00 chi2(1) = 1.45 Pr>chi2 = 0.2281 sex = M sex = F

Covariate Haz. Ratio Std. Err. P> z 95% Conf. Interval ----------------------------------------------------------------------------- Sex M* 1 F 1.293 0.277 0.231 (0.849 to 1.969) Covariate Haz. Ratio Std. Err. P> z 95% Conf. Interval ----------------------------------------------------------------------------- Sex M* 1 F 1.565 0.470 0.135 (0.870 to 2.818) Risk grp Homosexual 1.034 0.240 0.886 (0.656 to 1.630) Heterosexual* 1 Drug user 0.109 0.111 0.030 (0.015 to 0.806) Haemophilia 1.634 0.508 0.114 (0.888 to 3.007) Other 0.372 0.286 0.199 (0.083 to 1.680) NAIVE prior to HAART Yes/No 2.991 0.505 <0.001 (2.149 to 4.163) Age at HAART per 10 yrs 1.156 0.081 0.038 (1.008 to 1.327) Baseline CD4 per 100 cells/μl 1.085 0.039 0.023 (1.011 to 1.164) Baseline VL per 1 log10 0.679 0.077 0.001 (0.544 to 0.848)

0.00 0.25 0.50 0.75 1.00 Γράφημα 1 Γράφημα 2 Kaplan-Meier survival estimates 0 10 20 30 40 analysis time drug = 1 drug = 2 drug = 3 0.00 0.25 0.50 0.75 1.00 Kaplan-Meier failure estimates 0 10 20 30 40 analysis time drug = 1 drug = 2 drug = 3 Α) Τα γραφήματα 1 και 2 φαίνονται να είναι συμβατά μεταξύ τους και συμβατά με αποτελέσματα Cox μοντέλου που εκτιμά HR (2 vs. 1) = 0. 23 και HR (3 vs. 1) = 0. 07 Β) Τα γραφήματα 1 και 2 φαίνονται να είναι συμβατά μεταξύ τους και συμβατά με αποτελέσματα Cox μοντέλου που εκτιμά HR (2 vs. 1) = 1.4 και HR (3 vs. 1) = 2.3 Γ) Τα γραφήματα 1 και 2 δεν φαίνονται να είναι συμβατά μεταξύ τους