Ιστορικό, πορεία και εξέλιξη μίας μελέτης Στατιστική ανάλυση των δεδομένων Σ. Μακρυγιάννης, Γ.Ν Πειραιά«Τζάνειο»
William Osler, ιατρός, φιλόσοφος, ιστορικός, συγγραφέας If it were not for the great variability among individuals, medicine might as well be a science and not an art
Η ιατρική γνώση είναι απαραίτητη αλλά όχι επαρκής από μόνη της ε χρειάζεται όλες οι μελέτες να είναι «επαναστατικές» αλλά οφείλουν να είναι σαφείς για να προσφέρουν στην τρέχουσα επιστημονική γνώση Στηστατιστικήο«τύπος» είναι εξίσου σημαντικός με το «περιεχόμενο». Μία καλή ιδέα μπορεί να χαθεί στον ακατάλληλο τύπο μελέτης ενώ μια μέτρια να αποτελέσει σημαντική συμβολή στη συνολική γνώση αν υλοποιηθεί Ακόμα και μία πολύ μεγάλη και καλοσχεδιασμένη μελέτη δεν αναμένεται να μπορεί να απαντήσει σε περισσότερα από ένα ή δύο ερωτήματα. εν υπάρχουν στατιστικά «μαγικά» που να διορθώνουν λάθη στο σχεδιασμό ή την υλοποίηση ενός πρωτοκόλλου Η ακατάλληλη στατιστική ανάλυση μπορεί να «καταστρέψει» μια καλά σχεδιασμένη και υλοποιημένη μελέτη H Πιθανολογική σκέψη χρειάζεται εξάσκηση
Από την αρχή πρέπει να έχουμε στο μυαλό μας τις στατιστικές παραμέτρους της μελέτης: - Το κύριο ερώτημα που επιθυμούμε να απαντήσουμε - Τα χαρακτηριστικά του σχεδιασμού - Το μέγεθος του δείγματος και τη μέθοδο δειγματοληψίας - Το χαρακτήρα των δεδομένων που θα συλλεγούν - Τα καταληκτικά σημεία - Το πλάνο της στατιστικής ανάλυσης. Προαποφασισμένο προανακοινωμένο μέρος του πρωτοκόλλου: κύρια και δευτερεύουσες αναλύσεις, επίπεδο στατιστικής σημαντικότητας, συμπερασματικές στατιστικές μέθοδοι. Και βέβαια - Την επίδραση της τύχης (μέγεθος δείγματος) - Την επίδραση της μεροληψίας- bias (τυχαιοποίηση, διάχυση)
Ποιο είναι το κύριο ερώτημα; Μία Κλινική Έρευνα μπορεί να: 1. Αξιολογεί την εμφάνιση ή ύπαρξη μίας νόσου (κατάστασης ή συμπεριφοράς κλπ) (incidence / prevalence studies) 2. Αξιολογεί τους αιτιολογικούς παράγοντες μίας νόσου ή τους παράγοντες που επηρεάζουν την έκβαση (prognostic studies) 3. Αξιολογεί μια διαγνωστική δοκιμασία 4. Αξιολογεί μια παρέμβαση (experimental studies)
Ποιος είναι ο κατάλληλος σχεδιασμός; Experimental Observational (RCTs) Analytical Descriptive Case-Control Cohort + cross-sectional & ecologic Experimental studies Descriptive studies Analytical studies Συγκρίνουν θεραπευτικές επιλογές Εξετάζουν πρότυπα εμφάνισης της νόσου Μελετούν τα πιθανά αίτια
Grimes & Schulz, 2002
«Ιεραρχία» των Επιδημιολογικών Μελετών ανάλογα με το σχεδιασμό τους
Cohort Studies
Cohort Studies νόσος Πληθυσμός άτομα χωρίς νόσο έκθεση όχι έκθεση απουσία νόσου νόσος απουσία νόσου
Cohort Studies - Πλεονεκτήματα - Μπορούν να τεκμηριώσουν επίπτωση σε πληθυσμό - Ακριβής εκτίμηση σχετικού κινδύνου - Μπορεί να αξιολογήσει σπάνιες εκθέσεις - Μπορούν να εξαχθούν συμπεράσματα για τη χρονική σχέση (προοπτικές) - Είναι εφικτή η ανάλυση του χρόνου μέχρι το σύμβαμα - Μπορεί να χρησιμοποιηθεί όταν δεν είναι εφικτή η τυχαιοποίηση - Μπορεί να ποσοτικοποιηθεί το μέγεθος της επίδρασης ενός παράγοντα κινδύνου - Μπορεί να μειωθούν οι μεροληψίες επιλογής και - Μπορούν να μελετηθούν πολλαπλές εκβάσεις
Cohort Studies - Μειονεκτήματα - Χρονοβόρες και ακριβές - Μπορεί να απαιτήσουν μεγάλα δείγματα - Ακατάλληλες για σπάνιες νόσους - Ακατάλληλες για νόσους με μεγάλη υποκλινική φάση - Επιρρεπείς σε απρόβλεπτες μεταβολές - Επιρρεπείς σε bias μη ανταπόκρισης, μετακίνησης, απώλειας κατά την παρακολούθηση - Bias δειγματοληψίας, διαπίστωσης, παρατήρησης δεν εξαλείφονται
Παραδείγματα *Framingham Heart Study * NHANES Studies * Physicians' Health Study *Nurses' Health Study κλπ
Case Control Studies
Αντίθετα οι Case-Control Control Studies Πλεονεκτήματα - Όχι πολυέξοδες, εύκολες, σύντομες - Μπορούν να εξετασθούν πολλαπλοί παράγοντες έκθεσης - Μπορούνναμελετηθούννοσήματασπάνιαή/και με μεγάλα υποκλινικά διαστήματα - Κατάλληλες όταν η τυχαιοποίηση είναι μη ηθική Μειονεκτήματα - Η επιλογή των Case και control μπορεί να είναι δυσχερής - Bias (επιλογής, ανάκλησης, ταξινόμησης) - Δεν είναι εφικτή η απευθείας εκτίμηση της επίπτωσης - Η χρονική σχέση δεν είναι σαφής - Δεν μπορούν να μελετηθούν πολλαπλές εκβάσεις - Η αντίστροφη αιτιότητα αποτελεί πρόβλημα στην εξήγηση, ειδικά σε μοριακές επιδημιολογικές μελέτες
Μέγεθος δείγματος και ισχύς Ισχύς : (80 ή 90%) Μέγεθος αποτελέσματος Ποσοστό αναμενόμενων συμβαμάτων Αναμενόμενη διαφορά «πιλοτικά» δεδομένα Επίπεδο σημαντικότητας ( ) : (0.05) 1-tailed or 2-tailed testing (Συγχυτές) Μη συμμόρφωση, απώλειες στην παρακολούθηση κλπ
BIAS Οδηγεί σε ανακριβείς και ασαφείς εκτιμήσεις και διακινδυνεύει την «εσωτερική εγκυρότητα» της μελέτης - Bias επιλογής μεροληψία στη στρατολόγηση ή κατάταξη - Bias εκτέλεσης άνιση παροχή φροντίδας - Bias ανίχνευσης η καταγραφόμενη έκβαση μη κατάλληλη για το σκοπό της μελέτης, λάθη μετρήσεων (παρατηρητής, όργανο μέτρησης, ασθενής), ακατάλληλη στατιστική μέθοδος - Bias απωλειών εμφάνιση και διαχείριση αποκλίσεων από το πρωτόκολλο και απώλεια κατά την παρακολούθηση (loss to follow-up) Και.. Στατιστικές παραδοχές
Στατιστική επεξεργασία 3 Βήματα: 1. Έλεγχος των δεδομένων με τις μεθόδους της περιγραφικής στατιστικής Ανίχνευση λαθών Ποιοτικές Ποσοτικές Έλεγχος κανονικότητας για τις συνεχείς ποσοτικές μεταβλητές 2. Περιγραφή των μεταβλητών Προετοιμασία παρουσίασης με πίνακες και γραφήματα 3. Επαγωγική Στατιστική έλεγχος υποθέσεων
Στατιστική επεξεργασία Εισαγωγή δεδομένων στο κατάλληλο πακέτο στατιστικής επεξεργασίας Ασθενείς ανώνυμα cases (γραμμές) Μετρούμενα χαρακτηριστικά μεταβλητές (στήλες) Καταστάσεις των ποιοτικών αριθμητικές τιμές Καθορισμός του τρόπου διαχείρισης κάθε μεταβλητής Missing values διαχείριση Λάθη μεταγραφής
Στατιστική επεξεργασία
1.Έλεγχος δεδομένων Για τις ποιοτικές μεταβλητές μεταβλητές ότι δεν έχουν δοθεί τιμές πέραν των προκαθορισμένων π.χ. 1=Α 2=Β 3=Ο 4=ΑΒ να έχει δοθεί τιμή 5 ή συχνότερα20, 30 κ.λ.π
1.Έλεγχος δεδομένων Στις συνεχείς μεταβλητές Οπτική αναζήτηση «παράλογα» υψηλών ή χαμηλών τιμών π.χ ηλικία 450 ετών! TGL 13 έλεγχος στα CRF για λάθη μεταγραφής Range checking με πίνακες συνοπτικής παρουσίασης μεταβλητών με γραφήματα Λογικοί έλεγχοι σε εξαρτώμενες μεταβλητές π.χ τιμή15 σε μεταβλητή pack_years, όταν μεταβλητή smoking=no Έλεγχος και των παραγόμενων μεταβλητών. π.χ. Weight BMI
1.Έλεγχος δεδομένων
1.Έλεγχος δεδομένων Έλεγχος κατανομής και εγγύτητας στην κανονική κατανομή (ποσοτικές) Αδρή εκτίμηση από γραφική απεικόνιση Εκτίμηση skewness και kurtosis Έλεγχος Shapiro-Wilk W, Kolmogorov-Smirnov Είναι δικαιολογημένη η παραδοχή της Κανονικής Κατανομής; (παραμετρικές δοκιμασίες)
2. Περιγραφική Στατιστική
2. Περιγραφική Στατιστική
2. Περιγραφική Στατιστική Τι δείχνουν τα box-plots (θηκογράμματα)
3. Επαγωγική Στατιστική Έλεγχος υποθέσεων 1. ιαφορά μεταξύ δύο ή περισσότερων ομάδων ως προς κάποια μεταβλητή 2. Συσχέτιση δύο μεταβλητών 3. Πρόβλεψη
3. Επαγωγική στατιστική Λάθη κατά την εκτίμηση υποθέσεων Απόφαση Μη απόρριψη της μηδενικής υπόθεσης Απόρριψη της μηδενικής υπόθεσης Μηδενική υπόθεση αληθής Σωστή απόφαση Type I error Μηδενική υπόθεση ψευδής Type II error Σωστή απόφαση
Σύγκριση ομάδων Τα δεδομένα είναι κατηγορικά ή ποσοτικά συνεχή; Κατηγορικά δεδομένα: σύγκριση ποσοστών στις ομάδες Ποσοτικά συνεχή : σύγκριση μέσων ή διάμεσων τιμών στις ομάδες Δύο ή περισσότερες ομάδες, σύγκριση με chi-square test, Fisher s exact test Δύο ομάδες κανονική κατανομή, ίδια διασπορά; Πόσες ομάδες; Τρεις+ ομάδες, κανονική κατανομή; Μη κανονική κατανομή Wilcoxon test Shapiro-Wilk W, Kolmogorov-Smirnov Κανονική κατανομή t test. Κανονική κατανομή ANOVA Μη κανονική κατανομή Kruskal Wallis
3. Επαγωγική Στατιστική - Συσχέτιση Συσχέτιση Εξετάζει κατά πόσο η μια μεταβλητή επηρεάζεται από την άλλη Απλή συσχέτιση: 2 μεταβλητές Πολλαπλή συσχέτιση: >2 μεταβλητές Χαρακτηριστικά: Γραμμική μη γραμμική Θετική αρνητική Πλήρης ή μη
3. Επαγωγική Στατιστική - Συσχέτιση Εργαλεία στατιστικού ελέγχου r του Pearson (για συνεχείς και κανονικά κατανεμημένες μεταβλητές) ρ (rho) του Spearman (για διακριτές ή μη κανονικά κατανεμημένες μεταβλητές) Συντελεστής Συμφωνίας Kendall s-tau Μετρά το βαθμό συμφωνίας μεταξύ δύο ποσοτικών ή διατάξιμων μεταβλητών
3. Επαγωγική Στατιστική - Συσχέτιση -1-0,8-0,8-0,3-0,3 +0,3 +0,3 +0,8 +0,8 +1 Ισχυρή αρνητική συσχέτιση Μέτρια αρνητική συσχέτιση Ελαφρά συσχέτιση ή ασυσχέτιστα Μέτρια θετική συσχέτιση Ισχυρή θετική συσχέτιση Η παραπάνω κατηγοριοποίηση δεν εκφράζει στατιστική σημαντικότητα Για να γνωρίζουμε αν η παρατηρηθείσα συσχέστιση είναι το ίδιο σημαντική και στον πληθυσμό πρέπει να γίνει ο κατάλληλος στατιστικός έλεγχος που θα δώσει και το αντίστοιχο σφάλμα (p)
3. Επαγωγική Στατιστική - Συσχέτιση Perfect Correlation Correlation Coefficient -.5 Correlation Coefficient.7 Source: Altman. Practical Statistics for Medical Research
3. Επαγωγική Στατιστική - Συσχέτιση Regression Βασισμένη στην προσαρμογή μίας γραμμής στα δεδομένα Παρέχει ένα συντελεστή που είναι η κλίση της Y = ax + b Προβλέπει την τιμή μίας εξαρτημένης μεταβλητής βάσει της τιμής μιας ανεξάρτητης μεταβλητής Πιοχρήσιμηαπότησυσχέτιση Επιτρέπει την πρόβλεψη των τιμών της Y αντί να εκτιμά απλά αν υπάρχει σχέση μεταξύ δυο μεταβλητών
3. Επαγωγική Στατιστική - Συσχέτιση Είδη παλινδρόμησης Linear regression - χρησιμοποιεί συνεχή δεδομένα για να προβλέψει έκβαση που εκφράζεται σε συνεχή δεδομένα Logistic regression - χρησιμοποιεί συνεχή δεδομένα για να προβλέψει διχοτομική (y/n) έκβαση Cox proportional hazards regression- ανάλυση επιβίωσης Μοντέλα πολλαπλής παλινδρόμησης Καθορίζουν τη σχέση δύο μεταβλητών ενώ ελέγχουν για τις τιμές άλλων Οι πολυπαραγοντικές αναλύσεις υποστηρίζουν την ανεξαρτησία μίας μεταβλητής σε σχέση με πιθανούς συγχυτές
Cox Regression Model Proportional Hazards Survival Model. Χρησιμοποιείται για να διερευνήσει τη σχέση μεταξύ ενός συμβάματος και των πιθανών παραγόντων εκδήλωσης του Hazard ratio (HR). Ratio of the hazard in one group divided by the hazard in another. Επεξηγείται όπως τα risk ratios και odds ratios HR 1 = καμμία επίδραση HR > 1 αυξημένος κίνδυνος HR < 1 μειωμένος κίνδυνος Συχνά χρησιμοποιείται σε μακροχρόνιες μελέτες όπου διάφοροι παράγοντες μπορεί να προδιαθέτουν για την εμφάνιση ενός συμβάματος
3. Επαγωγική Στατιστική Survival Analysis Εκτίμηση του χρόνου μέχρι κάποιο σύμβαμα (θάνατος, υποτροπή, εμφάνιση συμπτώματος) Παρέχει δυνατότητα διαχείρισης censored data Ασθενών που δεν παρουσιάζουν το σύμβαμα μέχρι το τέλος της μελέτης ή χάνονται στο follow-up Ο πιο κοινός τύπος είναι η ανάλυση Kaplan-Meier Οι καμπύλες παρουσιάζονται ως βαθμιαία μεταβολή από το baseline εν υπάρχουν προκαθορισμένα διαστήματα follow-up το ποσοστό επιβίωσης επανυπολογίζεται μετά από κάθε σύμβαμα
3. Επαγωγική Στατιστική Survival Analysis Source: Altman. Practical Statistics for Medical Research
Kaplan-Meier Curve Παρέχει γραφική σύγκριση στην έκβαση δύο ομάδων που διαφέρουν ως προς την παρέμβαση ή άλλο παράγοντα Τα ποσοστά επιβίωσης μπορούν να μετρηθούν απευθείας από την καμπύλη Η διαφορά στις καμπύλες ελέγχεται για τη στατιστική της σημαντικότητα
Συμπερασματικά Εξωτερική εγκυρότητα Εσωτερική εγκυρότητα
Συμπερασματικά Η κατανόηση των βασικών στατιστικών εννοιών έχει ουσιαστική αξία όχι μόνο στη διεξαγωγή μίας μελέτης αλλά και στην κατανόηση της ιατρικής βιβλιογραφίας Η κατανόηση του τρόπου υπολογισμού των στατιστικών δοκιμασιών είναι ιδιαίτερα χρήσιμη αλλά όχι απολύτως απαραίτητη για τη χρήση τους Είναι απαραίτητο να γνωρίζει κανείς πότε χρησιμοποιείται μία στατιστική δοκιμασία, με ποιους περιορισμούς και πώς εξηγούνται τα αποτελέσματα που προκύπτουν από αυτή
Συμπερασματικά Ασθενείς εδομένα Βιοστατιστική μέθοδος Πρωτόκολλο
Ευχαριστώ για την προσοχή σας!