Biostatistics for clinicians Nikos Tzanakis MD, PhD Assistant Professor in Clinical Epidemiology Medical School, University of Crete
Έκφραση βιοϊατρικών παρατηρήσεων ΚΛΙΝΙΚΕΣ ΠΑΡΑΤΗΡΗΣΕΙΣ ΠΟΙΟΤΙΚΕΣ (qualitative) ΠΟΣΟΤΙΚΕΣ (quantitative, interval/ratio) Κατηγορικές (ordinal) Ονομαστικές (nominal) Συνεχείς (continuous) Ασυνεχείς (discrete) Δύσπνοια Ι, ΙΙ, ΙΙΙ βαθμού Φύσημα Ι,ΙΙ,ΙΙΙ,ΙV Σάκχαρο 1+, 2+ Στάδιο καρκίνου Απών/Παρών Παθολογικό Φυσιολογικό Ναι/Όχι Γυναίκα/Άνδρας Ομάδες αίματος mg,ml,cm dl,ng,pg Ακέραιες τιμές συνήθως ποσοστά
Παράδειγμα σφάλματος προκατάληψης και τυχαίου σφάλματος Αριθμός παρατηρήσεων Αληθής τιμή (Ενδοαρτηριακός Καθετήρας) Bias Μετρήσεις (Πιεσόμετρο) Chance 80 90 ιαστολική πίεση (mm Hg)
Τυχαίο σφάλμα (Random error) Η διακύμανση τιμών της διαστολικής πίεσης που περιγράφηκε προηγουμένως λέγεται τυχαίο σφάλμα Το τυχαίο σφάλμα διέπει όλα τα βιολογικά φαινόμενα και συνεπώς όλες τις ερευνητικές και κλινικές μελέτες Λέγεται τυχαίο σφάλμα επειδή υπάρχει πιθανότητα να είναι προς την μια πλευρά ή την άλλη Η πιθανότητα λάθους των αποτελεσμάτων μιας μελέτης πηγάζει από το γεγονός ότι η μικρή ομάδα ασθενών που μελετάτε παρόλα τα μέτρα που μπορεί να ληφθούν μπορεί να είναι διαφορετική από τον γενικό πληθυσμό στην ολότητα του
Επιδημιολογία Βιοστατιστική Η ανάγκη να εκφραστεί η πιθανότητα ότι μια αποτίμηση (μέτρηση) σε ένα βιοϊατρικό γεγονός αντανακλά την πραγματικότητα ή Η πιθανότητα ότι αυτό που μετρήθηκε να είναι και με ποια βεβαιότητα η πραγματική τιμή του φαινομένου
Null Hypothesis Έστω ότι διεξάγεται κλινική μελέτη ή οποία διερευνά το ενδεχόμενο η δοκιμαζόμενη θεραπεία να είναι δραστική ή όχι. Μελετήθηκαν 2 ομάδες ασθενών Α και Β. Στην Α δόθηκε η νέα θεραπεία στην Β δόθηκε η συνήθης θεραπεία. Η μηδενική υπόθεση H 0 συνεπώς είναι: η νέα θεραπεία δεν απέδωσε σημαντική βελτίωση σε σχέση με την συνήθη. Η εναλλακτική υπόθεση H A είναι: η νέα θεραπεία απέδωσε σημαντική βελτίωση (effect size) σε σχέση με την συνήθη Η στατιστική ανάλυση που έγινε ανάλυσε τα δεδομένα κατά όμοιο διχοτόμο τρόπο δηλ. απαντά αν τα δεδομένα διαφέρουν σημαντικά ή όχι μεταξύ των ομάδων Α & Β
Τι αντιπροσωπεύει η p value (type I error) TRUE DIFFERENCE ΠΑΡΟΥΣΑ ΑΠΟΥΣΑ Συμπέρασμα Στατιστικής ανάλυσης Στατιστικώς σημαντικό Στατιστικώς Μη σημαντικό Σωστό Type II (β) error Type I (α) error Σωστό p value
Τι αντιπροσωπεύει το type IΙ error ισχύς TRUE DIFFERENCE ΠΑΡΟΥΣΑ ΑΠΟΥΣΑ Συμπέρασμα Στατιστικής ανάλυσης Στατιστικώς σημαντικό Στατιστικώς Μη σημαντικό Σωστό Type II (β) error Type I (α) error Σωστό p value Ορίζεται στο 5% Power=1 β (β error ορίζεται στο 20%)
Στατιστική διαφορά μεταξύ των ομάδων Effect size Effect size αναφέρεται στo μέγεθος της επίδρασης που ασκεί η νέα θεραπεία (Α) έναντι της παλιάς (Β) σε κλινικές παραμέτρους έκβασης (outcomes) Η φύση της επίδρασης δεν είναι η ίδια από μελέτη σε μελέτη. Μπορεί να είναι διαφορά στο ποσοστό αποθεραπείας, διαφορά στον στατιστικό μέσο όρο μιας μέτρησης π.χ. διαστολική πίεση ή να αναφέρεται σαν σταθερά συσχέτισης μεταξύ δύο μεταβλητών Όποια και αν είναι όμως η φύση του effect size έχει την ίδια σημασία για την power analysis.
Εκφράσεις της p value Διχοτόμος ή ακριβής έκφραση; Είναι γενικώς αποδεκτό ότι p values μικρότερες του 0.05 αποτελούν ικανοποιητικό όριο να συμπεράνουμε ότι θεμελιώνεται στατιστική σημαντικότητα Η έκφραση p<0.05 (στατιστικώς σημαντικό) ή p>0.05 (στατιστικώς μη σημαντικό) αποτελεί ένα καθιερωμένο τρόπο έκφρασης αλλά σχετικώς ανακριβή Πολλοί προτιμούν να παραθέτουν τον ακριβή υπολογισμό του p π.χ p=0.003 και να αφήνουν τους αναγνώστες να εξάγουν τα συμπεράσματα τους
Statistical Power (ισχύς) μελέτης Η ισχύς της μελέτης παριστάνει: Την αριθμητική αξία το β error (όσο μεγαλύτερο το β error τόσο μικρότερη η ισχύς [power] της μελέτης) την στατιστικώς σημαντική διαφορά όταν η διαφορά όντως υπάρχει Μια μελέτη έχει μεγάλη στατιστική ισχύ (power) όταν έχει πολύ υψηλή πιθανότητα να ανιχνεύσει διαφορά μεταξύ των δύο υπό μελέτη ομάδων, διαφορά που αληθινά υπάρχει
Statistical test and the related error s trade off β α Do not Reject Ho Reject Ho α=0.05
Statistical test and the related error s trade off Ν=100 β α Do not Reject Ho Reject Ho α=0.01
Statistical test and the related error s trade off Ν=400 β α Do not Reject Ho Reject Ho Large groups α=0.001
Η ισχύς συναρτήσει του effect size & του αριθμού των ασθενών της μελέτης 1.0 0.8 0.6 Group A=0.40, B=0.30 Group A=0.50, B=0.30 Group A=0.60, B=0.30 Power 0.4 0.2 p=0.05, Tails=2 0 50 100 150 Αριθμός ασθενών ανά group 200
Η ισχύς συναρτήσει alpha error & του αριθμού των ασθενών της μελέτης 1.0 74 0.8 0.6 93 139 α) Alpha =0.01 β) Alpha =0.05 γ) Alpha =0.10 Power 0.4 0.2 p=0.05, Tails=2 Effect size=0.20 0 50 100 150 200 Αριθμός ασθενών ανά group
Sample size and related issues
Sample size and related issues
Sample size and related issues
Sample size and related issues
Μπαγεσιανή θεώρηση έναντι στατιστικής λογικής Survival (%) Αριθμός ζώντων 18 16 14 12 10 8 6 4 2 0 1524 1533 TORCH 0 12 24 36 48 60 72 84 96 108 120 132 144 156 Time to death (weeks) 1464 1487 1399 1426 HR 0.825, p=0.052 RRR=17.5% ARR: 2.6% Placebo 15.2% SFC 12.6% 1293 1339
Point Estimates Confidence Intervals Point estimate Το μέγεθος της επίδρασης του παράγοντα υπό έρευνα στις συγκρινόμενες ομάδες (effect size) π.χ επίδραση φαρμάκου σε κλινική μελέτη ή ο σχετικός κίνδυνος σε μελέτη cohort Αποτελεί το πιο σημαντικό στοιχείο μιας μελέτης γιατί αντιπροσωπεύει την ουσία της μελέτης (μέγεθος επίδρασης) Αποτελεί το ουσιαστικότερο στοιχείο των περιγραφικών στοιχείων μιας έρευνας (Descriptive summary) Confidence Interval (CI) Η αληθής τιμή της επίδρασης του υπό μελέτη παράγοντα (effect size) είναι αδύνατον να υπολογιστεί στην ιατρική έρευνα Συνήθως η αληθής τιμή εμπεριέχεται σε όρια τα οποία υπολογίζονται στην μελέτη και τα ονομάζουμε διαστήματα εμπιστοσύνης (CI) ή όρια αξιοπιστίας
Confidence Intervals: Έννοια Σημασία Confidence Interval (CI) Συνήθως παρατίθενται μαζί με το επίπεδο στατιστικής σημαντικότητας που επιθυμείται π.χ 95%CI (3-4.5). Σημαίνει ότι με πιθανότητα 95% η αληθής τιμή εμπεριέχεται στο διάστημα μεταξύ 3-4.5 Όσο πιο στενά είναι τα όρια εμπιστοσύνης τόσο πιο ακριβής είναι η μελέτη.
Confidence intervals: Πλεονεκτήματα Παράθεση ορίων τιμών επί κλινικών συνήθως δεδομένων Έμφαση στο κλινικό αποτέλεσμα μιας μελέτης και όχι σε στατιστική σημαντικότητα που μπορεί να είναι αλλά μπορεί και όχι κλινικώς ενδιαφέρον Ο αναγνώστης της μελέτης μπορεί να διαμορφώσει άποψη για την κλινική σημασία των ευρημάτων Ευρεία όρια αξιοπιστίας ιδίως αν αυτά εμπεριέχουν την τιμή που αντιπροσωπεύει μηδενική επίδραση σημαίνει ότι δυνατόν να ευρεθεί στατιστική σημαντικότητα αν αυξηθεί η ισχύς της μελέτης (π.χ. αυξάνοντας τον αριθμό των ασθενών)
Assumptions Variables Quantitative Qualitative Normality Normal Non normal distributed Groups Number (1, 2, >2) Pair or independent
Normality Normality Normal Non normal distributed Known identical mean Cases >50 z-test Cases <50 Single t-test Unknown identical mean 1-S Kolmogorov-Smirnov Shapiro-Wilk W test for nonnormality Histogram (with superimposed normal curve)
Examples of Normal Curves
Rescaling Data (cont.) The men s weight data set measured weights in kilograms. If we want to think about these weights in pounds, we would rescale the data:
z-scores Standardizing data into z-scores shifts the data by subtracting the mean and rescales the values by dividing by their standard deviation. Standardizing into z-scores does not change the shape of the distribution. Standardizing into z-scores changes the center by making the mean 0. Standardizing into z-scores changes the spread by making the standard deviation 1. - μ x z = SD z=x 1 -μ/sd, x 1 =μ+z SD
Standardizing the Three Normal Curves
The 68-95-99.7 Rule (cont.) The following shows what the 68-95-99.7 Rule tells us:
Finding Normal Percentiles by Hand (cont.) Table Z is the standard Normal table. We have to convert our data to z-scores before using the table. Figure shows us how to find the area to the left when we have a z-score of 1.80:
The 68-95-99.7 Rule Normal models give us an idea of how extreme a value is by telling us how likely it is to find one that far from the mean. We can find these numbers precisely, but until then we will use a simple rule that tells us a lot about the Normal model
The 68-95-99.7 Rule (cont.) It turns out that in a Normal model: about 68% of the values fall within one standard deviation of the mean; about 95% of the values fall within two standard deviations of the mean; and, about 99.7% (almost all!) of the values fall within three standard deviations of the mean.
Normal Probability Plots (cont.) Nearly Normal data have a histogram and a Normal probability plot that look somewhat like this example:
Normal Probability Plots (cont.) A skewed distribution might have a histogram and Normal probability plot like this:
The Key Fact for 68-95-99.7 Rule
When do we use z-score? There is no universal standard for z scores, but there is a model that shows up over and over in Statistics. This model is called the Normal model (You may have heard of bell shaped curves. ). Normal models are appropriate for distributions whose shapes are unimodal and roughly symmetric. These distributions provide a measure of how extreme a z score is.
Material & Methods Data analysis..
Presentation Proportions/ratios Pies, rates, adjustment rates Interval Normal (x±sd) Non-normal [median (min-max)]
Data presentation - Bars p=0.001 Cytotoxicity (%) 50 40 30 20 10 p=0.001 0.001 0 COPD smokers Non- COPD smokers Non- smokers healthy
Data presentation Scatter graphs p=0.002 Tc1/Tc2 ratio 60 50 40 30 20 p=0.001 p=0.001 10 0 COPD smokers (A) Non- COPD smokers (B) Non- smokers healthy (C)
Data presentation - Boxplots p=0.001 Perforin expression (RFI units) 9 8 7 6 5 4 3 2 1 p=0.03 p=0.01 0 COPD Non- COPD smokers Normal non- smokers
Παρουσίαση δεδομένων A B Ποια εικόνα προτιμάτε για την παρουσίαση δεδομένων? Την Α Την Β Καμία
Παρουσίαση δεδομένων A p=0.05* B p=0.05* Ποια εικόνα προτιμάτε για την παρουσίαση δεδομένων? Την Α Την Β Καμία * Paired t test
Παρουσίαση δεδομένων p=0.05* Αν ήσασταν reviewer θα ζητάγατε κάτι επιπλέον? * Paired t-test
Παρουσίαση δεδομένων p=0.05* * Paired t-test
Material & Methods Data analysis..
Επιλογή στατιστικής δοκιμασίας
Statistical analysis (Comparisons Rough guide) Comparisons Interval (numerical) Proportions & Rates Normal Non Normal Chi square test 2 groups Student t test (Paired/Independent) 3 or more groups ANOVA plus Posthoc analysis 2 groups Non parametric (Wilcoxon Mann Whitney) 3 or more groups Kruskal Walis plus Posthoc analysis Contingency tables 2 by 2 or by r by c McNemar s (paired) Fischer s exact test (dichotomous)
Chi Square Που χρησιμοποιείται: Σε όλα τα είδη των επιδημιολογικών μελετών όταν τα υπό εξέταση endpoints (variables) είναι ποιοτικά (counts) Χρησιμότητα: Είναι η συσχέτιση μεταξύ δύο ποιοτικών μεταβλητών στατιστικώς σημαντική; Πόσο ισχυρή είναι αυτή η συσχέτιση; Αντίστοιχη δοκιμασία: McNemar s: Χρησιμοποιείται στις μελέτες case control, cohort/experimental όταν υπάρχει αντιστοιχία κατά ζεύγη μεταξύ των υπό εξέταση μεταβλητών
Chi-Square in SPSS (Dialog box) Μορφή στοιχείων Κατηγορίες ή υπό μορφή αριθμών ή αλφαριθμητικών δεδομένων Δεδομένα: Ασθενείς με ψηλή μόρφωση δεν θα παραμελήσουν την δίαιτα τους σε περίπτωση μετά από καρδιακό επεισόδιο Επιλογή SPSS Analyze.. Crosstabs. Variable s selection.
Chi-Square in SPSS (Dialog box) Μορφή στοιχείων Κατηγορίες ή υπό μορφή αριθμών ή αλφαριθμητικών δεδομένων Επιλογή SPSS Analyze.. Crosstabs.. Variable s selection
Chi-Square in SPSS (dialog box) Μορφή στοιχείων Κατηγορίες ή υπό μορφή αριθμών ή αλφαριθμητικών δεδομένων Επιλογή SPSS Analyze.. Crosstabs.. Statistics (Chi-square)
Chi-Square in SPSS (Dialog box) Μορφή στοιχείων Κατηγορίες ή υπό μορφή αριθμών ή αλφαριθμητικών δεδομένων Επιλογή SPSS Analyze.. Crosstabs.. Statistics (Chi-square).. Format of contingency tables).
Chi-Square in SPSS (SPSS output) SPSS output Tables Statistical significance
Chi Square in SPSS (results expression) Interpretation (expression) Statistically significant proportion of the subjects of the high education level, 8/9 (88.9%) will change their diet habit compared to the individuals of lower education level 2/9 (18.2%), p=0.002 (chisquare)
Student-test in SPSS Εκτιμά την στατιστική σημαντικότητα μεταξύ των μέσων τιμών μιας μεταβλητής μεταξύ δύο ομάδων Εφαρμόζεται μόνο επί αριθμητικών δεδομένων με κανονική κατανομή Επί μη κανονικής κατανομής εφαρμόζεται το αντίστοιχο μη παραμετρικό (Mann- Whitney U test)
Student-test in SPSS (Menu) Analyze.. Compare Means Independent Student-T-Test
Student-test in SPSS (Dialog box) Analyze.. Compare Means Independent Student-T-Test Επιλογή παραμέτρων.. Καθορισμός της παραμέτρου ομαδοποίησης.
Student test in SPSS (output interpretation) The low education level group did not differ statistically significant in respect of the age (x±sd) compare to the high education level 44.3±15.1 vs. 47.8±19.9, p=0.7
Επιλογή στατιστικής δοκιμασίας
Statistical analysis (Relationships Rough guide) Relationships Interval (numerical) Proportions & Rates Pairs of variables Pair of variable Controlling with 1 or more Multiple variables Dichotomous against numeric Pearson s Chi square test Pearson Correlation Linear regression Bivariate analysis Spearmn s Rho Kendall s tau b Partial Linear correlation With co variants MANOVA Multivariate analysis (step up/down) Logistic regression Spearman s Rho Kendall s tau b
Regression in SPSS Εφαρμόζονται μεταξύ δύο μεταβλητών για να ελέγξουμε Την στατιστική σημαντικότητα της συσχέτισης μεταξύ των δύο μεταβλητών Την δύναμη αυτή της συσχέτισης Το μέγεθος της διακύμανσης της μιας μεταβλητής να που μπορεί να εξηγηθεί από την μεταβολή της άλλης
Regression in SPSS (Menu) Analyze. Regression. Linear. Variables.
Regression in SPSS (Menu) Analyze. Regression. Linear. Variables.
Regression in SPSS (interpretation/expression) The pain scale was significantly negatively associated with age, r=-941, p<0.0001
Regression in SPSS (regression graph) The pain scale was significantly negatively associated with age, r=-941, p<0.0001 H σημασία το r 2 =0.885 Pain Scale (0-100) n=20, r=-0.941 p<0.0001