Είδη δεδοµένων Σε µία επιδηµιολογική έρευνα, καταγράφονται τα παρακάτω δεδοµένα για κάθε άτοµο: Λογαριθµιστική εξάρτηση Βάνα Σύψα Επίκουρη Καθηγήτρια Επιδηµιολογίας και Προληπτικής Ιατρικής Εργαστήριο Υγιεινής, Επιδηµιολογίας και Ιατρικής Στατιστικής Ιατρική Σχολή Πανεπιστηµίου Αθηνών vsipsa@med.uoa.gr Έκθεση στον υπό µελέτη παράγοντα (π.χ. θεραπεία, κάπνισµα κλπ) Άλλοι παράγοντες (ηλικία, φύλο κλπ) Έκβαση (π.χ. ανταπόκριση στη θεραπεία, εµφάνιση νόσου κλπ) ΜΠΣ ΜΕΘ ΚΑΙ ΕΠΕΙΓΟΥΣΑ ΝΟΣΗΛΕΥΤΙΚΗ Είδη δεδοµένων Πιθανά ερωτήµατα σε µία επιδηµιολογική έρευνα Ποσοτικές µεταβλητές (quantitative) Π.χ. ηλικία, δείκτης µάζας σώµατος, επίπεδα χοληστερόλης, διαστολική/συστολική πίεση κλπ Παράγοντας Ποσοτική έκβαση (π.χ. επίπεδα χοληστερόλης) Ποιοτικές µεταβλητές (qualitative ή categorical) Διχοτοµικές: φύλο, επιβίωση Μεταβλητές µε περισσότερες από δύο κατηγορίες: οµάδα αίµατος, φυλή Διατάξιµες (ordinal): επίπεδο εκπαίδευσης, διαβάθµιση σοβαρότητας µίας ανεπιθύµητης ενέργειας Παράγοντας Ποιοτική έκβαση (π.χ. ανταπόκριση στη θεραπεία: ναι/όχι) ΜΠΣ "ΜΕΘ ΚΑΙ ΕΠΕΙΓΟΥΣΑ ΝΟΣΗΛΕΥΤΙΚΗ" 1
Υποθετικό παράδειγµα Παράδειγµα Παράγοντας Έκβαση Κλινική δοκιµή όπου οι ασθενείς τυχαιοποιούνται σε δύο θεραπευτικά σχήµατα Α και Β και στο τέλος της θεραπείας αξιολογείται η ανταπόκριση (ναι/όχι) Π.χ. Treatment Response Total Κάπνισµα (ναι/όχι) Ca πνεύµονα (ναι/όχι) Yes No (Α/Β) Ανταπόκριση (ναι/όχι) Drug A 180 120 300 Drug B 130 170 300 Total 310 290 600 Ποσοστά ανταπόκρισης Σχετικός λόγος (Οdds ratio) Treatment Response Total Yes No Drug A 180 (60.0%) 120 (40.0%) 300 (100.0%) Drug B 130 (43.3%) 170 (56.7%) 300 (100.0%) Στο παράδειγµά µας: εκφράζει πόσες φορές τα άτοµα που λαµβάνουν τη θεραπεία Α έχουν µεγαλύτερη (ή µικρότερη) πιθανότητα ανταπόκρισης σε σχέση µε τα άτοµα που λαµβάνουν τη θεραπεία Β. ΜΠΣ "ΜΕΘ ΚΑΙ ΕΠΕΙΓΟΥΣΑ ΝΟΣΗΛΕΥΤΙΚΗ" 2
Ερµηνεία Odds Ratio () Ανταπόκριση Ναι Όχι Α α β Β γ δ της έκβασης για τα άτοµα µε τον παράγοντα σε σχέση µε τα άτοµα χωρίς τον παράγοντα: =αδ/βγ 1: Τα άτοµα που παίρνουν τη θεραπεία Α έχουν παρόµοια πιθανότητα ανταπόκρισης σε σχέση µε τα άτοµα που παίρνουν τη θεραπεία Β >1: Τα άτοµα που παίρνουν τη θεραπεία Α έχουν µεγαλύτερη πιθανότητα ανταπόκρισης σε σχέση µε τα άτοµα που παίρνουν τη θεραπεία Β <1: Τα άτοµα που παίρνουν τη θεραπεία Α έχουν µικρότερη πιθανότητα ανταπόκρισης σε σχέση µε τα άτοµα που παίρνουν τη θεραπεία Β Παράδειγµα - συνέχεια Treatment Response Total Yes Drug A 180 (60.0%) Drug B 130 (43.3%) No 120 (40.0%) 170 (56.7%) =(180*170)/(130*120) =1.96 300 (100.0%) 300 (100.0%) Παράδειγµα - συνέχεια =1.96 Ερµηνεία:Τα άτοµα που λαµβάνουν το φάρµακο Α έχουν σχεδόν διπλάσια πιθανότητα ανταπόκρισης σε σχέση µε τα άτοµα που λαµβάνουν το φάρµακο Β ΟΜΩΣ, αυτό σηµαίνει ότι πραγµατικά το φάρµακο Α είναι καλύτερο από το φάρµακο Β; Η παρατηρούµενη σχέση µεταξύ έκθεσης και έκβασης µπορεί να οφείλεται σε: Τυχαίο σφάλµα (chance variation, random error) Ψευδείς συσχετίσεις µπορεί να βρεθούν κατά τύχη (sampling variability, measurement errors) Συστηµατικό σφάλµα (bias, systematic error) Συστηµατικά σφάλµατα στο σχεδιασµό ή κατά την εξέλιξη της µελέτης Συγχυτικοί παράγοντες Η σχέση µεταξύ της έκθεσης και της έκβασης συγχέεται από την παρουσία µίας τρίτης µεταβλητής ΜΠΣ "ΜΕΘ ΚΑΙ ΕΠΕΙΓΟΥΣΑ ΝΟΣΗΛΕΥΤΙΚΗ" 3
Τυχαίο σφάλµα Τυχαίο σφάλµα Στο υποθετικό παράδειγµα, το ποσοστό ανταπόκρισης στο φάρµακο Α βρέθηκε υψηλότερο σε σχέση µε το φάρµακο Β (60% vs, 43%) και το odds ratio ανταπόκρισης=1.96 Οφείλεται το εύρηµα αυτό στην ΤΥΧΗ; Χρήση στατιστικών τεστ για υπολογισµό της p-value: η πιθανότητα εύρεσης µίας τέτοιας διαφοράς κατά τύχη όταν τα θεραπευτικά σχήµατα έχουν παρόµοια αποτελεσµατικότητα p 0.05 πολύ µικρή πιθανότητα η διαφορά να βρέθηκε τυχαία Στατιστικές δοκιµασίες για τη διερεύνηση σχέσης µεταξύ 2 παραγόντων Δοκιµασία Χ 2 Παράγοντας Ποιοτική Ποσοτική Ποσοτική t-test Συντελεστής συσχέτισης µε στατιστική αξιολόγησή του Έκβαση Ποιοτική (µε 2 κατηγορίες) X 2 -test t-test Treatment Response Total Yes Drug A 180 (60.0%) Drug B 130 (43.3%) No 120 (40.0%) 170 (56.7%) Χ 2 -test: p<0.001 300 (100.0%) 300 (100.0%) Στατιστικά σηµαντική διαφορά των 2 θεραπειών ως προς την έκβαση ΜΠΣ "ΜΕΘ ΚΑΙ ΕΠΕΙΓΟΥΣΑ ΝΟΣΗΛΕΥΤΙΚΗ" 4
Συγχυτικοί παράγοντες (confounding) Συγχυτικοί παράγοντες Το ότι υπάρχει στατιστικά σηµαντική σχέση µεταξύ 2 µεταβλητών δε σηµαίνει απαραίτητα ότι υπάρχει µία αιτιολογική σχέση µεταξύ τους Μπορεί π.χ. να υπάρχει µία τρίτη µεταβλητή που επηρεάζει το αποτέλεσµα Παράγοντας Α Πλασµατική συσχέτιση? Υπό µελέτη συµβάν Παράγοντας Β Πιθανός συγχυτικός παράγοντας Συγχυτικοί παράγοντες -παράδειγµα Coffee consumption Lung cancer Yes No Yes 68 33 No 32 72 =(68*72)/(33*32) =4.64 p<0.001 Αυτοί που πίνουν καφέ έχουν 4.6 φορές µεγαλύτερο κίνδυνο καρκίνου του πνεύµονα Το εύρηµα είναι στατιστικά σηµαντικό Τι συµπεραίνω??? Ας διερευνήσουµε το ερώτηµα περισσότερο: Καπνιστές Lung cancer Coffee consumpti on Yes No Yes 63 15 No 15 4 ΟR 1 =1.12 (p=0.858) Μη καπνιστές Coffee consumpti on Lung cancer Yes No Yes 5 18 No 17 68 ΟR 2 =1.11 (p=0.854) Συνολικό =4.64 Στη διαστρωµάτωση: ΟR 1,ΟR 2 1 (απουσία σχέσης) Κάπνισµα είναι συγχυτικός παράγοντας Η κατανάλωση καφέ ΔΕN συσχετίζεται µε την εµφάνιση Cα πνεύµονα ΜΠΣ "ΜΕΘ ΚΑΙ ΕΠΕΙΓΟΥΣΑ ΝΟΣΗΛΕΥΤΙΚΗ" 5
Συγχυτικοί παράγοντες παράδειγµα (συνέχεια) Έλεγχος συγχυτικών παραγόντων Coffee consumption Lung cancer Στην απλή περίπτωση που υπάρχει ένας πιθανός συγχυτικός παράγοντας µε 2 επίπεδα (π.χ. κάπνισµα), η επίδραση του µπορεί να εξουδετερωθεί µε διαστρωµάτωση Smokers more frequently found among coffee drinkers Smoking associated with increased risk for lung cancer Όταν υπάρχουν πολλοί πιθανοί συγχυτικοί παράγοντες; Association due to confounding Μοντέλα πολλαπλής εξάρτησης Τα µοντέλα πολλαπλής εξάρτησης επιτρέπουν: να ελεγχθούν οι πιθανοί συγχυτικοί παράγοντες να διερευνηθεί η επίδραση πολλών µεταβλητών ταυτόχρονα Πολλαπλή λογαριθµιστική εξάρτηση (Multiple logistic regression model): Χρησιµοποιείται όταν η έκβαση είναι ποιοτική µεταβλητή µε 2 κατηγορίες!! Οι παράγοντες των οποίων την επίδραση µελετάµε µπορούν να είναι ποιοτικές και ποσοτικές µεταβλητές Πολλαπλή λογαριθµιστική εξάρτηση Γραµµική παλινδρόµηση (όταν η έκβαση ποσοτικό χαρακτηριστικό) ^Υ= β 0 +β 1 Χ 1 +β 2 Χ 2 + +β p X p Λογαριθµιστική παλινδρόµηση (όταν η έκβαση ποιοτικό χαρακτηριστικό µε 2 επίπεδα) log ( )= β 0 +β 1 Χ 1 +β 2 Χ 2 + +β p X p p 1-p όπου p: η αναλογία των ατόµων µε το υπό µελέτη συµβάν (π.χ. % ασθενών που ανταποκρίθηκαν) ΜΠΣ "ΜΕΘ ΚΑΙ ΕΠΕΙΓΟΥΣΑ ΝΟΣΗΛΕΥΤΙΚΗ" 6
Γραµµική και λογαριθµιστική εξάρτηση Πολλαπλή λογαριθµιστική εξάρτηση: Ερµηνεία συντελεστών µερικής εξάρτησης β Είδος εξαρτηµένης µεταβλητής (η έκβαση που µας ενδιαφέρει) Τι εκφράζει η εξαρτηµένη µεταβλητή Ανεξάρτητες µεταβλητές (µελετάµε την επίδραση τους στην έκβαση) Μοντέλο Γραµµική εξάρτηση Ποσοτική µε κανονική κατανοµή Τα επίπεδα της ποσοτικής µεταβλητής (Υ) Λογαριθµιστική εξάρτηση Ποιοτική µε 2 επίπεδα Την πιθανότητα παρουσίας (ή απουσίας) του ποιοτικού χαρακτηριστικού (π) Ποιοτικές και ποσοτικές µεταβλητές (Χ) ^ Υ=α+βX π ln( = α+ βx 1 π ) Οdds ratio (ΟR) = e β Συγκρίνει την πιθανότητα εµφάνισης του υπό µελέτη συµβάντος µεταξύ δύο οµάδων ατόµων που διαφέρουν ως προς το Χ κατά µία µονάδα (και οι υπόλοιπες µεταβλητές είναι ίδιες) ΟR > 1 αύξηση της Χ i συνεπάγεται αύξηση της πιθανότητας 1 µεταβολή της Χ i δεν επιφέρει µεταβολή της πιθανότητας < 1 αύξηση της Χ i συνεπάγεται µείωση της πιθανότητας Πολλαπλή λογαριθµιστική εξάρτηση: Παράδειγµα καφέ και Ca Πνεύµονα Χ 1 : Κατανάλωση καφέ (0: Όχι, 1: Ναι) X 2 : Κάπνισµα (0: Όχι, 1: Ναι) p : πιθανότητα να έχει το άτοµο Ca πνεύµονα p log ( )= β 0 +β 1 Χ 1 +β 2 Χ 2 1-p Κάπνισµα Κατανάλωση καφέ Παράδειγµα: Eρµηνεία οdds ratio για την επίδραση της κατανάλωσης καφέ Χ 1 : Κατανάλωση καφέ (0: Όχι, 1: Ναι) (e β1 ): odds ratio Ca πνεύµονα για τα άτοµα που πίνουν καφέ σε σχέση µε τα άτοµα που δεν πίνουν, διορθωµένο για το κάπνισµα Πιο απλά: το συγκρίνει τον κίνδυνο Ca πνεύµονα σε 2 άτοµα µε τις ίδιες καπνιστικές συνήθειες όπου το ένα πίνει καφέ και το άλλο δεν πίνει Επιτρέπει την αξιολόγηση της επίδρασης της κατανάλωσης καφέ στην εµφάνιση Ca πνεύµονα ανεξάρτητα από το κάπνισµα ΜΠΣ "ΜΕΘ ΚΑΙ ΕΠΕΙΓΟΥΣΑ ΝΟΣΗΛΕΥΤΙΚΗ" 7
Παράδειγµα: Eρµηνεία οdds ratio για την επίδραση του καπνίσµατος Χ 2 : Κάπνισµα (0: Όχι, 1: Ναι) (e β2 ): odds ratio Ca πνεύµονα για τα άτοµα που καπνίζουν σε σχέση µε τα άτοµα που δεν καπνίζουν, διορθωµένο για την κατανάλωση καφέ Πιο απλά: το συγκρίνει τον κίνδυνο Ca πνεύµονα σε 2 άτοµα µε την ίδια κατανάλωση καφέ (ναι, όχι) όπου το ένα καπνίζει και το άλλο δεν καπνίζει Επιτρέπει την αξιολόγηση της επίδρασης του καπνίσµατος στην εµφάνιση Ca πνεύµονα ανεξάρτητα από την κατανάλωση καφέ Πολλαπλή λογαριθµιστική εξάρτηση: Παράδειγµα Χ 1 : (0: Placebo, 1: New drug) X 2 : Ηλικία (σε έτη) p : % ασθενών που ανταποκρίθηκαν p log ( )= β 0 +β 1 Χ 1 +β 2 Χ 2 1-p Ηλικία Παράδειγµα: Eρµηνεία οdds ratio για την επίδραση της θεραπείας Χ 1 : (0: Placebo, 1: New drug) (e β1 ): odds ratio ανταπόκρισης για τα άτοµα που λαµβάνουν το νέο φάρµακο σε σχέση µε τα άτοµα που λαµβάνουν το placebo, διορθωµένο για την ηλικία (adjusted for age) Πιο απλά: το συγκρίνει 2 άτοµα της ίδιας ηλικίας όπου το ένα λαµβάνει το φάρµακο και το άλλο το placebo Επιτρέπει την αξιολόγηση της επίδρασης της θεραπείας στην ανταπόκριση ανεξάρτητα από την ηλικία Παράδειγµα: Eρµηνεία οdds ratio για την επίδραση της ηλικίας X 2 : Ηλικία (σε έτη) (e β2 ) odds ratio ανταπόκρισης για άτοµο που είναι 1 έτος µεγαλύτερο από άλλο και τα δύο άτοµα λαµβάνουν το ίδιο θεραπευτικό σχήµα Επιτρέπει την αξιολόγηση της επίδρασης της ηλικίας στην ανταπόκριση ανεξάρτητα από τη θεραπεία ΜΠΣ "ΜΕΘ ΚΑΙ ΕΠΕΙΓΟΥΣΑ ΝΟΣΗΛΕΥΤΙΚΗ" 8
Παραδείγµατα ερµηνείας των αποτελεσµάτων της λογαριθµιστικής εξάρτησης Μοντέλο 1 New drug/placebo 2.33 (1.25, 4.23) 0.002 95% όριααξιοπιστίας ( confidence interval): Με 95% πιθανότητα, το odds ratio ανταπόκρισηςβρίσκεταιµεταξύ 1.25 και 4.23 Αν το 1 ΕΝ περιλαµβάνεται στο 95% CI η σχέση είναι στατιστικά σηµαντική Παραδείγµατα ερµηνείας των αποτελεσµάτων της λογαριθµιστικής εξάρτησης Μοντέλο 1 Μοντέλο 2α New drug/placebo 2.33 (1.25, 4.23) 0.002 New drug/placebo 2.34 (1.13, 3.48) 0.003 Ηλικία 40/>40 ετών 1.35 (1.1, 1.8) 0.033 Παραδείγµατα ερµηνείας των αποτελεσµάτων της λογαριθµιστικής εξάρτησης Μοντέλο 1 Μοντέλο 2β New drug/placebo 2.33 (1.25, 4.23) 0.002 New drug/placebo 1.13 (0.88, 3.24) 0.234 Ηλικία 40/>40 ετών 1.35 (1.1, 1.8) 0.033 Παραδείγµατα ερµηνείας των αποτελεσµάτων της λογαριθµιστικής εξάρτησης Μοντέλο 1 Μοντέλο 2γ Ηλικία 40 ετών New drug/placebo 2.3 (1.2, 3.3) 0.023 Ηλικία >40 New drug/placebo 2.33 (1.25, 4.23) 0.002 New drug/placebo 1.2 (0.85, 1.4) 0.333 ΜΠΣ "ΜΕΘ ΚΑΙ ΕΠΕΙΓΟΥΣΑ ΝΟΣΗΛΕΥΤΙΚΗ" 9
Παραδείγµατα NEJM, 2012 Presence of nighttime intensivist staffing (yes/no) Death during hospitalisation (yes/no) ΜΠΣ "ΜΕΘ ΚΑΙ ΕΠΕΙΓΟΥΣΑ ΝΟΣΗΛΕΥΤΙΚΗ" 10
Presence of nighttime intensivist staffing (yes/no) Death during hospitalisation (yes/no) Πιθανοί συγχυτικοί παράγοντες? Nighttime intensivist staffing vs other staffing Η ανάλυση έγινε χωριστά ανάλογα µε το αν οι ασθενείς ήταν σε low-intensity daytime ή σε highintensity daytime staffing hospital Σε µονάδες µε nightime intensivist staffing ο κίνδυνος να πεθάνει ασθενής µέσα στο νοσοκοµείο ήταν 0.62 φορές µικρότερος σε σχέση µε µονάδες χωρίς nightime intensivist staffing (p=0.04) ΜΠΣ "ΜΕΘ ΚΑΙ ΕΠΕΙΓΟΥΣΑ ΝΟΣΗΛΕΥΤΙΚΗ" 11
Nighttime intensivist staffing vs other staffing Am J Resp & Crit Care Med, 2007 ΜΠΣ "ΜΕΘ ΚΑΙ ΕΠΕΙΓΟΥΣΑ ΝΟΣΗΛΕΥΤΙΚΗ" 12
ΜΠΣ "ΜΕΘ ΚΑΙ ΕΠΕΙΓΟΥΣΑ ΝΟΣΗΛΕΥΤΙΚΗ" 13