Ποιοτικά. Ονομαστικά Διαβήτης τύπου Ι/ τύπου ΙΙ/ μηδιαβητικός

Σχετικά έγγραφα
ΑΝΑΛΥΣΗ ΠΟΙΟΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ: Συγκρίσεις μεταξύ ομάδων. Η σύγκριση 2 ποιοτικών μεταβλητών με >2 ομάδες.

Έλεγχος ανεξαρτησίας μεταξύ δύο ποιοτικών μεταβλητών (Crosstabs - Chi-Square Tests)

Στατιστική και Θεωρία Πιθανοτήτων (ΓΓ04) ΑΝΤΩΝΙΟΣ ΧΡ. ΜΠΟΥΡΑΣ Εαρινό Εξάμηνο

Υ: Νόσος. Χ: Παράγοντας Κινδύνου 1 (Ασθενής) 2 (Υγιής) Σύνολο. 1 (Παρόν) n 11 n 12 n 1. 2 (Απών) n 21 n 22 n 2. Σύνολο n.1 n.2 n..

4. Ανάλυση ποιοτικών δεδοµένων: συγκρίσεις µεταξύ οµάδων.

Μεθοδολογία της Έρευνας και Εφαρμοσμένη Στατιστική

Μεθοδολογία των επιστημών του Ανθρώπου: Στατιστική Ι

Στόχος µαθήµατος: Παράδειγµα 1: µελέτη ασθενών-µαρτύρων ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΙΙ

Υ: Νόσος. Χ: Παράγοντας Κινδύνου 1 (Ασθενής) 2 (Υγιής) Σύνολο. 1 (Παρόν) n 11 n 12 n 1. 2 (Απών) n 21 n 22 n 2. Σύνολο n.1 n.2 n..

ΕΚΠΑΙΔΕΥΤΙΚΗ ΤΕΧΝΟΛΟΓΙΑ ΚΑΙ ΑΝΑΠΤΥΞΗ ΑΝΘΡΩΠΙΝΩΝ ΠΟΡΩΝ

ΚΟΙΝΩΝΙΟΒΙΟΛΟΓΙΑ, ΝΕΥΡΟΕΠΙΣΤΗΜΕΣ ΚΑΙ ΕΚΠΑΙΔΕΥΣΗ

Συνάφεια μεταξύ ποιοτικών μεταβλητών. Εκδ. #3,

Για να ελέγξουµε αν η κατανοµή µιας µεταβλητής είναι συµβατή µε την κανονική εφαρµόζουµε το test Kolmogorov-Smirnov.

StatXact ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΙΙ. StatXact. ΜΑΘΗΜΑ 5 ΕΡΓΑΣΤΗΡΙΟ 1 - συνέχεια ΜΕΤΡΑ ΚΙΝ ΥΝΟΥ & ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ ΜΕ ΤΗΝ ΧΡΗΣΗ StatXact

Μαντζούνη, Πιπερίγκου, Χατζή. ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 5 ο

ΠΕΡΙΓΡΑΦΙΚΗ και ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

Ασκήσεις Εξετάσεων. Μεταπτυχιακό Πρόγραμμα Σπουδών στη. Διοίκηση των Επιχειρήσεων

Μενύχτα, Πιπερίγκου, Σαββάτης. ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 5 ο

ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Δρ. Βασίλης Π. Αγγελίδης Τμήμα Μηχανικών Παραγωγής & Διοίκησης Δημοκρίτειο Πανεπιστήμιο Θράκης

ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ

Αναλυτική Στατιστική

Ποιοτική και ποσοτική ανάλυση ιατρικών δεδομένων

Σκοπός του μαθήματος. Έλεγχος μηδενικής υπόθεσης OR-RR. Έλεγχος μηδενικής υπόθεσης. Σφάλαμα τύπου Ι -Σφάλμα τύπου ΙΙ 20/4/2013

Τεκµηριωµένη Ιατρική ΒΛΑΒΗ. Βασίλης Κ. Λιακόπουλος Λέκτορας Νεφρολογίας ΑΠΘ

Κεφάλαιο 16. Σύγκριση συχνοτήτων κατηγοριών: το στατιστικό κριτήριο χ 2. Προϋποθέσεις για τη χρήση του τεστ. ιαφορές ή συσχέτιση.

Στατιστικοί Έλεγχοι Υποθέσεων. Σαλαντή Γεωργία Εργαστήριο Υγιεινής και Επιδημιολογίας Ιατρική Σχολή

Συγγραφή και κριτική ανάλυση επιδημιολογικής εργασίας

Περιγραφική Ανάλυση ποσοτικών μεταβλητών

Μη Παραμετρικοί Έλεγχοι & Η Δοκιμασία Χ 2

Επιδημιολογία 3 ΣΧΕΔΙΑΣΜΟΣ ΜΕΛΕΤΩΝ. Ροβίθης Μ. 2006

Κλινική Επιδηµιολογία. Μέτρα κινδύνου Αιτιολογική συσχέτιση

Ιατρικά Μαθηματικά & Βιοστατιστική

Στατιστικοί έλεγχοι του Χ 2

ΤΕΙ ΗΠΕΙΡΟΥ ΣΧΟΛΗ ΕΠΑΓΓΕΛΜΑΤΩΝ ΥΓΕΙΑΣ ΚΑΙ ΠΡΟΝΟΙΑΣ ΤΜΗΜΑ ΛΟΓΟΘΕΡΑΠΕΙΑΣ. Μεγγίσογλου Ευθυμία Ξενογιώργη Αικατερίνη Σβολιανίτη Χριστίνα

Σπουδαστές Γιαννουλάκης Αντρέας Α.Μ Τσουρουνάκης 'Αγγελος Α.Μ Μουτουσίδου Πόπη Α.Μ Εισηγητής: Ταφιάδης Χρ.

Κεφάλαιο 15 Έλεγχοι χ-τετράγωνο

Κλινική Επιδηµιολογία

«ΘΥΜΑΤΟΠΟΙΗΣΗ ΚΑΙ ΦΟΒΟΣ ΤΟΥ ΕΓΚΛΗΜΑΤΟΣ ΣΤΟ ΔΙΑΔΙΚΤΥΟ»

τατιστική στην Εκπαίδευση II

ΛΟΓΙΣΤΙΚΗ ΕΞΑΡΤΗΣΗ. Πρώτα θα δούμε την επίδραση των παραπάνω παραγόντων με διμεταβλητή ανάλυση: Variables in the Equation

Επιδημιολογία. Είδη υπό-μελέτη πληθυσμών. Ο ορισμός του υπό-μελέτη πληθυσμού ΜΕΤΡΗΣΗ ΚΑΙ ΣΥΓΚΡΙΣΗ ΤΗΣ ΣΥΧΝΟΤΗΤΑΣ ΤΩΝ ΝΟΣΗΜΑΤΩΝ

ΣΧΕΣΗ ΜΕΤΑΞΥ ΠΟΙΟΤΙΚΩΝ ΜΕΤΑΒΛΗΤΩΝ

Στατιστικές Υποθέσεις

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Μέτρα σχέσης. Ιωάννα Τζουλάκη Λέκτορας Επιδημιολογίας Υγιεινή και Επιδημιολογία

ΑΝΑΛΥΣΗ Ε ΟΜΕΝΩΝ. 3. Στατιστική Συµπερασµατολογία για ποιοτικές µεταβλητές

Εισαγωγή στη Στατιστική

ΕΡΓΑΣΤΗΡΙΟ ΣΤΑΤΙΣΤΙΚΗΣ

Βοήθημα Εξετάσεων. Μεταπτυχιακό Πρόγραμμα Σπουδών στη Διοίκηση των Επιχειρήσεων

ΤΕΙ Αθήνας Μεθοδολογία της έρευνας και Ιατρική στατιστική

Μπεττίνα Χάιδιτς. Επίκουρη Καθηγήτρια Υγιεινής Ιατρικής Στατιστικής e mail:

χ 2 test ανεξαρτησίας

Ενότητα 2: Έλεγχοι Υποθέσεων Διαστήματα Εμπιστοσύνης

Έλεγχος καλής προσαρμογής για μια ποιοτική μεταβλητή (Nonparametric Tests Chi-Square)

Ενότητα 6 η :Επαγωγική Στατιστική Ι. Ανάλυση δύο μεταβλητών. Δημήτριος Σταμοβλάσης Φιλοσοφίας Παιδαγωγικής ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

ΜΕΡΟΣ Α Κάθε µια από τις παρακάτω φράσεις (1α, 1β, 1γ, 2α κτλ) µπορεί να είναι σωστή ή λανθασµένη. Ποιες είναι σωστές και ποιες όχι;

σ = και σ = 4 αντιστοίχως. Τότε θα ισχύει

Μελέτες ασθενών οµάδας ελέγχου

Ερώτηση. Ποιο μέτρο συχνότητας υπολογίστηκε;

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

Λογαριθµιστική εξάρτηση

Η ΣΤΑΤΙΣΤΙΚΗ ΣΤΟ ΕΡΓΑΣΤΗΡΙΟ ΣΠΕΡΜΑΤΟΣ

Πίνακας 1. Επίπεδα PRAME mrna (αντίγραφα/ κύτταρα) σε άτοµα σε διαφορετικές φάσεις της CML. n Ελάχιστη-µέγιστη

Μελέτες αναλυτικής επιδημιολογίας στηδιερεύνησηεπιδημιών

ΣΥΣΧΕΤΙΣΗ. Το διάγραμμα διασποράς ΕΙΣΑΓΩΓΗ

τατιστική στην Εκπαίδευση II

Ερώτηση. Ποιο μέτρο συχνότητας υπολογίστηκε;

Ανάλυση επιβίωσης (survival analysis)

Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης

Έρευνες ασθενών-μαρτύρων. Αναδρομικές. Case-control studies (retrospective) (case-control studies) Προοπτικές μελέτες

Μεθοδολογία των Επιστημών του Ανθρώπου: Στατιστική

ΠΕΡΙΓΡΑΦΙΚΗ και ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

Λειτουργικός ορισμός των μεταβλητών

6 ο ΜΑΘΗΜΑ Έλεγχοι Υποθέσεων

Εισαγωγή στην Ανάλυση Δεδομένων

Στατιστική Ι. Ενότητα 2: Στατιστική Ι (2/4) Αναπλ. Καθηγητής Νικόλαος Σαριαννίδης Τμήμα Διοίκησης Επιχειρήσεων (Κοζάνη)

Κεφάλαιο 10 Εισαγωγή στην Εκτίμηση

Στόχος µαθήµατος: ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΙΙ. Α1.2 Παράδειγµα 1 (συνέχεια) Α1. ΙΤΙΜΕΣ ΚΑΤΗΓΟΡΙΚΕΣ ΜΕΤΑΒΛΗΤΕΣ ΣΕ ΕΞΑΡΤΗΜΕΝΑ ΕΙΓΜΑΤΑ Παράδειγµα 1: αρτηριακή πίεση

Αντικείμενο των επιδημιολογικών μελετών

ΣΥΣΧΕΤΙΣΗ. Διαβάσετε και τις αναλυτικές σημειώσεις.


Ποσοτικές Μέθοδοι Ανάλυσης στις Κοινωνικές Επιστήμες

Μελέτες αναλυτικής επιδημιολογίας στηδιερεύνησηεπιδημιών

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

ΕΚΠΑΙΔΕΥΤΙΚΗ ΕΡΕΥΝΑ 1. ΜΕΡΟΣ Α - ΕΡΕΥΝΑ ΑΠΟΣΑΦΗΝΙΣΗ ΠΕΔΙΟΥ 2. ΜΕΡΟΣ Β ΣΧΕΔΙΑΣΜΟΣ - ΜΕΘΟΔΟΛΟΓΙΑ ΕΡΕΥΝΑΣ 3. ΜΕΡΟΣ Γ ΑΝΑΛΥΣΗ-ΕΠΕΞΕΡΓΑΣΙΑ ΕΡΩΤΗΜΑΤΟΛΟΓΙΟΥ

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS)

Ιατρικά Μαθηματικά & Βιοστατιστική

Media Monitoring. Ενότητα 7: Εισαγωγή & Ανάλυση δεδομένων με το SPSS. Σταμάτης Πουλακιδάκος Σχολή ΟΠΕ Τμήμα ΕΜΜΕ

Λογαριθμικά Γραμμικά Μοντέλα Poisson Παλινδρόμηση Παράδειγμα στο SPSS

Μέρος 1 Εισαγωγή στο SPSS Βασικές αρχές καταχώρισης δεδομένων και στατιστικής ανάλυσης με το SPSS 39

1991 US Social Survey.sav

Είδη Επιδημιολογικής Έρευνας. Εμμανουήλ Σμυρνάκης Λέκτορας ΠΦΥ Ιατρικής Σχολής ΑΠΘ Στάθης Γιαννακόπουλος Γενικός Ιατρός, Διδάκτωρ Ιατρικής Σχολής ΑΠΘ

ΛΥΣΕΙΣ ΑΣΚΗΣΕΩΝ

Εισαγωγή στη Βιοστατιστική

Πινάκες συνάφειας. Βαρύτητα συμπτωμάτων. Φύλο Χαμηλή Υψηλή. Άνδρες. Γυναίκες

ΜΑΘΗΜΑ ΕΠΙΔΗΜΙΟΛΟΓΙΑΣ

ΠΕΡΙΓΡΑΦΙΚΗ και ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

Στατιστική Ι. Ενότητα 9: Κατανομή t-έλεγχος Υποθέσεων. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

Πέτρος Γαλάνης, MPH, PhD Εργαστήριο Οργάνωσης και Αξιολόγησης Υπηρεσιών Υγείας Τμήμα Νοσηλευτικής, Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών

Transcript:

4. ΑΝΑΛΥΣΗ ΠΟΙΟΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ: Συγκρίσεις μεταξύ ομάδων Εισαγωγή Διαξονικοί πίνακες συχνοτήτων Μέθοδοι ανάλυσης ερωτήματα Μέθοδοι σύγκρισης 2 ποσοστών Mε ανεξάρτητες ομάδες. Με ομάδες που σχετίζονται. Εισαγωγή. Παραδείγματα 1. Σχετίζεται η έκθεση με τη νόσο; 2. Σχετίζεται ο πρόωρος τοκετός με τον τόπο διαμονής; 3. Διαφέρουν οι αναλογίες των υπέρβαρων αγοριών στην Ελλάδα στις ηλικίες των 10 και 15 ετών; Η σύγκριση 2 ποιοτικών μεταβλητών με >2 ομάδες. Διάστημα εμπιστοσύνης για 1 αναλογία Σύγκριση κινδύνων: OR & RR Διαβάσετε και τις αναλυτικές σημειώσεις. Διαξονικοί πίνακες συχνοτήτων Αν θέλουμε να συγκρίνουμε 2 (ή περισσότερες) ομάδες ατόμων όσον αφορά ένα ποιοτικό χαρακτηριστικό τους, μπορούμε να δημιουργήσουμε έναν πίνακα συχνοτήτων όπου το κάθε κελί του πίνακα αντιστοιχεί σε έναν ορισμένο συνδυασμό των χαρακτηριστικών που είναι υπό μελέτη. Ο πίνακας αυτός ονομάζεται πίνακας συνάφειας (contingency table) ή διαξονικός πίνακας συχνοτήτων (two-way table). Εισαγωγή. Ποιοτικά Ονομαστικά Διαβήτης τύπου Ι/ τύπου ΙΙ/ μηδιαβητικός Δεδομένα Διαβαθμιζόμενα Τακτικά Φυσική δραστηριότητα (ελάχιστη/μέτρια /έντονη) Όταν πρόκειται για ποιοτικά δεδομένα, μέλη του δείγματος κατηγοριοποιούνται σε αμοιβαίως εξαιρετέες κλάσεις. Όταν η κάθε μεταβλητή είναι δυαδική, τότε ο πίνακας ονομάζεται τετράπτυχος ή 2 επί 2 πίνακας (2 by 2 table). Δυαδικά Φύλο Έχει / δεν έχει τη νόσο. 4 Παράδειγμα 1. Διαξονική ταξινόμηση 700 γυναικών ανάλογα με το εάν είχαν πρόωρο τοκετό και κατά περιοχή κατοικίας τους (μηπραγματικά δεδομένα) Συχνότητες Πρόωρος τοκετός Αγροτική 45 325 370 Αστική 55 275 330 ΣΥΝΟΛΟ 100 600 700 ΣΥΝΟΛΟ Υπάρχει ένας κοινός τρόπος ανάλυσης για τους διαξονικούς πίνακες συχνοτήτων αλλά στη πράξη η μέθοδος που επιλέγεται διαφέρει ανάλογα με: 1) Το ερευνητικό ερώτημα. 2) Τον αριθμό των κατηγοριών & τον αριθμό των ανεξάρτητων ομάδων. 3) Το είδος των μεταβλητών, δηλαδή αν είναι τακτικές ή όχι. [Όταν οι ομάδες δεν είναι ανεξάρτητες τότε ο τρόπος ανάλυσης διαφέρει] τετράπτυχος ή 2 επί 2 πίνακας 5 6 1

Θα ασχοληθούμε με τις ακόλουθες 3 γενικές καταστάσεις: 1) Υπάρχουν δύο ομάδες ατόμων. Σκοπός είναι να εξετασθεί εάν η αναλογία των ατόμων που έχουν κάποιο χαρακτηριστικό είναι ίδια σε κάθε ομάδα. Έλεγχος Χ 2, έλεγχος του Fisher, έλεγχος Ζ & Δ.Ε. 2) >2 ομάδες ατόμων. Ή αντίστοιχα, μία ομάδα ατόμων ταξινομείται με βάση δυο χαρακτηριστικά. Σκοπός είναι να εξετασθεί εάν τα δύο χαρακτηριστικά σχετίζονται. Έλεγχος Χ 2. Μέθοδοι σύγκρισης 2 ποσοστών Mε ανεξάρτητες ομάδες 3) Ίδιος σκοπός με το 1), αλλά οι δύο ομάδες σχετίζονται. Π.χ. Το ίδιο άτομο πριν και μετά, το κάθε άτομο «ταιριάζεται» με κάποιο άλλο. Έλεγχος του McNemar. Παράδειγμα 2. Παρατηρούμενες συχνότητες παχύσαρκων παιδιών ηλικίας 5 ετών ανάλογα με τη διατροφή της μητέρας στο πρώτο τρίμηνο της κύησης {μη-πραγματικά δεδομένα}. Υψηλή σε κορεσμένα λίπη δίαιτα; Παχύσαρκο 24 18 42 Μη- παχύσαρκο 56 82 138 ΣΥΝΟΛΟ 80 100 180 ΣΥΝΟΛΟ Παράδειγμα 2 (συν). Η 0 : δεν υπάρχει σχέση (association) μεταξύ της υψηλής πρόσληψης κορεσμένου λίπους στο πρώτο τρίμηνο της εγκυμοσύνης και παχυσαρκίας σε ηλικίας πέντε ετών. Μπορεί να εκφραστεί και ως εξής Η 0 : δεν υπάρχει διαφορά μεταξύ της αναλογίας των παχύσαρκων παιδιών από μητέρες με υψηλή πρόσληψη ενέργειας από κορεσμένο λίπος και της αντίστοιχης αναλογίας από μητέρες που δεν είχαν υψηλή πρόσληψη ενέργειας από κορεσμένο λίπος. Τα παρατηρούμενα ποσοστά των παχύσαρκων παιδιών είναι 30% (24/80) στη μια ομάδα και 18% (18/100) στην άλλη. Διαφέρουν οι αναλογίες των παχύσαρκων παιδιών ηλικίας 5 ετών ανάλογα με τη διατροφή της μητέρας στο πρώτο τρίμηνο της κύησης; 9 Αν οι αναλογίες δεν διαφέρουν, τότε η καλύτερη εκτίμηση της αναλογίας είναι η συνολική αναλογία των παχύσαρκων παιδιών, δηλαδή 42/180, περίπου 23%. Ποια θα ήταν η αναμενόμενη συχνότητα παχύσαρκων παιδιών σε κάθε ομάδα; 10 Παράδειγμα 2 (συν). Από τα 80, θα αναμέναμε τα 80 επί 23%, δηλαδή 19 παιδιά και Από τα 100, θα αναμέναμε 100 επί 23%, δηλαδή 23. Οι αναμενόμενες συχνότητες είναι οι συχνότητες που θα αναμέναμε αν ίσχυε η Η 0. Αναμενόμενες συχνότητες (expected frequencies=e) σε κάθε κελί. 80*42/180 = 19 80*138/180 = 61 100*42/180 =23 100*138/180 =77 ΣΥΝΟΛΟ 42 138 ΣΥΝΟΛΟ 80 100 180 11 e 11 e 12 R 1 e 21 e 22 R 2 ΣΥΝΟΛΟ C 1 C 2 N ΣΥΝΟΛΟ Αναμενόμενες συχνότητες e αβ = R α C β /N α = 1,2 β = 1,2. Pearson s chi-squared test statistic Όταν ισχύει η Η 0, το Χ 2 ακολουθεί προσεγγιστικά μια χ 2 κατανομή με 1 β.ε. [Γιατί 1 β.ε.; Γιατί οι 4 αναμενόμενες συχνότητες δεν είναι ανεξάρτητες. Αν γνωρίζουμε τη μία αναμενόμενη συχνότητα μπορούμε να 12 υπολογίσουμε τις άλλες.] 2

Εδώ X 2 = (24-19) 2 /19 +...+ (82-77) 2 /77 = 3,58. Από Πίνακες, Χ 2 (1, 0,90) =2,71, Χ 2 (1, 0,95) =3,84 => 0,05<p<0,1 «Διόρθωση για την έλλειψη συνέχειας, του Yates» (Yates continuity correction). Επίπεδο σημαντικότητας α =0,05. Συμπέρασμα: Δεν υπάρχει απόδειξη ότι η υψηλή πρόσληψη ενέργειας από κορεσμένα λιπαρά στην εγκυμοσύνη σχετίζεται με την 13 παχυσαρκία των παιδιών σε ηλικία 5 ετών. Επειδή ο έλεγχος X 2 βασίζεται σε μεθόδους που είναι κατάλληλες για μεγάλα δείγματα (large sample methods), εφαρμόζεται μια «διόρθωση για την έλλειψη συνέχειας» (continuity correction) ειδικά όταν το δείγμα είναι σχετικά μικρό. Χρησιμοποιείται μια συνεχή κατανομή (χ 2 ) για να προσεγγίσει συχνότητες. O έλεγχος X 2 δεν πρέπει να χρησιμοποιείται όταν υπάρχει κάποιο κελί με αναμενόμενη συχνότητα <5 (σε 2 επί 2 πίνακα). Ο ακριβής έλεγχος του Fisher (Fisher s exact test) είναι κατάλληλος. ΣΗΜΕΙΩΣΕΙΣ 1) Ο έλεγχος Χ 2 χρησιμοποιείται μόνο όταν οι αριθμοί στα κελιά είναι συχνότητες και όχι όταν είναι ποσοστά ή μέσες τιμές. 2) Ο έλεγχος Χ 2 δεν είναι έγκυρος σε 2 επί 2 πίνακα όταν κάποιο κελί έχει αναμενόμενη συχνότητα <5. Τότε, εφαρμόζεται ο ακριβής έλεγχος του Fisher. 3) Ο έλεγχος Χ 2 δεν μας δίνει ΔΕ για το μέγεθος της διαφοράς μεταξύ των 2 αναλογιών. Εδώ δεν υπάρχει τέτοιο πρόβλημα. [Εάν θέλουμε όμως μπορούμε να παρουσιάσουμε εδώ τα αποτελέσματα του ελέγχου του Fisher αντί για το Χ 2 ]. 16 Στο SPSS Analyse Descriptive Statistics Crosstabs... pregobese.sav Όταν δεν υπάρχουν τα raw data αλλά μόνο ο πίνακας συχνοτήτων (π.χ. Σε μία δημοσίευση), πάλι μπορούμε να τρέξουμε την ανάλυση στo SPSS. Στο SPSS Data Weight cases... (by freq) Στο SPSS Analyse Descriptive Statistics Crosstabs... 17 18 3

Παράδειγμα 2 (συν). Έλεγχος υπόθεσης Ζ. Θα μπορούσαμε να είχαμε εφαρμόσει έναν έλεγχο της H 0 : π 1 - π 2 =0 με το στατιστικό κριτήριο ελέγχου Ζ που αν ισχύει η Η 0 ακολουθεί μια τυπική κανονική κατανομή. Ζ= (p 1 - p 2) / ΤΣ(p 1 - p 2 ) όπου το Ζ έχει την τυπική κανονική κατανομή (η δειγματοληπτική κατανομή της διαφοράς είναι προσεγγιστικά κανονική). Ζ = 0,12/0,063 =1,89 που αντιστοιχεί σε p=0,058. Διαστήματα εμπιστοσύνης για τη σύγκριση 2 αναλογιών {Οι τύποι δεν είναι μέρος της ύλης} Αυτός ο έλεγχος μας δίνει ακριβώς τα ίδια αποτελέσματα με το Χ 2. 19 Δ.Ε. για τη διαφορά μεταξύ 2 αναλογιών πληθυσμών όταν ισχύουν οι προϋποθέσεις της κανονικής προσέγγισης (np>5 και n(1-p)>5 στο κάθε δείγμα). Το 95% Δ.Ε. είναι ΣΗΜΕΙΩΣΗ Ο τύπος που χρησιμοποιείται για την εκτίμηση του ΤΣ στον αντίστοιχο έλεγχο υπόθεσης (Παράδειγμα 2) διαφέρει από τον παραπάνω (χρησιμοποιείται η «καλύτερη» εκτίμηση της αναλογίας όταν ισχύει η Η0, η οποία είναι ). => Υπάρχει περίπτωση το ΔΕ να μην συμπεριλαμβάνει το 0 και ο έλεγχος υπόθεσης να μη δώσει στατιστικά σημαντικό αποτέλεσμα (και το αντίθετο). 21 Παράδειγμα 2 (συν). Υπολογισμός του ΔΕ της διαφοράς. Ούτε ο έλεγχος Χ 2, ούτε ο έλεγχος Ζ μας δίνει το πιθανό μέγεθος της διαφοράς. Θα μπορούσαμε να είχαμε υπολογίσει ένα ΔΕ για τη πραγματική διαφορά. Το 95% ΔΕ για τη διαφορά μεταξύ των ποσοστών είναι από 0,01 έως 0,25 (ποσοστιαίες μονάδες). Δηλαδή έχουμε 95% σιγουριά ότι το ποσοστό των παχύσαρκών παιδιών κυμαίνεται από μία μονάδα μικρότερο έως 25% μονάδες μεγαλύτερο στην ομάδα των παιδιών των οποίων οι μητέρες είχαν υψηλή σε κορεσμένα λίπη δίαιτα, σε σχέση με αυτά των οποίων οι μητέρες δεν είχαν υψηλή σε κορεσμένα λίπη δίαιτα. Αυτό το ΔΕ βασίζεται στη κανονική προσέγγιση στη διωνυμική κατανομή, οπότε δεν είναι αξιόπιστο όταν τα ποσοστά ή το δείγμα είναι μικρά. 22 ΠΑΡΑΔΕΙΓΜΑ 3. Η αντίδραση σε θεραπεία (καλυτέρευση/ καμία διαφορά) ελέγχθηκε σε 150 ασθενείς οι οποίοι είχαν τυχαία κατανεμηθεί σε μια από δύο θεραπείες (Α και Β). Τα ποσοστά βελτίωσης ήταν p A =0,80 (60/75) και p Β =0,60 (45/75). Εδώ, SE diff = = 0,073. Οπότε το 95% Δ.Ε. για τη διαφορά μεταξύ των 2 ποσοστών στους πληθυσμούς είναι από 0,20-(1,96*0,073) έως 0,20+(1,96*0,073). Δηλαδή από 6% έως 34%. Λέμε ότι «έχουμε 95% εμπιστοσύνη ότι το ποσοστό βελτίωσης είναι από 6% έως 34% υψηλότερο με την Α σε σχέση με τη Β θεραπεία». Μέθοδοι σύγκρισης 2 ποσοστών Με ομάδες που σχετίζονται 23 4

ΠΑΡΑΔΕΙΓΜΑ 4. Αμυγδαλεκτομή και νόσος του Hodgkin. Το 1972 οι Α Johnson & Β Johnson συλλέξανε δεδομένα για να συγκρίνουν τα ποσοστά των ατόμων που είχαν κάνει αμυγδαλεκτομή, σε μία ομάδα ασθενών με τη νόσο του Hodgkin και μία αντίστοιχη ομάδα ελέγχου. Στον κάθε ασθενή αντιστοιχούσε ένας αδελφός/μια αδελφή (ίδιο φύλο) με μέχρι 5 χρόνια διαφορά στην ηλικία τους που δεν είχε τη νόσο και ήταν μέλος της ομάδας ελέγχου. Βρέθηκε ότι 48% των ασθενών και 39% της ομάδας ελέγχου είχαν κάνει αμυγδαλεκτομή. Ο έλεγχος Χ 2 είχε κριτήριο 1,53 (με 1 βε) p=0,22. ΠΑΡΑΔΕΙΓΜΑ 4 (συν). Η 0 : οι αναλογίες των ατόμων που έχουν κάνει αμυγδαλεκτομή είναι ίδιες σε άτομα με και χωρίς τη νόσο του Hodgkin. H σωστή μορφή του πίνακα (όταν υπάρχουν ζεύγη) είναι η εξής: Control Tonsillectomy No tonsillectomy Hodgkin s Tonsillectomy 26 15 41 No tonsillectomy 7 37 44 33 52 85 Όμως, οι συγγραφείς είχαν αγνοήσει τα «ζευγάρια»... 25 ΣΗΜΕΙΩΣΗ: Δεν αρκούν οι πληροφορίες του 1 ου πίνακα για να δημιουργηθεί ο 2 ος. 26 Control Tonsillectomy No tonsillectomy Hodgkin s Tonsillectomy α β α+β No tonsillectomy γ δ γ+δ α+γ β+δ n π 1 = (α+γ)/n π 2 = (α+β)/n Η 0 : οι αναλογίες των ατόμων που έκαναν αμυγλ. είναι ίδιες στις 2 ομάδες. που αντιστοιχεί σε π 1 π 2 = 0 Η 0 : οι συχνότητες των «διαφωνούντων» ζευγαριών είναι ίδιες. β = γ Control Η 0 : οι αναλογίες των ατόμων που έκαναν αμυγλ. είναι ίδιες στις 2 ομάδες. π 2 π 1 = 0 π 2 π 1 = (α+β)/n - (α+γ)/n = (β-γ)/n που αντιστοιχεί σε Η 0 : οι συχνότητες των «διαφωνούντων» ζευγαριών είναι ίδιες. Tonsillectomy No tonsillectomy Hodgkin s Tonsillectomy 26=a 15=b 41 No tonsillectomy p 1 = (a+c)/n = 39% p 2 = (a+b)/n = 48% 7=c 37=d 44 33 52 85=n 27 p 2 p 1 = (b-c) / n = 9% μονάδες 28 ΠΑΡΑΔΕΙΓΜΑ 4 (συν). Στο SPSS 14 Analyse Descriptive Statistics Crosstabs... = 2,91 p=0,09 Με τη διόρθωση του Yates: = 2,23 p=0,14 Raw data = tonsill.sav (Πίνακας 5 στις σημειώσεις=johnson2.sav) Συμπέρασμα. Δεν απορρίπτουμε την Η 0 (σε επίπεδο 5%) Δεν υπάρχει απόδειξη ότι η αναλογία των ατόμων που έκαναν αμυγδαλεκτομή διαφέρει ανάλογα με το εάν έχουν η όχι τη νόσο του Hodgkin. ΠΑΡΑΔΕΙΓΜΑ 4 (συν). Σημείωση στο SPSS ο έλεγχος βασίζεται στη διωνυμική κατανομή. 29 30 5

ΠΑΡΑΤΗΡΗΣΕΙΣ ΚΑΤΑ ΖΕΥΓΗ: Ο έλεγχος του McNemar ΠΑΡΑΔΕΙΓΜΑ 5. Ποσοστά υπέρβαρων αγοριών σε ηλικίες 10 και 15 ετών. ΠΑΡΑΔΕΙΓΜΑ 5 (συν). Η 0 : οι αναλογίες των υπέρβαρων στις 2 ηλικίες είναι ίδιες. Τυχαίο δείγμα 200 παιδιών. Παρακολούθηση για 5 χρόνια. «Διαφέρουν οι αναλογίες των υπέρβαρων αγοριών στις 2 ηλικίες;» Ο συνηθισμένος 2 επί 2 πίνακας θα είχε την εξής μορφή. Υπέρβαρο Μη-υπέρβαρο Ηλικία 10 ετών 50 150 200 Ηλικία 15 ετών 90 110 200 140 260 400 H σωστή μορφή του πίνακα (όταν υπάρχουν ζεύγη) είναι η εξής: 10 ετών Υπέρβαρο 15 ετών Υπέρβαρο 40 50 90 Μηυπέρβαρο Μηυπέρβαρο 10 100 110 50 150 200 Η 0 : οι συχνότητες των ατόμων που αλλάζουν κατηγορία (δηλαδή υπέρβαρα σε ηλικία 10 ετών αλλά όχι σε ηλικία 15 ετών και Σε τι διαφέρει από άλλους 2x2 πίνακες,αν εξετάσουμε τα σύνολα; αντιστρόφως) είναι ίδιες. 31 32 ΣΩΣΤΟ ή ΛΑΘΟΣ; Ο έλεγχος του McNemar θα μπορούσε να χρησιμοποιηθεί 1) για να συγκρίνουμε τα ποσοστά των γυναικών που έπαιρναν το αντισυλληπτικό χάπι, σε ομάδα γυναικών με καρκίνο της μήτρας και ομάδα υγιών γυναικών, ταιριασμένων για ηλικία και τόπο διαμονής (matched controls). 2) για να εξετασθεί η αλλαγή στο FEV % pred σε μία ομάδα ασθενών με ΧΑΠ το χειμώνα σε σχέση με το καλοκαίρι. Η σύγκριση 2 ποιοτικών μεταβλητών με >2 ομάδες 3) για να συγκρίνουμε τα ποσοστά των γυναικών που έπαιρναν το αντισυλληπτικό χάπι, σε ομάδα γυναικών με καρκίνο της μήτρας και μια ομάδα υγιών γυναικών από τον γενικό πληθυσμό. 33 ΠΑΡΑΔΕΙΓΜΑ 6. Το επίπεδο παχυσαρκίας των παιδιών ανάλογα με την ηλικιακή τους ομάδα Crosstab cole ΣΗΜΕΙΩΣΕΙΣ 1) Ο έλεγχος Χ 2 χρησιμοποιείται μόνο όταν οι αριθμοί στα κελιά είναι συχνότητες και όχι όταν είναι ποσοστά ή μέσες τιμές. Normal weight Overweight Obese Total age4gps <=7 Count 37 6 4 47 Expected Count 31,9 11,1 4,0 47,0 8-10 Count 24 13 7 44 Expected Count 29,9 10,4 3,8 44,0 11-12 Count 29 13 2 44 Expected Count 29,9 10,4 3,8 44,0 >12 Count 37 12 3 52 Expected Count 35,3 12,2 4,4 52,0 Total Count 127 44 16 187 Expected Count 127,0 44,0 16,0 187,0 Chi-Square Tests Value df Asymp. (2-sided) Sig. 2) Ο έλεγχος Χ 2 δεν είναι έγκυρος σε Α επί Β πίνακα όταν >20% των κελιών έχουν αναμενόμενη συχνότητα <5. Επίσης συνίσταται να μην υπάρχει κελί με αναμενόμενη συχνότητα <1. Αν δεν τηρούνται οι προϋποθέσεις, προτείνεται η συγχώνευση κατηγοριών. 3) Όταν οι μεταβλητές είναι διαβαθμιζόμενες μπορεί να εφαρμοστεί ο έλεγχος γραμμικής τάσης χ 2. Προϋπόθεση = μέγεθος δείγματος > 30. Pearson Chi-Square 9,825 a 6,132 Likelihood Ratio 9,898 6,129 Linear-by-Linear Association,041 1,839 N of Valid Cases 187 a. 4 cells (33,3%) have expected count less than 5. The minimum expected count is 3,76. 35 36 6

Διάστημα εμπιστοσύνης για 1 αναλογία Αν το n είναι αρκετά μεγάλο και το p δεν είναι κοντά στο 0 ή στο 1, τότε το κατά προσέγγιση 95% ΔΕ είναι Συνήθως λέμε ότι χρειαζόμαστε np>5 και n(1-p)>5 ΠΑΡΑΔΕΙΓΜΑ 7. Σε ένα δείγμα 133 τραπεζικών υπαλλήλων, οι 77 ήταν καπνιστές. Εδώ, p=77/133=0,58 και SE= (0,58(1-0,58)/133)=0,042. Οπότε το 95% Δ.Ε. για το ποσοστό των καπνιστών στο πληθυσμό (των τραπεζικών υπαλλήλων) είναι από 0,58-(1,96*0,042) έως 0,58+(1,96*0,042). Δηλαδή από 50% έως 66%. 38 ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ Όταν το δείγμα είναι μικρό ή το p είναι κοντά στο 0 ή στο 1, τότε η μέθοδος δεν είναι εφαρμόσιμη και τα Δ.Ε. υπολογίζονται με τις ακριβείς πιθανότητες της δυωνυμικής κατανομής. ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΤΕΧΝΙΚΕΣ ΑΝΑΛΥΣΗΣ ΠΟΙΟΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ (συνέχεια) Σύγκριση κινδύνων ΠΑΡΑΔΕΙΓΜΑ 8. Μια δημοσίευση όπου εφαρμόστηκε η κανονική προσέγγιση αλλά δεν θα έπρεπε να είχε εφαρμοστεί (από τον Bland σελ 128). Οι Turnbull et al (1992) μελέτησαν τον επιπολασμό του HIV σε πρώην φυλακισμένους. Βρήκαν ότι 1 από 29 γυναίκες που δεν έκαναν ενέσεις ναρκωτικών ήταν HIV θετική και ανάφεραν ότι ο επιπολασμός ήταν 3,4% με 95% ΔΕ από 3,1% έως 9,9%. Αδύνατον! Το σωστό ΔΕ υπολογίστηκε με τις πιθανότητες της διωνυμικής κατανομής να είναι από 0,1% έως 17,8%. 39 Ορισμός: ΣΚ και OR. Εκτίμηση κινδύνων σε προοπτικές μελέτες Εκτίμηση κινδύνων σε μελέτες ασθενών μαρτύρων Σχέση OR και ΣΚ Πότε είναι κατάλληλο μέτρο ο OR; ΣΥΓΚΡΙΣΗ ΚΙΝΔΥΝΩΝ Το ερώτημα: Θέλουμε να ερευνήσουμε τη σχέση μεταξύ της ύπαρξης (ή μη-) κάποιας «έκθεσης» και της ανάπτυξης κάποιας νόσου. Τα δεδομένα είναι ποιοτικά. Θα μπορούσαν να εφαρμοστούν οι τεχνικές που ήδη συζητήθηκαν. Όμως, ανάλογα με το σχεδιασμό της μελέτης, θεωρείται πιο χρήσιμη η σύγκριση των αναλογιών με λόγους (ratios) απ ότι ο υπολογισμός των διαφορών. π.χ. ο σχετικός κίνδυνος (ΣΚ) ή ο σχετικός λόγος «Odds Ratio» (OR) Ο «κίνδυνος» κάποιου γεγονότος είναι η πιθανότητα ότι το γεγονός θα συμβεί σε ορισμένο χρονικό διάστημα. Γενική μορφή των αποτελεσμάτων μιας προοπτικής μελέτης (prospective study) σε 2 x 2 πίνακα. Νόσος (D) Παράγοντας (Έκθεση =E) + - Σύνολο + a b a+b - c d c+d Σύνολο a+c b+d n ΣΗΜΕΙΩΣΗ Ο Τριχόπουλος έχει την αντίθετη διάταξη (Ε x D) στη σελ. 73 (αλλά την παρούσα στη σελ 77). 41 Ο κίνδυνος ότι θα αναπτυχθεί η νόσος στο χρονικό διάστημα που έχει οριστεί είναι a/(a+c) για την εκτεθειμένη ομάδα και b/(b+d) για τη μη-εκτεθειμένη. 42 7

Νόσος (D) Έκθεση =E + - + a b a+b - c d c+d a+c b+d n Σε μια προοπτική μελέτη, ο λόγος των κινδύνων ονομάζεται σχετικός κίνδυνος (ΣΚ), relative risk) ΣΚ Τιμές από 0 έως. Νόσος (D) Έκθεση =E + - + a b a+b - c d c+d Odds ratio of disease (Σχετικός λόγος συμπληρωματικών πιθανοτήτων) a+c b+d n ΣΚ=1 σημαίνει έλλειψη σχέσης. Αν ΣΚ>1 τότε ο παράγοντας σχετίζεται θετικά με το νόσημα. Δηλαδή ο παράγοντας είναι επιβαρυντικός. Αν ΣΚ<1 τότε ο παράγοντας προστατεύει από το νόσημα. 43 Τιμές από 0 έως. ψ=1 σημαίνει έλλειψη σχέσης. 44 Γιατί λέγεται «odds ratio» δηλαδή «λόγος των odds» ; Ουσιαστικά o odds ενός ενδεχομένου είναι η πιθανότητα ότι συμβαίνει το ενδεχόμενο (p) δια την πιθανότητα ότι δε συμβαίνει (1-p). Το να φέρεις 6άρι: Πιθ 1/6 προς Πιθ 5/6, δηλαδή Νόσος (D) Έκθεση =E + - + a b a+b - c d c+d a+c b+d n Σημείωση: Ένα τρίτο πιθανό μέτρο είναι η διαφορά του κινδύνου μεταξύ των εκτεθειμένων και μη- ατόμων. Δηλαδή, το odds δεν είναι πιθανότητα. Λέμε the odds in favour of having the disease are odds ratio (OR) = odds 1 /odds 2 Μπορεί να γίνει έλεγχος Χ 2 για τη σύγκριση των αναλογιών. BMJ 2000; 320:1468 The odds ratio. J M Bland, D G Altman, 45 46 Εκτίμηση κινδύνων σε προοπτικές μελέτες Σε μια προοπτική μελέτη μπορεί να εκτιμηθεί ο σχετικός κίνδυνος ανάπτυξης κάποιας νόσου. Προοπτική μελέτη (prospective study) Έκθεση; Νόσος; - μελέτη παρατήρησης (observational study). Όπως αυτή στο Παράδειγμα 7. - κλινική δοκιμή (clinical trial). Εδώ τυχαιοποιούμε τον παράγοντα που ενδιαφέρει. Όπως στο Παράδειγμα 6. 48 8

ΠΑΡΑΔΕΙΓΜΑ 6. Αντιοξειδωτικά συμπληρώματα διατροφής και ο κίνδυνος ανάπτυξης Kwashiorkor. (H Ciliberto et al, BMJ 2005). Δείγμα 2372 παιδιών ηλικίας 12-48 μηνών στο Malawi. Τυχαιοποίηση σε 2 ομάδες: η μία έλαβε συμπληρωματικό δισκίο διατροφής με αντιοξειδωτικά, η άλλη μόνο placebo. Διαφέρει ο κίνδυνος ανάπτυξης της νόσου ανάλογα με το εάν πάρθηκε η όχι το συμπλήρωμα; Kwashiorkor (oedema) Συμπλήρωμα διατροφής Σύνολο 39 23 62 1145 1165 2310 Σύνολο 1184 1188 2372 FIXED COLUMN TOTALS 49 Μπορεί να γίνει έλεγχος Χ 2 για τη σύγκριση των αναλογιών. Χ 2 =4.30 με 1 β.ε. p=0.038 Θα μπορούσε επίσης να υπολογιστεί ο «σχετικός κίνδυνος (ΣΚ)» (relative risk), δηλαδή ο αυξημένος κίνδυνος της μιας ομάδας σε σχέση με της άλλης, ως εξής: 39 από τα 1184 παιδιά που παίρνουν το συμπλήρωμα αναπτύσσουν τη νόσο (3,29%) ενώ 25 από τα 1188 παιδιά που δεν παίρνουν το συμπλήρωμα αναπτύσσουν τη νόσο (1,94%). Ο ΣΚ= 3,29 / 1,94 = 1,70. Δηλαδή τα παιδιά που παίρνουν το συμπλήρωμα διατρέχουν ένα κίνδυνο ανάπτυξης της νόσου που είναι περίπου 1,7 φορές μεγαλύτερος από τον κίνδυνο των παιδιών που δεν παίρνουν συμπλήρωμα! 50 «Πώς ξέρουμε πόσο ακριβής είναι η εκτίμηση του ΣΚ;» Μπορούμε να δημιουργήσουμε ανάλογα διαστήματα εμπιστοσύνης (ΔΕ) {λεπτομέρειες στις αναλυτικές σημειώσεις}. Τιμή ΣΚ=1 σημαίνει ότι ο κίνδυνος είναι ίδιος στις 2 ομάδες. Aν το ΔΕ δεν συμπεριλαμβάνει τη μονάδα, λέμε ότι υπάρχει αυξημένος κίνδυνος στη μία ομάδα. 51 ΔΕ για το ΣΚ στο Παράδειγμα 6. Έχουμε ΣΚ 1,70. Το 95% ΔΕ είναι από 1,02 έως 2,83. Οπότε έχουμε 95% σιγουριά ότι ο κίνδυνος για kwashiorkor είναι υψηλότερος στην ομάδα που έλαβε το συμπλήρωμα. Έχουμε 95% σιγουριά ότι ο κίνδυνος για kwashiorkor κυμαίνεται από 1,02 έως 2,83 φορές τον κίνδυνο της ομάδας που δεν έλαβε το συμπλήρωμα. Οι συγγραφείς βρήκαν ΔΕ από 0,98 έως 2,42 (λαμβάνουν υπ όψιν την ηλικία και διάφορες σωματομετρήσεις στη στατιστική ανάλυση). 52 ΠΑΡΑΔΕΙΓΜΑ 7. Κατανάλωση καφέ και κίνδυνος ανάπτυξης καρκίνου του ήπατος (T Shimazu et al, IJC, 2005). Πρόσφατη προοπτική μελέτη στην Ιαπωνία είχε ως σκοπό τη διερεύνηση του κινδύνου του καρκίνου του ήπατος σε σχέση με την κατανάλωση καφέ. Συμμετείχαν περίπου 51.000 άτομα ηλικίας άνω των 40 ετών. Παρακολούθηση για 5-7 χρόνια για την εμφάνιση καρκίνου του ήπατος. 117 περιπτώσεις. Αποτελέσματα: RR (95% CI) of liver cancer for subjects drinking coffee never, occasionally and 1 or more cups/day were 1.00 (Reference), 0.71 (0.46-1.09) and 0.58 (0.36-0.96) respectively. Ο ΣΚ (95% ΔΕ) του καρκίνου του ήπατος σε άτομα που δεν έπιναν καφέ ποτέ, έπιναν περιστασιακά ή έπιναν τουλάχιστον 1 φλιτζάνι ημερησίως ήταν 1,00 (επίπεδο αναφοράς), 0,71 (0,46-1,09) and 0,58 (0,36-0,96) Σχετικός κίνδυνος απόλυτος κίνδυνος Όταν εκτιμάμε τον ΣΚ, δεν πρέπει να αγνοούμε και τον απόλυτο κίνδυνο (absolute risk). Όταν η νόσος είναι σπάνιο γεγονός, τότε μπορεί ο κίνδυνος να τριπλασιάζετε (π.χ.) αλλά η απόλυτη διαφορά να μην είναι μεγάλη. π.χ. Μπορεί ο ΣΚ μιας νόσου να είναι 25 για τους άνδρες σε σχέση με τις γυναίκες (πολύ μεγάλος ΣΚ) αλλά τα ποσοστά των ανδρών και γυναικών που παθαίνουν τη νόσο να είναι μόνο 5% και 0,2% αντίστοιχα. Women over 50 told : «Mammography screening reduces the risk of dying from breast cancer by 25% But the absolute risk reduction is 1 in 1000. Of 1000 women who undergo mammography, 3 will die from BC whereas of 1000 women who do not undergo mammography about 4 will die (in the next ten years). Gigerenzer G & Edwards BMJ 2003 αντίστοιχα. 53 54 9

Μπορεί να έχουμε μια αναδρομική μελέτη case-control, δηλαδή μια μελέτη όπου επιλέγουμε άτομα με και χωρίς τη νόσο και ερευνούμε αν ήταν εκτεθειμένα η όχι. Εκτίμηση κινδύνων σε μελέτες ασθενών μαρτύρων Αναδροµική µελέτη (retrospective study) Έκθεση; Νόσος 56 ΠΑΡΑΔΕΙΓΜΑ 8. Κοινωνική επαφή και ανάπτυξη λευχαιμίας (C Gilham et al, BMJ, 2005). Δείγμα 1272 παιδιών με διάγνωση οξείας lymphoblastic leukaemia και 6238 παιδιών χωρίς λευχαιμία (2-5 ετών). Ερωτήθηκαν για τις κοινωνικές τους επαφές στο 1 ο έτος της ζωής τους. Λευχαιμία «social activity» Σύνολο 1020 252 1272 5343 895 6238 Σύνολο 6363 1147 7510 Στη μελέτη ασθενών-μαρτύρων ο ΣΚ δεν μπορεί να υπολογιστεί διότι οι «αναλογίες που αναπτύσσουν τη νόσο» εξαρτώνται από την αναλογία cases προς controls (ασθενών προς ελέγχους) που 57 επιλέγουμε στην αρχή της μελέτης. Λευχαιμία «social activity» Σύνολ ο 1020 252 1272 5343 895 6238 Σύνολο 6363 1147 7510 «Κίνδυνος» = 1020/6363 (16%) για παιδιά με κοινωνικές επαφές και 252/1147 (22%) για παιδιά χωρίς επαφές. «ΣΚ=0,73» Λευχαιμία «social activity» Σύνολ ο 1020 252 1272 1336 224 1560 Με (υποθετική) επιλογή του ¼ των παιδιών χωρίς λευχαιμία. Σύνολο 2356 476 2832 «Κίνδυνος» = 1020/2356 (43%) για παιδιά με κοινωνικές επαφές και 252/476 (53%) για παιδιά χωρίς επαφές! «ΣΚ=0,82» Ο ΣΚ έχει αλλάξει! 58 Σε case-control μελέτες, υπολογίζουμε το «odds ratio» («σχετικό λόγο») ως ad/bc. Νόσος (D) ad/bc = 1020 x 895 / (252 x 5343) = 0,68 Έκθεση =E + - + a b a+b - c d c+d a+c b+d n Θεωρούμε ότι ο OR είναι καλή εκτίμηση του ΣΚ, και λέμε ότι ο κίνδυνος ανάπτυξης λευχαιμίας είναι κατά 32% μειωμένος σε παιδιά με κοινωνική επαφή σε σχέση με τα παιδιά χωρίς κοινωνική επαφή. «Πώς ξέρουμε πόσο ακριβής είναι η εκτίμηση του OR;» Μπορούμε να δημιουργήσουμε ανάλογα διαστήματα εμπιστοσύνης (ΔΕ) {λεπτομέρειες στις αναλυτικές σημειώσεις}. Τιμή OR=1 σημαίνει ότι ο κίνδυνος είναι ίδιος στις 2 ομάδες. Aν το ΔΕ δεν συμπεριλαμβάνει τη μονάδα, λέμε ότι υπάρχει αυξημένος κίνδυνος στη μία ομάδα. [με τα 2832 παιδιά, OR= 1020 x 224 / (252 x 1336) = 0,68] 59 60 10

ΔΕ για τον OR στο Παράδειγμα 8. OR= 0,68. Το 95% ΔΕ είναι από 0,58 έως 0,79. (ο τύπος διαφέρει από τον τύπο για το ΔΕ του ΣΚ). Έχουμε 95% σιγουριά ότι ο κίνδυνος (ο odds) για λευχαιμία σε παιδιά με κοινωνική επαφή κυμαίνεται από 0,58 έως 0,79 φορές τον κίνδυνο της ομάδας που δεν είχαν κοινωνική επαφή στο 1 ο έτος της ζωής τους. Σχέση OR και ΣΚ «Πότε μπορούμε να θεωρήσουμε ότι ο OR είναι καλή εκτίμηση του ΣΚ;» 61 Σε μια μελέτη ασθενών-μαρτύρων θεωρούμε ότι ο OR είναι ικανοποιητική εκτίμηση του ΣΚ όταν η νόσος είναι σπάνια π.χ. <10% στον πληθυσμό. Αν η νόσος είναι σπάνια, τότε a μικρό σε σχέση με c, b μικρό σε σχέση με d σε πίνακα προοπτικής μελέτης, οπότε ψ ΣΚ Νόσος (D) Παράγοντας (Έκθεση =E) + - + a b a+b - c d c+d a+c b+d n ΣΚ συχνότητα της νόσου = 1% ψ 63 http://www.jr2.ox.ac.uk/bandolier/band25/b25-61.gif 64 Ο ΣΚ και ο OR είναι παρόμοιοι τρόποι για την εκτίμηση της σχέσης 2 δυαδικών μεταβλητών. Ο ΣΚ έχει πιο εύκολη ερμηνεία αλλά το OR έχει μαθηματικές ιδιότητες που το κάνουν πιο εύχρηστο για στατιστικές αναλύσεις. π.χ. Ο OR δεν αλλάζει αν αλλάξουμε τις θέσεις των γραμμών και στηλών ενός πίνακα (ο ΣΚ αλλάζει). Αν αλλάξουν μόνο οι θέσεις των στηλών, τότε η εκτίμηση του OR είναι η ακριβώς αντίστροφη. Πότε είναι κατάλληλο μέτρο ο OR; 65 11

Ο OR μπορεί να μας δώσει μια εκτίμηση της σχέσης μεταξύ δύο δυαδικών μεταβλητών. Όμως για να εκτιμηθεί κάποιος σχετικός κίνδυνος, ο OR μπορεί να χρησιμοποιηθεί μόνο όταν πρόκειται για μελέτη ασθενών-μαρτύρων με χαμηλό επιπολασμό της νόσου. Συχνά στην ιατρική βιβλιογραφία τα OR ερμηνεύονται σαν να είναι ΣΚ, όταν αυτό δεν δικαιολογείται (WL Holcomb et al, O&G, 2001). Πρόσφατα δημοσιεύματα (JJ Deeks et al, BMJ letter, 1998, DL Sackett et al, EvBasedMed 1996, DAG Grimes & KF Schulz, O&G, 2008) συνιστούν τη χρήση των OR μόνο α) σε μελέτες ασθενών-μαρτύρων ή Β) όταν η κατάλληλη ανάλυση είναι η λογιστική παλινδρόμηση. Πολύ συχνά ο OR ερμηνεύεται σαν αύξηση/μείωση του κινδύνου (risk) όταν λόγω του σχεδιασμού της μελέτης, ουσιαστικά δεν εκτιμάει το σχετικό κίνδυνο. 67 68 ΣΥΝΟΨΗ: ΣΥΓΚΡΙΣΗ ΚΙΝΔΥΝΩΝ Συνήθως, οι ερευνητές θέλουν να λάβουν υπ όψιν τους κι άλλους παράγοντες σε μια ανάλυση κινδύνου (π.χ. Ηλικία, φύλο κά) και χρησιμοποιούν την κατάλληλη πολυμετάβλητη μέθοδο. Προοπτική μελέτη π.χ. cohort study ή κλινική δοκιμή Η case-control μελέτη - αναδρομική μελέτη Για εκτιμήσεις του OR, λογιστική παλινδρόμηση. Για εκτιμήσεις του RR, τεχνικές ανάλυσης επιβίωσης (π.χ. μοντέλο ΑΚ του Cox). Σχετικός κίνδυνος (ΣΚ) Odds Ratio (OR) Ο λόγος OR προσεγγίζει τον ΣΚ όταν η νόσος είναι σπάνια. 69 70 Καλύπτοντας την ενότητα «Ανάλυση Ποιοτικών Δεδομένων», ο σκοπός είναι να - γνωρίζετε ότι δύο αναλογίες μπορούν να συγκριθούν με τον έλεγχο Χ 2 του Pearson και υπολογίζοντας το ΔΕ της διαφοράς των αναλογιών. - γνωρίζετε ποια είναι η υπόθεση που ερευνούμε όταν εφαρμόζουμε έναν έλεγχο Χ 2 του Pearson σε έναν διαξονικό πίνακα, τι αντιπροσωπεύουν οι αναμενόμενες συχνότητες, και πώς τις υπολογίζουμε στον έλεγχο Χ 2. - γνωρίζετε κάτω από ποιες συνθήκες πρέπει να εφαρμόζεται ο ακριβής έλεγχος του Fisher. - γνωρίζετε ότι όταν οι ποιοτικές παρατηρήσεις είναι κατά ζεύγη, ο κατάλληλος έλεγχος είναι ο έλεγχος του McNemar. - μπορείτε να ερμηνεύσετε τα αποτελέσματα μιας έρευνας όπου συγκρίνονται δύο (ή περισσότερες) ομάδες όσον αφορά κάποιο ποιοτικό τους χαρακτηριστικό. - μπορείτε να ερμηνεύσετε αποτελέσματα από μελέτες σύγκρισης κινδύνων (OR, RR). 71 12