ΑΝΑΛΥΣΗ ΠΟΙΟΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ: Συγκρίσεις μεταξύ ομάδων. Η σύγκριση 2 ποιοτικών μεταβλητών με >2 ομάδες.

Σχετικά έγγραφα
Ποιοτικά. Ονομαστικά Διαβήτης τύπου Ι/ τύπου ΙΙ/ μηδιαβητικός

Μεθοδολογία της Έρευνας και Εφαρμοσμένη Στατιστική

Για να ελέγξουµε αν η κατανοµή µιας µεταβλητής είναι συµβατή µε την κανονική εφαρµόζουµε το test Kolmogorov-Smirnov.

Έλεγχος ανεξαρτησίας μεταξύ δύο ποιοτικών μεταβλητών (Crosstabs - Chi-Square Tests)

Στατιστική και Θεωρία Πιθανοτήτων (ΓΓ04) ΑΝΤΩΝΙΟΣ ΧΡ. ΜΠΟΥΡΑΣ Εαρινό Εξάμηνο

Μαντζούνη, Πιπερίγκου, Χατζή. ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 5 ο

ΠΕΡΙΓΡΑΦΙΚΗ και ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

4. Ανάλυση ποιοτικών δεδοµένων: συγκρίσεις µεταξύ οµάδων.

Μεθοδολογία των επιστημών του Ανθρώπου: Στατιστική Ι

Μενύχτα, Πιπερίγκου, Σαββάτης. ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 5 ο

ΕΚΠΑΙΔΕΥΤΙΚΗ ΤΕΧΝΟΛΟΓΙΑ ΚΑΙ ΑΝΑΠΤΥΞΗ ΑΝΘΡΩΠΙΝΩΝ ΠΟΡΩΝ

Υ: Νόσος. Χ: Παράγοντας Κινδύνου 1 (Ασθενής) 2 (Υγιής) Σύνολο. 1 (Παρόν) n 11 n 12 n 1. 2 (Απών) n 21 n 22 n 2. Σύνολο n.1 n.2 n..

ΚΟΙΝΩΝΙΟΒΙΟΛΟΓΙΑ, ΝΕΥΡΟΕΠΙΣΤΗΜΕΣ ΚΑΙ ΕΚΠΑΙΔΕΥΣΗ

Στόχος µαθήµατος: Παράδειγµα 1: µελέτη ασθενών-µαρτύρων ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΙΙ

Υ: Νόσος. Χ: Παράγοντας Κινδύνου 1 (Ασθενής) 2 (Υγιής) Σύνολο. 1 (Παρόν) n 11 n 12 n 1. 2 (Απών) n 21 n 22 n 2. Σύνολο n.1 n.2 n..

Ασκήσεις Εξετάσεων. Μεταπτυχιακό Πρόγραμμα Σπουδών στη. Διοίκηση των Επιχειρήσεων

StatXact ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΙΙ. StatXact. ΜΑΘΗΜΑ 5 ΕΡΓΑΣΤΗΡΙΟ 1 - συνέχεια ΜΕΤΡΑ ΚΙΝ ΥΝΟΥ & ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ ΜΕ ΤΗΝ ΧΡΗΣΗ StatXact

Συνάφεια μεταξύ ποιοτικών μεταβλητών. Εκδ. #3,

ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Δρ. Βασίλης Π. Αγγελίδης Τμήμα Μηχανικών Παραγωγής & Διοίκησης Δημοκρίτειο Πανεπιστήμιο Θράκης

ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ

Αναλυτική Στατιστική

Ποιοτική και ποσοτική ανάλυση ιατρικών δεδομένων

τατιστική στην Εκπαίδευση II

Κεφάλαιο 16. Σύγκριση συχνοτήτων κατηγοριών: το στατιστικό κριτήριο χ 2. Προϋποθέσεις για τη χρήση του τεστ. ιαφορές ή συσχέτιση.

Σκοπός του μαθήματος. Έλεγχος μηδενικής υπόθεσης OR-RR. Έλεγχος μηδενικής υπόθεσης. Σφάλαμα τύπου Ι -Σφάλμα τύπου ΙΙ 20/4/2013

Μη Παραμετρικοί Έλεγχοι & Η Δοκιμασία Χ 2

Τεκµηριωµένη Ιατρική ΒΛΑΒΗ. Βασίλης Κ. Λιακόπουλος Λέκτορας Νεφρολογίας ΑΠΘ

Στατιστικοί Έλεγχοι Υποθέσεων. Σαλαντή Γεωργία Εργαστήριο Υγιεινής και Επιδημιολογίας Ιατρική Σχολή

Περιγραφική Ανάλυση ποσοτικών μεταβλητών

ΤΕΙ ΗΠΕΙΡΟΥ ΣΧΟΛΗ ΕΠΑΓΓΕΛΜΑΤΩΝ ΥΓΕΙΑΣ ΚΑΙ ΠΡΟΝΟΙΑΣ ΤΜΗΜΑ ΛΟΓΟΘΕΡΑΠΕΙΑΣ. Μεγγίσογλου Ευθυμία Ξενογιώργη Αικατερίνη Σβολιανίτη Χριστίνα

Κλινική Επιδηµιολογία. Μέτρα κινδύνου Αιτιολογική συσχέτιση

Συγγραφή και κριτική ανάλυση επιδημιολογικής εργασίας

ΑΝΑΛΥΣΗ Ε ΟΜΕΝΩΝ. 3. Στατιστική Συµπερασµατολογία για ποιοτικές µεταβλητές

«ΘΥΜΑΤΟΠΟΙΗΣΗ ΚΑΙ ΦΟΒΟΣ ΤΟΥ ΕΓΚΛΗΜΑΤΟΣ ΣΤΟ ΔΙΑΔΙΚΤΥΟ»

Ιατρικά Μαθηματικά & Βιοστατιστική

Σπουδαστές Γιαννουλάκης Αντρέας Α.Μ Τσουρουνάκης 'Αγγελος Α.Μ Μουτουσίδου Πόπη Α.Μ Εισηγητής: Ταφιάδης Χρ.

Επιδημιολογία 3 ΣΧΕΔΙΑΣΜΟΣ ΜΕΛΕΤΩΝ. Ροβίθης Μ. 2006

Στατιστικοί έλεγχοι του Χ 2

Εισαγωγή στη Στατιστική

ΛΟΓΙΣΤΙΚΗ ΕΞΑΡΤΗΣΗ. Πρώτα θα δούμε την επίδραση των παραπάνω παραγόντων με διμεταβλητή ανάλυση: Variables in the Equation

Κλινική Επιδηµιολογία

Κεφάλαιο 15 Έλεγχοι χ-τετράγωνο

ΣΧΕΣΗ ΜΕΤΑΞΥ ΠΟΙΟΤΙΚΩΝ ΜΕΤΑΒΛΗΤΩΝ

Επιδημιολογία. Είδη υπό-μελέτη πληθυσμών. Ο ορισμός του υπό-μελέτη πληθυσμού ΜΕΤΡΗΣΗ ΚΑΙ ΣΥΓΚΡΙΣΗ ΤΗΣ ΣΥΧΝΟΤΗΤΑΣ ΤΩΝ ΝΟΣΗΜΑΤΩΝ

Μέτρα σχέσης. Ιωάννα Τζουλάκη Λέκτορας Επιδημιολογίας Υγιεινή και Επιδημιολογία

τατιστική στην Εκπαίδευση II

χ 2 test ανεξαρτησίας

Στατιστικές Υποθέσεις

Βοήθημα Εξετάσεων. Μεταπτυχιακό Πρόγραμμα Σπουδών στη Διοίκηση των Επιχειρήσεων

ΕΡΓΑΣΤΗΡΙΟ ΣΤΑΤΙΣΤΙΚΗΣ

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

Έλεγχος καλής προσαρμογής για μια ποιοτική μεταβλητή (Nonparametric Tests Chi-Square)

ΤΕΙ Αθήνας Μεθοδολογία της έρευνας και Ιατρική στατιστική

Ενότητα 6 η :Επαγωγική Στατιστική Ι. Ανάλυση δύο μεταβλητών. Δημήτριος Σταμοβλάσης Φιλοσοφίας Παιδαγωγικής ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

ΕΚΠΑΙΔΕΥΤΙΚΗ ΕΡΕΥΝΑ 1. ΜΕΡΟΣ Α - ΕΡΕΥΝΑ ΑΠΟΣΑΦΗΝΙΣΗ ΠΕΔΙΟΥ 2. ΜΕΡΟΣ Β ΣΧΕΔΙΑΣΜΟΣ - ΜΕΘΟΔΟΛΟΓΙΑ ΕΡΕΥΝΑΣ 3. ΜΕΡΟΣ Γ ΑΝΑΛΥΣΗ-ΕΠΕΞΕΡΓΑΣΙΑ ΕΡΩΤΗΜΑΤΟΛΟΓΙΟΥ

Ενότητα 2: Έλεγχοι Υποθέσεων Διαστήματα Εμπιστοσύνης


ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

Λογαριθμικά Γραμμικά Μοντέλα Poisson Παλινδρόμηση Παράδειγμα στο SPSS

Μπεττίνα Χάιδιτς. Επίκουρη Καθηγήτρια Υγιεινής Ιατρικής Στατιστικής e mail:

Μελέτες ασθενών οµάδας ελέγχου

Μελέτες αναλυτικής επιδημιολογίας στηδιερεύνησηεπιδημιών

1991 US Social Survey.sav

Ερώτηση. Ποιο μέτρο συχνότητας υπολογίστηκε;

Λογαριθµιστική εξάρτηση

σ = και σ = 4 αντιστοίχως. Τότε θα ισχύει

ΜΕΡΟΣ Α Κάθε µια από τις παρακάτω φράσεις (1α, 1β, 1γ, 2α κτλ) µπορεί να είναι σωστή ή λανθασµένη. Ποιες είναι σωστές και ποιες όχι;

ΑΝΤΙΚΕΙΜΕΝΟ ΜΑΘΗΜΑΤΟΣ

Η ΣΤΑΤΙΣΤΙΚΗ ΣΤΟ ΕΡΓΑΣΤΗΡΙΟ ΣΠΕΡΜΑΤΟΣ

Μεθοδολογία των Επιστημών του Ανθρώπου: Στατιστική

ΣΤΟΧΟΙ ΤΗΣ ΕΝΟΤΗΤΑΣ ΒΑΣΙΚΑ ΣΤΟΙΧΕΙΑ ΜΗ ΠΑΡΑΜΕΤΡΙΚΩΝ ΕΛΕΓΧΩΝ

Ερώτηση. Ποιο μέτρο συχνότητας υπολογίστηκε;

Εισαγωγή στην Ανάλυση Δεδομένων

Έρευνες ασθενών-μαρτύρων. Αναδρομικές. Case-control studies (retrospective) (case-control studies) Προοπτικές μελέτες

Πίνακας 1. Επίπεδα PRAME mrna (αντίγραφα/ κύτταρα) σε άτοµα σε διαφορετικές φάσεις της CML. n Ελάχιστη-µέγιστη

Media Monitoring. Ενότητα 7: Εισαγωγή & Ανάλυση δεδομένων με το SPSS. Σταμάτης Πουλακιδάκος Σχολή ΟΠΕ Τμήμα ΕΜΜΕ

ΣΥΣΧΕΤΙΣΗ. Το διάγραμμα διασποράς ΕΙΣΑΓΩΓΗ

Λειτουργικός ορισμός των μεταβλητών

ΠΕΡΙΓΡΑΦΙΚΗ και ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

Εισαγωγή στη Βιοστατιστική

Ανάλυση επιβίωσης (survival analysis)

Στόχος µαθήµατος: ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΙΙ. Α1.2 Παράδειγµα 1 (συνέχεια) Α1. ΙΤΙΜΕΣ ΚΑΤΗΓΟΡΙΚΕΣ ΜΕΤΑΒΛΗΤΕΣ ΣΕ ΕΞΑΡΤΗΜΕΝΑ ΕΙΓΜΑΤΑ Παράδειγµα 1: αρτηριακή πίεση

Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης

ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΧΤΑ ΑΚΑΔΗΜΑΙΚΑ ΜΑΘΗΜΑΤΑ. Στατιστική. 7 ο Μάθημα: Ο Έλεγχος Χ 2. Γεώργιος Μενεξές Τμήμα Γεωπονίας

ΜΑΘΗΜΑ ΕΠΙΔΗΜΙΟΛΟΓΙΑΣ

Έλεγχος ύπαρξης στατιστικά σημαντικών διαφορών μεταξύ δύο εξαρτημένων δειγμάτων, που δεν ακολουθούν την κανονική κατανομή (Wilcoxon test)

ΠΕΡΙΓΡΑΦΙΚΗ και ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

ΛΥΣΕΙΣ ΑΣΚΗΣΕΩΝ

Αντικείμενο των επιδημιολογικών μελετών

6 ο ΜΑΘΗΜΑ Έλεγχοι Υποθέσεων

Ποσοτικές Μέθοδοι Ανάλυσης στις Κοινωνικές Επιστήμες

Μελέτες αναλυτικής επιδημιολογίας στηδιερεύνησηεπιδημιών

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS)

Πινάκες συνάφειας. Βαρύτητα συμπτωμάτων. Φύλο Χαμηλή Υψηλή. Άνδρες. Γυναίκες

Στατιστικοί έλεγχοι για διακριτά δεδομένα

ΣΥΣΧΕΤΙΣΗ. Διαβάσετε και τις αναλυτικές σημειώσεις.

Στατιστική Ι. Ενότητα 2: Στατιστική Ι (2/4) Αναπλ. Καθηγητής Νικόλαος Σαριαννίδης Τμήμα Διοίκησης Επιχειρήσεων (Κοζάνη)

Κεφάλαιο 10 Εισαγωγή στην Εκτίμηση

Πέτρος Γαλάνης, MPH, PhD Εργαστήριο Οργάνωσης και Αξιολόγησης Υπηρεσιών Υγείας Τμήμα Νοσηλευτικής, Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών

Transcript:

2010-11 4. ΑΝΑΛΥΣΗ ΠΟΙΟΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ: Συγκρίσεις μεταξύ ομάδων Εισαγωγή Διαξονικοί πίνακες συχνοτήτων Μέθοδοι ανάλυσης ερωτήματα Μέθοδοι σύγκρισης 2 ποσοστών Mε ανεξάρτητες ομάδες. Με ομάδες που σχετίζονται. Η σύγκριση 2 ποιοτικών μεταβλητών με >2 ομάδες. Διάστημα εμπιστοσύνης για 1 αναλογία Σύγκριση κινδύνων: OR & RR Διαβάσετε και τις αναλυτικές σημειώσεις.

Εισαγωγή. Παραδείγματα 1. Σχετίζεται η έκθεση με τη νόσο; 2. Σχετίζεται ο πρόωρος τοκετός με τον τόπο διαμονής; 3. Διαφέρουν οι αναλογίες των υπέρβαρων αγοριών στην Ελλάδα στις ηλικίες των 10 και 15 ετών;

Διαξονικοί πίνακες συχνοτήτων Αν θέλουμε να συγκρίνουμε 2 (ή περισσότερες) ομάδες ατόμων όσον αφορά ένα ποιοτικό χαρακτηριστικό τους, μπορούμε να δημιουργήσουμε έναν πίνακα συχνοτήτων όπου το κάθε κελί του πίνακα αντιστοιχεί σε έναν ορισμένο συνδυασμό των χαρακτηριστικών που είναι υπό μελέτη. Ο πίνακας αυτός ονομάζεται πίνακας συνάφειας (contingency table) ή διαξονικός πίνακας συχνοτήτων (two-way table). Όταν η κάθε μεταβλητή είναι δυαδική, τότε ο πίνακας ονομάζεται τετράπτυχος ή 2 επί 2 πίνακας (2 by 2 table).

Εισαγωγή. Ποιοτικά Ονομαστικά Διαβήτης τύπου Ι/ τύπου ΙΙ/ μηδιαβητικός Δεδομένα Διαβαθμιζόμενα Τακτικά Φυσική δραστηριότητα (ελάχιστη/μέτρια /έντονη) Όταν πρόκειται για ποιοτικά δεδομένα, μέλη του δείγματος κατηγοριοποιούνται σε αμοιβαίως εξαιρετέες κλάσεις. Δυαδικά Φύλο Έχει / δεν έχει τη νόσο. 4

Παράδειγμα 1. Διαξονική ταξινόμηση 700 γυναικών ανάλογα με το εάν είχαν πρόωρο τοκετό και κατά περιοχή κατοικίας τους (μηπραγματικά δεδομένα) Συχνότητες Πρόωρος τοκετός ΣΥΝΟΛΟ Ναι Όχι Αγροτική 45 325 370 Αστική 55 275 330 ΣΥΝΟΛΟ 100 600 700 τετράπτυχος ή 2 επί 2 πίνακας 5

Υπάρχει ένας κοινός τρόπος ανάλυσης για τους διαξονικούς πίνακες, συχνοτήτων αλλά στη πράξη η μέθοδος που επιλέγεται διαφέρει ανάλογα με: 1) Το ερευνητικό ερώτημα. 2) Τον αριθμό των κατηγοριών & τον αριθμό των ανεξάρτητων ομάδων. 3) Το είδος των μεταβλητών, δηλαδή αν είναι τακτικές ή όχι. [Όταν οι ομάδες δεν είναι ανεξάρτητες τότε ο τρόπος ανάλυσης διαφέρει] 6

Θα ασχοληθούμε με τις ακόλουθες 3 γενικές καταστάσεις: 1) Υπάρχουν δύο ομάδες ατόμων. Σκοπός είναι να εξετασθεί εάν η αναλογία των ατόμων που έχουν κάποιο χαρακτηριστικό είναι ίδια σε κάθε ομάδα. Έλεγχος Χ 2, έλεγχος του Fisher, έλεγχος Ζ & Δ.Ε. 2) >2 ομάδες ατόμων. Ή αντίστοιχα, μία ομάδα ατόμων ταξινομείται με βάση δυο χαρακτηριστικά. Σκοπός είναι να εξετασθεί εάν τα δύο χαρακτηριστικά σχετίζονται. Έλεγχος Χ 2. 3) Ίδιος σκοπός με το 1), αλλά οι δύο ομάδες σχετίζονται. Π.χ. Το ίδιο άτομο πριν και μετά, το κάθε άτομο «ταιριάζεται» με κάποιο άλλο. Έλεγχος του McNemar.

Μέθοδοι σύγκρισης 2 ποσοστών Mε ανεξάρτητες ομάδες

Παράδειγμα 2. Παρατηρούμενες συχνότητες παχύσαρκων παιδιών ηλικίας 5 ετών ανάλογα με τη διατροφή της μητέρας στο πρώτο τρίμηνο της κύησης {μη-πραγματικά δεδομένα}. Υψηλή σε κορεσμένα λίπη δίαιτα; Ναι Όχι Παχύσαρκο 24 18 42 Μη- παχύσαρκο 56 82 138 ΣΥΝΟΛΟ 80 100 180 ΣΥΝΟΛΟ Τα παρατηρούμενα ποσοστά των παχύσαρκων παιδιών είναι 30% (24/80) στη μια ομάδα και 18% (18/100) στην άλλη. Διαφέρουν οι αναλογίες των παχύσαρκων παιδιών ηλικίας 5 ετών ανάλογα με τη διατροφή της μητέρας στο πρώτο τρίμηνο της κύησης; 9

Παράδειγμα 2 (συν). Η 0 : δεν υπάρχει σχέση (association) μεταξύ της υψηλής πρόσληψης κορεσμένου λίπους στο πρώτο τρίμηνο της εγκυμοσύνης και παχυσαρκίας σε ηλικίας πέντε ετών. Μπορεί να εκφραστεί και ως εξής Η 0 : δεν υπάρχει διαφορά μεταξύ της αναλογίας των παχύσαρκων παιδιών από μητέρες με υψηλή πρόσληψη ενέργειας από κορεσμένο λίπος και της αντίστοιχης αναλογίας από μητέρες που δεν είχαν υψηλή πρόσληψη ενέργειας από κορεσμένο λίπος. Αν οι αναλογίες δεν διαφέρουν, τότε η καλύτερη εκτίμηση της αναλογίας είναι η συνολική αναλογία των παχύσαρκων παιδιών, δηλαδή 42/180, περίπου 23%. Ποια θα ήταν η αναμενόμενη συχνότητα παχύσαρκων παιδιών σε κάθε ομάδα; 10

Παράδειγμα 2 (συν). Από τα 80, θα αναμέναμε τα 80 επί 23%, δηλαδή 19 παιδιά και Από τα 100, θα αναμέναμε 100 επί 23%, δηλαδή 23. Οι αναμενόμενες συχνότητες είναι οι συχνότητες που θα αναμέναμε αν ίσχυε η Η 0. Αναμενόμενες συχνότητες (expected frequencies=e) σε κάθε κελί. ΣΥΝΟΛΟ 80*42/180 100*42/180 42 = 19 =23 80*138/180 100*138/180 138 = 61 =77 ΣΥΝΟΛΟ 80 100 180 11

ΣΥΝΟΛΟ e 11 e 12 R 1 e 21 e 22 R 2 ΣΥΝΟΛΟ C 1 C 2 N Αναμενόμενες συχνότητες e αβ = R α C β /N α = 1,2 β = 1,2. Pearson s chi-squared test statistic X 2 e 2 αβ ) ( o = αβ e αβ αβ Όταν ισχύει η Η 0, το Χ 2 ακολουθεί προσεγγιστικά μια χ 2 κατανομή με 1 β.ε. [Γιατί 1 β.ε.; Γιατί οι 4 αναμενόμενες συχνότητες δεν είναι ανεξάρτητες. Αν γνωρίζουμε τη μία αναμενόμενη συχνότητα μπορούμε να 12 υπολογίσουμε τις άλλες.]

Εδώ X 2 = (24-19) 2 /19 +...+ (82-77) 2 /77 = 3,58. Από Πίνακες, Χ 2 (1, 0,90) =2,71, Χ 2 (1, 0,95) =3,84 => 0,05<p<0,1 Pearson Chi-Square Continuity Correction a Likelihood Ratio Fisher's Exact Test Linear-by-Linear Association N of Valid Cases Chi-Square Tests Asymp. Sig. Value df (2-sided) 3,578 b 1,059 2,938 1,087 3,561 1,059 3,558 1,059 180 a. Computed only for a 2x2 table Exact Sig. (2-sided) Exact Sig. (1-sided),076,044 b. 0 cells (,0%) have expected count less than 5. The minimum expected count is 18,67. Επίπεδο σημαντικότητας α =0,05. Συμπέρασμα: Δεν υπάρχει απόδειξη ότι η υψηλή πρόσληψη ενέργειας από κορεσμένα λιπαρά στην εγκυμοσύνη σχετίζεται με την 13 παχυσαρκία των παιδιών σε ηλικία 5 ετών.

«Διόρθωση για την έλλειψη συνέχειας, του Yates» (Yates continuity correction). Pearson Chi-Square Continuity Correction a Likelihood Ratio Fisher's Exact Test Linear-by-Linear Association N of Valid Cases Chi-Square Tests Asymp. Sig. Value df (2-sided) 3,578 b 1,059 2,938 1,087 3,561 1,059 3,558 1,059 180 a. Computed only for a 2x2 table Exact Sig. (2-sided) Exact Sig. (1-sided),076,044 b. 0 cells (,0%) have expected count less than 5. The minimum expected count is 18,67. Επειδή ο έλεγχος X 2 βασίζεται σε μεθόδους που είναι κατάλληλες για μεγάλα δείγματα (large sample methods), εφαρμόζεται μια «διόρθωση για την έλλειψη συνέχειας» (continuity correction) ειδικά όταν το δείγμα είναι σχετικά μικρό. Χρησιμοποιείται μια συνεχή κατανομή (χ 2 ) για να προσεγγίσει συχνότητες.

O έλεγχος X 2 δεν πρέπει να χρησιμοποιείται όταν υπάρχει κάποιο κελί με αναμενόμενη συχνότητα <5 (σε 2 επί 2 πίνακα). Ο ακριβής έλεγχος του Fisher (Fisher s exact test) είναι κατάλληλος. Pearson Chi-Square Continuity Correction a Likelihood Ratio Fisher's Exact Test Linear-by-Linear Association N of Valid Cases Chi-Square Tests Asymp. Sig. Value df (2-sided) 3,578 b 1,059 2,938 1,087 3,561 1,059 3,558 1,059 180 a. Computed only for a 2x2 table Exact Sig. (2-sided) Exact Sig. (1-sided),076,044 b. 0 cells (,0%) have expected count less than 5. The minimum expected count is 18,67. Εδώ δεν υπάρχει τέτοιο πρόβλημα. [Εάν θέλουμε όμως μπορούμε να παρουσιάσουμε εδώ τα αποτελέσματα του ελέγχου του Fisher αντί για το Χ 2 ].

ΣΗΜΕΙΩΣΕΙΣ 1) Ο έλεγχος Χ 2 χρησιμοποιείται μόνο όταν οι αριθμοί στα κελιά είναι συχνότητες και όχι όταν είναι ποσοστά ή μέσες τιμές. 2) Ο έλεγχος Χ 2 δεν είναι έγκυρος σε 2 επί 2 πίνακα όταν κάποιο κελί έχει αναμενόμενη συχνότητα <5. Τότε, εφαρμόζεται ο ακριβής έλεγχος του Fisher. 3) Ο έλεγχος Χ 2 δεν μας δίνει ΔΕ για το μέγεθος της διαφοράς μεταξύ των 2 αναλογιών. 16

Στο SPSS Analyse Descriptive Statistics Crosstabs... pregobese.sav 17

Όταν δεν υπάρχουν τα raw data αλλά μόνο ο πίνακας συχνοτήτων (π.χ. Σε μία δημοσίευση), πάλι μπορούμε να τρέξουμε την ανάλυση στo SPSS. Στο SPSS Data Weight cases... (by freq) Στο SPSS Analyse Descriptive Statistics Crosstabs... 18

Παράδειγμα 2 (συν). Έλεγχος υπόθεσης Ζ. Θα μπορούσαμε να είχαμε εφαρμόσει έναν έλεγχο της H 0 : π 1 - π 2 =0 με το στατιστικό κριτήριο ελέγχου Ζ που αν ισχύει η Η 0 ακολουθεί μια τυπική κανονική κατανομή. Ζ= (p 1 - p 2) / ΤΣ(p 1 - p 2 ) όπου το Ζ έχει την τυπική κανονική κατανομή (η δειγματοληπτική κατανομή της διαφοράς είναι προσεγγιστικά κανονική). Ζ = 0,12/0,063 =1,89 που αντιστοιχεί σε p=0,058. Αυτός ο έλεγχος μας δίνει ακριβώς τα ίδια αποτελέσματα με το Χ 2. 19

Διαστήματα εμπιστοσύνης για τη σύγκριση 2 αναλογιών {Οι τύποι δεν είναι μέρος της ύλης}

Δ.Ε. για τη διαφορά μεταξύ 2 αναλογιών πληθυσμών όταν ισχύουν οι προϋποθέσεις της κανονικής προσέγγισης (δηλαδή np>5 και n(1-p)>5 στο κάθε δείγμα). Το 95% Δ.Ε. είναι ( p 1 p 2 ) ± 1, 96 p 1 ( 1 n 1 p 1 ) + p 2 ( 1 n 2 p 2 ) ΣΗΜΕΙΩΣΗ Ο τύπος που χρησιμοποιείται για την εκτίμηση του ΤΣ στον αντίστοιχο έλεγχο υπόθεσης (Παράδειγμα 2) διαφέρει από τον παραπάνω (χρησιμοποιείται η «καλύτερη» εκτίμηση της αναλογίας όταν ισχύει η Η0, η οποία είναι r1+ r2 ). pˆ = n 1 + n 2 => Υπάρχει περίπτωση το ΔΕ να μην συμπεριλαμβάνει το 0 και ο έλεγχος υπόθεσης να μη δώσει στατιστικά σημαντικό αποτέλεσμα (και το αντίθετο). 21

Παράδειγμα 2 (συν). Υπολογισμός του ΔΕ της διαφοράς. Ούτε ο έλεγχος Χ 2, ούτε ο έλεγχος Ζ μας δίνει το πιθανό μέγεθος της διαφοράς. Θα μπορούσαμε να είχαμε υπολογίσει ένα ΔΕ για τη πραγματική διαφορά. Το 95% ΔΕ για τη διαφορά μεταξύ των ποσοστών είναι από 0,01 έως 0,25 (ποσοστιαίες μονάδες). Δηλαδή έχουμε 95% σιγουριά ότι το ποσοστό των παχύσαρκών παιδιών κυμαίνεται από μία μονάδα μικρότερο έως 25% μονάδες μεγαλύτερο στην ομάδα των παιδιών των οποίων οι μητέρες είχαν υψηλή σε κορεσμένα λίπη δίαιτα, σε σχέση με αυτά των οποίων οι μητέρες δεν είχαν υψηλή σε κορεσμένα λίπη δίαιτα. Αυτό το ΔΕ βασίζεται στη κανονική προσέγγιση στη διωνυμική κατανομή, οπότε δεν είναι αξιόπιστο όταν τα ποσοστά ή το δείγμα είναι μικρά. 22

ΠΑΡΑΔΕΙΓΜΑ 3. Η αντίδραση σε θεραπεία (καλυτέρευση/ καμία διαφορά) ελέγχθηκε σε 150 ασθενείς οι οποίοι είχαν τυχαία κατανεμηθεί σε μια από δύο θεραπείες (Α και Β). Τα ποσοστά βελτίωσης ήταν p A =0,80 (60/75) και p Β =0,60 (45/75). Εδώ, SE diff = 0,80 0,20 0,60 0,40 = 0,073. + 75 75 Οπότε το 95% Δ.Ε. για τη διαφορά μεταξύ των 2 ποσοστών στους πληθυσμούς είναι από 0,20-(1,96*0,073) έως 0,20+(1,96*0,073). Δηλαδή από 6% έως 34%. Λέμε ότι «έχουμε 95% εμπιστοσύνη ότι το ποσοστό βελτίωσης είναι από 6% έως 34% υψηλότερο με την Α σε σχέση με τη Β θεραπεία». 23

Μέθοδοι σύγκρισης 2 ποσοστών Με ομάδες που σχετίζονται

ΠΑΡΑΔΕΙΓΜΑ 4. Αμυγδαλεκτομή και νόσος του Hodgkin. Το 1972 οι Α Johnson & Β Johnson συλλέξανε δεδομένα για να συγκρίνουν τα ποσοστά των ατόμων που είχαν κάνει αμυγδαλεκτομή, σε μία ομάδα ασθενών με τη νόσο του Hodgkin και μία αντίστοιχη ομάδα ελέγχου. Στον κάθε ασθενή αντιστοιχούσε ένας αδελφός/μια αδελφή (ίδιο φύλο) με μέχρι 5 χρόνια διαφορά στην ηλικία τους που δεν είχε τη νόσο και ήταν μέλος της ομάδας ελέγχου. Βρέθηκε ότι 48% των ασθενών και 39% της ομάδας ελέγχου είχαν κάνει αμυγδαλεκτομή. Ο έλεγχος Χ 2 είχε κριτήριο 1,53 (με 1 βε) p=0,22. Όμως, οι συγγραφείς είχαν αγνοήσει τα «ζευγάρια»... 25

ΠΑΡΑΔΕΙΓΜΑ 4 (συν). Η 0 : οι αναλογίες των ατόμων που έχουν κάνει αμυγδαλεκτομή είναι ίδιες σε άτομα με και χωρίς τη νόσο του Hodgkin. H σωστή μορφή του πίνακα (όταν υπάρχουν ζεύγη) είναι η εξής: Control Tonsillectomy No tonsillectomy Hodgkin s Tonsillectomy 26 15 41 No tonsillectomy 7 37 44 33 52 85 ΣΗΜΕΙΩΣΗ: Δεν αρκούν οι πληροφορίες του 1 ου πίνακα για να δημιουργηθεί ο 2 ος. 26

Control Tonsillectomy No tonsillectomy Hodgkin s Tonsillectomy α β α+β π 2 = (α+β)/n No tonsillectomy γ δ γ+δ α+γ β+δ n π 1 = (α+γ)/n Η 0 : οι αναλογίες των ατόμων που έκαναν αμυγλ. είναι ίδιες στις 2 ομάδες. π 2 π 1 = 0 π 2 π 1 = (α+β)/n - (α+γ)/n = (β-γ)/n που αντιστοιχεί σε Η 0 : οι συχνότητες των «διαφωνούντων» ζευγαριών είναι ίδιες. 27

Η 0 : οι αναλογίες των ατόμων που έκαναν αμυγλ. είναι ίδιες στις 2 ομάδες. που αντιστοιχεί σε π 1 π 2 = 0 Η 0 : οι συχνότητες των «διαφωνούντων» ζευγαριών είναι ίδιες. β = γ Control Tonsillectomy No tonsillectomy Hodgkin s Tonsillectomy 26=a 15=b 41 No tonsillectomy 7=c 37=d 44 33 52 85=n p 1 = (a+c)/n = 39% p 2 = (a+b)/n = 48% p 2 p 1 = (b-c) / n = 9% μονάδες 28

ΠΑΡΑΔΕΙΓΜΑ 4 (συν). X 2 = ( b c) 2 b+ c = 2,91 p=0,09 Με τη διόρθωση του Yates: X 2 ( b c 1) = b+ c 2 = 2,23 p=0,14 Συμπέρασμα. Δεν απορρίπτουμε την Η 0 (σε επίπεδο 5%) Δεν υπάρχει απόδειξη ότι η αναλογία των ατόμων που έκαναν αμυγδαλεκτομή διαφέρει ανάλογα με το εάν έχουν η όχι τη νόσο του Hodgkin. 29

Στο SPSS 14 Analyse Descriptive Statistics Crosstabs... Raw data = tonsill.sav (Πίνακας 5 στις σημειώσεις=johnson2.sav) ΠΑΡΑΔΕΙΓΜΑ 4 (συν). Σημείωση στο SPSS ο έλεγχος βασίζεται στη διωνυμική κατανομή. McNemar Test N of Valid Case Chi-Square Tests Value 85 a. Binomial distribution used. Exact Sig. (2-sided),134 a 30

ΠΑΡΑΤΗΡΗΣΕΙΣ ΚΑΤΑ ΖΕΥΓΗ: Ο έλεγχος του McNemar ΠΑΡΑΔΕΙΓΜΑ 5. Ποσοστά υπέρβαρων αγοριών σε ηλικίες 10 και 15 ετών. Τυχαίο δείγμα 200 παιδιών. Παρακολούθηση για 5 χρόνια. «Διαφέρουν οι αναλογίες των υπέρβαρων αγοριών στις 2 ηλικίες;» Ο συνηθισμένος 2 επί 2 πίνακας θα είχε την εξής μορφή. Υπέρβαρο Μη-υπέρβαρο Ηλικία 10 ετών 50 150 200 Ηλικία 15 ετών 90 110 200 140 260 400 Σε τι διαφέρει από άλλους 2x2 πίνακες,αν εξετάσουμε τα σύνολα; 31

ΠΑΡΑΔΕΙΓΜΑ 5 (συν). Η 0 : οι αναλογίες των υπέρβαρων στις 2 ηλικίες είναι ίδιες. H σωστή μορφή του πίνακα (όταν υπάρχουν ζεύγη) είναι η εξής: 10 ετών Υπέρβαρο 15 ετών Υπέρβαρο 40 50 90 Μηυπέρβαρο Μηυπέρβαρο 10 100 110 50 150 200 Η 0 : οι συχνότητες των ατόμων που αλλάζουν κατηγορία (δηλαδή υπέρβαρα σε ηλικία 10 ετών αλλά όχι σε ηλικία 15 ετών και αντιστρόφως) είναι ίδιες. 32

ΣΩΣΤΟ ή ΛΑΘΟΣ; Ο έλεγχος του McNemar θα μπορούσε να χρησιμοποιηθεί 1) για να συγκρίνουμε τα ποσοστά των γυναικών που έπαιρναν το αντισυλληπτικό χάπι, σε ομάδα γυναικών με καρκίνο της μήτρας και ομάδα υγιών γυναικών, ταιριασμένων για ηλικία και τόπο διαμονής (matched controls). 2) για να εξετασθεί η αλλαγή στο FEV % pred σε μία ομάδα ασθενών με ΧΑΠ το χειμώνα σε σχέση με το καλοκαίρι. 3) για να συγκρίνουμε τα ποσοστά των γυναικών που έπαιρναν το αντισυλληπτικό χάπι, σε ομάδα γυναικών με καρκίνο της μήτρας και μια ομάδα υγιών γυναικών από τον γενικό πληθυσμό. 33

Η σύγκριση 2 ποιοτικών μεταβλητών με >2 ομάδες

ΠΑΡΑΔΕΙΓΜΑ 6. Το επίπεδο παχυσαρκίας των παιδιών ανάλογα με την ηλικιακή τους ομάδα Crosstab cole Normal weight Overweight Obese Total age4gps <=7 Count 37 6 4 47 Expected Count 31,9 11,1 4,0 47,0 8-10 Count 24 13 7 44 Expected Count 29,9 10,4 3,8 44,0 11-12 Count 29 13 2 44 Expected Count 29,9 10,4 3,8 44,0 >12 Count 37 12 3 52 Expected Count 35,3 12,2 4,4 52,0 Total Count 127 44 16 187 Expected Count 127,0 44,0 16,0 187,0 Chi-Square Tests Value df Asymp. Sig. (2-sided) Pearson Chi-Square 9,825 a 6,132 Likelihood Ratio 9,898 6,129 Linear-by-Linear Association,041 1,839 N of Valid Cases 187 a. 4 cells (33,3%) have expected count less than 5. The minimum expected count is 3,76. 35

ΣΗΜΕΙΩΣΕΙΣ 1) Ο έλεγχος Χ 2 χρησιμοποιείται μόνο όταν οι αριθμοί στα κελιά είναι συχνότητες και όχι όταν είναι ποσοστά ή μέσες τιμές. 2) Ο έλεγχος Χ 2 δεν είναι έγκυρος σε Α επί Β πίνακα όταν >20% των κελιών έχουν αναμενόμενη συχνότητα <5. Επίσης συνίσταται να μην υπάρχει κελί με αναμενόμενη συχνότητα <1. Αν δεν τηρούνται οι προϋποθέσεις, προτείνεται η συγχώνευση κατηγοριών. 3) Όταν οι μεταβλητές είναι διαβαθμιζόμενες μπορεί να εφαρμοστεί ο έλεγχος γραμμικής τάσης χ 2. Προϋπόθεση = μέγεθος δείγματος > 30. 36

Διάστημα εμπιστοσύνης για 1 αναλογία

p [ z SE ( p ± α )] Αν το n είναι αρκετά μεγάλο και το p δεν είναι κοντά στο 0 ή στο 1, τότε το κατά προσέγγιση 95% ΔΕ είναι p ± 1, 96 p ( 1 n p ) Συνήθως λέμε ότι χρειαζόμαστε np>5 και n(1-p)>5 SE ( p ) = p (1 p ) / n ΠΑΡΑΔΕΙΓΜΑ 7. Σε ένα δείγμα 133 τραπεζικών υπαλλήλων, οι 77 ήταν καπνιστές. Εδώ, p=77/133=0,58 και SE= (0,58(1-0,58)/133)=0,042. Οπότε το 95% Δ.Ε. για το ποσοστό των καπνιστών στο πληθυσμό (των τραπεζικών υπαλλήλων) είναι από 0,58-(1,96*0,042) έως 0,58+(1,96*0,042). Δηλαδή από 50% έως 66%. 38

ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ Όταν το δείγμα είναι μικρό ή το p είναι κοντά στο 0 ή στο 1, τότε η μέθοδος δεν είναι εφαρμόσιμη και τα Δ.Ε. υπολογίζονται με τις ακριβείς πιθανότητες της δυωνυμικής κατανομής. ΠΑΡΑΔΕΙΓΜΑ 8. Μια δημοσίευση όπου εφαρμόστηκε η κανονική προσέγγιση αλλά δεν θα έπρεπε να είχε εφαρμοστεί (από τον Bland σελ 128). Οι Turnbull et al (1992) μελέτησαν τον επιπολασμό του HIV σε πρώην φυλακισμένους. Βρήκαν ότι 1 από 29 γυναίκες που δεν έκαναν ενέσεις ναρκωτικών ήταν HIV θετική και ανάφεραν ότι ο επιπολασμός ήταν 3,4% με 95% ΔΕ από 3,1% έως 9,9%. Αδύνατον! Το σωστό ΔΕ υπολογίστηκε με τις πιθανότητες της διωνυμικής κατανομής να είναι από 0,1% έως 17,8%. 39

ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΤΕΧΝΙΚΕΣ ΑΝΑΛΥΣΗΣ ΠΟΙΟΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ (συνέχεια) Σύγκριση κινδύνων Ορισμός: ΣΚ και OR. Εκτίμηση κινδύνων σε προοπτικές μελέτες Εκτίμηση κινδύνων σε μελέτες ασθενών μαρτύρων Σχέση OR και ΣΚ Πότε είναι κατάλληλο μέτρο ο OR;

ΣΥΓΚΡΙΣΗ ΚΙΝΔΥΝΩΝ Το ερώτημα: Θέλουμε να ερευνήσουμε τη σχέση μεταξύ της ύπαρξης (ή μη-) κάποιας «έκθεσης» και της ανάπτυξης κάποιας νόσου. Τα δεδομένα είναι ποιοτικά. Θα μπορούσαν να εφαρμοστούν οι τεχνικές που ήδη συζητήθηκαν. Όμως, ανάλογα με το σχεδιασμό της μελέτης, θεωρείται πιο χρήσιμη η σύγκριση των αναλογιών με λόγους (ratios) απ ότι ο υπολογισμός των διαφορών. π.χ. ο σχετικός κίνδυνος (ΣΚ) ή ο σχετικός λόγος «Odds Ratio» (OR) 41

Ο «κίνδυνος» κάποιου γεγονότος είναι η πιθανότητα ότι το γεγονός θα συμβεί σε ορισμένο χρονικό διάστημα. Γενική μορφή των αποτελεσμάτων μιας προοπτικής μελέτης (prospective study) σε 2 x 2 πίνακα. Νόσος (D) Παράγοντας (Έκθεση =E) + - Σύνολο + a b a+b - c d c+d Σύνολο a+c b+d n ΣΗΜΕΙΩΣΗ Ο Τριχόπουλος έχει την αντίθετη διάταξη (Ε x D) στη σελ. 73 (αλλά την παρούσα στη σελ 77). Ο κίνδυνος ότι θα αναπτυχθεί η νόσος στο χρονικό διάστημα που έχει οριστεί είναι a/(a+c) για την εκτεθειμένη ομάδα και b/(b+d) για τη μη-εκτεθειμένη. 42

Σε μια προοπτική μελέτη, ο λόγος των κινδύνων ονομάζεται σχετικός κίνδυνος (ΣΚ), relative risk) ΣΚ Τιμές από 0 έως. Πιθ ( D Πιθ ( D / E ) / E ) = b + b + d = a( b b( a ΣΚ=1 σημαίνει έλλειψη σχέσης. a a c + + Νόσος (D) d ) c) = ΣΚ Έκθεση =E + - + a b a+b - c d c+d a+c b+d n Αν ΣΚ>1 τότε ο παράγοντας σχετίζεται θετικά με το νόσημα. Δηλαδή ο παράγοντας είναι επιβαρυντικός. Αν ΣΚ<1 τότε ο παράγοντας προστατεύει από το νόσημα. 43

Νόσος (D) Έκθεση =E + - + a b a+b - c d c+d a+c b+d n Odds ratio of disease (Σχετικός λόγος συμπληρωματικών πιθανοτήτων) ψ = Π Π ιθ ιθ ( D ( D / E) / E) Π Π ιθ ιθ ( D ( D / E ) / E ) = a /( a c /( a + + c) c) b d /( b /( b + + d ) d ) = ad bc Τιμές από 0 έως. ψ=1 σημαίνει έλλειψη σχέσης. 44

Γιατί λέγεται «odds ratio» δηλαδή «λόγος των odds» ; Ουσιαστικά o odds ενός ενδεχομένου είναι η πιθανότητα ότι συμβαίνει το ενδεχόμενο (p) δια την πιθανότητα ότι δε συμβαίνει (1-p). Το να φέρεις 6άρι: Δηλαδή, το odds δεν είναι πιθανότητα. Λέμε the odds in favour of having the disease are odds ratio (OR) = odds 1 /odds 2 Πιθ 1/6 προς Πιθ 5/6, δηλαδή odds = 1/ 6 5/ 6 = 1/ 5 BMJ 2000; 320:1468 The odds ratio. J M Bland, D G Altman, 45

Έκθεση =E + - Νόσος (D) + a b a+b - c d c+d a+c b+d n Σημείωση: Ένα τρίτο πιθανό μέτρο είναι η διαφορά του κινδύνου μεταξύ των εκτεθειμένων και μη- ατόμων. Π ιθ ( D / E) Πιθ ( D / E ) = a a + c b b + d Μπορεί να γίνει έλεγχος Χ 2 για τη σύγκριση των αναλογιών. 46

Εκτίμηση κινδύνων σε προοπτικές μελέτες

Σε μια προοπτική μελέτη μπορεί να εκτιμηθεί ο σχετικός κίνδυνος ανάπτυξης κάποιας νόσου. Προοπτική μελέτη (prospective study) Έκθεση; Νόσος; - μελέτη παρατήρησης (observational study). Όπως αυτή στο Παράδειγμα 7. - κλινική δοκιμή (clinical trial). Εδώ τυχαιοποιούμε τον παράγοντα που ενδιαφέρει. Όπως στο Παράδειγμα 6. 48

ΠΑΡΑΔΕΙΓΜΑ 6. Αντιοξειδωτικά συμπληρώματα διατροφής και ο κίνδυνος ανάπτυξης Kwashiorkor. (H Ciliberto et al, BMJ 2005). Δείγμα 2372 παιδιών ηλικίας 12-48 μηνών στο Malawi. Τυχαιοποίηση σε 2 ομάδες: η μία έλαβε συμπληρωματικό δισκίο διατροφής με αντιοξειδωτικά, η άλλη μόνο placebo. Διαφέρει ο κίνδυνος ανάπτυξης της νόσου ανάλογα με το εάν πάρθηκε η όχι το συμπλήρωμα; Συμπλήρωμα διατροφής Ναι Όχι Σύνολο Kwashiorkor (oedema) Ναι 39 23 62 Όχι 1145 1165 2310 Σύνολο 1184 1188 2372 FIXED COLUMN TOTALS 49

Μπορεί να γίνει έλεγχος Χ 2 για τη σύγκριση των αναλογιών. Χ 2 =4.30 με 1 β.ε. p=0.038 Θα μπορούσε επίσης να υπολογιστεί ο «σχετικός κίνδυνος (ΣΚ)» (relative risk), δηλαδή ο αυξημένος κίνδυνος της μιας ομάδας σε σχέση με της άλλης, ως εξής: 39 από τα 1184 παιδιά που παίρνουν το συμπλήρωμα αναπτύσσουν τη νόσο (3,29%) ενώ 25 από τα 1188 παιδιά που δεν παίρνουν το συμπλήρωμα αναπτύσσουν τη νόσο (1,94%). Ο ΣΚ= 3,29 / 1,94 = 1,70. Δηλαδή τα παιδιά που παίρνουν το συμπλήρωμα διατρέχουν ένα κίνδυνο ανάπτυξης της νόσου που είναι περίπου 1,7 φορές μεγαλύτερος από τον κίνδυνο των παιδιών που δεν παίρνουν συμπλήρωμα! 50

«Πώς ξέρουμε πόσο ακριβής είναι η εκτίμηση του ΣΚ;» Μπορούμε να δημιουργήσουμε ανάλογα διαστήματα εμπιστοσύνης (ΔΕ) {λεπτομέρειες στις αναλυτικές σημειώσεις}. Τιμή ΣΚ=1 σημαίνει ότι ο κίνδυνος είναι ίδιος στις 2 ομάδες. Aν το ΔΕ δεν συμπεριλαμβάνει τη μονάδα, λέμε ότι υπάρχει αυξημένος κίνδυνος στη μία ομάδα. 51

ΔΕ για το ΣΚ στο Παράδειγμα 6. Έχουμε ΣΚ 1,70. Το 95% ΔΕ είναι από 1,02 έως 2,83. Οπότε έχουμε 95% σιγουριά ότι ο κίνδυνος για kwashiorkor είναι υψηλότερος στην ομάδα που έλαβε το συμπλήρωμα. Έχουμε 95% σιγουριά ότι ο κίνδυνος για kwashiorkor κυμαίνεται από 1,02 έως 2,83 φορές τον κίνδυνο της ομάδας που δεν έλαβε το συμπλήρωμα. Οι συγγραφείς βρήκαν ΔΕ από 0,98 έως 2,42 (λαμβάνουν υπ όψιν την ηλικία και διάφορες σωματομετρήσεις στη στατιστική ανάλυση). 52

ΠΑΡΑΔΕΙΓΜΑ 7. Κατανάλωση καφέ και κίνδυνος ανάπτυξης καρκίνου του ήπατος (T Shimazu et al, IJC, 2005). Πρόσφατη προοπτική μελέτη στην Ιαπωνία είχε ως σκοπό τη διερεύνηση του κινδύνου του καρκίνου του ήπατος σε σχέση με την κατανάλωση καφέ. Συμμετείχαν περίπου 51.000 άτομα ηλικίας άνω των 40 ετών. Παρακολούθηση για 5-7 χρόνια για την εμφάνιση καρκίνου του ήπατος. 117 περιπτώσεις. Αποτελέσματα: RR (95% CI) of liver cancer for subjects drinking coffee never, occasionally and 1 or more cups/day were 1.00 (Reference), 0.71 (0.46-1.09) and 0.58 (0.36-0.96) respectively. Ο ΣΚ (95% ΔΕ) του καρκίνου του ήπατος σε άτομα που δεν έπιναν καφέ ποτέ, έπιναν περιστασιακά ή έπιναν τουλάχιστον 1 φλιτζάνι ημερησίως ήταν 1,00 (επίπεδο αναφοράς), 0,71 (0,46-1,09) and 0,58 (0,36-0,96) αντίστοιχα. 53

Σχετικός κίνδυνος απόλυτος κίνδυνος Όταν εκτιμάμε τον ΣΚ, δεν πρέπει να αγνοούμε και τον απόλυτο κίνδυνο (absolute risk). Όταν η νόσος είναι σπάνιο γεγονός, τότε μπορεί ο κίνδυνος να τριπλασιάζετε (π.χ.) αλλά η απόλυτη διαφορά να μην είναι μεγάλη. π.χ. Μπορεί ο ΣΚ μιας νόσου να είναι 25 για τους άνδρες σε σχέση με τις γυναίκες (πολύ μεγάλος ΣΚ) αλλά τα ποσοστά των ανδρών και γυναικών που παθαίνουν τη νόσο να είναι μόνο 5% και 0,2% αντίστοιχα. Women over 50 told : «Mammography screening reduces the risk of dying from breast cancer by 25% But the absolute risk reduction is 1 in 1000. Of 1000 women who undergo mammography, 3 will die from BC whereas of 1000 women who do not undergo mammography about 4 will die (in the next ten years). Gigerenzer G & Edwards BMJ 2003 54

Εκτίμηση κινδύνων σε μελέτες ασθενών μαρτύρων

Μπορεί να έχουμε μια αναδρομική μελέτη case-control, δηλαδή μια μελέτη όπου επιλέγουμε άτομα με και χωρίς τη νόσο και ερευνούμε αν ήταν εκτεθειμένα η όχι. Αναδροµική µελέτη (retrospective study) Έκθεση; Νόσος Ναι Όχι 56

ΠΑΡΑΔΕΙΓΜΑ 8. Κοινωνική επαφή και ανάπτυξη λευχαιμίας (C Gilham et al, BMJ, 2005). Δείγμα 1272 παιδιών με διάγνωση οξείας lymphoblastic leukaemia και 6238 παιδιών χωρίς λευχαιμία (2-5 ετών). Ερωτήθηκαν για τις κοινωνικές τους επαφές στο 1 ο έτος της ζωής τους. «social activity» Ναι Όχι Σύνολο Λευχαιμία Ναι 1020 252 1272 Όχι 5343 895 6238 Σύνολο 6363 1147 7510 Στη μελέτη ασθενών-μαρτύρων ο ΣΚ δεν μπορεί να υπολογιστεί διότι οι «αναλογίες που αναπτύσσουν τη νόσο» εξαρτώνται από την αναλογία cases προς controls (ασθενών προς ελέγχους) που 57 επιλέγουμε στην αρχή της μελέτης.

Λευχαιμία «social activity» Ναι Όχι Σύνολ ο Ναι 1020 252 1272 Όχι 5343 895 6238 Σύνολο 6363 1147 7510 «Κίνδυνος» = 1020/6363 (16%) για παιδιά με κοινωνικές επαφές και 252/1147 (22%) για παιδιά χωρίς επαφές. «ΣΚ=0,73» Λευχαιμία «social activity» Ναι Όχι Σύνολ ο Ναι 1020 252 1272 Όχι 1336 224 1560 Με (υποθετική) επιλογή του ¼ των παιδιών χωρίς λευχαιμία. Σύνολο 2356 476 2832 «Κίνδυνος» = 1020/2356 (43%) για παιδιά με κοινωνικές επαφές και 252/476 (53%) για παιδιά χωρίς επαφές! «ΣΚ=0,82» Ο ΣΚ έχει αλλάξει! 58

Έκθεση =E + - Νόσος (D) + a b a+b - c d c+d a+c b+d n Σε case-control μελέτες, υπολογίζουμε το «odds ratio» («σχετικό λόγο») ως ad/bc. ad/bc = 1020 x 895 / (252 x 5343) = 0,68 Θεωρούμε ότι ο OR είναι καλή εκτίμηση του ΣΚ, και λέμε ότι ο κίνδυνος ανάπτυξης λευχαιμίας είναι κατά 32% μειωμένος σε παιδιά με κοινωνική επαφή σε σχέση με τα παιδιά χωρίς κοινωνική επαφή. [με τα 2832 παιδιά, OR= 1020 x 224 / (252 x 1336) = 0,68] 59

«Πώς ξέρουμε πόσο ακριβής είναι η εκτίμηση του OR;» Μπορούμε να δημιουργήσουμε ανάλογα διαστήματα εμπιστοσύνης (ΔΕ) {λεπτομέρειες στις αναλυτικές σημειώσεις}. Τιμή OR=1 σημαίνει ότι ο κίνδυνος είναι ίδιος στις 2 ομάδες. Aν το ΔΕ δεν συμπεριλαμβάνει τη μονάδα, λέμε ότι υπάρχει αυξημένος κίνδυνος στη μία ομάδα. 60

ΔΕ για τον OR στο Παράδειγμα 8. OR= 0,68. Το 95% ΔΕ είναι από 0,58 έως 0,79. (ο τύπος διαφέρει από τον τύπο για το ΔΕ του ΣΚ). Έχουμε 95% σιγουριά ότι ο κίνδυνος (ο odds) για λευχαιμία σε παιδιά με κοινωνική επαφή κυμαίνεται από 0,58 έως 0,79 φορές τον κίνδυνο της ομάδας που δεν είχαν κοινωνική επαφή στο 1 ο έτος της ζωής τους. «Πότε μπορούμε να θεωρήσουμε ότι ο OR είναι καλή εκτίμηση του ΣΚ;» 61

Σχέση OR και ΣΚ

Σε μια μελέτη ασθενών-μαρτύρων θεωρούμε ότι ο OR είναι ικανοποιητική εκτίμηση του ΣΚ όταν η νόσος είναι σπάνια π.χ. <10% στον πληθυσμό. Αν η νόσος είναι σπάνια, τότε a μικρό σε σχέση με c, b μικρό σε σχέση με d σε πίνακα προοπτικής μελέτης, οπότε ψ ΣΚ Παράγοντας (Έκθεση =E) + - Νόσος (D) + a b a+b - c d c+d ΣΚ = a b a + b + c d = a( b b( a + + d ) c) a( d ) b( c) = ad bc a+c b+d n = OR 63

συχνότητα της νόσου = 1% ΣΚ ψ http://www.jr2.ox.ac.uk/bandolier/band25/b25-61.gif 64

Ο ΣΚ και ο OR είναι παρόμοιοι τρόποι για την εκτίμηση της σχέσης 2 δυαδικών μεταβλητών. Ο ΣΚ έχει πιο εύκολη ερμηνεία αλλά το OR έχει μαθηματικές ιδιότητες που το κάνουν πιο εύχρηστο για στατιστικές αναλύσεις. π.χ. Ο OR δεν αλλάζει αν αλλάξουμε τις θέσεις των γραμμών και στηλών ενός πίνακα (ο ΣΚ αλλάζει). Αν αλλάξουν μόνο οι θέσεις των στηλών, τότε η εκτίμηση του OR είναι η ακριβώς αντίστροφη. 65

Πότε είναι κατάλληλο μέτρο ο OR;

Ο OR μπορεί να μας δώσει μια εκτίμηση της σχέσης μεταξύ δύο δυαδικών μεταβλητών. Όμως για να εκτιμηθεί κάποιος σχετικός κίνδυνος, ο OR μπορεί να χρησιμοποιηθεί μόνο όταν πρόκειται για μελέτη ασθενών-μαρτύρων με χαμηλό επιπολασμό της νόσου. 67

Συχνά στην ιατρική βιβλιογραφία τα OR ερμηνεύονται σαν να είναι ΣΚ, όταν αυτό δεν δικαιολογείται (WL Holcomb et al, O&G, 2001). Πρόσφατα δημοσιεύματα (JJ Deeks et al, BMJ letter, 1998, DL Sackett et al, EvBasedMed 1996, DAG Grimes & KF Schulz, O&G, 2008) συνιστούν τη χρήση των OR μόνο α) σε μελέτες ασθενών-μαρτύρων ή Β) όταν η κατάλληλη ανάλυση είναι η λογιστική παλινδρόμηση. Πολύ συχνά ο OR ερμηνεύεται σαν αύξηση/μείωση του κινδύνου (risk) όταν λόγω του σχεδιασμού της μελέτης, ουσιαστικά δεν εκτιμάει το σχετικό κίνδυνο. 68

ΣΥΝΟΨΗ: ΣΥΓΚΡΙΣΗ ΚΙΝΔΥΝΩΝ Προοπτική μελέτη π.χ. cohort study ή κλινική δοκιμή Η case-control μελέτη - αναδρομική μελέτη Σχετικός κίνδυνος (ΣΚ) Odds Ratio (OR) Ο λόγος OR προσεγγίζει τον ΣΚ όταν η νόσος είναι σπάνια. 69

Συνήθως, οι ερευνητές θέλουν να λάβουν υπ όψιν τους κι άλλους παράγοντες σε μια ανάλυση κινδύνου (π.χ. Ηλικία, φύλο κά) και χρησιμοποιούν την κατάλληλη πολυμετάβλητη μέθοδο. Για εκτιμήσεις του OR, λογιστική παλινδρόμηση. Για εκτιμήσεις του RR, τεχνικές ανάλυσης επιβίωσης (π.χ. μοντέλο ΑΚ του Cox). 70

Καλύπτοντας την ενότητα «Ανάλυση Ποιοτικών Δεδομένων», ο σκοπός είναι να - γνωρίζετε ότι δύο αναλογίες μπορούν να συγκριθούν με τον έλεγχο Χ 2 του Pearson και υπολογίζοντας το ΔΕ της διαφοράς των αναλογιών. - γνωρίζετε ποια είναι η υπόθεση που ερευνούμε όταν εφαρμόζουμε έναν έλεγχο Χ 2 του Pearson σε έναν διαξονικό πίνακα, τι αντιπροσωπεύουν οι αναμενόμενες συχνότητες, και πώς τις υπολογίζουμε στον έλεγχο Χ 2. - γνωρίζετε κάτω από ποιες συνθήκες πρέπει να εφαρμόζεται ο ακριβής έλεγχος του Fisher. - γνωρίζετε ότι όταν οι ποιοτικές παρατηρήσεις είναι κατά ζεύγη, ο κατάλληλος έλεγχος είναι ο έλεγχος του McNemar. - μπορείτε να ερμηνεύσετε τα αποτελέσματα μιας έρευνας όπου συγκρίνονται δύο (ή περισσότερες) ομάδες όσον αφορά κάποιο ποιοτικό τους χαρακτηριστικό. - μπορείτε να ερμηνεύσετε αποτελέσματα από μελέτες σύγκρισης κινδύνων (OR, RR). 71