ΣΧΕΣΗ ΜΕΤΑΞΥ ΠΟΙΟΤΙΚΩΝ ΜΕΤΑΒΛΗΤΩΝ Θα δούμε ένα παράδειγμα από 141 νεογνά που εγχειρίστηκαν σε ένα νοσοκομείο (surgery.sav). Οι παράμετροι που καταγράφηκαν είναι οι εξής: Κωδικός νεογνού (ID), Φύλο Νεογνού (GENDER, M=Male, F=Female), Περιοχή γέννησης (PLACE, L=Local, R= Regional O=Overseas) Βάρος νεογνού σε γραμμάρια (BIRTHWT) Βδομάδες κύησης (GESTATIO), Ημέρες νοσηλείας (LENGTHST), Λοίμωξη (INFECTION, 1= Yes, 0=No), Προωρότητα (PREMATUR, 1= Yes, 0=No) και Περιοχή επέμβασης (SURGERY, 1=Abdominal, 2=Cardiac, 3=Other): Ένα από τα ερωτήματα που δημιουργούνται είναι εάν η προωρότητα σχετίζεται με το φύλο. Τώρα για να εξεταστεί η σχέση φύλου και προωρότητας, χρησιμοποιείται η δοκιμασία χ 2 (Chisquare test). Το φύλο έχει 2 κατηγορίες: αγόρια και κορίτσια, όπως και η προωρότητα έχει 2 κατηγορίες (ναι και όχι) οπότε διαμορφώνεται ένας πίνακας συνάφειας 2x2. Η μηδενική και η εναλλακτική υπόθεση που διατυπώνονται είναι: Η 0 : Το φύλο δεν σχετίζεται με την προωρότητα (είναι ανεξάρτητα), δηλαδή το ποσοστό προωρότητας στα αγόρια και κορίτσια είναι το ίδιο Η 0 : p A = p K Η a : Το φύλο σχετίζεται με την προωρότητα (δεν είναι ανεξάρτητα), δηλαδή το ποσοστό προωρότητας διαφέρει μεταξύ αγοριών και κοριτσιών Η a : p A p K Στην περίπτωση που ο αναμενόμενος αριθμός συχνοτήτων είναι <5, χρησιμοποιείται η ακριβή δοκιμασία κατά Fisher s (Fisher s exact-test). Επιλέγοντας από το Toolbar Analyze Descriptive Statistics Cross-tabs : Στο Row(s) μπαίνει η μια ποιοτική μεταβλητή και στο Column(s) η άλλη ποιοτική μεταβλητή Μέσα στο Statistics επιλέγεται το Chi-square μετά Continue και τέλος OK Και τα αποτελέσματα: 1
P=0.012 <0.05, υπάρχει σημαντική σχέση μεταξύ φύλου και προωρότητας, το ποσοστό προωρότητας στα αγόρια ήταν σχεδόν διπλάσιο σε σχέση με τα κορίτσια (40.2% vs. 20.3%) Σε περίπτωση που το SPSS έχει ως υποσημείωση ότι κάποιο κελί έχει αναμενόμενο αριθμό συχνοτήτων < 5, χρησιμοποιείται το Fisher s Exact Test Λογαριθμιστική εξάρτηση Ένας άλλος τρόπος έκφρασης της παραπάνω σχέσης είναι με τον λόγο σχετικών πιθανοτήτων (odds-ratio), ο οποίος δίνεται από τη λογαριθμιστική εξάρτηση (logistic regression). Το χαρακτηριστικό αυτού του μοντέλου είναι ότι η έκβαση (εξαρτημένη μεταβλητή) είναι διχότομη. Επίσης, αυτό το μοντέλο προσφέρεται και για πολυπαραγοντική ανάλυση, δηλαδή την εύρεση πολλών σημαντικών παραγόντων που επηρεάζουν την έκβαση. Επιλέγοντας από το Toolbar Analyze Regression Binary Logistic : 2
Στο Dependent μπαίνει η διχότομη μεταβλητή και στο Covariates μπαίνουν οι ανεξάρτητες μεταβλητές, είτε ποιοτικές ή ποσοτικές. Από το Options επιλέγεται CI for exp(b) και μετά Continue και μετά OK. Και τα αποτελέσματα: O λόγος σχετικών πιθανοτήτων (odds ratio=exp(b)) = 0.379, δηλαδή η πιθανότητα προωρότητας ήταν (1-0.379=0.621) 62% μικρότερη στα κορίτσια απ ότι στα αγόρια. Το 95% ΔΕ (0.18, 0.82) δεν περιέχει την μονάδα οπότε η σχέση είναι και στατιστικά σημαντική (P=0.014) Η αντίστροφη σχέση αγόρια σε σχέση με τα κορίτσια μπορεί να οριστεί μέσα από το Categorical : 3
Επιλέγοντας το Categorical προσδιορίζεται ποια θα είναι η ομάδα αναφοράς στην ποιοτική μεταβλητή. Εδώ το Gender είναι κωδικοποιημένο 1=Males και 2=Females, οπότε βάζοντας τη μεταβλητή μέσα στο Categorical Covariates το Reference Category είναι Last. Δηλαδή Males vs. Females. Οπότε τώρα τα αποτελέσματα παρουσιάζονται αντίστροφα, η πιθανότητα για προωρότητα στα αγόρια σε σχέση με κορίτσια: O λόγος σχετικών πιθανοτήτων (odds ratio=exp(b)) = 2.638 (1/0.379), δηλαδή η πιθανότητα προωρότητας ήταν 2.6 φορές μεγαλύτερη στα αγόρια απ ότι στα κορίτσια. Το 95% ΔΕ (1.22, 5.71) δεν περιέχει την μονάδα οπότε η σχέση είναι και στατιστικά σημαντική (P=0.014) 4
2x3 πίνακες συνάφειας: Η δοκιμασία χ 2 μπορεί να εφαρμοστεί και σε μεγαλύτερους πίνακες συνάφειας 2x3. Για παράδειγμα μπορεί να εξεταστεί η σχέση περιοχής γέννησης και προωρότητας. Η περιοχή γέννησης έχει 3 κατηγορίες: τοπικά, περιφερειακά και εξωτερικό και η προωρότητα έχει 2 κατηγορίες (ναι και όχι) οπότε διαμορφώνεται ένας πίνακας συνάφειας 2x3. Η μηδενική και η εναλλακτική υπόθεση που διατυπώνονται είναι: Η 0 : Η περιοχή γέννησης δεν σχετίζεται με την προωρότητα (είναι ανεξάρτητα), δηλαδή το ποσοστό προωρότητας στις διάφορες περιοχές είναι το ίδιο Η 0 : p Τ = p Π = p Ε Η a : : Η περιοχή γέννησης σχετίζεται με την προωρότητα (δεν είναι ανεξάρτητα), δηλαδή το ποσοστό προωρότητας διαφέρει μεταξύ των περιοχών (τουλάχιστον μεταξύ δύο περιοχών). Η a : p Τ p Π p Ε Επιλέγοντας από το Toolbar Analyze Descriptive Statistics Cross-tabs : Και τα αποτελέσματα: 5
Τώρα υπάρχει η υποσημείωση ότι ένα κελί έχει αναμενόμενη συχνότητα < 5 οπότε θα πρέπει να εφαρμοστεί το Fisher s Exact Test! To SPSS σε πίνακες συνάφειας μεγαλύτερους από 2x2 δεν εμφανίζει αυτόματα το Fisher s Exact Test διότι είναι μια δοκιμασία με πολλούς εντατικούς υπολογισμούς. Παρόλα αυτά υπάρχει τρόπος να υπολογιστεί πατώντας το κουμπί Exact στο πάνω δεξιά μέρος: Επειδή υπήρχε η υποσημείωση ότι υπάρχει κελί με αναμενόμενη συχνότητα < 5 πρέπει να εφαρμοστεί το Fisher s Exact Test πατώντας το κουμπί Exact Και τα αποτελέσματα: 6
P=0.079 >0.05 άρα δεν υπάρχει σημαντική σχέση μεταξύ περιοχής γέννησης και προωρότητας Έλεγχος γραμμικής τάσης σε διατεταγμένα δεδομένα (Chi-square test adjusting for trend) Για παράδειγμα διερευνάται αν υπάρχει κάποια τάση η οποία να δείχνει ότι τα ποσοστά λοίμωξης αυξάνουν σε νεογνά που μένουν περισσότερο μέσα στο νοσοκομείο. Η εμφάνιση λοίμωξης έχει 2 κατηγορίες: ναι και όχι και οι ημέρες νοσηλείας έχουν χωριστεί σε 5 ίσες κατηγορίες οπότε θεωρείται και διατεταγμένη μεταβλητή οπότε διαμορφώνεται ένας πίνακας συνάφειας 2x5. Η μηδενική και η εναλλακτική υπόθεση που διατυπώνονται είναι: Η 0 : Η εμφάνιση λοίμωξης δεν σχετίζεται με τις ημέρες νοσηλείας (είναι ανεξάρτητα), δηλαδή το ποσοστό λοίμωξης δεν διαφέρει ανάλογα με τις ημέρες νοσηλείας Η 0 : p 0-18 = p 19-22 = p 23-30 = p 31-44 = p 45-244 Η a : Η εμφάνιση λοίμωξης σχετίζεται με τις ημέρες νοσηλείας (δεν είναι ανεξάρτητα), δηλαδή το ποσοστό λοίμωξης διαφέρει ανάλογα με τις ημέρες νοσηλείας Η a : p 0-18 p 19-22 p 23-30 p 31-44 p 45-244 7
Και τα αποτελέσματα: P=0.002 >0.05 υπάρχει γραμμική τάση η οποία δείχνει ότι τα ποσοστά λοίμωξης αυξάνουν ανάλογα με τις ημέρες λοίμωξης Κοιτώντας το και γραφικά με ένα ραβδόγραμμα: 8
Άσκηση για το σπίτι: 1. Να ελέγξετε αν οι ημέρες νοσηλείας (LENGHTST) διαφέρουν ανάλογα με τον τύπο της επέμβασης (SURGERY) 2. Να ελέγξετε αν η εμφάνιση λοίμωξης (INFECTION) σχετίζεται με το φύλο και να το παρουσιάσετε και με λόγο σχετικών πιθανοτήτων. 9
Παρατηρήσεις κατά ζεύγη (εξαρτημένα δείγματα) Στην περίπτωση που τα δείγματα δεν είναι ανεξάρτητα αλλά εξαρτημένα δεν μπορεί να χρησιμοποιηθεί η δοκιμασία χ 2 διότι προϋποθέτει ανεξαρτησία μεταξύ των δειγμάτων. Για παράδειγμα, μια ομάδα ασθενών μελετήθηκε σε δύο χρονικές στιγμές, πριν και μετά τη λήψη μιας παρέμβασης. Η κατάλληλη δοκιμασία σε αυτήν την περίπτωση είναι η δοκιμασία Mc Nemar. Γι αυτήν την ανάλυση θα χρησιμοποιηθεί η βάση pairedcategorical.sav, στην οποία έχει καταγραφεί η ανταπόκριση, θετική + και αρνητική -, 20 ασθενών σε 3 χρονικές στιγμές (antaporkrisia, antapokrisib, antapokrisic). Ένα ερευνητικό ερώτημα είναι εάν η ανταπόκριση μεταβλήθηκε σημαντικά μεταξύ της Α και της Β χρονικής στιγμής. Η μηδενική και η εναλλακτική υπόθεση που διατυπώνεται είναι η εξής: Η 0 : Η ανταπόκριση δεν μεταβλήθηκε σημαντικά μεταξύ της Α και της Β χρονικής στιγμής Η a : Η ανταπόκριση μεταβλήθηκε σημαντικά μεταξύ της Α και της Β χρονικής στιγμής Επιλέγοντας από το Toolbar Analyze Descriptive Statistics Crosstabs : Στο Row(s) επιλέγεται η μια μεταβλητή και στο Column(s) η άλλη. Μέσα στο Statistics επιλέγεται το McNemar και μετά Continue και μετά OK 10
Και τα αποτελέσματα: P=0.727>0.05 δεν υπήρχε τελικά σημαντική μεταβολή στην ανταπόκριση μεταξύ της Α και της Β χρονικής στιγμής Στην περίπτωση που θα θέλαμε να ελέγξουμε την ανταπόκριση σε 3 χρονικές στιγμές, η κατάλληλη δοκιμασία είναι το Cochrane s Q test. Η μηδενική και η εναλλακτική υπόθεση που διατυπώνεται είναι η εξής: Η 0 : Η ανταπόκριση δεν μεταβλήθηκε σημαντικά μεταξύ της Α, και της Γ χρονικής στιγμής Η a : Η ανταπόκριση μεταβλήθηκε σημαντικά μεταξύ τουλάχιστον 2 χρονικών στιγμών. Επιλέγοντας από το Toolbar Analyze Nonparametrics Tests Legacy dialogs K Related Samples : 11
Επιλέγονται και οι 3 χρονικές στιγμές μέσα στο Test Variables και στο Test Type επιλέγεται το Cochran s Q και μετά OK Και τα αποτελέσματα: P=0.150>0.05 δεν μεταβλήθηκε σημαντικά η ανταπόκριση μεταξύ των 3 χρονικών στιγμών 12