Έλεγχος ανεξαρτησίας μεταξύ δύο ποιοτικών μεταβλητών (Crosstabs - Chi-Square Tests) Σε αρκετές περιπτώσεις απαιτείται να ελεγχθεί αν η συχνότητα εμφάνισης κάποιων συγκεκριμένων τιμών (κατηγοριών) μιας ποιοτικής μεταβλητής σχετίζεται με τη συχνότητα εμφάνισης συγκεκριμένων τιμών (κατηγοριών) κάποιας άλλης ποιοτικής μεταβλητής. Παράδειγμα: Για παράδειγμα έχουμε δύο ποιοτικές (ονομαστικές) μεταβλητές: τη μεταβλητή a, η οποία έχει τις υποκατηγορίες: Α1 (= συμμετοχή σε τελικούς αγώνες κολύμβησης), Α2 (= συμμετοχή σε ημιτελικούς αγώνες κολύμβησης) και Α3 (= συμμετοχής σε προημιτελικούς αγώνες κολύμβησης) και τη μεταβλητή b (= χρονική στιγμή διεξαγωγής της προπόνησης), η οποία έχει τις υποκατηγορίες: Β1(= προπόνηση και το πρωί και το απόγευμα), Β2 (= μόνο απογευματινή προπόνηση) και Β3 (= μόνο πρωινή προπόνηση). Οι κολυμβητές που ανήκουν: στην κατηγορία Α1 (δηλαδή έχουν συμμετάσχει σε τελικούς αγώνες κολύμβησης), λαμβάνουν στην μεταβλητή a την τιμή 1 στην κατηγορία Α2 (δηλαδή έχουν συμμετάσχει σε ημιτελικούς αγώνες κολύμβησης), λαμβάνουν στην μεταβλητή a την τιμή 2 στην κατηγορία Α3 (δηλαδή έχουν συμμετάσχει σε προημιτελικούς αγώνες κολύμβησης), λαμβάνουν στην μεταβλητή a την τιμή 3. Οι κολυμβητές που ανήκουν: στην κατηγορία Β1 (δηλαδή πραγματοποιούν και πρωινή και απογευματινή προπόνηση), λαμβάνουν στην μεταβλητή b την τιμή 1 στην κατηγορία Β2 (δηλαδή πραγματοποιούν μόνο απογευματινή προπόνηση), λαμβάνουν στην μεταβλητή b την τιμή 2 και στην κατηγορία Β3 (δηλαδή πραγματοποιούν μόνο πρωινή προπόνηση), λαμβάνουν στην μεταβλητή b την τιμή 3. Το ερώτημα που τίθεται είναι αν οι ποιοτικές μεταβλητές a και b είναι ανεξάρτητες μεταξύ τους, δηλαδή «αν οι συχνότητες εμφάνισης της πρώτης ποιοτικής μεταβλητής a είναι ανεξάρτητες από τις συχνότητες εμφάνισης της δεύτερης ποιοτικής μεταβλητής b». Στο 1
συγκεκριμένο παράδειγμα μας ενδιαφέρει αν η συμμετοχή των αθλητών σε τελικούς (Α1), ημιτελικούς (Α2) ή προημιτελικούς αγώνες (Α3) επηρεάζεται (εξαρτάται) από τη χρονική στιγμή διεξαγωγής της προπόνησης, αν δηλαδή διεξάγεται προπόνηση το πρωί και το απόγευμα (Β1), μόνο το απόγευμα (Β2) ή μόνο το πρωί (Β3). Διεξαγωγή της ανάλυσης ελέγχου ανεξαρτησίας μεταξύ δύο ποιοτικών μεταβλητών (Chi-Square) Από το μενού «Analyze» επιλέγουμε «Descriptive Statistics» και στη συνέχεια «Crosstabs» (Εικ. 1). Εικ. 1 Κάνοντας αριστερό κλικ με το ποντίκι στην επιλογή «Crosstabs» εμφανίζεται το πλαίσιο διαλόγου Crosstabs (Εικ. 2). 2
Εικ.2. Στο αριστερό πεδίο του πλαισίου διαλόγου «Crosstabs» περιλαμβάνονται οι μεταβλητές του αρχείου (π.χ. οι μεταβλητές a και b). Μαρκάρουμε με το ποντίκι την πρώτη μεταβλητή για την οποία θέλουμε να πραγματοποιηθεί ο έλεγχος ανεξαρτησίας Chi Square και κάνοντας αριστερό κλικ με το ποντίκι στο βελάκι ( 4 ) εισάγουμε την πρώτη εξαρτημένη μεταβλητή (π.χ. την μεταβλητή b) στο πεδίο Row(s) (γραμμές). Μαρκάρουμε με το ποντίκι τη δεύτερη μεταβλητή για την οποία θέλουμε να πραγματοποιηθεί ο έλεγχος ανεξαρτησίας Chi Square και κάνοντας αριστερό κλικ με το ποντίκι στο βελάκι ( 4 ) εισάγουμε την δεύτερη εξαρτημένη μεταβλητή (π.χ. την μεταβλητή a) στο πεδίο Column(s) (Στήλες) (Εικ. 3). Εικ. 3 3
Κάνοντας αριστερό κλικ με το ποντίκι πάνω στον διακόπτη «Statistics», του πλαισίου διαλόγου «Crosstabs», εμφανίζεται το πλαίσιο διαλόγου «Crosstabs: Statistics» μέσω του οποίου μαρκάρουμε την επιλογή Chi-square, κάνοντας αριστερό κλικ στο τετραγωνάκι που βρίσκεται αριστερά του (Εικ. 4). Στη συνέχεια αποδεχόμαστε αυτή την επιλογή κάνοντας αριστερό κλικ πάνω στον διακόπτη «Continue». Εικ. 4. Κάνοντας αριστερό κλικ με το ποντίκι πάνω στον διακόπτη «Cells», του πλαισίου διαλόγου «Crosstabs» (Εικ. 3), εμφανίζεται το πλαίσιο διαλόγου «Crosstabs: Cell Display» μέσω του οποίου μαρκάρουμε την επιλογή Expected, στο πεδίο με τίτλο «s», κάνοντας αριστερό κλικ στο τετραγωνάκι που βρίσκεται αριστερά του (Εικ. 5), έτσι ώστε στη συνέχεια εκτός από τις παρατηρούμενες (Observed) να εμφανιστούν και οι αναμενόμενες (Expected) συχνότητες. Στη συνέχεια αποδεχόμαστε αυτή την επιλογή κάνοντας αριστερό κλικ πάνω στον διακόπτη «Continue». Εικ. 5 4
Πατώντας τον διακόπτη OK του πλαισίου διαλόγου «Crosstabs» (Εικ. 3), πραγματοποιείται η ανάλυση. Αρχικά εμφανίζεται ο πίνακας των παρατηρούμενων συχνοτήτων () και των θεωρητικών συχνοτήτων (Expected ) για τους διάφορους συνδυασμούς των κατηγοριών της μεταβλητής b, η οποία έχει τοποθετηθεί στις γραμμές (Rows) και των κατηγοριών της μεταβλητής a, η οποία έχει τοποθετηθεί στις στήλες (Columns). b * a Crosstabulation a Total A1 A2 A3 b B1 20 20 10 50 Expected 15.0 15.0 20.0 50.0 B2 5 5 15 25 Expected 7.5 7.5 10.0 25.0 B3 5 5 15 25 Expected 7.5 7.5 10.0 25.0 Total 30 30 40 100 Expected 30.0 30.0 40.0 100.0 Υπολογισμός θεωρητικών συχνοτήτων: (30*50)/100= 15 (40*50)/100=20 (30*25)/100=7.5 5
Ο έλεγχος ανεξαρτησίας μεταξύ των δύο ποιοτικών μεταβλητών πραγματοποιείται μέσω του στατιστικού Chi-Square που παρουσιάζεται στον πίνακα Chi-Square Tests και ο οποίος περιλαμβάνει: την τιμή του Chi-Square (Value) = 16.667 τους αντίστοιχους βαθμούς ελευθερίας (df) = 4 (A-1)*(B-1)=(3-1)*(3-1) = 4 το επίπεδο σημαντικότητας της τιμής του Chi-Square (Asymp. Sig. 2-sided) = 0,002 Chi-Square Tests Value df Asymp. Sig. (2- sided) Pearson Chi- 16.667 4.002 Square Likelihood Ratio 17.261 4.002 Linear-by-Linear 10.565 1.001 Association N of Valid Cases 100 a 0 cells (.0%) have expected count less than 5. The minimum expected count is 7.50. Όταν το επίπεδο σημαντικότητας του Chi-Square είναι μικρότερο από 0.05 απορρίπτεται η μηδενική υπόθεση και γίνεται αποδεκτή η εναλλακτική υπόθεση. Σύμφωνα με την μηδενική υπόθεση: Ho: «οι συχνότητες εμφάνισης της πρώτης ποιοτικής μεταβλητής a είναι ανεξάρτητες από τις συχνότητες εμφάνισης της δεύτερης ποιοτικής μεταβλητής b» ενώ σύμφωνα με την εναλλακτική υπόθεση: H A : «οι συχνότητες εμφάνισης της πρώτης ποιοτικής μεταβλητής a δεν είναι ανεξάρτητες από τις συχνότητες εμφάνισης της δεύτερης ποιοτικής μεταβλητής b». Κατά συνέπεια στο συγκεκριμένο παράδειγμα η συμμετοχή των αθλητών σε τελικούς (Α1), ημιτελικούς (Α2) ή προημιτελικούς αγώνες (Α3) επηρεάζεται (εξαρτάται) από την χρονική στιγμή διεξαγωγής της προπόνησης, αν δηλαδή η προπόνηση διεξάγεται το πρωί και το απόγευμα (Β1), μόνο το απόγευμα (Β2) ή μόνο το πρωί (Β3). 6