Έλεγχος καλής προσαρμογής για μια ποιοτική μεταβλητή (Nonparametric Tests Chi-Square) Το Chi Square τεστ αποτελεί ένα μη παραμετρικό τεστ και εφαρμόζεται σε ονομαστικές μεταβλητές, βάσει των οποίων τα άτομα του δείγματος ομαδοποιούνται σε κατηγορίες. Παράδειγμα: Σε έναν αγώνα 400 m οι αθλητές τρέχουν ο καθένας σε μία από τις 8 διαδρομές του στίβου. Το ερώτημα που τίθεται είναι «κατά πόσο είναι σημαντικός παράγοντας η διαδρομή στην οποία τρέχει ένας αθλητής για την επίτευξη της νίκης». Η διαδρομή στην οποία τρέχει κάθε φορά ο νικητής, σε μια σειρά αγώνων (ο αριθμός των αγώνων και κατά συνέπεια το σύνολο των νικητών αποτελεί το σύνολο του δείγματος) καταχωρείται στην μεταβλητή diadromi (η οποία είναι μια ονομαστική μεταβλητή). Η μεταβλητή diadromi θα έχει 8 κατηγορίες, όσες είναι δηλαδή και οι διαδρομές του στίβου: αν κάποιος αθλητής-νικητής τρέχει στην 1 η διαδρομή (line 1), τότε λαμβάνει την τιμή 1 αν κάποιος αθλητής-νικητής τρέχει στην 2 η διαδρομή (line 2), τότε λαμβάνει την τιμή 2 αν κάποιος αθλητής-νικητής τρέχει στην 3 η διαδρομή (line 3), τότε λαμβάνει την τιμή 3 αν κάποιος αθλητής-νικητής τρέχει στην 4 η διαδρομή (line 4), τότε λαμβάνει την τιμή 4 αν κάποιος αθλητής-νικητής τρέχει στην 5 η διαδρομή (line 5), τότε λαμβάνει την τιμή 5 αν κάποιος αθλητής-νικητής τρέχει στην 6 η διαδρομή (line 6), τότε λαμβάνει την τιμή 6 αν κάποιος αθλητής-νικητής τρέχει στην 7 η διαδρομή (line 7), τότε λαμβάνει την τιμή 7 αν κάποιος αθλητής-νικητής τρέχει στην 8 η διαδρομή (line 8), τότε λαμβάνει την τιμή 8 Για να ελεγχθεί το ερώτημα που τέθηκε αρχικά, δηλαδή «κατά πόσο είναι σημαντικός παράγοντας η διαδρομή στην οποία τρέχει ένας αθλητής για την επίτευξη της νίκης», θα πρέπει να ελεγχθεί αν υπάρχουν διαφορές μεταξύ των πραγματικών τιμών (δηλαδή του αριθμού των νικητών που έτρεχαν σε κάποια διαδρομή) και των θεωρητικών τιμών, οι οποίες προκύπτουν διαιρώντας το σύνολο των πραγματικών τιμών (δηλαδή το συνολικό αριθμό των νικητών) με τον αριθμό των κατηγοριών (δηλαδή τον αριθμό των διαδρομών). 1
Διεξαγωγή της ανάλυσης ελέγχου καλής προσαρμογής (Chi-Square) Από το μενού «Analyze» επιλέγουμε «Nonparametric Tests» και στη συνέχεια «Chi-Square» (Εικ. 1). Εικ. 1 Κάνοντας αριστερό κλικ με το ποντίκι στην επιλογή «Chi-Square» εμφανίζεται το πλαίσιο διαλόγου Chi-Square Test (Εικ. 2). Εικ. 2 2
Στο αριστερό πεδίο του πλαισίου διαλόγου «Chi-Square Test» περιλαμβάνονται οι μεταβλητές του αρχείου (π.χ. η μεταβλητή diadromi). Μαρκάρουμε τη μεταβλητή για την οποία θέλουμε να πραγματοποιηθεί ο έλεγχος καλής προσαρμογής Chi Square, κάνοντας αριστερό κλικ με το ποντίκι πάνω σ αυτή και στη συνέχεια κάνοντας αριστερό κλικ με το ποντίκι στο βελάκι ( 4 ) εισάγουμε την εξαρτημένη μεταβλητή στο πεδίο Test Variable List (Εικ. 3). Εικ. 3. Στο πεδίο Expected Values θα πρέπει να είναι μαρκαρισμένη η επιλογή All categories equal. Μέσω αυτής της επιλογής θα συγκριθούν οι πραγματικές τιμές με τις θεωρητικές, σύμφωνα με τις οποίες σε κάθε κατηγορία της εξαρτημένης μεταβλητής θα πρέπει να βρίσκεται ο ίδιος αριθμός ατόμων. Δηλαδή στο συγκεκριμένο παράδειγμα οι θεωρητικές τιμές δηλώνουν ότι υπάρχει η ίδια πιθανότητα κάποιος νικητής να είναι στην 1 η διαδρομή ή στην 2 η ή στην 3 η κ.ο.κ. διαδρομή. Πατώντας τον διακόπτη OK πραγματοποιείται η ανάλυση. 3
Αρχικά εμφανίζεται ο πίνακας συχνοτήτων των πραγματικών (Observed N) και θεωρητικών (Expected N) τιμών, καθώς και οι διαφορές τους (Residual). Οι θεωρητικές τιμές προκύπτουν από τη διαίρεση του συνόλου των ατόμων (128 άτομα) προς τον αριθμό των κατηγοριών (8 κατηγορίες διαδρομές): 128/8= 16. diadromi Observed N Expected N Residual lline1 18 16,0 2,0 line2 17 16,0 1,0 line3 14 16,0-2,0 line4 15 16,0-1,0 line5 16 16,0,0 line6 18 16,0 2,0 line7 17 16,0 1,0 line8 13 16,0-3,0 Total 128 Test Statistics Η μηδενική υπόθεσης διατυπώνεται ως εξής: «Ho: δεν υπάρχουν στατιστικά σημαντικές διαφορές μεταξύ των πραγματικών και των θεωρητικών τιμών», δηλαδή στο συγκεκριμένο παράδειγμα υπάρχει η ίδια πιθανότητα να είναι κάποιος αθλητής νικητής ανεξάρτητα από τη διαδρομή στην οποία τρέχει. Ο έλεγχος της μηδενικής υπόθεσης πραγματοποιείται μέσω του στατιστικού Chi- Square που παρουσιάζεται στον πίνακα Test Statistics: diadromi Chi- 1,500 Square(a) df 7 Asymp. Sig.,982 a 0 cells (,0%) have expected frequencies less than 5. The minimum expected cell frequency is 16,0. Στον πίνακας Test Statistics παρουσιάζονται: η τιμή του Chi Square = 1.5 οι αντίστοιχοι βαθμοί ελευθερίας df (αριθμός κατηγοριών 1 = 8 1 = 7) το επίπεδο σημαντικότητας της τιμής του Chi Square: Asymp. Sig = 0.982 Εφόσον το επίπεδο σημαντικότητας του Chi-Square είναι μεγαλύτερο από 0.05 (όπως στο συγκεκριμένο παράδειγμα) γίνεται αποδεκτή η μηδενική υπόθεση σύμφωνα με την οποία: 4
«Ho: δεν υπάρχουν στατιστικά σημαντικές διαφορές μεταξύ των πραγματικών και των θεωρητικών τιμών», οπότε η διαδρομή στην οποία τρέχει κάποιος αθλητής δεν είναι καθοριστικής σημασίας για την νίκη. Αντίθετα αν το επίπεδο σημαντικότητας του Chi-Square ήταν μικρότερο από 0.05 τότε θα απορρίπτονταν η μηδενική υπόθεση και θα γινόταν αποδεκτή η εναλλακτική υπόθεση σύμφωνα με την οποία: «H Α : υπάρχουν στατιστικά σημαντικές διαφορές μεταξύ των πραγματικών και των θεωρητικών τιμών», οπότε η διαδρομή στην οποία τρέχει κάποιος αθλητής είναι καθοριστικής σημασίας για την νίκη. 5