Έλεγχος ύπαρξης στατιστικά σημαντικών διαφορών μεταξύ περισσότερων από δύο ανεξάρτητων δειγμάτων, που διαχωρίζονται βάσει ενός ανεξάρτητου παράγοντα (Ανάλυση διακύμανσης για ανεξάρτητα δείγματα ως προς έναν παράγοντα) Για τον έλεγχο της ύπαρξης στατιστικά σημαντικών διαφορών μεταξύ των μέσων όρων περισσότερων από δύο ανεξάρτητων δειγμάτων, τα οποία διαφοροποιούνται βάσει ενός παράγοντα, πραγματοποιείται ανάλυση διακύμανσης για ανεξάρτητα δείγματα ως προς έναν παράγοντα. Παράδειγμα: Ένας προπονητής ενδιαφέρεται να μάθει αν το επίπεδο της τεχνικής κατά την εκτέλεση κατακόρυφων αλμάτων επηρεάζει την επίδοση. Για το σκοπό αυτό καταγράφεται η επίδοση μιας ομάδας αθλητών στο κατακόρυφο άλμα (countermovement jump). Η μεταβλητή «επίδοση στο κατακόρυφο άλμα» (countermovement jump) αποτελεί την εξαρτημένη μεταβλητή. Ανάλογα με το «επίπεδο της τεχνικής» τους, που εκφράζεται μέσω της ανεξάρτητης μεταβλητής technique, τα άτομα του αρχικού συνολικού δείγματος διακρίνονται σε τρεις υποομάδες: Οι αθλητές με υψηλό επίπεδο τεχνικής (high) λαμβάνουν στην μεταβλητή technique την τιμή 1. Οι αθλητές με μέτριο επίπεδο τεχνικής (medium) λαμβάνουν στην μεταβλητή technique την τιμή 2 και οι αθλητές με χαμηλό επίπεδο τεχνικής (low) λαμβάνουν στην μεταβλητή technique την τιμή 3. Για να ελεγχθεί αν υπάρχουν στατιστικά σημαντικές διαφορές στην επίδοση των αθλητών στο κατακόρυφο άλμα (εξαρτημένη μεταβλητή), ανάλογα με το επίπεδο της τεχνικής τους (ανεξάρτητη μεταβλητή), θα πρέπει να εφαρμοστεί ανάλυση διακύμανσης για ανεξάρτητα δείγματα ως προς έναν παράγοντα. Τα δείγματα είναι ανεξάρτητα γιατί σε κάθε υποκατηγορία (αθλητές με υψηλό επίπεδο τεχνικής, αθλητές με μέτριο επίπεδο τεχνικής, αθλητές με χαμηλό επίπεδο τεχνικής) ανήκουν διαφορετικά υποκείμενα (αθλητές). Ο παράγοντας βάσει του οποίου διαφοροποιείται το αρχικό συνολικό δείγμα είναι η ανεξάρτητη μεταβλητή «επίπεδο τεχνικής» (technique). 1
Διεξαγωγή της ανάλυσης διακύμανσης για ανεξάρτητα δείγματα ως προς έναν παράγοντα (One-Way ANOVA) Από το μενού «Analyze επιλέγουμε «Compare Means» και στη συνέχεια, «One-Way ANOVA» (Εικ. 1). Εικ. 1 Κάνοντας αριστερό κλικ με το ποντίκι πάνω στην επιλογή «One-Way ANOVA» εμφανίζεται το πλαίσιο διαλόγου «One-Way ANOVA» (Εικ. 2), το οποίο στην αριστερή του πλευρά περιέχει ένα πεδίο με όλες τις μεταβλητές του αρχείου και στην δεξιά του πλευρά δύο πεδία διαφορετικού μεγέθους. 2
Στο αριστερό πεδίο του πλαισίου διαλόγου One-Way ANOVA, «μαρκάρουμε» την εξαρτημένη μεταβλητή που επιθυμούμε (κάνοντας με το ποντίκι αριστερό κλικ πάνω σ αυτήν). Η μεταβλητή «μαρκάρεται» και γίνεται σκούρο χρώμα. Π.χ. η μεταβλητή jump1 (countermovement jump) (Εικ. 2.) Εικ. 2 Κάνοντας αριστερό «κλικ» με το ποντίκι πάνω στο πάνω βελάκι ( 4 ) εισάγουμε την εξαρτημένη μεταβλητή στο πεδίο «Dependent List:» (Εικ. 3). Εικ. 3 3
Στο αριστερό πεδίο του πλαισίου διαλόγου «One-Way ANOVA», «μαρκάρουμε» την ανεξάρτητη μεταβλητή που επιθυμούμε (κάνοντας με το ποντίκι αριστερό κλικ πάνω σ αυτήν) και η οποία διαχωρίζει το συνολικό δείγμα σε περισσότερες από δύο κατηγορίες. Η μεταβλητή «μαρκάρεται» και γίνεται σκούρο χρώμα. Π.χ. η μεταβλητή techniq (technique), η οποία διαχωρίζει το συνολικό δείγμα σε τρεις κατηγορίες: αυτούς που έχουν «υψηλό επίπεδο τεχνικής» (1= high), αυτούς που έχουν «μέτριο επίπεδο τεχνικής» (2= medium) και αυτούς που έχουν «χαμηλό επίπεδο τεχνικής» (3 = low) (Εικ. 4). Εικ. 4 Κάνοντας αριστερό κλικ με το ποντίκι πάνω στο κάτω βελάκι ( 4 ) εισάγουμε την ανεξάρτητη μεταβλητή (παράγοντα) techiq στο πεδίο «Factor» (Εικ. 5). Εικ. 5 4
Κάνοντας αριστερό κλικ με το ποντίκι πάνω στον διακόπτη «Options» εμφανίζεται το πλαίσιο διαλόγου «One-Way ANOVA: Options» (Εικ. 6), μέσω του οποίου μπορούμε να επιλέξουμε, κάνοντας αριστερό κλικ μέσα στο τετραγωνάκι δίπλα από την αντίστοιχη επιλογή να εμφανίζονται «περιγραφικά στατιστικά στοιχεία» ( Descriptive ), όπως μέσοι όροι, τυπικές αποκλίσεις κλπ. να πραγματοποιείται έλεγχος ομοιογένειας των διακυμάνσεων ( Homogeneity of variance test ) να αναπαριστώνται γραφικά οι μέσοι όροι των επιμέρους δειγμάτων, που διαχωρίζονται βάσει της ανεξάρτητης μεταβλητής (παράγοντα) ( Means plot ) να αποκλείονται από την ανάλυση οι περιπτώσεις, δηλαδή τα άτομα, τα οποία έχουν «χαμένη τιμή» στην συγκεκριμένη εξαρτημένη μεταβλητή που μελετάται ( Exclude cases analysis by analysis ) ή να αποκλείονται από την ανάλυση οι περιπτώσεις, δηλαδή τα άτομα, τα οποία έχουν «χαμένη τιμή» σε οποιαδήποτε μεταβλητή του αρχείου ( Exclude cases listwise ) (αυτό ορισμένες φορές εμπεριέχει τον κίνδυνο μεγάλης μείωσης του δείγματος). Εικ. 6. 5
Για να εντοπιστεί μεταξύ ποιών μέσων όρων υπάρχουν στατιστικά σημαντικές διαφορές θα πρέπει να πραγματοποιηθεί κάποιο τεστ πολλαπλών συγκρίσεων. Για να επιλεγεί κάποιο τεστ πολλαπλών συγκρίσεων ενεργοποιούμε το διακόπτη «Post Hoc», κάνοντας αριστερό κλικ πάνω σ αυτόν (Εικ 7). Εικ. 7. Κάνοντας αριστερό κλικ πάνω στο διακόπτη «Post Hoc...», εμφανίζεται το πλαίσιο διαλόγου «One-Way ANOVA: Post Hoc Multiple Comparisons» (Εικ. 8), από το οποίο μπορούμε να επιλέξουμε κάποιο τεστ πολλαπλών συγκρίσεων. Το πλέον διαδεδομένο είναι το τεστ Scheffe, το οποίο ωστόσο μπορεί να εφαρμοστεί μόνο στις περιπτώσεις όπου υπάρχει ισότητα (ομοιογένεια) διακυμάνσεων μεταξύ των επιμέρους δειγμάτων (Equal Variances Assumed) και η οποία ελέγχεται μέσω του ελέγχου ομοιογένειας των διακυμάνσεων («Homogeneity of variance test»), από την επιλογή «Options». Εικ. 8. 6
Αφού γίνουν όλες οι απαραίτητες επιλογές που αναφέρθηκαν παραπάνω, πατώντας των διακόπτη «OK» στο πλαίσιο διαλόγου «One-way ANOVA» (Εικ. 7), πραγματοποιείται η ανάλυση. Αρχικά εμφανίζεται ο πίνακας Descriptives, o οποίος περιλαμβάνει τα στατιστικά των επιμέρους δειγμάτων: N Mean Std. Deviation Descriptives Std. Error 95% Confidence Interval for Mean Lower Bound Upper Bound Minimum Maximum high 8 40.75 3.732 1.319 37.6299 43.8701 35.00 45.00 medium 6 36.00 4.733 1.932 31.0332 40.9668 28.00 41.00 low 12 32.50 3.030.875 30.5747 34.4253 25.00 36.00 Total 26 35.85 5.049.990 33.8067 37.8856 25.00 45.00 N = το μέγεθος του κάθε δείγματος (αποκλείονται τα άτομα που έχουν χαμένες τιμές) Mean = ο μέσος όρος της εξαρτημένης μεταβλητής (jump1) σε κάθε ένα από τα επιμέρους δείγματα (high, medium και low). Std. Deviation = η τυπική απόκλιση της εξαρτημένης μεταβλητής (jump1) σε κάθε ένα από τα επιμέρους δείγματα (high, medium και low). Std. Error Mean = το τυπικό σφάλμα του μέσου όρου της εξαρτημένης μεταβλητής (jump1) σε κάθε ένα από τα επιμέρους δείγματα (high, medium και low). Minimum = η ελάχιστη τιμή της εξαρτημένης μεταβλητής (jump1) σε κάθε ένα από τα επιμέρους δείγματα (high, medium και low). Maximum = η μέγιστη τιμή της εξαρτημένης μεταβλητής (jump1) σε κάθε ένα από τα επιμέρους δείγματα (high, medium και low). Στη συνέχεια εμφανίζεται ο πίνακας Test of Homogeneity of Variances, μέσω του οποίου ελέγχεται η ομοιογένεια (ισότητα) των διακυμάνσεων των μέσων όρων των επιμέρους δειγμάτων, μέσω του στατιστικού του Levene. Test of Homogeneity of Variances Levene df1 df2 Sig. Statistic 1.089 2 23.353 Αν το επίπεδο σημαντικότητας (Sig) του στατιστικού του Levene είναι μεγαλύτερο από 0.05 (Sig > 0.05) γίνεται αποδεκτή η μηδενική υπόθεση σύμφωνα με την οποία: «Ηο: οι διακυμάνσεις των επιμέρους δειγμάτων είναι ίσες μεταξύ τους». Στην αντίθετη περίπτωση, όπου το επίπεδο σημαντικότητας (Sig) του στατιστικού του Levene είναι μικρότερο από 0.05 (Sig < 0.05) απορρίπτεται η μηδενική υπόθεση και γίνεται αποδεκτή η εναλλακτική υπόθεση σύμφωνα με την οποία: «Η Α : οι διακυμάνσεις των επιμέρους δειγμάτων δεν είναι ίσες μεταξύ 7
τους». Απαραίτητη προϋπόθεση για την εφαρμογή της «ανάλυσης διακύμανσης για ανεξάρτητα δείγματα ως προς έναν παράγοντα» (One-way ANOVA), είναι η ισότητα των διακυμάνσεων. Στην αντίθετη περίπτωση θα πρέπει να εφαρμοστεί κάποιο μη παραμετρικό τεστ. Η κατεξοχήν ανάλυση διακύμανσης για ανεξάρτητα δείγματα ως προς έναν παράγοντα (One-Way ANOVA) παρουσιάζεται στον αμέσως επόμενο πίνακα ANOVA. ANOVA Sum of df Mean F Sig. Squares Square Between 326.885 2 163.442 12.107.000 Groups Within 310.500 23 13.500 Groups Total 637.385 25 Ο πίνακας της ανάλυσης διακύμανσης για ανεξάρτητα δείγματα ως προς έναν παράγοντα περιλαμβάνει: Sum of Squares = αθροίσματα τετραγώνων μεταξύ των ομάδων (Between Groups) και αθροίσματα τετραγώνων εντός των ομάδων (Within Groups) (αποτελούν έκφραση διακύμανσης) df = οι αντίστοιχοι βαθμοί ελευθερίας Mean Square = μέσα τετράγωνα μεταξύ των ομάδων (Between Groups) και μέσα τετράγωνα εντός των ομάδων (Within Groups), τα οποία προκύπτουν από την διαίρεση των αντίστοιχων αθροισμάτων τετραγώνων με τους αντίστοιχους βαθμούς ελευθερίας F = η F τιμή, η οποία είναι το πηλίκο του μέσου τετραγώνου μεταξύ των ομάδων προς το μέσο τετράγωνο εντός των ομάδων (163.442 / 13.500 = 12.107) Sig = το επίπεδο σημαντικότητας της F τιμής. Η μηδενική υπόθεση κατά τον έλεγχο της ύπαρξης στατιστικά σημαντικών διαφορών μεταξύ των μέσων όρων των επιμέρους ανεξάρτητων δειγμάτων διατυπώνεται ως εξής: «Η ο : Δεν υπάρχουν στατιστικά σημαντικές διαφορές μεταξύ των μέσων όρων των επιμέρους ανεξάρτητων δειγμάτων, δηλαδή οι μέσοι όροι των πληθυσμών από τους οποίους προέρχονται τα επιμέρους δείγματα είναι ίσοι» (H o : μ 1 = μ 2 = = μ n ). Στο συγκεκριμένο παράδειγμα, σύμφωνα με την μηδενική υπόθεση δεν υπάρχουν στατιστικά σημαντικές διαφορές στην επίδοση στο κατακόρυφο άλμα μεταξύ των αθλητών που έχουν υψηλό, μέτριο ή χαμηλό επίπεδο τεχνικής. Αν το επίπεδο σημαντικότητας της F-τιμής (Sig) είναι μικρότερο από 0.05 (Sig < 0.05) τότε απορρίπτεται η μηδενική υπόθεση και γίνεται αποδεκτή η εναλλακτική 8
υπόθεση, ότι δηλαδή: «Υπάρχουν στατιστικά σημαντικές διαφορές μεταξύ των μέσων όρων των επιμέρους ανεξάρτητων δειγμάτων, δηλαδή οι μέσοι όροι των πληθυσμών από τους οποίους προέρχονται τα επιμέρους δείγματα είναι διαφορετικοί» (H Α : μ 1 μ 2 μ n ). Αν το επίπεδο σημαντικότητας της F-τιμής (Sig) είναι μεγαλύτερο από 0.05 (Sig > 0.05) τότε γίνεται αποδεκτή η μηδενική υπόθεση, ότι δηλαδή: «Δεν υπάρχουν στατιστικά σημαντικές διαφορές μεταξύ των μέσων όρων των επιμέρους ανεξάρτητων δειγμάτων, δηλαδή οι μέσοι όροι των πληθυσμών από τους οποίους προέρχονται τα επιμέρους δείγματα είναι ίσοι» (H o : μ 1 = μ 2 = = μ n ). Στην προκειμένη περίπτωση, όπου το επίπεδο σημαντικότητας της F-τιμής (F= 12.107) είναι μικρότερο από 0.05 (Sig = 0.000 < 0.05), απορρίπτεται η μηδενική υπόθεση και γίνεται αποδεκτή η εναλλακτική υπόθεση οπότε: «Υπάρχουν στατιστικά σημαντικές διαφορές μεταξύ των μέσων όρων των αθλητών που παρουσιάζουν υψηλό, μέτριο ή χαμηλό επίπεδο τεχνικής». Μέχρι το σημείο αυτό έχει απλά διαπιστωθεί η ύπαρξη στατιστικά σημαντικών διαφορών μεταξύ των μέσων όρων των επιμέρους δειγμάτων. Ακόμη δεν έχουν εντοπιστεί αυτές οι διαφορές, δηλαδή ποιοι ακριβώς μέσοι όροι διαφέρουν στατιστικά σημαντικά μεταξύ τους. Ο εντοπισμός των στατιστικά σημαντικών διαφορών μεταξύ των μέσων όρων των επιμέρους δειγμάτων επιτυγχάνεται μέσω των τεστ πολλαπλών συγκρίσεων. Ένα τέτοιο τεστ πολλαπλών συγκρίσεων είναι το τεστ Scheffe το οποίο παρουσιάζεται στο παρακάτω πίνακα Multiple Comparisons: Multiple Comparisons Dependent Variable: counter-movement jump Scheffe Mean Difference (I-J) Std. Error Sig. 95% Confidence Interval (I) (J) Lower technique technique Bound Upper Bound high medium 4.7500 1.984.077 -.4413 9.9413 low 8.2500 * 1.677.000 3.8626 12.6374 medium high -4.7500 1.984.077-9.9413.4413 low 3.5000 1.837.185-1.3062 8.3062 low high -8.2500 * 1.677.000-12.6374-3.8626 medium -3.5000 1.837.185-8.3062 1.3062 * The mean difference is significant at the.05 level. 9
Στον πίνακα του τεστ πολλαπλών συγκρίσεων παρουσιάζονται οι διαφορές μεταξύ των μέσων όρων των επιμέρους δειγμάτων (Mean Difference) το επίπεδο σημαντικότητας (Sig) βάσει του οποίου ελέγχεται κατά πόσο οι διαφορές μεταξύ των μέσων όρων των επιμέρους δειγμάτων (ανά δύο) είναι στατιστικά σημαντικές, δηλαδή κατά πόσο διαφέρουν μεταξύ τους οι μέσοι όροι των πληθυσμών από τους οποίους προέρχονται τα επιμέρους δείγματα το 95% διάστημα εμπιστοσύνης της διαφοράς των μέσων όρων των πληθυσμών. Αν στο διάστημα εμπιστοσύνης της διαφοράς των μέσων όρων των πληθυσμών εμπεριέχεται η τιμή μηδέν (0), τότε δεν υπάρχει στατιστικά σημαντική διαφορά μεταξύ των δύο επιμέρους δειγμάτων. Στο συγκεκριμένο παράδειγμα εντοπίζονται στατιστικά σημαντικές διαφορές μόνο μεταξύ των αθλητών με υψηλό επίπεδο τεχνικής και των αθλητών με χαμηλό επίπεδο τεχνικής. Τρόπος συγγραφής των αποτελεσμάτων: Από την εφαρμογή της ανάλυσης διακύμανσης για ανεξάρτητα δείγματα ως προς έναν παράγοντα διαπιστώθηκε στατιστικά σημαντική επίδραση του παράγοντα «επίπεδο τεχνικής» (F2,23= 12.107; p< 0.05) στην επίδοση στο κατακόρυφο άλμα. Από το τεστ πολλαπλών συγκρίσεων Scheffe διαπιστώθηκαν ωστόσο στατιστικά σημαντικές διαφορές μόνο μεταξύ των αθλητών με υψηλό επίπεδο τεχνικής και των αθλητών με χαμηλό επίπεδο τεχνικής. 10