----------Εισαγωγή στη Χρήση του SPSS for Windows ------------- Σελίδα: 0------------ ΚΕΦΑΛΑΙΟ 6 ο 6.1 Ερωτήσεις Πολλαπλών Απαντήσεων 6.2 Εντολή Case Summaries 6.3 Ο έλεγχος t : (correlate t-test) 6.3.1Σύγκριση δύο δειγµάτων συσχετισµένων/ σχετικών τιµών 6.3.2 Ερµηνεία των αποτελεσµάτων του correlate t-test 6.3.3 Παρουσίαση των αποτελεσµάτων του correlate t-test 6.4 Ο έλεγχος t - (uncorrelate t-test) 6.4.1 Σύγκριση δύο δειγµάτων µη συσχετισµένων / µη σχετικών τιµών 6.4.2 Ερµηνεία των αποτελεσµάτων του uncorrelate t-test 6.4.3 Παρουσίαση των αποτελεσµάτων του uncorrelate t-test 6.5 Ανάλυση διακύµανσης(ανοbα) 6.5.1 Aπλή µη συσχετισµένη ΑΝΟBΑ 6.5.2 Ερµηνεία των αποτελεσµάτων του One-way ANOBA 6.5.3Παρουσίαση των αποτελεσµάτων του One-way ANOBA 6.6 Ανάλυση διακύµανσης ΚΑΤΑ ΕΝΑ ΠΑΡΑΓΟΝΤΑ ΜΕ BLOCKS και Ανάλυση διακύµανσης ΚΑΤΑ 2 ΠΑΡΑΓΟΝΤΕΣ 6.6.1 Ανάλυση διακύµανσης 6.6.2 Ερµηνεία των αποτελεσµάτων 6.6.3 Παρουσίαση των αποτελεσµάτων
----------Εισαγωγή στη Χρήση του SPSS for Windows ------------- Σελίδα: 1------------ 6.1 ΕΡΩΤΗΣΕΙΣ ΠΟΛΛΑΠΛΩΝ ΑΠΑΝΤΗΣΕΩΝ Οι ερωτήσεις στις οποίες ο κάθε ερωτώµενος ( case ) επιτρέπεται να δώσει περισσότερες από µία απαντήσεις αναφορικά µε ένα χαρακτηριστικό, ονοµάζονται ερωτήσεις πολλαπλών απαντήσεων. Για την καταγραφή της πληροφορίας που συγκεντρώνεται από τέτοιου είδους ερωτήσεις πρέπει να χρησιµοποιηθούν περισσότερες από µια µεταβλητές. Για παράδειγµα, έστω ότι έχουµε 5 µάρκες ποτού (a, b, c, d, e) και ζητάµε από κάθε έναν ερωτώµενο να µας αναφέρει τις µάρκες που κατανάλωσε. Η καταγραφή της συλλεγόµενης αυτής πληροφορίας, δηλαδή η κωδικογράφησή της µπορεί να γίνει µε δύο τρόπους: l. Χρήση διχοτοµικών µεταβλητών: Στην περίπτωση αυτή πρέπει να απεικονίσουµε κάθε µάρκα ποτού µε µία µεταβλητή. Και οι πέντε µεταβλητές θα πρέπει να παίρνουν τιµές Ο και 1, ανάλογα µε το αν ο ερωτώµενος πίνει ή όχι την αντίστοιχη µάρκα. Ερωτώµενος whsico#a Whsico# whsico#c whsico#d whsico#e 1 1 1 0 0 1 2 0 1 1 0 0 3 0 1 0 0 0 2. Χρήση κατηγοριών µεταβλητών: Στην περίπτωση χρειαζόµαστε τόσες µεταβλητές όσες είναι οι επιτρεπτές απαντήσεις. Αν, για παράδειγµα, η ερώτηση δεχόταν µέχρι τρεις απαντήσεις τότε θα έπρεπε να έχουµε στο αρχείο δεδοµένων τρεις µεταβλητές. Οι τιµές των µεταβλητών αυτών θα ήταν οι πέντε µάρκες ποτών. Στον πίνακα παρακάτω απεικονίζονται πέντε µεταβλητές, για την περίπτωση που οι ερωτώµενοι µπορούν να δώσουν πέντε διαφορετικές απαντήσεις. 1η επιλογή 2η επιλογή 3η επιλογή µάρκας µάρκας µάρκας 1 1 2 5 2 2 3 3 2 4η επιλογή µάρκας 5η επιλογή µάρκας
----------Εισαγωγή στη Χρήση του SPSS for Windows ------------- Σελίδα: 2------------ Και στις δύο περιπτώσεις η µάρκα " 1 " χρησιµοποιείται µία φορά, η µάρκα "2" τρεις φορές, η µάρκα "3 " µία φορά, η µάρκα "4" δεν χρησιµοποιείται, ενώ η µάρκα "5" χρησιµοποιείται µία φορά. Εποµένως, ο πίνακας κατανοµών είναι: Μάρκα Αναφορές % επι του συνόλου των αναφορών 1 1 1/6 1/3 2 3 3/6 3/3 3 1 1/6 1/3 4 0 0/6 0/3 5 1 1/6 1/3 Σύνολο χρήσεων 6 Σύν περιπτώσεων 3 % επι του συνόλου των περιπτώσεων Οι µεταβλητές που περιγράφουν τις ερωτήσεις πολλαπλών µεταβλητών µπορούν να αναλυθούν και από την ειδική εντολή του SPSS που ενεργοποιείται από τη διαδροµή ΑΝΑlΥΖΕ MULTIPLE RESPONSE Στη διαδικασία αυτή πρέπει να οριστεί η πολλαπλή ερώτηση και µετά να πινακοποιηθεί Για παράδειγµα στο πεδίο 'Variables ίη set' Επιλέγονται οι πέντε µάρκες που αναπαριστούν την πληροφορία της ερώτησης πολλαπλών µεταβλητών. Στο πεδίο.name' ορίζεται το όνοµα της ειδικής µεταβλητής και στο πεδίο.label' η περιγραφή της. Επίσης, στο πεδίο.variables are Coded As' δηλώνονται εάν οι µεταβλητές είναι κατηγορικές ή διχοτοµικές. Στην συνέχεια επιλέγεται το πλήκτρο ' Add' από το δεξί µέρος του παραθύρου για να προστεθεί το αποτέλεσµα του ορισµού της πολλαπλής απάντησης. Για την µετάβαση στη επόµενη διαδικασία επιλέγεται το πλήκτρο ΟΚ.
----------Εισαγωγή στη Χρήση του SPSS for Windows ------------- Σελίδα: 3------------ Σ:τη συνέχεια για την παρουσίαση των αποτελεσµάτων της πολλαπλής απάντησης µπορούµε να επιλέξουµε Είτε από την διαδικασία ANALYZE MULTIPLE RESPONSE FREQUENCIES, για την παραγωγή πινάκων συχνοτήτων Count Πριν το πείραµα Μετά το πείραµα $MARKA 1 2 WHISCO#A 39 31 70 MAΡΚΑ Σkωτσ. 1 7,5 6,2 WHISCO#B 32 25 MAΡΚΑ Σkωτσ. 1 6,1 5,0 WHISCO#C 64 48 MAΡΚΑ Σkωτσ. 1 12,2 9,6 WHISCO#V 40 53 Row Total 6,8 57 5,6 112 11,0 93 KAMMIA 7,6 10,6 9,1 Column 523 499 Total 51,2 48,8 1022 1 είτε την διαδικασία ΑΝΑLΥΖΕ MULTIPLE RESPONSE CROSSTABS, για την δηµιουργία πινάκων διπλή εισόδου
----------Εισαγωγή στη Χρήση του SPSS for Windows ------------- Σελίδα: 4------------ 6.2 ΕΝΤΟΛΗ CASE SUMMARIES παρουσιαστούν Με την εντολή αυτή παρουσιάζεται η λίστα των εγγραφών των επιλεγµένων µεταβλητών µε την σειρά που αυτές απεικονίζονται στον 'Data editor' του SPSS. Για την εντολή ακολουθούµε την διαδροµή ANALYZE Report Case Summaries. Στο πεδίο 'Variables' εισάγουµε τις µεταβλητές οι τιµές των οποίων θα στο πίνακα. Στο δεύτερο πεδίο παρέχεται η δυνατότητα οµαδοποίησης των µεταβλητών βάσει κάποιων χαρακτηριστικών (πχ βάσει του φύλου). Με την επιλογή του πλήκτρου 'Statistics, επιλέγονται τα στατιστικά µέτρα που θα περιέχονται στον πίνακα, ενώ µε την επιλογή Option ορίζουµε ειδκά χαρακτηριστικά όπως πχ εισαγωγή Τιτλου
----------Εισαγωγή στη Χρήση του SPSS for Windows ------------- Σελίδα: 5------------ 6.3 Ο έλεγχος t : (correlate t-test) 6.3.1Σύγκριση δύο δειγµάτων συσχετισµένων/ σχετικών τιµών Ένα συνηθισµένο ερώτηµα στην έρευνα είναι αν η µέση τιµή (µέσος όρος) ενός συνόλου τιµών διαφέρει από τη µέση τιµή ενός άλλου συνόλου. Επειδή στη στατιστική έρευνα ασχολούµαστε µε δείγµατα ατόµων τα οποία έχουν ληφθεί από το συνολικό πληθυσµό της έρευνας πρέπει να εκτιµήσουµε αν οποιαδήποτε διαφορά εντοπίζουµε µεταξύ των δύο συνόλων τιµών έχει στατιστική σηµαντικότητα. ηλαδή, είναι η διαφορά που εντοπίσαµε µεταξύ των δύο µέσων όρων τόσο διαφορετική από µηδενική, ώστε να µην είναι πιθανό τα δύο δείγµατα να προέρχονται από τον ίδιο πληθυσµό; Υπάρχουν δύο εκδόσεις του ελέγχου t(t-test). Η µία χρησιµοποιείται όταν τα δύο προς σύγκριση σύνολα τιµών προέρχονται από ένα µοναδικό δείγµα ανθρώπων ή όταν ο συντελεστής συσχέτισης µεταξύ των δύο συνόλων τιµών είναι µεγάλος. Αυτή η έκδοση είναι γνωστή ως συσχετισµένος έλεγχος t (correlate t- test). Αν τα δύο σύνολα τιµών προέρχονται από δύο διαφορετικές οµάδες ατόµων, Πηγαίνετε στον επόµενο έλεγχο. (Αν έχετε χρησιµοποιήσει κάποια διαδικασία οµοιότητας για να δηµιουργήσετε ζεύγη ατόµων µε βάση κάποια άλλα χαρακτηριστικά, µπορείτε να χρησιµοποιήσετε και στην περίπτωση αυτή τον έλεγχο t που αναλύεται εδώ ειδικά αν τα δύο σύνολα τιµών έχουν υψηλό συντελεστή συσχέτισης). Η καταχώριση δεδοµένων για συσχετιζόµενες και µη συσχετιζόµενες µεταβλητές είναι πολύ διαφορετική στο SPSS και, εποµένως πρέπει να προσέξετε να σχεδιάσετε την ανάλυσή σας πριν από την καταχώριση των δε δοµένων, ώστε να αποφύγετε προβλήµατα και άχρηστη επιπλέον δουλειά. Αν έχετε περισσότερο από δύο σύνολα τιµών να συγκρίνετε, πηγαίνετε στο Κεφάλαιο 21 που αφορά την ανάλυση διακύµανσης Θα δούµε εδώ το συσχετισµένο έλεγχο t (correlate t-test) για τις µετρήσεις βάρους πριν και µετά την εφαρµογή µιας δίαιτας σε δώδεκα άτοµα που εµφανίζονται στον παρακάτω πίνακα:
----------Εισαγωγή στη Χρήση του SPSS for Windows ------------- Σελίδα: 6------------ Μετρήσεις βάρους πριν και µετά την εφαρµογή µιας δίαιτας Βαρος πριν τη ίαιτα Βάρος µετά τη ίαιτα 78,00 80,00 67,00 70,00 56,00 60,00 45,00 50,00 56,00 59,00 67,00 71,00 89,00 90,00 87,00 89,00 66,00 69,00 54,00 58,00 80,00 82,00 81,00 84,00 Καταχωρούµε τα παραπάνω δεδοµένα σε δυό µεταβλητές Barospr Barosme και µετα επιλέγουµε τη διαδροµή: Analyse Compare means Paired Samples T test Εµφανίζεται το παρακάτω πλαίσιο διαλόγου : Επιλέγουµε τις δυο µεταβλητές µεταφέρουµε το ζευγάρι αυτό στο πεδίο Paired Variables και µε κλικ στο οκ παίρνουµε τους παρακάτω πίνακες σε Output:
----------Εισαγωγή στη Χρήση του SPSS for Windows ------------- Σελίδα: 7------------ 6.3.2 Ερµηνεία των αποτελεσµάτων του correlate t-test 1. Στον πρώτο πίνακα των αποτελεσµάτων, το µέσο Βάρος πριν τη δίαιτα (barospr) ίσο µε 68,8 και µέσο Βάρος µετά τη δίαιτα (barospr) ίσο 71,8 εµφανίζεται κάτω από την επικεφαλίδα Mean Paired Samples Statistics. Pair 1 Βάρος Πριν Βάρος µετά Std. Error Mean N Std. Deviation Mean 68,8333 12 14,22439 4,10623 71,8333 12 13,23792 3,82146 2. Στο δεύτερο πίνακα των αποτελεσµάτων υπάρχει ο συντελεστής συσχέτισης (Pearson) µεταξύ των δύο µεταβλητών (barospr-barosme). Στην Ι ΑΝΙΚΗ περίπτωση, η τιµή αυτή πρέπει να είναι αρκετά µεγάλη (για την ακρίβεια, είναι.999) και στατιστικά σηµαντική (που δεν είναι, µε επίπεδο σηµαντικότητας.000). 0 συσχετισµένος έλεγχος t υποθέτει ότι υπάρχει συσχέτιση µεταξύ των δύο µεταβλητών, οπότε ίσως θεωρήσετε το µη συσχετισµένο έλεγχο t ( επόµενος) ως πιο κατάλληλο για την περίπτωση αυτή. Paired Samples Correlations Pair 1 Βάρος Πριν & Βάρος µετά N Correlation Sig. 12,999,000 3. Στον Τρίτο πίνακα των αποτελεσµάτων, η διαφορά µεταξύ των δύο µέσων όρων εµφανίζεται κάτω από την ετικέτα Mean του Peared Differences, και το τυπικό σφάλµα αυτού του µέσου όρου κάτω από την ετικέτα Std.Error Mean Η διαφορά µεταξύ των δύο µέσων όρων είναι -3.00 και το εκτιµώµενο τυπικό σφάλµα των µέσων όρων του δείγµατος αυτού είναι.325 Η τιµή t της διαφοράς µεταξύ των µέσων όρων του δείγµατος, οι βαθµοί ελευθερίας df της, και το επίπεδο σηµαντικότητάς της εµφανίζονται επίσης στον τρίτο αυτόν πίνακα. Η τιµή t είναι -1.984, και έχει επίπεδο σηµαντικότητας Sig.(2-tailer).000 µε 11 βαθµούς ελευθερίας df. Paired Samples Test Pair 1 Βάρος Πριν - Βάρος µ Paired Differences 95% Confidence Interval of the Std. Error Difference Mean Std. Deviation Mean Lower Upper t df Sig. (2-tailed) -3,0000 1,12815,32567-3,7168-2,2832-9,212 11,000
----------Εισαγωγή στη Χρήση του SPSS for Windows ------------- Σελίδα: 8------------ 6.3.3 Παρουσίαση των αποτελεσµάτων του correlate t-test Θα µπορούσαµε να παρουσιάσουµε τα αποτελέσµατα αυτά ως εξής: Το µέσο Βάρος πριν τη δίαιτα (Μ = 68,8, St.dev = 14,2) και µετα (Μ = 71,8, St.dev = 13,2) δε διαφέρουν σηµαντικά (t=-9,2, df= 11, 2-tailer =.000). Για να είµαστε συνεπείς, θα αναφέρουµε το ακριβές επίπεδο της πιθανότητας για σηµαντικά αποτελέσµατα όπως τα παραπάνω. Όµως. είναι εξίσου αποδεκτό να τα αναφέρουµε ως «p<.001 ή significant (σηµαντικό). Αν προτιµάτε να χρησιµοποιήσετε διαστήµατα εµπιστοσύνης, θα µπορούσατε να αναφέρετε τα αποτελέσµατα ως εξής: Το µέσο Βάρος πριν τη δίαιτα είναι 68,8,( St.dev = 14,2), και µετά είναι 71,8(St.Dev = 13,2). Η διαφορά είναι 3.00. Το διάστηµα εµπιστοσύνης 95% της διαφοράς αυτής είναι -3.71 έως -2.28. Επειδή το διάστηµα εµπιστοσύνης δεν περιέχει το 0.00, η διαφορά είναι στατιστικώς σηµαντική σε επίπεδο διπλής ουράς 5% Η αναφορά των διαστηµάτων εµπιστοσύνης αντί για τα επίπεδα σηµαντικότητας συνιστάται από µερικούς στατιστικούς, αλλά παραµένει σχετικά ασυνήθης.
----------Εισαγωγή στη Χρήση του SPSS for Windows ------------- Σελίδα: 9------------ 6.4 Ο έλεγχος t - (uncorrelate t-test) 6.4.1 Σύγκριση δύο δειγµάτων µη συσχετισµένων / µη σχετικών τιµών Ο µη συσχετισµένος (uncorrelated ή unrelated) έλεγχος t χρησιµοποιείται για τον υπολογισµό τού αν oι µέσοι, όροι δύο συνόλων τιµών διαφέρουν σηµαντικά ο ένας από τον άλλο Είναι η πιο συνήθης µορφή του ελέγχου t:. Ο µη συσχετισµένος έλεγχος t χρησιµοποιείται όταν τα δύο σύνολα τιµών προέρχονται από δύο διαφορετικά δείγµατα ατόµων (Ανατρέξτε στην προηγούµενη ενότητα για το συσχετισµένο έλεγχο t αν τα δεδοµένα σας προέρχονται από ένα µόνο σύνολο ατόµων. Η καταχώριση δεδοµένων για συσχετιζόµενες και µη συσχετιζόµενες µεταβλητές είναι πολύ διαφορετική στο SPSS και, εποµένως πρέπει να προσέξετε να σχεδιάσετε την ανάλυσή σας πριν από την καταχώριση των δεδοµένων, ώστε να αποφύγετε προβλήµατα και άχρηστη επιπλέον δουλειά. Στο SPSS, σι διαδικασίες για το µη συσχετισµένο έλεγχο t είναι πολύ χρήσιµες επειδή περιλαµβάνουν µια επιλογή για τον υπολογισµό του όταν οι διακυµάνσεις των δύο συνόλων τιµών είναι σηµαντικά διαφορετικές µετα ξύ τους. Αν έχετε περισσότερα από δύο σύνολα τιµών να συγκρίνετε, πηγαίνετε στη επόµενη ανάλυση ANCOBA η ANOBA που αφορά τη µη συσχετισµένη ανάλυση διακύµανσης Θα δείξουµε τον υπολογισµό τού µη συσχετισµένου ελέγχου t µε τα δεδοµένα του παρακάτω Πίνακα, ο οποίος δείχνει το Βαρος 10 γυναικών ηλικίας 35 ετών από την Αφρική, και 10 γυναικών ηλικίας 35 ετών από την Ευρώπη. Στο SPSS αυτό το είδος ελέγχου t ονοµάζεται Έλεγχος t µε ανεξάρτητο δείγµα ( Indepentent Sample t-test )
----------Εισαγωγή στη Χρήση του SPSS for Windows ------------- Σελίδα: 10------------ Μετρήσεις βάρους 10 γυναικών από Ευρώπη και 10 από Αφρική Ηπειρος Βάρος Ηπειρος Βάρος 1 58,00 2 50,00 1 57,00 2 40,00 1 56,00 2 40,00 1 45,00 2 50,00 1 56,00 2 49,00 1 67,00 2 41,00 1 59,00 2 51,00 1 67,00 2 39,00 1 66,00 2 49,00 1 54,00 2 48,00 Καταχωρούµε τα παραπάνω δεδοµένα σε δυό µεταβλητές region Baros 1-Ευρώπη 2-Αφρική για τιµές της µεταβλητης region δηλαδή έχουµε 20 γραµµές(20-cases) σε 2 στήλες στο data-view του SPSS και µετά επιλέγουµε τη διαδροµή: Analyse Compare means Indepentent Samples T test Εµφανίζεται το παρακάτω πλαίσιο διαλόγου : Επιλέγουµε τη µεταβλητη Baros και τη µεταφέρουµε στο πεδίο Test Variables και µε κλικ στο οκ παίρνουµε τους παρακάτω πίνακες σε Output: Επιλέγουµε τη µεταβλητη region και τη µεταφέρουµε στο πεδίο GroupingVariable (µεταβλητή οµαδοποίησης) Πατώντας το Define groups εµφανίζεται το παρακάτω πλαίσιο διαλόγου
----------Εισαγωγή στη Χρήση του SPSS for Windows ------------- Σελίδα: 11------------ Βαζουµε 1 και 2 για τις δυο οµάδες που θα συγκριθούν και χτυπάµε Continue Μετα µε ΟΚ παίρνουµε τους παρακάτω πίνακες στο Output 6.4.2 Ερµηνεία των αποτελεσµάτων των Πινακων uncorrelate t-test Στα αποτελέσµατα του µη συσχετισµένου ελέγχου t υπάρχουν δύο είδη µη συσχετισµένου ελέγχου t Το ποιο από τα δύο θα χρησιµοποιήσετε εξαρτάται από το αν υπάρχει ή όχι σηµαντική διαφορά µεταξύ των (εκτιµώµενων) διακυµάνσεων για τις δύο οµάδες τιµών. 1. Παρατηρήστε τον πρώτο πίνακα των αποτελεσµάτων. Βάρος Ηπειρος Ευρώπη Αφρική Group Statistics Std. Error N Mean Std. Deviation Mean 10 58,5000 6,81909 2,15639 10 45,7000 4,98999 1,57797 Περιέχει τους µέσους όρους και τις τυπικές αποκλίσεις των τιµών της εξαρτηµένης µεταβλητής (Βάρος) των δύο οµάδων. Παρατηρήστε ότι ο υπολογιστής έχει προσθέσει την οµάδα (Ευρώπη Αφρική) στο όνοµα της στήλης(βάρος) που περιέχει την εξαρτηµένη µεταβλητή. ετσι προσδιορίζει σε ποια από τις δύο οµάδες αναφέρεται η γραµµή. Αν δεν είχατε δώσει ετικέτες στις τιµές σας, αυτές οι ετικέτες θα δίνονταν σαν αριθµοι 1 αντι Ευρώπη 2 αντί Αφρική. Για γυναίκες από Ευρώπη (region= 1), η µέση τιµή Βάρος είναι 58.5 και η τυπική απόκλιση των τιµών του Βάρους είναι 6.8. Για γυναίκες από Αφρική (region= 2, η µέση τιµή Βάρος είναι 45.7 και η τυπική απόκλιση των τιµών του Βάρους είναι 4.99
----------Εισαγωγή στη Χρήση του SPSS for Windows ------------- Σελίδα: 12------------ 2. Στο δεύτερο πίνακα, διαβάστε τη γραµµή που γράφει Levene's Test for Equality of Variances (Ελεγχος Levene's για την ισότητα των διακυµάνσεων). Αν η τιµή της πιθανότητας (propability) είναι στατιστικώς σηµαντική, σι διακυµάνσεις σας είναι ΑΝΙΣΕΣ, ιαφορετικά, θεωρούνται ίσες. Ο έλεγχος Levene's για την ισότητα των διακυµάνσεων στην περίπτωσή µας λέει πως οι διακυµάνσεις είναι ίσες, επειδή η τιµή 0.762 της πιθανότητας ρ δεν είναι στατιστικώς σηµαντική. Συνεπώς, χρειαζόµαστε τη πρώτη γραµµή Equal variances assumed (Οι διακυµάνσεις θεωρούνται ίσες). Εµφανίζονται η τιµή t =4,79, οι βαθµοί ελευθερίας της df=18, και η πιθανότητα (2-tailed)= 0.001. Η τιµή t για ίσες διακυµάνσεις είναι 4,79 η οποία, µε 18 βαθµούς ελευθερίας df, έχει ακριβές επίπεδο σηµαντικότητας διπλής ουράς (2-tailed)= 0.001 Αν ο έλεγχος Levene για την ισότητα των διακυµάνσεων ήταν στατιστικώς σηµαντικός (δηλαδή 0.05 ή µικρότερη τιµή), θα έπρεπε να χρησιµοποιήσετε τη δεύτερη γραµµή των αποτελεσµάτων, η οποία δίνει τις τιµές του ελέγχου t για άνισες διακυµάνσεις.. Βάρος Equal variance assumed Equal variance not assumed Levene's Test for Equality of Variances F Sig. Independent Samples Test t-test for Equality of Means Mean t df Sig. (2-tailed) Difference 95% Confidence Interval of the Difference Std. Error Difference Lower Upper,094,762 4,790 18,000 12,8000 2,67208 7,18617 18,41383 4,790 16,491,000 12,8000 2,67208 7,14912 18,45088 6.4.3 Παρουσίαση των αποτελεσµάτων του uncorrelate t-test Θα µπορούσαµε να παρουσιάσουµε τα αποτελέσµατα της ανάλυσής µας ως εξής: Ο µέσος όρος των τιµών βάρους για γυναίκες από Ευρώπη (Μ = 58.5, ST.dev = 6.8) είναι σηµαντικά υψηλότερος (t = 4.79, df =1820, 2-tailed ρ =.0 01) από αυτόν για γυναίκες από Αφρική (Μ =45.7, St.De = 4.99). Για να αιτιολογήσουµε τη επιλογή µεθόδου θα µπορούσαµε να γράψουµε: Επειδή οι διακυµάνσεις των δύο οµάδων ήταν σηµαντικά άνισες (Ρ = 8.43, ρ<.05), χρησιµοποιήθηκε έλεγχος t για άνισες διακυµάνσεις.(uncorrelate t- test). Αν προτιµάτε να χρησιµοποιήσετε διαστήµατα εµπιστοσύνης, θα µπορούσατε να αναφέρετε τα αποτελέσµατα ως εξής: Η διαφορά µεταξύ των τιµών βάρους για γυναίκες από Ευρώπη (Μ = 58.5, ST.dev = 6.8) και τιµών βάρους για γυναίκες από Αφρική (Μ =45.7, St.De = 4.99). είναι 12,8. Το διάστηµα εµπιστοσύνης 95% της διαφοράς κυµαίνεται από 7,19 έως 8,4. Επειδή το διάστηµα εµπιστοσύνης δεν περιέχει το 0.00, η διαφορά είναι στατιστικώς σηµαντική σε επίπεδο διπλής ουράς 5%.
----------Εισαγωγή στη Χρήση του SPSS for Windows ------------- Σελίδα: 13------------ 6.5 Ανάλυση διακύµανσης(ανοbα) 6.5.1 Aπλή µη συσχετισµένη ΑΝΟBΑ Η µη συσχετισµένη ανάλυση διακύµανσης σας λέει αν δύο ή περισσότερες οµάδες τιµών έχουν πολύ διαφορετικούς µέσους όρους.υποθέτει ότι οι οµάδες τιµών προέρχονται από διαφορετικά άτοµα. εν είναι απαραίτητο το πλήθος των τιµών να είναι ίδιο και στις δύο οµάδες. Η ερµηνεία της ανάλυσης διακύµανσης µπορεί να είναι δύσκολη για τρεις ή περισσότερες οµάδες τιµών. Στις συνθήκες αυτές µπορεί να αποδειχθεί δύσκολη η εκτίµηση του πού βρίσκονται σι διαφορές. Για το λόγο αυτόν, ίσως χρειαστεί να χωρίσετε την ανάλυση σε πολλές διαφορετικές συγκρίσεις για να εκτιµήσετε ποια οµάδα τιµών είναι αυτή που παρουσιάζει σηµαντική διαφορά από τις υπόλοιπες. Στην ιδανική περίπτωση, πρέπει να γίνει κάποια προσαρµογή για τον αριθµό των συγκρίσεων (δείτε το Κεφάλαιο 23 για τις πολλαπλές συγκρίσεις και για περισσότερες πληροφορίες σχετικά µε καλύτερες µεθόδους από αυτές που περιγράφουµε στο παρόν κεφάλαιο). Θα δείξουµε τον υπολογισµό της απλής µη συσχετισµένης ανάλυσης διακύµανσης µε τα δεδοµένα του Πίνακα,ο οποίος παρουσιάζει τις επιδόσεις τριών συµµετεχόντων ( Τρια άτοµα ) σε τρεις καταστάσεις ( Τρεις δίαιτες). Πρόκειται για µια µελέτη της επίδρασης εφαρµογής διαφορετικών διαιτολογίων στο βάρος. Η δίαιτα είναι η ανεξάρτητη και το βάρος είναι η εξαρτηµένη µεταβλητή. ιαλέξαµε το όνοµα diet και την ετικέτα «Είδος ίαιτας» για την ανεξάρτητη µεταβλητή µε τιµές 1=1 η ίαιτα, 2=2 η ίαιτα 3=3 η ίαιτα, το όνοµα lipos και την ετικέτα είκτης σωµατικού λίπους που βλέπετε στο Πίνακα. είκτης Ειδος σωµατικού διατας λίπους 1 22,5 1 30 1 20 2 10 2 5 2 12,5 3 7,5 3 15 3 7,5 Αφού κατασκευάσουµε τις µεταβλητές diet, lipos στο SPSS και καταχωρήσουµε τα δεδοµένα στις δυο µεταβλητές επιλέγουµε τη διαδροµή: Analyze Compare Means One way ANOBA
----------Εισαγωγή στη Χρήση του SPSS for Windows ------------- Σελίδα: 14------------ Ανοίγει το πλαίσιο διαλόγου: Επιλέγουµε Options και στο πλαίσιο διαλόγου που εµφανίζεται τσεκάρουµε Desctiptive και Homogeneity of Variance (Οµογένεια ιακύµανσης) Χτυπάµε Continue και µε OK παίρνουµε τα αποτελέσµατα στο Output Viewer Ερµηνεία των αποτελεσµάτων One-way ANOBA Τα περιγραφικά στατιστικά παρουσιάζονται στον πρώτο πίνακα, ο έλεγχος ο µοιογένειας διακυµάνσεων στο δεύτερο πίνακα, και η ανάλυση του πίνακα διακυµάνσεων στον τρίτο. 1 ος Πίνακας: περιγραφικά στατιστικά είκτης σωµατικού λίπους 1η ίαιτα 2η ίαιτα 3η ίαιτα Total Descriptives 95% Confidence Interval for Mean Std. Std. Lower Upper N Mean Deviation Error Bound Bound Minimum Maximum 3 24,17 5,20416 3,00463 11,2388 37,0945 20,0 30,0 3 9,167 3,81881 2,20479 -,3198 18,6531 5,00 12,5 3 10,00 4,33013 2,50000 -,7566 20,7566 7,50 15,0 9 14,44 8,27060 2,75687 8,0871 20,8018 5,00 30,0 2 ος Πίνακας: έλεγχος οµοιογένειας διακυµάνσεων Test of Homogeneity of Variances είκτης σωµατικού λίπους Levene Statistic df1 df2 Sig.,293 2 6,756
----------Εισαγωγή στη Χρήση του SPSS for Windows ------------- Σελίδα: 15------------ 3 ος Πίνακας: ανάλυση του πίνακα διακυµάνσεων είκτης σωµατικού λίπους Between Groups Within Groups Total ANOVA Sum of Squares df Mean Square F Sig. 426,389 2 213,194 10,586,011 120,833 6 20,139 547,222 8 Καθώς η πιθανότητα του ελέγχου Levene δεν είναι σηµαντική 0,293, οι διακυµάνσεις παρουσιάζουν οµοιογένεια (δε διαφέρουν). Ετσι, µπορούµε να ερµηνεύσουµε το λόγο F χωρίς να µετασχηµατίσουµε τα δεδοµένα. Ο λόγος F προκύπτει από τη διαίρεση του µέσου τετραγώνου µεταξύ των οµάδων (Between Group Mean Square) µε το µέσο τετράγωνο στο εσωτερικό των οµάδων Group Mean Square) και είναι ίσος µε 10.586 (34.111/3.222 = 10.5869). Η πιθανότητα αυτού του λόγου F είναι.011. Με άλλα λόγια, είναι µικρότερη από την κρίσιµη τιµή του 0.05 και εποµένως είναι στατιστικώς σηµαντική. Αυτό δείχνει πως υπάρχει σηµαντική διαφορά µεταξύ των τριών οµάδων. ΟΜΩΣ, ΚΑΤΙ ΤΕΤΟΙΟ Ε ΣΗΜΑΙΝΕΙ ΑΠΑΡΑΙΤΗΤΑ ΟΤΙ ΟΛΟΙ ΟΙ ΜΕ- ΣΟΙ ΟΡΟΙ ΕΙΝΑΙ ΣΗΜΑΝΤΙΚΑ ΙΑΦΟΡΕΤΙΚΟΙ ΜΕΤΑΞΥ ΤΟΥΣ. ΣΤΗΝ ΠΕΡΙΠΤΩΣΗ ΑΥΤΗ, ΑΝΑΜΕΝΕΙ ΚΑΝΕΙΣ ΟΤΙ ΟΙ ΜΕΣΟΙ ΟΡΟΙ 3.67 ΚΑΙ 4.00 Ε ΙΑΦΕΡΟΥΝ ΣΗΜΑΝΤΙΚΑ. Ποιός από τους µέσους όρους διαφέρει σηµαντικά από τους άλλους µπορεί να διερευνηθεί κατόπιν, µε τη χρήση ελέγχων πολλαπλής σύγκρισης όπως ο µη συσχετισµένος έλεγχος t. ε χρειάζεται να καταχωρίσετε τα δεδοµένα από την αρχή. Εκείνο που πρέπει να κάνετε είναι ένας µη συσχετισµένος έλεγχος t ορίζοντας τις οµάδες ως 1 και 2, µετά ορίζοντάς τις ως 1 και 3, και τέλος ως 2 και 3. Στο παράδειγµά µας, η οµάδα 1 διαφέρει σηµαντικά από τις οµάδες 2 και 3, οι οποίες δε διαφέρουν πολύ µεταξύ τους. Επειδή κάνουµε τρεις συγκρίσεις, το ακριβές επίπεδο σηµαντικότητας κάθε ελέγχου t πρέπει να πολλαπλασιαστεί επί 3 για να µας δώσει το επίπεδο σηµαντικότητας Bonferroni 6.5.4Παρουσίαση των αποτελεσµάτων του One-way ANOBA Θα µπορούσαµε να παρουσιάσουµε τα αποτελέσµατα που βρήκαµε ως εξής: Η επίδραση της 3 ης ίαιτας βρέθηκε συνολικά σηµαντική (F= 10.58, p = 0.011). Μετά από µια προσαρµογή κατά Bonferroni για τον αριθµό των συγκρίσεων, η µοναδική σηµαντική διαφορά βρέθηκε µεταξύ των µέσων όρων της 1 ης ίαιτας και της 2 ης ίαιτας (t= 4.02, df= 4, p διπλής ουράς <.05). Ο µέσος όρος της 1 ης ίαιτας (Μ = 9.67, SD = 2.08) ήταν σηµαντικά µεγαλύτερος από αυτόν της 2 ης ίαιτας (Μ = 3.67, SD = 1.53). εν προέκυψε σηµαντική διαφορά µεταξύ του µέσου όρου 3 ης ίαιτας και της 1 ης ή της 2 ης ίαιτας.
----------Εισαγωγή στη Χρήση του SPSS for Windows ------------- Σελίδα: 16------------ Boxplot 40 30 είκτης σωµατικού λίπους 20 10 0 N = 3 3 3 1η ίαιτα 2η ίαιτα 3η ίαιτα Είδος ίαιτας Scatter 40 30 είκτης σωµατικού λίπους 20 10 0,5 1,0 1,5 2,0 2,5 3,0 3,5 Είδος ίαιτας
----------Εισαγωγή στη Χρήση του SPSS for Windows ------------- Σελίδα: 17------------ 6.6 ΑΝΑΛΥΣΗ ΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΕΝΑ ΠΑΡΑΓΟΝΤΑ ΜΕ BLOCKS ΚΑΙ ΑΝΑΛΥΣΗ ΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ 2 ΠΑΡΑΓΟΝΤΕΣ Και τα δύο παραπάνω είδη πειραµατικών σχεδιασµών µαθηµατικά αναλύονται µε τον ίδιο τρόπο. Συνεπώς τα παρουσιάζουµε ως µία µεθοδολογία για λόγους συντοµίας. Οι φοιτητές πρέπει να προσέξουν στην ερµηνεία που δίνουν στα αποτελέσµατα ώστε να είναι η κατάλληλη για τον πειραµατικό σχεδιασµό που έχει δώσει τα δεδοµένα τους. Η διπλή ανάλυση διακύµανσης σας δίνει τη δυνατότητα να συγκρίνετε µε το µέσο όρο των εξαρτηµένων µεταβλητών όταν έχετε ΥΟ ανεξάρτητες µεταβλητές. Αν έχετε περισσότερες από µία ΕΞΑΡΤΗΜΕΝΕΣ µεταβλητές, απλώς επαναλαµβάνετε τη διαδικασία γιο κάθε µία από αυτές ξεχωριστά. Από την άλλη, αν οι διάφορες εξαρτηµένες µεταβλητές έχουν περίπου τις ίδιες τιµές θα µπορούσατε να τις συνδυάσετε σε µία οµάδα µε τις διαδικασίες συνάθροισης που περιγράψαµε στο Tansform Compute Έστω ότι έχουµε έναν παράγοντα (µε όνοµα Α) που µας ενδιαφέρει να εξετάσουµε αν επιδρά στην τυχαία µεταβλητή Υ. Στο πείραµα µας θεωρούµε κι ένα δεύτερο παράγοντα ή blocks (µε όνοµα Β). Θεωρούµε δύο επίπεδα από κάθε παράγοντα και σε κάθε συνδυασµό επιπέδων παίρνουµε 5 παρατηρήσεις. Καταχώριση δεδοµένων Σε µία στήλη καταχωρούµε τις 20 µετρήσεις της Υ και σε δύο άλλες (έστω µε ονόµατα factora και factorb) τοποθετούµε ψευδοτιµές (1 και 2 αλλά θα µπορούσαν να είναι και άλλες(όπως στο παραδειγµα που θα ακολουθήσει µε το alcohol) που δείχνουν τα επίπεδα του αντίστοιχου παράγοντα στα οποία έχει ληφθεί κάθε παρατήρηση. Όταν τα επίπεδα έχουν όνοµα, το δίνουµε ως value label (ξέρετε πως). Γραφική εξέταση Με τις εντολές Graphs, Scatter, Simple, Define οδηγούµαστε σε ένα πλαίσιο διαλόγου όπου συµπληρώνουµε ότι φαίνεται στην ακόλουθη εικόνα:
----------Εισαγωγή στη Χρήση του SPSS for Windows ------------- Σελίδα: 18------------ εν δείχνουµε το output αλλά αυτό θα είναι διάγραµµα διασποράς της Υ έναντι των επιπέδων του Α µε τα σηµεία να έχουν διαφορετικά χρώµατα ανάλογα µε το επίπεδο του Β στο οποίο αναλογούν.(θα το δείξουµε στο παράδειγµα πιο κάτω) 6.6.1 Ανάλυση διακύµανσης Επιλέγουµε Analyze, General Linear Model, Univariate και στο πλαίσιο διαλόγου που προκύπτει συµπληρώνουµε αυτά που φαίνονται στην ακόλουθη εικόνα: Πιέζοντας Model επιλέγετε το µοντέλο (δηλαδή ποιοί παράγοντες και αλληλεπιδράσεις θα ληφθούν υπόψη). Εδώ µε δύο παράγοντες αφήνουµε την επιλογή Full factorial ως έχει για να εξεταστεί και η τυχόν αλληλεπίδραση τους. Μπορείτε ακόµα πιέζοντας το κουµπί Plots να οδηγηθείτε σε πλαίσιο διαλόγου όπου (δεν το δείχνουµε και πάλι για οικονοµία µεγέθους αρχείου) συµπληρώνετε: τον παράγοντα που σας ενδιαφέρει στο πεδίο Horizontal axis και τον άλλο (ή τα blocks) στο πεδίο Separate lines και πιέζετε Add και ύστερα Continue οπότε επιστρέφετε στο προηγούµενο πλαίσιο. (αυτό, µαζί µε την ανάλυση θα σας δώσει και διάγραµµα που θα δείχνει τους µέσους των παρατηρήσεων για κάθε συνδυασµό επιπέδων των παραγόντων και στην ερµηνεία του µοιάζει µε το προηγούµενο διάγραµµα που δείξαµε). Στο κουµπί Post Hoc θα βρείτε τους ελέγχους για πολλαπλές συγκρίσεις.
----------Εισαγωγή στη Χρήση του SPSS for Windows ------------- Σελίδα: 19------------ ΠΑΡΑ ΕΙΓΜΑ (ΑΝΑΛΥΣΗ ΙΑΚΥΜΑΝΣΗΣ ΚΑΤΑ ΥΟ ΠΑΡΑΓΟΝΤΕΣ ) ΠΕΙΡΑΜΑ: Γίνεται Καταµέτρηση λαθών (errors) στη παρακολούθηση ενός Βίντεο ΣΤΕΡΗΣΗ ΥΠΝΟΥ Λήψη ΛΑΘΗ από 18 ατοµα σε 6 συνθήκες sleepdep ALCOHOL errors Στέρηση ύπνου (sleepdep) ( 1) 1 1 16 Κατανάλωση Αλκοολ (2) δηλαδή 1 1 12 έχουµε τους συνδυασµούς 2 Χ 3 = 6 1 1 17 2 1 18 του πίνακα: 2 1 16 2 1 25 3 1 22 3 1 24 3 1 32 1 2 11 1 2 9 1 2 12 2 2 13 2 2 8 2 2 11 3 2 12 3 2 14 3 2 12 Στο παράθυρο Variable View δηµιουργούµε τις Μεταβλητές όπως την παρακάτω Στο παράθυρο Data editor καταχωρούµε τα δεδοµένα του παραπάνω πίνακα και από τη διαδροµή : Analyze General Linear Model Univariate ηλαδη Ανάλυση Γενικό Γραµµικό Μοντέλο Μονοµεταβλητή Εµφανίζεται το πλαίσιο διαλόγου και µεταφέρουµε τις µεταβλητές
----------Εισαγωγή στη Χρήση του SPSS for Windows ------------- Σελίδα: 20------------ Επιλέγουµε Option και στο Factor and Factor Interactions(Παράγοντες και Αλληλεπιδράσεις παραγόντων) βάζουµε τη µεταβλητή sleepdep. Τα ιδια κάνουµε και για τη sleep και για sleepdep*alcohol Στην ενότητα Display επιλέγουµε Desciptive Statistics Και Homogeneity tests ( Έλεγχοι Οµοιογένειας) Στο Plots µεταφέρουµε την sleepdep και την alcohol όπως δείχνει η εικόνα και πατώντας continue και µετά ΟΚ Παίρνουµε τα αποτελέσµατα Αποτελέσµατα διπλής µη συσχετισµένης ANOBA 30 Estimated Marginal Means of Λάθη 20 Estimated Marginal Means 10 0 4 Ωρες 12 Ώρες Κατανάλωση Αλκοόολ Ναι Όχι 24 Ώρες Στέρηση ύπνου
----------Εισαγωγή στη Χρήση του SPSS for Windows ------------- Σελίδα: 21------------ Between-Subjects Factors Στέρηση ύπνου Κατανάλωση Αλκοόολ 1 2 3 1 2 Value Label N 4 Ωρες 6 12 Ώρες 6 24 Ώρες 6 Ναι 9 Όχι 9 Descriptive Statistics Dependent Variable: Λάθη Στέρηση ύπνου 4 Ωρες 12 Ώρες 24 Ώρες Total Κατανάλωση Αλκοόολ Ναι Όχι Total Ναι Όχι Total Ναι Όχι Total Ναι Όχι Total Mean Std. Deviation N 15,00 2,646 3 10,67 1,528 3 12,83 3,061 6 19,67 4,726 3 10,67 2,517 3 15,17 5,981 6 26,00 5,292 3 12,67 1,155 3 19,33 8,066 6 20,22 6,099 9 11,33 1,871 9 15,78 6,330 18 Levene's Test of Equality of Error Variances a Dependent Variable: Λάθη F df1 df2 Sig. 2,786 5 12,068 Tests the null hypothesis that the error variance of the dependent variable is equal across groups. a. Design: Intercept+SLEEPDEP+ALCOHOL+SLEEPDEP * ALCOHOL Έλεγχοι επίδρασης µεταξύ υποκειµένων Dependent Variable: Λάθη Source Corrected Model Intercept SLEEPDEP ALCOHOL SLEEPDEP * ALCOHOL Error Total Corrected Total Tests of Between-Subjects Effects Type III Sum of Squares df Mean Square F Sig. 546,444 a 5 109,289 9,739,001 4480,889 1 4480,889 399,287,000 130,111 2 65,056 5,797,017 355,556 1 355,556 31,683,000 60,778 2 30,389 2,708,107 134,667 12 11,222 5162,000 18 681,111 17 a. R Squared =,802 (Adjusted R Squared =,720)
----------Εισαγωγή στη Χρήση του SPSS for Windows ------------- Σελίδα: 22------------ Εκτιµώµενοι οριακοί Μέσοι Όροι Estimated Marginal Means Dependent Variable: Λάθη Στέρηση ύπνου 4 Ωρες 12 Ώρες 24 Ώρες 1. Στέρηση ύπνου 95% Confidence Interval Mean Std. Error Lower Bound Upper Bound 12,833 1,368 9,854 15,813 15,167 1,368 12,187 18,146 19,333 1,368 16,354 22,313 Dependent Variable: Λάθη Κατανάλωση Αλκοόολ Ναι Όχι 2. Κατανάλωση Αλκοόολ 95% Confidence Interval Mean Std. Error Lower Bound Upper Bound 20,222 1,117 17,789 22,655 11,333 1,117 8,900 13,766 3. Στέρηση ύπνου * Κατανάλωση Αλκοόολ Dependent Variable: Λάθη Στέρηση ύπνου 4 Ωρες 12 Ώρες 24 Ώρες Κατανάλωση Αλκοόολ Ναι Όχι Ναι Όχι Ναι Όχι 95% Confidence Interval Mean Std. Error Lower Bound Upper Bound 15,000 1,934 10,786 19,214 10,667 1,934 6,453 14,881 19,667 1,934 15,453 23,881 10,667 1,934 6,453 14,881 26,000 1,934 21,786 30,214 12,667 1,934 8,453 16,881 6.6.2Ερµηνεία των αποτελεσµάτων Τα περιγραφικά στατιστικά στοιχεία εµφανίζονται στο δεύτερο πίνακα (Desciptive statistics) των αποτελεσµάτων, καθώς και στην ενότητα Εκτιµώµενοι οριακοί Μέσοι Όροι Estimated Marginal Means (πέµπτο, τον έκτο, και τον έβδοµο πίνακα). Οι µέσοι όροι απεικονίζονται γραφικά στην αρχή ανάλυση διακύµανσης παρουσιάζεται στον τέταρτο πίνακα των αποτελεσµάτων (Έλεγχοι επίδρασης µεταξύ υποκειµένων). Στο δεύτερο πίνακα, εµφανίζονται πρώτα οι µέσοι όροι (Mean), οι τυπικές αποκλίσεις(st.deviation), και ο αριθµός των περιπτώσεων (Ν) για τις δύο συνθήκες κατανάλωσης και µη κατανάλωσης αλκοόλ για την πρώτη συνθήκη στέρησης ύπνου (4 ώρες), και ακολουθούν οι µέσοι όροι, οι τυπικές αποκλίσεις, και ο αριθµός των περιπτώσεων για τις δύο συνθήκες κατανάλωσης και µη κατανάλωσης αλκοόλ για τη δεύτερη συνθήκη στέρησης ύπνου (12 ώρες). Επειδή η πιθανότητα του ελέγχου Levene (τρίτος πίνακας) δεν είναι σηµαντική, µπορούµε να ερµηνεύσουµε τους λόγους F χωρίς να πρέπει να µετασχηµατίσουµε τα δεδοµένα.