Εισαγωγή στο SPSS ΚΕΔΙΜΑ 28/9/2013 Γεώργιος Σπανούδης (spanouod@ucy.ac.cy) Τμήμα Ψυχολογίας
Στόχος του μαθήματος Τα τέσσερα παράθυρα του SPSS Η διαχείριση των αρχείων δεδομένων Βασικά στοιχεία ανάλυσης στο SPSS
Εισαγωγή: τί είναι το SPSS? Ακρωνύμιο του Statistical Package for the Social Science που τώρα του Statistical Product and Service Solutions. Ένα από τα πλέον δημοφιλή στατιστικά πακέτα με τα οποία μπορεί κανείς να εκτελέσει περίπλοκους χειρισμούς δεδομένων και αναλύσεων με πολύ απλούς τρόπους.
Τα τέσσερα παράθυρα του SPSS: Data editor Output viewer Syntax editor Script window
Τα τέσσερα παράθυρα του SPSS: Data Editor Data Editor Spreadsheet-like σύστημα για ορισμό (defining), καταχώρηση (entering), διαχείριση (editing) και παρουσίαση (displaying δεδομένων. Το extension των αποθηκευμένων (saved) αρχείων είναι *.sav.
Τα τέσσερα παράθυρα του SPSS: Output Viewer Output Viewer παρουσιάζει το output και τα λάθη μας! Το extension των αποθηκευμένων (saved) αρχείων είναι *.spv.
Τα τέσσερα παράθυρα του SPSS: Syntax editor Syntax Editor κειμενογράφος (text editor) σύνταξης εντολών προς εκτέλεση. Το extension των αποθηκευμένων (saved) αρχείων είναι *.sps.
Τα τέσσερα παράθυρα του SPSS: Script Window Script Window μας δίνει τη δυνατότητα να γράφουμε ολοκληρωμένα (full-blown) προγράμματα διαχείρισης και ανάλυσης δεδομένων υπό μορφή BASIC-like γλώσσας. Πρόκειται για κειμενογράφο (text editor) για σύνταξη εντολών. Το extension των αποθηκευμένων (saved) αρχείων είναι *.sbs.
Βασικά στοιχεία διαχείρισης δεδομένων
Ανοίγοντας το SPSS Start All Programs IBM SPSS Statistics IBM SPSS Statistics 20
Opening SPSS Το προεπιλεγμένο (default) παράθυρο θα σας παρουσιάσει το data editor Υπάρχουν δύο φύλλα (sheets) στο παράθυρο: 1. Data view 2. Variable view
Παράθυρο Data View Το Data View παράθυρο Αυτό το φύλλο είναι ορατό κατά το αρχικό άνοιγμα του Data Editor. Αυτό το φύλλο είναι αφιερωμένο στην παρουσίαση των δεδομένων Κάνετε κλικ στο tab με την ονομασία Variable View Κλικ
Το παράθυρο Variable View: Name Αυτό το φύλλο είναι αφιερωμένο στην παρουσίαση πληροφοριών σχετικών με τα δεδομένα που είναι αποθηκευμένα στο αρχείο δεδομένων σας (dataset) Name Ο πρώτος χαρακτήρας του ονόματος της μεταβλητής πρέπει να είναι αλφαβητικός (a, b...z) Τα ονόματα των μεταβλητών πρέπει να είναι μοναδικά και να έχουν λιγότερους από 64 χαρακτήρες. Διαστήματα (spaces) ΔΕΝ επιτρέπονται.
Το παράθυρο Variable View: Type Type Κάντε κλικ στο κουτί type. Δύο βασικοί τύποι μεταβλητών κατά βάση είναι χρήσιμοι, numeric και string. Αυτή η στήλη σας δίνει τη δυνατότητα να ορίσετε τον τύπο της μεταβλητή σας.
Το παράθυρο Variable View: Width Width Το Width μας επιτρέπει να καθορίσουμε τον αριθμό των χαρακτήρων σε κάθε μεταβλητή του SPSS.
Το παράθυρο Variable View: Decimals Decimals Αριθμός δεκαδικών Πρέπει να είναι λιγότερος ή ίσος του 16 1.34179265
Το παράθυρο Variable View: Label Label Μπορείτε να ορίσετε τις λεπτομέρειες της μεταβλητής Μπορείτε να γράψετε μέχρι 256 χαρακτήρες με διαστήματα
Το παράθυρο Variable View: Values Values Σε περίπτωση που έχετε κατηγορική μεταβλητή, μπορεί να χρησιμοποιηθεί για να καθορίσουμε τι αναπαριστά κάθε αριθμός π.χ., 1=αγόρι, 2=κορίτσι κοκ.
Καθορίζοντας τις ετικέτες των τιμών Κάνετε κλικ στη στήλη των τιμών (values column) όπως φαίνεται παρακάτω Για την τιμή και την ετικέτα της μπορείτε να καταχωρήσετε μέχρι 60 χαρακτήρες. Μετά τον καθορισμό των τιμών κάνετε κλικ στο add και μετά κλικ στο OK. Click
Εξάσκηση 1 Παρακαλώ καταχωρήστε τις παρακάτω πληροφορίες στο SPSS. id sex age SES anxiety RT_CRT 1 1 12 1 12 13,45 2 1 13 2 13 13,4 3 1 15 2 14 12,89 4 1 14 1 15 11,11 5 1 10 3 16 23,2 6 1 12 3 17 9,45 7 1 13 1 21 7,89 8 1 14 2 9 7,56 9 1 16 2 7 9,04 10 1 19 1 8 4,07 Στη μεταβλητή SEX: 1=αγόρι (male) και 2=κορότσι (female) Στη μεταβλητή SES: 1=χαμηλό (low), 2= medium, 3=high
Εξάσκηση 1 (Παράδειγμα λύσης) Click
Click
Αποθηκεύοντας (saving) τα δεδομένα Για να αποθηκεύσετε το αρχείο δεδομένων που δημιουργήσατε, κάνετε κλικ στο file και μετά κλικ στο save as. Μπορείτε ακόμη να αποθηκεύσετε το αρχείο σας σε διαφορετική μορφή κάνοντας κλικ στο Save as type. Click
Παρουσιάζοντας τις ετικέτες των κατηγορικών μεταβλητών Κλικ στο View -> τικ το Value labels
Ταξινομώντας (sorting) τα δεδομένα Κλικ στο Data και μετά κλικ στο Sort Cases
Ταξινομώντας τα δεδομένα (cont d) Διπλό κλικ στο SES και μετά κλικ στο ok. Click
Εξάσκηση 2 Μπορείτε να ταξινομήσετε τα δεδομένα με βάση το επίπεδο του anxiety των συμμετεχόντων κατά κατιούσα φορά; Απάντηση Click Data-> Sort cases-> διπλό κλικ στο anxiety -> κλικ στο Descending και τέλος κλικ στο ok.
Μετασχηματίζοντας δεδομένα Κλικ στο Transform και μετά κλικ στο Compute Variable
Μετασχηματίζοντας δεδομένα (cont d) Παράδειγμα: δημιουργώντας μια καινούργια μεταβλητή με το όνομα g_anxiety διαχωρισμού του δείγματος σε άτομα υψηλού άγχους και χαμηλού άγχους. Γράψτε το όνομα g_anxiety στο κουτί Target Variable. Δώστε την τιμή 1 (ή άλλη τιμή) στο κουτί Numeric Expression, κάντε κλικ στο if -> include if case satisfies condition -> double κλικ στη μεταβλητή anxiety -> κλικ στον ανισωτικό μικρότερο < - > γράψτε δίπλα του την τιμή 10 -> κλικ στο continue -> κλικ στο ΟΚ. Επαναλάβετε τη διαδικασία ορίζοντας αυτή τη φορά τις τιμές πάνω από 10 να παίνρουν την τιμή 2 (ή άλλη τιμή). Click
Μετασχηματίζοντας δεδομένα(cont d) Η καινούργια μεταβλητή g_anxiety έχει προστεθεί στο αρχείο ων δεδομένων σας
Εξάσκηση 3: H χρήση της εντολής recode Δημιουργήστε μια νέα μεταβλητή με το όνομα n_rt_crt η οποία να διαχωρίζει τους συμμετέχοντες με βάση τις τιμές της μεταβλητής RT_CRT σε γρήγορους =κάτω από 10 sec, μέτριας ταχύτητας= 10-20 sec και αργούς = πάνω από 20 sec. Λύση Εφαρμογή στη μεταβλητή SES
Επιλέγοντας περιπτώσεις: η εντολή select if Κλικ στο Data -> κλικ στο Select if -> τικ στο if condition is satisfied -> κλικ στο if -> Μεταφέρουμε δεξιά στο κενό κελί τη μεταβλητή με βάση την οποία θέλουμε να επιλέξουμε την υποομάδα που μας ενδιαφέρει -> -> κλικ στο continue -> κλικ στο ΟΚ. Εξάσκηση με τη μεταβλητή φύλο.
Βασικά στοιχεία Ανάλυσης με το SPSS
Βασικά στοιχεία ανάλυσης με το SPSS Συχνότητες (frequencies) Αυτή η ανάλυση παράγει πίνακες συχνοτήτων Μέτρα περιγραφικής στατιστικής (descriptives) Αυτή η ανάλυση παρουσιάζει μέτρα περιγραφικής στατιστικής (maximum, minimum, mean, standard deviation κα.) Συγκρίσεις μέσων όρων (t-tests) Αυτές οι αναλύσεις σας επιτρέπουν να συγκρίνετε δύο μέσους όρους και να γενικεύσετε προς τον πληθυσμούς από τους οποίους πήρατε τα δείγματα Συσχέτιση (correlation) Αυτή η ανάλυση σας επιτρέπει να διαγνώσετε το βαθμό της σχέσης που υφίσταται μεταξύ δύο ή περισσοτέρων μεταβλητών Παλινδρόμηση (linear regression analysis) Linear Regression estimates the coefficients of the linear equation
Ανοίγοντας το αρχείο των δεδομένων Ανοίξτε το αρχείο screen.sav που σας δόθηκε Κάνετε κλικ File ->Open και κλικ στο Data
Συχνότητες Κλικ στο Analyze, -> Descriptive statistics, - > Frequencies
Συχνότητες Κλικ στις μεταβλητές emplmnt και mstatus και μεταφορά τους στο variable box. Κλικ στο Charts. Κλικ στο Bar charts και μετά Continue. Click Click
Συχνότητες Κλικ στο OK. Ρίξτε μια ματιά επίσης στην επιλογή statistics Click
Υπολογίζοντας μέτρα περιγραφικής στατιστικής μέσω του Syntax editor Κλικ Analyze, Descriptive statistics, και μετά Frequencies. Κλικ στις μεταβλητές emplmnt και mstatus και μεταφορά τους στο variable box.. Κλικ επίσης στο Charts, Bar charts, και μετά στο Continue. Κλικ στο Paste. Click
Υπολογίζοντας μέτρα περιγραφικής στατιστικής μέσω του Syntax editor Επιλέξτε όλη την εντολή σας στο Syntax editor και κάνετε κλικ το εικονίδιο run. Click
Εξάσκηση 4 Κάνετε ανάλυση συχνοτήτων στη μεταβλητή race Δημιουργήστε το pie charts Κάνετε την ίδια ανάλυση με τη χρήση του syntax editor
Απάντηση Click
Descriptives Κλικ Analyze, Descriptive statistics, και μετά κλικ στο Descriptives Διπλό κλικ στις μεταβλητές attdrug και atthouse για μεταφορά τους στο variable box. Κλικ στο Options Click
Descriptives Η επιλογή options μας επιτρέπει να υπολογίσουμε το σύνολο των μέτρων περιγραφικής στατιστικής. Κλικ στα variance και kurtosis Τέλος κλικ στο Continue Click Click
Descriptives Κλικ στο OK στο Descriptives box. Εξάσκηση 5 : υπολογίστε το μέσο όρο και την τυπική απόκλιση της μεταβλητής timedrs
Συγκρίσεις διαφοράς μέσω όρων: t-tests Υπάρχουν τρείς έλεγχοι t γνωστοί: ο έλεγχος δύο ανεξάρτητων δειγμάτων (independent-samples t-test), ο έλεγχος δύο εξαρτημένων δειγμάτων (paired-samples t-test) και ο έλεγχος ενός δείγματος (one sample t-test). Ο έλεγχος δύο ανεξάρτητων δειγμάτων εφαρµόζεται για ελέγχους ισότητας µέσων όρων µεταξύ δύο δειγµάτων τα οποία είναι ανεξάρτητα (ή µπορούµε να υποθέσουµε ότι είναι ανεξάρτητα). Για παράδειγμα, επισκέπτονται περισσότερες φορές τους γιατρούς οι παντρεμένοι ή οι ανύπαντροι;
Συγκρίσεις διαφοράς μέσω όρων: t-tests Τι γίνεται όµως όταν τα δύο δείγµατα δεν είναι, ή δεν µπορούµε να υποθέσουµε ότι είναι ανεξάρτητα; Την απάντηση τη δίνει το t τεστ για συζευγμένα ζεύγη παρατηρήσεων. Κλασικό παράδειγµα εφαρµογής του paired-samples t-test τεστ είναι όταν έχουµε µετρήσεις για κάποια άτοµα πριν και µετά από µία παρέμβαση (π.χ., δίαιτα, θεραπεία κοκ) και ενδιαφερόµαστε να δούµε κατά πόσο ήταν αποτελεσµατική η παρέμβαση. Υποθέστε για παράδειγμα ότι θέλουμε να δούμε αν είναι διαφορετικά τα attitudes στο δείγμα μας.
Εξάσκηση 6: Στο αρχείο Ancova.sav εξετάστε αν οι εργαζόμενοι παρουσιάζουν σημαντικές διαφορές από τους άνεργους (μεταβλητή emplmnt ) στη χρήση ψυχοτροπικών ουσιών ( psydrug ). Στο ίδιο αρχείο εξετάστε αν το δείγμα της έρευνας παρουσιάζει διαφορές μεταξύ φυσικών συμπτωμάτων (μεταβλητή Physical health symptoms και νοητικών συμπτωμάτων (μεταβλητή Mental health symptoms )
Υπολογίζοντας τη σχέση δύο ή περισσοτέρων μεταβλητών Analyze Correlate Bivariate Οι τιµές που µπορεί να πάρει ένας συντελεστής συσχέτισης είναι από -1 έως +1. Αρνητικές τιµές του συντελεστή γραµµικής συσχέτισης δύο µεταβλητών σηµαίνει ότι έχουµε την ύπαρξη αρνητικής γραµµικής συσχέτισης. Θετικές τιµές του συντελεστή γραµµικής συσχέτισης είναι ένδειξη θετικής γραµµικής συσχέτισης µεταξύ των δύο µεταβλητών. Τιµές κοντά στο µηδέν αποτελούν ένδειξη ότι δεν υπάρχει στατιστικά σηµαντική γραµµική συσχέτιση µεταξύ των δύο µεταβλητών. Όσο πιο µεγάλες είναι οι τιµές του συντελεστή, ή όσο πιο κοντά βρίσκονται στη µονάδα (σε απόλυτη τιµή πάντα), τόσο πιο ισχυρή είναι η γραµµική συσχέτιση µεταξύ τους. Οι πιο γνωστοί συντελεστές γραµµικής συσχέτισης είναι οι συντελεστές του Pearson, του Spearman και του Kendall.
Click Εξάσκηση 7 : Υπολογίστε τη σχέση της μεταβλητής timedrs με τις μεταβλητές attdrug και atthouse
Ανάλυση παλινδόμησης (Regression Analysis) Κλικ Analyze, Regression, και μετά κλικ στο Linear.
Regression Analysis Για παράδειγμα ας αναλύσουμε το μοντέλο: menheal 0 1phyheal Τοποθετήστε το menheal στο Dependent και το phyheal στο Independent. Click Click
Regression Analysis Κάνοντας κλικ στο OK παίρνετε το παρακάτω output
Απεικονίζοντας (Plotting) τη γραμμή παλινδρόμησης ( regression line) Κλικ στο Graphs, Legacy Dialogs, Interactive, και Scatterplot από το main menu.
Απεικονίζοντας τη γραμμή παλινδρόμησης Σύρτε το phyheal στον άξονα Υ και το menheal στον άξονα Χ. Κάντε κλικ στο ΟΚ. Διπλό κλικ στο scatterplot -> ανοίγει νέο παράθυρο στο οποίο κάνουμε κλικ στο Elements -> Fit Line at Total -> κλικ στο OK. Click Set this to Regression!
Εξάσκηση 8 Βρείτε αν οι στάσεις για τα ναρκωτικά (μεταβλητή attdrug ) προβλέπουν τη χρήση ψυχοτροπικών ουσιών (μεταβλητή psydrug ). Απεικονίστε τη γραμμή παλινδρόμησης χρησιμοποιώντας τη διαδικασία που περιγράφηκε.
Απάντηση Click