Ανάλυση εδοµένων µε το SPSS Μάθηµα 1 30 / 3 / 2012 ΚριτσωτάκηςΙ. Ευάγγελος Βιοστατιστικός, MSc, PhD ekritsot@yahoo.gr Μάθηµα 1 -Θεµατολογία Επισκόπηση βασικών χαρακτηριστικών του SPSS και βασική ορολογία. Καταχώρηση και επεξεργασία δεδοµένων. Μετασχηµατισµοί και τροποποιήσεις των δεδοµένων, δηµιουργία νέων µεταβλητών. 2 1
SPSS: ονοµασίες / εκδόσεις SPSS = Statistical Package for the Social Sciences = Statistical and Presentational System Software PASW = Predictive Analytics SoftWare 3 Release history: SPSS 15.0.1 - November 2006 SPSS 16.0.2 - April 2008 SPSS Statistics 17.0.1 - December 2008 PASW Statistics 17.0.3 - September 2009 PASW Statistics 18.0 - August 2009 PASW Statistics 18.0.1 - December 2009 PASW Statistics 18.0.2 - April 2010 PASW Statistics 18.0.3 - September 2010 IBM SPSS Statistics 19.0 - August 2010 IBM SPSS Statistics 20.0 - August 2011 Εκκίνηση SPSS Έναρξη Προγράµµατα SPSS SPSS 19.0 ή ιπλό κλικ στο Εικονίδιο στην επιφάνεια εργασίας 4 2
Παράθυρα Εργασίας SPSS Data Editor Data View Variable View Καταχώρηση, τροποποίηση, εµφάνιση δεδοµένων. Output Εµφάνιση Αποτελεσµάτων. SPSS Viewer Pivot Table Editor Chart Editor Επεξεργασία Πινάκων και ιαγραµµάτων. Syntax Editor Σύνταξη / εκτέλεση γλώσσας εντολών (command syntax). Script Editor Σύνταξη script προγραµµάτων. 5 Πλαίσια ιαλόγου Καθορισµός / επιλογές διαδικασιών προς εκτέλεση. Data Editor Γραµµή Μενού Συντοµεύσεις 6 Κατάσταση Προβολής Γραµµή Καταστάσεων 3
Data Editor Data View (οθόνηδεδοµένων) ΒασικόςΚανόνας Καταχώρησης εδοµένων: Κάθε στήλη αντιστοιχεί σε µία µεταβλητή, Κάθε γραµµή αντιστοιχεί στις απαντήσεις ενός ατόµου (σε ένα ερωτηµατολόγιο). Column Variable, Row Case εδοµέναπου µπορούν να εισαχθούν σε ένα κελί: Αριθµοί Ηµεροµηνίες Κείµενο / λέξεις (το αποφεύγουµε!!!) 7 Π.χ. Ον/µο Ηλικία Φύλο Ευχέρεια χρήσης SPSS* 1 ΑΝΤ.Κ 38 Άνδρας Πολύ µεγάλη 2 ΣΤΕ.Κ 41 Γυναίκα Καθόλου 3 ΜΑΡ.Σ 25 Γυναίκα Μικρή 4 ΜΑΡ.Π 35 Γυναίκα Πολύ µεγάλη 5 ΑΘΑ.Σ 29 Άνδρας Μεγάλη 6 ΕΛΕ.Ε 39 Άνδρας Καθόλου 7 ΒΑΣ.Μ Γυναίκα Μικρή 8 ΝΙΚ.Π 44 Γυναίκα Μέτρια 8 * Καθόλου / Μικρή / Μέτρια / Μεγάλη / Πολύ µεγάλη 4
Π.χ. 9 Data Editor Variable View (οθόνηµεταβλητών) 10 Καθορισµόςτων Ιδιοτήτων των Μεταβλητών (ονόµατα, ετικέτες, είδη) και της εµφάνισης των τιµών τους στο data view. Κάθε γραµµή αφορά µία µεταβλητή. 5
Είδη Μεταβλητών (επίπεδο µέτρησης) Μεταβλητές Variables Ποιοτικές (κατηγορικές) Ποσοτικές (αριθµητικές) Ονοµαστικές ιατάξιµες ιακριτές Συνεχείς Nominal Ordinal Scale 12 6
Επιλογές Variable View (1) NAME: Όνοµα µεταβλητής. Μπαίνει επικεφαλίδα στην αντίστοιχη στήλη του Data View. Χρησιµοποιείται από το SPSS για την αναγνώριση της στήλης στον κώδικα προγραµµατισµού, οπότε το NAME δεν επιτρέπεται να περιέχει κενά, σύµβολα ή να αρχίζει από αριθµό. Απαγορεύονται επίσης λέξεις κλειδιά όπως and, or, to κλπ. To όνοµα αυτό θα εµφανίζεται και στα πλαίσια διαλόγου του SPSS. LABEL:Ετικέτα µεταβλητής. Πλήρης λεκτική περιγραφή της µεταβλητής (επιτρέπονται κενά, σύµβολα και σχετικά µεγάλο κείµενο). Η περιγραφή αυτή θα εµφανίζεται στους τίτλους πινάκων, διαγραµµάτων, αναλύσεων και πλαισίων διαλόγου 13 του SPSS. Επιλογές Variable View (2) TYPE: Τύπος των δεδοµένων που καταχωρήθηκαν στην αντίστοιχη στήλη του Data View. Οι πιο συνηθισµένοι τύποι δεδοµένων είναι numeric (αριθµοί), date (ηµεροµηνίες) και string (κείµενο). Η τελευταία επιλογή γενικά αποφεύγεται µέσω κωδικοποίησης των ποιοτικών µεταβλητών. DECIMALS:Ο µέγιστος αριθµός δεκαδικών ψηφίων που θα εµφανίζονται σε αριθµητικά δεδοµένα στο Data View. 14 VALUES: Ετικέτες (περιγραφές) για τις κωδικοποιηµένες τιµές ποιοτικών µεταβλητών (π.χ. 1 = Άνδρας, 2 = Γυναίκα). 7
Επιλογές Variable View (3) MEASURE:Το είδος (επίπεδο µέτρησης) της µεταβλητής. Έχει τρεις επιλογές: scale (ποσοτική), ordinal (ποιοτική διατάξιµη), και nominal (ποιοτική ονοµαστική). WIDTH:Μέγιστος αριθµός των χαρακτήρων που µπορούν να καταχωρηθούν στο Data View. COLUMNS: Το πλάτος της αντίστοιχης στήλης του Data View. ALIGN: Η στοίχιση των δεδοµένων στην αντίστοιχη στήλη του Data View. MISSING: Κωδικοποίηση των απουσώντιµών (missing values), 15 µέχρι 3 κωδικοί. Π.χ. 16 Εµφάνισηετικετών δεδοµένων: View Value Labels ήεικονίδιο 8
Αποθήκευση Αρχείου εδοµένων File Save As Τοποθεσία Αποθήκευσης στον Η/Υ Όνοµα Αρχείου 17 File Save και τοποθεσία Κατάληξη αρχείων δεδοµένων: sav για επόµενες αποθηκεύσεις µε ίδιο όνοµα Μηνύµατα κατά το Κλείσιµο Αρχείου sav Μήνυµα 1ο: Θέλεις να προχωρήσω (στο κλείσιµο)? Αν το αρχείο έχει αποθηκευτεί το SPSS τερµατίζεται. Μήνυµα 2ο: Θέλεις να αποθηκεύσω το αρχείο δεδοµένων? Εµφανίζεται αν το αρχείο δεν έχει αποθηκευτεί. 18 9
ιορθώσεις / διαγραφή case / διαγραφή µεταβλητής 19 ιαγραφή ατόµου No. 3: Επιλογή ολόκληρης γραµµής 3. Delete στο πληκτρολόγιο ή δεξί κλικ και clear. ιαγραφή µεταβλητής «SPSS»: Επιλογή ολόκληρης στήλης 3. Delete στο πληκτρολόγιο ή δεξί κλικ και clear. ΑΣΚΗΣΗ 1: Καταχώρηση εδοµένων στο SPSS 20 1) Κατασκευάστε κατάλληλη βάση δεδοµένων στη Variable View του SPSS για τα παραπάνω δεδοµένα 2) Καταχωρήστε στο Data View τα δεδοµένα για τους παραπάνω 7 ασθενείς. 3) Αποθηκεύστε το αρχείο δεδοµένων µε όνοµα SSI_DATA.sav στο φάκελο εργασίας σας. 10
Περιήγηση στα µενού του SPSS File: Άνοιγµα, κλείσιµο, αποθήκευση, εκτύπωση αρχείων δεδοµένων. Edit: Αντιγραφή, αποκοπή, επικόλληση, αναζήτηση δεδοµένων, αναίρεση. View: Ρυθµίσεις για την εµφάνιση του Data Editor Data: ιαχείριση δεδοµένων & µεταβλητών. Επιλογή περιπτώσεων & στάθµιση δεδοµένων. Transform: Μετασχηµατισµοί δεδοµένων, δηµιουργία νέων µεταβλητών. Analyze: Στατιστική Ανάλυση! 21 Graphs: Παραγωγή & επεξεργασία διαγραµµάτων. Utilities: Συµπληρωµατικές επιλογές, όπως περιγραφή µεταβλητών, εισαγωγή σχολίων στο αρχείο δεδοµένων και ειδικές διαδικασίες. Window: Τα ανοικτά παράθυρα του SPSS. υνατότητα δηµιουργίας πολλαπλών παραθύρων σε ένα αρχείο δεδοµένων. Help: Παροχή βοήθειας, φροντιστήριο. 22 11
Πληροφορίες εδοµένων / Μεταβλητών σε Αρχείο sav 4τρόποι: 1) Variable View 2) Μενού File: Display Data File Information Working File 3) Μενού Data: Define Variable Properties 4) Μενού Utilities: Variables Σχόλια στο αρχείο δεδοµένων: Utilities Data File Comments 23 ΑΣΚΗΣΗ 2: Πληροφορίες Αρχείου εδοµένων SSI_COLON.sav 24 12
ηµιουργία Νέων Μεταβλητών (1) Transform Compute Variable, εντολή datediff Aρχείο SSI_COLON.sav: Από τις υπάρχουσες µεταβλητές ΗΜΝΙΑ_ΕΙΣκαι ΗΜΝΙΑ_ΕΠδηµιουργήστε νέα µεταβλητή µε όνοµα ΗΜΕΡΕΣ_ΠΡΙΝη οποία να δίνει την Προεγχειρητική ιάρκεια Νοσηλείας σε ηµέρες. 25 ηµιουργία Νέων Μεταβλητών (2α) Επανα-κωδικοποίηση Transform Recode Into Different Variables Aρχείο SSI_COLON.sav: Από την υπάρχουσα µεταβλητή ASA, δηµιουργήστε νέα µεταβλητή µε όνοµα ASA_34, η οποία να λαµβάνει τιµή 1 αν ASA >=3 και 0 αλλιώς. 26 13
ηµιουργία Νέων Μεταβλητών (2β) Επανα-κωδικοποίηση Transform Recode Into Different Variables Aρχείο SSI_COLON.sav: Από την υπάρχουσα µεταβλητή ASA, δηµιουργήστε νέα µεταβλητή µε όνοµα ASA_35, η οποία να λαµβάνει τιµή 1 αν ASA >=3 και 0 αν ASA <=2. 27 ηµιουργία Νέων Μεταβλητών (3α) Επανα-κωδικοποίηση Transform Count Values Within Cases Aρχείο SSI_COLON.sav: Από την υπάρχουσα µεταβλητή ASA, δηµιουργήστε νέα µεταβλητή µε όνοµα ASA_35, η οποία να λαµβάνει τιµή 1 αν ASA >=3 και 0 αν ASA <=2. (β τρόπος) 28 14
ηµιουργία Νέων Μεταβλητών (3β) Επανα-κωδικοποίηση Transform Count Values Within Cases Aρχείο SSI_COLON.sav: Από την υπάρχουσα µεταβλητή ASA, δηµιουργήστε νέα µεταβλητή µε όνοµα ASA_35, η οποία να λαµβάνει τιµή 1 αν ASA >=3 και 0 αν ASA <=2. (β τρόπος) 29 ΕΕΝΕ Σεµινάριο Μάιος 2011 ΑΣΚΗΣΗ 3: ηµιουργία Νέων Μεταβλητών 15
ηµιουργία Νέων Μεταβλητών (4α) Transform Compute Variable, άθροισηµεταβλητών Aρχείο SSI_COLON.sav: ηµιουργήστε νέα µεταβλητή µε όνοµα NNIS_RISKκαι ετικέτα είκτης Κινδύνου NNIS, η οποία να είναι το άθροισµα των µεταβλητών ASA_34, ΙΑΡΚΕΙΑ_ΕΠ_170 και TXT_34. Οι τρεις πιο σηµαντικοί παράγοντες κινδύνου για µετεγχειρητικές λοιµώξεις: Κακή φυσική κατάσταση (ASA >= 3) Μεγάλη διάρκεια επέµβασης (> 170 min για επεµβάσεις παχ. εντερ.) Μεγάλο µικροβιακό φορτίο στο χειρ/κό τραύµα (TXT >=3) 31 είκτης Κινδύνου NNIS: είχνει το πλήθος των παραπάνω ΠΚ, λαµβάνοντας τιµές 0 έως 3. ιαστρωµατώνει τα ποσοστά λοιµώξεων. ηµιουργία Νέων Μεταβλητών (4β) Transform Compute Variable, άθροισηµεταβλητών Aρχείο SSI_COLON.sav: ηµιουργήστε νέα µεταβλητή µε όνοµα NNIS_RISKκαι ετικέτα είκτης Κινδύνου NNIS, η οποία να είναι το άθροισµα των µεταβλητών ASA_34, ΙΑΡΚΕΙΑ_ΕΠ_170 και TXT_34. 32 16
ηµιουργία Νέων Μεταβλητών (5α) Transform Count Values Within Cases Aρχείο SSI_COLON.sav: ηµιουργήστε νέα µεταβλητή µε όνοµα NNIS_RISKκαι ετικέτα είκτης Κινδύνου NNIS, η οποία να είναι το άθροισµα των µεταβλητών ASA_34, ΙΑΡΚΕΙΑ_ΕΠ_170 και TXT_34. (β τρόπος) 33 ηµιουργία Νέων Μεταβλητών (5β) Transform Count Values Within Cases Aρχείο SSI_COLON.sav: ηµιουργήστε νέα µεταβλητή µε όνοµα NNIS_RISKκαι ετικέτα είκτης Κινδύνου NNIS, η οποία να είναι το άθροισµα των µεταβλητών ASA_34, ΙΑΡΚΕΙΑ_ΕΠ_170 και TXT_34. (β τρόπος) 34 17
Πράξεις και λογικοί τελεστές στο Compute Variable 35 + πρόσθεση - αφαίρεση * πολλαπλασιασµός / διαίρεση ** ύψωση σε δύναµη = ίσον ~= όχι ίσο (διάφορο) < µικρότερο (>µεγαλύτερο) < = µικρότερο ή ίσο (>= µεγαλύτερο ή ίσο) & Λογικός τελεστής ΚΑΙ Λογικός τελεστής Η ~ Λογικός τελεστής ΟΧΙ 18