ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Δρ. Βασίλης Π. Αγγελίδης Τμήμα Μηχανικών Παραγωγής & Διοίκησης Δημοκρίτειο Πανεπιστήμιο Θράκης

Σχετικά έγγραφα
Εισαγωγή στο SPSS, Ενότητα 1

Εργαστήριο στατιστικής Στατιστικό πακέτο S.P.S.S.

SPSS Statistical Package for the Social Sciences

ΒΙΟΣΤΑΤΙΣΤΙΚΗ Πρακτική με SPSS (1)

Λογισμικά για Στατιστική Ανάλυση. Minitab, R (ελεύθερο λογισμικό), Sas, S-Plus, Stata, StatGraphics, Mathematica (εξειδικευμένο λογισμικό για

ΣΗΜΕΙΩΣΕΙΣ ΣΤΑΤΙΣΤΙΚΗΣ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥ ΩΝ «ΦΡΟΝΤΙ Α ΣΤΟ ΣΑΚΧΑΡΩ Η ΙΑΒΗΤΗ» 2 ο Μάθηµα

ΤΜΗΜΑ ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥ ΣΧΕΔΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ. ΟΙΚΟΝΟΜΕΤΡΙΚΑ ΠΡΟΤΥΠΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ 1 ο ΕΡΓΑΣΤΗΡΙΟΥ ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΣΤΑΤΙΣΤΙΚΗΣ

ΒΙΟΣΤΑΤΙΣΤΙΚΗ. ΑΛΕΓΚΑΚΗΣ ΑΘΑΝΑΣΙΟΣ Φυσικός, PH.D. Σχολής Επιστηµών Υγείας

Λογισμικά για Στατιστική Ανάλυση. Minitab, R (ελεύθερο λογισμικό), Sas, S-Plus, Stata, StatGraphics, Mathematica (εξειδικευμένο λογισμικό για

Δείγμα (μεγάλο) από οποιαδήποτε κατανομή

Καθορισμός μεταβλητών και εισαγωγή δεδομένων

3 ο Φυλλάδιο Ασκήσεων. Εφαρμογές

Κεφάλαιο 3: Ανάλυση μιας μεταβλητής

ΕΝ ΕΙΚΤΙΚΕΣ ΑΠΑΝΤΗΣΕΙΣ ΑΣΚΗΣΗΣ 2 (Εργαστήρια µαθήµατος «Στατιστικά Προγράµµατα», τµ. Στατ. & Ασφ. Επιστ., 04-05) (Επιµέλεια: Ελευθεράκη Αναστασία)

κωδικοποίηση κτλ) Εισαγωγή δεδομένων με μορφή SPSS Εισαγωγή δεδομένων σε μορφή EXCEL Εισαγωγή δεδομένων σε άλλες μορφές

Εξερευνώντας τα δεδομένα μας-περιγραφική Στατιστική

Περιγραφική Στατιστική

Statistics. hrs1 Number of hours worked last week. educ Highest year of school completed. sibs NUMBER OF BROTHERS AND SISTERS. N Valid

Διερευνητική Ανάλυση Δεδομένων Exploratory Data Analysis

ΕΠΙΣΤΗΜΟΝΙΚΟ ΕΠΙΜΟΡΦΩΤΙΚΟ ΣΕΜΙΝΑΡΙΟ «ΚΑΤΑΡΤΙΣΗ ΕΡΩΤΗΜΑΤΟΛΟΓΙΟΥ ΚΑΙ ΣΤΑΤΙΣΤΙΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΔΕΔΟΜΕΝΩΝ» Τριανταφυλλίδου Ιωάννα Μαθηματικός

ΗΥ-SPSS Statistical Package for Social Sciences 6 ο ΜΑΘΗΜΑ. ΧΑΡΑΛΑΜΠΟΣ ΑΘ. ΚΡΟΜΜΥΔΑΣ Διδάσκων Τ.Ε.Φ.Α.Α., Π.Θ.

ΕΡΓΑΣΤΗΡΙΟ ΣΤΑΤΙΣΤΙΚΗΣ

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS)

Εισαγωγή στην ανάλυση μεταβλητών με το IBM SPSS Statistics

Τίτλος Μαθήματος: Στατιστική Ανάλυση Δεδομένων

6 / 4 / Βιοστατιστικός, MSc, PhD

Μεθοδολογία των επιστημών του Ανθρώπου : Στατιστική

Εισαγωγή στο SPSS. Για την πρώτη σας προσπάθεια να εξοικειωθείτε με το SPSS, σκεφτείτε το παρακάτω πείραμα.

Διερευνητική Ανάλυση Δεδομένων Exploratory Data Analysis

Στατιστική Επιχειρήσεων Ι

Εκπαιδευτική έρευνα Οργάνωση & Παρουσίαση Δεδομένων (Εργαστήριο SPSS) Άγγελος Μάρκος, Λέκτορας Δημοκρίτειο Πανεπιστήμιο Θράκης

ΚΕΦΑΛΑΙΟ 5 ο. 5.1 Εντολή EXPLORE 5.2 Εντολή CROSSTABS 5.3 Εντολή RAΤΙΟ STΑTISTIC 5.4 Εντολή OLAP CUBES. Daily calorie intake

ΔΑΠ- ΝΔΦΚ Πολιτικής Επιστήμης

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΚΑΙ ΕΛΕΓΧΟΣ ΥΠΟΘΕΣΕΩΝ

Παράδειγμα: Γούργουλης Βασίλειος, Επίκουρος Καθηγητής Τ.Ε.Φ.Α.Α. Δ.Π.Θ.

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Κ.Μ. 436

Εισαγωγή στο SPSS. ΚΕΔΙΜΑ 28/9/2013 Γεώργιος Σπανούδης Τμήμα Ψυχολογίας

Ενότητα 2 η : Περιγραφική Στατιστική Ι. Πίνακες και Γραφικές παραστάσεις. Δημήτριος Σταμοβλάσης Φιλοσοφίας Παιδαγωγικής

1991 US Social Survey.sav

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Κ. Μ. 436

ΑΝΑΛΥΣΗ Ε ΟΜΕΝΩΝ. 2. Περιγραφική Στατιστική

Εισαγωγή στη Χρήση του SPSS for Windows Σελίδα:

ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΧΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ

Έλεγχος για τις παραμέτρους θέσης δύο πληθυσμών με ανεξάρτητα δείγματα

Ενότητα 3 η : Περιγραφική Στατιστική Ι. Πίνακες και Γραφικές παραστάσεις. Δημήτριος Σταμοβλάσης Φιλοσοφίας Παιδαγωγικής

Αρχίζοντας με το ΜΙΝΙΤΑΒ 15

ΕΙΣΑΓΩΓΗ ΣΤΟ ΠΡΟΓΡΑΜΜΑ SPSS FOR WINDOWS

Παράδειγμα: Γούργουλης Βασίλειος, Επίκουρος Καθηγητής Τ.Ε.Φ.Α.Α.-Δ.Π.Θ.

Επεξεργασία πολλαπλών φύλλων εργασίας - Γραφημάτων Excel

30 / 3 /

Στατιστική Ι (ΨΥΧ-1202) ιάλεξη 4

Ασκήσεις Εξετάσεων. Μεταπτυχιακό Πρόγραμμα Σπουδών στη. Διοίκηση των Επιχειρήσεων

Δρ. Χάϊδω Δριτσάκη. MSc Τραπεζική & Χρηματοοικονομική

ΠΕΡΙΕΧΟΜΕΝΑ 1. ΤΟ ΠΕΡΙΒΑΛΛΟΝ ΕΡΓΑΣΙΑΣ ΤΟΥ SPSS 19.0

Έλεγχος ότι η παράμετρος θέσης ενός πληθυσμού είναι ίση με δοθείσα γνωστή τιμή. μεγέθους n από έναν πληθυσμό με μέση τιμή μ

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS)

Παράδειγμα: Γούργουλης Βασίλειος, Επίκουρος Καθηγητής Τ.Ε.Φ.Α.Α.-Δ.Π.Θ.

Έλεγχος ύπαρξης στατιστικά σημαντικών διαφορών μεταξύ δύο ανεξάρτητων δειγμάτων, που ακολουθούν την κανονική κατανομή (t-test για ανεξάρτητα δείγματα)

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΚΑΙ ΕΛΕΓΧΟΣ ΥΠΟΘΕΣΕΩΝ ΜΕ ΤΗ ΧΡΗΣΗ ΤΟΥ PSPP

Μενύχτα, Πιπερίγκου, Σαββάτης. ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 5 ο

Λυμένες Ασκήσεις για το μάθημα:

Τµήµα Τυποποίησης και ιακίνησης Προϊόντων (Logistics) Εισαγωγή στο SPSS Βασικές έννοιες.

6.4. LOGLINEAR (MANOVA) 121

Εργαστήριο 4 ΔΗΜΙΟΥΡΓΙΑ ΓΡΑΦΗΜΑΤΩΝ ΜΕ ΤΟ EXCEL ΑΚ ΤΡΑΥΛΟΣ

CTEC-153: ΥΤΛΛΑ ΕΡΓΑΙΑ

Κεφάλαιο 4. Περιγραφική Στατιστική - Γραφήματα. Σύνοψη. Προαπαιτούμενη γνώση. 4.1 Βασικές Έννοιες και Ορισμοί

Περιγραφή των εργαλείων ρουτινών του στατιστικού

Περιγραφική Ανάλυση ποσοτικών μεταβλητών

Μαντζούνη, Πιπερίγκου, Χατζή. ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 5 ο

Έλεγχος για τις παραμέτρους θέσης δύο πληθυσμών με εξαρτημένα δείγματα

Κάθε ένα κελί θα πρέπει να περιέχει ένα μόνο στοιχείο δεδομένων, για παράδειγμα το όνομα σε ένα κελί, το επίθετο σε άλλο κελί.

Γνωρίστε το Excel 2007

Ενότητα 21 Pivot Tables

1.1 Data view & Variable view: Μεταβλητές (variables) και περιπτώσεις (cases) Πίνακες συχνοτήτων (η εντολή Frequencies)...

ΕΙΣΑΓΩΓΗ ΣΤΗ ΧΡΗΣΗ ΤΟΥ ΣΤΑΤΙΣΤΙΚΟΥ ΠΑΚΕΤΟΥ SPSS 14.0

Παράδειγμα: Γούργουλης Βασίλειος, Επίκουρος Καθηγητής Τ.Ε.Φ.Α.Α.-Δ.Π.Θ.

ΜΑΘΗΜΑ 2 ο. ΗχρήσητουπακέτουEviews (Using Eviews econometric package)

8. ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΣ ΔΕΔΟΜΕΝΩΝ

1. Κλικ στην καρτέλα Insert 2. Tables 3. Κλικ Table 4. Σύρουμε το δείκτη του ποντικιού και επιλέγουμε τον επιθυμητό αριθμό γραμμών και στηλών

ΓΡΑΦΙΚΕΣ ΠΑΡΑΣΤΑΣΕΙΣ ΜΕ ΕXCEL

1. Ιστόγραμμα. Προκειμένου να αλλάξουμε το εύρος των bins κάνουμε διπλό κλικ οπουδήποτε στο ιστόγραμμα και μετά

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι

Κεφάλαιο 6. Περιγραφική Στατιστική

Δείγμα πριν τις διορθώσεις

ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΧΡΗΣΗ SPSS

ΣΤΑΤΙΣΤΙΚΗ ΜΕ ΤΗ ΧΡΗΣΗ ΤΟΥ ΠΑΚΕΤΟΥ SPSS 15

Λίγα λόγια από το συγγραφέα Κεφάλαιο 1: Microsoft Excel Κεφάλαιο 2: Η δομή ενός φύλλου εργασίας... 26

ΠΕΡΙΓΡΑΦΙΚΗ και ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Δρ. Βασίλης Π. Αγγελίδης Τμήμα Μηχανικών Παραγωγής & Διοίκησης Δημοκρίτειο Πανεπιστήμιο Θράκης

Οδηγίες για προσθήκη Web Frames Tools to the Quick Access Bar σε μεταγενέστερη έκδοση του Word

Lampiran 1 Output SPSS MODEL I

Microsoft Excel Κεφάλαιο 1. Εισαγωγή. Βιβλίο εργασίας

1. Hasil Pengukuran Kadar TNF-α. DATA PENGAMATAN ABSORBANSI STANDAR TNF α PADA PANJANG GELOMBANG 450 nm

ΕΝΕΡΓΟΠΟΙΗΣΗ Η ενεργοποίηση του SPSS γίνεται με 2 τρόπους : Με διπλό πάτημα του εικονιδίου SPSS στην επιφάνεια εργασίας, ή

Media Monitoring. Ενότητα 6: Δημιουργία Βάσης Δεδομένων στο SPSS. Σταμάτης Πουλακιδάκος Σχολή ΟΠΕ Τμήμα ΕΜΜΕ

Στατιστική Ι. Μέτρα Διασποράς (measures of dispersion) Δρ. Δημήτρης Σωτηρόπουλος

Media Monitoring. Ενότητα 7: Εισαγωγή & Ανάλυση δεδομένων με το SPSS. Σταμάτης Πουλακιδάκος Σχολή ΟΠΕ Τμήμα ΕΜΜΕ

Εισαγωγή στο πρόγραμμα Microsoft word 2003

Τίτλος Μαθήματος: Στατιστική Ανάλυση Δεδομένων

Τίτλος Μαθήματος: Στατιστική Ανάλυση Δεδομένων

Transcript:

ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ Δρ. Βασίλης Π. Αγγελίδης Τμήμα Μηχανικών Παραγωγής & Διοίκησης Δημοκρίτειο Πανεπιστήμιο Θράκης

Περιεχόμενα Εισαγωγή στο SPSS Ο Data editor Ο Viewer Άνοιγμα Αρχείου στο SPSS Εισαγωγή Δεδομένων Κινήσεις στον data editor Μετατροπή μεταβλητών Περιγραφική στατιστική με το SPSS Analyze/Descriptive Statistics/Descriptives Analyze/Descriptive Statistics/Frequencies Analyze/Descriptive Statistics/Explore Γραφήματα με το SPSS Ραβδογράμματα Πίτες Ιστογράμματα Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 2

Εισαγωγή στο SPSS Το πακέτο SPSS παρέχει στον τελικό χρήστη τη δυνατότητα στατιστικών αναλύσεων και τη διαχείριση μεγάλου όγκου δεδομένων σε ένα γραφικό περιβάλλον εκμεταλλευόμενο πλήρως τις δυνατότητες των Windows. Τα δύο βασικότερα παράθυρα που καλύπτουν το μεγαλύτερο φάσμα ενεργειών του πακέτου είναι το παράθυρο του Data editor και του Viewer. Ο Data editor παρέχει ουσιαστικά τη δυνατότητα δημιουργίας ή μορφοποίησης αρχείου δεδομένων. Το παράθυρο αυτό ανοίγει αυτόματα με την εκκίνηση του SPSS. Ο Viewer παρέχει τη δυνατότητα απεικόνισης όλων των στατιστικών αναλύσεων, τη δημιουργία πινάκων και γραφικών και την αποθήκευση σε αρχείο αποτελεσμάτων. Ο Viewer ανοίγει αυτόματα με την πρώτη διαδικασία ανάλυσης που εκτελεί το πακέτο. Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 3

Η Αρχική Εικόνα Η εκκίνηση του προγράμματος γίνεται με την επιλογή του στοιχείου Spss for Windows. Οι διαθέσιμες επιλογές είναι: Run the tutorial (εκτέλεση του εκπαιδευτικού προγράμματος εκμάθησης). Με την επιλογή αυτή εκτελείται ένα βοηθητικό πρόγραμμα εκπαίδευσης του χρήστη στο πακέτο. Type in data (εισαγωγή δεδομένων). Η επιλογή αυτή ενεργοποιεί τον Data editor παρέχοντας στον χρήστη τη δυνατότητα να εισάγει δεδομένα σε ένα κενό φύλλο εργασίας. Run an existing query (εκτέλεση μιας ήδη υπάρχουσας άντλησης πληροφοριών). Το SPSS έχει σαν δυνατότητα, όπως θα δούμε παρακάτω, τη διασύνδεση και ανάκτηση πληροφοριών δεδομένων από πολλά γνωστά προγράμματα Create new query using Database Capture Wizard. Ακριβώς ότι ισχύει και για το προηγούμενο μόνο που ο μάγος αυτός καθοδηγεί τον χρήστη στη δημιουργία μιας τέτοιας διασύνδεσης. Open an existing file (άνοιγμα ενός ήδη υπάρχοντος αρχείου δεδομέμων). Κάτω από την επιλογή αυτή υπάρχει μία λίστα αρχείων δεδομένων συμβατών με το Spss δηλαδή αρχείων που δημιουργήθηκαν και αποθηκεύθηκαν από το ίδιο το πρόγραμμα. Τα αρχεία αυτά έχουν επίθετο SAV και στη λίστα εμφανίζονται τα 10 τελευταία αρχεία που άνοιξε το πρόγραμμα. Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 4

Ο data editor Η επιλογή του πλήκτρου cancel ή του type in data οδηγεί στον Data editor Στο παράθυρο του data editor υπάρχουν: η γραμμή τίτλου, τα μενού, η γραμμή εργαλείων, τα πεδία εισαγωγής δεδομένων, τα κελιά δεδομένων οι λωρίδες κύλισης (δεξιά και κάτω) και η γραμμή κατάστασης στο κάτω μέρος του παραθύρου Οι διαθέσιμες επιλογές είναι: New που οδηγεί σε μία επιπλέον λίστα επιλογών και ζητά από τον χρήστη να αποφασίσει αν θέλει να δημιουργήσει ένα νέο παράθυρο data editor, syntax editor, output, draft output & script. Open δίνει τη δυνατότητα να ανοίξει ένα ήδη αποθηκευμένο αρχείο δεδομένων είτε του Spss είτε άλλων συνεργαζόμενων προγραμμάτων ή παλαιότερων εκδόσεων του προγράμματος. Στη λίστα αρχεία τύπου ο χρήστης πρέπει να επιλέξει τι τύπου αρχεία πρόκειται να εισάγει. Εξ ορισμού το πρόγραμμα αναζητά αρχεία τύπου sav. Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 5

Άνοιγμα Αρχείου Στη λίστα αρχεία τύπου ο χρήστης πρέπει να επιλέξει τι τύπου αρχεία πρόκειται να εισάγει. Εξ ορισμού το πρόγραμμα αναζητά αρχεία τύπου sav. Πρέπει να σημειωθεί ότι το spss ανοίγει αρχεία excel Για αρχεία σε μορφή ASCII υπάρχει η αντίστοιχη επιλογή. Η τρίτη από αριστερά επιλογή View δίνει στο χρήστη δυνατότητες ρύθμισης παραμέτρων του παραθύρου data editor. Οι επιλογές status bar, toolbars και Grid lines και Value labels εμφανίζουν ή κρύβουν τα αντίστοιχα στοιχεία. Η επιλογή Value labels εμφανίζει ή αποκρύπτει τις ετικέτες των μεταβλητών (βλέπε παρακάτω). Με την επιλογή Fonts παρέχεται η δυνατότητα ρύθμισης των χαρακτήρων στα δεδομένα και μάλιστα η σωστή απεικόνιση των ελληνικών αρκεί να επιλεγεί στη λίστα Γραφή η Ελληνική αντί της Δυτικής που είναι εξ ορισμού Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 6

Εισαγωγή Δεδομένων (1) Το πρώτο βήμα στην εισαγωγή δεδομένων είναι η δημιουργία των μεταβλητών. Πατάμε στο κουμπί Variable View του Data Editor ή κάνουμε διπλό κλικ στην επικεφαλίδα της στήλης (var) που θέλουμε να εισάγουμε τα δεδομένα και εμφανίζεται το διπλανό παράθυρο διαλόγου Στο πεδίο variable name γράφουμε το όνομα της μεταβλητής. Εκεί μπορεί ο χρήστης να πληκτρολογήσει σε αγγλικά ή ελληνικά ένα όνομα για την μεταβλητή που δημιουργεί. Το όνομα αυτό δεν πρέπει να ξεπερνά τους 8 χαρακτήρες και πρέπει να είναι μοναδικό στο αρχείο. Δεν επιτρέπονται κενά και κάποιοι άλλοι ειδικοί χαρακτήρες (!,?,,*). Το Type ορίζει τον τύπο της μεταβλητής δηλαδή των δεδομένων που θα περιέχει η συγκεκριμένη στήλη. Οι κύριες επιλογές είναι δύο: numeric και string. Η numeric ορίζει ότι τα δεδομένα θα είναι αριθμοί ενώ η string ότι τα δεδομένα θα είναι γράμματα. Στη δεξιά πλευρά του νέου πλαισίου define variable type ο χρήστης μπορεί να ορίσει το μέγεθος της στήλης Width δηλαδή πόσοι αριθμοί ή χαρακτήρες Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 7

Εισαγωγή Δεδομένων (2) Στην ένδειξη Decimal Places βάζουμε το πλήθος των δεκαδικών ψηφίων της μεταβλητής, αν φυσικά υπάρχουν. Στη στήλη Label, γράφουμε τον τίτλο της ερώτησης, αν θέλουμε με ελληνικά γράμματα, ο οποίος θα εμφανίζεται σαν επικεφαλίδα όταν με το ποντίκι περνάμε πάνω από τη στήλη αλλά και στην παρουσίαση των αποτελεσμάτων. Πατώντας στη στήλη Values εμφανίζεται ένα κουμπάκι όμοιο με αυτό της στήλης Type το οποίο αν ενεργοποιήσουμε θα εμφανιστεί το διπλανό παράθυρο διαλόγου. Αν η μεταβλητή είναι ποσοτική δεν χρησιμοποιείται αν όμως είναι ποιοτική τότε στο κελί Value γράφουμε τον κωδικό και στο κελί label γράφουμε το κείμενο που αντιστοιχεί. Στην στήλη missing values αντιστοιχεί η φόρμα που σημειώνουμε τις τιμές ή τους κωδικούς των τιμών οι οποίες θέλουμε να θεωρούνται missing στην επεξεργασία και στην παρουσίαση των δεδομένων. Η στήλη Align μας επιτρέπει να στοιχήσουμε Left ή Right ή Center ανάλογα με τη στοίχιση που θέλουμε να έχουν τα δεδομένα μέσα στα κελιά. Τέλος η στήλη Measure μας επιτρέπει να δηλώσουμε το είδος της μεταβλητής. Στην περίπτωση ποσοτικών μεταβλητών επιλέγουμε Scale ενώ σε περίπτωση ποιοτικών Ordinal ή Nominal Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 8

Κινήσεις στον data editor (1) Η εισαγωγή δεδομένων μπορεί να γίνει σε οποιοδήποτε κελί του data editor. Κάτω από τη μπάρα εργαλείων εμφανίζονται ο αριθμός της περίπτωσης και το όνομα της μεταβλητής ενώ ο δρομέας εμφανίζεται στο δεξί μέρος του πεδίου περιμένοντας την εισαγωγή δεδομένων. Η τελική εισαγωγή γίνεται με το πάτημα του πλήκτρου enter ή με την επιλογή άλλου κελιού. Για να μπορέσει ο χρήστης να εισάγει κάτι άλλο εκτός από αριθμούς θα πρέπει να το έχει δηλώσει στον ορισμό της μεταβλητής. Αλλιώς το πρόγραμμα επιστρέφει ένα ηχητικό σήμα. Στο μενού data οι επιλογές insert variable και insert case εισάγουν αντίστοιχα στήλη και γραμμή στον πίνακα των δεδομένων. Η εισαγωγή της μεταβλητής γίνεται αριστερά από το σημείο που είναι επιλεγμένο και της περίπτωσης επάνω. Οι επιλογές της εισαγωγής μεταβλητής και περίπτωσης εμφανίζονται και με δεξί κλικ πάνω στην επιλεγμένη μεταβλητή ή περίπτωση αντίστοιχα. Με τις εντολές cut, copy, paste που βρίσκονται στο μενού edit μπορεί ο χρήστης να αντιγράψει ή να μετακινήσει δεδομένα ή μεταβλητές. Κατά την αντιγραφή μεταβλητών όπως είναι φυσικό το spss δίνει στην νέα μεταβλητή ένα όνομα διαφορετικό από το όνομα της αρχικής μεταβλητής. Οι εντολές αυτές όπως και η clear είναι διαθέσιμες με δεξί κλικ πάνω στη μεταβλητή. Δύο επιλογές που βοηθούν τον χρήστη στην εμφάνιση ή μετακίνηση σε ένα μεγάλο αρχείο δεδομένων είναι η go to case που βρίσκεται στο μενού data και find που βρίσκεται στο μενού edit. Όταν επιλεγούν ανοίγουν ένα πλαίσιο διαλόγου όπου ο χρήστης μπορεί να εισάγει αριθμό περίπτωσης για την go to case ή τα δεδομένα για τα οποία θα γίνει η αναζήτηση στο search for data Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 9

Κινήσεις στον data editor (2) Στο μενού data και στο δεύτερο όμιλο επιλογών η εντολή sort cases ταξινομεί τα δεδομένα βάση μιας μεταβλητής (ή περισσοτέρων) σε αύξουσα ή φθίνουσα σειρά. Η επιλογή transpose μετατρέπει σε ένα καινούργιο αρχείο δεδομένων τις υπάρχουσες μεταβλητές σε περιπτώσεις και το αντίστροφο. Στο πλαίσιο διαλόγου transpose ο χρήστης πρέπει να εισάγει τις μεταβλητές που θέλει να βρίσκονται στο νέο αρχείο σαν περιπτώσεις και να επιλέξει στο πεδίο name variable την μεταβλητή που θα δεχθεί τις παλαιές μεταβλητές σαν περιπτώσεις δηλαδή βάση της οποίας θα γίνει η περιστροφή (flip). Μετά την επιλογή των μεταβλητών στο πλαίσιο διαλόγου το πάτημα του ΟΚ εκτελεί την περιστροφή και ανοίγει τον editor με τις σχετικές πληροφορίες. Η νέα μεταβλητή που εμπεριέχει τα ονόματα των παλαιών μεταβλητών ονομάζεται από το πρόγραμμα case_lbl. Η επιλογή merge file που βρίσκεται στο σύνολο επιλογών του data δίνει τη δυνατότητα συνένωσης αρχείων. Η συνένωση αυτή μπορεί να αφορά αρχεία που περιέχουν ίδιες μεταβλητές αλλά διαφορετικές περιπτώσεις (κατακόρυφη συνένωση) ή ίδιες περιπτώσεις αλλά διαφορετικές μεταβλητές (οριζόντια συνένωση). Στην πρώτη περίπτωση η διαδικασία είναι ως εξής: Από το μενού data κλικ στο merge files κλικ στο add case. Με τον ίδιο τρόπο περίπου μπορεί ο χρήστης να προσθέσει σε ένα αρχείο νέες μεταβλητές από ένα άλλο αρχείο. Το πλαίσιο διαλόγου που ανοίγει μετά την επιλογή Add variables περιλαμβάνει και αυτό το πεδίο στα αριστερά με τις μεταβλητές που υπάρχουν στο ενεργό αρχείο (το spss αναγνωρίζει τα ονόματα των μεταβλητών και επειδή τα ονόματα αυτά όπως αναφέρθηκε πρέπει να είναι μοναδικά δεν επιτρέπει την εισαγωγή). Υπάρχει όμως η δυνατότητα μετονομασίας με το πλήκτρο rename. Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 10

Μετατροπή μεταβλητών Μερικές βασικές επεμβάσεις για τη μετατροπή των δεδομένων γίνονται από το σύνολο των εντολών που εμπεριέχονται στην επιλογή transform που βρίσκεται στα μενού. Η πρώτη εντολή είναι η compute και δίνει τη δυνατότητα στον χρήστη να δημιουργήσει μεταβλητές που τα δεδομένα τους προέρχονται από επεξεργασία δεδομένων άλλων μεταβλητών. Κάνοντας κλικ στη λέξη compute ανοίγει το πλαίσιο διαλόγου compute variable που είναι σε γενικές γραμμές ίδιο με αυτό για την επιλογή των περιπτώσεων (select cases If). Πάνω αριστερά υπάρχει το πεδίο target variable και μέσα σε αυτό ο χρήστης πρέπει να εισάγει το όνομα της νέας μεταβλητής που θα δημιουργηθεί. Μετά την εισαγωγή του ονόματος ενεργοποιείται ο διακόπτης Type & Label έτσι ώστε να φορμάρει τη μεταβλητή πλήρως. Κάτω από το διακόπτη αυτό βρίσκονται οι μεταβλητές του αρχείου. Ο χρήστης μπορεί να επιλέγει μόνο μία μεταβλητή και πατώντας τον διακόπτη με το βέλος να την εισάγει στο πεδίο τέλεσης των πράξεων. Ένα αντίγραφο του ονόματος της μεταβλητής εμφανίζεται στο πεδίο. Επιλέγοντας τους τελεστές που θέλει ο χρήστης δημιουργεί μια συνάρτηση. Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 11

Analyze/Descriptive Statistics/Descriptives Μετά την εισαγωγή των δεδομένων στον Data Editor, το επόμενο βήμα είναι η επιλογή της Στατιστικής ανάλυσης ή του γραφήματος που μας ενδιαφέρει. Αν για παράδειγμα θέλουμε να πάρουμε ορισμένα στατιστικά στοιχεία για κάποιες μεταβλητές επιλέγουμε από το μενού Analyze / Descriptive Statistics. Εδώ υπάρχουν διάφορες υπο επιλογές που μπορούμε να επιλέξουμε: Analyze / Descriptive Statistics / Descriptives. Με αυτή την διαδικασία λαμβάνουμε την τιμή κάποιων στατιστικών συναρτήσεων για μια μεταβλητή-δείγμα Sample size, mean, minimum, maximum, standard deviation, variance, range, sum, standard error of the mean, kurtosis and skewness Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 12

Analyze/Descriptive Statistics/Descriptives Αφού επιλέξουμε αυτή την διαδικασία εμφανίζεται ένα παράθυρο διαλόγου. Σε αυτό επιλέγουμε τις μεταβλητές που θέλουμε να χρησιμοποιήσουμε στη συγκεκριμένη ανάλυση από την λίστα όλων των μεταβλητών (στήλες) που έχουν περαστεί στον data editor. Μπορούμε επίσης να διαλέξουμε και διάφορες άλλες επιλογές από τα Options (π.χ. αν θέλουμε να εμφανιστεί το variance ή το maximum του δείγματος κ.ο.κ.). Εάν μάλιστα διαλέξουμε την επιλογή «save standardized values as variables» τότε στον πίνακα με τα δεδομένα προστίθενται νέες μεταβλητές οι οποίες περιέχουν ως τιμές τις τυποποιημένες τιμές των αρχικών μεταβλητών. Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 13

Analyze/Descriptive Statistics/Descriptives Για παράδειγμα, επιλέγοντας τις μεταβλητές chol και age (αρχείο δεδομένων test) στην διαδικασία Analyze / Descriptive Statistics / Descriptives με Options: Range, Minimum, Maximum, Mean, Std. Deviation, Std. Error of the mean, Variance Πατώντας ΟΚ λαμβάνουμε τα αποτελέσματα (εμφανίζονται στον SPSS Viewer) Descriptive Statistics N Range Minimum Maximum Mean Std. Deviation Variance chol 60 194,00 161,00 355,00 240,0833 48,72729 2374,349 age 60 58 19 77 48,62 12,736 162,206 Valid N (listwise) 60 Η αριστερή πλευρά του Viewer περιέχει ένα γενικό περίγραμμα των αποτελεσμάτων (μπορούμε χρησιμοποιώντας το να πάμε σε κάποιο συγκεκριμένο αποτέλεσμα και να μετακινήσουμε (drag and drop) ή να κρύψουμε κάποιο άλλο). Η δεξιά πλευρά περιέχει στατιστικούς πίνακες, διαγράμματα και κείμενο. Στους πίνακες μπορούμε να αλλάξουμε τις τιμές (Προσοχή, δεν ξαναγίνονται υπολογισμοί), τις ετικέτες, τις γραμμές με τις στήλες κ.α. (pivoting tables) τις γραμματοσειρές (Format / Font), να κρύψουμε στήλες (Ctrl-Alt-Click / Hide Category - View/show all) κ.α.. Είναι επίσης εφικτή η μεταφορά οποιουδήποτε αποτελέσματος μέσω copy - paste σε οποιοδήποτε άλλο πρόγραμμα Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 14

Analyze/Descriptive Statistics/Frequencies Με αυτή την διαδικασία λαμβάνουμε έναν πίνακα με τις συχνότητες εμφάνισης των διαφόρων τιμών μιας ή περισσοτέρων μεταβλητών. Η διαδικασία αυτή μπορεί να επίσης δώσει και τιμές διαφόρων στατιστικών συναρτήσεων καθώς και γραφήματα (ιστόγραμμα, ραβδόγραμμα, κυκλικό διάγραμμα κ.α.) Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 15

Analyze/Descriptive Statistics/Frequencies Το πλαίσιο διαλόγου frequencies στο αριστερό του πεδίο εμφανίζει το σύνολο των μεταβλητών και στο δεξί πεδίο εισάγονται οι προς ανάλυση μεταβλητές. Αυτό είναι κοινό σε όλα τα πλαίσια διαλόγου και γίνεται με το πάτημα του πλήκτρου βέλους αφού επιλεγούν οι μεταβλητές ή η μεταβλητή μπορεί να εκτελεστεί η ανάλυση Στο κάτω μέρος του πλαισίου βρίσκονται τα πλήκτρα: statistics που αφού πατηθεί δίνει τη δυνατότητα στον χρήστη να επιλέξει ποια ακόμα στατιστικά θέλει στα αποτελέσματα της ανάλυσης. Το πλήκτρο charts παρέχει τη δυνατότητα γραφικής απεικόνισης των δεδομένων και μάλιστα στην επιλογή histograms μπορεί το πρόγραμμα αν του ζητηθεί να εμφανίσει την καμπύλη της κανονικής κατανομής παράλληλα με το ιστόγραμμα Με το format δίνονται δυνατότητα επιλογής της φόρμας παρουσίασης της ανάλυσης στον viewer. Σε κάθε υποπλαίσιο που ανοίγει μετά το πάτημα αυτών των πλήκτρων και αφού ολοκληρωθούν οι επιλογές πρέπει να πατήσει ο χρήστης το πλήκτρο continue για να επιστρέψει στο κύριο πλαίσιο frequencies και για να ξεκινήσει η ανάλυση το πλήκτρο ΟΚ. Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 16

Analyze/Descriptive Statistics/Frequencies Το πλαίσιο διαλόγου statistics χωρίζεται σε τέσσερα κύρια μέρη. Percentiles Values (επί τοις εκατό τιμές) Quartiles Τεταρτημόρια Cut points for equal groups - Χωρισμός των δεδομένων σε ίσα γκρουπ. Percentiles - Εκατοστημόρια. Αν τσεκάρουμε αυτή την ένδειξη, πρέπει στο παράθυρο να γράψουμε το ποσοστό που θέλουμε και στη συνέχεια να κάνουμε Add. Central tendency (Κεντρική τάση) - Mean (Αριθμητικός μέσος), Median (Διάμεσος), Mode (Τύπος), Sum (Άθροισμα), Dispersion (Διασπορά), Std. Deviation (Τυπική απόκλιση), Variance (Διακύμανση), Range (Εύρος), S.E. Mean (Τυπικό σφάλμα αριθ. Μέσου), Distribution (Κατανομή), Skewness (Ασυμμετρία), Kurtosis (Κύρτωση) Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 17

Analyze/Descriptive Statistics/Frequencies age Frequency Percent Valid Percent Cum. Per. Valid 45 1 1,7 1,7 40,0 46 1 1,7 1,7 41,7 47 1 1,7 1,7 43,3 49 3 5,0 5,0 48,3 50 3 5,0 5,0 53,3 51 1 1,7 1,7 55,0 52 2 3,3 3,3 58,3 53 3 5,0 5,0 63,3 54 4 6,7 6,7 70,0 56 1 1,7 1,7 71,7 57 1 1,7 1,7 73,3 59 1 1,7 1,7 75,0 60 1 1,7 1,7 76,7 61 1 1,7 1,7 78,3 62 2 3,3 3,3 81,7 63 2 3,3 3,3 85,0 64 4 6,7 6,7 91,7 66 1 1,7 1,7 93,3 67 1 1,7 1,7 95,0 68 1 1,7 1,7 96,7 69 1 1,7 1,7 98,3 77 1 1,7 1,7 100,0 Statistics age N Valid 60 Missing 0 Mean 48,62 Std. Error of Mean 1,644 Std. Deviation 12,736 Variance 162,206 Range 58 Minimum 19 Maximum 77 Percentiles 25 37,25 50 50,00 75 59,75 Total 60 100,0 100,0 Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 18

Analyze/Descriptive Statistics/Explore Πολλές φορές καταχωρούμε μία ποσοτική μεταβλητή σε μία στήλη και παράλληλα κάποιες άλλες ποιοτικές ή κατηγορικές μεταβλητές σε άλλες στήλες. Είναι ιδιαίτερα σημαντικό και χρήσιμο να μπορούμε να έχουμε εύκολα και γρήγορα όλα τα Στατιστικά μέτρα της ποσοτικής μεταβλητής, όχι όμως στο σύνολο των εγγραφών της, αλλά ομαδοποιημένα με βάση κάποια άλλη μεταβλητή. Με την διαδικασία Analyze/Descriptive Statistics/Explore λαμβάνουμε τιμές διαφόρων στατιστικών συναρτήσεων καθώς και διάφορα γραφήματα (histogram, box-plot, stemand-leaf plot) είτε για όλες τις παρατηρήσεις είτε ξεχωριστά για διάφορες ομάδες των παρατηρήσεων (π.χ. ξεχωριστά αποτελέσματα της chol για males females κ.ο.κ.). Από το μενού Analyze επιλέγουμε Descriptive Statistics και στη συνέχεια Explore. Στο παράθυρο Dependent List βάζουμε την ποσοτική μεταβλητή Στο παράθυρο Factor List βάζουμε την ποιοτική ή κατηγορική μεταβλητή, η οποία θα χωρίσει την ποσοτική μεταβλητή σε ομάδες Από το Display επιλέγουμε statistics, αν θέλουμε μόνο τα βασικά Στατιστικά μέτρα, Plots αν θέλουμε μόνο γράφημα και Both αν τα θέλουμε και τα δύο. Τσεκάρουμε Descriptives και στο παράθυρο Confidence interval for mean δίνουμε έναν αριθμό, συνήθως μεταξύ του 95 και του 100. Καθορίζουμε δηλαδή το επίπεδο εμπιστοσύνης του διαστήματος εμπιστοσύνης για τη μέση τιμή. Μπορούμε επίσης να τσεκάρουμε M-estimators, για να πάρουμε εκτιμήσεις για τη μέση τιμή. Qutliers, για να πάρουμε τις πέντε υψηλότερες και τις πέντε χαμηλότερες τιμές της κάθε ομάδας. Percentiles για να πάρουμε το 5ο, 10ο, 25ο, 50ο, 75ο, 90ο και 95ο εκατοστημόριο. Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 19

Analyze/Descriptive Statistics/Explore Για παράδειγμα, μπορούμε να επιλέξουμε (dependent list) αρχικά μόνο την μεταβλητή chol (θέτοντας κενό στο Factor List) και να μελετήσουμε τα αποτελέσματα. Επίσης μπορούμε να επιλέξουμε (dependent list) την μεταβλητή chol με Factor list την μεταβλητή sex ή την μεταβλητή drug και να δούμε την ανάλυση της chol ανά ομάδες (άνδρες γυναίκες, στάθμες φαρμάκου). Αξίζει να παρατηρήσουμε ότι με αυτή την διαδικασία μπορούμε να πάρουμε το ιστόγραμμα συχνοτήτων και το box-plot των τιμών των μεταβλητών (π.χ. της chol) είτε συνολικά, είτε ανά κατηγορίες factors. Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 20

Analyze/Descriptive Statistics/Explore Descriptives sex Statistic Std. Error chol man Mean 230,2083 10,11635 95% Confidence Lower Bound 209,2811 Interval for Mean Upper Bound 251,1356 5% Trimmed Mean 227,6019 Median 225,0000 Variance 2456,172 Std. Deviation 49,55978 Minimum 161,00 Maximum 355,00 Range 194,00 Interquartile Range 59,25 Skewness,726,472 Kurtosis,248,918 woman Mean 246,6667 7,95294 95% Confidence Lower Bound 230,5213 Interval for Mean Upper Bound 262,8120 5% Trimmed Mean 245,5864 Median 246,5000 Variance 2276,971 Std. Deviation 47,71762 Minimum 169,00 Maximum 354,00 Range 185,00 Interquartile Range 75,00 Skewness,179,393 Kurtosis -,684,768 Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 21

Analyze/Descriptive Statistics/Explore Tests of Normality Kolmogorov-Smirnov a Shapiro-Wilk sex Statistic df Sig. Statistic df Sig. chol man,102 24,200 *,946 24,216 woman,125 36,167,968 36,373 a. Lilliefors Significance Correction *. This is a lower bound of the true significance. Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 22

Γραφικά με το SPSS Χρησιμοποιώντας το SPSS μπορούμε να παράγουμε πολλών ειδών γραφήματα. Μερικά από αυτά είναι τα παρακάτω: Graphs/Bar/Simple/Summaries for groups Εδώ, κάθε μπάρα του γραφήματος παρουσιάζει τη συχνότητα εμφάνισης κάθε τιμής της μεταβλητής που έχουμε επιλέξει (Drug). Μπορούμε κάνοντας διπλό κλικ στο γράφημα να αλλάξουμε τη μορφή του (χρώμα, 3D, Labels, κ.α), να προσθέσουμε τίτλο, να αλλάξουμε την κλίμακα των αξόνων και γενικά να μορφοποιήσουμε την εμφάνιση του γραφικού Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 23

Γραφικά με το SPSS Graphs/Bar/Simple/Summaries for separate vars: Mean(chol), Mean(age) Εδώ, κάθε μπάρα του ραβδογράμματος αντιπροσωπεύει την μέση τιμή για κάθε μεταβλητή που έχουμε επιλέξει (εδώ των chol και age). Μπορούμε αντί της μέσης τιμής κάθε μεταβλητής να πάρουμε κάποιο άλλο χαρακτηριστικό (variance, maximum, median κ.α.) από την επιλογή Change Summary. Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 24

Γραφικά με το SPSS Graphs/Bar/Simple/ Values of individual cases: chol Εδώ, κάθε μπάρα του ραβδογράμματος αντιπροσωπεύει την τιμή της μεταβλητής που έχουμε επιλέξει (chol) για κάθε ένα case (το γράφημα έχει την παραπάνω μορφή γιατί έχουμε ταξινομήσει τις τιμές τις chol πρώτα). Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 25

Γραφικά με το SPSS Graphs /Βar /Clustered/Summaries for groups: drug, Clusters: Sex Είναι η ίδια διαδικασία με την Bar/Simple/Summaries for groups αλλά αυτή τη φορά τα αποτελέσματα χωρίζονται σε Clusters. Κάθε μπάρα του ραβδογράμματος αντιπροσωπεύει τη συχνότητα εμφάνισης κάθε τιμής της μεταβλητής που έχουμε επιλέξει (Drug) ανά Cluster. Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 26

Γραφικά με το SPSS Graphs/ Bar/ Clustered/Summaries for separate vars: Mean(chol), Mean(age), Category: sex Είναι η ίδια διαδικασία με την Bar/Simple/Summaries for separate vars αλλά αυτή τη φορά τα αποτελέσματα χωρίζονται σε Clusters. Κάθε μπάρα του ραβδογράμματος αντιπροσωπεύει την μέση τιμή για κάθε μεταβλητή που έχουμε επιλέξει (εδώ των chol και age) ανά cluster (sex). Μπορούμε και πάλι αντί της μέσης τιμής κάθε μεταβλητής να πάρουμε κάποιο άλλο χαρακτηριστικό (variance, maximum, median κ.α.) από την επιλογή Change Summary. Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 27

Γραφικά με το SPSS Graphs/ Pie/ Summaries for groups: drug Λαμβάνεται η πίττα με τα ποσοστά των διαφορετικών τιμών της μεταβλητής που επιλέγουμε (drug). Οι διαδικασίες Pie/Summaries for groups, Pie/Summaries of separate variables, Pie/values of individual cases είναι αντίστοιχες με τις Bar/simple/Summaries for groups, Bar/simple/Summaries of separate variables, Bar/simple/values of individual cases μόνο που τώρα στο ύψος που πριν είχαμε μπάρες (ράβδους) τώρα έχουμε τα αντίστοιχα ποσοστά σε φέτες μιας πίττας. Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 28

Γραφικά με το SPSS Graphs/Box Plot /Simple/ Summaries for groups: chol, drug Λαμβάνεται το BoxPlot των τιμών της μεταβλητής που έχουμε επιλέξει (chol) ανά κατηγορία (drug). Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 29

Γραφικά με το SPSS Graphs/ Box Plot/ Simple/ Summaries of separate vars: chol, age Λαμβάνονται τα BoxPlots των τιμών των μεταβλητών που έχουμε επιλέξει (παραπάνω επιλέξαμε τις chol, age αλλά θα μπορούσαμε να ζητήσουμε τo boxplot π.χ. μόνο της chol). Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 30

Γραφικά με το SPSS Graphs /Box Plot /Clustered/ Summaries for groups: chol, sex, drug Λαμβάνεται το BoxPlot των τιμών της μεταβλητής που έχουμε επιλέξει (chol) ανά κατηγορία (drug) και ανά cluster (sex). Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 31

Γραφικά με το SPSS Graphs /Box Plot /Clustered /Summaries of separate vars: chol, age, Category:sex Λαμβάνεται το BoxPlot των τιμών της μεταβλητής που έχουμε επιλέξει (chol) ανά κατηγορία (drug) και ανά cluster (sex). Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 32

Γραφικά με το SPSS Graphs /Error Bar /Simple/Summaries for groups of cases: chol, drug Λαμβάνεται ένα γράφημα με το διάστημα εμπιστοσύνης (συντελεστού 95%) για τον πληθυσμιακό μέσο της μεταβλητής που επιλέγουμε (chol) ανά κατηγορία (drug). Οι άλλες 3 περιπτώσεις στην διαδικασία Error Bar (Clustered, Summaries of separate vars) είναι αντίστοιχες με αυτές του BoxPlot (στη θέση των BoxPlot τώρα δίνεται το δ.ε. 95% για το πληθυσμιακό μέσο). Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 33

Γραφικά με το SPSS Graphs /ScatterPlot /Simple: chol, age, Labels:sex Λαμβάνεται το διδιάστατο γράφημα διασποράς (scatterplot) των δύο μεταβλητών που έχουμε επιλέξει (chol, age). (Αν Χ1,Χ2,,Χn και Υ1,Υ2,,Υn είναι οι τιμές της chol και της age των n = 60 ατόμων τότε τοποθετούνται στο επίπεδο τα σημεία (Χ1,Υ1),,(Xn,Yn)). Στο παραπάνω γράφημα παρατηρούμε μια θετική συσχέτιση μεταξύ των δύο μεταβλητών (όσο αυξάνεται η ηλικία, αυξάνεται ο δείκτης χοληστερίνης). Σε επόμενο μάθημα θα δούμε πως μπορούμε να αναλύσουμε περισσότερο τη σχέση μεταξύ αυτών των δύο μεταβλητών μέσω της ανάλυσης παλινδρόμησης. Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 34

Γραφικά με το SPSS Graphs/ Histogram: chol Λαμβάνουμε το ιστόγραμμα της μεταβλητής που έχουμε επιλέξει (chol). Οι κλάσεις λαμβάνονται αυτόματα (σύμφωνα με κάποιο κανόνα). Όπως είδαμε και σε προηγούμενη διαδικασία (που παρουσιάζεται και πάλι το ιστόγραμμα), μπορούμε να αλλάξουμε διάφορα χαρακτηριστικά του ιστογράμματος που παράγεται (π.χ. το πλήθος των κλάσεων) κάνοντας διπλό κλικ στο ιστόγραμμα και αλλάζοντας κατάλληλα διάφορες παραμέτρους. Για παράδειγμα, μπορούμε να αλλάξουμε το πλήθος των κλάσεων από το menu Chart/Axis: Επιλέγουμε interval και πατώντας OK μπορούμε να αλλάξουμε τα intervals από automatic σε custom και να επιλέξουμε το πλήθος ή το εύρος των κλάσεων που επιθυμούμε. Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 35

Γραφικά με το SPSS Graphs/ Interactive Τα Interactive Chart Dialog Boxes έχουν μερικές διαφορές από τα υπόλοιπα dialog boxes. Οι μεταβλητές που θα χρησιμοποιηθούν επιλέγονται εδώ με drag and drop. Έδώ υπάρχουν τρία είδη μεταβλητών: Categorical (κατηγορικές: π.χ. αγόρι, κορίτσι), scale (αριθμητικές ή κλίμακας, π.χ. 1.2, 1.6, 4,...) και builtin (μεταβλητές προγράμματος, π.χ. Count, Percent). Εδώ για να κάνουμε αλλαγή μεταξύ names-labels αρκεί να κάνουμε right-click πάνω στη λίστα και να κάνουμε την κατάλληλη επιλογή. Επίσης εδώ δεν μπορούμε να πάρουμε πληροφορίες για τις μεταβλητές με right-click. Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 36

ΤΕΛΟΣ Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 37