Πρόλογος Η πλατιά εφαρμογή των στατιστικών μεθόδων, καθώς και η ραγδαία ανάπτυξη των πληροφοριακών συστημάτων και των Ηλεκτρονικών Υπολογιστών (Η/Υ), είχαν ως αποτέλεσμα την ανάπτυξη ενός αρκετά μεγάλου αριθμού εξειδικευμένων προϊόντων στατιστικού λογισμικού. Έτσι, πακέτα όπως το SPSS (Statistical Package for Social Sciences), το Statgraphics, το Statistica, το Splus, το SAS κ.ά εμφανίστηκαν στη διεθνή αλλά και στην ελληνική αγορά λογισμικού, προσφέροντας νέες δυνατότητες στην προσέγγιση της στατιστικής επιστήμης και στη διαδικασία υποστήριξης αποφάσεων με Η/Υ, ακόμη και σε αυτούς που δεν έχουν μυηθεί σε βάθος στη στατιστική θεωρία. Το στατιστικό πακέτο SPSS, προϊόν της εταιρείας SPSS Inc., είναι ένα από τα πλέον αξιόπιστα συστήματα λογισμικού που υποστηρίζουν στατιστικές μεθόδους. Περιλαμβάνει ένα πλήρες σύνολο εργαλείων στατιστικής ανάλυσης και παρουσίασης δεδομένων, που μπορεί να αξιοποιηθεί με απόλυτη επιτυχία σε ένα ευρύ φάσμα εφαρμογών όπως στην επιστημονική έρευνα, στην έρευνα αγοράς, στη διοίκηση επιχειρήσεων, στο σχεδιασμό και τις προβλέψεις, στη βελτίωση της ποιότητας των προϊόντων, στην επεξεργασία και παραγωγή αναφορών από βάσεις δεδομένων, κ.ά. Η εμφάνιση του SPSS, πριν από 20 χρόνια περίπου, αφορούσε στην υποστήριξη ερευνητικών προβλημάτων από το πεδίο των κοινωνικών επιστημών. Η ανάπτυξη βέβαια έγινε αρχικά σε μεγάλα υπολογιστικά συστήματα (mainframes). Με την τεράστια εξέλιξη των προσωπικών υπολογιστών και με την παράλληλη επίλυση προβλημάτων ταχύτητας και χώρου αποθήκευσης, αναπτύχθηκαν σταδιακά νέες κατάλληλες εκδόσεις για κάθε τύπο λειτουργικού συστήματος (όπως το SPSS/PC+ για το DOS και το SPSS for Windows) που στη συνέχεια συμπληρώθηκαν και επεκτάθηκαν. Σήμερα το SPSS λειτουργεί στο σύγχρονο περιβάλλον των Windows και αποτελεί ένα πανίσχυρο και εύχρηστο εργαλείο που μπορεί να καλύψει κάθε ανάγκη στατιστικής επεξεργασίας. Τα ιδιαίτερα χαρακτηριστικά του πακέτου, που το έχουν καταστήσει ένα από τα πλέον δημοφιλή στο χώρο του, είναι το ευρύ φάσμα στατιστικών μεθόδων που διαθέτει από τις πιο απλές μέχρι τις πιο εξειδικευμένες, η ευκολία διαχείρισης δεδομένων και αρχείων, η δημιουργία πινάκων και γραφικών και τέλος η δυνατότητα συνεργασίας με όλα τα γνωστά και δημοφιλή προγράμματα της αγοράς. Το Τμήμα Πληροφορικής του Τεχνολογικού Ιδρύματος Θεσσαλονίκης έχει εισάγει στο πρόγραμμα σπουδών του την εκμάθηση του στατιστικού πακέτου SPSS στα πλαίσια εργαστηριακού μαθήματος. Οι σπουδαστές έχουν την ευκαιρία να εφαρμόσουν τις μεθόδους που διδάσκονται στο θεωρητικό μάθημα της Στατιστικής, χρησιμοποιώντας ένα εύχρηστο εργαλείο στατιστικής ανάλυσης. Η εκπαίδευση στο SPSS περιλαμβάνει την πραγματοποίηση ασκήσεων από τους χώρους της επιστημονικής έρευνας, των επιχειρήσεων, της
πληροφορικής κ.ά. Ιδιαίτερη σημασία δίνεται στη μελέτη συγκεκριμένων προβλημάτων μετά από επεξεργασία στοιχείων που αναφέρονται στο πρόβλημα (case studies). Οι σημειώσεις αυτές απευθύνονται στους σπουδαστές του Τμήματος Πληροφορικής του Τ.Ε.Ι. Θεσσαλονίκης που παρακολουθούν το αντίστοιχο εργαστηριακό μάθημα, αλλά και σε όσους θα ήθελαν να εφαρμόσουν κάποιες στατιστικές μεθόδους με τη βοήθεια του SPSS για τον εμπλουτισμό των πτυχιακών εργασιών τους με στατιστική τεκμηρίωση. Σκοπός της προσπάθειας αυτής είναι η συστηματική ανάπτυξη της μεθοδολογίας επίλυσης συγκεκριμένων στατιστικών προβλημάτων με τη χρήση του SPSS καθώς και η ερμηνεία των αποτελεσμάτων με απλό και συνοπτικό τρόπο. Πρέπει να τονίσουμε ότι στις σημειώσεις αυτές περιγράφονται ορισμένες μόνο διαδικασίες του SPSS, έτσι όπως έχουν αυτές επιλεγεί από τους διδάσκοντες για την κατανόηση της φιλοσοφίας του πακέτου και για την απάντηση απλών ερωτημάτων, που συχνά αντιμετωπίζει κανείς κατά την εφαρμογή των στατιστικών μεθόδων στο πλαίσιο εκπόνησης μιας ερευνητικής εργασίας. Έγινε προσπάθεια ώστε τα παραδείγματα που δίνονται για επεξεργασία να μην είναι τεχνητά (κατασκευασμένα δεδομένα) αλλά αντίθετα να αφορούν σε πραγματικά και επίκαιρα προβλήματα. Τα στατιστικά συμπεράσματα δίνονται σε απλή γλώσσα, αποφεύγοντας τους δυσνόητους μαθηματικούς συλλογισμούς, όπου βέβαια αυτό είναι δυνατό χωρίς αλλοίωση της επιστημονικής ορθότητας και ακρίβειας των μεθόδων που παρουσιάζονται. Ελπίζουμε οι σημειώσεις αυτές να αποτελέσουν ένα χρήσιμο εγχειρίδιο των βασικών προγραμμάτων του SPSS και να δώσουν κίνητρο για την περαιτέρω διερεύνηση των πραγματικά πολύ μεγάλων δυνατοτήτων του πακέτου και για την καλύτερη προσέγγιση της στατιστικής επιστήμης και των πλούσιων εφαρμογών της. Θεσσαλονίκη, Νοέμβριος 2007 Ε.Ν. Σωσσίδου και Δ. Κ. Ψευτογιάννη
Εισαγωγή Κ Ε Φ Α Λ Α Ι Ο 1 Εισαγωγή Η επιλογή της μεθόδου ανάλυσης, καθώς και η ανάγνωση και αξιολόγηση των στατιστικών αποτελεσμάτων που προκύπτουν από τη χρήση ενός ειδικού στατιστικού προγράμματος, όπως είναι το SPSS, απαιτεί βαθιά γνώση της στατιστικής μεθοδολογίας. Δυστυχώς κανένα στατιστικό πακέτο δεν είναι αρκετά "έξυπνο" ώστε να επιλέγει μόνο του τις κατάλληλες τεχνικές και μεθόδους που απαιτούνται ανάλογα με τη φύση των δεδομένων. Ακόμη περισσότερο, κανένα πακέτο δεν είναι ικανό να εμποδίσει το χρήστη από το να επιλέξει μία ακατάλληλη μέθοδο και να εξάγει ανόητα συμπεράσματα. Είναι λοιπόν απαραίτητο να συνειδητοποιήσουμε ότι η κατάλληλη εκλογή μεθόδου ανάλυσης εξαρτάται αποκλειστικά και μόνο από τον ερευνητή και όχι από οποιοδήποτε πρόγραμμα. Βέβαια, στο μικρό αυτό εγχειρίδιο δεν έχουμε την πρόθεση να παρουσιάσουμε ούτε τις αρχές ούτε και τις μεθόδους της στατιστικής, τις οποίες ο αναγνώστης μπορεί να βρει σε μία πλούσια βιβλιογραφία που έχει αναπτυχθεί γύρω από τα θέματα αυτά. Αντίθετα, το εγχειρίδιο αυτό το έχουμε σχεδιάσει έτσι, ώστε να αποτελεί ένα βοήθημα σε αυτόν που γνωρίζει τις μεθόδους και επιθυμεί τη γρήγορη και ακριβή εκτίμηση στατιστικών δεικτών με τη χρήση του SPSS. Παρόλα αυτά, δεν θα μπορούσαμε να αναφερθούμε αμέσως στο περιβάλλον του SPSS, χωρίς μία συνοπτική αναφορά στις βασικές έννοιες και στην ορολογία, που πρέπει κάποιος να γνωρίζει για να προχωρήσει σε στατιστική έρευνα. 1.1. Βασικές Έννοιες της Στατιστικής Aς ξεκινήσουμε, δίνοντας έναν ακόμη ορισμό της Στατιστικής Επιστήμης, που είναι μία επιστήμη με αντικείμενο τη συλλογή, οργάνωση, παρουσίαση, ανάλυση και ερμηνεία δεδομένων, με στόχο την εξαγωγή συμπερασμάτων που ερμηνεύουν διάφορα προβλήματα. Η στατιστική ακολουθεί την επαγωγική λογική (Σχήμα 1.1). Δηλαδή, επιχειρεί την εξαγωγή συμπερασμάτων για ένα σύνολο ύστερα από παρατήρηση ενός μέρους του συνόλου. Μεθοδολογία Έρευνας και Στατιστική με τη χρήση του SPSS 13.0 for Windows - 1 -
Σωσσίδου, Ε.Ν. και Ψευτογιάννη, Δ.Κ. Με άλλα λόγια, ο ερευνητής που αντιμετωπίζει ένα πρόβλημα ή θέτει ένα ερώτημα προς απάντηση, πρέπει να πάρει κάποιες μετρήσεις των ιδιοτήτων (χαρακτηριστικών) από το σύνολο των ατόμων στο οποίο αναφέρεται η έρευνά του. Τις περισσότερες όμως φορές η καταγραφή των ιδιοτήτων ολόκληρου του συνόλου είναι αδύνατη. Έτσι υπάρχει η ανάγκη ενός επαγωγικού εργαλείου, μιας διαδικασίας δηλαδή, η οποία να καταγράφει μετρήσεις σε ένα αντιπροσωπευτικό υποσύνολο του αρχικού συνόλου και στη συνέχεια χρησιμοποιώντας τις μετρήσεις αυτές να εξάγει συμπεράσματα για το αρχικό σύνολο. ΠΛΗΘΥΣΜΟΣ Σύνολο των παρατηρήσεων του χαρακτηριστικού που ενδιαφέρει τη στατιστική έρευνα Στατιστική Επαγωγή Διατύπωση συμπερασμάτων για τον πληθυσμό που βασίζονται στα δεδομένα του δείγματος ΔΕΙΓΜΑ Υποσύνολο του πληθυσμού Σχήμα 1.1: Επαγωγικός τρόπος έρευνας με τη Στατιστική Ο όρος πληθυσμός (population) αναφέρεται σε ολόκληρο το σύνολο των ατόμων για το οποίο ενδιαφερόμαστε. Ένας πληθυσμός μπορεί να είναι πραγματικός όπως το σύνολο των ατόμων που γεννήθηκαν το 1990, ή θεωρητικός, όπως το σύνολο των βρεφών που γεννήθηκαν ή θα γεννηθούν από μητέρες που καπνίζουν ένα πακέτο τσιγάρα ημερησίως. Ο όρος δείγμα (sample) αναφέρεται σε ένα υποσύνολο του πληθυσμού. Οι περισσότερες στατιστικές έρευνες στηρίζονται σε δείγματα αφού, όπως αναφέραμε και προηγουμένως, οι ιδιότητες του πληθυσμού είναι συνήθως αδύνατο να καταγραφούν. Θέλουμε λοιπόν συχνά να εξάγουμε συμπεράσματα για τον πληθυσμό βασιζόμενοι στο δείγμα που έχουμε επιλέξει. Για παράδειγμα, θέλουμε να εκτιμήσουμε το πραγματικό ποσοστό των θεατών ενός αγώνα ποδοσφαίρου που μεταδόθηκε τηλεοπτικά, βασιζόμενοι σε ένα δείγμα ατόμων που ρωτήθηκε σχετικά. Ο όρος παράμετρος (parameter) αναφέρεται σε κάποιο "μέτρο" του πληθυσμού. Στο προηγούμενο παράδειγμα το πραγματικό (αλλά άγνωστο) ποσοστό των ατόμων που παρακολούθησαν τον αγώνα αποτελεί μία παράμετρο του πληθυσμού της χώρας. - 2 - Μεθοδολογία Έρευνας και Στατιστική με τη χρήση του SPSS 13.0 for Windows
Εισαγωγή Αντίστοιχα, ο όρος στατιστικό μέτρο (statistic) αναφέρεται σε κάποιο "μέτρο" του δείγματος. Στο παράδειγμα, το ποσοστό των ατόμων του δείγματος που απάντησαν ότι παρακολούθησαν τον αγώνα αποτελεί στατιστικό μέτρο, το οποίο θα χρησιμοποιηθεί για την εκτίμηση της παραμέτρου. Στο σημείο αυτό, πρέπει να αναφέρουμε τις δύο βασικές κατηγορίες μεθόδων που χρησιμοποιεί η στατιστική. Οι μέθοδοι της στατιστικής διακρίνονται παραδοσιακά σε αυτές που αφορούν στη συλλογή και στην παρουσίαση των στατιστικών μέτρων του δείγματος και σε εκείνες που αφορούν στην εκτίμηση των παραμέτρων του πληθυσμού με βάση τα στατιστικά μέτρα του δείγματος. Το τμήμα που περιλαμβάνει τις πρώτες μεθόδους ονομάζεται Περιγραφική Στατιστική (Descriptive Statistics), ενώ εκείνο που αναφέρεται στις εκτιμήσεις των παραμέτρων του πληθυσμού ονομάζεται Συμπερασματική Στατιστική (Inferential Statistics). 1.2. Μεταβλητές Με τον όρο μεταβλητές (variables) θα εννοούμε τα χαρακτηριστικά που μας ενδιαφέρουν να μετρήσουμε και να καταγράψουμε σε ένα σύνολο ατόμων. Έτσι, μεταβλητές μπορούν να θεωρηθούν (όταν αναφερόμαστε σε ανθρώπους) το ύψος, το χρώμα μαλλιών, η γνώμη που έχουν για κάποιο μέτρο της κυβέρνησης, η ηλικία τους κλπ. Τις μεταβλητές διακρίνουμε στις παρακάτω κατηγορίες: (α) Ποιοτικές μεταβλητές (qualitative variables). Είναι οι μεταβλητές των οποίων οι δυνατές τιμές είναι κατηγορίες διαφορετικές μεταξύ τους. Η χρήση αριθμών για την παράσταση των τιμών μίας τέτοιας μεταβλητής είναι καθαρά συμβολική και δεν έχει έννοια μέτρησης. Για παράδειγμα, η μεταβλητή "οικογενειακή κατάσταση" έχει δυνατές τιμές τις κατηγορίες "έγγαμος", "άγαμος", "διαζευγμένος" και "χήρος". Τις τιμές αυτές θα μπορούσαμε να τις παραστήσουμε συμβολικά με τους αριθμούς 1, 2, 3 και 4 αντίστοιχα (κάτι το πολύ συνηθισμένο στην εισαγωγή δεδομένων σε Η/Υ όπως θα δούμε), χωρίς όμως να υπάρχει κάποια έννοια διάταξης ή μέτρησης. (β) Ποσοτικές μεταβλητές (quantitative variables). Είναι οι μεταβλητές με τιμές αριθμούς που όμως έχουν τη σημασία της μέτρησης. Η ηλικία, ο αριθμός παιδιών μιας οικογένειας, το οικογενειακό εισόδημα είναι τέτοιες μεταβλητές. Οι ποσοτικές μεταβλητές διακρίνονται με τη σειρά τους σε δύο μεγάλες κατηγορίες τις διακριτές (ή ασυνεχείς) και τις συνεχείς. Σε μία διακριτή μεταβλητή η μικρότερη μη μηδενική διαφορά που μπορούν να έχουν δύο τιμές της είναι σταθερή ποσότητα. Ένα τέτοιο παράδειγμα είναι ο αριθμός των μελών της Μεθοδολογία Έρευνας και Στατιστική με τη χρήση του SPSS 13.0 for Windows - 3 -
Σωσσίδου, Ε.Ν. και Ψευτογιάννη, Δ.Κ. οικογένειας. Πράγματι, η μικρότερη δυνατή (μη μηδενική) διαφορά ανάμεσα σε δύο οικογένειες είναι ένα άτομο. Τέτοιες μεταβλητές έχουν "διακεκριμένες" τιμές όπως 0, 1, 2, 3,... Αντίθετα, σε μία συνεχή μεταβλητή δύο τιμές μπορούν να διαφέρουν κατά οσοδήποτε μικρή ποσότητα. Ως παράδειγμα αναφέρουμε την ηλικία, για την οποία η διαφορά ανάμεσα σε δύο τιμές θα μπορούσε να είναι χρόνια, μήνες, ημέρες, ώρες, λεπτά, δευτερόλεπτα, κοκ. Στην πράξη θεωρούμε σαν συνεχή μια μεταβλητή που μπορεί να πάρει όλες τις τιμές σε ένα διάστημα, διαφορετικά τη θεωρούμε διακριτή (η μεταβλητή "άτομα οικογένειας" δε θα μπορούσε προφανώς να πάρει όλες τις τιμές ανάμεσα στο 1 και στο 3 όπως π.χ. την τιμή 1.5). - 4 - Μεθοδολογία Έρευνας και Στατιστική με τη χρήση του SPSS 13.0 for Windows
Εισαγωγή στο SPSS Κ Ε Φ Α Λ Α Ι Ο 2 Εισαγωγή στο SPSS Το SPSS διαθέτει μία ειδική γλώσσα εντολών, με την οποία επιτυγχάνουμε τη διαμόρφωση του περιβάλλοντος εργασίας του συστήματος, τη διαχείριση των αρχείων, καθώς και την εισαγωγή, επεξεργασία και στατιστική ανάλυση των δεδομένων. Οι εντολές του SPSS είναι απλές αγγλικές λέξεις, που είναι δυνατό να συνοδεύονται από μία ή περισσότερες παραμέτρους, ή να συνδυάζονται με υποεντολές. Ανάλογα με τη λειτουργία τους, διακρίνουμε τις εντολές στις παρακάτω τρεις κατηγορίες: 1. Λειτουργικές εντολές (operational commands): Είναι οι εντολές που χρησιμοποιούμε για κλήση βοήθειας, διαμόρφωση του περιβάλλοντος εργασίας και διαχείριση αρχείων 2. Εντολές ορισμού και διαχείρισης δεδομένων (data definition and manipulation): Είναι οι εντολές που χρησιμοποιούμε για ανάγνωση, επιλογή και μετασχηματισμό δεδομένων και δημιουργία ετικετών και μορφών 3. Διαδικασίες (procedures): είναι οι εντολές που χρησιμοποιούμε για την παρουσίαση δεδομένων, την εφαρμογή περιγραφικών και αναλυτικών στατιστικών μεθόδων και για βοηθητικές λειτουργίες. 2.1. Εισαγωγή στο SPSS for Windows 2.1.1. O Επεξεργαστής Δεδομένων του SPSS for Windows Ο επεξεργαστής δεδομένων του SPSS for Windows προσφέρει ένα εύχρηστο σύστημα δημιουργίας και επεξεργασίας αρχείων δεδομένων, που μοιάζει πολύ με εκείνο ενός λογιστικού φύλλου (spreadsheet). Το παράθυρο του επεξεργαστή (Data Editor window) ανοίγει αυτόματα μόλις γίνει εκκίνηση του προγράμματος. Οι βασικές αρχές λειτουργίας του επεξεργαστή δεδομένων του SPSS for Windows είναι οι εξής : Μεθοδολογία Έρευνας και Στατιστική με τη χρήση του SPSS 13.0 for Windows - 5 -
Σωσσίδου, Ε.Ν. και Ψευτογιάννη, Δ.Κ. Οι γραμμές αποτελούν τις περιπτώσεις (rows cases). Kάθε γραμμή αντιπροσωπεύει μία περίπτωση ή μία στατιστική μονάδα. Οι στήλες αποτελούν τις μεταβλητές (columns variables). Κάθε στήλη αντιπροσωπεύει μία μεταβλητή ή αλλιώς ένα χαρακτηριστικό που μελετούμε. Οι κυψέλες (cells) περιέχουν τιμές. Κάθε κυψέλη περιέχει μία μόνο τιμή μίας μεταβλητής για μία περίπτωση. Οι κυψέλες βρίσκονται στη διασταύρωση μίας στήλης και μίας γραμμής και περιέχουν αποκλειστικά δεδομένα (ενώ στα λογιστικά φύλλα οι κυψέλες περιέχουν και τύπους). Το αρχείο δεδομένων αποτελεί ένα πίνακα. Οι διαστάσεις του αρχείου καθορίζονται από τον αριθμό των περιπτώσεων και από τον αριθμό των μεταβλητών. Εάν εισαχθούν δεδομένα σε μία κυψέλη που βρίσκεται εκτός των αρχικών ορίων του πίνακα, το SPSS επεκτείνει τα όρια αυτά, έτσι ώστε να περιλάβει τις νέες γραμμές και / ή στήλες μεταξύ της κυψέλης και των ορίων του αρχείου. Δεν υπάρχουν «άδειες» κυψέλες μέσα στα όρια του αρχείου δεδομένων. Για τις αριθμητικές μεταβλητές, οι κενές κυψέλες περιέχουν «χαμένες» για το σύστημα τιμές, ενώ για τις αλφαριθμητικές μεταβλητές οι κενές κυψέλες περιέχουν έγκυρες τιμές. Στη συνέχεια, θα περιγράψουμε τον τρόπο εισαγωγής και επεξεργασίας δεδομένων με τον επεξεργαστή αυτό. Εισαγωγή δεδομένων Η εισαγωγή δεδομένων είναι δυνατή με οποιαδήποτε σειρά, κατά περίπτωση, κατά στήλη, σε επιλεγμένες περιοχές ή σε ατομικές θέσεις. Για να εισάγουμε δεδομένα σε μία κυψέλη ακολουθούμε τα εξής απλά βήματα : 1. Επιλέγουμε την κυψέλη χρησιμοποιώντας το ποντίκι ή τα βελάκια. Ένα έντονο περίγραμμα εμφανίζεται γύρω από την κυψέλη, ξεχωρίζοντάς την από τις υπόλοιπες (active cell). Το όνομα της στήλης και ο αριθμός της γραμμής εμφανίζονται στο αριστερό άνω άκρο του παραθύρου του επεξεργαστή δεδομένων (cell editor). 2. Πληκτρολογούμε τα δεδομένα, που εμφανίζονται επίσης στο αριστερό άνω άκρο του παραθύρου του επεξεργαστή δεδομένων. 3. Καταχωρούμε τα δεδομένα πληκτρολογώντας <Enter> ή μετακινούμενοι σε άλλη κυψέλη. Τα δεδομένα μεταφέρονται τώρα μέσα στην κυψέλη. Κατά την εισαγωγή δεδομένων, οι τιμές εμφανίζονται εξ ορισμού σε numeric format με δύο δεκαδικά ψηφία. Έτσι, αν πληκτρολογήσουμε 123,456 θα εμφανισθεί ως 123,46 αλλά - 6 - Μεθοδολογία Έρευνας και Στατιστική με τη χρήση του SPSS 13.0 for Windows
Εισαγωγή στο SPSS παρόλα αυτά η ακριβής αριθμητική τιμή έχει καταχωρηθεί και εκείνη είναι που θα χρησιμοποιηθεί στους υπολογισμούς. Επίσης, με την εισαγωγή δεδομένων σε μία στήλη, αυτόματα δημιουργείται μία μεταβλητή με το όνομα var0000x (x=αύξων αριθμός μεταβλητής, π.χ. var00001, var00002,...). Παράλληλα όλες οι περιπτώσεις της νέας μεταβλητής που δεν έχουν δεδομένα αποτελούν "χαμένες τιμές" για το σύστημα, όπως φαίνεται και στο Σχήμα 2.1. αριθμός γραμμής όνομα μεταβλητής ενεργή κυψέλη χαμένες τιμές επεξεργαστής κυψέλης Σχήμα 2.1: Το παράθυρο του επεξεργαστή δεδομένων με "χαμένες τιμές" Οι τιμές που μπορούμε να εισάγουμε σε μία κυψέλη καθορίζονται από τον τύπο και το εύρος της μεταβλητής. Ειδικότερα, αν πληκτρολογήσουμε ένα χαρακτήρα σε θέση που ο τύπος της μεταβλητής δεν επιτρέπει, ακούγεται ένας προειδοποιητικός ήχος και η εισαγωγή δεν είναι δυνατή. Για τις αλφαριθμητικές μεταβλητές δεν είναι δυνατή η εισαγωγή χαρακτήρων που υπερβαίνουν το προκαθορισμένο εύρος. Τέλος για τις αριθμητικές μεταβλητές, οι ακέραιες τιμές που υπερβαίνουν το εύρος είναι δυνατό να εισαχθούν, αλλά ο επεξεργαστής θα εμφανίσει στη θέση αυτών αστερίσκους ή κάποιο επιστημονικό συμβολισμό. Για να ελέγξουμε τη μετακίνηση ανάμεσα στις κυψέλες με επιλογή μίας περιοχής δεδομένων ακολουθούμε τα εξής: Επιλογή μίας περίπτωσης (γραμμής). Είτε επιλέγουμε με το ποντίκι τον αριθμό στα αριστερά της γραμμής είτε με τα βελάκια πηγαίνουμε σε οποιαδήποτε κυψέλη της γραμμής και πληκτρολογούμε το συνδυασμό <Shift+Space>. Όλη η γραμμή φωτίζεται. Με τα πλήκτρα <Enter> και <Τab> η κίνηση μπορεί να γίνει μόνο ανάμεσα στις στήλες της συγκεκριμένης περίπτωσης. Επιλογή μίας μεταβλητής (στήλης). Είτε επιλέγουμε με το ποντίκι το όνομα της μεταβλητής στην κορυφή της στήλης είτε με τα βελάκια πηγαίνουμε σε οποιαδήποτε κυψέλη της στήλης Μεθοδολογία Έρευνας και Στατιστική με τη χρήση του SPSS 13.0 for Windows - 7 -
Σωσσίδου, Ε.Ν. και Ψευτογιάννη, Δ.Κ. και πληκτρολογούμε το συνδυασμό <Ctrl+Space>. Όλη η στήλη φωτίζεται. Με τα πλήκτρα <Enter> και <Τab> η κίνηση μπορεί να γίνει μόνο ανάμεσα στις στήλες της συγκεκριμένης περίπτωσης. Επιλογή μίας περιοχής διαφορετικών περιπτώσεων και μεταβλητών. Επιλέγουμε την κυψέλη που βρίσκεται στο ένα άκρο της περιοχής (π.χ. άνω αριστερή γωνία) και με σύρσιμο του ποντικιού διαγώνια σαρώνουμε την υπόλοιπη περιοχή μέχρι να περιληφθεί το άλλο άκρο της περιοχής (π.χ. κάτω δεξιά γωνία). Το πλήκτρο <Enter> περιορίζει την κίνηση από επάνω προς τα κάτω μεταξύ των περιπτώσεων για κάθε μεταβλητή της επιλεγμένης περιοχής. Το πλήκτρο <Tab> περιορίζει την κίνηση από αριστερά προς τα δεξιά μεταξύ των μεταβλητών για κάθε περίπτωση της επιλεγμένης περιοχής. Επεξεργασία δεδομένων Η επεξεργασία δεδομένων περιλαμβάνει την αλλαγή δεδομένων, την αποκοπή, αντιγραφή και επικόλληση δεδομένων, την προσθήκη και διαγραφή δεδομένων, την προσθήκη και διαγραφή μεταβλητών, την αλλαγή της διάταξης των μεταβλητών και την αλλαγή ρυθμίσεων των μεταβλητών. Αλλαγή δεδομένων: Με τον όρο αυτό περιγράφουμε την αντικατάσταση μίας τιμής ή την τροποποίηση αυτής. Αντικατάσταση μίας τιμής. Για να διαγράψουμε μία τιμή και να εισάγουμε μία νέα τιμή: 1. Επιλέγουμε την κυψέλη 2. Εισάγουμε τη νέα τιμή και παρατηρούμε ότι αυτή αντικαθιστά την παλιά τιμή στον επεξεργαστή της κυψέλης 3. Πληκτρολογούμε <Enter> ή επιλέγουμε άλλη θέση και παρατηρούμε ότι μέσα στην κυψέλη η παλιά τιμή έχει αντικατασταθεί από τη νέα τιμή Τροποποίηση μίας τιμής. Για να αλλάξουμε μία τιμή χρησιμοποιώντας το ποντίκι : 1. Επιλέγουμε την κυψέλη 2. Φέρνουμε τον δείκτη του ποντικιού μέσα στον επεξεργαστή της κυψέλης κάνοντας κλικ στη θέση όπου θα κάνουμε διορθώσεις 3. Επεξεργαζόμαστε τα δεδομένα όπως οποιοδήποτε άλλο κείμενο 4. Πληκτρολογούμε <Enter> ή επιλέγουμε άλλη θέση Αντιγραφή / Μετακίνηση δεδομένων. Τα βήματα που ακολουθούμε είναι τα παρακάτω : 1. Επιλέγουμε τα δεδομένα που θέλουμε να αντιγράψουμε / μετακινήσουμε 2. Από τα menus επιλέγουμε Edit - 8 - Μεθοδολογία Έρευνας και Στατιστική με τη χρήση του SPSS 13.0 for Windows
Εισαγωγή στο SPSS Copy / Cut 3. Επιλέγουμε τις κυψέλες όπου θα αντιγραφούν / μετακινηθούν τα δεδομένα 4. Από τα menus επιλέγουμε Edit Paste Τα δεδομένα αντιγράφονται / μετακινούνται, εκτός αν οι τύποι των μεταβλητών δεν είναι ίδιοι, αλλά ούτε συμβατοί, οπότε το σύστημα εισάγει "χαμένες τιμές". Επιπλέον, αν επικολλήσουμε δεδομένα εκτός των ορίων του αρχείου δεδομένων, το SPSS επεκτείνει τα όρια αυτά δημιουργώντας νέες περιπτώσεις και / ή νέες μεταβλητές συμπληρώνοντας τις κενές κυψέλες που προκύπτουν με "χαμένες τιμές". Στο Σχήμα 2.2. παρουσιάζουμε το αποτέλεσμα που θα προκύψει αν ο αριθμός των σειρών και στηλών της περιοχής-πηγής για αντίγραφο δεν είναι ίδιος με εκείνον της περιοχής επικόλλησης. Πηγή Επικόλληση 11 12 13 11 11 11 21 22 23 11 11 11 31 32 33 11 11 11 Αντιγραφή μίας κυψέλης σε πολλές κυψέλες 11 12 13 11 12 13 21 22 23 11 12 13 31 32 33 11 12 13 Αντιγραφή μίας γραμμής σε πολλές σειρές 11 12 13 11 11 11 21 22 23 21 21 21 31 32 33 31 31 31 Αντιγραφή μίας στήλης σε πολλές στήλες 11 12 13 11 12 13 21 22 23 21 22 23 31 32 33 31 32 33 Αντιγραφή μίας περιοχής σε ισομεγέθη περιοχή Μεθοδολογία Έρευνας και Στατιστική με τη χρήση του SPSS 13.0 for Windows - 9 -
Σωσσίδου, Ε.Ν. και Ψευτογιάννη, Δ.Κ. 11 12 13 11 12 21 22 23 21 22 31 32 33,, Αντιγραφή μίας περιοχής σε ανισομεγέθη περιοχή Σχήμα 2.2 : Παραδείγματα αντιγραφής δεδομένων Εισαγωγή νέων περιπτώσεων Η εισαγωγή δεδομένων σε μία κυψέλη ή σε μία κενή γραμμή αυτόματα δημιουργεί μία νέα περίπτωση. Το SPSS εισάγει "χαμένες τιμές" για όλες τις υπόλοιπες μεταβλητές της περίπτωσης αυτής. Αν υπάρχουν κενές σειρές ανάμεσα στη νέα περίπτωση και στις υπάρχουσες περιπτώσεις, οι κενές σειρές γίνονται νέες περιπτώσεις με "χαμένες τιμές" για όλες τις μεταβλητές. Εισαγωγή νέας περίπτωσης ανάμεσα από υπάρχουσες περιπτώσεις. Τα βήματα που ακολουθούμε είναι τα εξής : 1. Επιλέγουμε οποιαδήποτε κυψέλη της γραμμής κάτω από τη θέση της οποίας θέλουμε να εισάγουμε τη νέα περίπτωση. 2. Από τα menus επιλέγουμε Data Insert Case με αποτέλεσμα την εισαγωγή μίας νέας γραμμής που στις θέσεις όλων των μεταβλητών περιέχει "χαμένες τιμές". Εισαγωγή νέων μεταβλητών Η εισαγωγή δεδομένων σε μία κενή στήλη αυτόματα δημιουργεί μία νέα μεταβλητή. Το SPSS εισάγει "χαμένες τιμές" για όλες τις περιπτώσεις της μεταβλητής αυτής. Αν υπάρχουν κενές στήλες ανάμεσα στη νέα μεταβλητή και στις ήδη υπάρχουσες, οι κενές στήλες γίνονται νέες μεταβλητές με "χαμένες τιμές" για όλες τις περιπτώσεις. Εισαγωγή νέας μεταβλητής ανάμεσα από υπάρχουσες μεταβλητές. Τα βήματα που ακολουθούμε είναι τα εξής : 1. Επιλέγουμε οποιαδήποτε κυψέλη της στήλης προς τα δεξιά της θέσης όπου θέλουμε να εισάγουμε τη νέα μεταβλητή. - 10 - Μεθοδολογία Έρευνας και Στατιστική με τη χρήση του SPSS 13.0 for Windows
Εισαγωγή στο SPSS 2. Από τα menus επιλέγουμε Data Insert Variable με αποτέλεσμα την εισαγωγή μίας νέας μεταβλητής, που στις θέσεις όλων των περιπτώσεων περιέχει "χαμένες τιμές". Διαγραφή περιπτώσεων και μεταβλητών Διαγραφή μίας περίπτωσης. Τα βήματα που ακολουθούμε για να διαγράψουμε μία περίπτωση είναι τα εξής : 1. Επιλέγουμε τη γραμμή είτε με το ποντίκι είτε πληκτρολογώντας το συνδυασμό <Shift+Space>. Όλη η γραμμή φωτίζεται. Για την επιλογή περισσοτέρων από μίας σειρών, χρησιμοποιούμε την μέθοδο συρσίματος του ποντικιού (click and drag method) ή χρησιμοποιούμε το πλήκτρο <Shift> σε συνδυασμό με τα βελάκια για να επεκτείνουμε την επιλογή μας. 2. Από τα menus επιλέγουμε Edit Clear με αποτέλεσμα όλες οι σειρές να διαγραφούν και όλες οι σειρές κάτω από αυτές να ανέβουν προς τα επάνω. Διαγραφή μίας μεταβλητής. Τα βήματα που ακολουθούμε για να διαγράψουμε μία μεταβλητή είναι τα εξής : 1. Επιλέγουμε τη στήλη είτε με το ποντίκι είτε πληκτρολογώντας το συνδυασμό <Ctrl+Space>. Όλη η στήλη φωτίζεται. Για την επιλογή περισσοτέρων από μίας στηλών, χρησιμοποιούμε τη μέθοδο συρσίματος του ποντικιού (click and drag method) ή χρησιμοποιούμε το πλήκτρο <Shift> σε συνδυασμό με τα βελάκια για να επεκτείνουμε την επιλογή μας. 2. Από τα menus επιλέγουμε Edit Clear με αποτέλεσμα όλες οι στήλες να διαγραφούν και όλες οι στήλες που βρίσκονται προς τα δεξιά να μετακινηθούν προς τα αριστερά. Μετακίνηση μεταβλητών Η μετακίνηση μίας μεταβλητής με αποκοπή και επικόλληση στον επεξεργαστή δεδομένων γίνεται με τα παρακάτω βήματα : Μεθοδολογία Έρευνας και Στατιστική με τη χρήση του SPSS 13.0 for Windows - 11 -
Σωσσίδου, Ε.Ν. και Ψευτογιάννη, Δ.Κ. 1. Εισάγουμε μία νέα μεταβλητή στη θέση όπου επιθυμούμε να μετακινήσουμε την υπάρχουσα μεταβλητή 2. Επιλέγουμε τη μεταβλητή που επιθυμούμε να μετακινήσουμε με το ποντίκι ή με το συνδυασμό <Ctrl+Space>. 3. Από τα menus δίνουμε Edit Cut και η επιλεγμένη μεταβλητή αποκόπτεται από τη θέση της, ενώ οι μεταβλητές που βρίσκονται στα δεξιά της μετακινούνται προς τα αριστερά. 4. Επιλέγουμε τη νέα μεταβλητή που έχουμε δημιουργήσει στο πρώτο μας βήμα. 5. Από τα menus δίνουμε Edit Paste με αποτέλεσμα η μεταβλητή που είχε αποκοπεί να επικολληθεί στη θέση της νέας μεταβλητής. Αλλαγή ιδιοτήτων μίας μεταβλητής Επιλέγουμε προβολή μεταβλητών (Variable view), όπου οι μεταβλητές παρουσιάζονται ως γραμμές. ( Σχήμα 2.3 (α)) - 12 - Μεθοδολογία Έρευνας και Στατιστική με τη χρήση του SPSS 13.0 for Windows
Εισαγωγή στο SPSS Σχήμα 2.3 (α) Εδώ λοιπόν έχουμε τις εξής δυνατότητες: Να αλλάξουμε το όνομα της μεταβλητής γράφοντας ένα νέο όνομα στη θυρίδα Variable Name που βλέπουμε στο Σχήμα 2.3 (α) Να αλλάξουμε τον τύπο της μεταβλητής επιλέγοντας το Type και συμπληρώνοντας κατάλληλα το αντίστοιχο παράθυρο που βλέπουμε στο Σχήμα 2.3. (β) Να αλλάξουμε ή να ορίσουμε ετικέτες στη μεταβλητή συμπληρώνοντας το νέο όνομα στην θυρίδα Label Σχήμα 2.3 (α) και να αλλάξουμε ή να ορίσουμε ετικέτες τις τιμές της επιλέγοντας το Value Labels και συμπληρώνοντας κατάλληλα το παράθυρο του Σχήματος 2.3 (γ) Να ορίσουμε τις χαμένες τιμές της μεταβλητής επιλέγοντας το Missing Values και συμπληρώνοντας το παράθυρο του Σχήματος 2.3 (δ) Να αλλάξουμε τη μορφή της στήλης (πλάτος, στοίχιση) συμπληρώνοντας τις θυρίδες Columns, Aligh, Measure του παράθυρου του Σχήματος 2.3 (α) Μεθοδολογία Έρευνας και Στατιστική με τη χρήση του SPSS 13.0 for Windows - 13 -
Σωσσίδου, Ε.Ν. και Ψευτογιάννη, Δ.Κ. (β) (γ) (δ) - 14 - Μεθοδολογία Έρευνας και Στατιστική με τη χρήση του SPSS 13.0 for Windows
Εισαγωγή στο SPSS Αναζήτηση μεταβλητών, περιπτώσεων και συγκεκριμένων τιμών Αναζήτηση μεταβλητών. Αφού οι μεταβλητές δεν είναι πάντα ταξινομημένες κατά αλφαβητική σειρά, πολλές φορές είναι δύσκολη η ανεύρεση μίας συγκεκριμένης μεταβλητής και μάλιστα όταν το αρχείο δεδομένων περιέχει ένα μεγάλο αριθμό μεταβλητών. Την αναζήτηση μίας μεταβλητής μπορούμε να επιτύχουμε με τη χρήση του πλήκτρου Go To του παραθύρου διαλόγου Variables (Σχήμα 2.4.) το οποίο ανοίγει επιλέγοντας από το κυρίως menu Utilities Variables Σχήμα 2.4: Το παράθυρο Variables με πληροφορίες για τις μεταβλητές Αναζήτηση περιπτώσεων. Η αναζήτηση μίας συγκεκριμένης περίπτωσης μπορεί να γίνει αν από τα menus επιλέξουμε : Data Go to Case και ανοίξουμε το παράθυρο διαλόγου του Σχήματος 2.5. Μεθοδολογία Έρευνας και Στατιστική με τη χρήση του SPSS 13.0 for Windows - 15 -
Σωσσίδου, Ε.Ν. και Ψευτογιάννη, Δ.Κ. Σχήμα 2.5 : Αναζήτηση μίας περίπτωσης Στη θυρίδα διαλόγου Case Number εισάγουμε τον αριθμό της γραμμής που περιέχει την περίπτωση που αναζητούμε. Ο αριθμός αυτός αντιπροσωπεύει την επίκαιρη θέση της περίπτωσης μέσα στο αρχείο δεδομένων. Αναζήτηση συγκεκριμένων τιμών. Για μία μεταβλητή μπορούμε να αναζητήσουμε μία συγκεκριμένη τιμή της ή τις ετικέτες που περιγράφουν τις κατηγορίες τιμών της. Η αναζήτηση μίας τιμής σε μία μεταβλητή γίνεται όπως παρακάτω : Επιλέγουμε οποιαδήποτε κυψέλη της μεταβλητής Από τα menus επιλέγουμε : Edit Find.. με αποτέλεσμα την εμφάνιση του παραθύρου διαλόγου του Σχήματος 2.6., με τη βοήθεια του οποίου είναι δυνατή η αναζήτηση επάνω ή κάτω από την ενεργή κυψέλη. Σχήμα 2.6 : Αναζήτηση δεδομένων - 16 - Μεθοδολογία Έρευνας και Στατιστική με τη χρήση του SPSS 13.0 for Windows
Εισαγωγή στο SPSS 2.2. Προετοιμασία Στατιστικών Δεδομένων για Ανάλυση Προτού τα δεδομένα εισαχθούν σε ένα αρχείο, πρέπει να τα προετοιμάσουμε κατάλληλα, έτσι ώστε να αποδίδουν τη σωστή πληροφόρηση, με τη σωστή αντιστοίχησή τους στις μεταβλητές, και να είναι δυνατή η περαιτέρω αξιοποίησή τους με τη στατιστική ανάλυση. Η παράσταση των δεδομένων στον Η/Υ εξαρτάται φυσικά από το πακέτο που χρησιμοποιούμε. Η διαδικασία που θα περιγράψουμε παρακάτω αφορά στην εισαγωγή δεδομένων στο SPSS, αλλά μπορεί να θεωρήσει κανείς ότι αποτελεί διαδικασία τυποποιημένη και κοινή για όλα σχεδόν τα γνωστά στατιστικά πακέτα. Ας δούμε, για παράδειγμα, τα δεδομένα που περιέχει ο Πίνακας 2.1. Πίνακας 2.1. Τριτοβάθμια τεχνολογική εκπαίδευση: Σπουδαστές και μηχανογράφηση διοικητικών υπηρεσιών, κατά εκπαιδευτικό ίδρυμα:1987/88 Εκπαιδευτικό Ίδρυμα Σπουδαστές (Άρρενες) Σπουδάστριες (Θήλεα) Μηχανογράφηση διοικητικών υπηρεσιών ΤΕΙ Αθηνών 7.599 10.101 NAI ΤΕΙ Θεσσαλονίκης 4.414 5.300 NAI ΤΕΙ Σερρών 1.309 939 OXI Στον Πίνακα 2.1. κάθε γραμμή αποτελεί μία περίπτωση και για το SPSS θα αποτελεί ένα case, ή με άλλα λόγια τη βασική μονάδα ανάλυσης των τιμών (values) που έχουν συλλεχθεί για ένα σύνολο μεταβλητών. Έτσι, για το πρώτο case, το ΤΕΙ Αθηνών, η τιμή που έχουμε για τη μεταβλητή πτυχιούχοι άρρενες είναι 7.599 και η τιμή που έχουμε για τη μεταβλητή πτυχιούχοι θήλεα είναι 10.101. Για κάθε Εκπαιδευτικό Ίδρυμα έχουν καταγραφεί οι ίδιες μεταβλητές ( σπουδαστές, σπουδάστριες, ύπαρξη μηχανογράφησης στις διοικητικές υπηρεσίες ), ενώ αυτό που είναι διαφορετικό για κάθε case είναι οι τιμές που έχουν συλλεχθεί για τις μεταβλητές αυτές. Κάθε case έχει μία μόνο τιμή για κάθε μεταβλητή, ενώ είναι δυνατό να απουσιάζουν τιμές για μία ή περισσότερες μεταβλητές (missing values), που θα απαιτήσουν στη συνέχεια ιδιαίτερους χειρισμούς. Ένα case θα μπορούσε να είναι μία μεγαλύτερη μονάδα από αυτήν που χρησιμοποιήσαμε στο παραπάνω παράδειγμα, όπως είναι μία χώρα, ή μία χρονική περίοδος, ή ακόμη ένα γεγονός. Η ανάλυση των δεδομένων που έχουμε συλλέξει απαιτεί όλα τα cases να είναι ίδια, δηλαδή εάν η μονάδα ανάλυσης είναι η χώρα, όλα τα cases πρέπει να είναι χώρες και τα values για κάθε μεταβλητή θα είναι οι παρατηρήσεις που έχουμε συλλέξει για μία χώρα. Μεθοδολογία Έρευνας και Στατιστική με τη χρήση του SPSS 13.0 for Windows - 17 -
Σωσσίδου, Ε.Ν. και Ψευτογιάννη, Δ.Κ. Αφού προσδιορίσουμε τη μονάδα ανάλυσης και τις σημαντικές μεταβλητές στην έρευνά μας, δίνουμε συμβολικά ονόματα στις μεταβλητές. Στη συνέχεια, αποφασίζουμε για τον τρόπο καταγραφής της πληροφόρησης που έχουμε συλλέξει. Χρειαζόμαστε χωριστά τον αριθμό αρρένων από τον αριθμό θηλέων σπουδαστών, ή θα ήταν αρκετός ο συνολικός αριθμός σπουδαστών; Μία καλή συμβουλή στην απόφασή μας αυτή είναι να καταγράφουμε τα δεδομένα όσο το δυνατό πιο αναλυτικά. Εάν έχουμε καταγράψει χωριστά τον αριθμό των αρρένων από τον αριθμό των θηλέων σπουδαστών, μπορούμε να υπολογίσουμε εύκολα το συνολικό αριθμό τους, ενώ εάν έχουμε καταγράψει από την αρχή το συνολικό αριθμό δεν θα μπορέσουμε να διακρίνουμε στη συνέχεια τους σπουδαστές από τις σπουδάστριες, έστω και εάν η διάκριση αυτή είναι μεγάλης σπουδαιότητας για την έρευνα που επιχειρούμε για τα Τεχνολογικά Ιδρύματα της χώρας μας. Ένας τρόπος για να απλοποιήσουμε την είσοδο των δεδομένων είναι να αντιστοιχήσουμε σε αυτά αριθμούς ή σύμβολα (ένα αριθμό ή σύμβολο για κάθε δυνατή τιμή), με άλλα λόγια να κωδικοποιήσουμε τα δεδομένα μας. Αντί να πληκτρολογήσουμε ΤΕΙ Αθηνών ή ΤΕΙ Θεσσαλονίκης, μπορούμε να πληκτρολογήσουμε αντίστοιχα τους κωδικούς 1 και 2 ή τους κωδικούς Α και Θ, ή ακόμη Ε1 και Ε2. Ως κωδικούς χρησιμοποιούμε αριθμούς numeric coding scheme) ή αλφαριθμητικούς χαρακτήρες (alphanumeric or string coding scheme). Συνιστούμε εδώ τη χρήση αριθμητικών κωδικών, αφού η εισαγωγή τους είναι η πλέον σύντομη και περιέχει τον λιγότερο κίνδυνο λαθών. Εάν επιθυμούμε στα αποτελέσματα των στατιστικών αναλύσεων εμφάνιση μίας ετικέτας (label) δίπλα σε κάθε κωδικό, το SPSS διαθέτει έναν απλό τρόπο για να μας διευκολύνει. Είναι πολύ χρήσιμο να έχουμε μία μεταβλητή που να δίνει την ταυτότητα της κάθε case, όπως στο παράδειγμά μας είναι η ονομασία του Εκπαιδευτικού Ιδρύματος. Συχνά επίσης χρησιμοποιούμε για τον ίδιο λόγο ένα αύξοντα αριθμό (ID), με τον οποίο είναι εύκολη η εντόπιση συγκεκριμένης γραμμής με ασυνήθιστες ή χαμένες τιμές. Ένα πιθανό μοντέλο κωδικοποίησης για τα δεδομένα του Πίνακα 2.1. παρουσιάζουμε στον Πίνακα 2.2. - 18 - Μεθοδολογία Έρευνας και Στατιστική με τη χρήση του SPSS 13.0 for Windows