ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΣΧΟΛΗ ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΜΑΘΗΜΑΤΙΚΩΝ ΤΟΜΕΑΣ ΣΤΑΤΙΣΤΙΚΗΣ ΚΑΙ ΕΠΙΧΕΙΡΗΣΙΑΚΗΣ ΕΡΕΥΝΑΣ ΕΡΓΑΣΤΗΡΙΟ ΣΤΑΤΙΣΤΙΚΗΣ Εισαγωγή στο P.A.S.W. Υποχρεωτικό μάθημα 4 ου εξαμήνου
ΒΙΒΛΙΟΓΡΑΦΙΑ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ ΜΕ ΤΟ P.A.S.W. 17.0 του Χ. Γναρδέλλη (υπάρχει και προηγούμενη έκδοση 14.0) ΚΟΙΝΩΝΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΜΕ ΤΟ S.P.S.S. του Β. Δαφέρμου S.P.S.S. 16.0 GUIDE TO DATA ANALYSIS της Marija J. Norusis ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ ΜΕ ΤΗ ΒΟΗΘΕΙΑ ΣΤΑΤΙΣΤΙΚΩΝ ΠΑΚΕΤΩΝ των Ν. Τσάντα, Χρ. Μωυσιάδη, Ντ. Μπαγιάτη και Θ. Χατζηπαντελή ΟΔΗΓΟΣ ΑΝΑΛΥΣΗΣ ΔΕΔΟΜΕΝΩΝ ΜΕ ΤΟ S.P.S.S. 12.0 της M. J. Norusis DISCOVERING STATISTICS USING S.P.S.S. του A.Field (3 rd edition)
Γενικές πληροφορίες Πρώτο μάθημα: 12/03, 14/03, 15/03 & 16/03/2012 Δεύτερο μάθημα: 19/03, 21/03, 22/03 & 23/03/2012 Τρίτο μάθημα: 26/03, 28/03, 29/03 & 30/03/2012 Ιστοσελίδα μαθήματος: http://www.math.auth.gr/el/studies/undergraduate/allcourses ΕΠΙΚΟΙΝΩΝΙΑ ΜΕ ΤΟΥΣ ΔΙΔΑΣΚΟΝΤΕΣ ΤΩΝ ΤΜΗΜΑΤΩΝ ΣΑΣ cstavros@math.auth.gr cbratsas@math.auth.gr chkeramy@auth.gr xr.natnis@hotmail.com
ΠΟΡΕΙΑ ΣΤΑΤΙΣΤΙΚΗΣ ΑΝΑΛΥΣΗΣ ΔΙΑΜΟΡΦΩΣΗ ΕΡΩΤΗΣΕΩΝ ΕΡΩΤΗΜΑΤΟΛΟΓΙΟ ΔΕΙΓΜΑΤΟΛΗΨΙΑ ΠΡΟΣΧΕΔΙΟ ΣΤΑΤΙΣΤΙΚΗΣ ΑΝΑΛΥΣΗΣ ΟΡΙΣΜΟΣ ΜΕΤΑΒΛΗΤΩΝ ΚΩΔΙΚΟΠΟΙΗΣΗ ΕΙΣΑΓΩΓΗ ΔΕΔΟΜΕΝΩΝ ΣΤΟ PASW
ΠΡΟΣΔΙΟΡΙ- ΣΜΟΣ ΜΕΘΟΔΩΝ ΕΠΕΞΕΡΓΑΣΙΑΣ- ΕΦΑΡΜΟΓΗ ΑΠΟΤΕΛΕΣΜΑΤΑ (ΔΙΑΓΡΑΜΜΑΤΑ - ΠΙΝΑΚΕΣ) ΣΥΜΠΕΡΑΣΜΑΤΟΛΟΓΙΑ Στο εργαστήριο θα ασχοληθούμε κυρίως με την επεξεργασία δεδομένων και τη διαδικασία εξαγωγής συμπερασμάτων με τη βοήθεια του στατιστικού λογισμικού P.A.S.W. ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΣΤΑΤΙΣΤΙΚΗΣ Πληθυσμός: Σύνολο ατόμων ή αντικειμένων για τα οποία ενδιαφερόμαστε να εξάγουμε συμπεράσματα σε σχέση με κάποιες ιδιότητες που αφορούν τα στοιχεία του. Ο πληθυσμός πρέπει να είναι καλώς ορισμένος, να περιγραφεί δηλαδή με κάποιες ιδιότητες των στοιχείων που τον αποτελούν, σε τρόπο ώστε να μπορεί οποιοσδήποτε να αποφανθεί μονοσήμαντα αν κάποιο στοιχείο είναι μέλος του. Τα στοιχεία του πληθυσμού είναι τα υποκείμενα. Καθορίζεται πάντα στην αρχή της έρευνας. Δείγμα: το κομμάτι του πληθυσμού που είναι αντιπροσωπευτικό, τυχαίο και μπορεί να μελετηθεί ΑΝΑΛΥΤΙΚΑ.
ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΣΤΑΤΙΣΤΙΚΗΣ Σκοπός μιας επιστημονικής έρευνας είναι η εξαγωγή συμπερασμάτων για τη ευρύτερη ομάδα ατόμων της έρευνας μας (πληθυσμός), την οποία δε μπορούμε να ελέγξουμε, μελετώντας και ελέγχοντας τη στενότερη ομάδα των ατόμων που ενδιαφέρει την έρευνά μας (δείγμα). Δηλαδή, όλα όσα θα παρατηρήσουμε, θα καταγράψουμε και θα μετρήσουμε στο δείγμα, θα θέλαμε να αποδοθούν ως χαρακτηριστικά και ιδιότητες του υπό-μελέτη πληθυσμού. Το δείγμα θα πρέπει να είναι τυχαίο, που σημαίνει ότι κάθε υποκείμενο του πληθυσμού θα έχει την ίδια πιθανότητα να συμπεριληφθεί στο δείγμα. Η επιλογή ενός στοιχείου του πληθυσμού είναι ανεξάρτητη από την επιλογή ενός άλλου στοιχείου. Το δείγμα θα πρέπει να είναι αντιπροσωπευτικό, που σημαίνει ότι το δείγμα θα πρέπει να έχει τα χαρακτηριστικά και τις ιδιότητες του πληθυσμού από τον οποίο προέρχεται. (δειγματοληψία)
Τα υποκείμενα ενός πληθυσμού έχουν διάφορα χαρακτηριστικά, κάποια από τα οποία ενδιαφερόμαστε να μελετήσουμε. Τα χαρακτηριστικά αυτά μεταβάλλονται από υποκείμενο σε υποκείμενο (ή και στο ίδιο υποκείμενο αν μετρηθεί πολλές φορές) είναι οι μεταβλητές. Οι διακρίσεις που μπορούμε να κάνουμε μεταξύ της ίδιας πληροφορίας που παίρνουμε για δύο ή περισσότερα υποκείμενα (ή στο ίδιο υποκείμενο δύο ή περισσότερες φορές) με τη διαδικασία της μέτρησης, μπορεί να αφορούν ποιότητα ή ποσότητα. ΔΙΑΚΡΙΣΗ ΜΕΤΑΒΛΗΤΩΝ ΠΟΙΟΤΙΚΕΣ ΠΟΣΟΤΙΚΕΣ ΚΑΤΗΓΟΡΙΑΣ ΔΙΑΤΑΞΗΣ ΔΙΑΣΤΗΜΑΤΟΣ ΑΝΑΛΟΓΙΑΣ ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΣΤΑΤΙΣΤΙΚΗΣ
ΚΑΤΗΓΟΡΙΑΣ Είναι οι μεταβλητές των οποίων το σύνολο τιμών δεν έχει καμία ιδιότητα (χρώμα ματιών, τόπος γέννησης). Ωστόσο αν μία μεταβλητή έχει δύο μόνο κατηγορίες πχ (φύλο με 1 η : ΑΝΔΡΑΣ και 2 η : ΓΥΝΑΙΚΑ) τότε αυτές είναι αμοιβαία αποκλειόμενες και η μεταβλητή ονομάζεται διχοτομική. ΔΙΑΤΑΞΗΣ Είναι οι μεταβλητές που για το σύνολο τιμών μπορούμε να ορίσουμε μια σχέση διάταξης, δηλαδή οι κατηγορίες είναι σαφείς, ισοδύναμες και διατεταγμένες (σειρά κατάταξης σε ένα αγώνα-1 ος,2 ος, 3 ος,, 1 ο κόμμα, 2 ο κόμμα, ανάλογα με τη δύναμη των εδρών στη Βουλή.) Οι πράξεις ανάμεσα στις βαθμίδες της κλίμακας δεν έχουν νόημα. Αν όμως 1: καθόλου, 2: Λίγο, 3: Αρκετά, 4: Πολύ και 5: Πάρα πολύ, τότε ένας μέσος όρος πχ. 3.9 είναι ερμηνεύσιμος. Σε αυτές τις κατηγορίες ανήκουν και οι μεταβλητές κλίμακας Likert, των οποίων οι απαντήσεις διαβαθμίζονται από το απόλυτο αρνητικό στο απόλυτο θετικό, δηλαδή 1: διαφωνώ απόλυτα, 2: διαφωνώ, 3: αβέβαιος, 4: συμφωνώ και 5: συμφωνώ απόλυτα. 8
ΔΙΑΣΤΗΜΑΤΟΣ Ανήκουν οι μεταβλητές στις οποίες τα υποκείμενα εντάσσονται σε σαφώς καθορισμένες, αμοιβαία αποκλειόμενες, διατεταγμένες κατηγορίες και οι οποίες χρησιμοποιούν σταθερή μονάδα μέτρησης (χρόνος, απόσταση, ηλικία, θερμοκρασία σε ºC). Δηλαδή, εάν έχουμε 0ºC, σε καμία περίπτωση αυτό το μηδέν δε σημαίνει την απουσία του μετρούμενου χαρακτηριστικού. Η απόσταση μεταξύ δύο οποιονδήποτε διαδοχικών τιμών μιας διαστημικής κλίμακας είναι ίση με την απόσταση μεταξύ δύο άλλων τυχαίων διαδοχικών τιμών (πχ η διαφορά των τιμών 1 και 2 είναι ίση με αυτή των 3 και 4,, 5 και 6, ).Για τις τιμές των μεταβλητών αυτών δεν έχει νόημα ο υπολογισμός αναλογιών (δε γίνεται λόγος για διπλάσιο, τριπλάσιο, ) ΑΝΑΛΟΓΙΑΣ Είναι οι μεταβλητές που διατηρούν όλα τα χαρακτηριστικά των διαστημικών μεταβλητών και επιπλέον διαθέτουν πραγματικό σημείο αναφοράς το οποίο αντιστοιχεί στο απόλυτο μηδέν. Σε αυτήν την περίπτωση το 0 δηλώνει την απουσία κάποιου χαρακτηριστικού(ταχύτητα, επιτάχυνση, ημερήσιος τζίρος ενός καταστήματος). Εδώ όχι μόνο η διαφορά μεταξύ 2 και 5 είναι ίση με αυτή των 14 και 17, αλλά επίσης το 14 είναι 7 φορές μεγαλύτερο του 2. 9
P.A.S.W. S.P.S.S. (Statistical Package in Social Sciences) P.A.S.W. (Predictive Analysis SoftWare) Το P.AS.W. (Πλατφόρμα Λογισμικού Προβλεπτικής Ανάλυσης) είναι η νέα έκδοση του S.P.S.S., ένα λογισμικό που παρέχει στους χρήστες του ένα αναβαθμισμένο γραφικό περιβάλλον και φυσικά νέες δυνατότητες που αφορούν διάφορες λειτουργίες του αλλά και σε θέματα στατιστικής. Το παραθυρικό περιβάλλον του είναι όμοιο με αυτό των προηγούμενων εκδόσεων του στατιστικού λογισμικού. Έχει και menu SYNTAX στο οποίο γράφονται προτάσεις της γλώσσας εντολών που έχει το PASW-SPSS. Η γλώσσα εντολών του PASW είναι μια ισχυρή γλώσσα δομημένου προγραμματισμού όπου παράγονται νέες δομές δεδομένων, συντάσσονται νέες στατιστικές διαδικασίες κ.α. Επιπλέον, παρέχεται η δυνατότητα συνεργασίας της PASW με τη γλώσσα R κυρίως για τη δημιουργία νέων στατιστικών διαδικασιών. Στο εργαστήριο θα ασχοληθούμε με την έκδοση 17.0. Κυκλοφορεί και η έκδοση 18.0.
.sav πλαίσιο δεδομένων πλαίσιο μεταβλητών
ΑΠΟΤΕΛΕΣΜΑΤΑ ΕΠΕΞΕΡΓΑΣΙΑΣ (OUTPUT) ΣΕ ΞΕΧΩΡΙΣΤΟ ΑΡΧΕΙΟ Outline pane: σύνοψη των αποτελεσμάτων στο παράθυρο του Viewer εισαγωγή σχολίων Αποτελέσματα των στατιστικών διαδικασιών Εξαγωγή του output αρχείο word, pdf, excel, powerpoint..spv Από την έκδοση του SPSS 16.0 και μετά τα αρχεία αποτελεσμάτων αποθηκεύονται με την κατάληξη.spv. Δυστυχώς τα αρχεία παλαιότερων εκδόσεων με κατάληξη.spo δεν ανοίγουν. Για να τα δείτε, εφόσον έχετε εγκατεστημένη νέα έκδοση, χρησιμοποιείτε το SPSS-Smart Viewer και τα βλέπετε.
ΕΙΣΑΓΩΓΗ ΔΕΔΟΜΕΝΩΝ ΣΤΟ P.A.S.W. ΣΤΗΛΗ ΜΕΤΑΒΛΗΤΗ - ΕΡΩΤΗΣΕΙΣ ΠΟΥ ΑΠΑΝΤΩΝΤΑΙ ΓΡΑΜΜΗ ΥΠΟΚΕΙΜΕΝΑ - ΤΑ ΑΤΟΜΑ ΠΟΥ ΕΡΩΤΩΝΤΑΙ
ΕΙΣΑΓΩΓΗ ΔΕΔΟΜΕΝΩΝ ΣΤΟ P.A.S.W. Όνομα μεταβλητής χωρίς κενά, σύμβολα, τελείες. Μπορείτε _. Ελληνικά ή λατινικά Ετικέτα μεταβλητής : μας θυμίζει το περιεχόμενο της μεταβλητής. Ελλην. ή λατινικά
P.A.S.W. : Η διαδικασία C O M P U T E salary.sav ο νέος μισθός θα δίνεται από τη σχέση : salbeg +12.15* 2010
P.A.S.W. : Η διαδικασία R E C O D E Μας ενδιαφέρει η ηλικιακή ομάδα του ερωτώμενου και όχι ακριβώς ποια είναι η ηλικία του.
P.A.S.W. : Η διαδικασία D A T A - S E L E C T C A S E S Θέλουμε η στατιστική ανάλυση να συνεχιστεί μόνο για τους άνδρες του δείγματος. Η επιλογή περιπτώσεων διατηρείται μέχρι εμείς πάλι να την απομακρύνουμε με τον ίδιο τρόπο, μόνο που τώρα επιλέγουμε All cases.
Δοκιμάστε τώρα μόνοι σας : ΕΦΑΡΜΟΓΉ : insert data _ example ΑΣΚΗΣΗ 1