ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΣΧΟΛΗ ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΜΑΘΗΜΑΤΙΚΩΝ ΤΟΜΕΑΣ ΣΤΑΤΙΣΤΙΚΗΣ ΚΑΙ ΕΠΙΧΕΙΡΗΣΙΑΚΗΣ ΕΡΕΥΝΑΣ ΕΡΓΑΣΤΗΡΙΟ ΣΤΑΤΙΣΤΙΚΗΣ Περιγραφική στατιστική δύο μεταβλητών Εισαγωγή στη θεωρία ελέγχων υποθέσεων Επιμέλεια : Ελευθερίου Μ. & Σκουρκέας Αν. Υποχρεωτικό μάθημα 4 ου εξαμήνου 1 Περιγραφική Στατιστική ύο Μεταβλητών Η ύπαρξη δύο ή περισσοτέρων μεταβλητών σε μια έρευνα, οδηγεί εύλογα στην αναζήτηση της (πιθανής) μεταξύ τους σχέσης. Εξετάζεται η συμπεριφορά των τιμών μιας μεταβλητής σε σχέση με τις τιμές κάποιας άλλης. Η επιλογή της στατιστικής τεχνικής εξαρτάται αποκλειστικά από τη διάκριση των μεταβλητών σε ποσοτικές ή ποιοτικές. Θα ασχοληθούμε με την: περιγραφική στατιστική δύο ποιοτικών μεταβλητών περιγραφική στατιστική μιας ποσοτικής μεταβλητής μέσα στις κατηγορίες μιας ποιοτικής-ών. 2 1
Περιγραφική στατιστική δύο ποιοτικών μεταβλητών FILE OPEN DATA salary.sav (δεδομένα για 474 υπαλλήλους που απολύθηκαν από μια τράπεζα μεταξύ του 1969 και του 1971) ιαδικασία Crosstabs Analyze Descriptive Statistics Crosstabs ημιουργεί Ραβδογράμματα 3 Counts : Παρατηρούμενες συχνότητες (observed) είναι οι μετρήσεις σε κάθε κελί, ενώ αναμενόμενες (expected) είναι ο αριθμός των περιπτώσεων που θα ήταν σε κάθε κελί αν οι μεταβλητές που ορίζουν τις γραμμές και τις στήλες του πίνακα συνάφειας είναι στατιστικά ανεξάρτητες. Percentages: Τα ποσοστά των γραμμών/στηλών αθροίζουν στο 100% κατά μήκος της κάθε γραμμής/στήλης του πίνακα συνάφειας, ενώ τα συνολικά ποσοστά αθροίζουν στο 100% μέσα σε όλα τα κελιά του πίνακα. Residuals: Τα υπόλοιπα είναι οι διαφορές μεταξύ παρατηρούμενων και αναμενόμενων τιμών του κάθε κελιού. 4 2
5 Ο πίνακας διαβάζεται ως εξής : Τα μπλε χρωματισμένα ποσοστά διαβάζονται (αθροίζονται) οριζόντια. Τα κόκκινα και γαλάζια χρωματισμένα ποσοστά διαβάζονται (αθροίζονται) κάθετα. Τα υπογραμμισμένα και πλάγια ποσοστά διαβάζονται (αθροίζονται) κάθετα και οριζόντια. Το 48,5% των ταμιών είναι άνδρες και το 51,5% γυναίκες. (άθροισμα 100%). Από τους άνδρες που απολύθηκαν, έχουμε: 42.6% ταμίες, 18.2% office-trainee,10.5% security-officer, 13.2% college trainee, 11.6% exempt employee, 1.6% MBA-trainee και 2.3 % τεχνικοί. (άθροισμα :100%). Από το σύνολο αυτών που απολύθηκαν, για τους άνδρες έχουμε: 23.2% ταμίες, 9.9% office-trainee, 5.7% security-officer, 7.2% college trainee, 6.3% exempt employee, 0.8% MBA-trainee και 1.3 % τεχνικοί. (άθροισμα :54,4%, που είναι και το ποσοστό των ανδρών). 6 3
Ομαδοποιημένο Ραβδόγραμμα (Clustered bar chart) Γραφική αναπαράσταση των αποτελεσμάτων του προηγούμενου πίνακα 7 Ελέγχοντας τα χαρακτηριστικά του γραφήματος Αναγραφή του πλήθους των υποκειμένων που αναπαριστά κάθε ράβδος Chart editor Show Data Labels Data Value Labels, Displayed: Count 8 4
Αν θέλουμε το ποσοστό που αντιστοιχεί σε κάθε ράβδο, παράγουμε καινούριο ραβδόγραμμα. Graphs Bar Clustered, Summaries for group of cases επιλέγουμε επιλέγουμε 9 Αφού ανοίξουμε τον chart editor επιλέγουμε ως label: Percent Chart editor Show Data Labels Data Value Labels, Displayed: Percent 5
Συσσωρευμένο Ραβδόγραμμα (Stacked bar chart) 100,0% 80,0% 24,68% 18,78% 1,48% 0,42% 0,21% SEX OF EMPLOYEE MALES FEMALES Πώς παράγουμε ένα τέτοιο γράφημα? Για κάθε μία από τις κατηγορίες του επαγγέλματος δημιουργείται μία ράβδος με μήκος το 100% ποσοστό. Percent 60,0% 40,0% 5,7% 7,17% 6,33% 0,84% 1,27% Οι διάφορες στοίβες μέσα στην κάθε ράβδο αντιστοιχούν στο ποσοστό που έχουν στη συγκεκριμένη κατηγορία του επαγγέλματος οι κατηγορίες του φύλου. 20,0% 0,0% 23,21% 9,92% CLERICAL OFFICE SECURITY COLLEGE EXEMPT MBA TECHNICA TRAINEE OFFICER TRAINEEEMPLOYEETRAINEE L EMPLOYMENT CATEGORY Τα συμπεράσματα που μπορούμε να βγάλουμε, αφορούν την αναζήτηση του ίδιου προφίλ μέσα στις 7 ράβδους (που θα σήμαινε ανεξαρτησία) που εδώ δε φαίνεται να υπάρχει. 11 6
ύο ποιοτικές στις τάξεις μιας 3 ης ποιοτικής μεταβλητής Η διαδικασία Crosstabs μπορεί να χρησιμοποιηθεί και για ποσοτικές μεταβλητές, αρκεί οι τιμές αυτών να έχουν κωδικοποιηθεί σε διαστήματα τιμών (Transform Recode.). To SPSS παρέχει με τη βοήθεια της επιλογής Layers, τη δυνατότητα να ορίσουμε μία ή περισσότερες ποιοτικές μεταβλητές σαν μεταβλητές ελέγχου των ζητούμενων πινάκων συνάφειας : αρκεί να τη μετακινήσουμε στον κατάλογο Layers. 1 η ποιοτική μεταβλητή 2 η ποιοτική μεταβλητή FILE OPEN DATA cats.sav 3 η ποιοτική μεταβλητή (layer) Πίνακας συνάφειας με layer Layer Οι 2 ποιοτικές μεταβλητές Η στατιστική ανάλυση των δύο μεταβλητών γίνεται για κάθε στρώμα (κατηγορία) της μεταβλητής ελέγχου (Layer). 7
Ραβδογράμματα της Crosstabs με layers Για κάθε κατηγορία της layer ποιοτικής μεταβλητής σχηματίζεται ένα clustered γράφημα Το μόνο συμπέρασμα αφορά τη σύγκριση του μήκους των ράβδων μέσα στην κάθε ομάδα. Πώς τα παράγουμε 16 8
ιπλό αριστερό κλίκ στο γράφημα για να ανοίξει ο chart editor. Edit Properties Variables Στην καρτέλα Variables: Αλλάζω τα χαρακτηριστικά x-axis και x-cluster στις δύο μεταβλητές. 18 9
ιαδικασία Means (ανάλυση μέσων τιμών) Ανοίγουμε πάλι το salary.sav Analyze Compare Means Means Μέσες τιμές της ποσοτικής salbeg στις κατηγορίες της ποιοτικής sex αλλά & jobcat Επιπλέον στατιστικά 19 Αποτελέσματα της διαδικασίας Means Μοναδικό layer : employment category ύο layers: employment category & sex 20 10
Τρόποι γραφικής αναπαράστασης των αποτελεσμάτων της διαδικασίας MEANS (ένα Layer) Graphs Bar Charts Simple 21 Τρόποι γραφικής αναπαράστασης των αποτελεσμάτων της διαδικασίας MEANS (δύο Layers) Graphs Bar Charts Clustered 22 11