1. Να χρησιμοποιηθεί το gssnet.sav για να υπολογιστούν τα περιγραφικά μέτρα για τον αριθμό αδελφών (sibs), έτη εκπαίδευσης (educ), και ώρες εργασίας την τελευταία εβδομάδα(hrs1). Να δημιουργηθούν επίσης ιστογράμματα. Για κάθε μεταβλητή να συγκριθούν τα διάφορα μέτρα κεντρικής θέσης. Να υποδείξετε γιατί και πότε θα προτιμήσετε το ένα μέτρο από το άλλο. Σχετικά με τον αριθμό αδελφών καταλληλότερο μέτρο είναι η διάμεσος και η επικρατέστερη τιμή γιατί η κατανομή παρουσιάζει μεγαλύτερη θετική ασυμμετρία, η διαφορά δε μέσης τιμής και διαμέσου είναι πολύ μεγάλη με την τάξη μεγέθους (διαφορά 0.85 αναφορικά με την τιμή της διαμέσου 3). Στις υπόλοιπες 2 περιπτώσεις θα μπορούσε να χρησιμοποιηθεί τόσο η μέση τιμή όσο και η διάμεσος επειδή οι αντίστοιχες κατανομές είναι περίπου συμμετρικές (η διαφορά δε μέσης τιμής και διαμέσου είναι μικρή σε σχέση με την τάξη μεγέθους της διαμέσου). Statistics sibs NUMBER OF BROTHERS AND SISTERS educ Highest year of school completed hrs1 Number of hours worked last week N Valid 1414 1415 909 Missing 5 4 510 Mean 3,85 13,23 42,51 Median 3,00 13,00 40,00 Mode 2 12 40
2. Να χρησιμοποιηθεί το αρχείο electric.sav. Να εξετασθούν οι διαφορές σε διαστολική πίεση, χοληστερόλη και έτη εκπαίδευσης (dbp59, chol58, eduyr) για εκείνους που είναι ζωντανοί 10 χρόνια με την έναρξη της μελέτης και για εκείνους που δεν είναι (vita10) με τη δημιουργία κατάλληλων γραφημάτων. Γράψτε μια περίληψη των αποτελεσμάτων σας. Αναφορικά με τη διαστολική πίεση παρατηρούμε τα εξής: Στους αποβιώσαντες, η αρχική μέση τιμή και διάμεσος είναι μεγαλύτερη από την αρχική μέση τιμή και διάμεσο των ζωντανών. Αναφορικά με τη χοληστερόλη παρατηρούμε τα εξής: Στους αποβιώσαντες, η αρχική μέση τιμή της χοληστερόλης είναι μικρότερη από την αρχική μέση τιμή των ζωντανών. Αντίθετα, η σύγκριση των διαμέσων οδηγεί στο αντίθετο συμπέρασμα. Αναφορικά με τα έτη εκπαίδευσης παρατηρούμε τα εξής: Στους αποβιώσαντες, η αρχικές μέσες τιμές και διάμεσος είναι μικρότερες από τις αντίστοιχες τιμές των εν ζωή. Report dbp58 Average chol58 Serum Diast Blood Cholesterol 58 -- eduyr Years of vital10 Status at Ten Years Pressure 58 Mg per DL Education Alive Mean 87,56 264,87 11,79 N 178 179 164 Std. Deviation 11,446 52,981 2,740 Median 87,00 260,00 12,00 Dead Mean 92,38 261,80 11,23 N 61 61 48 Std. Deviation 16,477 51,807 2,875 Median 89,00 264,00 11,00 Total Mean 88,79 264,09 11,66 N 239 240 212 Std. Deviation 13,050 52,594 2,774 Median 87,00 261,00 12,00
3. Να χρησιμοποιηθεί το αρχείο salary.sav για να απαντηθούν οι παρακάτω ερωτήσεις a. Να χρησιμοποιηθεί η κατανομή των υπαλλήλων σε κάθε κατηγορία επαγγέλματος (μεταβλητή jobcat) i. Να περιγραφεί η κατανομή των ανθρώπων σε κάθε κατηγορία επαγγέλματος (μεταβλητή jobcat) Η απάντηση δίνεται από την κατασκευή του παρακάτω πίνακα των συχνοτήτων. jobcat EMPLOYMENT CATEGORY Frequency Percent Valid Percent Cumulative Percent Valid CLERICAL 227 47,9 47,9 47,9 OFFICE TRAINEE 136 28,7 28,7 76,6 SECURITY OFFICER 27 5,7 5,7 82,3 COLLEGE TRAINEE 41 8,6 8,6 90,9 EXEMPT EMPLOYEE 32 6,8 6,8 97,7 MBA TRAINEE 5 1,1 1,1 98,7 TECHNICAL 6 1,3 1,3 100,0 Total 474 100,0 100,0 ii. Να γίνει κυκλικό διάγραμμα που εκφράζει το ποσοστό των υπαλλήλων σε κάθε κατηγορία επαγγέλματος
iii. Να γίνει ραβδόγραμμα που παρουσιάζει την κατανομή υπαλλήλων σε κάθε κατηγορία επαγγέλματος. Οι ράβδοι να αντιπροσωπεύουν το ποσοστό των υπαλλήλων σε κάθε κατηγορία.
b. Να μελετηθεί η μεταβλητή εργασιακή εμπειρία (work) i. Να κατασκευαστεί ένα ραβδόγραμμα και ένα ιστόγραμμα. Ποιο είναι καλύτερο στο να συνοψίσει τα δεδομένα και γιατί; Το ραβδόγραμμα δεν απεικονίζει σωστά την πυκνότητα των τιμών, επειδή ίσα μήκη πάνω στον άξονα χ του ραβδογράμματος δεν αντιστοιχούν σε ίδιο εύρος τιμών της κλίμακας της μεταβλητής. Το ιστόγραμμα είναι κατάλληλο, επειδή, είναι απαλλαγμένο από το προηγούμενο πρόβλημα που αναφέρθηκε στο ραβδόγραμμα, και άρα η πυκνότητα σε κάθε διάστημα τιμών απεικονίζεται με ακρίβεια.
ii. Ποια είναι η διάμεσος των ετών εργασιακής εμπειρίας για το δείγμα; Ποια τα τεταρτημόρια; Statistics work WORK EXPERIENCE N Valid 474 Missing 0 Median 4,5800 Percentiles 25 1,5800 50 4,5800 75 11,6650 Η διάμεσος και τα τεταρτημόρια φαίνονται στον παραπάνω πίνακα: 1 ο τεταρτημόριο = 1.58, 2 ο τεταρτημόριο (διάμεσος) = 4.58, και 3 ο τεταρτημόριο = 11.665.. iii. Τι ποσοστό του δείγματος δεν έχει προηγούμενη εργασιακή εμπειρία; Από εκείνους που έχουν προηγούμενη εργασιακή εμπειρία ποια είναι η διάμεσος των ετών εργασιακής εμπειρίας; Ανατρέχοντας στον πίνακα της κατανομής των συχνοτήτων (παρατίθεται μέρος του πίνακα) για τη συγκεκριμένη μεταβλητή, βρίσκουμε το ποσοστό των ατόμων (5,1%) με τιμή εργασιακής εμπειρίας = 0. work WORK EXPERIENCE Frequency Percent Valid Percent Cumulative Percent Valid,00 24 5,1 5,1 5,1,17 4,8,8 5,9,25 5 1,1 1,1 7,0,33 4,8,8 7,8,42 12 2,5 2,5 10,3,50 7 1,5 1,5 11,8 Total 474 100,0 100,0
Από την εντολή Data -> Select Cases επιλέγονται τα άτομα με work > 0. Μετά την εφαρμογή του φίλτρου, επιλέγουμε την εντολή Analyze ->, Descriptive Statistics -> Explore και παίρνουμε ως αποτέλεσμα τον πίνακα των περιγραφικών μέτρων της μεταβλητής. Μεταξύ των στατιστικών μέτρων βρίσκεται η διάμεσος η τιμή της οποίας είναι 4.92. Descriptives Statistic Std. Error work WORK EXPERIENCE Mean 8,4147,41211 95% Confidence Interval for Mean Lower Bound 7,6048 Upper Bound 9,2246 5% Trimmed Mean 7,4931 Median 4,9200 Variance 76,425 Std. Deviation 8,74216 Minimum,17 Maximum 39,67 Range 39,50 Interquartile Range 10,11 Skewness 1,471,115 Kurtosis 1,548,230