ΕΝ ΕΙΚΤΙΚΕΣ ΑΠΑΝΤΗΣΕΙΣ ΑΣΚΗΣΗΣ (Εργαστήρια µαθήµατος «Στατιστικά Προγράµµατα», τµ. Στατ. & Ασφ. Επιστ., -) (Επιµέλεια: Ελευθεράκη Αναστασία) Άσκηση (Εργαστήριο #) Στις εξετάσεις Φεβρουαρίου του µαθήµατος της Στατιστικής του τµ. Οικονοµικής Επιστήµης προσήλθαν 1 φοιτητές και φοιτήτριες. Ο εξεταστής βαθµολόγησε τα 1 γραπτά χρησιµοποιώντας την κλίµακα -3 (:λευκό γραπτό, 3:άριστα) όπως φαίνεται στους παρακάτω πίνακες στους οποίους φαίνεται επίσης το έτος φοίτησης και το φύλο: (πρόκειται για πραγµατικά δεδοµένα δύο εκ των δέκα αιθουσών που συνολικά χρησι- µοποιήθηκαν για τις εξετάσεις) Φοιτήτριες ο έτος: 1, 1,,,,,, 1, 1, 3, 1, 1, 1, 11,, 9,, 1,, 9, 1 3 ο έτος: 13, 19,,,, 1, 17,, 1,,, 13 ο έτος:,, 1, 13, 13, 13, 3 ο έτος: 1, 11, 1,, 11, ο έτος: 1, 1, 1,, 1 7 ο έτος: 1 9 ο έτος: Φοιτητές ο έτος: 11, 1,, 3,,,,,, 11,, 3 ο έτος: 1, 9,,, 1, 3, 11,,,,, ο έτος: 13, 1, 1,, 1, 1, 9,, 1, 13,, 1, 13 ο έτος: 3, 1,, 3, 1, 1, 1 ο έτος: 9 ο έτος: 13 1 ο έτος: 1) Να εισάγετε µε κατάλληλο τρόπο τα παραπάνω δεδοµένα στο SPSS (κατασκευάζοντας όσες µεταβλητές χρειάζονται). Θα πρέπει να κατασκευάσουµε τρεις στήλες. Η πρώτη θα περιέχει τους βαθµούς των φοιτητών-τριών, η δεύτερη θα δηλώνει το φύλο ( = φοιτητής, 1 = φοιτήτρια) και η τρίτη στήλη θα περιέχει το έτος φοίτησης. Τις στήλες θα τις ονοµάσουµε αντίστοιχα grade, sex και year. Από την καρτέλα variable view θα πρέπει να κάνουµε και τις κατάλληλες ρυθµίσεις (grade=scale, sex=nominal και year=ordinal). ) Να δοθούν: η µέση τιµή, η διασπορά, η τυπική απόκλιση, η µεγαλύτερη και η µικρότερη τιµή των παραπάνω βαθµών. Επιλέγουµε: Analyze Descriptive Statistics Descriptives grade Options Continue OK 1
Descriptive Statistics grade Valid N (listwise) N Minimum Maximum Mean Std. Deviation Variance 1 9 1,7 7,77,9 1 3) Να δοθούν: ο πίνακας συχνοτήτων και το αντίστοιχο ραβδόγραµµα (Barchart) συχνοτήτων, η διάµεσος, τα τεταρτηµόρια, το 3%-ποσοστηµόριο και η κορυφή των βαθµών. Από τον πίνακα συχνοτήτων, τι ποσοστό των φοιτητώντριών φαίνεται να έχει βαθµολογηθεί πάνω από τη βάση; (>13). Επιλέγουµε: Analyze Descriptive Statistics Frequencies grade Statistics. Continue Charts Bar charts Continue OK Statistics grade N Median Mode Percentiles Valid Missing 3 7 1 11, 3,, 11, 1,
Valid 1 3 9 1 11 1 13 1 1 1 17 1 19 1 3 9 Total grade Cumulative Frequency Percent Valid Percent Percent 17 17, 17, 17, 3 3, 3,, 3 3, 3, 3,,,, 3 3, 3,, 1 1, 1, 9,,, 33,,, 1, 3 3, 3,, 1 1, 1,,,, 1,,,, 9 9, 9,,,, 9, 3 3, 3, 7, 1 1, 1,, 1 1, 1, 3,,, 7, 1 1, 1,, 1 1, 1, 9,,, 91,,, 93,,, 97, 1 1, 1, 9, 1 1, 1, 99, 1 1, 1, 1, 1 1, 1, Πάνω από τη βάση έχει το 3% των φοιτητών-τριών, αφού 1. =.3. grade 1 Frequency 1 1 3 9 1 11 1 13 1 1 1 17 1 19 1 3 9 grade ) Να δοθεί το ιστόγραµµα συχνοτήτων (histogram) των βαθµών. Χρησιµοποιήστε τις κλάσεις -1, -, -7, -1, 11-13, 1-1, 17-19, -, 3-, -, 9-3. Για το ιστόγραµµα επιλέγουµε: Graphs Histogram grade OK Στην συνέχεια µε διπλό κλικ πάνω στο γράφηµα, επιλέγουµε: 3
Chart Axis Interval+OK Intervals-custom-Define: interval width 3, range -1. 31. Το ζητούµενο γράφηµα θα έχει τη µορφή: 1 Frequency 1 31, 3,, 7,,,, 1, 19, 1, 1, 1, 13, 1, 1, 9, 7,,, 3, 1,, -1, grade Mean = 1,7 Std. Dev. = 7,77 N = 1 ) Να δοθεί το Box plot των βαθµών. Υπάρχουν Outliers?. Για το θηκόγραµµα επιλέγουµε: Graphs Βoxplot grade OK 3 1 1 grade Από το θηκόγραµµα δεν βλέπουµε να υπάρχουν outliers. Εργαστήριο #3
(Συνέχεια της Άσκησης ) Τα πλήρη δεδοµένα (βαθµολογία και έτος φοίτησης φοιτητών και φοιτητριών) που προσήλθαν στις εξετάσεις της Άσκησης βρίσκονται χωρισµένα σε δύο αρχεία: - exerc_females.xls: αρχείο του Εxcel που περιέχει τα δεδοµένα που αφορούν τις φοιτήτριες - exerc_males.txt: αρχείο κειµένου (text) που περιέχει τα δεδοµένα που αφορούν τους φοιτητές α) Ανοίξτε τα αρχεία αυτά (το πρώτο µε το Excel και το δεύτερο µε οποιοδήποτε κειµενογράφο) για να εξετάσετε τη µορφή τους (π.χ. πόσες µεταβλητές περιέχουν, αν περιλαµβάνουν ονόµατα µεταβλητών κ.ο.κ.) και στη συνέχεια κλείστε τα χωρίς να τα τροποποιήσετε. β) Ανοίξτε το SPSS και αφού εισάγετε τα δεδοµένα (3 cases) του πρώτου αρχείου, αλλάξτε τις ονοµασίες των µεταβλητών σε grades, year και προσθέστε τη µεταβλητή sex. Κλείστε τα δεδοµένα αφού τα αποθηκεύστε σε αρχείο του SPSS µε το όνοµα exercf.sav Από το µενού του SPSS επιλέγουµε τα παρακάτω για να ανοίξουµε το αρχείο exerc_females.xls: File Open Data exerc_females.xls Open. Στη συνέχεια εµφανίζεται το παράθυρο: Πατάµε OK. Ονοµάζουµε τις στήλες στο SPSS grade και year αντίστοιχα και φτιάχνουµε τη στήλη sex µε τιµές 1 για τις γυναίκες. Στη συνέχεια σώζουµε το νέο αρχείο ως εξής: File Save As exercf.sav γ) Να εισάγετε στο SPSS τα δεδοµένα ( cases) του δεύτερου αρχείου (αυτή τη φορά µην αλλάξετε τις ονοµασίες των µεταβλητών g, y) και προσθέστε και πάλι την µεταβλητή sex. Αποθηκεύστε τα ως exercm.sav Από το µενού του SPSS επιλέγουµε τα παρακάτω για να ανοίξουµε το αρχείο exerc_males.txt: File Open Data exerc_males.txt Open. Στη συνέχεια εµφανίζονται τα παράθυρα στα οποία αφού κάνουµε τις επιλογές που φαίνονται στα επόµενα παράθυρα πατάµε next:
Αφού φτιάξουµε την στήλη sex µε για τους άντρες, σώζουµε το νέο αρχείο ως εξής: File Save As exercm.sav δ) Να ενώσετε τα δεδοµένα των δύο παραπάνω αρχείων σε ένα κοινό αρχείο δεδοµένων µε cases και 3 µεταβλητές (grades, year, sex). Αποθηκεύστε το αρχείο µε το όνοµα exerc.sav Αφού ανοίξουµε το αρχείο exercm.sav επιλέγουµε: Data Merge Files Add cases exercf.sav Open Επιλέγω µαζί τις µεταβλητές g και grade και πατώντας το pair τις µεταφέρω δεξιά. Όµοια για τις y και year.
Επιλέγουµε ΟΚ, ονοµάζουµε τις µεταβλητές και αφού κάνουµε τις απαραίτητες αλλαγές σώζουµε το νέο αρχείο ως εξής: File Save As exerc.sav Χρησιµοποιώντας τα πλήρη δεδοµένα ( περιπτώσεις) απαντήστε στα (υπόλοιπα) ερωτήµατα της Άσκησης (Να κατασκευάσετε και τις νέες µεταβλητές, και fyear όπως περιγράφεται στα ερωτήµατα () και ()). ) Να κατασκευάσετε µια νέα µεταβλητή η οποία να είναι ο τελικός βαθµός κάθε φοιτητή στην κλίµακα,1,,1. (, 1, 1, 3 1, 1,, 9, 9 1, 3 1). Να δοθεί ο πίνακας συχνοτήτων αυτής της µεταβλητής. Πόσοι πέρασαν µε ; Να δώσετε την µέση τιµή της εξαιρώντας αυτούς που πήραν. Για να κατασκευάσουµε τη µεταβλητή επιλέγουµε τα εξής: Transform Compute Για να εµφανιστεί ο πίνακας συχνοτήτων της επιλέγουµε: Analyze Descriptive Statistics Frequencies OK 7
Valid, 1,, 3,,,, 7,, 9, 1, Total Cumulative Frequency Percent Valid Percent Percent 11,,, 1,3 1,3 3, 39 7,7 7,7, 71 1,1 1,1,3 17, 17, 71,7 1,9 1,9,,7,7 91,3 1,, 9,1 1 3, 3, 97, 1,, 99,,, 1, 1, 1, Εποµένως µε βαθµό πέρασε το 1,9% των φοιτητών. Για να εξαιρέσουµε τους φοιτητές που πήραν βαθµό επιλέγουµε: Data Select cases If condition is satisfied > Continue OK Στην συνέχεια επιλέγουµε:analyze Descriptive Statistics Descriptives Options Continue OK Descriptive Statistics Valid N (listwise) N Mean 393,3 393 (Καταργούµε τη µεταβλητή FILTER για να εργαστούµε στα επόµενα ερωτήµατα µε όλα τα δεδοµένα) 7) Ποια είναι τα ποσοστά των φοιτητών και των φοιτητριών στους εξεταζόµενους; Να δοθεί το αντίστοιχο pie-chart.
Επιλέγουµε: Analyze Descriptive Statistics Frequencies sex Charts Pie charts Continue OK sex Valid male female Total Cumulative Frequency Percent Valid Percent Percent 3,1,1,1 9,9 9,9 1, 1, 1, sex male female 9,9%,1% ) Χρησιµοποιώντας την µεταβλητή που εκφράζει το έτος φοίτησης (µε τιµές, 3,,1) να κατασκευάσετε µια νέα µεταβλητή (fyear) η οποία να δείχνει αν ο φοιτητής βρίσκεται στο ο έτος, 3 ο έτος ο έτος, επί πτυχίω (> ο έτος). Ποιο είναι το ποσοστό των εξεταζοµένων φοιτητών που βρίσκονται στο ο έτος, 3 ο έτος ο έτος, πτυχίο; Να δοθεί το αντίστοιχο pie-chart. Για να φτιάξουµε την µεταβλητή fyear επιλέγουµε: Transform Recode Into different variables year Old and new values... Continue.. OK 9
Στη συνέχεια για την πίτα επιλέγουµε: Analyze Descriptive Statistics Frequencies fyear Charts Pie charts Continue OK fyear Valid o etos 3o etos o etos epi ptyxiw Total Cumulative Frequency Percent Valid Percent Percent 177 3, 3, 3, 1 3, 3,, 7 13,9 13,9 7,7 13 7,3 7,3 1, 1, 1, 1
fyear 7,33% 3,% o etos 3o etos o etos epi ptyxiw 13,% 3,7% 9) Να δοθεί η µέση τιµή, το box-plot το ραβδόγραµµα των βαθµών (-1) ανά φύλο. Analyze Descriptive Statistics Explore 1 male sex female Descriptives sex male female Mean Mean Statistic Std. Error,7,11 3,1,19 (Από τον πίνακα Descriptives έχουµε κρατήσει µόνο την µέση τιµή για κάθε φύλο µαζί το αντίστοιχο τυπικό σφάλµα) Για το ραβδόγραµµα επιλέγουµε: Graphs Bar Clustered Summaries for group of cases 11
Percent 3 1 1 sex male female 1 3 7 9 1 1) Να δοθεί η µέση τιµή, το box-plot και το ραβδόγραµµα των βαθµών (-1) ανά έτος ( ο, 3 ο, ο, πτυχίο). Analyze Descriptive Statistics Explore 1 o etos 3o etos o etos epi ptyxiw fyear 1
Descriptives fyear o etos 3o etos o etos epi ptyxiw Mean Mean Mean Mean Statistic Std. Error 3,,,33,193 3,1,93 3,7,3 (Από τον πίνακα Descriptives έχουµε κρατήσει µόνο την µέση τιµή για κάθε επίπεδο της µαζί το αντίστοιχο τυπικό σφάλµα) Για το ραβδόγραµµα επιλέγουµε: of cases Graphs Bar Clustered Summaries for group Percent 3 1 fyear o etos 3o etos o etos epi ptyxiw 1 1 3 7 9 1 11) Να δοθεί ένας πίνακας που να δείχνει το πλήθος των φοιτητών-τριών που βαθµολογήθηκαν µε, 1,,,1 ανά φύλο. Ο πίνακας να περιλαµβάνει και τα ποσοστά των βαθµών ανά φύλο. Analyze Descriptive Statistics Crosstabs 13
* sex Crosstabulation Total 1 3 7 9 1 sex male female Total 7 11 7,7% 1,7%,% 11,1% 9,% 1,3% 19 39 7,% 7,9% 7,7% 3 39 71 1,% 1,% 1,1% 1,% 19,% 17,% 9 1,3% 11,% 1,9% 17 7,7% 1,7%,7% 1,% 3,%,% 1 1,%,% 3,% 7 3 1,% 1,%,%,%,%,% 3 1,% 1,% 1,% 1) Να δοθεί ένας πίνακας που να δείχνει το πλήθος των φοιτητών-τριών που βαθµολογήθηκαν µε, 1,,,1 ανά έτος φοίτησης ( ο, 3 ο, ο, πτυχίο). Ο πίνακας να περιλαµβάνει και τα ποσοστά των βαθµών ανά έτος φοίτησης. Αnalyze Descriptive Statistics Crosstabs 1
Total 1 3 7 9 1 * fyear Crosstabulation fyear o etos 3o etos o etos epi ptyxiw Total 3 3 1 7 11 19,% 3,%,% 19,%,% 1 9 11,3% 1,% 7,1%,% 1,3% 1 9 3 13 39 7,9% 7,%,3% 9,% 7,7% 1 1 7 71 11,9% 1,% 1,% 1,1% 1,1% 7 1 1,3% 1,7% 1,% 1,% 17,% 17 1 1 9,%,7%,% 11,% 1,9% 7 9 11,3%,7% 1,%,%,7% 1 1 3,% 1,7% 1,% 3,%,% 1 1 1,%,%,9% 3,% 3,% 7 1 1,%,% 1,% 1,%,% 1 1,%,% 1,%,7%,% 177 1 7 13 1,% 1,% 1,% 1,% 1,% 13) Να δοθεί ένας πίνακας που να δείχνει το πλήθος των φοιτητών-τριών που βαθµολογήθηκαν µε, 1,,,1 ανά έτος φοίτησης (,3,, πτυχίο) και ανά φύλο. Analyze Descriptive Statistics Crosstabs 1
sex male female Total Total 1 3 7 9 1 1 3 7 9 * fyear * sex Crosstabulation fyear o etos 3o etos o etos epi ptyxiw Total 3 17 1 7 1 3 1 19 1 1 3 11 7 1 3 9 9 3 17 3 3 1 7 1 1 7 7 39 1 3 1 19 7 1 7 1 3 13 39 1 13 7 1 1 3 7 9 1 7 3 1 9 1 1 1 3 11 3 31 7 1) Να δοθεί ένα γράφηµα που να περιέχει τα boxplots των βαθµών (-1) ανά φύλο και ανά έτος (,3,,πτυχίο) ( = boxplots). Graphs Boxplot Clustered Summaries for group of cases. 1 sex male female o etos 3o etos o etos epi ptyxiw fyear 1