----------Εισαγωγή στη Χρήση του SPSS for Windows ------------- Σελίδα: 0------------ ΚΕΦΑΛΑΙΟ 5 ο 5.1 Εντολή EXPLORE 5.2 Εντολή CROSSTABS 5.3 Εντολή RAΤΙΟ STΑTISTIC 5.4 Εντολή OLAP CUBES 5000 Daily calorie intake 4000 Observed Linear 3000 Logarithmic Inverse 2000 Quadratic Cubic 1000 Pow er Exponential 0-100 0 100 200 Logistic Infant mortality (deaths per 1000 live births)
----------Εισαγωγή στη Χρήση του SPSS for Windows ------------- Σελίδα: 1------------ 5.1 ENTOΛH EXPLORE Η εντολή Explore παράγει και περιγράφει στατιστικά µέτρα και γραφικές παραστάσεις είτε για το σύνολο των τιµών της µεταβλητής είτε για οµάδες τιµών της, έτσι όπως αυτές καθορίζονται από µία άλλη εξωτερική µεταβλητή (factor). Η διαδικασία 'Explore' µπορεί να χρησιµοποιηθεί µε επιτυχία : στη διερεύνηση δεδοµένων, στην ανίχνευση ακραίων τιµών, στην περιγραφική ανάλυση, στην πραγµατοποίηση έλεγχων υποθέσεων, ή στον υπολογισµό διαφορών µεταξύ υπό-πληθυσµών. Η διερεύνηση των δεδοµένων µπορεί να οδηγήσει στον εντοπισµό ακραίων τιµών, κενών ή άλλων ιδιοµορφιών των δεδοµένων και να βοηθήσει στην απόφαση του κατά πόσο οι στατιστικές τεχνικές που έχει υπόψη του ο χρήστης για την ανάλυση των δεδοµένων είναι κατάλληλες. Για την ενεργοποίηση του παραθύρου της εντολής 'explore' ακολουθούµε την διαδροµή ΑΝΑΙΥΖΕ DESCRIPTIVESTATISTICS EXPLORE. Η µεταβλητή της οποίας επιθυµούµε να υπολογιστούν τα περιγραφικά στατιστικά µέτρα εισάγεται στο πεδίο 'Dependent List' ενώ η µεταβλητή δηµιουργίας υποοµάδων ανάλυσης εισάγεται στο πεδίο 'Factor'. Με την επιλογή του πλήκτρου 'Statistics' παρέχεται η δυνατότητα επιλογής επιπλέον στατιστικών µέτρων. Η επιλογή του πλήκτρου 'ΡΙοts' παράγει γραφικές παραστάσεις ανάλογα µε την επιλογή του χρήστη.
----------Εισαγωγή στη Χρήση του SPSS for Windows ------------- Σελίδα: 2------------ Αποτελέσµατα της εντολής EXPLORE στο Output. Descriptives ΦΥΛΛΟ Statistic Std. Τριλυκερίδια Πριν Error male Mean 137,40 13,274 95% Confidence Interval for Mean Lower Bound 107,37 Upper Bound 167,43 5% Trimmed Mean 136,67 Median 139,00 Variance 1762,044 Std. Deviation 41,977 Minimum 84 Maximum 204 Range 120 female Mean 121,00 16,358 95% Confidence Interval for Mean Lower Bound 78,95 Upper Bound 163,05 5% Trimmed Mean 119,61 Median 111,50 Variance 1605,600 Std. Deviation 40,070 Minimum 85 Maximum 182 Range 97 Τριλυκερίδια Πριν 220 200 180 160 140 Τριλυκερίδια Πριν 120 100 80 60 N = 10 6 male female ΦΥΛΛΟ
----------Εισαγωγή στη Χρήση του SPSS for Windows ------------- Σελίδα: 3------------ 5.2 ENTOΛΗ CROSSTABS Η διαδικασία Crosstabs δηµιουργεί πίνακες διπλής εισόδου (και πολλαπλών εισόδων) και εµπεριέχει ποικιλία ελέγχων και µετρήσεων της συσχέτισης των µεταβλητών.η δοµή του πίνακα και η ταξινόµηση των κατηγοριών καθορίζουν το είδος του ελέγχου ή τη µέτρηση που θα χρησιµοποιηθεί. Οι στατιστικές µετρήσεις συσχέτισης υπολογίζονται µόνο στους πίνακες διπλής εισόδου. Σε περίπτωση που θέλουµε να ελέγξουµε κατά πόσο οι δύο κατηγορικές µεταβλητές είναι εξαρτηµένες µεταξύ τους ακολουθούµε την διαδροµή ANALYZE DESCRIPTIVE STATISTICS CROSSTABS. Για την δηµιουργία ενός πίνακα διπλής εισόδου τοποθετούµε µία µεταβλητή στις στήλες και µια στις γραµµές. Η θέση των µεταβλητών δεν έχει σηµασία. Στη συνέχεια µε την επιλογή του πλήκτρου STΑTISTICS επιλέγουµε το έλεγχο chisquare ή όποιο άλλο µέτρο θεωρούµε κατάλληλο για τον έλεγχο της υπόθεσής της συσχέτισης των δύο µεταβλητών. Με την επιλογή του πλήκτρου 'cells' µπορούµε να ορίσουµε αν ο πίνακας θα περιέχει µόνο πραγµατικές τιµές ή και ποσοστά. Με την επιλογή του πλήκτρου ΟΚ, στο output του SPSS παράγεται ο πίνακας διπλής εισόδου καθώς και τα αποτελέσµατα του στατιστικού ελέγχου 'chi-square'. Το αποτέλεσµα του ελέγχου chi-square συνοψίζεται από τον διπλανό πίνακα όπου εξετάζεται αν η τιµή, Asymp. Sig., (2- sided) είναι µικρότερη το 0,05 (για 95% διάστηµα εµπιστοσύνης).
----------Εισαγωγή στη Χρήση του SPSS for Windows ------------- Σελίδα: 4------------ Στο πιο πάνω παράδειγµα η τιµή είναι πολύ µεγαλύτερη του 0,05 άρα οι δύο αυτές µεταβλητές θεωρούνται ανεξάρτητες. (δεν απορρίπτεται η µηδενική υπόθεση ότι οι µεταβλητές gender και Years που συµµετέχουν στο 'crosstabs' είναι ανεξάρτητες). 5.3 ΕΝΤΟΛΗ RAΤΙΟ STΑTISTIC Η διαδικασία Ratio παρέχει µια λίστα από στατιστικά µέτρα για την περιγραφή της αναλογίας δύο συνεχών µεταβλητών, µέσω της εντολής είναι δυνατή η ταξινόµηση των αποτελεσµάτων από τιµές µιας οµαδοποιηµένης µεταβλητής σε φθίνουσα ή αύξουσα σειρά. Για την ενεργοποίηση της εντολής 'Ratio' ακολουθούµε την διαδροµή Analyze Descriptive Statistics Ratio 5.4 ΕΝΤΟΛΗ OLAP CUBES Τα Olap Cubes είναι ένα βασικό εργαλείο του SPSS στην πινακοποίηση δεδοµένων. Η χρήση τους συνίσταται στις περιπτώσεις όπου θέλουµε να εξετάσουµε τη µεταβολή κάποιου (ή κάποιων) συνεχών µέτρων µέσα σε ένα πλέγµα ορισµένων διακριτών µεταβλητών. Για παράδειγµα, έστω ότι διαθέτουµε ένα αρχείο δεδοµένων που αναφέρεται στην προσδοκώµενη διάρκεια ζωής κατοίκων διάφορων χωρών (lifexp ) και θέλουµε να µελετήσουµε αυτή την πληροφορία σε σχέση µε την θρησκεία (religion) και την ήπειρο στην οποία ανήκει κάθε µία από τις χώρες αυτές (region). υπάρχει, δηλαδή µια συνεχής µεταβλητή (lifeexp) η οποία θα µελετηθεί σε σχέση µε τις κατηγορικές µεταβλητές 'religion' και 'region'. Η µελέτη των παραπάνω σχέσεων θα πραγµατοποιηθεί µέσω της εντολής
----------Εισαγωγή στη Χρήση του SPSS for Windows ------------- Σελίδα: 5------------ OLAP Cubes από τη διαδροµή ANALYZE REPORTS OLAP Cubes Στο πεδίο 'Summary variable(s)' τοποθετείται η συνεχής µεταβλητή 'διάρκεια προσδοκώµενης ζωής' (lifeexp) και στο πεδίο 'Grouping Variables' τοποθετούνται οι µεταβλητές 'region' και 'religion'. Με την επιλογή του πλήκτρου Statistic, επιλέγονται, από την αριστερή πλευρά του υποπαραθύρου, τα στατιστικά µέτρα που θα περιέχονται στον πίνακα. Στο παράδειγµα µας µεταφέρουµε στα δεξιά τα στατιστικά µέτρα: άθροισµα (sum),πλήθος εγγραφών (number of cases), µέσος όρος (mean) και τυπική απόκλιση (standard deviation). Στην συνέχεια επιλέγεται το πλήκτρο 'Continue'. Με την επιλογή του πλήκτρου 'title' : ορίζουµε το τίτλο του πίνακα που θα δηµιουργηθεί. Στο δεύτερο πεδίο.caption' εισάγονται υποσηµειώσεις για το πίνακα. Ή επιλογή του πλήκτρου.continue' επαναφέρει το βασικό παράθυρο της εντολής..
----------Εισαγωγή στη Χρήση του SPSS for Windows ------------- Σελίδα: 6------------ Το πλήκτρο 'Differences' ενεργοποιεί το παρακάτω παράθυρο το οποίο επιτρέπει τον υπολογισµό ποσοστών και αριθµητικών διαφορών µεταξύ των µεταβλητών που έχουν τοποθετηθεί στο πεδίο 'Summary variable(s)', από το κεντρικό παράθυρο του 'Olap Cube', ή µεταξύ των µεταβλητών που έχουν τοποθετηθεί στο πεδίο 'Grouping Variables' από το κεντρικό παράθυρο του 'Olap Cube'. Με την επιλογή 'Differences between Variables' ενεργοποιείται ο δεύτερος τοµέας του υποπαραθύρου όπου υπολογίζει τις διαφορές µεταξύ ζευγαριών των µεταβλητών που έχουν τοποθετηθεί στο πεδίο 'Summary variable(s)'. Στο τρίτο τοµέα, 'differences between groups of cases' υπολογίζονται οι διαφορές ζευγαριών µεταξύ των κατηγοριών των µεταβλητών που έχουν τοποθετηθεί στο πεδίο 'Grouping Variables'. Για την δηµιουργία του πίνακα κάνουµε 'κλικ' στο πλήκτρο 'Continue' και από το κεντρικό παράθυρο του 'Olap Cube' επιλέγουµε το πλήκτρο ΟΚ. Ο παραγόµενος πίνακας παρουσιάζεται στο παράθυρο των αποτελεσµάτων (Output Navigator) : Στον διπλανό παραπάνω πίνακα παρουσιάζονται τα αποτελέσµατα της προσδοκώµενης ζωής των κατοίκων όλων των χωρών σε σχέση µε τα στατιστικά µέτρα που έχουµε επιλέξει. Για παράδειγµα, ο µέσος όρος της προσδοκώµενης ζωής των κατοίκων όλων των χωρών είναι 70, 18 έτη.
----------Εισαγωγή στη Χρήση του SPSS for Windows ------------- Σελίδα: 7------------ Για την επιλογή συγκεκριµένη κατηγορίας θα πρέπει, αρχικά, να ενεργοποιηθεί το 'Olap Cube'. Η ενεργοποίηση γίνεται µε διπλό 'κλικ' πάνω στον πίνακα. Η ενεργοποίηση δίνει τη δυνατότητα επιλογής κατηγοριών από τις δύο αυτές µεταβλητές έτσι ώστε να παραχθεί ο κατάλληλος συνδυασµός. Για παράδειγµα, επιλέγεται ο συνδυασµός των κατοίκων της Αφρικής που είναι µουσουλµάνοι Παρατηρείται ότι ο µέσος όρος της προσδοκώµενης ζωής, του παραπάνω συνδυασµού είναι 57,6 έτη, δηλαδή, µειώθηκε σε σχέση µε το συνολικό µέσο όρο της προσδοκώµενης ζωής των κατοίκων που αρχικά ήταν 70, 18 έτη. Η διαδικασία τροποποίησης των πινάκων είναι ιδιαίτερα ευέλικτη. Για παράδειγµα, µπορούµε να µεταφέρουµε µέσω του Pivoting trays τη µεταβλητή 'Religion' στις γραµµές του πίνακα, έχοντας τη δυνατότητα να κάνουµε συγκρίσεις. Το εικονίδιο του 'Pivoting Trays' ενεργοποιείται από την διαδροµή Ρίνοt Pivoting Trays Επίσης η διαδικασία OLAP Cubes µας επιτρέπει να συγκρίνουµε τις τιµές περισσότερων από µίας συνεχών µεταβλητών βάσει ενός πλέγµατος κατηγορικών
----------Εισαγωγή στη Χρήση του SPSS for Windows ------------- Σελίδα: 8------------ µεταβλητών. Για παράδειγµα, µεταφέρουµε την µεταβλητή πληθυσµός(ρορulatn) από το αριστερό πεδίο στο πεδίο 'Summary Variables'. Για την δηµιουργία του πίνακα επιλέγουµαι το πλήκτρο ΟΚ: Παρατηρείται ότι ο µέσος όρος της προσδοκώµενης ζωής, του παραπάνω συνδυασµού είναι 57,6 έτη, δηλαδή, µειώθηκε σε σχέση µε το συνολικό µέσο όρο της προσδοκώµενης ζωής των κατοίκων που αρχικά ήταν 70, 18 έτη. Στον πίνακα τώρα περιέχεται η πληροφορία για το πληθυσµό των κατοίκων της Αφρικής που είναι µουσουλµάνοι. Άλλο παράδειγµα κυβου OLAP OLAP Cubes Predominant climate: Total Sum N Mean Std. Daily calorie intake % of Total % of Total Deviation Sum N 206537 75 2753,83 567,828 100,0% 100,0% Predominant climate: mediterranean Sum N Mean Std. Daily calorie intake % of Total % of Total Deviation Sum N 16976 6 2829,33 542,235 8,2% 8,0% Predominant climate: tropical Sum N Mean Std. Daily calorie intake % of Total % of Total Deviation Sum N 66498 28 2374,93 308,809 32,2% 37,3%