ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ Δρ. Βασίλης Π. Αγγελίδης Τμήμα Μηχανικών Παραγωγής & Διοίκησης Δημοκρίτειο Πανεπιστήμιο Θράκης
Εισαγωγή στο Amos Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Θεωρία) Διαφάνεια 2
Περιεχόμενα Εκφώνηση Παραδείγματος Εκκίνηση του Amos Τα εικονίδια του Amos Εισαγωγή (επιλογή) αρχείου δεδομένων Σχεδιασμός του μοντέλου Μορφοποίηση αντικειμένων Μορφοποίηση διαγράμματος Ιδιότητες Ανάλυσης Εκτέλεση της ανάλυσης Αποτελέσματα Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Θεωρία) Διαφάνεια 3
Εκφώνηση Παραδείγματος Ο Hamilton (1990) σε μία έρευνα που έκανε μέτρησε διάφορα μεγέθη για κάθε μια από τις 21 πολιτείες στην Αμερική. Τρεις από αυτές τις μετρήσεις θα χρησιμοποιηθούν για την παρουσίαση του Amos: 1)ο μέσος όρος του τεστ για την εισαγωγή ενός φοιτητή στο κολέγιο (SAT), 2)το ετήσιο οικογενειακό εισόδημα (Income) και 3)το επίπεδο μόρφωσης των γονιών (Education). Το πρόβλημα όπως εμφανίζεται είναι μια παλινδρόμηση όπου η μετρήσιμη μεταβλητή Sat προβλέπεται σαν γραμμικός συνδυασμός των δύο άλλων μεταβλητών. Χρησιμοποιήθηκε επίσης μία αφανής (κρυφή) μεταβλητή ενσωματώνει την διακύμανση της SAT η οποία δεν μπορεί να ερμηνευτεί από της άλλες δύο μεταβλητές (το λάθος της εκτίμησης). Όπως φαίνεται στο διάγραμμα τα απλά βέλη αντιπροσωπεύουν τους συντελεστές παλινδρόμησης ενώ τα διπλά βέλη συμβολίζουν τον βαθμό συσχέτισης ή συνδιακύμανσης μεταξύ των μεταβλητών Education SAT Other Income Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Θεωρία) Διαφάνεια 4
Εκκίνηση του Amos Υπάρχουν πολλοί τρόποι για την εκκίνηση του Amos Graphics Start Programs Amos Amos Graphics Με διπλό κλικ επάνω στα αρχεία (*.amw) (αρχεία που δημιουργούνται με το Amos Graphics Αν έχετε νέα έκδοση του Spss από το Analyze Amos Μετά την εκκίνηση του προγράμματος εμφανίζεται η εικόνα η οποία περιλαμβάνει την γραμμή εντολών καθώς και ένα τετράγωνα με διάφορα κουμπιά εντολών. Επίσης εμφανίζεται μία λωρίδα (γκρι χρώμα) χωρισμένη σε έξι μέρη η οποία παρουσιάζει διάφορες πληροφορίες για το μοντέλο και το κεντρικό μέρος όπου με απλό τρόπο σχεδιάζεται το μοντέλο και μετά την ανάλυση εμφανίζονται τα κυριότερα αποτελέσματα Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Θεωρία) Διαφάνεια 5
Τα εικονίδια του Amos (1) Σχεδιασμός μετρήσιμων μεταβλητών Σχεδιασμός κρυφών μεταβλητών Σχεδιασμός κρυφών μεταβλητών με την προσθήκη προσδιοριστικών μεταβλητών Σχεδιασμός αιτιακής σχέσης Σχεδιασμός Διακύμανσης( covariance) / συσχέτισης (correlation) Προσθήκη μιας μεταβλητής σε μια υπάρχουσα μεταβλητή Τίτλοι Κατάλογος μεταβλητών του μοντέλου Κατάλογος μεταβλητών του αρχείου δεδομένων Επιλογή ενός αντικειμένου Επιλογή όλων των αντικειμένων Επιλογή αρχείου δεδομένων Ιδιότητες της ανάλυσης Υπολογισμός Εκτίμηση Αντιγραφή ενός μοντέλου στο clipboard Εμφάνιση αναλυτικών αποτελεσμάτων Αποθήκευση μοντέλου Ιδιότητες αντικειμένου Αντιγραφή ιδιοτήτων αντικειμένου σε ένα άλλο αντικείμενο Διατήρηση συμμετριών Zoom της επιλεγμένης περιοχής Εμφάνιση μικρότερης περιοχής του μοντέλου Ακύρωση επιλογής όλων των αντικειμένων Εμφάνιση μεγαλύτερης περιοχής του μοντέλου Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Θεωρία) Διαφάνεια 6
Τα εικονίδια του Amos (2) Αντίγραφο αντικειμένου Μετακίνηση αντικειμένου Διαγραφή αντικειμένου Αλλαγή του μεγέθους του αντικειμένου Περιστροφή των προσδιοριστικών μεταβλητών μιας κρυφής μεταβλητής Απεικόνιση των προσδιοριστικών μεταβλητών μιας κρυφής Μεταφορά τιμών των παραμέτρων Επανατοποθέτηση του μοντέλου στην οθόνη Εμφάνιση όλης της σελίδας στην οθόνη Επανασχεδιασμός του μοντέλου έτσι ώστε να χωράει στην σελίδα Εξέταση του διαγράμματος με loupe Εμφάνιση βαθμών ελευθερίας Ανάλυση πολλαπλών ομάδων Εκτύπωση του μοντέλου και των αποτελεσμάτων Ανατροπή Επαναφορά Τακτοποίηση μεταβλητής Αναζήτηση προδιαγραφών Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Θεωρία) Διαφάνεια 7
Εισαγωγή (επιλογή) αρχείου δεδομένων Από την μπάρα εντολών επιλέγεται File Data Files στην συνέχεια από την θυρίδα διαλόγου που εμφανίζεται επιλέγεται File Name. Από την νέα θυρίδα διαλόγου μπορείτε πλέον επιλέξετε το αρχείο το οποίο περιέχει τα δεδομένα. Το Amos υποστηρίζει αρχεία βάσεων δεδομένων, λογιστικών σελίδων καθώς στατιστικών πακέτων. Εφόσον επιλέξετε το αρχείο που περιέχει τα δεδομένα προς ανάλυση πατήστε OK. Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Θεωρία) Διαφάνεια 8
Σχεδιασμός του μοντέλου Ξεκινάμε τον σχεδιασμό του μοντέλου αναπαριστώντας πρώτα τις τρεις μετρήσιμες μεταβλητές του παραδείγματος: κάνοντας κλικ στο αντίστοιχο κουμπί εντολών ή από την μπάρα εργαλείων επιλέγοντας Diagram Draw Observed. Στην συνέχεια με τον ίδιο τρόπο μπορείτε να σχεδιάσετε και την αφανή μεταβλητή : κάνοντας κλικ στο αντίστοιχο κουμπί εντολών ή από την μπάρα εργαλείων επιλέγοντας Diagram Draw Unobserved. Στην συνέχεια μπορείτε να σχεδιάσετε τις διαδρομές κάνοντας κλικ στο αντίστοιχο κουμπί εντολών ή από την μπάρα εργαλείων επιλέγοντας Diagram Draw Path ή Diagram Draw Covariance ανάλογα με την περίπτωση Στην συνέχεια για να αντιστοιχίσουμε τις μετρήσιμες μεταβλητές στο αντίστοιχο σχέδιο του διαγράμματος πατάμε κλικ στο κουμπί που εμφανίζει την λίστα των μεταβλητών του αρχείο των δεδομένων και στην συνέχεια επιλέγουμε την μεταβλητή που θέλουμε και την σέρνουμε στο αντίστοιχο παραλληλόγραμμο του διαγράμματος. Τα αποτελέσματα αυτών των ενεργειών έχουν το παρακάτω αποτέλεσμα στην περιοχή σχεδιασμού Education SAT Income Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Θεωρία) Διαφάνεια 9
Μορφοποίηση αντικειμένων Για να δώσετε όνομα στην αφανή μεταβλητή κάνετε δεξί κλικ επάνω της και επιλέγετε Object Proprieties. Εμφανίζεται ένα παράθυρο διαλόγου το οποίο αποτελείτε από πέντε καρτέλες. Στην πρώτη καρτέλα στο πεδίο Variable name δίνετε το όνομα της μεταβλητής, στο πεδίο variable name δίνετε την ετικέτα της μεταβλητής (πως θέλουμε να εμφανίζεται η μεταβλητή στα αποτελέσματα) μπορείτε επίσης να επιλέξετε το μέγεθος και το στυλ της γραμματοσειράς. Στην δεύτερη καρτέλα μπορείτε να επιλέξετε το μέγεθος και το στυλ της γραμματοσειράς των παραμέτρων που θα εμφανιστούν στα αποτελέσματα καθώς την κατεύθυνση τους Εδώ μπορείτε επίσης να εισαχθούν στο πεδίο Variance οι περιορισμοί για το αντικείμενο. Στην Τρίτη καρτέλα μπορείτε να επιλέξετε διάφορους χρωματισμούς για το αντικείμενο που έχετε επιλέξει. Τέλος στην τέταρτη καρτέλα μπορείτε να επιλέξετε την μορφή των μεταβλητών και στην πέμπτη καρτέλα το τι θέλετε από το αντικείμενο να είναι ορατό στην περιοχή του σχεδιασμού καθώς και στην αντίστοιχη περιοχή των αποτελεσμάτων. Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Θεωρία) Διαφάνεια 10
Μορφοποίηση διαγράμματος Μπορείτε να αλλάξετε την εμφάνιση του διαγράμματος σύμφωνα με την αισθητική σας. Οι αλλαγές που θα κάνετε στην μορφή και το μέγεθος των αντικειμένων ή των γραμματοσειρών δεν επηρεάζουν καθόλου τις προδιαγραφές και την εγκυρότητα του μοντέλου. Επιλέγοντας ένα από τα κουμπιά εντολών μπορείτε να παρατηρήσετε ότι εμφανίζεται το αντίστοιχο σχέδιο στο βέλος του ποντικιού επομένως εφόσον επιλέξετε την μορφοποίηση που θέλετε μετακινήστε το ποντίκι στο αντικείμενο προς μορφοποίηση. Τα κυριότερα αντικείμενα για την μορφοποίηση των αντικειμένων είναι: Μετακινεί τα αντικείμενα Αλλάζει το μέγεθος Αντιγράφει ένα αντικείμενο Μετακινεί τους παραμέτρους ενός αντικειμένου Διαγράφει ένα αντικείμενο Εμφανίζει το παράθυρο διαλόγου των ιδιοτήτων του αντικειμένου Ένα πολύ εύχρηστο κουμπί είναι αυτό της μεταφοράς των μορφοποιήσεων ενός αντικειμένου σε ένα άλλο. Εφόσον κάνουμε τις μορφοποιήσεις που επιθυμούμε σε ένα αντικείμενο στην συνέχεια κάνουμε κλικ στο κουμπί εντολής, επιλέγουμε τις μορφοποιήσεις που θέλουμε να μεταφέρουμε και στην συνέχεια κάνουμε κλικ στο μορφοποιημένο αντικείμενο και χωρίς να αφήσουμε το κλικ το σέρνουμε στο αντικείμενο που θέλουμε να μορφοποιήσουμε Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Θεωρία) Διαφάνεια 11
Ιδιότητες Ανάλυσης Το επόμενο βήμα μετά τον σχεδιασμό είναι να επιλεχτούν οι επιθυμητές προδιαγραφές ανάλυσης. Το Amos προσφέρει μία μεγάλη γκάμα ιδιοτήτων. Για την επιλογή των ιδιοτήτων της ανάλυσης μπορείτε να κάνετε κλικ στο αντίστοιχο κουμπί εντολών ή από την μπάρα εργαλείων επιλέγοντας View Analysis Proprieties. Με την επιλογή εμφανίζεται ένα παράθυρο διαλόγου το οποίο περιέχει έξι καρτέλες οι οποίες περιέχουν πολλές επιλογές οι οποίες θα βοηθήσουν στα διάφορα είδη αναλύσεων τα οποία μπορούμε να εκτελέσουμε με το πρόγραμμα. Στην συγκεκριμένη περίπτωση τσεκάρουμε τις επιλογές Minimization history, Standardized estimates, και Squared multiple correlations. Οι οποίες είναι οι πιο συνηθισμένες αλλά και απαραίτητες για κάθε είδος ανάλυσης. Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Θεωρία) Διαφάνεια 12
Εκτέλεση της ανάλυσης Για την εκτέλεση της ανάλυσης μπορείτε να κάνετε κλικ στο αντίστοιχο κουμπί εντολών ή από την μπάρα εργαλείων επιλέγοντας Analyze Calculate Estimates. Με αυτή την επιλογή το πρόγραμμα σύμφωνα με τον αλγόριθμο σύγκλησης και τις ιδιότητες της ανάλυσης που επιλέξαμε εκτελεί την ανάλυση και παρουσιάζει ορισμένα από τα αποτελέσματα στην κύρια οθόνη (μπορεί να σας ζητηθεί η αποθήκευση των αποτελεσμάτων στον σκληρό δίσκο). Μετά την εκτέλεση της ανάλυσης η εμφάνιση του περιβάλλοντος εργασίας έχει τροποποιηθεί. Στην αρχή της γκρι ζώνη έχει ενεργοποιηθεί και το δεύτερο εικονίδιο. Τα δύο αυτά εικονίδια εναλλάσσουν την κατάσταση του περιβάλλοντος εργασίας μεταξύ σχεδιασμού και αποτελεσμάτων. Επίσης έχει ενεργοποιηθεί και η επιλογή μεταξύ των τυποποιημένων υπολογισμών και των μη τυποποιημένων υπολογισμών. Με αντίστοιχο κλικ στην επιλογή γίνεται η αντίστοιχη εναλλαγή Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Θεωρία) Διαφάνεια 13
Εμφάνιση αποτελεσμάτων Εκτιμήσεων Για να δείτε τα αποτελέσματα μπορείτε να κάνετε κλικ στο αντίστοιχο κουμπί εντολών ή από την μπάρα μενού επιλέγοντας View Text Output. Η ενέργεια αυτή ενεργοποιεί ένα νέο παράθυρο στο οποίο εμφανίζονται αναλυτικά και ομαδοποιημένα τα αποτελέσματα σε δενδρική μορφή (για τις εκδόσεις μεγαλύτερες της 5). Η πρώτη κατηγορία που μας ενδιαφέρει είναι οι διάφορες εκτιμήσεις (estimates) Variance Estimate S.E. C.R. P Label educatn,027,008 3,162,002 income 2,562,810 3,162,002 Other 382,736 121,032 3,162,002 Correlations Estimate educatn <--> income,485 Regression Weights: Estimate S.E. C.R. P Label sat <--- educatn 136,022 30,555 4,452 *** sat <--- income 2,156 3,125,690,490 Standardized Regression Weights Estimate sat <--- educatn,717 sat <--- income,111 Covariance Estimate S.E. C.R. P Label educatn <--> income,127,065 1,952,051 Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Θεωρία) Διαφάνεια 14
Δείκτες προσαρμοστικότητας Η επόμενη κατηγορία που μας ενδιαφέρει είναι οι δείκτες προσαρμοστικότητας (model fit) οι οποίοι όπως προαναφέρθηκε μας επιδεικνύουν την καταλληλότητα του μοντέλου Model NPAR CMIN DF P CMIN/DF Default 6,000 0 Saturated 6,000 0 Independence 3 23,861 3,000 7,954 Model RMR GFI AGFI PGFI Default,000 1,000 Saturated,000 1,000 Independence 9,448,591,181,295 Model RMSEA LO 90 HI 90 PCLOSE Independence,590,384,820,000 Model NFI Delta1 RFI rho1 IFI Delta2 TLI rho2 CFI Default 1,000 1,000 1,000 Saturated 1,000 1,000 1,000 Independence,000,000,000,000,000 Model PRATIO PNFI PCFI Default,000,000,000 Saturated,000,000,000 Independence 1,000,000,000 Model AIC BCC BIC CAIC Default 12,000 15,000 18,267 24,267 Saturated 12,000 15,000 18,267 24,267 Independence 29,861 31,361 32,995 35,995 Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Θεωρία) Διαφάνεια 15