Παραγοντική ανάλυση και SPSS Πρόχειρες σημειώσεις

Σχετικά έγγραφα
ΠΑΡΑΓΟΝΤΙΚΗ ΑΝΑΛΥΣΗ FACTOR ANALYSIS

Ιωάννης Τσαούσης, Πανεπιστήμιο Κρήτης Τμήμα Ψυχολογίας

Οδηγός Ανάλυσης Αξιοπιστίας και Εγκυρότητας Ψυχομετρικών Κλιμάκων με το SPSS

Διερεύνηση της Αξιοπιστίας και της Εγκυρότητας Ψυχομετρικής Κλίμακας με το λογισμικό SPSS

ΤΕΙ ΠΕΙΡΑΙΑ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΕΠΙΣΤΗΜΗ ΤΩΝ ΑΠΟΦΑΣΕΩΝ ΜΕ ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ

ΜΕΘΟ ΟΛΟΓΙΑ ΕΚΠΑΙ ΕΥΤΙΚΗΣ ΕΡΕΥΝΑΣ

ΑΝΑΛΥΣΗ ΣΕ ΚΥΡΙΕΣ ΣΥΝΙΣΤΩΣΕΣ Α.Κ.Σ.

ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Δρ. Βασίλης Π. Αγγελίδης Τμήμα Μηχανικών Παραγωγής & Διοίκησης Δημοκρίτειο Πανεπιστήμιο Θράκης

ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Δρ. Βασίλης Π. Αγγελίδης Τμήμα Μηχανικών Παραγωγής & Διοίκησης Δημοκρίτειο Πανεπιστήμιο Θράκης

ΜΕΘΟΔΟΙ ΕΡΥΕΝΑΣ ΔΙΑΛΕΞΗ 5: ΠΑΡΑΓΟΝΤΙΚΗ ΑΝΑΛΥΣΗ

ΠΑΡΑΓΟΝΤΙΚΗ ΑΝΑΛΥΣΗ ΣΕ ΔΕΔΟΜΕΝΑ ΑΠΟ ΕΡΕΥΝΑ ΑΓΟΡΑΣ

ΠΕΡΙΕΧΟΜΕΝΑ 1 ΕΙΣΑΓΩΓΗ ΤΟ PASW ΜΕ ΜΙΑ ΜΑΤΙΑ ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ: Η ΜΕΣΗ ΤΙΜΗ ΚΑΙ Η ΔΙΑΜΕΣΟΣ... 29

10. ΠΟΛΛΑΠΛΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

ΚΕΦΑΛΑΙΟ 6 ΠΑΡΑΓΟΝΤΙΚΗ ΑΝΑΛΥΣΗ ΤΩΝ ΒΑΘΜΟΛΟΓΙΩΝ ΟΙ ΣΥΝΙΣΤΩΣΕΣ ΤΗΣ ΜΑΘΗΤΙΚΗΣ ΕΠΙ ΟΣΗΣ

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

ΟΙΚΟΝΟΜΕΤΡΙΑ. Βιολέττα Δάλλα. Εθνικό και Καποδιστριακό Πανεπιστήµιο Αθηνών

Οι νέοι και το περιβάλλον: Περιβαλλοντικές στάσεις και συµπεριφορά µαθητών Λυκείων και ΤΕΕ του Ν. Ροδόπης

ΠΕΡΙΕΧΟΜΕΝΑ 1 ΕΙΣΑΓΩΓΗ ΤΟ PASW ΜΕ ΜΙΑ ΜΑΤΙΑ ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ: Η ΜΕΣΗ ΤΙΜΗ ΚΑΙ Η ΔΙΑΜΕΣΟΣ... 29

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS)

ΠΑΝΕΠΙΣΤΗΜΙΟ+ΠΑΤΡΩΝ+ Τμήμα+Διοίκησης+Επιχειρήσεων+

ΣΥΣΧΕΤΙΣΗ και ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

ΚΕΦΑΛΑΙΟ 1 ο ΒΑΣΙΚΕΣ ΤΕΧΝΙΚΕΣ ΔΕΙΓΜΑΤΟΛΗΨΙΑΣ ΚΑΙ ΑΝΑΛΥΣΗ ΕΡΩΤΗΜΑΤΟΛΟΓΙΩΝ ΜΕ ΧΡΗΣΗ ΕΛΕΓΧΩΝ (STUDENT S T).. 21

+ ε βελτιώνει ουσιαστικά το προηγούμενο (β 3 = 0;) 2. Εξετάστε ποιο από τα παρακάτω τρία μοντέλα:

Άσκηση 11. Δίνονται οι παρακάτω παρατηρήσεις:

ΓΡΑΜΜΙΚΗ ΠΑΛΙΝ ΡΟΜΗΣΗ

Τομέας Βιομηχανικής Διοίκησης και Επιχειρησιακής Έρευνας

Ερμηνεία αποτελεσμάτων Ανάλυση διακύμανσης κατά ένα παράγοντα

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ

Α.Σ.ΠΑΙ.Τ.Ε. Π.Ε.ΣΥ.Π. ΜΕΘΟΔΟΛΟΓΙΑ ΕΡΕΥΝΑΣ ΓΙΑ ΤΟΥΣ ΣΚΟΠΟΥΣ ΣΥΕΠ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΜΕ ΤΟ SPSS

Εισόδημα Κατανάλωση

Κεφάλαιο 6 Πολυμεταβλητές Μέθοδοι Ανάλυσης

Διπλωματική Εργασία: «Συγκριτική Μελέτη Μηχανισμών Εκτίμησης Ελλιπούς Πληροφορίας σε Ασύρματα Δίκτυα Αισθητήρων»

Παράδειγμα: Γούργουλης Βασίλειος, Επίκουρος Καθηγητής Τ.Ε.Φ.Α.Α. Δ.Π.Θ.

Queensland University of Technology Transport Data Analysis and Modeling Methodologies

Μέρος στατιστικής ανάλυσης (πολλά κεφάλαια λείπουν) Ανάλυση αξιοπιστίας της κλίµακας PCRS

ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ ΘΕΜΑ:ΠΑΡΑΓΟΝΤΙΚΗ ΑΝΑΛΥΣΗ ΣΕ ΣΥΝΕΧΗ ΚΑΙ ΚΑΤΗΓΟΡΙΚΑ ΔΕΔΟΜΕΝΑ ΑΛΕΞΑΝΔΡΟΣ ΣΑΒΒΟΠΟΥΛΟΣ Α.Μ:48/05

ΠΟΛΥΜΕΤΑΒΛΗΤΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ Ε ΟΜΕΝΩΝ EUROSTAT

R 28 February 2014

ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ ΜΕΘΟΔΟΙ ΠΟΛΥΜΕΤΑΒΛΗΤΗΣ ΣΤΑΤΙΣΤΙΚΗΣ ΑΝΑΛΥΣΗΣ ΚΑΙ ΕΦΑΡΜΟΓΕΣ. Ναταλία Δ. Μαύρου

Έλεγχος για τις παραμέτρους θέσης δύο πληθυσμών με εξαρτημένα δείγματα

ΔΗΜΟΚΡΙΤΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΡΑΚΗΣ Τμήμα Επιστήμης Φυσικής Αγωγής και Αθλητισμού Πρόγραμμα Διδακτορικών Σπουδών ΠΛΗΡΟΦΟΡΙΑΚΟ ΕΝΤΥΠΟ ΜΑΘΗΜΑΤΟΣ

ΕΠΙΣΤΗΜΟΝΙΚΟ ΕΠΙΜΟΡΦΩΤΙΚΟ ΣΕΜΙΝΑΡΙΟ «ΚΑΤΑΡΤΙΣΗ ΕΡΩΤΗΜΑΤΟΛΟΓΙΟΥ ΚΑΙ ΣΤΑΤΙΣΤΙΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΔΕΔΟΜΕΝΩΝ» Τριανταφυλλίδου Ιωάννα Μαθηματικός

ΤΗΛΕΠΙΣΚΟΠΗΣΗ. Γραµµικοί Μετασχηµατισµοί (Linear Transformations) Τονισµός χαρακτηριστικών εικόνας (image enhancement)

ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Δρ. Βασίλης Π. Αγγελίδης Τμήμα Μηχανικών Παραγωγής & Διοίκησης Δημοκρίτειο Πανεπιστήμιο Θράκης

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

ΜΑΘΗΜΑ 3ο. Υποδείγματα μιας εξίσωσης

ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Τραπεζικής & Χρηματοοικονομικής

Περιγραφική Ανάλυση ποσοτικών μεταβλητών

Ερωτήσεις κατανόησης στην Οικονομετρία (Με έντονα μαύρα γράμματα είναι οι σωστές απαντήσεις)

SCHOOL OF MATHEMATICAL SCIENCES G11LMA Linear Mathematics Examination Solutions

Statistics 104: Quantitative Methods for Economics Formula and Theorem Review

1. Θα χρησιμοποιηθεί το αρχείο Ο γονικός έλεγχος στην εφηβική ηλικία. Στο. i. Με ποιες μεταβλητές που αφορούν σε σχέσεις εφήβων με τους γονείς τους

Phys460.nb Solution for the t-dependent Schrodinger s equation How did we find the solution? (not required)

Έλεγχος ανεξαρτησίας μεταξύ δύο ποιοτικών μεταβλητών (Crosstabs - Chi-Square Tests)

Πίσω στα βασικά, μέρος 3 ο Βασικές αρχές στατιστικής για κοινωνιολογικές έρευνες: Συσχέτιση μεταβλητών

Στατιστική και Θεωρία Πιθανοτήτων (ΓΓ04) ΑΝΤΩΝΙΟΣ ΧΡ. ΜΠΟΥΡΑΣ Εαρινό Εξάμηνο

(p 1) (p m) (m 1) (p 1)

Τίτλος Μαθήματος: Στατιστική Ανάλυση Δεδομένων

Μεθοδολογία της Έρευνας και Εφαρμοσμένη Στατιστική

Στατιστική Ι (ΨΥΧ-1202) Διάλεξη 6 Σχέσεις μεταξύ μεταβλητών

Μεθοδολογία των επιστημών του Ανθρώπου: Στατιστική Ι

Παράδειγμα: Γούργουλης Βασίλειος, Επίκουρος Καθηγητής Τ.Ε.Φ.Α.Α.-Δ.Π.Θ.

ΚΥΠΡΙΑΚΗ ΕΤΑΙΡΕΙΑ ΠΛΗΡΟΦΟΡΙΚΗΣ CYPRUS COMPUTER SOCIETY ΠΑΓΚΥΠΡΙΟΣ ΜΑΘΗΤΙΚΟΣ ΔΙΑΓΩΝΙΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ 19/5/2007

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

Reliability analysis Ανάλυση αξιοπιστίας

Κώστας Ζαφειρόπουλος. Τμήμα Διεθνών και Ευρωπαϊκών Σπουδών Πανεπιστήμιο Μακεδονίας

Περιεχόμενα. Πρόλογος... 15

χ 2 test ανεξαρτησίας

Exercises 10. Find a fundamental matrix of the given system of equations. Also find the fundamental matrix Φ(t) satisfying Φ(0) = I. 1.

Ενότητα 4 η : Ανάλυση ερευνητικών δεδομένων. Δημήτριος Σταμοβλάσης Φιλοσοφίας Παιδαγωγικής ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

Μονάδα Διασφάλισης Ποιότητας Εθνικού & Καποδιστριακού Πανεπιστημίου Αθηνών

Επαγωγική Στατιστική. Εισαγωγή Βασικές έννοιες

Παράδειγμα: Γούργουλης Βασίλειος, Επίκουρος Καθηγητής Τ.Ε.Φ.Α.Α.-Δ.Π.Θ.

ΤΣΑΛΤΑ ΜΑΡΙΑ Α.Μ: 1946 ΠΑΥΛΕΛΛΗ ΛΟΥΙΖΑ Α.Μ: 2342 ΤΣΑΪΛΑΚΗ ΦΑΝΗ Α.Μ: Οικονομετρικά. Εργαστήριο 15/05/11

Συνάφεια μεταξύ ποιοτικών μεταβλητών. Εκδ. #3,

ΒΙΟΣΤΑΤΙΣΤΙΚΗ Πρακτική με SPSS (1)

Απλή Γραμμική Παλινδρόμηση II

HMY 795: Αναγνώριση Προτύπων

Πολλαπλή παλινδρόμηση (Multivariate regression)

ΑΚΑΔΗΜΙΑ ΤΩΝ ΠΟΛΙΤΩΝ

Εισαγωγή στην Ανάλυση Δεδομένων

Μερικά Ερευνητικά Αποτελέσματα από τη Χρήση των Τ.Π.Ε. στη Διδασκαλία των Μαθηματικών στο Γυμνάσιο και στο Λύκειο

ΤΜΗΜΑ ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥ ΣΧΕΔΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ. ΟΙΚΟΝΟΜΕΤΡΙΚΑ ΠΡΟΤΥΠΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ 1 ο ΕΡΓΑΣΤΗΡΙΟΥ ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΣΤΑΤΙΣΤΙΚΗΣ

ΚΥΠΡΙΑΚΗ ΕΤΑΙΡΕΙΑ ΠΛΗΡΟΦΟΡΙΚΗΣ CYPRUS COMPUTER SOCIETY ΠΑΓΚΥΠΡΙΟΣ ΜΑΘΗΤΙΚΟΣ ΔΙΑΓΩΝΙΣΜΟΣ ΠΛΗΡΟΦΟΡΙΚΗΣ 24/3/2007

Πρόλογος... xv. Κεφάλαιο 1. Εισαγωγικές Έννοιες... 1

Μενύχτα, Πιπερίγκου, Σαββάτης. ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 5 ο

Δρ Κορρές Κωνσταντίνος

Αναπλ. Καθηγήτρια, Ελένη Κανδηλώρου. Αθήνα Σημειώσεις. Εκτίμηση των Παραμέτρων β 0 & β 1. Απλό γραμμικό υπόδειγμα: (1)

ΜΟΝΟΠΑΡΑΜΕΤΡΙΚΗ ΚΑΙ ΠΟΛΥΠΑΡΑΜΕΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ

Εισαγωγή στην ανάλυση μεταβλητών με το IBM SPSS Statistics

2. ΧΡΗΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΠΑΚΕΤΩΝ ΣΤΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

ΠΟΣΟΤΙΚΕΣ ΜΕΘΟΔΟΙ ΙI (ΣΤΑΤΙΣΤΙΚΗ ΓΙΑ ΤΗ ΔΙΟΙΚΗΣΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ) (ΟΔΕ 2116)

Μαντζούνη, Πιπερίγκου, Χατζή. ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 5 ο

ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Δρ. Βασίλης Π. Αγγελίδης Τμήμα Μηχανικών Παραγωγής & Διοίκησης Δημοκρίτειο Πανεπιστήμιο Θράκης

DEMOCRITUS UNIVERISTY OF THRACE Dept. of Physical Education and Sport Sciences Doctoral Program of Study COURSE OUTLINE

ΚΕΝΤΡΟ ΣΥΝΕΧΙΖΟΜΕΝΗΣ ΕΚΠΑΙΔΕΥΣΗΣ ΚΑΙ ΕΠΙΜΟΡΦΩΣΗΣ

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

Προσοµοίωση Εξέτασης στο µάθηµα του Γεωργικού Πειραµατισµού

ΟΙΚΟΝΟΜΕΤΡΙΑ Κεφάλαιο 2

Transcript:

Παραγοντική ανάλυση και SPSS Πρόχειρες σημειώσεις ΣΤΟΧΟΣ ΠΑΡΑΓΟΝΤΙΚΗΣ ΑΝΑΛΥΣΗΣ Η εύρεση της ύπαρξης κοινών παραγόντων ανάμεσα σε μία ομάδα μεταβλητών. Τι επιτυγχάνεται? 1.Μείωση της διάστασης του προβλήματος. 2.Εξήγηση των συσχετίσεων που υπάρχουν στα δεδομένα. 3.Δημιουργία νέων μεταβλητών που ίσως ερμηνεύουν μη μετρήσιμες έννοιες!!! 4.Δημιουργία ενός συνόλου παραγόντων για να χρησιμοποιηθούν ως ασυσχέτιστες μεταβλητές (διόρθωση προβλήματος πολυσυγγραμμικότητας) 5.Εξακρίβωση ή επιβεβαίωση μιας κλίμακας. Μειονεκτήματα 1. Υποθέσεις μη ρεαλιστικές και ελέγξιμες. 2. Δεν δίνει μοναδική λύση. 3. Οι παράγοντες που προκύπτουν δεν έχουν μοναδική ερμηνεία. 4. Ο αριθμός των παραγόντων δεν είναι αυστηρά μαθηματικά καθορισμένος. Είδη παραγοντικής ανάλυσης 1. Exploratory: Προσπαθεί να ανακαλύψει την ύπαρξη παραγόντων σε ένα μεγάλο σύνολο μεταβλητών. 2. Confirmatory: Προσπαθεί να ανακαλύψει αν ο αριθμός των παραγόντων καθώς και η σύνθεση τους επιβεβαιώνει τα αναμενόμενα από τη θεωρία. Βήματα παραγοντικής ανάλυσης 1. Καταλληλότητα δεδομένων και μεταβλητών Θα πρέπει να υπάρχουν ικανοποιητικές συσχετίσεις για τη διεξαγωγή παραγοντικής ανάλυσης. Αν τα δεδομένα είναι ασυσχέτιστα δεν έχει νόημα να συνεχίσουμε. Απόλυτες τιμές του συντελεστή συσχέτισης μεγαλύτερες του 0.4 είναι ικανοποιητικές. Η ορίζουσα του δειγματικού πίνακα συσχέτισης είναι μεγαλύτερη από 0.00001 Έλεγχος της υπόθεσης της σφαιρικότητας (Bartlett s test of sphericity) είτε με το στατιστικό H : 0 R= Ip, Α. Δ. ΜΠΑΤΣΙΔΗΣ 1 ΠΡΟΧΕΙΡΕΣ ΣΗΜΕΙΩΣΕΙΣ

είτε με το H 1 0 L= n ln R ~ X p p 6(2 p + 5) 2 ( 1)/2, + + L= n S s X. 2 p H (2p p 2) 0 2 2 ln ln i ~ p( p 1)/2 6 p i= 1 Εξέταση της πολυσυγγραμμικότητας. Χρησιμοποιώντας το στατιστικό των Kaiser Meyer Olkin (KMO) εξετάζεται αν τα δεδομένα μας είναι κατάλληλα για παραγοντική ανάλυση. Το στατιστικό αυτό παίρνει τιμές στο διάστημα [0,1]. Αν ΚΜΟ>0.6 συνεχίζουμε την παραγοντική ανάλυση. Κοιτούμε τον δείκτη Measure of Sampling Adequacy για να αποφανθούμε αν μία μεταβλητή είναι κατάλληλη για να χρησιμοποιηθεί στην ανάλυση. Τιμές μεγαλύτερες του 0.5 μας υποδεικνύουν την καταλληλότητα. 2. Καθορισμός ή υπολογισμός του αριθμού των παραγόντων Kaiser criterion: ο αριθμός των παραγόντων είναι ίσος με τον αριθμό των ιδιοτιμών του πίνακα συσχέτισης που είναι μεγαλύτερες από τη μονάδα. Scree plot test: ο αριθμός των παραγόντων προσδιορίζεται από το γράφημα των ιδιοτιμών του πίνακα συσχέτισης σε φθίνουσα σειρά. Είναι ίσος με το πλήθος των ιδιοτιμών πριν την τελευταία σημαντική πτώση του μεγέθους της ιδιοτιμής. (καλό για n>200) 3. Εκτίμηση των παραγόντων Μεθοδολογίες εκτίμησης τ ων παραγόντων Principal component analysis (προτείνεται) Η πιο ευρέως χρησιμοποιούμενη μέθοδος. Αναζητεί το γραμμικό συνδυασμό των μεταβλητών έτσι ώστε να επεξηγείται από τους παράγοντες η μέγιστη μεταβλητότητα των μεταβλητών. Maximum likelihood factoring προϋποθέτει την ύπαρξη πολυδιάστατης κανονικής κατανομής. Ίσως οδηγεί σε πολλούς παράγοντες άλλα όχι περισσότερους από το ακέραιο μέρος του p /2, δηλαδή από [p/2]. Principal axis factoring παραλλαγή της PCA. Χρησιμοποιείται όταν ο πίνακας συσχέτισης είναι ιδιάζων. Image factoring χρησιμοποιείται κυρίως στη θεωρία εικόνας. Α. Δ. ΜΠΑΤΣΙΔΗΣ 2 ΠΡΟΧΕΙΡΕΣ ΣΗΜΕΙΩΣΕΙΣ

Alpha factoring προσπαθεί να μεγιστοποιήσει την αξιοπιστία (δηλαδή το alpha του Cronbach, βλέπε Ανάλυση Αξιοπιστίας, Reliability Analysis) Unweighted least squares factoring ελαχιστοποιεί το άθροισμα τετραγώνων μεταξύ παρατηρούμενων και εκτιμώμενων πινάκων συσχέτισης. Generalizes least squares factoring: παραλλαγή της προηγούμενης. 4. Περιστροφή Χρησιμοποιείται για να γίνουν τα αποτελέσματά μας πιο ερμηνεύσιμα. Ελπίζουμε ότι οι επιβαρύνσεις κάποιων παραγόντων θα είναι μεγάλες σε απόλυτη κλίμακα μόνο για κάποιες μεταβλητές και έτσι βλέποντας ποιες μεταβλητές εξαρτώνται με ποιους παράγοντες μπορούμε να τους ερμηνεύσουμε. Μέθοδοι περιστροφής Varimax: ελαχιστοποιεί αριθμό μεταβλητών που έχουν μεγάλες επιβαρύνσεις για κάθε παράγοντα. Quartimax: ελαχιστοποιεί αριθμό παραγόντων που εξηγούν μία μεταβλητή Equimax: συνδυασμός των άνω Direct oblimin rotation και Promax οι οποίες δίνουν συσχετισμένους παράγοντες. 5. Ερμηνεία αποτελεσμάτων Ας δούμε πως υλοποιούνται όλα τα παραπάνω μέσω του ακόλουθου παραδείγματος Παράδειγμα Στο αρχείο SAQ.sav καταγράφονται οι απαντήσεις σε 23 πιθανές ερωτήσεις για το άγχος των φοιτητών για το SPSS. Το ενδιαφέρον αρχικά επικεντρώνεται στην εύρεση πιθανών παραγόντων αιτιολόγησης του άγχους. (Παράδειγμα Andy Field (2000)). Από το κεντρικό παράθυρο διαλόγου του Data View επιλέγουμε Analyze Data Reduction Factor. Στο νέο παράθυρο διαλόγου που προκύπτει: Α. Δ. ΜΠΑΤΣΙΔΗΣ 3 ΠΡΟΧΕΙΡΕΣ ΣΗΜΕΙΩΣΕΙΣ

στο πεδίο Variables εισάγουμε τις μεταβλητές για τις οποίες θέλουμε να εξετάσουμε την ύπαρξη κοινών παραγόντων. Επομένως έχουμε: Στο πλαίσιο Selection Variable υπεισέρχεται η μεταβλητή εκείνη ως προς καθορισμένη τιμή της οποίας (υπεισέρχεται στο πεδίο Value) θέλουμε να διεξαχθεί η παραγοντική ανάλυση. Από το πλαίσιο Descriptives έχουμε τις ακόλουθες επιλογές: Α. Δ. ΜΠΑΤΣΙΔΗΣ 4 ΠΡΟΧΕΙΡΕΣ ΣΗΜΕΙΩΣΕΙΣ

Univariate descriptives: μέση τιμή, τυπική απόκλιση και πλήθος πειραματικών μονάδων για κάθε μεταβλητή. Initial solution μας δίνονται οι αρχικές ιδιοτιμές και το ποσοστό της μεταβλητότητας που εξηγείται. Coefficients: ο πίνακας συσχέτισης (σχόλιο: επιθυμητό είναι οι απόλυτες τιμές των συντελεστών συσχέτισης να είναι μεγαλύτερες του 0.3). Significance level: δίνονται οι p-τιμές για τον έλεγχο της υπόθεσης ότι ο πληθυσμιακός συντελεστής συσχέτισης κάθε ζεύγους μεταβλητών (σχόλιο: υπενθυμίζεται ότι θέλουμε οι μεταβλητές να είναι συσχετισμένες). Determinant: η ορίζουσα του πίνακα συσχέτισης. Πρέπει να είναι μεγαλύτερη από 0.00001. Inverse ο αντίστροφος του πίνακα συσχέτισης Reproduced: ο εκτιμώμενος πίνακας συσχέτισης. Δίνονται και τα υπόλοιπα. Θα πρέπει να έχουν απόλυτες τιμές μικρότερες του 0.05 Anti-image: δίνονται οι συντελεστές μερικής συσχέτισης με αλλαγμένα πρόσημα στα μη διαγώνια στοιχεία, ενώ στα διαγώνια δίνεται ο δείκτης MSA (θέλουμε τιμές μεγαλύτερες του 0.5) ΚΜΟ and Bartlett test of sphericity. Η υπόθεση της σφαιρικότητας θα πρέπει να απορρίπτεται (p-τιμή του Bartlett test of sphericity<0.05) και ο δείκτης KMO θα πρέπει να είναι μεγαλύτερος από 0.6. Ενδεικτικά επιλέγουμε τα ακόλουθα: Α. Δ. ΜΠΑΤΣΙΔΗΣ 5 ΠΡΟΧΕΙΡΕΣ ΣΗΜΕΙΩΣΕΙΣ

Από το πλαίσιο Extraction έχουμε τη δυνατότητα να καθορίσουμε τη μέθοδο εκτίμησης των παραγόντων (Principal components), το αν θα χρησιμοποιηθεί ο πίνακας συσχετίσεων ή ο συνδιακυμάνσεων (Correlation ή Covariance matrix), από το πεδίο Unrotated factor solution μας δίνεται η λύση της παραγοντικής ανάλυσης πριν την περιστροφή. Επιλέγοντας το πλαίσιο Scree plot προκύπτει το γράφημα των ιδιοτιμών του πίνακα συσχέτισης σε φθίνουσα σειρά. Τέλος από το πεδίο Extract είτε καθορίζουμε τον αριθμό των παραγόντων (πλαίσιο Number of factors) είτε επιλέγουμε τη χρησιμοποίηση του Kaiser Criterion (Eigenvalues over 1), δηλώνοντας και τον αριθμό των επαναλήψεων μέχρι να επιτευχθεί σύγκλιση. Από το πλαίσιο Rotation επιλέγεται η μέθοδος περιστροφής (συνηθέστερα η Varimax) και δηλώνουμε το πλαίσιο Rotated Solution για να εμφανιστεί η λύση με περιστροφή στο παράθυρο των αποτελεσμάτων. Α. Δ. ΜΠΑΤΣΙΔΗΣ 6 ΠΡΟΧΕΙΡΕΣ ΣΗΜΕΙΩΣΕΙΣ

Από το πλαίσιο Scores επιλέγοντας το πεδίο Save as Variables δημιουργείται (με μία εκ των τριών διαθέσιμων μεθόδων) μία νέα μεταβλητή για κάθε παράγοντα. Οι μεταβλητές αυτές μπορούν να χρησιμοποιηθούν για την περαιτέρω έρευνα π.χ εξέταση της επίδρασης ποιοτικών μεταβλητών στα σκορ των παραγόντων. Αν είναι k το πλήθος οι παράγοντες οι νέες μεταβλητές προκύπτουν ως εξής: F = a X + a X +... + a X 1 11 1 12 2 1p F = a X + a X +... + a X 2 21 1 22 2 2k p p Fk = ap 1X11+ ap2x2 +... + apkx p Από το πεδίο Display factor score coefficient matrix: μας δίνονται οι συντελεστές με τους οποίους κάθε μεταβλητή πολλαπλασιάστηκε για τη δημιουργία των factor scores, δηλαδή οι τιμές των a, i= 1,..., p, j = 1,..., k. ij Τέλος, από το πεδίο Options καθορίζουμε τον τρόπο χειρισμού των ελλιπών τιμών, τον τρόπο εμφάνισης των συντελεστών (κατά μέγεθος, Sorted by size), και δηλώνουμε αν δεν θέλουμε να εμφανίζονται συντελεστές με απόλυτη τιμή μικρότερη από καθορισμένο Α. Δ. ΜΠΑΤΣΙΔΗΣ 7 ΠΡΟΧΕΙΡΕΣ ΣΗΜΕΙΩΣΕΙΣ

αριθμός (συνήθως επιλέγεται το 0.3 έτσι ώστε ο προσδιορισμός των παραγόντων να είναι άμεσος) Αποτελέσματα αυτών των επιλογών Στο παράθυρο των αποτελεσμάτων λόγω των παραπάνω επιλογών προκύπτει ο πίνακας Descriptive Statistics όπου για κάθε μεταβλητή που δηλώθηκε στο πλαίσιο Variables δίνεται η μέση τιμή, η τυπική απόκλιση και το πλήθος των διαθέσιμων παρατηρήσεων. Ο πίνακας Correlation matrix μας δίνει τον πίνακα συσχέτισης, τις αντίστοιχες p-τιμές του μονόπλευρου ελέγχου ότι ο πληθυσμιακός συντελεστής συσχέτισης είναι ίσος με μηδέν κάθε δυνατού ζεύγους μεταβλητών (p-τιμές<0.05 για το συντριπτικό ποσοστών των ελέγχων) και την τιμή της ορίζουσας του δειγματικού πίνακα συσχέτισης (τιμή=0.01). Από τον πίνακα KMO and Bartlett s test προκύπτει ότι τα δεδομένα είναι κατάλληλα για διεξαγωγή παραγοντικής ανάλυσης (ο δείκτης KMO=0.930>0.6, p-τιμή του Bartlett s test of sphericity<0.05). Επιπλέον όλες οι μεταβλητές μας είναι κατάλληλες για την παραγοντική ανάλυση καθώς από το πεδίο Anti-Image Matrices προκύπτει ότι ο δείκτης MSA για όλες τις υπό μελέτη μεταβλητές είναι μεγαλύτερος από 0.5 (αν υπήρχαν κάποιες με MSA<0.5 καλό θα ήταν να αποκλείονταν από τη μελέτη). Στον πίνακα Communalities μπορούμε να «δούμε» το ποσοστό της μεταβλητότητας κάθε μεταβλητής που εξηγείται από τον αριθμό των παραγόντων που προσαρμόστηκε (άρα είναι ένας αριθμός μεταξύ 0 και 1). Η πρώτη στήλη (Initial) είναι πάντοτε 1 όταν χρησιμοποιείται η μέθοδος των κύριων συνιστωσών. Έτσι για παράδειγμα παρατηρούμε ότι το προσαρμοσμένο μοντέλο ερμηνεύει μόνο το 43,5% της πρώτης ερώτησης «Statistics makes me cry». Αυτό σημαίνει ότι το προσαρμοσμένο μοντέλο δεν είναι ιδιαίτερα καλό. Α. Δ. ΜΠΑΤΣΙΔΗΣ 8 ΠΡΟΧΕΙΡΕΣ ΣΗΜΕΙΩΣΕΙΣ

Communalities Initial Extraction Statiscs makes me cry 1,000,435 My friends will think I'm stupid for not being able to cope with SPSS 1,000,414 Standard deviations excite me I dream that Pearson is attacking me with correlation coefficients 1,000,530 1,000,469 I don't understand statistics 1,000,343 I have little experience of computers 1,000,654 All computers hate me 1,000,545 I have never been good at mathematics 1,000,739 My friends are better at statistics than me 1,000,484 Computers are useful only for playing games 1,000,335 I did badly at mathematics at school 1,000,690 People try to tell you that SPSS makes statistics easier to understand but it doesn't I worry that I will cause irreparable damage because of my incompetenece with computers 1,000,513 1,000,536 Computers have minds of their own and deliberately go wrong 1,000,488 whenever I use them Computers are out to get me 1,000,378 I weep openly at the mention of central tendency 1,000,487 I slip into a coma whenever I see an equation 1,000,683 SPSS always crashes when I try to use it 1,000,597 Everybody looks at me when I use SPSS 1,000,343 I can't sleep for thoughts of eigen vectors 1,000,484 I wake up under my duvet thinking that I am trapped under a normal distribtion 1,000,550 My friends are better at SPSS than I am If I'm good at statistics my friends will think I'm a nerd 1,000,464 1,000,412 Extraction Method: Principal Component Analysis. Α. Δ. ΜΠΑΤΣΙΔΗΣ 9 ΠΡΟΧΕΙΡΕΣ ΣΗΜΕΙΩΣΕΙΣ

Ο πίνακας Total Variance Explained περιέχει στη στήλη Initial Eigenvalues τις ιδιοτιμές και το ποσοστό της διακύμανσης που κάθε ιδιοτιμή ερμηνεύει, άρα κάθε κύρια συνιστώσα. Στη στήλη Extaction Sum of Squared Loadings μας δίνεται το ποσοστό της διακύμανσης που εξηγεί κάθε παράγοντας αν χρησιμοποιηθεί ο κριτήριο του προσδιορισμού του αριθμού των παραγόντων το κριτήριο του Kaiser. Τέλος στη στήλη Rotation Sum of Squared Loadings μας δίνεται το ποσοστό της διακύμανσης που εξηγείται από τους παράγοντες μετά την περιστροφή. Επομένως έχουμε 4 παράγοντες που εξηγούν το 50,3% της συνολικής διακύμανσης. Total Variance Explained Compo nent Initial Eigenvalues Extraction Sums of Squared Loadings Rotation Sums of Squared Loadings Total % of Variance Cumulativ e % Total % of Variance Cumulative % Total % of Variance Cumulative % 1 7,290 31,696 31,696 7,290 31,696 31,696 3,730 16,219 16,219 2 1,739 7,560 39,256 1,739 7,560 39,256 3,340 14,523 30,742 3 1,317 5,725 44,981 1,317 5,725 44,981 2,553 11,099 41,841 4 1,227 5,336 50,317 1,227 5,336 50,317 1,950 8,476 50,317 5,988 4,295 54,612 6,895 3,893 58,504 7,806 3,502 62,007 8,783 3,404 65,410 9,751 3,265 68,676 10,717 3,117 71,793 11,684 2,972 74,765 12,670 2,911 77,676 13,612 2,661 80,337 14,578 2,512 82,849 15,549 2,388 85,236 16,523 2,275 87,511 17,508 2,210 89,721 18,456 1,982 91,704 19,424 1,843 93,546 20,408 1,773 95,319 21,379 1,650 96,969 22,364 1,583 98,552 23,333 1,448 100,000 Extraction Method: Principal Component Analysis. Επιπλέον μας δίνεται το Scree plot. Δεν είναι ξεκάθαρο πόσους παράγοντες θα χρησιμοποιήσουμε (3 ή 4). Α. Δ. ΜΠΑΤΣΙΔΗΣ 10 ΠΡΟΧΕΙΡΕΣ ΣΗΜΕΙΩΣΕΙΣ

Scree Plot 8 6 Eigenvalue 4 2 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Component Number 16 17 18 19 20 21 22 23 Στον πίνακα Component matrix δίνονται οι επιβαρύνσεις των παραγόντων που προκύπτουν με το μοντέλο για 4 παράγοντες. Ουσιαστικά ο πίνακας αυτός μας δίνει τις ακόλουθες πληροφορίες: X = L F + L F +... + L F 1 11 1 12 2 1k X = L F + L F +... + L F 2 21 1 22 2 2k k k X = L F + L F +... + L F p p1 1 p2 2 pk k Σχόλιο: Από τις τιμές των L,..., i1 Li k μπορούν να βρεθούν οι τιμές του πίνακα Communalities στήλη Extraction με τη σχέση k 2 L ij, i 1,..., j= 1 = p. Ο πίνακας Rotated Component Matrix περιέχει τις επιβαρύνσεις των παραγόντων μετά την περιστροφή. Από τον πίνακα αυτό μπορούμε να «ερμηνεύσουμε» τους παράγοντες. Α. Δ. ΜΠΑΤΣΙΔΗΣ 11 ΠΡΟΧΕΙΡΕΣ ΣΗΜΕΙΩΣΕΙΣ

Rotated Component Matrix(a) Component 1 2 3 4 I have little experience of computers,800 SPSS always crashes when I try to use it,684,327 I worry that I will cause irreparable damage because of my incompetenece with computers,647 All computers hate me,638,327 Computers have minds of their own and deliberately go wrong whenever I use them Computers are useful only for playing games,550,579,360 Computers are out to get me,459 I can't sleep for thoughts of eigen vectors,677 I wake up under my duvet thinking that I am trapped under a normal distribtion Standard deviations excite me People try to tell you that SPSS makes statistics easier to understand but it doesn't I dream that Pearson is attacking me with correlation coefficients I weep openly at the mention of central tendency,661 -,567,368,473,523,320,516,314,334,514,313 Statiscs makes me cry,496,356 I don't understand statistics,319,429 I have never been good at mathematics,833 I slip into a coma whenever I see an equation,747 I did badly at mathematics at school,747 My friends are better at statistics than me,648 My friends are better at SPSS than I am,645 If I'm good at statistics my friends will think I'm a nerd,586 My friends will think I'm stupid for not being able to cope with SPSS -,338,543 Everybody looks at me when I use SPSS -,372,428 Extraction Method: Principal Component Analysis. Rotation Method: Varimax with Kaiser Normalization. a Rotation converged in 8 iterations. Α. Δ. ΜΠΑΤΣΙΔΗΣ 12 ΠΡΟΧΕΙΡΕΣ ΣΗΜΕΙΩΣΕΙΣ

Παρατηρούμε ότι υπάρχουν μεταβλητές που «φορτίζουν» σε περισσότερους από έναν παράγοντες. Συνηθέστερα στις κοινωνικές επιστήμες αυτές αποκλείονται και η παραγοντική ανάλυση διεξάγεται από την αρχή. Αν θέλαμε να δώσουμε μία ελεύθερη ερμηνεία στους 4 παράγοντες που προέκυψαν θα λέγαμε ότι ο πρώτος περιγράφει το άγχος για τη χρήση των υπολογιστών, ο δεύτερος για τη Στατιστική, ο τρίτος για τα μαθηματικά και ο τέταρτος για τις αντιδράσεις των υπολοίπων. Τέλος στον πίνακα Component Transformation Matrix δίνεται ο πίνακας με τον οποίο πολλαπλασιάσαμε τον αρχικό πίνακα επιβαρύνσεων (Component Matrix) για να οδηγηθούμε στον τελικό πίνακα επιβαρύνσεων (Rotated Component matrix). Επομένως, Rotated Component matrix=component Matrix * Component Transformation Matrix Component Transformation Matrix Component 1 2 3 4 1,635,585,443 -,242 2,137 -,167,488,846 3,758 -,513 -,403,008 4,067,605 -,635,476 Extraction Method: Principal Component Analysis. Rotation Method: Varimax with Kaiser Normalization. Ενδεικτική Βιβλιογραφία Field, A. P. (2000). Factor Analysis Using SPSS http://www.sussex.ac.uk/psychology/profile9846.html Coakes, S. and Steed, L ( 1999). SPSS Analysis without Anguish. Wiley. Καρλής, Δ. (2005). Πολυμεταβλητή Στατιστική Ανάλυση. Εκδόσεις Σταμούλη. Α. Δ. ΜΠΑΤΣΙΔΗΣ 13 ΠΡΟΧΕΙΡΕΣ ΣΗΜΕΙΩΣΕΙΣ