ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Δρ. Βασίλης Π. Αγγελίδης Τμήμα Μηχανικών Παραγωγής & Διοίκησης Δημοκρίτειο Πανεπιστήμιο Θράκης

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Δρ. Βασίλης Π. Αγγελίδης Τμήμα Μηχανικών Παραγωγής & Διοίκησης Δημοκρίτειο Πανεπιστήμιο Θράκης"

Transcript

1 ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ Δρ. Βασίλης Π. Αγγελίδης Τμήμα Μηχανικών Παραγωγής & Διοίκησης Δημοκρίτειο Πανεπιστήμιο Θράκης

2 ΠΑΡΑΓΟΝΤΙΚΗ ΑΝΑΛΥΣΗ Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 2

3 Περιεχόμενα Εισαγωγή Ορθογώνιο μοντέλο Υποθέσεις του Ορθογώνιου Μοντέλου Έλεγχος Συσχετίσεων Μερικός συντελεστής συσχέτισης Μέτρα μερικών συντελεστών συσχέτισης Αριθμός και Εκτίμηση των Παραγόντων Μέθοδοι εκτίμησης παραγόντων Περιστροφή Υπολογισμός των σκορ των παραγόντων Οδηγίες εκτέλεσης παραγοντικής ανάλυσης με την χρήση του SPSS Παράδειγμα με την χρήση του SPSS ανάλυση - ερμηνεία Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 3

4 Εισαγωγή Η παραγοντική ανάλυση έχει σκοπό να βρει την ύπαρξη κοινών παραγόντων ανάμεσα σε μια ομάδα μεταβλητών. Έτσι, εκφράζοντας αυτούς τους παράγοντες (οι οποίοι δεν είναι μια υπαρκτή ποσότητα αλλά την κατασκευάζουμε για τις ανάγκες μας) μπορούμε: Να μειώσουμε τις διαστάσεις του προβλήματος. Αντί να δουλεύουμε με τις αρχικές μεταβλητές να δουλέψουμε με λιγότερες αφού οι παράγοντες είναι έτσι κατασκευασμένοι ώστε να διατηρούν όσο γίνεται την πληροφορία που υπήρχε στις αρχικές μεταβλητές. Να δημιουργήσουμε νέες μεταβλητές, τους παράγοντες, στις οποίες μπορούμε με έναν υποκειμενικό τρόπο να αναγνωρίσουμε ως κάποιες μη μετρήσιμες μεταβλητές όπως π.χ. η ευφυΐα στην ψυχολογία ή η ελκυστικότητα ενός προϊόντος στο Μάρκετινγκ. Να εξηγήσουμε τις συσχετίσεις που υπάρχουν στα δεδομένα, για τις οποίες έχουμε υποθέσει ότι οφείλονται αποκλειστικά στην ύπαρξη κάποιων κοινών παραγόντων που δημιούργησαν τα δεδομένα. Προσοχή: η παραγοντική ανάλυση προσπαθεί περισσότερο να ερμηνεύσει τη δομή παρά τη μεταβλητότητα. Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 4

5 Ορθογώνιο μοντέλο Στο ορθογώνιο μοντέλο της παραγοντικής ανάλυσης, το οποίο είναι και το πιο διαδεδομένο, υποθέτουμε πως οι όποιες συσχετίσεις μεταξύ των μεταβλητών οφείλονται αποκλειστικά στην ύπαρξη κάποιων κοινών παραγόντων τους οποίους δεν ξέρουμε και θέλουμε να εκτιμήσουμε. Έτσι υποθέτουμε πως οι p μεταβλητές μας μπορούν να γραφτούν ως γραμμικός συνδυασμός των k παραγόντων, δηλαδή X-μ = LF + ε όπου Χ είναι το διάνυσμα των αρχικών μεταβλητών μεγέθους p x 1 μ είναι το διάνυσμα των μέσων μεγέθους p x 1, L είναι ένας πίνακας p x k όπου το Lij είναι η επιβάρυνση (loading) του παράγοντα Fj στη μεταβλητή Xi, F είναι ένας k x 1 πίνακας με τους παράγοντες και ε είναι το σφάλμα ή μοναδικός παράγοντας. Το σφάλμα εi είναι ο μοναδικός παράγοντας της i μεταβλητής και είναι το μέρος της μεταβλητής το οποίο δεν μπορεί να εξηγηθεί από τους παράγοντες. Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 5

6 Υποθέσεις του Ορθογώνιου Μοντέλου Ένα πολύ βασικό κομμάτι του παραγοντικού μοντέλου είναι οι υποθέσεις που πρέπει να γίνουν. Αυτές είναι: 1. Ε(F)=0 2. Cov (F) = I 3. Ε(ε)=0 4. Cov (ε) = Ψ όπου Ψ είναι ένας διαγώνιος πίνακας της μορφής 5. Cov (εi, Fj)=0, για κάθε i j. Ψ Ψ 2 0 Δηλαδή υποθέτουμε πως οι μοναδικοί παράγοντες και οι κοινοί παράγοντες είναι ασυσχέτιστοι (υπόθεση 5). Επίσης από τις παραπάνω υποθέσεις έχουμε πως τόσο οι παράγοντες όσο και οι μοναδικοί παράγοντες είναι ασυσχέτιστοι μεταξύ τους (υποθέσεις 2 και 4) κι έχουν μηδενικές μέσες τιμές (υποθέσεις 1 και 3). 0 0 Ψ p Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 6

7 Έλεγχος Συσχετίσεων Όπως όλες οι στατιστικές μέθοδοι, έτσι και στην παραγοντική ανάλυση πρέπει να ξεκινώ εξετάζοντας περιγραφικά τα δεδομένα. Για την παραγοντική ανάλυση είναι σημαντικό να υπάρχουν συσχετίσεις ανάμεσα στις μεταβλητές καθώς αυτές τις συσχετίσεις θα προσπαθήσω να εξηγήσω. Aν τα δεδομένα είναι σχετικά ασυσχέτιστα δεν έχει νόημα να συνεχίσω αφού αυτό σημαίνει ότι δε θα βρω κοινούς παράγοντες που να μου επιτρέψουν να δουλέψω με αυτούς Συνεπώς αυτό που μας ενδιαφέρει είναι να υπάρχουν μεγάλες συσχετίσεις τουλάχιστον σε μεγάλο ποσοστό του πίνακα συσχετίσεων. Τιμές μεγαλύτερες του 0.40 σε απόλυτη τιμή είναι ευπρόσδεκτες Αν υπάρχουν κάποια ή κάποιες μεταβλητές που είναι ασυσχέτιστες με τις υπόλοιπες καλό είναι να τις αγνοήσουμε καθώς, επειδή δεν σχετίζονται με τις άλλες, θα προκύψουν από μόνες τους ως ένας ξεχωριστός παράγοντας. Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 7

8 Μερικός συντελεστής συσχέτισης Ο απλός συντελεστής συσχέτισης υπολογίζει τη συσχέτιση μεταξύ δυο μεταβλητών αγνοώντας τις υπόλοιπες. Έτσι μπορεί να εμφανίζει συσχετισμένες κάποιες μεταβλητές απλά και μόνο επειδή κάποιες άλλες έχουν μεγάλη συσχέτιση με αυτές και όταν ακυρώσουμε την επίδρασή τους οι αρχικές μεταβλητές να μην εμφανίζουν πια καμιά συσχέτιση. Είναι χρήσιμος ένας συντελεστής συσχέτισης ο οποίος θα υπολογίζει τη συσχέτιση αφού αφαιρέσει την επίδραση των υπόλοιπων μεταβλητών. Αυτός είναι ο μερικός συντελεστής συσχέτισης. Για να προχωρήσουμε σε παραγοντική ανάλυση μας ενδιαφέρει οι μερικοί συντελεστές συσχέτισης να είναι μικροί (Αν οι μεταβλητές μοιράζονται κοινούς παράγοντες θα περίμενε κανείς ότι ο μερικός συντελεστής συσχέτισης ανάμεσα σε δύο μεταβλητές, όταν ακυρωθεί η επίδραση όλων των υπολοίπων μεταβλητών, θα είναι μικρή, αφού η ακύρωση της επίδρασης των υπολοίπων μεταβλητών ακυρώνει σε μεγάλο βαθμό την επίδραση των κοινών παραγόντων) Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 8

9 Μέτρα μερικών συντελεστών συσχέτισης Ένα μέτρο για να συγκρίνουμε το σχετικό μέγεθος των συντελεστών συσχέτισης σχετικά με τους μερικούς συντελεστές συσχέτισης είναι το Kaiser-Meyer-Olkin. Αν η τιμή του ΚΜΟ είναι μεγάλη τότε τα δεδομένα μας είναι κατάλληλα για παραγοντική ανάλυση. Τιμές κάτω από 0.5 είναι πολύ κακές τιμές. Στην πράξη τιμές γύρω στο 0.8 θεωρούνται αρκετά καλές για να προχωρήσουμε. Μικρότερες τιμές αποτελούν ένδειξη ότι η παραγοντική ανάλυση δεν θα μας δώσει ικανοποιητικά αποτελέσματα. Ένα άλλο μέτρο που μας επιτρέπει να εξετάσουμε μια-μια τις μεταβλητές και το κατά πόσο είναι κατάλληλες για να χρησιμοποιηθούν στην ανάλυση είναι το μέτρο της δειγματικής καταλληλότητας (measure of sampling adequacy. Τιμές κοντά στο 1 είναι ενδείξεις ότι η μεταβλητή είναι πολύ καλή για να χρησιμοποιηθεί στην ανάλυση. Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 9

10 Αριθμός και Εκτίμηση των Παραγόντων Ένα από τα βασικά ερωτήματα στην Παραγοντική Ανάλυση είναι ο καθορισμός του αριθμού των παραγόντων που θα χρησιμοποιήσουμε Για να βρεθεί ο αριθμός λοιπόν των παραγόντων ο ερευνητής μπορεί να χρησιμοποιήσει παρόμοιες τεχνικές με αυτές της ανάλυση σε κύριες συνιστώσες. Δηλαδή, τις τιμές των ιδιοτιμών του πίνακα διακύμανσης συνδιακύμανσης, τιμές που εξηγούν κάποιο ποσοστό της διακύμανσης ή το scree plot (το γράφημα των ιδιοτιμών ως προς τον αύξοντα αριθμό τους). Ο αριθμός των παραγόντων χρειάζεται να καθοριστεί πριν γίνει η εκτίμηση τους. Επομένως κάποιος θα μπορούσε να δουλέψει με διαδοχικά αυξανόμενο αριθμό παραγόντων και να κρατήσει το μοντέλο με βάση κάποιο κριτήριο καλής προσαρμοστικότητας. Τέτοια κριτήρια είναι: Από τον πίνακα των επιβαρύνσεων μπορεί κάποιος να εκτιμήσει τον πίνακα Σ. Οι αποκλίσεις του πραγματικού πίνακα με τον εκτιμημένο (συνήθως ονομάζεται reproduced matrix) θα πρέπει να είναι μικρές. Δυστυχώς δεν υπάρχει ένα κριτήριο του πόσο μικρές. Έλεγχος λόγου πιθανοφανειών αν οι εκτιμήσεις έχουν γίνει με τη μέθοδο μεγίστης πιθανοφάνειας. Τέτοιοι έλεγχοι στηρίζονται σε υποθέσεις για την κατανομή του πληθυσμού. Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 10

11 Μέθοδοι εκτίμησης παραγόντων Οι δύο βασικές μέθοδοι εκτίμησης που χρησιμοποιούνται στην πράξη είναι η μέθοδος των κυρίων συνιστωσών και η μέθοδος μεγίστης πιθανοφάνειας. Συγκριτικά έχουμε: Με τη μέθοδο των κυρίων συνιστωσών, προσθέτοντας παράγοντες δεν αλλάζουν οι επιβαρύνσεις των παραγόντων που είχαμε πάρει πριν. Αυτό δεν ισχύει με τη μέθοδο μεγίστης πιθανοφάνειας όπου προσθέτοντας παράγοντες αλλάζουν οι επιβαρύνσεις των προηγούμενων παραγόντων και άρα η ερμηνεία τους. Η μέθοδος των κυρίων συνιστωσών εξαρτάται από τις μονάδες μέτρησης κι έτσι αν αλλάξουν μπορεί να αλλάξει ριζικά η λύση που έχουμε πάρει. Αυτό δεν ισχύει με τη μέθοδο μεγίστης πιθανοφάνειας που είναι ανεξάρτητη των μονάδων μέτρησης (Έτσι ενώ στη μέθοδο κυρίων συνιστωσών πρέπει να διαλέξω ανάμεσα στον πίνακα διακύμανσης και τον πίνακα συσχέτισης στη μέθοδο μεγίστης πιθανοφάνειας δεν έχω τέτοιο πρόβλημα). Η μέθοδος των κυρίων συνιστωσών δεν βάζει περιορισμούς στον αριθμό των παραγόντων που μπορούμε να εκτιμήσουμε. Όταν η μέθοδος μεγίστης πιθανοφάνειας δεν δουλεύει αυτό είναι μια ένδειξη ότι υπάρχει πρόβλημα με το μοντέλο. Αντίθετα η μέθοδος κυρίων συνιστωσών επειδή είναι στην ουσία ένας μαθηματικός μετασχηματισμός των δεδομένων δουλεύει πάντα χωρίς όμως να μας δίνει κάποια ένδειξη αν καλώς δουλεύει ή όχι. Με τη μέθοδο μεγίστης πιθανοφάνειας τα σκορ των παραγόντων δεν μπορούν να υπολογιστούν ακριβώς όπως συμβαίνει με τη μέθοδο κυρίων συνιστωσών. Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 11

12 Περιστροφή Με την περιστροφή των παραγόντων προσπαθώ να κάνω τους παράγοντες πιο ερμηνεύσιμους. Με την περιστροφή δεν αλλάζουν κάποια από τα χαρακτηριστικά του μοντέλου όπως η καλή του προσαρμοστικότητα και το ποσό της διακύμανσης συνδιακύμανσης που ερμηνεύει το μοντέλο παρά μόνο οι τιμές των επιβαρύνσεων. Οι βασικές μέθοδοι περιστροφής είναι: Varimax: Προσπαθεί να ελαχιστοποιήσει τον αριθμό των μεταβλητών που έχουν μεγάλες επιβαρύνσεις για κάθε παράγοντα Quartimax: Προσπαθεί να ελαχιστοποιήσει τον αριθμό των παραγόντων που εξηγούν μια μεταβλητή Equimax: Συνδυασμός των varimax και quartimax Oblique: Μη ορθογώνια περιστροφή, οι άξονες που προκύπτουν δεν είναι πια ορθογώνιοι (και άρα οι παράγοντες δεν είναι ανεξάρτητοι). Η ερμηνεία των αποτελεσμάτων είναι πιο δύσκολη. Στην πράξη τον χρησιμοποιούμε όταν δεν θέλουμε οι παράγοντες που προκύπτουν να είναι ασυσχέτιστοι. Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 12

13 Υπολογισμός των σκορ των παραγόντων ένας από του σκοπούς της παραγοντικής ανάλυσης είναι να μειώσει τον αριθμό των μεταβλητών. Για να επιτευχθεί αυτό μπορούμε να δημιουργήσουμε καινούριες μεταβλητές, τους παράγοντες, ως γραμμικούς συνδυασμούς των αρχικών μεταβλητών έτσι ώστε ξεκινώντας από έστω 10 αρχικές μεταβλητές να μας μείνουν έστω 4 νέες, οι κοινοί παράγοντες. Κάθε παράγοντας μπορεί να γραφτεί στη μορφή F F F k a a a k1 X X X a 12 a a 22 k 2 X X 2 X 2... a 2 1p... a... a 2 p kp X X p X p p Οι συντελεστές α ij είναι το σκορ της μεταβλητής Χj στον παράγοντα Fi και δεν πρέπει να συγχέονται με τις επιβαρύνσεις. Σημειώστε ότι εξ ορισμού οι νέες μεταβλητές θα έχουν μέση τιμή 0 και θα είναι ασυσχέτιστες, δεδομένου πως το μοντέλο είναι ορθογώνιο. Έχοντας λοιπόν εκτιμήσει ένα παραγοντικό μοντέλο και έστω L και Ψ οι εκτιμήσεις μας για τις παραμέτρους αυτού, (πριν η μετά την περιστροφή) τότε μπορούμε να βρούμε τα factor scores δηλαδή τις τιμές των καινούριων μεταβλητών για κάθε μεταβλητή. Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 13

14 Ανακεφαλαίωση Η παραγοντική ανάλυση ερευνά τη συσχέτιση μεταξύ μεγάλου αριθμού αλληλοσυνδεόμενων μεταβλητών δια μέσου της ομαδοποίησης αυτών σε παράγοντες. Οι βασικές προϋποθέσεις για τη χρησιμοποίηση της παραγοντικής ανάλυσης είναι οι επόμενες: Οι μεταβλητές πρέπει να είναι ποσοτικές. Μπορεί επίσης να είναι μεταβλητές οι οποίες εκφράζουν το βαθμό ικανοποίησης ή επιθυμίας αρκεί να υπάρχει μία αριθμητική κλίμακα όπου οι χαμηλές τιμές εκφράζουν μικρό βαθμό ικανοποίησης ή επιθυμίας και οι υψηλές τιμές μεγάλο βαθμό ικανοποίησης ή επιθυμίας (μπορεί να συμβαίνει και το αντίθετο). Το μέγεθος του δείγματος να μην είναι μικρότερο των 50 ατόμων και κατά προτίμηση να είναι μεγαλύτερο των 100 ατόμων. Πολλοί ερευνητές προτείνουν ένα ελάχιστο αριθμό 20 ατόμων για κάθε μεταβλητή, ενώ η πλέον αποδεκτή αναλογία είναι 10 άτομα για κάθε μεταβλητή. Τα δεδομένα πρέπει να ακολουθούν τη διμεταβλητή κανονική κατανομή για κάθε ζεύγος μεταβλητών και Οι παρατηρήσεις να είναι ανεξάρτητες. Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 14

15 Παράδειγμα Το παράδειγμα με το οποίο θα δουλέψουμε αφορά 406 αυτοκίνητα και τα χαρακτηριστικά τους συμπεριλαμβανομένων τεχνικών χαρακτηριστικών αλλά και ήπειρο προέλευσης. Τα δεδομένα αυτά έχουν χρησιμοποιηθεί από την Αμερικάνικη Στατιστική Ένωση (American Statistical Association) σαν δεδομένα σύγκρισης διαφόρων στατιστικών πακέτων και επομένως μπορείτε να το βρείτε στο SPSS (αρχείο cars) Σκοπός λοιπόν της ανάλυσης είναι να δούμε αν και κατά πόσο τα παραπάνω δεδομένα μπορούν να ερμηνευτούν με τη χρήση του ορθογώνιου παραγοντικού μοντέλου και κατά πόσο μπορούμε να ερμηνεύσουμε τους παράγοντες που προκύπτουν. Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 15

16 Παραγοντική ανάλυση με SPSS (1) Από το μενού Analyse Data Reduction Factor Analysis εμφανίζεται το παράθυρο που φαίνεται στην εικόνα. Από το παράθυρο αυτό μπορούμε να διαλέξουμε τις μεταβλητές που είναι αριστερά και μεταφέροντας αυτές στο διπλανό παράθυρο τις επιλέγουμε να χρησιμοποιηθούν για την ανάλυση. Στο παράδειγμα μας έχουμε διαλέξει τις μεταβλητές mpg, engine, horse, weight, accel και year, nofcylinder. Είναι απαραίτητο να κάνουμε ελέγχους οι οποίοι εξασφαλίζουν την καταλληλότητα των δεδομένων και των μεταβλητών για τη δημιουργία των παραγόντων. Για το λόγο αυτό σαν πρώτο βήμα θα πρέπει να είναι η επιλογή των δεικτών εκείνων οι οποίοι ερμηνεύουν τις προϋποθέσεις Από πλήκτρο Descriptives μπορούμε να επιλέξουμε όποια από αυτά θέλουμε. Οι επιλογές αφορούν διάφορα περιγραφικά μέτρα που είναι χρήσιμα για την ανάλυση μας. Συγκεκριμένα οι επιλογές μας δίνουν Συνήθως τσεκάρουμε στην περιοχή Correlation Matrix τις ενδείξεις Coefficients, Significance levels, KMO and Batrlett s test of Sphericity και Anti-image Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 16

17 Παραγοντική ανάλυση με SPSS (2) Επιλογή Statistics Univariate Statistics Initial Solution Correlation Matrix Coefficients Significance Levels Determinant KMO and Bartlett s test of sphericity Inverse Reproduced Anti-image Αποτέλεσμα περιγραφικά στατιστικά για κάθε μεταβλητή Η αρχική λύση. Αν διαλέξουμε τη μέθοδο κυρίων συνιστωσών παίρνουμε μια στήλη με μονάδες. Αυτό δεν ισχύει στην περίπτωση της μεθόδου μεγίστης πιθανοφάνειας όπου οι αρχικές τιμές είναι ο συντελεστής παλινδρόμησης της κάθε μεταβλητής με επεξηγηματικές μεταβλητές όλες τις υπόλοιπες ο πίνακας συσχετίσεων ο πίνακας με τη στατιστική σημαντικότητα κάθε συσχέτισης ξεχωριστά την ορίζουσα του πίνακα συσχετίσεων. Τιμές κοντά στο 0 σημαίνουν την ύπαρξη συσχετίσεων ο έλεγχος σφαιρικότητας του Bartlett και η Kaiser-Meyer- Olkin στατιστική συνάρτηση για την καταλληλότητα των Δεδομένων Ο αντίστροφος του πίνακα συσχετίσεων ο εκτιμημένος πίνακας συσχετίσεων σύμφωνα με το μοντέλο. Τα διαγώνια στοιχεία είναι οι εταιρικότητες (communalities) ενώ τα στοιχεία κάτω από τη διαγώνιο είναι η διαφορά της εκτιμημένης συσχέτισης με την πραγματική Περιέχει τις αρνητικές τιμές του πίνακα μερικών συσχετίσεων, ενώ τα διαγώνια στοιχεία του πίνακα είναι τα MSA των Μεταβλητών Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 17

18 Παραγοντική ανάλυση με SPSS (3) Με το πλήκτρο Extraction διαλέγουμε τη μέθοδο εκτίμησης των παραγόντων. Από την επιλογή Method το πακέτο μας προσφέρει διάφορες μεθόδους μεταξύ αυτών και τη μέθοδο κυρίων συνιστωσών (που είναι η μέθοδος που χρησιμοποιεί αν δεν επιλέξουμε εμείς κάποια) και τη μέθοδο μεγίστης πιθανοφάνειας. Μπορούμε να επιλέξουμε επίσης αν θα δουλέψουμε με τον πίνακας συσχετίσεων η τον πίνακα διακύμανσης συνδιακύμανσης Μπορούμε να διαλέξουμε επίσης να μας εμφανιστεί η λύση πριν την περιστροφή καθώς και το scree plot. Για να επιλέξουμε πόσους παράγοντες μπορούμε είτε να διαλέξουμε απευθείας τον αριθμό είτε να διαλέξουμε μια τιμή και έτσι να πάρουμε τόσους παράγοντες όσες και οι ιδιοτιμές το πίνακα που χρησιμοποιούμε (συσχετίσεων ή συνδιακύμανσης) που είναι μεγαλύτερες από τη μέση τιμή όλων των ιδιοτιμών. αν χρησιμοποιούμε τον πίνακα συσχετίσεων η μέση τιμή όλων των ιδιοτιμών είναι 1 αν χρησιμοποιούμε τη μέθοδο μεγίστης πιθανοφάνειας το πακέτο χρησιμοποιεί τον πίνακα συσχετίσεων και τις ιδιοτιμές του. Το κριτήριο δηλαδή που βασίζεται στις ιδιοτιμές μπορούμε να το χρησιμοποιήσουμε και για τη μέθοδο μεγίστης πιθανοφάνειας, άσχετα αν δεν είναι σχετικό με αυτή τη μέθοδο Στην πράξη η χρήση της παραγοντικής ανάλυσης είναι μια επαναληπτική διαδικασία όπου προσαρμόζουμε διάφορα μοντέλα και επιλέγουμε αυτό που θεωρούμε καλύτερο Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 18

19 Παραγοντική ανάλυση με SPSS (4) Από το πλήκτρο Rotation μπορούμε να επιλέξουμε τη μέθοδο περιστροφής που θέλουμε. Αν δεν επιλέξουμε κάποια δεν θα γίνει περιστροφή και θα πάρουμε απλά τη λύση χωρίς περιστροφή. Οι μέθοδοι που προσφέρονται είναι αυτοί που αναφέρθηκαν. Αν επιλεγεί μη ορθογώνια περιστροφή (oblique ή Promax) πρέπει να συμπληρώσουμε την επιλογή Delta (μια τιμή κοντά στο 1 προτείνεται στη βιβλιογραφία) αν επιλέξουμε τη μέθοδο Promax πρέπει να συμπληρώσουμε την επιλογή Kappa. Τέλος επιλέγοντας Loading plots θα πάρουμε τα γραφήματα των παραγόντων που έχουμε επιλέξει. Αν οι παράγοντες είναι 3 θα πάρουμε 3-διάστατο γράφημα και όχι 3 2-διάστατα γραφήματα που θα ήταν πιο βολικό. Δυστυχώς για να κάνουμε κάτι τέτοιο πρέπει να δουλέψουμε από το Syntax και όχι από τα menu. Το πακέτο θα μας εμφανίσει τον πίνακα του μετασχηματισμού που χρησιμοποιήθηκε για την περιστροφή κάτω από τον τίτλο Transfromation Matrix. Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 19

20 Παραγοντική ανάλυση με SPSS (5) Από το πλήκτρο Scores μπορούμε επιλέγοντας Save as variables το πακέτο θα δημιουργήσει τόσες νέες μεταβλητές όσοι κι οι παράγοντες που επέλεξα χρησιμοποιώντας τυποποιημένα μοναδικά ονόματα της μορφής fac1_1 κλπ. Αν ξανατρέξουμε πάλι μια παραγοντική ανάλυση και ζητήσουμε πάλι τα factor scores τότε το όνομα θα είναι fac2_1 και ούτω καθεξής. Αν έχω εκτιμήσει τους παράγοντες με τη μέθοδο των κυρίων συνιστωσών τα factor scores μπορούν να υπολογιστούν με ακρίβεια. Αλλιώς θα πρέπει να επιλέξω κάποια από τις 3 μεθόδους (Regression, Bartlett και Anderson-Rubin) Τέλος η επιλογή Display factor score coefficient matrix θα μου εμφανίζει τον πίνακα με τους συντελεστές (Προσοχή αυτός ο πίνακας περιέχει τους συντελεστές με τους οποίους μπορώ να εκφράσω έναν παράγοντα ως γραμμικό συνδυασμό των μεταβλητών). Τέλος από το παράθυρο Options μπορούμε να επιλέξουμε κάποιες άλλες επιλογές σχετικά με το χειρισμό των missing values και με τον τρόπο που θέλουμε να εμφανίζονται τα αποτελέσματα των εκτιμημένων παραγόντων. Έτσι μπορούμε να δούμε τις μεταβλητές με σειρά απόλυτης τιμής (από τη μεγαλύτερη και άρα πιο σημαντική για τον παράγοντα προς τη μικρότερη) ή ακόμα και να μη εμφανιστούν μικροί συντελεστές. Αυτό είναι χρήσιμο όταν έχουμε πολλές μεταβλητές επειδή έτσι μπορούμε να διαβάσουμε γρήγορα τα αποτελέσματα. Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 20

21 Ανάλυση Βήμα 1 ο (περιγραφικά στοιχεία) Πριν ξεκινήσουμε την ανάλυση των δεδομένων όπως αυτή προκύπτει από τη παραγοντική ανάλυση πρέπει να δούμε κάποια περιγραφικά στοιχεία. Για τον λόγο αυτό από το παράθυρο διαλόγου του πλήκτρου descriptives τσεκάρουμε την επιλογή Univariate descriptives και Initial solution Επίσης από την περιοχή correlation matrix επιλέγουμε τις επιλογές Coefficients, KMO and Bartlett's Test και την επιλογή Anti image για να ελέγξουμε αν τα δεδομένα μας είναι κατάλληλα για παραγοντική ανάλυση. Υπενθύμιση: Η επιλογή Univariate descriptives δημιουργεί έναν πίνακα που περιέχει τα δύο βασικότερα μέτρα της απλής περιγραφικής στατιστικής, ο αριθμητικός μέσος (Mean) και η τυπική απόκλιση (Std. Deviation) για όλες τις μεταβλητές. Η επιλογή Initial solution προσθέτει στον πίνακα Total Variance Explained στοιχεία για τον αριθμό των παραγόντων. Η επιλογή Coefficients δημιουργεί έναν που περιέχει τους συντελεστές συσχέτισης όλων των ζευγών των μεταβλητών Η επιλογή KMO δημιουργεί έναν πίνακα που περιέχει τον πολύ σημαντικό δείκτη KMO για την καταλληλότητα των δεδομένων και τον Bartlett s test of Sphericity το Sig. του οποίου δηλώνει αν υπάρχουν στον πίνακα συσχετίσεων σημαντικές συσχετίσεις μεταξύ κάποιων μεταβλητών. Τέλος η επιλογή Ani-image δημιουργεί έναν πίνακα του οποίου η διαγώνιος περιέχει τον δείκτη MSA (Measures of Sampling Adequacy) για κάθε μεταβλητή ξεχωριστά. Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 21

22 Ανάλυση Βήμα 2 ο (Συσχετίσεις) Το ενδιαφέρον στοιχείο που προκύπτει από τον πίνακα δεν είναι τόσο οι μέσες τιμές που έτσι κι αλλιώς δεν είναι άμεσα συγκρίσιμες αλλά το γεγονός πως οι διακυμάνσεις διαφέρουν αρκετά και επομένως δεν μοιάζει λογικό να προχωρήσει κανείς σε ανάλυση με τον πίνακα διακύμανσης. Miles per Gallon Engine Displacement (cu. inches) Horsepower Vehicle Weight (lbs.) Time to Accelerate f rom 0 to 60 mph (sec) Model Year (modulo 100) Number of Cy linders Descriptive Statistics Mean Std. Dev iation Analysis N 23,48 7, ,13 104, ,24 38, ,10 845, ,53 2, ,99 3, ,47 1, Correlation Sig. (1-tailed) Miles per Gallon Engine Displacement (cu. inches) Horsepower Vehicle Weight (lbs.) Time to Accelerate f rom 0 to 60 mph (sec) Model Year (modulo 100) Number of Cy linders Miles per Gallon Engine Displacement (cu. inches) Horsepower Vehicle Weight (lbs.) Time to Accelerate f rom 0 to 60 mph (sec) Model Year (modulo 100) Number of Cy linders Correlation Matrix Time to Engine Accelerate Miles per Displacement Vehicle f rom 0 to 60 Model Year Number of Gallon (cu. inches) Horsepower Weight (lbs.) mph (sec) (modulo 100) Cylinders 1,000 -,805 -,776 -,831,431,577 -,776 -,805 1,000,898,934 -,548 -,367,951 -,776,898 1,000,863 -,701 -,411,842 -,831,934,863 1,000 -,425 -,303,897,431 -,548 -,701 -,425 1,000,296 -,511,577 -,367 -,411 -,303,296 1,000 -,342 -,776,951,842,897 -,511 -,342 1,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000 Κοιτάζοντας λοιπόν τον πίνακα συσχετίσεων υπάρχουν ενδείξεις πως οι συσχετίσεις ανάμεσα στις μεταβλητές είναι ικανοποιητικά μεγάλες. Αυτό δεν έχει να κάνει μόνο με το γεγονός πως όλες είναι στατιστικά σημαντικές. Αυτό από μόνο του δεν μας αρκεί. Παρατηρούμε πως η μικρότερη συσχέτιση σε απόλυτη τιμή είναι ανάμεσα στην επιτάχυνση και τη χρονιά κατασκευής. Επίσης ένα άλλο ενδιαφέρον συμπέρασμα είναι πως η μεταβλητή που έχει τις μικρότερες συσχετίσεις με τις υπόλοιπες είναι η χρονιά κατασκευής. Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 22

23 Ανάλυση Βήμα 3 ο (καταληλλότητα) Από τον πίνακα μπορεί κανείς να δει το στατιστικό κριτήριο του Keiser-Meyer-Olkin το οποίο είναι αρκετά υψηλό (0.813) και αυτό υποδεικνύει ότι οι συσχετίσεις ανάμεσα στα δεδομένα μας είναι αρκετά υψηλές. Miles per Gallon Engine Displacement (cu. inches) Anti-image matrix Horsepower Vehicle Weight (lbs.) KMO and Bartlett's Test Kaiser-Meyer-Olkin Measure of Sampling Adequacy. Bartlett's Test of Sphericity Time to Accelerate from 0 to 60 mph (sec) Model Year (modulo 100) Approx. Chi-Square df Sig. Number of Cylinders Miles per Gallon,844(a) -0,057 0,007 0,46-0,037-0,59 0,053 Engine Displacement (cu. inches) -0,057,837(a) -0,264-0,415 0,079 0,098-0,674 Horsepower 0,007-0,264,839(a) -0,379 0,647 0,167 0,119 Vehicle Weight (lbs.) 0,46-0,415-0,379,795(a) -0,434-0,392-0,079 Time to Accelerate from 0 to 60 mph (sec) -0,037 0,079 0,647-0,434,707(a) 0,077 0,063 Model Year (modulo 100) -0,59 0,098 0,167-0,392 0,077,631(a) -0,023 Number of Cylinders 0,053-0,674 0,119-0,079 0,063-0,023,876(a) Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 23, ,634 21,000 Επίσης, όπως ήταν αναμενόμενο μετά τη συζήτηση, ο έλεγχος σφαιρικότητας του Bartlett απορρίπτει τη μηδενική υπόθεση πως ο πίνακας συσχέτισης είναι ο μοναδιαίος (τιμή της ελεγχοσυνάρτησης , βαθμοί ελευθερίας 21, p=7). Όλα λοιπόν τα στοιχεία δείχνουν πως τα δεδομένα μας είναι κατάλληλα για παραγοντική ανάλυση. Για να ελέγξουμε τώρα αν όλες οι μεταβλητές είναι κατάλληλες να χρησιμοποιηθούν στο μοντέλο χρησιμοποιούμε την τιμή ΜSA την οποία μπορείτε να διαβάσετε για κάθε μεταβλητή στη διαγώνιο του πίνακα Anti-Image. Παρατηρείστε πως για τη μεταβλητή χρονιά κατασκευής η τιμή είναι η μικρότερη (0.631) κάτι που είχαμε παρατηρήσει και από τον πίνακα συσχετίσεων και δηλώνει πως αυτή η μεταβλητή είναι λιγότερο σχετική με τις υπόλοιπες. Παρόλα αυτά όλες οι τιμές κρίνονται ικανοποιητικές και δεν υπάρχει λόγος να διώξουμε κάποια μεταβλητή

24 Ανάλυση Βήμα 4 ο (αριθμός παραγόντων) Component Initial Eigenvalues Total Variance Explained Total % of Variance Cumulativ e % Total % of Variance Cumulativ e % 5,015 71,638 71,638 5,015 71,638 71,638,870 12,434 84,072,721 10,305 94,377,185 2,647 97,023,120 1,710 98,733,054,773 99,506,035, ,000 Extraction Method: Principal Component Analysis. Extraction Sums of Squared Loadings Η επιλογή του αριθμού των παραγόντων δεν μπορεί να γίνει πριν από την εκτίμηση του μοντέλου εκτός αν υπάρχουν ισχυρά στοιχεία ότι ο αριθμός των παραγόντων είναι συγκεκριμένος. Αυτό σημαίνει πως η επιλογή του αριθμού των παραγόντων είναι μια δυναμική διαδικασία και προϋποθέτει επαναληπτικά την εκτίμηση και αξιολόγηση του μοντέλου. Μπορεί να χρησιμοποιηθεί ο κανόνας του Kaiser (το ποσοστό της διακύμανσης που εξηγείται) ή το scree plot. Έχετε υπόψη σας ότι αυτή η ερμηνεία (ποσοστό διακύμανσης που ερμηνεύει) είναι σωστή μόνο αν χρησιμοποιηθεί η μέθοδος των κυρίων συνιστωσών, καθώς και ότι με τις υπόλοιπες μεθόδους εκτίμησης η διακύμανση που ερμηνεύεται από κάθε παράγοντα διαφέρει. Γίνεται λοιπόν κατανοητό πως το πρόβλημα επιλογής αριθμού παραγόντων δεν είναι άσχετο με την επιλογή μεθόδου εκτίμησης. Παρόλα αυτά κριτήρια βασισμένα στις ιδιοτιμές χρησιμοποιούνται συχνά στην πράξη άσχετα με τη μέθοδο εκτίμησης που διαλέγει κανείς. Με αυτή την προσέγγιση, 2 παράγοντες εξηγούν πάνω από το 80% της διακύμανσης. Από το scree plot πάλι δεν είναι ξεκάθαρο πόσους παράγοντες θα κρατήσουμε. (Διαλέγουμε 2 και συνεχίζουμε την ανάλυση) Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 24

25 Ανάλυση Βήμα 4 ο (Κύριες συνιστώσες) Από τον πίνακα component matrix μπορεί κανείς να δει πως εκφράζεται κάθε μια μεταβλητή με τη χρήση των 2 παραγόντων που χρησιμοποιήσαμε. Έτσι έχουμε πως: Κατανάλωση = -0,890 F1 + 0,188 F2 Μέγεθος μηχανής= 0,961 F1+ 0,168 F2 Ιπποδύναμη = 0,947 F1 + 0,078 F2 Βάρος οχήματος= 0,926 F1 + 0,216 F2 Επιτάχυνση = -0,646 F1 + 0,015 F2 Χρονιά κατασκευής= -0,510 F1+ 0,848 F2 Αριθμός κυλίνδρων= 0,931 F1+ 0,187 F2 Miles per Gallon Engine Displacement (cu. inches) Horsepower Vehicle Weight (lbs.) Component Matrix a Time to Accelerate f rom 0 to 60 mph (sec) Model Y ear (modulo 100) Number of Cy linders Component 1 2 -,890,188,961,168,947,078,926,216 -,646,015 -,510,848,931,187 Extract ion Method: Principal Component Analy sis. a. 2 components extracted. Κοιτάζοντας λοιπόν τις σχέσεις των μεταβλητών και των παραγόντων μπορεί κάποιος να δει πως οι μεταβλητές Κατανάλωση, Επιτάχυνση και Χρονιά κατασκευής έχουν αρνητικά πρόσημα ενώ οι υπόλοιπες θετικά πρόσημα για τον πρώτο παράγοντα, επομένως κάποιος θα μπορούσε να διακινδυνεύσει κάποια ερμηνεία για τον πρώτο παράγοντα με βάση αυτή την παρατήρηση. Σας υπενθυμίζουμε πως τα πρόσημα των ιδιοδιανυσμάτων δεν είναι μοναδικά καθώς αν πολλαπλασιάσουμε έναν ιδιοδιάνυσμα με 1 αυτό συνεχίζει να είναι λύση της εξίσωσης από την οποία ορίζονται τα ιδιοδιανύσματα. Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 25

26 Ανάλυση Βήμα 4 ο (Κύριες συνιστώσες) Πιο εύκολα μπορεί να καταλάβει κανείς πως σχετίζονται οι μεταβλητές αν κάνει ένα γράφημα των παραγόντων ως εξής: σε κάθε άξονα αντιστοιχούμε έναν παράγοντα και για κάθε μεταβλητή την αναπαριστούμε με συντεταγμένη τις επιβαρύνσεις κάθε παράγοντα. Για παράδειγμα το γράφημα component plot μας δείχνει τους δύο παράγοντες. Παρατηρείστε πως οι μεταβλητές βάρος, ιπποδύναμη, μέγεθος μηχανής και αριθμός κυλίνδρων είναι πολύ κοντά η μία στην άλλη και σε αντιδιαστολή με τις υπόλοιπες τρεις. Πόσο καλό όμως είναι το παραγοντικό μοντέλο που προσαρμόσαμε; Στον communalities μπορεί κανείς να δει τις εταιρικότητες, δηλαδή τις διακυμάνσεις που εξηγούν οι παράγοντες που προσαρμόσαμε. Παρατηρούμε επομένως πως με το μοντέλο που προσαρμόσαμε ερμηνεύουμε το 83% της κατανάλωσης. Το ποσοστό αυτό δεν είναι παρά το άθροισμα τετραγώνων των επιβαρύνσεων των παραγόντων σε αυτή τη μεταβλητή, δηλαδή για τη μεταβλητή κατανάλωση είναι (- 0.89) 2 + (0.188) 2 = Βλέπουμε λοιπόν πως το μοντέλο δεν καταφέρνει να εξηγήσει παρά μόνο το 42% της μεταβλητής επιτάχυνση και αυτό είναι ίσως μια ένδειξη πως πρέπει να προσθέσουμε και άλλον παράγοντα αν θέλουμε να αυξήσουμε την ερμηνεία για αυτή τη μεταβλητή. Miles per Gallon Engine Displacement (cu. inches) Horsepower Vehicle Weight (lbs.) Communalities Time to Accelerate f rom 0 to 60 mph (sec) Model Year (modulo 100) Number of Cy linders Initial Extraction 1,000,828 1,000,952 1,000,902 1,000,905 1,000,418 1,000,978 1,000,902 Extraction Method: Principal Component Analysis. Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 26

27 Ανάλυση Βήμα 4 ο (Κύριες συνιστώσες) Ένα ακόμα μέτρο του πόσο καλό είναι το μοντέλο που προσαρμόσαμε είναι η σύγκριση του εκτιμώμενου πίνακα διακυμάνσεων ανάμεσα στις αρχικές μεταβλητές. O πίνακας reproduced Correlations περιέχει αυτόν τον εκτιμημένο πίνακα. Στη διαγώνιο υπάρχουν οι εταιρικότητες. Reproduced Correlation Residual a Miles per Gallon Engine Displacement (cu. inches) Horsepower Vehicle Weight (lbs.) Time to Accelerate f rom 0 to 60 mph (sec) Model Year (modulo 100) Number of Cy linders Miles per Gallon Engine Displacement (cu. inches) Horsepower Vehicle Weight (lbs.) Time to Accelerate f rom 0 to 60 mph (sec) Model Year (modulo 100) Number of Cy linders Reproduced Correlations Miles per Gallon Engine Displ. Horsep Vehicle Weight Time to Accelerate Model Year Number,828 b -,824 -,828 -,784,578,613 -,793 -,824,952 b,923,927 -,619 -,347,926 -,828,923,902 b,894 -,611 -,417,896 -,784,927,894,905 b -,595 -,289,903,578 -,619 -,611 -,595,418 b,342 -,599,613 -,347 -,417 -,289,342,978 b -,316 -,793,926,896,903 -,599 -,316,902 b,019,052 -,047 -,147 -,036,017,019 -,025,007,071 -,020,025,052 -,025 -,031 -,091,006 -,054 -,047,007 -,031,170 -,014 -,006 -,147,071 -,091,170 -,046,088 -,036 -,020,006 -,014 -,046 -,026,017,025 -,054 -,006,088 -,026 Extraction Method: Principal Component Analysis. a. Residuals are computed between observ ed and reproduced correlations. There are 7 (33,0%) nonredundant residuals with absolute values greater than b. Reproduced communalities Αν το μοντέλο ήταν τέλειο δεν θα έπρεπε να υπάρχουν διαφορές (κατάλοιπα) ανάμεσα στον πραγματικό πίνακα (τον πίνακα συσχετίσεων στην περίπτωση μας) και στον εκτιμημένο πίνακα. Στο κάτω μέρος του πίνακα μπορεί κανείς να δει αυτά τα κατάλοιπα, δηλαδή τη διαφορά του πραγματικού πίνακα μείον τον εκτιμημένο. Δεν υπάρχει σαφές κριτήριο με βάση το οποίο να αποφασίζει κανείς αν οι εκτιμήσεις ήταν καλές. Παρόλα αυτά ανάμεσα σε δύο διαφορετικά μοντέλα μπορεί κανείς να πάρει κάποια συνάρτηση των καταλοίπων (π.χ. άθροισμα τετραγώνων) και να κρίνει ποιο από τα δύο μοντέλα ήταν καλύτερο. Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 27

28 Ανάλυση Βήμα 4 ο (Μέθοδος μεγίστης πιθανοφάνειας) Χρησιμοποιούμε αυτή την φορά τη μέθοδο μεγίστης πιθανοφάνειας για να εκτιμήσουμε το παραγοντικό μοντέλο. Για να έχουμε μέτρα σύγκρισης με την προηγούμενη μέθοδο διαλέγουμε και αυτή την φορά να πάρουμε 2 παράγοντες. Ο πίνακας factor matrix είναι ο πίνακας με τις επιβαρύνσεις όταν αυτές εκτιμούνται με τη μέθοδο μεγίστης πιθανοφάνειας. Συγκρίνοντας τα αποτελέσματα με αυτά που πήραμε με την προηγούμενη μέθοδο εκτίμησης μπορεί κανείς να δει πως υπάρχουν σημαντικές διαφορές οι οποίες δεν είναι μόνο αριθμητικές. Ως προς τον πρώτο παράγοντα τα πρόσημα έχουν παραμείνει ίδια αλλά βέβαια οι επιβαρύνσεις έχουν αλλάξει σε μερικές μεταβλητές και μάλιστα αρκετά. Για παράδειγμα, για την επιτάχυνση έχουμε τώρα έναντι που είχαμε πριν. Παρατηρείστε πως στο δεύτερο παράγοντα οι επιβαρύνσεις είναι πολύ διαφορετικές και ως προς τα πρόσημα. Δηλαδή έχουμε μια μεγάλη διαφορά στους παράγοντες (επομένως και στην όποια ερμηνεία τους) ανάμεσα στις 2 μεθόδους. Miles per Gallon Engine Displacement (cu. inches) Horsepower Vehicle Weight (lbs.) Factor Matrix a Time to Accelerate f rom 0 to 60 mph (sec) Model Year (modulo 100) Number of Cy linders Factor 1 2 -,454 -,697,574,802,721,608,453,844 -,999,032 -,305 -,249,536,789 Extraction Method: Maximum Likelihood. a. 2 f actors extracted. 6 iterations required. Κατανάλωση = F F2 Μέγεθος μηχανής = F F2 Ιπποδύναμη = F F2 Βάρος οχήματος = F F2 Επιτάχυνση = F F2 Χρονιά κατασκευής = F F2 Αριθμός κυλίνδρων = F F2 Τα αποτελέσματα αυτά αποτελούν μια ισχυρή ένδειξη πως το μοντέλο δεν είναι σωστό. Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 28

29 Ανάλυση Βήμα 4 ο (Μέθοδος μεγίστης πιθανοφάνειας) Στον πίνακα communalities παρουσιάζεται η διακύμανση της κάθε μεταβλητής που μπορούμε να ερμηνεύσουμε με 2 παράγοντες. Το αξιοσημείωτο σε αυτή την περίπτωση είναι ότι χρησιμοποιώντας δύο παράγοντες, αλλά διαφορετικές μεθόδους, παίρνω διαφορετικά αποτελέσματα ως προς το ποσοστό της διακύμανσης κάθε μεταβλητής. Πιο συγκεκριμένα με τη μέθοδο μεγίστης πιθανοφάνειας εξηγώ μόλις το 15% της χρονιάς κατασκευής ενώ με την προηγούμενη μέθοδο είχα εξηγήσει το 98%. Επίσης ενώ πριν εξηγούσα μόλις το 42% της επιτάχυνσης τώρα εξηγώ σχεδόν όλη τη διακύμανση (99.9%). Miles per Gallon Engine Displacement (cu. inches) Horsepower Vehicle Weight (lbs.) Communalities a Time to Accelerate f rom 0 to 60 mph (sec) Model Year (modulo 100) Number of Cy linders Initial Extraction,808,692,951,973,897,889,926,917,632,999,474,155,906,910 Extraction Method: Maximum Likelihood. a. One or more communalitiy estimates greater than 1 were encountered during iterations. The resulting solution should be interpreted with caution. Στον πίνακα communalities μπορούμε να παρατηρήσουμε και την προειδοποίηση κάτω από τον πίνακα. Επειδή ο αλγόριθμος σε κάθε βήμα εκτιμά τις παραμέτρους μέχρι να συγκλίνει, σε κάποιες επαναλήψεις υπάρχει περίπτωση να φτάσει σε μη επιτρεπτές τιμές. Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 29

30 Ανάλυση Βήμα 4 ο (Μέθοδος μεγίστης πιθανοφάνειας) Στον πίνακα Total variance Explained μπορούμε να παρατηρήσουμε στην αριστερή στήλη τις ιδιοτιμές και το ποσοστό της διακύμανσης που θα εξηγούσε κάθε κύρια συνιστώσα με βάση την προηγούμενη μέθοδο. Στην πραγματικότητα αυτή η στήλη δεν μας λέει τίποτα για τη μέθοδο απλά μας υπενθυμίζει κάποια αποτελέσματα από την προηγούμενη μέθοδο εκτίμησης (κύριες συνιστώσες). Τώρα στο δεξί μέλος το ποσοστό της διακύμανσης κάθε παράγοντα διαφέρει από αυτό που οι ιδιοτιμές δίνουν. Παρατηρείστε πως αθροίζω ως προς τη στήλη και όχι ως προς τη γραμμή όπως έκανα για να βρω το ποσοστό της διακύμανσης για κάθε μεταβλητή. Από τον πίνακα βλέπουμε πως οι παράγοντες δεν είναι σε αύξουσα σειρά ως προς την διακύμανση που εξηγούν. Η τρίτη στήλη έχει να κάνει με το ποσοστό της διακύμανσης μετά την περιστροφή που θα δούμε σε λίγο. Παρατηρείστε πως το ποσοστό κάθε παράγοντα έχει αλλάξει μετά την περιστροφή, αν και το συνολικό ποσοστό παρέμεινε το ίδιο. Επίσης πως το μοντέλο με 2 παράγοντες εξηγεί το 79% με τη μέθοδο μεγίστης πιθανοφάνειας και το 84% με τη μέθοδο των κυρίων συνιστωσών. Μια σημαντική διαφορά με τη μέθοδο κυριών συνιστωσών είναι πως κάθε φορά που προσθέτουμε έναν παράγοντα οι επιβαρύνσεις των προηγούμενων αλλάζουν. Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 30

31 Ανάλυση Βήμα 4 ο (Μέθοδος μεγίστης πιθανοφάνειας) Η χρήση της μεθόδου μεγίστης πιθανοφάνειας μας επιτρέπει τη στατιστική αξιολόγηση του μοντέλου. Η μηδενική υπόθεση είναι ισοδύναμη με την υπόθεση ότι το μοντέλο προσαρμόζει καλά τα δεδομένα. Για τα δεδομένα μας βλέπουμε πως απορρίπτουμε ακόμα και για το μοντέλο με 3 παράγοντες κάτι που σημαίνει πως δεν είναι σωστό το μοντέλο. Συνήθως η διαδιακασία που ακολουθείτε είναι να προσθέτουμε παράγοντες μέχρι το μοντέλο να γίνει στατιστικά σημαντικό. Όμως σε αυτή την περίπτωση περαιτέρω παράγοντες θα οδηγήσουν και πάλι ίσως σε στατιστικά σημαντικό μοντέλο και άρα χρειαζόμαστε κάποιο κριτήριο επιλογής του καλύτερου μοντέλου Goodness-of-fit Test Chi-Square df Sig. 499,618 14,000 Goodness-of-fit Test Chi-Square df Sig. 282,514 8,000 Goodness-of-fit Test Chi-Square df Sig. 108,140 3,000.Μέχρι τώρα έχουμε δει αρκετές φορές πως το μοντέλο με 2 παράγοντες που έχουμε υποθέσει δεν φαίνεται να περιγράφει καλά τα δεδομένα. Στην πραγματικότητα είδαμε πως ούτε το μοντέλο με 3 παράγοντες δεν περιγράφει καλά τα δεδομένα. Η ερώτηση είναι τι μπορεί να φταίει για αυτό. Αφενός ίσως η υπόθεση της κανονικότητας (απαραίτητη για τη μέθοδο μεγίστης πιθανοφάνειας) δεν ισχύει. Στην βιβλιογραφία έχει δειχτεί πώς μικρές αποκλίσεις από την υπόθεση της κανονικότητας δεν μπορούν να θεωρηθούν ως αιτία της απόρριψης του μοντέλου. Αν μάλιστα ληφθεί υπόψη πως οι συσχετίσεις που είχαμε δει στην αρχή της ανάλυσης ήταν μάλλον υψηλές, η απόρριψη του ορθογώνιου παραγοντικού μοντέλου μπορεί να οφείλεται σε μια σειρά από λόγους όπως: α)μη γραμμικότητα της σχέσης παραγόντων και μεταβλητών β)ύπαρξη συσχέτισης μεταξύ των παραγόντων (δηλαδή το μοντέλο δεν είναι ορθογώνιο), γ)η βασική υπόθεση του μοντέλου είναι πως η συσχέτιση ανάμεσα σε δύο μεταβλητές οφείλεται στην ύπαρξη κάποιων κοινών παραγόντων, επομένως αν κάτι τέτοιο δεν ισχύει μπορεί να οδηγήσει παρά την ύπαρξη σημαντικών συσχετίσεων σε απόρριψη του μοντέλου. Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 31

32 Ανάλυση Βήμα 5 ο (Δημιουργία factors scores) Ο στόχος της παραγοντικής ανάλυσης είναι η δημιουργία καινούριων μεταβλητών οι οποίες να συμπυκνώνουν όσο γίνεται τη διακύμανση των αρχικών μεταβλητών, ελπίζοντας πως έτσι μπορούμε να μειώσουμε τις διαστάσεις του προβλήματος. Δηλαδή θέλουμε να δημιουργήσουμε καινούριες μεταβλητές για κάθε παρατήρηση, τόσες όσοι και οι παράγοντες στο μοντέλο που χρησιμοποιήσαμε, ώστε να δημιουργήσουμε καινούρια δεδομένα για κάθε παρατήρηση με σκοπό περαιτέρω στατιστική επεξεργασία. καινούριες μεταβλητές όταν έχουμε χρησιμοποιήσει ένα ορθογώνιο παραγοντικό μοντέλο θα είναι ασυσχέτιστες (θυμηθείτε πως αυτή είναι μια από τις υποθέσεις του παραγοντικού μοντέλου). Για την δημιουργία των factors scores επιλέγουμε από το πλήκτρο scores του κεντρικού μενού τις επιλογές save as variable regression και τσεκάρουμε την επιλογή Display factor score coeficient matrix. Το αποτέλεσμα αυτής της διαδικασίας είναι η δημιουργία δύο νέων στον φύλλο δεδομένων που αντιπροσωπεύουν τις τους δύο παράγοντες καθώς και ο πίνακας component score coefficient matrix ο οποίος περιέχει του συντελεστές Component Score Coefficient Matrix Miles per Gallon Engine Displacement (cu. inches) Horsepower Vehicle Weight (lbs.) Time to Accelerate from 0 to 60 mph (sec) Model Year (modulo 100) Number of Cy linders Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 32 Οι Component 1 2 -,089,265,248,112,208,016,261,166 -,114,062,252,946,250,135 Extraction Method: Principal Component Analy sis. Rotation Method: Varimax with Kaiser Normalization. Component Scores.

33 Ανάλυση Βήμα 6 ο (Χρήση των σκορ) Στην ουσία έχουμε πια ποσοτικοποιήσει τους παράγοντες που υποθέσαμε ότι εξηγούν τις συσχετίσεις των μεταβλητών μας. Για τα δεδομένα μας αποθηκεύσαμε τους δύο παράγοντες των παραγόντων για όλες τις παρατηρήσεις μπορεί κανείς να τις δει στα γραφήματα που ακολουθούν. Από το αρχείο δεδομένων γνωρίζουμε για κάθε αυτοκίνητο την ήπειρο προέλευσης τους. Τα αυτοκίνητα είναι ταξινομημένα σε Αμερικάνικα, Ευρωπαϊκά και Γιαπωνέζικα. Στα γραφήματα βλέπουμε Boxplots για τις τρεις ομάδες αυτοκινήτων και τις τιμές τους στους δύο παράγοντες. Παρατηρείστε στο 3 γράφημα το οποίο παρουσιάζει έναν νέφος σημείων όλων των παρατηρήσεων πως τα αμερικάνικα αυτοκίνητα μαζεύονται στο δεξί μέλος της εικόνας. Δηλαδή αυτό που βλέπουμε είναι πως χρησιμοποιώντας την παραγοντική ανάλυση η πληροφορία που συμπυκνώνουν οι 2 πρώτοι παράγοντες είναι αρκετή για να αποκτήσουμε την ικανότητα να ξεχωρίζουμε τα αυτοκίνητα. Θυμηθείτε πως μια ερμηνεία που είχαμε δώσει στον πρώτο παράγοντα ήταν ένα κοντράστ ανάμεσα στο μέγεθος του αυτοκινήτου και τις επιδόσεις του. Τα αμερικάνικα αυτοκίνητα, όπως είναι γνωστό άλλωστε στους φίλους του αυτοκινήτου, είναι συνήθως ογκώδη και για αυτό ξεχωρίζουν από τα υπόλοιπα. Το παραπάνω αποτελεί μια απλή εφαρμογή των καινούριων δεδομένων που προέκυψαν από την παραγοντική ανάλυση. REGR factor score 1 for analysis 1 REGR factor score 2 for analysis 1 2, , , , , , , , ,00000 n=244 n=68 n=79 Americ an European Japanese Country of Origin n=244 n=68 n=79 Americ an European Japanese Country of Origin Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 33

34 Ανακεφαλαίωση Κριτήρια Π.Α. (1) ο δείκτης KMO είναι ένας στατιστικός δείκτης σύγκρισης του σχετικού μεγέθους των συντελεστών συσχέτισης, σε σχέση με τους μερικούς συντελεστές συσχέτισης. Οι τιμές του δείκτη αυτού κυμαίνονται από 0 έως 1. Τιμές κοντά στη μονάδα δηλώνουν ότι, τα δεδομένα είναι κατάλληλα για παραγοντική ανάλυση. Αντίθετα τιμές κάτω του 0,5 θεωρούνται μη αποδεκτές και δεν συνιστάται η συνέχιση της παραγοντικής διαδικασίας. Στην πράξη τιμές γύρω στο 0,8 θεωρούνται αρκετά καλές για να διενεργηθεί μια παραγοντική ανάλυση (De Vaus 1991, Garson 2001). Γενικότερα μπορούμε να πούμε ότι η τιμή του δείκτη KMO μεγαλώνει όταν: α)το μέγεθος του δείγματος μεγαλώνει, β)ο μέσος όρος των συσχετίσεων μεγαλώνει, γ)το πλήθος των μεταβλητών αυξάνει και δ) το πλήθος των παραγόντων ελαττώνεται. Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 34

35 Ανακεφαλαίωση Κριτήρια Π.Α. (2) το τεστ του Bartlett για τη σφαιρικότητα, το οποίο αποφαίνεται για την παρουσία συσχετίσεων μεταξύ των μεταβλητών. Στην ουσία μας δίνει την πιθανότητα κατά την οποία ο πίνακας συσχέτισης να έχει σημαντικές συσχετίσεις μεταξύ κάποιων μεταβλητών. Έτσι, αν η στατιστική σημαντικότητα (Sig.) του δείκτη αυτού είναι μικρότερο του 0,05 απορρίπτεται η υπόθεση της μη ύπαρξης σημαντικών συσχετίσεων, σε επίπεδο σημαντικότητας 5%. αν οι τιμές των παραπάνω δύο δεικτών, δεν είναι μέσα στα υιοθετηθέντα περιθώρια, τότε ελέγχονται οι τιμές των συντελεστών MSA για κάθε μεταβλητή ξεχωριστά. Οι τιμές αυτές παρουσιάζονται στη διαγώνιο του πίνακα anti image correlations και υποδεικνύουν ποιες μεταβλητές πρέπει να διαγραφούν έτσι ώστε τα δεδομένα να γίνουν κατάλληλα για την παραγοντική ανάλυση. Γενικά αποδεκτό είναι ότι, μεταβλητές οι οποίες έχουν τιμή μικρότερη του 0,5 στο συντελεστή MSA πρέπει να διαγραφούν. Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 35

36 Ανακεφαλαίωση Κριτήρια Π.Α. (3) οι τιμές των φορτίσεων της κάθε μεταβλητής. Γενικά τιμές φορτίσεων χαμηλότερες του 0,5 θεωρούνται χαμηλές και οι μεταβλητές που έχουν χαμηλές φορτίσεις πρέπει να αφαιρούνται (De Vaus 1991, Field 2000, Garson 2001, Hair et al. 1995, Stevens 1992). Εντούτοις, ένα αυστηρότερο όριο είναι τιμή φόρτισης 0,6 (McCroskey και Young 1979, Doll et al. 1995, Sankaranarayanan et al. 2002). Υποσημείωση: Σύμφωνα με τους Hair et al. (1998) διαγράφονται όλες οι μεταβλητές οι οποίες: α)έχουν τιμές μικρότερες του 0,5 στο δείκτη MSA, β) έχουν φορτίσεις μικρότερες του 0,5, γ) έχουν φορτίσεις μεγαλύτερες από 0,45 σε περισσότερους από έναν παράγοντες, και δ)δημιουργούν από μόνες τους παράγοντα Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 36

37 Ανακεφαλαίωση Κριτήρια Π.Α. (4) Για τον καθορισμό του πλήθους των παραγόντων μπορούμε να πάρουμε υπόψη μας κάποιο από τα επόμενα τέσσερα κριτήρια. Το πρώτο κριτήριο βασίζεται στην τιμή της ιδιοτιμής που εμείς καθορίζουμε. Συνήθως πρέπει να είναι μεγαλύτερη του 1. Έτσι κάθε παράγοντες με ιδιοτιμή μεγαλύτερη του 1 θεωρείται σημαντικός, ενώ κάθε παράγοντας με ιδιοτιμή μικρότερη του 1 θεωρείται μη σημαντικός και αγνοείται. Το δεύτερο κριτήριο είναι η εκ των προτέρων βούληση για συγκεκριμένο αριθμό παραγόντων με βάση κάποια δεδομένα. Το τρίτο κριτήριο είναι το άθροισμα των διακυμάνσεων το οποίο θεωρούμε ικανοποιητικό. Αν δηλαδή θέλουμε το ποσοστό της διακύμανσης το οποίο περιγράφεται από τους παράγοντες να είναι 85% τότε θα επιλέξουμε τόσους διαδοχικούς παράγοντες ώστε να φτάσουμε στο επιθυμητό αποτέλεσμα. Το τέταρτο κριτήριο στηρίζεται στο Scree Plot. Με βάση αυτή τη γραφική απεικόνιση μετά από το σημείο το οποίο η καμπύλη τείνει να γίνει ευθεία πρέπει να απορρίπτονται οι παράγοντες. Σε σχέση με το πρώτο κριτήριο δίνει τουλάχιστον ένα παράγοντα περισσότερο Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια 37

ΠΑΡΑΓΟΝΤΙΚΗ ΑΝΑΛΥΣΗ FACTOR ANALYSIS

ΠΑΡΑΓΟΝΤΙΚΗ ΑΝΑΛΥΣΗ FACTOR ANALYSIS ΠΑΡΑΓΟΝΤΙΚΗ ΑΝΑΛΥΣΗ ΣΤΟΧΟΣ FACTOR ANALYSIS ΜΕΙΟΝΕΚΤΗΜΑΤΑ-ΠΛΕΟΝΕΚΤΗΜΑΤΑ ΙΑΦΟΡΕΣ ΜΕ ΚΥΡΙΕΣ ΣΥΝΙΣΤΩΣΕΣ. ΚΑΤΑΛΛΗΛΟΤΗΤΑ Ε ΟΜΕΝΩΝ. ΠΩΣ ΕΠΙΤΥΓΧΑΝΕΤΑΙ. ΠΑΡΑ ΕΙΓΜΑ ΥΛΟΠΟΙΗΣΗ ΣΤΟ SPSS ΕΡΜΗΝΕΙΑ 1 ΠΑΡΑΓΟΝΤΙΚΗ ΑΝΑΛΥΣΗ

Διαβάστε περισσότερα

Ιωάννης Τσαούσης, Πανεπιστήμιο Κρήτης Τμήμα Ψυχολογίας

Ιωάννης Τσαούσης, Πανεπιστήμιο Κρήτης Τμήμα Ψυχολογίας Η Ανάλυση Παραγόντων (Factor Analysis) Τι είναι η ανάλυση παραγόντων Σκοπός της ανάλυσης παραγόντων (ΑΠ) είναι να συνοψίσει τις σχέσεις ανάμεσα σε ένα μεγάλο αριθμό μεταβλητών με έναν περιεκτικό και ακριβή

Διαβάστε περισσότερα

ΤΕΙ ΠΕΙΡΑΙΑ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΕΠΙΣΤΗΜΗ ΤΩΝ ΑΠΟΦΑΣΕΩΝ ΜΕ ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ

ΤΕΙ ΠΕΙΡΑΙΑ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΕΠΙΣΤΗΜΗ ΤΩΝ ΑΠΟΦΑΣΕΩΝ ΜΕ ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ ΤΕΙ ΠΕΙΡΑΙΑ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΕΠΙΣΤΗΜΗ ΤΩΝ ΑΠΟΦΑΣΕΩΝ ΜΕ ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ ΜΑΘΗΜΑ: Ανάλυση Πολυδιάστατων (Πολυμεταβλητών) Δεδομένων και Συστήματα Εξόρυξης Δεδομένων (Multivariate Data

Διαβάστε περισσότερα

ΑΝΑΛΥΣΗ ΣΕ ΚΥΡΙΕΣ ΣΥΝΙΣΤΩΣΕΣ Α.Κ.Σ.

ΑΝΑΛΥΣΗ ΣΕ ΚΥΡΙΕΣ ΣΥΝΙΣΤΩΣΕΣ Α.Κ.Σ. ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ ΑΝΑΛΥΣΗ ΣΕ ΚΥΡΙΕΣ ΣΥΝΙΣΤΩΣΕΣ Α.Κ.Σ. Μ-Ν ΝΤΥΚΕΝ Ορισμός Σκοπός της Α.Κ.Σ. Η Α.Κ.Σ. εντάσσεται στις μεθόδους διερευνητικής ανάλυσης (exploratory) συνθετικών φαινόμενων (Παραγοντικές μεθόδοι).

Διαβάστε περισσότερα

Οδηγός Ανάλυσης Αξιοπιστίας και Εγκυρότητας Ψυχομετρικών Κλιμάκων με το SPSS

Οδηγός Ανάλυσης Αξιοπιστίας και Εγκυρότητας Ψυχομετρικών Κλιμάκων με το SPSS Οδηγός Ανάλυσης Αξιοπιστίας και Εγκυρότητας Ψυχομετρικών Κλιμάκων με το SPSS Άγγελος Μάρκος Λέκτορας ΠΤΔΕ, ΔΠΘ Αλεξανδρούπολη 2012 1. Εισαγωγή Η μέτρηση στις επιστήμες της συμπεριφοράς συχνά στοχεύει στην

Διαβάστε περισσότερα

ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Δρ. Βασίλης Π. Αγγελίδης Τμήμα Μηχανικών Παραγωγής & Διοίκησης Δημοκρίτειο Πανεπιστήμιο Θράκης

ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Δρ. Βασίλης Π. Αγγελίδης Τμήμα Μηχανικών Παραγωγής & Διοίκησης Δημοκρίτειο Πανεπιστήμιο Θράκης ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ Δρ. Βασίλης Π. Αγγελίδης Τμήμα Μηχανικών Παραγωγής & Διοίκησης Δημοκρίτειο Πανεπιστήμιο Θράκης Παραδείγματα στο Amos Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια

Διαβάστε περισσότερα

Διερεύνηση της Αξιοπιστίας και της Εγκυρότητας Ψυχομετρικής Κλίμακας με το λογισμικό SPSS

Διερεύνηση της Αξιοπιστίας και της Εγκυρότητας Ψυχομετρικής Κλίμακας με το λογισμικό SPSS Διερεύνηση της Αξιοπιστίας και της Εγκυρότητας Ψυχομετρικής Κλίμακας με το λογισμικό SPSS 1. Εισαγωγή Άγγελος Μάρκος Αλεξανδρούπολη, 04.04.2013 Η μέτρηση στις επιστήμες της συμπεριφοράς συχνά στοχεύει

Διαβάστε περισσότερα

ΜΕΘΟ ΟΛΟΓΙΑ ΕΚΠΑΙ ΕΥΤΙΚΗΣ ΕΡΕΥΝΑΣ

ΜΕΘΟ ΟΛΟΓΙΑ ΕΚΠΑΙ ΕΥΤΙΚΗΣ ΕΡΕΥΝΑΣ ΜΕΘΟ ΟΛΟΓΙΑ ΕΚΠΑΙ ΕΥΤΙΚΗΣ ΕΡΕΥΝΑΣ ΑΝΑΛΥΣΗ ΠΑΡΑΓΟΝΤΩΝ (FACTOR ANALYSIS) ΜΕ ΤΟ SPSS Ρ ΚΟΡΡΕΣ ΚΩΝΣΤΑΝΤΙΝΟΣ ΑΝΑΛΥΣΗ ΠΑΡΑΓΟΝΤΩΝ (FACTOR ANALYSIS) Η ανάλυση παραγόντων (Fact) είναι ουσιαστικά µία τεχνική µείωσης

Διαβάστε περισσότερα

Παραγοντική ανάλυση και SPSS Πρόχειρες σημειώσεις

Παραγοντική ανάλυση και SPSS Πρόχειρες σημειώσεις Παραγοντική ανάλυση και SPSS Πρόχειρες σημειώσεις ΣΤΟΧΟΣ ΠΑΡΑΓΟΝΤΙΚΗΣ ΑΝΑΛΥΣΗΣ Η εύρεση της ύπαρξης κοινών παραγόντων ανάμεσα σε μία ομάδα μεταβλητών. Τι επιτυγχάνεται? 1.Μείωση της διάστασης του προβλήματος.

Διαβάστε περισσότερα

ΜΕΘΟΔΟΙ ΕΡΥΕΝΑΣ ΔΙΑΛΕΞΗ 5: ΠΑΡΑΓΟΝΤΙΚΗ ΑΝΑΛΥΣΗ

ΜΕΘΟΔΟΙ ΕΡΥΕΝΑΣ ΔΙΑΛΕΞΗ 5: ΠΑΡΑΓΟΝΤΙΚΗ ΑΝΑΛΥΣΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΙΑΣ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΧΩΡΟΤΑΞΙΑΣ, ΠΟΛΕΟΔΟΜΙΑΣ ΚΑΙ ΠΕΡΙΦΕΡΕΙΑΚΗΣ ΑΝΑΠΤΥΞΗΣ ΠΜΣ «ΕΠΕΝΔΥΣΕΙΣ ΚΑΙ ΠΕΡΙΦΕΡΕΙΑΚΗ ΑΝΑΠΤΥΞΗ» ΜΕΘΟΔΟΙ ΕΡΥΕΝΑΣ ΔΙΑΛΕΞΗ 5: ΠΑΡΑΓΟΝΤΙΚΗ ΑΝΑΛΥΣΗ Δρ.

Διαβάστε περισσότερα

Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500

Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500 Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500 Πληθυσμός Δείγμα Δείγμα Δείγμα Ο ρόλος της Οικονομετρίας Οικονομική Θεωρία Διατύπωση της

Διαβάστε περισσότερα

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS)

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS) ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS) Έλεγχος Υποθέσεων για τους Μέσους - Εξαρτημένα Δείγματα (Paired samples t-test) Το κριτήριο Paired samples t-test χρησιμοποιείται όταν θέλουμε να συγκρίνουμε

Διαβάστε περισσότερα

ΔΗΜΟΚΡΙΤΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΡΑΚΗΣ Τμήμα Επιστήμης Φυσικής Αγωγής και Αθλητισμού Πρόγραμμα Διδακτορικών Σπουδών ΠΛΗΡΟΦΟΡΙΑΚΟ ΕΝΤΥΠΟ ΜΑΘΗΜΑΤΟΣ

ΔΗΜΟΚΡΙΤΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΡΑΚΗΣ Τμήμα Επιστήμης Φυσικής Αγωγής και Αθλητισμού Πρόγραμμα Διδακτορικών Σπουδών ΠΛΗΡΟΦΟΡΙΑΚΟ ΕΝΤΥΠΟ ΜΑΘΗΜΑΤΟΣ ΔΗΜΟΚΡΙΤΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΡΑΚΗΣ Τμήμα Επιστήμης Φυσικής Αγωγής και Αθλητισμού Πρόγραμμα Διδακτορικών Σπουδών ΠΛΗΡΟΦΟΡΙΑΚΟ ΕΝΤΥΠΟ ΜΑΘΗΜΑΤΟΣ 1. ΤΙΤΛΟΣ ΜΑΘΗΜΑΤΟΣ: Προχωρημένη Στατιστική 2. ΠΕΡΙΓΡΑΜΜΑ ΕΙΣΗΓΗΣΕΩΝ

Διαβάστε περισσότερα

ΣΥΣΧΕΤΙΣΗ και ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

ΣΥΣΧΕΤΙΣΗ και ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ Αλεξάνδρειο Τεχνολογικό Εκπαιδευτικό Ίδρυμα Θεσσαλονίκης Τμήμα Πληροφορικής Εργαστήριο «Θεωρία Πιθανοτήτων και Στατιστική» ΣΥΣΧΕΤΙΣΗ και ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ Περιεχόμενα 1. Συσχέτιση μεταξύ δύο ποσοτικών

Διαβάστε περισσότερα

Η ΜΕΘΟΔΟΣ PCA (Principle Component Analysis)

Η ΜΕΘΟΔΟΣ PCA (Principle Component Analysis) Η ΜΕΘΟΔΟΣ PCA (Principle Component Analysis) Η μέθοδος PCA (Ανάλυση Κύριων Συνιστωσών), αποτελεί μία γραμμική μέθοδο συμπίεσης Δεδομένων η οποία συνίσταται από τον επαναπροσδιορισμό των συντεταγμένων ενός

Διαβάστε περισσότερα

Αντικείμενο του κεφαλαίου είναι: Ανάλυση συσχέτισης μεταξύ δύο μεταβλητών. Εξίσωση παλινδρόμησης. Πρόβλεψη εξέλιξης

Αντικείμενο του κεφαλαίου είναι: Ανάλυση συσχέτισης μεταξύ δύο μεταβλητών. Εξίσωση παλινδρόμησης. Πρόβλεψη εξέλιξης Γραμμική Παλινδρόμηση και Συσχέτιση Αντικείμενο του κεφαλαίου είναι: Ανάλυση συσχέτισης μεταξύ δύο μεταβλητών Εξίσωση παλινδρόμησης Πρόβλεψη εξέλιξης Διμεταβλητές συσχετίσεις Πολλές φορές χρειάζεται να

Διαβάστε περισσότερα

Β Γραφικές παραστάσεις - Πρώτο γράφημα Σχεδιάζοντας το μήκος της σανίδας συναρτήσει των φάσεων της σελήνης μπορείτε να δείτε αν υπάρχει κάποιος συσχετισμός μεταξύ των μεγεθών. Ο συνήθης τρόπος γραφικής

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική ΟΙΚΟΝΟΜΕΤΡΙΑ Ενότητα 3: Ανάλυση γραμμικού υποδείγματος Απλή παλινδρόμηση (2 ο μέρος) Παπάνα Αγγελική Μεταδιδακτορική ερευνήτρια, ΑΠΘ E-mail: angeliki.papana@gmail.com, agpapana@auth.gr Webpage: http://users.auth.gr/agpapana

Διαβάστε περισσότερα

ΜΟΝΟΠΑΡΑΜΕΤΡΙΚΗ ΚΑΙ ΠΟΛΥΠΑΡΑΜΕΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ

ΜΟΝΟΠΑΡΑΜΕΤΡΙΚΗ ΚΑΙ ΠΟΛΥΠΑΡΑΜΕΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ ΜΟΝΟΠΑΡΑΜΕΤΡΙΚΗ ΚΑΙ ΠΟΛΥΠΑΡΑΜΕΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ ΣΤΑΤΙΣΤΙΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΓΙΑ ΤΟΝ ΕΝΤΟΠΙΣΜΟ ΓΕΩΧΗΜΙΚΗΣ ΑΝΩΜΑΛΙΑΣ Στατιστική ανάλυση του γεωχημικού δείγματος μας δίνει πληροφορίες για τον

Διαβάστε περισσότερα

Κεφάλαιο 9. Έλεγχοι υποθέσεων

Κεφάλαιο 9. Έλεγχοι υποθέσεων Κεφάλαιο 9 Έλεγχοι υποθέσεων 9.1 Εισαγωγή Όταν παίρνουμε ένα ή περισσότερα τυχαία δείγμα από κανονικούς πληθυσμούς έχουμε τη δυνατότητα να υπολογίζουμε στατιστικά, όπως μέσους όρους, δειγματικές διασπορές

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική ΟΙΚΟΝΟΜΕΤΡΙΑ Ενότητα 13: Επανάληψη Παπάνα Αγγελική Μεταδιδακτορική ερευνήτρια, ΑΠΘ E-mail: angeliki.papana@gmail.com, agpapana@auth.gr Webpage: http://users.auth.gr/agpapana 1 Γιατί μελετούμε την Οικονομετρία;

Διαβάστε περισσότερα

ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Τραπεζικής & Χρηματοοικονομικής

ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Τραπεζικής & Χρηματοοικονομικής ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Τραπεζικής & Χρηματοοικονομικής Υποθέσεις του Απλού γραμμικού υποδείγματος της Παλινδρόμησης Η μεταβλητή ε t (διαταρακτικός όρος) είναι τυχαία μεταβλητή με μέσο όρο

Διαβάστε περισσότερα

10. ΠΟΛΛΑΠΛΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

10. ΠΟΛΛΑΠΛΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ 0. ΠΟΛΛΑΠΛΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ 0. ΤΟ ΓΕΝΙΚΟ ΓΡΑΜΜΙΚΟ ΜΟΝΤΕΛΟ Συχνά στην πράξη το μοντέλο της απλής γραμμικής παλινδρόμησης είναι ανεπαρκές για την περιγραφή της μεταβλητότητας που υπάρχει στην εξαρτημένη

Διαβάστε περισσότερα

ΚΟΙΝΩΝΙΟΒΙΟΛΟΓΙΑ, ΝΕΥΡΟΕΠΙΣΤΗΜΕΣ ΚΑΙ ΕΚΠΑΙΔΕΥΣΗ

ΚΟΙΝΩΝΙΟΒΙΟΛΟΓΙΑ, ΝΕΥΡΟΕΠΙΣΤΗΜΕΣ ΚΑΙ ΕΚΠΑΙΔΕΥΣΗ A εξάμηνο 2009-2010 ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΚΟΙΝΩΝΙΟΒΙΟΛΟΓΙΑ, ΝΕΥΡΟΕΠΙΣΤΗΜΕΣ ΚΑΙ ΕΚΠΑΙΔΕΥΣΗ Μεθοδολογία Έρευνας και Στατιστική ΑΝΤΩΝΙΟΣ ΧΡ. ΜΠΟΥΡΑΣ Χειμερινό Εξάμηνο 2009-2010 Ποιοτικές και Ποσοτικές

Διαβάστε περισσότερα

Στατιστική Ι (ΨΥΧ-1202) Διάλεξη 6 Σχέσεις μεταξύ μεταβλητών

Στατιστική Ι (ΨΥΧ-1202) Διάλεξη 6 Σχέσεις μεταξύ μεταβλητών (ΨΥΧ-1202) Λεωνίδας Α. Ζαμπετάκης Β.Sc., M.Env.Eng., M.Ind.Eng., D.Eng. Εmail: statisticsuoc@gmail.com Διαλέξεις: ftp://ftp.soc.uoc.gr/psycho/zampetakis/ Διάλεξη 6 Σχέσεις μεταξύ μεταβλητών ΠΑΝΕΠΙΣΤΗΜΙΟ

Διαβάστε περισσότερα

ΤΜΗΜΑ ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥ ΣΧΕΔΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ. ΟΙΚΟΝΟΜΕΤΡΙΚΑ ΠΡΟΤΥΠΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ 1 ο ΕΡΓΑΣΤΗΡΙΟΥ ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΣΤΑΤΙΣΤΙΚΗΣ

ΤΜΗΜΑ ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥ ΣΧΕΔΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ. ΟΙΚΟΝΟΜΕΤΡΙΚΑ ΠΡΟΤΥΠΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ 1 ο ΕΡΓΑΣΤΗΡΙΟΥ ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΣΤΑΤΙΣΤΙΚΗΣ ΤΜΗΜΑ ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥ ΣΧΕΔΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ ΟΙΚΟΝΟΜΕΤΡΙΚΑ ΠΡΟΤΥΠΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ 1 ο ΕΡΓΑΣΤΗΡΙΟΥ ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΣΤΑΤΙΣΤΙΚΗΣ ΕΠΙΧ Οικονομετρικά Πρότυπα Διαφάνεια 1 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΣΤΑΤΙΣΤΙΚΗΣ

Διαβάστε περισσότερα

Κεφάλαιο 9. Έλεγχοι υποθέσεων

Κεφάλαιο 9. Έλεγχοι υποθέσεων Κεφάλαιο 9 Έλεγχοι υποθέσεων 9.1 Εισαγωγή Όταν παίρνουμε ένα ή περισσότερα τυχαία δείγμα από κανονικούς πληθυσμούς έχουμε τη δυνατότητα να υπολογίζουμε στατιστικά, όπως μέσους όρους, δειγματικές διασπορές

Διαβάστε περισσότερα

ΜΟΝΟΠΑΡΑΜΕΤΡΙΚΗ ΚΑΙ ΠΟΛΥΠΑΡΑΜΕΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Αριάδνη Αργυράκη

ΜΟΝΟΠΑΡΑΜΕΤΡΙΚΗ ΚΑΙ ΠΟΛΥΠΑΡΑΜΕΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Αριάδνη Αργυράκη ΜΟΝΟΠΑΡΑΜΕΤΡΙΚΗ ΚΑΙ ΠΟΛΥΠΑΡΑΜΕΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ Αριάδνη Αργυράκη ΣΤΑΔΙΑ ΕΚΤΕΛΕΣΗΣ ΠΕΡΙΒΑΛΛΟΝΤΙΚΩΝ ΓΕΩΧΗΜΙΚΩΝ ΕΡΕΥΝΩΝ 1.ΣΧΕΔΙΑΣΜΟΣ: - Καθορισμός στόχων έρευνας - Ιστορικό περιοχής 2 4.

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 07-08 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Επικ. Καθηγητής v.koutras@fme.aegea.gr Τηλ: 7035468 Θα μελετήσουμε

Διαβάστε περισσότερα

Μεθοδολογία των επιστημών του Ανθρώπου : Στατιστική Εργαστήριο 6 :

Μεθοδολογία των επιστημών του Ανθρώπου : Στατιστική Εργαστήριο 6 : Μεθοδολογία των επιστημών του Ανθρώπου : Στατιστική Εργαστήριο 6 : 1. Να χρησιμοποιηθεί το αρχείο gssft.sav για να γίνει έλεγχος της υπόθεσης ότι στους εργαζόμενους με πλήρη απασχόληση η τιμή του μέσου

Διαβάστε περισσότερα

ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Δρ. Βασίλης Π. Αγγελίδης Τμήμα Μηχανικών Παραγωγής & Διοίκησης Δημοκρίτειο Πανεπιστήμιο Θράκης

ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Δρ. Βασίλης Π. Αγγελίδης Τμήμα Μηχανικών Παραγωγής & Διοίκησης Δημοκρίτειο Πανεπιστήμιο Θράκης ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ Δρ. Βασίλης Π. Αγγελίδης Τμήμα Μηχανικών Παραγωγής & Διοίκησης Δημοκρίτειο Πανεπιστήμιο Θράκης Πολλαπλή Παλινδρόμηση Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Εργαστήριο) Διαφάνεια

Διαβάστε περισσότερα

Στατιστικές Υποθέσεις

Στατιστικές Υποθέσεις Τμήμα Λογιστικής και Χρηματοοικονομικής 1 Στατιστικές Υποθέσεις Δρ. Αγγελίδης Π. Βασίλειος 2 Εισαγωγή Ίσως το σπουδαιότερο μέρος της Στατιστικής επιστήμης. Εξαγωγή συμπερασμάτων για τις τιμές των παραμέτρων

Διαβάστε περισσότερα

Μονοπαραγοντική Ανάλυση Διακύμανσης Ανεξάρτητων Δειγμάτων

Μονοπαραγοντική Ανάλυση Διακύμανσης Ανεξάρτητων Δειγμάτων Μονοπαραγοντική Ανάλυση Διακύμανσης Ανεξάρτητων Δειγμάτων 1 Μονοπαραγοντική Ανάλυση Διακύμανσης Παραμετρικό στατιστικό κριτήριο για τη μελέτη της επίδρασης μιας ανεξάρτητης μεταβλητής στην εξαρτημένη Λογική

Διαβάστε περισσότερα

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS)

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS) ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS) Έλεγχος Υποθέσεων για την Μέση Τιμή ενός Δείγματος (One Sample t-test) Το κριτήριο One sample t-test χρησιμοποιείται όταν θέλουμε να συγκρίνουμε τον αριθμητικό

Διαβάστε περισσότερα

Χ. Εμμανουηλίδης, 1

Χ. Εμμανουηλίδης, 1 Εφαρμοσμένη Στατιστική Έρευνα Απλό Γραμμικό Υπόδειγμα AΠΛΟ ΓΡΑΜΜΙΚΟ ΥΠΟ ΕΙΓΜΑ Δρ. Χρήστος Εμμανουηλίδης Αν. Καθηγητής Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης Εφαρμοσμένη Στατιστική, Τμήμα Ο.Ε. ΑΠΘ Χ. Εμμανουηλίδης,

Διαβάστε περισσότερα

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 2 Μαΐου /23

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 2 Μαΐου /23 Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπιστήμιο Κρήτης 2 Μαΐου 2017 1/23 Ανάλυση Διακύμανσης. Η ανάλυση παλινδρόμησης μελετά τη στατιστική σχέση ανάμεσα

Διαβάστε περισσότερα

Στατιστική Ι (ΨΥΧ-1202) ιάλεξη 3

Στατιστική Ι (ΨΥΧ-1202) ιάλεξη 3 (ΨΥΧ-1202) Λεωνίδας Α. Ζαμπετάκης Β.Sc., M.Env.Eng., M.Ind.Eng., D.Eng. Εmail: statisticsuoc@gmail.com ιαλέξεις: ftp://ftp.soc.uoc.gr/psycho/zampetakis/ ιάλεξη 3 ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ ΤΜΗΜΑ ΨΥΧΟΛΟΓΙΑΣ Ρέθυμνο,

Διαβάστε περισσότερα

ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Δρ. Βασίλης Π. Αγγελίδης Τμήμα Μηχανικών Παραγωγής & Διοίκησης Δημοκρίτειο Πανεπιστήμιο Θράκης

ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Δρ. Βασίλης Π. Αγγελίδης Τμήμα Μηχανικών Παραγωγής & Διοίκησης Δημοκρίτειο Πανεπιστήμιο Θράκης ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ Δρ. Βασίλης Π. Αγγελίδης Τμήμα Μηχανικών Παραγωγής & Διοίκησης Δημοκρίτειο Πανεπιστήμιο Θράκης Περιεχόμενα Εισαγωγή Το πρόβλημα - Συντελεστής συσχέτισης Μοντέλο απλής γραμμικής παλινδρόμησης

Διαβάστε περισσότερα

Εισαγωγή στη Στατιστική

Εισαγωγή στη Στατιστική Εισαγωγή στη Στατιστική Μετεκπαιδευτικό Σεμινάριο στην ΨΥΧΟΚΟΙΝΩΝΙΚΗ ΑΠΟΚΑΤΑΣΤΑΣΗ ΨΥΧΟΚΟΙΝΩΝΙΚΕΣ ΘΕΡΑΠΕΥΤΙΚΕΣ ΠΡΟΣΕΓΓΙΣΕΙΣ Δημήτρης Φουσκάκης, Επίκουρος Καθηγητής, Τομέας Μαθηματικών, Σχολή Εφαρμοσμένων

Διαβάστε περισσότερα

(p 1) (p m) (m 1) (p 1)

(p 1) (p m) (m 1) (p 1) ΠΑΡΑΓΟΝΤΙΚΗ ΑΝΑΛΥΣΗ Σκοπός της παραγοντικής ανάλυσης είναι να περιγράψει την συνδιασπορά μεταξύ των μεταβλητών με την βοήθεια τυχαίων άγνωστων ποσοτήτων που ονομάζονται παράγοντες. Το μοντέλο είναι το

Διαβάστε περισσότερα

Συσχέτιση μεταξύ δύο συνόλων δεδομένων

Συσχέτιση μεταξύ δύο συνόλων δεδομένων Διαγράμματα διασποράς (scattergrams) Συσχέτιση μεταξύ δύο συνόλων δεδομένων Η οπτική απεικόνιση δύο συνόλων δεδομένων μπορεί να αποκαλύψει με παραστατικό τρόπο πιθανές τάσεις και μεταξύ τους συσχετίσεις,

Διαβάστε περισσότερα

ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ. Παπάνα Αγγελική

ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ. Παπάνα Αγγελική ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ 7o Μάθημα: Απλή παλινδρόμηση (ΕΠΑΝΑΛΗΨΗ) Παπάνα Αγγελική Μεταδιδακτορική ερευνήτρια, ΑΠΘ & ΠΑΜΑΚ E-mail: angeliki.papana@gmail.com, agpapana@auth.gr Webpage: http://users.auth.gr/agpapana

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική ΟΙΚΟΝΟΜΕΤΡΙΑ Ενότητα 4: Ανάλυση γραμμικού υποδείγματος Απλή παλινδρόμηση (3 ο μέρος) Παπάνα Αγγελική Μεταδιδακτορική ερευνήτρια, ΑΠΘ E-mail: angeliki.papana@gmail.com, agpapana@auth.gr Webpage: http://users.auth.gr/agpapana

Διαβάστε περισσότερα

5. ΤΟ ΓΕΝΙΚΟ ΓΡΑΜΜΙΚΟ ΜΟΝΤΕΛΟ (GENERAL LINEAR MODEL) 5.1 Εναλλακτικά μοντέλα του απλού γραμμικού μοντέλου: Το εκθετικό μοντέλο

5. ΤΟ ΓΕΝΙΚΟ ΓΡΑΜΜΙΚΟ ΜΟΝΤΕΛΟ (GENERAL LINEAR MODEL) 5.1 Εναλλακτικά μοντέλα του απλού γραμμικού μοντέλου: Το εκθετικό μοντέλο 5. ΤΟ ΓΕΝΙΚΟ ΓΡΑΜΜΙΚΟ ΜΟΝΤΕΛΟ (GENERAL LINEAR MODEL) 5.1 Εναλλακτικά μοντέλα του απλού γραμμικού μοντέλου: Το εκθετικό μοντέλο Ένα εναλλακτικό μοντέλο της απλής γραμμικής παλινδρόμησης (που χρησιμοποιήθηκε

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική ΟΙΚΟΝΟΜΕΤΡΙΑ Ενότητα 6: Ανάλυση γραμμικού υποδείγματος Πολυμεταβλητή παλινδρόμηση (2 ο μέρος) Παπάνα Αγγελική Μεταδιδακτορική ερευνήτρια, ΑΠΘ E-mail: angeliki.papana@gmail.com, agpapana@auth.gr Webpage:

Διαβάστε περισσότερα

ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ ΜΕΘΟΔΟΙ ΠΟΛΥΜΕΤΑΒΛΗΤΗΣ ΣΤΑΤΙΣΤΙΚΗΣ ΑΝΑΛΥΣΗΣ ΚΑΙ ΕΦΑΡΜΟΓΕΣ. Ναταλία Δ. Μαύρου

ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ ΜΕΘΟΔΟΙ ΠΟΛΥΜΕΤΑΒΛΗΤΗΣ ΣΤΑΤΙΣΤΙΚΗΣ ΑΝΑΛΥΣΗΣ ΚΑΙ ΕΦΑΡΜΟΓΕΣ. Ναταλία Δ. Μαύρου ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΚΑΙ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΟΜΕΑΣ ΜΑΘΗΜΑΤΙΚΩΝ ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ ΜΕΘΟΔΟΙ ΠΟΛΥΜΕΤΑΒΛΗΤΗΣ ΣΤΑΤΙΣΤΙΚΗΣ ΑΝΑΛΥΣΗΣ ΚΑΙ ΕΦΑΡΜΟΓΕΣ Ναταλία Δ. Μαύρου ΑΘΗΝΑ,

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 6 ΠΑΡΑΓΟΝΤΙΚΗ ΑΝΑΛΥΣΗ ΤΩΝ ΒΑΘΜΟΛΟΓΙΩΝ ΟΙ ΣΥΝΙΣΤΩΣΕΣ ΤΗΣ ΜΑΘΗΤΙΚΗΣ ΕΠΙ ΟΣΗΣ

ΚΕΦΑΛΑΙΟ 6 ΠΑΡΑΓΟΝΤΙΚΗ ΑΝΑΛΥΣΗ ΤΩΝ ΒΑΘΜΟΛΟΓΙΩΝ ΟΙ ΣΥΝΙΣΤΩΣΕΣ ΤΗΣ ΜΑΘΗΤΙΚΗΣ ΕΠΙ ΟΣΗΣ ΚΕΦΑΛΑΙΟ 6 ΠΑΡΑΓΟΝΤΙΚΗ ΑΝΑΛΥΣΗ ΤΩΝ ΒΑΘΜΟΛΟΓΙΩΝ ΟΙ ΣΥΝΙΣΤΩΣΕΣ ΤΗΣ ΜΑΘΗΤΙΚΗΣ ΕΠΙ ΟΣΗΣ Εισαγωγή Στο κεφάλαιο αυτό επιχειρούµε να εξάγουµε τις συνιστώσες της µαθητικής επίδοσης, χρησιµοποιώντας παραγοντική

Διαβάστε περισσότερα

+ ε βελτιώνει ουσιαστικά το προηγούμενο (β 3 = 0;) 2. Εξετάστε ποιο από τα παρακάτω τρία μοντέλα:

+ ε βελτιώνει ουσιαστικά το προηγούμενο (β 3 = 0;) 2. Εξετάστε ποιο από τα παρακάτω τρία μοντέλα: ΑΝΑΛΥΣΗ ΠΑΛΙΝΔΡΟΜΗΣΗΣ, 6-5-0 Άσκηση 8. Δίνονται οι παρακάτω 0 παρατηρήσεις (πίνακας Α) με βάση τις οποίες θέλουμε να δημιουργήσουμε ένα γραμμικό μοντέλο για την πρόβλεψη της Υ μέσω των ανεξάρτητων μεταβλητών

Διαβάστε περισσότερα

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ Σ ΤΑΤ Ι Σ Τ Ι Κ Η i ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ Κατανομή Δειγματοληψίας του Δειγματικού Μέσου Ο Δειγματικός Μέσος X είναι μια Τυχαία Μεταβλητή. Καθώς η επιλογή και χρήση διαφορετικών δειγμάτων από έναν

Διαβάστε περισσότερα

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΔΙΑΧΕΙΡΙΣΗΣ ΚΙΝΔΥΝΟΥ. Συσχέτιση (Correlation) - Copulas

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΔΙΑΧΕΙΡΙΣΗΣ ΚΙΝΔΥΝΟΥ. Συσχέτιση (Correlation) - Copulas ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΔΙΑΧΕΙΡΙΣΗΣ ΚΙΝΔΥΝΟΥ Συσχέτιση (Correlation) - Copulas Σημασία της μέτρησης της συσχέτισης Έστω μία εταιρεία που είναι εκτεθειμένη σε δύο μεταβλητές της αγοράς. Πιθανή αύξηση των 2 μεταβλητών

Διαβάστε περισσότερα

Τομέας Βιομηχανικής Διοίκησης και Επιχειρησιακής Έρευνας

Τομέας Βιομηχανικής Διοίκησης και Επιχειρησιακής Έρευνας Εθνικό Μετσόβιο Πολυτεχνείο Τομέας Βιομηχανικής Διοίκησης και Επιχειρησιακής Έρευνας Έρευνα Αγοράς Μέρος 2 ο - Έλεγχοι Συσχέτισης και Πολυμεταβλητή Στατιστική 1 Περιεχόμενα 1. Έλεγχοι Συσχετίσεων Δύο Μεταβλητών

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 06-07 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Επικ. Καθηγητής v.koutra@fme.aegea.gr Τηλ: 7035468 Θα μελετήσουμε

Διαβάστε περισσότερα

ΕΠΙΣΤΗΜΟΝΙΚΟ ΕΠΙΜΟΡΦΩΤΙΚΟ ΣΕΜΙΝΑΡΙΟ «ΚΑΤΑΡΤΙΣΗ ΕΡΩΤΗΜΑΤΟΛΟΓΙΟΥ ΚΑΙ ΣΤΑΤΙΣΤΙΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΔΕΔΟΜΕΝΩΝ» Τριανταφυλλίδου Ιωάννα Μαθηματικός

ΕΠΙΣΤΗΜΟΝΙΚΟ ΕΠΙΜΟΡΦΩΤΙΚΟ ΣΕΜΙΝΑΡΙΟ «ΚΑΤΑΡΤΙΣΗ ΕΡΩΤΗΜΑΤΟΛΟΓΙΟΥ ΚΑΙ ΣΤΑΤΙΣΤΙΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΔΕΔΟΜΕΝΩΝ» Τριανταφυλλίδου Ιωάννα Μαθηματικός ΕΠΙΣΤΗΜΟΝΙΚΟ ΕΠΙΜΟΡΦΩΤΙΚΟ ΣΕΜΙΝΑΡΙΟ «ΚΑΤΑΡΤΙΣΗ ΕΡΩΤΗΜΑΤΟΛΟΓΙΟΥ ΚΑΙ ΣΤΑΤΙΣΤΙΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΔΕΔΟΜΕΝΩΝ» ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΜΕ ΤΟ SPSS To SPSS θα: - Κάνει πολύπλοκη στατιστική ανάλυση σε δευτερόλεπτα -

Διαβάστε περισσότερα

Μενύχτα, Πιπερίγκου, Σαββάτης. ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 6 ο

Μενύχτα, Πιπερίγκου, Σαββάτης. ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 6 ο Παράδειγμα 1 Ο παρακάτω πίνακας δίνει τις πωλήσεις (ζήτηση) ενός προϊόντος Υ (σε κιλά) από το delicatessen μιας περιοχής και τις αντίστοιχες τιμές Χ του προϊόντος (σε ευρώ ανά κιλό) για μια ορισμένη χρονική

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΕΤΡΙΑ. Βιολέττα Δάλλα. Εθνικό και Καποδιστριακό Πανεπιστήµιο Αθηνών

ΟΙΚΟΝΟΜΕΤΡΙΑ. Βιολέττα Δάλλα. Εθνικό και Καποδιστριακό Πανεπιστήµιο Αθηνών ΟΙΚΟΝΟΜΕΤΡΙΑ Βιολέττα Δάλλα Τµήµα Οικονοµικών Επιστηµών Εθνικό και Καποδιστριακό Πανεπιστήµιο Αθηνών 1 Εισαγωγή Οικονοµετρία (Econometrics) είναι ο τοµέας της Οικονοµικής επιστήµης που περιγράφει και αναλύει

Διαβάστε περισσότερα

Διάλεξη 1 Βασικές έννοιες

Διάλεξη 1 Βασικές έννοιες Εργαστήριο SPSS Ψ-4201 (ΕΡΓ) Λεωνίδας Α. Ζαμπετάκης Β.Sc., M.Env.Eng., M.Ind.Eng., D.Eng. Εmail: statisticsuoc@gmail.com Διαλέξεις αναρτημένες στο: Διαλέξεις: ftp://ftp.soc.uoc.gr/psycho/zampetakis/ Διάλεξη

Διαβάστε περισσότερα

H ΑΝΑΛΥΣΗ ΣΥΣΧΕΤΙΣΗΣ (PEARSON s r)

H ΑΝΑΛΥΣΗ ΣΥΣΧΕΤΙΣΗΣ (PEARSON s r) 5 H ΑΝΑΛΥΣΗ ΣΥΣΧΕΤΙΣΗΣ (PEARSON s r) Περίληψη Σκοπός του κεφαλαίου είναι η εφαρμογή της ανάλυσης συσχέτισης (Pearson r) μέσω του PASW. H ανάλυση συσχέτισης Pearson r χρησιμοποιείται για να εξεταστεί η

Διαβάστε περισσότερα

Παράδειγμα: Γούργουλης Βασίλειος, Επίκουρος Καθηγητής Τ.Ε.Φ.Α.Α. Δ.Π.Θ.

Παράδειγμα: Γούργουλης Βασίλειος, Επίκουρος Καθηγητής Τ.Ε.Φ.Α.Α. Δ.Π.Θ. Έλεγχος ύπαρξης στατιστικά σημαντικών διαφορών μεταξύ περισσότερων από δύο ανεξάρτητων δειγμάτων, που διαχωρίζονται βάσει ενός ανεξάρτητου παράγοντα (Ανάλυση διακύμανσης για ανεξάρτητα δείγματα ως προς

Διαβάστε περισσότερα

Απλή Γραμμική Παλινδρόμηση II

Απλή Γραμμική Παλινδρόμηση II . Ο Συντελεστής Προσδιορισμού Η γραμμή Παλινδρόμησης στο δείγμα, αποτελεί μία εκτίμηση της γραμμής παλινδρόμησης στον πληθυσμό. Αν και από τη μέθοδο των ελαχίστων τετραγώνων προκύπτουν εκτιμητές που έχουν

Διαβάστε περισσότερα

ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΤΜΗΜΑ ΟΡΓΑΝΩΣΗΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΔΙΔΑΣΚΩΝ: ΘΑΝΑΣΗΣ ΚΑΖΑΝΑΣ. Οικονομετρία

ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΤΜΗΜΑ ΟΡΓΑΝΩΣΗΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΔΙΔΑΣΚΩΝ: ΘΑΝΑΣΗΣ ΚΑΖΑΝΑΣ. Οικονομετρία ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΤΜΗΜΑ ΟΡΓΑΝΩΣΗΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΔΙΔΑΣΚΩΝ: ΘΑΝΑΣΗΣ ΚΑΖΑΝΑΣ Οικονομετρία 4.1 Πολλαπλό Γραμμικό Υπόδειγμα Παλινδρόμησης Γενικεύοντας τη διμεταβλητή (Y, X) συνάρτηση

Διαβάστε περισσότερα

Έλεγχος ύπαρξης στατιστικά σημαντικών διαφορών μεταξύ δύο εξαρτημένων δειγμάτων, που ακολουθούν την κανονική κατανομή (t-test για εξαρτημένα δείγματα)

Έλεγχος ύπαρξης στατιστικά σημαντικών διαφορών μεταξύ δύο εξαρτημένων δειγμάτων, που ακολουθούν την κανονική κατανομή (t-test για εξαρτημένα δείγματα) Έλεγχος ύπαρξης στατιστικά σημαντικών διαφορών μεταξύ δύο εξαρτημένων δειγμάτων, που ακολουθούν την κανονική κατανομή (t-test για εξαρτημένα δείγματα) Όπως αναφέρθηκε στο προηγούμενο κεφάλαιο σε ορισμένες

Διαβάστε περισσότερα

Συνάφεια μεταξύ ποιοτικών μεταβλητών. Εκδ. #3,

Συνάφεια μεταξύ ποιοτικών μεταβλητών. Εκδ. #3, Συνάφεια μεταξύ ποιοτικών μεταβλητών Εκδ. #3, 19.03.2016 Ο έλεγχος ανεξαρτησίας χ 2 Ο έλεγχος ανεξαρτησίας χ 2 εφαρμόζεται για να εξετάσουμε τη συνάφεια μεταξύ δύο ποιοτικών μεταβλητών με την έννοια της

Διαβάστε περισσότερα

2. ΧΡΗΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΠΑΚΕΤΩΝ ΣΤΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

2. ΧΡΗΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΠΑΚΕΤΩΝ ΣΤΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ 2. ΧΡΗΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΠΑΚΕΤΩΝ ΣΤΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ Η χρησιμοποίηση των τεχνικών της παλινδρόμησης για την επίλυση πρακτικών προβλημάτων έχει διευκολύνει εξαιρετικά από την χρήση διαφόρων στατιστικών

Διαβάστε περισσότερα

Διαχείριση Υδατικών Πόρων

Διαχείριση Υδατικών Πόρων Εθνικό Μετσόβιο Πολυτεχνείο Διαχείριση Υδατικών Πόρων Γ.. Τσακίρης Μάθημα 3 ο Λεκάνη απορροής Υπάρχουσα κατάσταση Σενάριο 1: Μέσες υδρολογικές συνθήκες Σενάριο : Δυσμενείς υδρολογικές συνθήκες Μελλοντική

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ 1 ΕΙΣΑΓΩΓΗ... 1 2 ΤΟ PASW ΜΕ ΜΙΑ ΜΑΤΙΑ... 13 3 ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ: Η ΜΕΣΗ ΤΙΜΗ ΚΑΙ Η ΔΙΑΜΕΣΟΣ... 29

ΠΕΡΙΕΧΟΜΕΝΑ 1 ΕΙΣΑΓΩΓΗ... 1 2 ΤΟ PASW ΜΕ ΜΙΑ ΜΑΤΙΑ... 13 3 ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ: Η ΜΕΣΗ ΤΙΜΗ ΚΑΙ Η ΔΙΑΜΕΣΟΣ... 29 ΠΕΡΙΕΧΟΜΕΝΑ 1 ΕΙΣΑΓΩΓΗ... 1 Μεταβλητές...5 Πληθυσμός, δείγμα...7 Το ευρύτερο γραμμικό μοντέλο...8 Αναφορές στη βιβλιογραφία... 11 2 ΤΟ PASW ΜΕ ΜΙΑ ΜΑΤΙΑ... 13 Περίληψη... 13 Εισαγωγή... 13 Με μια ματιά...

Διαβάστε περισσότερα

ΜΑΘΗΜΑ 3ο. Υποδείγματα μιας εξίσωσης

ΜΑΘΗΜΑ 3ο. Υποδείγματα μιας εξίσωσης ΜΑΘΗΜΑ 3ο Υποδείγματα μιας εξίσωσης Οι βασικές υποθέσεις 1. Ο διαταρακτικός όρος u t είναι μια τυχαία μεταβλητή με μέσο το μηδέν. Eu t = 0 για t = 1,2,3..n 2. Η διακύμανση της τυχαίας μεταβλητής u t είναι

Διαβάστε περισσότερα

ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Δρ. Βασίλης Π. Αγγελίδης Τμήμα Μηχανικών Παραγωγής & Διοίκησης Δημοκρίτειο Πανεπιστήμιο Θράκης

ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Δρ. Βασίλης Π. Αγγελίδης Τμήμα Μηχανικών Παραγωγής & Διοίκησης Δημοκρίτειο Πανεπιστήμιο Θράκης ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ Δρ. Βασίλης Π. Αγγελίδης Τμήμα Μηχανικών Παραγωγής & Διοίκησης Δημοκρίτειο Πανεπιστήμιο Θράκης Εισαγωγή στο Amos Δρ. Βασίλης Π. Αγγελίδης Ανάλυση Δεδομένων (Θεωρία) Διαφάνεια 2 Περιεχόμενα

Διαβάστε περισσότερα

HMY 795: Αναγνώριση Προτύπων

HMY 795: Αναγνώριση Προτύπων HMY 795: Αναγνώριση Προτύπων Διάλεξη 2 Επισκόπηση θεωρίας πιθανοτήτων Τυχαίες μεταβλητές: Βασικές έννοιες Τυχαία μεταβλητή: Μεταβλητή της οποίας δε γνωρίζουμε με βεβαιότητα την τιμή (σε αντίθεση με τις

Διαβάστε περισσότερα

Έλεγχος για τις παραμέτρους θέσης δύο πληθυσμών με εξαρτημένα δείγματα

Έλεγχος για τις παραμέτρους θέσης δύο πληθυσμών με εξαρτημένα δείγματα ΚΕΦΑΛΑΙΟ ΕΚΤΟ Έλεγχος για τις παραμέτρους θέσης δύο πληθυσμών με εξαρτημένα δείγματα Στο κεφάλαιο αυτό θα ασχοληθούμε με τον έλεγχο της υπόθεσης της ισότητα δύο μέσων τιμών με εξαρτημένα δείγματα. Εξαρτημένα

Διαβάστε περισσότερα

Εισαγωγή στην Ανάλυση Δεδομένων

Εισαγωγή στην Ανάλυση Δεδομένων ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ ΔΙΑΛΕΞΗ 09-10-2015 Εισαγωγή στην Ανάλυση Δεδομένων Βασικές έννοιες Αν. Καθ. Μαρί-Νοέλ Ντυκέν ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ ΔΙΑΛΕΞΗ 30-10-2015 1. Στατιστικοί παράμετροι - Διάστημα εμπιστοσύνης Υπολογισμός

Διαβάστε περισσότερα

ΘΕΩΡΙΑ ΟΙΚΟΝΟΜΕΤΡΙΑΣ ΣΥΝΟΠΤΙΚΕΣ ΣΗΜΕΙΩΣΕΙΣ

ΘΕΩΡΙΑ ΟΙΚΟΝΟΜΕΤΡΙΑΣ ΣΥΝΟΠΤΙΚΕΣ ΣΗΜΕΙΩΣΕΙΣ ΘΕΩΡΙΑ ΟΙΚΟΝΟΜΕΤΡΙΑΣ ΣΥΝΟΠΤΙΚΕΣ ΣΗΜΕΙΩΣΕΙΣ ΑΠΛΟ ΓΡΑΜΜΙΚΟ ΥΠΟΔΕΙΓΜΑ Συντελεστής συσχέτισης (εκτιμητής Person: r, Y ( ( Y Y xy ( ( Y Y x y, όπου r, Y (ισχυρή θετική γραμμική συσχέτιση όταν, ισχυρή αρνητική

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΕΤΡΙΑ Κεφάλαιο 2

ΟΙΚΟΝΟΜΕΤΡΙΑ Κεφάλαιο 2 013 [Κεφάλαιο ] ΟΙΚΟΝΟΜΕΤΡΙΑ Κεφάλαιο Μάθημα Εαρινού Εξάμηνου 01-013 M.E. OE0300 Πανεπιστήμιο Θεσσαλίας Τμήμα Μηχανικών Χωροταξίας, Πολεοδομίας και Περιφερειακής Ανάπτυξης [Οικονομετρία 01-013] Μαρί-Νοέλ

Διαβάστε περισσότερα

Στατιστική Ι. Ενότητα 9: Κατανομή t-έλεγχος Υποθέσεων. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

Στατιστική Ι. Ενότητα 9: Κατανομή t-έλεγχος Υποθέσεων. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών Στατιστική Ι Ενότητα 9: Κατανομή t-έλεγχος Υποθέσεων Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για

Διαβάστε περισσότερα

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium iv

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium iv Σ ΤΑΤ Ι Σ Τ Ι Κ Η i Statisticum collegium iv Στατιστική Συμπερασματολογία Ι Σημειακές Εκτιμήσεις Διαστήματα Εμπιστοσύνης Στατιστική Συμπερασματολογία (Statistical Inference) Το πεδίο της Στατιστικής Συμπερασματολογία,

Διαβάστε περισσότερα

----------Εισαγωγή στη Χρήση του SPSS for Windows ------------- Σελίδα: 0------------

----------Εισαγωγή στη Χρήση του SPSS for Windows ------------- Σελίδα: 0------------ ----------Εισαγωγή στη Χρήση του SPSS for Windows ------------- Σελίδα: 0------------ ΚΕΦΑΛΑΙΟ 8 ο 8.1 Συντελεστές συσχέτισης: 8.1.1 Συσχέτιση Pearson, και ρ του Spearman 8.1.2 Υπολογισµός του συντελεστή

Διαβάστε περισσότερα

Οι νέοι και το περιβάλλον: Περιβαλλοντικές στάσεις και συµπεριφορά µαθητών Λυκείων και ΤΕΕ του Ν. Ροδόπης

Οι νέοι και το περιβάλλον: Περιβαλλοντικές στάσεις και συµπεριφορά µαθητών Λυκείων και ΤΕΕ του Ν. Ροδόπης Οι νέοι και το περιβάλλον: Περιβαλλοντικές στάσεις και συµπεριφορά µαθητών Λυκείων και ΤΕΕ του Ν. Ροδόπης Ευρ. Παπαδηµητρίου, Λέκτορας Κοινωνιολογίας Τµήµα Κοινωνικής ιοίκησης, ηµοκρίτειο Πανεπιστήµιο

Διαβάστε περισσότερα

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ. ΜΑΘΗΜΑ 4ο

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ. ΜΑΘΗΜΑ 4ο ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΜΑΘΗΜΑ 4ο Διαδικασία των συντελεστών αυτοσυσχέτισης Ονομάζουμε συνάρτηση αυτοσυσχέτισης (autocorrelation function) και συμβολίζεται με τα γράμματα

Διαβάστε περισσότερα

Περιεχόμενα. Πρόλογος... 15

Περιεχόμενα. Πρόλογος... 15 Περιεχόμενα Πρόλογος... 15 Κεφάλαιο 1 ΘΕΩΡΗΤΙΚΑ ΚΑΙ ΦΙΛΟΣΟΦΙΚΑ ΟΝΤΟΛΟΓΙΚΑ ΚΑΙ ΕΠΙΣΤΗΜΟΛΟΓΙΚΑ ΖΗΤΗΜΑΤΑ ΤΗΣ ΜΕΘΟΔΟΛΟΓΙΑΣ ΕΡΕΥΝΑΣ ΤΟΥ ΠΡΑΓΜΑΤΙΚΟΥ ΚΟΣΜΟΥ... 17 Το θεμελιώδες πρόβλημα των κοινωνικών επιστημών...

Διαβάστε περισσότερα

Στατιστικός έλεγχος υποθέσεων (Μέρος 1 ο ) 24/2/2017

Στατιστικός έλεγχος υποθέσεων (Μέρος 1 ο ) 24/2/2017 Στατιστικός έλεγχος υποθέσεων (Μέρος 1 ο ) 24/2/2017 2 Η γενική ιδέα της διαδικασίας στατιστικού ελέγχου υποθέσεων Πρόκειται για μια διαδικασία απόφασης μεταξύ δύο υποθέσεων Η μια υπόθεση ονομάζεται μηδενική

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ Ερωτήσεις πολλαπλής επιλογής Συντάκτης: Δημήτριος Κρέτσης 1. Ο κλάδος της περιγραφικής Στατιστικής: α. Ασχολείται με την επεξεργασία των δεδομένων και την ανάλυση

Διαβάστε περισσότερα

3. ΣΕΙΡΙΑΚΟΣ ΣΥΝΤΕΛΕΣΤΗΣ ΣΥΣΧΕΤΙΣΗΣ

3. ΣΕΙΡΙΑΚΟΣ ΣΥΝΤΕΛΕΣΤΗΣ ΣΥΣΧΕΤΙΣΗΣ 3. ΣΕΙΡΙΑΚΟΣ ΣΥΝΤΕΛΕΣΤΗΣ ΣΥΣΧΕΤΙΣΗΣ Πρόβλημα: Ένας ραδιοφωνικός σταθμός ενδιαφέρεται να κάνει μια ανάλυση για τους πελάτες του που διαφημίζονται σ αυτόν για να εξετάσει την ποσοστιαία μεταβολή των πωλήσεων

Διαβάστε περισσότερα

Ανάλυση διακύμανσης (Μέρος 1 ο ) 17/3/2017

Ανάλυση διακύμανσης (Μέρος 1 ο ) 17/3/2017 Ανάλυση διακύμανσης (Μέρος 1 ο ) 17/3/2017 2 Γιατί ανάλυση διακύμανσης; (1) Ας θεωρήσουμε k πληθυσμούς με μέσες τιμές μ 1, μ 2,, μ k, αντίστοιχα Πως μπορούμε να συγκρίνουμε τις μέσες τιμές k πληθυσμών

Διαβάστε περισσότερα

Στατιστικός έλεγχος υποθέσεων (Μέρος 1 ο )

Στατιστικός έλεγχος υποθέσεων (Μέρος 1 ο ) Στατιστικός έλεγχος υποθέσεων (Μέρος 1 ο ) 2 Η γενική ιδέα της διαδικασίας στατιστικού ελέγχου υποθέσεων Πρόκειται για μια διαδικασία απόφασης μεταξύ δύο υποθέσεων Η μια υπόθεση ονομάζεται μηδενική (Η

Διαβάστε περισσότερα

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Στατιστική II Διάλεξη 1 η : Εισαγωγή-Επανάληψη βασικών εννοιών Εβδομάδα 1 η : ,

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Στατιστική II Διάλεξη 1 η : Εισαγωγή-Επανάληψη βασικών εννοιών Εβδομάδα 1 η : , Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Στατιστική II Διάλεξη 1 η : Εισαγωγή-Επανάληψη βασικών εννοιών Εβδομάδα 1 η :1-0-017, 3-0-017 Διδάσκουσα: Κοντογιάννη Αριστούλα Σκοπός του μαθήματος Η παρουσίαση

Διαβάστε περισσότερα

Α. Μπατσίδης Πρόχειρες βοηθητικές διδακτικές σημειώσεις

Α. Μπατσίδης Πρόχειρες βοηθητικές διδακτικές σημειώσεις Α. Μπατσίδης Πρόχειρες βοηθητικές διδακτικές σημειώσεις Οι παρούσες σημειώσεις επιχειρούν να αποτελέσουν μια βοήθεια τόσο στην παρακολούθηση της διάλεξης όσο και στη μελέτη κάποιων εκ των θεμάτων της Γραμμικής

Διαβάστε περισσότερα

ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ. Παπάνα Αγγελική

ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ. Παπάνα Αγγελική ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ 7ο μάθημα: Πολυμεταβλητή παλινδρόμηση (ΕΠΑΝΑΛΗΨΗ) Παπάνα Αγγελική Μεταδιδακτορική ερευνήτρια, ΑΠΘ & ΠΑΜΑΚ E-mail: angeliki.papana@gmail.com, agpapana@auth.gr Webpage: http://users.auth.gr/agpapana

Διαβάστε περισσότερα

Κεφάλαιο 14. Ανάλυση ιακύµανσης Μονής Κατεύθυνσης. Ανάλυση ιακύµανσης Μονής Κατεύθυνσης

Κεφάλαιο 14. Ανάλυση ιακύµανσης Μονής Κατεύθυνσης. Ανάλυση ιακύµανσης Μονής Κατεύθυνσης Κεφάλαιο 14 Ανάλυση ιακύµανσης Μονής Κατεύθυνσης 1 Ανάλυση ιακύµανσης Μονής Κατεύθυνσης Παραµετρικό στατιστικό κριτήριο για τη µελέτη της επίδρασης µιας ανεξάρτητης µεταβλητής στην εξαρτηµένη Λογική παρόµοια

Διαβάστε περισσότερα

ΠΟΣΟΤΙΚΕΣ ΜΕΘΟΔΟΙ ΙI (ΣΤΑΤΙΣΤΙΚΗ ΓΙΑ ΤΗ ΔΙΟΙΚΗΣΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ) (ΟΔΕ 2116)

ΠΟΣΟΤΙΚΕΣ ΜΕΘΟΔΟΙ ΙI (ΣΤΑΤΙΣΤΙΚΗ ΓΙΑ ΤΗ ΔΙΟΙΚΗΣΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ) (ΟΔΕ 2116) Σελίδα 1 ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΟΡΓΑΝΩΣΗΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΜΑΘΗΜΑ: ΠΟΣΟΤΙΚΕΣ ΜΕΘΟΔΟΙ ΙΙ (ΣΤΑΤΙΣΤΙΚΗ ΓΙΑ ΤΗ ΔΙΟΙΚΗΣΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ) (ΟΔΕ 2116) ΠΑΝΕΠΙΣΤΗΜΙΑΚΟΣ ΥΠΟΤΡΟΦΟΣ ΠΑΝΑΓΙΩΤΗΣ

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ 1 ΕΙΣΑΓΩΓΗ ΤΟ PASW ΜΕ ΜΙΑ ΜΑΤΙΑ ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ: Η ΜΕΣΗ ΤΙΜΗ ΚΑΙ Η ΔΙΑΜΕΣΟΣ... 29

ΠΕΡΙΕΧΟΜΕΝΑ 1 ΕΙΣΑΓΩΓΗ ΤΟ PASW ΜΕ ΜΙΑ ΜΑΤΙΑ ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ: Η ΜΕΣΗ ΤΙΜΗ ΚΑΙ Η ΔΙΑΜΕΣΟΣ... 29 ΠΕΡΙΕΧΟΜΕΝΑ 1 ΕΙΣΑΓΩΓΗ... 1 Μεταβλητές...5 Πληθυσμός, δείγμα...7 Το ευρύτερο γραμμικό μοντέλο...8 Αναφορές στη βιβλιογραφία... 11 2 ΤΟ PASW ΜΕ ΜΙΑ ΜΑΤΙΑ... 13 Περίληψη... 13 Εισαγωγή... 13 Με μια ματιά...

Διαβάστε περισσότερα

Στατιστική, Άσκηση 2. (Κανονική κατανομή)

Στατιστική, Άσκηση 2. (Κανονική κατανομή) Στατιστική, Άσκηση 2 (Κανονική κατανομή) Στον πίνακα που ακολουθεί δίνονται οι μέσες παροχές όπως προέκυψαν από μετρήσεις πεδίου σε μια διατομή ενός ποταμού. Ζητείται: 1. Να αποδειχθεί ότι το δείγμα προσαρμόζεται

Διαβάστε περισσότερα

Ποσοτικές Μέθοδοι Ανάλυσης στις Κοινωνικές Επιστήμες

Ποσοτικές Μέθοδοι Ανάλυσης στις Κοινωνικές Επιστήμες ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Ποσοτικές Μέθοδοι Ανάλυσης στις Κοινωνικές Επιστήμες Ενότητα 9 : Περιγραφή του ελέγχου Χ 2 Θεόδωρος Χατζηπαντελής Άδειες Χρήσης Το παρόν

Διαβάστε περισσότερα

Πολλαπλή παλινδρόμηση (Multivariate regression)

Πολλαπλή παλινδρόμηση (Multivariate regression) ΜΑΘΗΜΑ 3 ο 1 Πολλαπλή παλινδρόμηση (Multivariate regression) Η συμπεριφορά των περισσότερων οικονομικών μεταβλητών είναι συνάρτηση όχι μιας αλλά πολλών μεταβλητών Υ = f ( X 1, X 2,... X n ) δηλαδή η Υ

Διαβάστε περισσότερα

Ερωτήσεις κατανόησης στην Οικονομετρία (Με έντονα μαύρα γράμματα είναι οι σωστές απαντήσεις)

Ερωτήσεις κατανόησης στην Οικονομετρία (Με έντονα μαύρα γράμματα είναι οι σωστές απαντήσεις) Ερωτήσεις κατανόησης στην Οικονομετρία (Με έντονα μαύρα γράμματα είναι οι σωστές απαντήσεις) 1. Έχοντας στη διάθεσή μας ένα δείγμα, προκύπτει ότι το 95% διάστημα εμπιστοσύνης για το μέσο μ ενός κανονικού

Διαβάστε περισσότερα

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Οικονομετρία Διάλεξη 2η: Απλή Γραμμική Παλινδρόμηση. Διδάσκουσα: Κοντογιάννη Αριστούλα

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Οικονομετρία Διάλεξη 2η: Απλή Γραμμική Παλινδρόμηση. Διδάσκουσα: Κοντογιάννη Αριστούλα Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Οικονομετρία Διάλεξη 2η: Απλή Γραμμική Παλινδρόμηση Διδάσκουσα: Κοντογιάννη Αριστούλα Πώς συσχετίζονται δυο μεταβλητές; Ένας απλός τρόπος για να αποκτήσουμε

Διαβάστε περισσότερα

Στατιστική είναι το σύνολο των μεθόδων και θεωριών που εφαρμόζονται σε αριθμητικά δεδομένα προκειμένου να ληφθεί κάποια απόφαση σε συνθήκες

Στατιστική είναι το σύνολο των μεθόδων και θεωριών που εφαρμόζονται σε αριθμητικά δεδομένα προκειμένου να ληφθεί κάποια απόφαση σε συνθήκες Ορισμός Στατιστική είναι το σύνολο των μεθόδων και θεωριών που εφαρμόζονται σε αριθμητικά δεδομένα προκειμένου να ληφθεί κάποια απόφαση σε συνθήκες αβεβαιότητας. Βασικές έννοιες Η μελέτη ενός πληθυσμού

Διαβάστε περισσότερα

Διερευνητική Ανάλυση Δεδομένων Exploratory Data Analysis

Διερευνητική Ανάλυση Δεδομένων Exploratory Data Analysis Διερευνητική Ανάλυση Δεδομένων Exploratory Data Analysis Περιλαμβάνει ένα σύνολο αριθμητικών και γραφικών μεθόδων, που μας επιτρέπουν να αποκτήσουμε μια πρώτη εικόνα για την κατανομή των τιμών της μεταβλητής

Διαβάστε περισσότερα

ΠΟΣΟΤΙΚΗ ΓΕΝΕΤΙΚΗ 03. ΜΕΣΗ ΤΙΜΗ & ΔΙΑΚΥΜΑΝΣΗ

ΠΟΣΟΤΙΚΗ ΓΕΝΕΤΙΚΗ 03. ΜΕΣΗ ΤΙΜΗ & ΔΙΑΚΥΜΑΝΣΗ ΠΟΣΟΤΙΚΗ ΓΕΝΕΤΙΚΗ 03. ΜΕΣΗ ΤΙΜΗ & ΔΙΑΚΥΜΑΝΣΗ 1 ΠΟΣΟΤΙΚΟ ΓΝΩΡΙΣΜΑ ΑΑββΓΓδδεεΖΖ αριθμός φυτών 50 00 150 100 50 0 10 5 184 119 17 87 40 1 5 0-10 10-0 0-30 30-40 40-50 50-60 60-70 70-80 80-90 απόδοση/φ υτό

Διαβάστε περισσότερα

ΕΚΠΑΙΔΕΥΤΙΚΗ ΤΕΧΝΟΛΟΓΙΑ ΚΑΙ ΑΝΑΠΤΥΞΗ ΑΝΘΡΩΠΙΝΩΝ ΠΟΡΩΝ

ΕΚΠΑΙΔΕΥΤΙΚΗ ΤΕΧΝΟΛΟΓΙΑ ΚΑΙ ΑΝΑΠΤΥΞΗ ΑΝΘΡΩΠΙΝΩΝ ΠΟΡΩΝ Α εξάμηνο 2010-2011 ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΕΚΠΑΙΔΕΥΤΙΚΗ ΤΕΧΝΟΛΟΓΙΑ ΚΑΙ ΑΝΑΠΤΥΞΗ ΑΝΘΡΩΠΙΝΩΝ ΠΟΡΩΝ Ποιοτικές και Ποσοτικές μέθοδοι και προσεγγίσεις για την επιστημονική έρευνα users.sch.gr/abouras

Διαβάστε περισσότερα

ΠΑΡΟΥΣΙΑΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ

ΠΑΡΟΥΣΙΑΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ ο Κεφάλαιο: Στατιστική ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΚΑΙ ΟΡΙΣΜΟΙ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ Πληθυσμός: Λέγεται ένα σύνολο στοιχείων που θέλουμε να εξετάσουμε με ένα ή περισσότερα χαρακτηριστικά. Μεταβλητές X: Ονομάζονται

Διαβάστε περισσότερα

Κεφάλαιο 16 Απλή Γραμμική Παλινδρόμηση και Συσχέτιση

Κεφάλαιο 16 Απλή Γραμμική Παλινδρόμηση και Συσχέτιση Κεφάλαιο 16 Απλή Γραμμική Παλινδρόμηση και Συσχέτιση Copyright 2009 Cengage Learning 16.1 Ανάλυση Παλινδρόμησης Σκοπός του προβλήματος είναι η ανάλυση της σχέσης μεταξύ συνεχών μεταβλητών. Η ανάλυση παλινδρόμησης

Διαβάστε περισσότερα