Πίσω στα βασικά, μέρος 3 ο Βασικές αρχές στατιστικής για κοινωνιολογικές έρευνες: Συσχέτιση μεταβλητών

Σχετικά έγγραφα
Πίσω στα βασικά: Βασικές αρχές στατιστικής για κοινωνιολογικές έρευνες

Ποσοτική & Ποιοτική Ανάλυση εδομένων Συσχέτιση. Παιδαγωγικό Τμήμα ημοτικής Εκπαίδευσης ημοκρίτειο Πανεπιστήμιο Θράκης Αλεξανδρούπολη,

Εκπαιδευτική Έρευνα: Μέθοδοι Συλλογής και Ανάλυσης εδομένων Συσχέτιση

Στατιστική Ι (ΨΥΧ-1202) Διάλεξη 6 Σχέσεις μεταξύ μεταβλητών

Σχετικές πληροφορίες: Πίσω στα βασικά Βασικές αρχές στατιστικής για κοινωνιολογικές έρευνες

Ενότητα 4 η : Ανάλυση ερευνητικών δεδομένων. Δημήτριος Σταμοβλάσης Φιλοσοφίας Παιδαγωγικής ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

Kruskal-Wallis H

ΣΥΣΧΕΤΙΣΗ και ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Αναλυτική Στατιστική

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Στατιστική Επιχειρήσεων Ι

H ΑΝΑΛΥΣΗ ΣΥΣΧΕΤΙΣΗΣ (PEARSON s r)

σ = και σ = 4 αντιστοίχως. Τότε θα ισχύει

Περιεχόμενα. Πρόλογος... 15

ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ MSc Τραπεζικής & Χρηματοοικονομικής

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

ΕΠΑΝΑΛΗΨΗ ΒΑΣΙΚΩΝ ΕΝΝΟΙΩΝ ΣΤΑΤΙΣΤΙΚΗΣ

Τμήμα Οργάνωσης και Διαχείρισης Αθλητισμού

Αναπλ. Καθηγήτρια, Ελένη Κανδηλώρου. Αθήνα Σημειώσεις. Εκτίμηση των Παραμέτρων β 0 & β 1. Απλό γραμμικό υπόδειγμα: (1)

2 ο Εξάμηνο του Ακαδημαϊκού Έτους ΟΔ 055 ΣΤΑΤΙΣΤΙΚΗ ΓΙΑ ΤΙΣ ΚΟΙΝΩΝΙΚΕΣ ΕΠΙΣΤΗΜΕΣ Διδασκαλία: κάθε Τετάρτη 12:00-15:00 Ώρες διδασκαλίας (3)

Γ. Πειραματισμός Βιομετρία

Εισαγωγή στη μεθοδολογία της Εκπαιδευτικής Έρευνας

Η ΣΤΑΤΙΣΤΙΚΗ ΣΤΟ ΕΡΓΑΣΤΗΡΙΟ ΣΠΕΡΜΑΤΟΣ

Μοντέλα Παλινδρόμησης. Άγγελος Μάρκος, Λέκτορας ΠΤ Ε, ΠΘ

ΕΠΙΣΤΗΜΟΝΙΚΟ ΕΠΙΜΟΡΦΩΤΙΚΟ ΣΕΜΙΝΑΡΙΟ «ΚΑΤΑΡΤΙΣΗ ΕΡΩΤΗΜΑΤΟΛΟΓΙΟΥ ΚΑΙ ΣΤΑΤΙΣΤΙΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΔΕΔΟΜΕΝΩΝ» Τριανταφυλλίδου Ιωάννα Μαθηματικός

Εισόδημα Κατανάλωση

ΔΗΜΟΚΡΙΤΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΡΑΚΗΣ Τμήμα Επιστήμης Φυσικής Αγωγής και Αθλητισμού Πρόγραμμα Διδακτορικών Σπουδών ΠΛΗΡΟΦΟΡΙΑΚΟ ΕΝΤΥΠΟ ΜΑΘΗΜΑΤΟΣ

Αντικείμενο του κεφαλαίου είναι: Ανάλυση συσχέτισης μεταξύ δύο μεταβλητών. Εξίσωση παλινδρόμησης. Πρόβλεψη εξέλιξης

Παιδαγωγικά II. Εισαγωγή στη μεθοδολογία της Εκπαιδευτικής Έρευνας Ευαγγελία Παυλάτου, Αν. Καθηγήτρια ΕΜΠ Νίκος Καλογερόπουλος, ΕΔΙΠ ΕΜΠ

έρευνας και στατιστική» παραμετρικές συγκρίσεις»

Μέτρα θέσης και διασποράς

Στατιστικές Υποθέσεις

ΠΕΡΙΕΧΟΜΕΝΑ. Μέρος Α. ΣΤΑΤΙΣΤΙΚΗ Θεωρία και Εφαρµογές Υπολογιστικοί αλγόριθµοι στον MS-Excel: υπολογισµός και ερµηνεία στατιστικών ευρηµάτων

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

Περιγραφική Ανάλυση ποσοτικών μεταβλητών

Μ Ε Τ Ρ Α Δ Ι Α Σ Π Ο Ρ Α Σ.

Εισαγωγή στη Χρήση του SPSS for Windows Σελίδα:

Διμεταβλητές κατανομές πιθανοτήτων

Χρονικές σειρές 2 Ο μάθημα: Εισαγωγή στις χρονοσειρές

Διερευνητική Ανάλυση Δεδομένων Exploratory Data Analysis

ΜΟΝΟΠΑΡΑΜΕΤΡΙΚΗ ΚΑΙ ΠΟΛΥΠΑΡΑΜΕΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ

Στατιστική, Άσκηση 2. (Κανονική κατανομή)

Τμήμα Τεχνολόγων Γεωπόνων-Κατεύθυνση Αγροτικής Οικονομίας Εφαρμοσμένη Στατιστική Μάθημα 4 ο :Τυχαίες μεταβλητές Διδάσκουσα: Κοντογιάννη Αριστούλα

Οικονομετρία Ι. Ενότητα 9: Αυτοσυσχέτιση. Δρ. Χαϊδώ Δριτσάκη Τμήμα Λογιστικής & Χρηματοοικονομικής

Εκπαιδευτική έρευνα Οργάνωση & Παρουσίαση Δεδομένων (Εργαστήριο SPSS) Άγγελος Μάρκος, Λέκτορας Δημοκρίτειο Πανεπιστήμιο Θράκης

ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ

ΣΤΑΤΙΣΤΙΚΕΣ ΕΦΑΡΜΟΓΕΣ

ΕΞΕΤΑΣΗ ΤΗΣ ΣΧΕΣΗΣ ΔΥΟ ΜΕΤΑΒΛΗΤΩΝ

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

Έλεγχος ύπαρξης στατιστικά σημαντικών διαφορών μεταξύ δύο εξαρτημένων δειγμάτων, που δεν ακολουθούν την κανονική κατανομή (Wilcoxon test)

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS)

Διάστημα εμπιστοσύνης της μέσης τιμής

ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Τραπεζικής & Χρηματοοικονομικής

Διερευνητική Ανάλυση Δεδομένων Exploratory Data Analysis

ΤΜΗΜΑ ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥ ΣΧΕΔΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ. ΟΙΚΟΝΟΜΕΤΡΙΚΑ ΠΡΟΤΥΠΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ 1 ο ΕΡΓΑΣΤΗΡΙΟΥ ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΣΤΑΤΙΣΤΙΚΗΣ

ΜΟΝΟΠΑΡΑΜΕΤΡΙΚΗ ΚΑΙ ΠΟΛΥΠΑΡΑΜΕΤΡΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Αριάδνη Αργυράκη

4.2 Μελέτη Επίδρασης Επεξηγηματικών Μεταβλητών

Στατιστική Ι. Ανάλυση Παλινδρόμησης

Μεθοδολογία των Επιστημών του Ανθρώπου: Στατιστική

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 4 Αριθμητικές Μέθοδοι Περιγραφικής Στατιστικής

Απλή Παλινδρόμηση και Συσχέτιση

ΑΝΑΛΥΣΗ Ε ΟΜΕΝΩΝ. 6. Συσχέτιση

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΔΙΑΧΕΙΡΙΣΗΣ ΚΙΝΔΥΝΟΥ. Συσχέτιση (Correlation) - Copulas

ΜΕΘΟΔΟΛΟΓΙΑ ΕΡΕΥΝΑΣ. Διάλεξη 8 Εφαρμογές της στατιστικής στην έρευνα - Ι. Υπεύθυνος Καθηγητής Χατζηγεωργιάδης Αντώνης

Οι στατιστικοί έλεγχοι x τετράγωνο, t- test, ANOVA & Correlation. Σταμάτης Πουλακιδάκος

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Οικονομετρία Διάλεξη 2η: Απλή Γραμμική Παλινδρόμηση. Διδάσκουσα: Κοντογιάννη Αριστούλα

Απαραμετρική Στατιστική. Το βαθμονομικό κριτήριο του Wilcoxon, για ζευγαρωτες παρατηρήσεις Ο βαθμονομικός συντελεστής συσχέτισης του Spearman

Έλεγχος ύπαρξης στατιστικά σημαντικών διαφορών μεταξύ δύο εξαρτημένων δειγμάτων, που ακολουθούν την κανονική κατανομή (t-test για εξαρτημένα δείγματα)

Κεφάλαιο 9. Υπολογισµός του είκτη Συσχέτισης. Ο Υπολογισµός του είκτη Συσχέτισης

Β. Δισλιάν, Μ. Ανδρέου, Μ. Γεωργιάδου, Θ. Μακρής, Α. Μπαρμπαρίδου, Α. Μπελτσίδης, Γ. Αμαξόπουλος, Α. Τσετινέ

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium iv

Απλή Γραμμική Παλινδρόμηση II

Μεθοδολογία των Επιστημών του Ανθρώπου: Στατιστική

Στατιστική Ι. Ενότητα 2: Στατιστικά Μέτρα Διασποράς Ασυμμετρίας - Κυρτώσεως. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

Κεφάλαιο 12. Σύγκριση μεταξύ δύο δειγμάτων: Το κριτήριο t

Πανεπιστήμιο Θεσσαλίας Πολυτεχνική Σχόλη Τμήμα Μηχανικών Χωροταξίας, Πολεοδομίας & Περιφερειακής Ανάπτυξης

9. Παλινδρόμηση και Συσχέτιση

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

ΣΤΑΤΙΣΤΙΚΗ ΙΙ. Ενότητα 2: ΣΤΑΤΙΣΤΙΚΗ ΙΙ (2/4). Επίκ. Καθηγητής Κοντέος Γεώργιος Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά)

Στατιστική ανάλυση αποτελεσμάτων


Διαχείριση Υδατικών Πόρων

ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ Έρευνα και Συγγραφή

Έλεγχος ύπαρξης στατιστικά σημαντικών διαφορών μεταξύ δύο ανεξάρτητων δειγμάτων, που ακολουθούν την κανονική κατανομή (t-test για ανεξάρτητα δείγματα)

ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ. Παπάνα Αγγελική

Κεφάλαιο 9. Έλεγχοι υποθέσεων

Μεθοδολογία της Έρευνας και Εφαρμοσμένη Στατιστική

ΠΕΡΙΓΡΑΦΙΚΗ και ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ 1

Οικονομετρία Ι. Ενότητα 5: Ανάλυση της Διακύμανσης. Δρ. Χαϊδώ Δριτσάκη Τμήμα Λογιστικής & Χρηματοοικονομικής

ΑΠΟ ΤΟ ΔΕΙΓΜΑ ΣΤΟΝ ΠΛΗΘΥΣΜΟ

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 14 Μαρτίου /34

ΠΕΡΙΕΧΟΜΕΝΑ ΠΡΟΛΟΓΟΣ 7. ΚΕΦΑΛΑΙΟ 1: Εισαγωγικές Έννοιες 13

Γ. Πειραματισμός - Βιομετρία

ΕΝΤΥΠΟ ΘΕΜΑΤΩΝ ΕΞΕΤΑΣΕΩΝ

HMY 799 1: Αναγνώριση Συστημάτων

Ο είκτης Συσχέτισης. Υπάρχουν πολλές οι έρευνες στις οποίες µας ενδιαφέρει να µελετήσουµε αν υπάρχει ΑΛΛΗΛΕΞΑΡΤΗΣΗ µεταξύ δύο µεταβλητών

Transcript:

Πίσω στα βασικά, μέρος 3 ο Βασικές αρχές στατιστικής για κοινωνιολογικές έρευνες: Συσχέτιση μεταβλητών Σπύρος Βερονίκης Τμήμα Αρχειονομίας-Βιβλιοθηκονομίας Ιόνιο Πανεπιστήμιο spver@ionio.gr http://dlib.ionio.gr/~spver/seminars/statistics/

Περιεχόμενο παρουσίασης Ο συντελεστής συσχέτισης (correlation coefficient) Διαγράμματα διασποράς (scatterplots) Συσχέτιση δύο μεταβλητών (correlation) Ο συντελεστής συσχέτισης Pearson Αιτιότητα (causality) Ο συντελεστής συσχέτισης Spearman Ο συντελεστής συσχέτισης Kendall Biserial and point-biserial correlation Μερική συσχέτιση (partial correlation) 2

Σκοπός της παρουσίασης Συχνά χρειάζεται να γνωρίζουμε τι είδους σχέση υπάρχει μεταξύ δύο μεγεθών. Η συσχέτιση είναι ένα μέτρο περιγραφής της γραμμικής εξάρτησης μεταξύ δύο μεταβλητών Θα δούμε πώς μπορούμε να εκφράσουμε στατιστικώς τη σχέση μεταξύ δύο μεταβλητών χρησιμοποιώντας δύο μεγέθη: τη συνδιακύμανση (covariance) και το συντελεστή συσχέτισης (correlation coefficient). Θα δούμε επίσης πώς μπορούμε να απεικονίσουμε γραφικά τη σχέση μεταξύ μεταβλητών και πώς μπορούμε να την ερμηνεύσουμε. 3

Συνδιακύμανση (covariance) Διακύμανση είναι η μέση ποσότητα απόκλισης των μετρήσεων από τη μέση τιμή. Η απλούστερη ένδειξη συσχέτισης μεταξύ δύο μεταβλητών είναι η συνδιακύμανση (ή συν-διασπορά), σύμφωνα με την οποία καθώς οι τιμές μιας μεταβλητής αποκλίνουν από τη μέση της τιμή, παρατηρείται αντίστοιχη απόκλιση (θετική ή αρνητική) και στην άλλη μεταβλητή 4

Παράδειγμα συνδιακύμανσης Φοιτητής 1 2 3 4 5 Μέση τιμή Διακύμανση Βιβλία (x) 5 4 4 6 8 5,4 1,67 Επισκέψεις (y) 8 9 10 13 15 11,0 2,92 x-avg(x) -0,4-1,4-1,4 0,6 2,6 y-avg(y) -3-2 -1 2 4 [x-avg(x)]* [y-avg(y)] 1,2 2,8 1,4 1,2 10,4 Σ[x-AVG(x)]*[y-AVG(y)]= 17 x cov x, y= i AVGx y i AVG y = 17 N 1 5 1 =4.25 Θετικές τιμές συνδιακύμανσης υποδεικνύουν πως καθώς μια μεταβλητή αποκλίνει από τη μέση τιμή (π.χ. αυξανόμενα) την ίδια μεταβολή (αυξανόμενη) ακολουθεί και η άλλη μεταβλητή. Όταν η συνδιακύμανση είναι αρνητική, οι μεταβλητές ακολουθούν αντίστροφη φορά μεταβολής (καθώς η μία αυξάνεται η άλλη μειώνεται). Καταγράφεται παρόμοιος τρόπος διαφοροποιήσεων των δύο μεταβλητών Οι πρώτες 3 τιμές των δύο μεταβλητών είναι μικρότερες της μέσης τιμής 5

Αναγωγή τιμών σε μονάδες τυπικής απόκλισης Ο συντελεστής συν-διακύμανσης εξαρτάται από την κλίμακα αποτίμησης των μεταβλητών, δηλαδή δεν είναι ανηγμένος. Προκειμένου ο συντελεστής συσχέτισης να μην επηρεάζεται από τις τιμές της κλίμακας αποτίμησης, πρέπει οι μετρήσεις να αναχθούν σε ένα ενιαίο μέτρο. Ένα τέτοιο μέτρο αποτίμησης, είναι η τυπική απόκλιση της κάθε μεταβλητής, s (ή σ). AVG= 4.2 S= 1.5 (AVG) s = 4.2/1.5= 2.8 6

Ο συντελεστής συσχέτισης Pearson Karl Pearson (1857-1936) covx, y r= s x s y Ο συντελεστής συσχέτισης Pearson είναι ένα ανηγμένο μέγεθος συσχέτισης, το οποίο λαμβάνει τιμές από -1 έως 1. Όταν είναι +1 σημαίνει πως οι δύο μεταβλητές x και y σχετίζονται απολύτως θετικά, κι αυτό είναι μάλλον ύποπτο (π.χ. συσχέτιση της ηλικίας καταγεγραμμένης σε έτη και σε μήνες). Όταν είναι -1 σημαίνει πως οι δύο μεταβλητές σχετίζονται απολύτως αρνητικά (επίσης ύποπτο). Όταν είναι 0 σημαίνει πως δεν υπάρχει καμία συσχέτιση (η μια μεταβλητή δεν φαίνεται να επηρεάζει την άλλη) Οι ενδιάμεσες τιμές αντιστοιχούν σε ενδιάμεσες εντάσεις αλληλεξάρτησης Γενικά, η ένταση συσχέτισης οριοθετείται βάσει του παρακάτω εμπειρικού κανόνα: +/- 0.1 : μικρή συσχέτιση +/- 0.3: μέτρια συσχέτιση +/- 0.5: μεγάλη συσχέτιση 7

Απεικόνιση συσχετίσεων Υπάρχει συσχέτιση μεταξύ άγχους προ των εξετάσεων και βαθμολογίας; Διαφοροποιείται βάσει του γένους; Παρατηρούμε πως: Για τους περισσότερους καταγράφηκαν υψηλά επίπεδα άγχους Διαφαίνεται μια αρνητική συσχέτιση μεταξύ των μεταβλητών (υψηλότερα επίπεδα άγχους οδηγούν σε χαμηλότερες βαθμολογίες) Η αρνητική συσχέτιση φαίνεται να καταγράφεται και για τα δύο γένη Δεν υπάρχουν καταγραφές με χαμηλά επίπεδα άγχους και ταυτόχρονα χαμηλές επιδόσεις. 8

Συσχέτιση δύο μεταβλητών Επιλέγονται: ο συντελεστής συσχέτισης που πρόκειται να υπολογιστεί (Pearson, Spearman ή Kendall) το είδος του ελέγχου (ενός ή δύο άκρων) για τον υπολογισμό της στατιστικής σημαντικότητας της υπολογιζόμενης τιμής συσχέτισης Ο έλεγχος δύο άκρων χρησιμοποιείται όταν δεν έχουμε κάποια ένδειξη για το είδος της συσχέτισης (αρνητική ή θετική). Εάν γνωρίζουμε το είδος συσχέτισης (βάσει προηγούμενης εμπειρίας ή της οπτικής απεικόνισης), τότε ζητείται έλεγχος ενός άκρου (one-tailed test). Π.χ. εάν δεν γνωρίζουμε εάν ο αυξημένος αριθμός επισκέψεων στη βιβλιοθήκη πρόκειται να οδηγήσει σε αύξηση του πλήθους των δανεισμένων βιβλίων, τότε χρησιμοποιούμε έλεγχο δύο άκρων (twotailed test) για τη σημαντικότητα (significance) του συντελεστή συσχέτισης. 9

Συσχέτιση δύο μεταβλητών Προϋποθέσεις χρήσης του συντελεστή συσχέτισης Pearson Οι μετρήσεις (data) να καταγράφονται σε συνεχείς κλίμακες (να είναι τύπου interval). Για τον υπολογισμό της στατιστικής σημαντικότητας της υπολογιζόμενης τιμής, τα δεδομένα πρέπει να ακολουθούν κανονική κατανομή, η οποία ελέγχεται με το κριτήριο Kolmogorov- Smirnov. 10

Συσχέτιση 3 μεταβλητών Σχετίζονται ο χρόνος διαβάσματος (time), η ένταση άγχους (anxiety) προ των εξετάσεων και η βαθμολογική επίδοση (performance); Με ποιο τρόπο; 11

Συσχέτιση (correlation) και αιτιότητα (causality) Ο συντελεστής συσχέτισης υποδεικνύει εάν, σε τι βαθμό και με ποιο τρόπο σχετίζονται δύο μεγέθη, δηλαδή εάν οι τιμές ενός μεγέθους επηρεάζονται από τις τιμές ενός άλλου μεγέθους. Ωστόσο δεν παρέχει πληροφορία για τη φορά επίδρασης μεταξύ των δύο μεγεθών. Στο παράδειγμα, είδαμε πώς η αποτίμηση έδειξε χαμηλές βαθμολογικές επιδόσεις στις περιπτώσεις αυξημένου άγχους. Ωστόσο, δεν μπορούμε να ισχυριστούμε πως τα υψηλά επίπεδα άγχους προκαλούν χαμηλές βαθμολογικές επιδόσεις. Αυτό συμβαίνει επειδή: Ενδέχεται να υπάρχει και άλλη μεταβλητή (καταγεγραμμένη ή μη) η οποία να επιδρά στη σχέση μεταξύ των δύο μεταβλητών. Ο συντελεστής συσχέτισης δεν περιέχει πληροφορία για τη φορά της επίδρασης Ορισμένες φορές η φορά αιτιότητας μπορεί να προσδιοριστεί εφ' όσον υπάρχει μια μονοσήμαντη χρονική σειρά καταγραφής των μεταβλητών. Για παράδειγμα, αποδεχόμαστε πως το άγχος πριν την εξέταση επηρεάζει τη βαθμολογική επίδοση και πως η βαθμολογική επίδοση (μεταγενέστερη) δεν μπορεί να επηρεάσει το άγχος πριν την εξέταση (προγενέστερη) αφού ο χρόνος δεν γυρίζει πίσω. 12

Η τιμή R 2 Η τετραγωνισμένη τιμή του συντελεστή συσχέτισης είναι ένα μέτρο της ποσότητας διακύμανσης της μιας μεταβλητής η οποία (ποσότητα) οφείλεται (ερμηνεύεται) από τη διακύμανση της άλλης μεταβλητής. Για παράδειγμα η βαθμολογικής επίδοση παρουσιάζει μια διακύμανση μεταξύ των τιμών της επειδή τα άτομα έχουν διαφορετικά χαρακτηριστικά (μεταξύ άλλων και διαφορετικά επίπεδα άγχους). Το τετράγωνο του συντελεστή συσχέτισης μεταξύ βαθμολογικής επίδοσης και έντασης άγχους είναι (-0.441) 2 = 0.194 Άρα 0.194x100= 19,4% της καταγεγραμμένης διακύμανσης στη βαθμολογική επίδοση, οφείλεται στη διακύμανση της έντασης άγχους των ατόμων του δείγματος. Απομένει ποσοστό 80.6% καταγεγραμμένης διακύμανσης στην επίδοση το οποίο δεν οφείλεται στο άγχος. Συχνά, ζητούμενο είναι ο προσδιορισμός κατά το δυνατόν περισσότερων παραγόντων οι οποίοι επηρεάζουν τη βαθμολογική επίδοση. 13

Επιλογή του κατάλληλου συντελεστή συσχέτισης Η επιλογή του συντελεστή συσχέτισης εξαρτάται από το είδος των μεταβλητών από τις παραμετρικές τους ιδιότητες 14

Συσχέτιση μη-παραμετρικών μετρήσεων Παράδειγμα: Συσχετίζονται οι βαθμολογικές επιδόσεις στη στατιστική με τις βασικές δεξιότητες μαθηματικών; Stats= {A, B+, B-, C, Pass, Fail} Ordinal scale (τακτική κλίμακα) GCSE= {A, B, C, D, E, F} Ordinal scale (τακτική κλίμακα) Α --> 1 Β+, Β --> 2 B-, C --> 3 C, D --> 4 Pass, E --> 5 Fail, F --> 6 Charles Spearman (1863-1945) Maurice Kendall (1907-1983) 15

Συσχέτιση μη-παραμετρικών μετρήσεων 16

Μερική συσχέτιση (Part and partial correlation) Η συσχέτιση μεταξύ δύο μεταβλητών μπορεί να επηρεάζεται από μια 3η μεταβλητή. Είναι συχνά ζητούμενο να μπορούμε να εκτιμήσουμε την επίδραση της 3ης μεταβλητής στην αλληλεξάρτιση (συσχέτιση) των δύο μεταβλητών που μας ενδιαφέρουν. Παράδειγμα: Το εντατικό διάβασμα ελαττώνει το άγχος Το εντατικό διάβασμα βελτιώνει την επίδοση Η αύξηση άγχους ελαττώνει την επίδοση 17

Ερμηνεία διακύμανσης r (anxiety, performance) = -0.441 R 2 = 0.194 ή 19.4% r (revision, performance) = +0.397 R 2 = 0.157 ή 15.7% r (revision, anxiety) = -0.709 R 2 = 0.502 ή 50.2% Αφού 1) Ο χρόνος διαβάσματος επηρεάζει τη βαθμολογική επίδοση 2) Η ένταση άγχους επηρεάζει τη βαθμολογική επίδοση 3) Και ο χρόνος διαβάσματος επηρεάζει σημαντικά την ένταση άγχους... αναμένεται πως ορισμένη από διακύμανση επίδοσης η οποία οφείλεται στο άγχος, πρέπει εμμέσως να προέρχεται και από το χρόνο διαβάσματος Χρησιμοποιούμε τη μερική συσχέτιση για να προσδιορίσουμε τα καθαρά (και όχι τα μικτά) ποσοστά διακύμανσης που οφείλονται σε κάθε μεταβλητή. Π.χ., υπολογίζουμε το συντελεστή μερικής συσχέτισης μεταξύ άγχους και βαθμολογικής επίδοσης (αμοιγώς κίτρινη περιοχή), ελέγχοντας (απομονώνοντας) την επίδραση του χρόνου διαβάσματος 18

Αποτελέσματα μερικής συσχέτισης Ο συντελεστής συσχέτισης άγχους-επίδοσης (απομακρύνοντας την επίδραση του χρόνου ανάγνωσης) ελαττώθηκε σε -0.247 (από 0,441) γεγονός που υποδεικνύει πως (-0.247) 2 = 0.06 ή 6% της καταγεγραμμένης διακύμανσης στις μετρήσεις επίδοσης οφείλεται στη διακύμανση άγχους των φοιτητών. Μεγάλο ποσοστό από την καταγεγραμμένη διακύμανση επίδοσης λόγω άγχους επισκιάζεται (οφείλεται) στον χρόνο διαβάσματος. 19

Συνοψίζοντας Το μέγεθος αλληλεξάρτησης μεταξύ δύο μεταβλητών μπορεί να υπολογιστεί στατιστικώς με το συντελεστή συσχέτισης Τα γραφήματα διασποράς δίνουν μια καλή εικόνα για το είδος συσχέτισης μεταξύ δύο μεταβλητών γι' αυτό και προτείνεται η χρήση τους Υπάρχουν πολλαπλοί συντελεστές συσχέτισης και η επιλογή του κατάλληλου εξαρτάται από το είδος των μεταβλητών, την κλίμακα αποτίμησης και το είδος της κατανομής τους. Ο συντελεστής συσχέτισης κυμαίνεται από 1 έως 1 Κατά τους υπολογισμούς αναφέρεται και το επίπεδο στατιστικής σημαντικότητας για την υπολογιζόμενη τιμή Η τιμή R 2 υποδεικνύει το ποσοστό της καταγεγραμμένης διακύμανσης της μιας μεταβλητής το οποίο (ποσοστό) οφείλεται στη διακύμανση της άλλης μεταβλητής. Η συσχέτιση δεν συνεπάγεται αιτιότητα Η συσχέτιση μεταξύ δύο μεταβλητών μπορεί να επηρεάζεται από μία ή και περισσότερες άλλες μεταβλητές, καταγεγραμμένης ή μή. Ο υπολογισμός μερικής συσχέτισης προσδιορίζει το ακριβές ποσοστό εξάρτησης μεταξύ δύο μεταβλητών, ελέγχοντας την επίδραση των τυχόν υπολοίπων. 20

Παραπομπές Field, A (2005) Discovering Statistics Using SPSS: and sex, drugs and rock 'n roll, 2 nd ed., Sage Publication Statsoft, Inc (2011). Electronic Statistics Textbook. Tulsa, OK: Statsoft Web: http://www.statsoft.com/textbook 21