ΣΥΣΧΕΤΙΣΗ. Το διάγραμμα διασποράς ΕΙΣΑΓΩΓΗ

Σχετικά έγγραφα
ΣΥΣΧΕΤΙΣΗ. Διαβάσετε και τις αναλυτικές σημειώσεις.

5. ΣΥΣΧΕΤΙΣΗ. ηµιουργία διαγράµµατος διασποράς 2. Συσχέτιση µεταξύ δύο ποσοτικών χαρακτηριστικών: ο συντελεστής συσχέτισης του 9. Pearson.

ΣΥΣΧΕΤΙΣΗ και ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

Αναλυτική Στατιστική

ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ

Λίγα λόγια για τους συγγραφείς 16 Πρόλογος 17

Αντικείμενο του κεφαλαίου είναι: Ανάλυση συσχέτισης μεταξύ δύο μεταβλητών. Εξίσωση παλινδρόμησης. Πρόβλεψη εξέλιξης

Η ΣΤΑΤΙΣΤΙΚΗ ΣΤΟ ΕΡΓΑΣΤΗΡΙΟ ΣΠΕΡΜΑΤΟΣ

Στατιστική Επιχειρήσεων Ι

Ποιοτική και ποσοτική ανάλυση ιατρικών δεδομένων

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Εκπαιδευτική έρευνα Οργάνωση & Παρουσίαση Δεδομένων (Εργαστήριο SPSS) Άγγελος Μάρκος, Λέκτορας Δημοκρίτειο Πανεπιστήμιο Θράκης

1. Θα χρησιμοποιηθεί το αρχείο Ο γονικός έλεγχος στην εφηβική ηλικία. Στο. i. Με ποιες μεταβλητές που αφορούν σε σχέσεις εφήβων με τους γονείς τους

Μεθοδολογία των Επιστημών του Ανθρώπου: Στατιστική

Μεθοδολογία των Επιστημών του Ανθρώπου: Στατιστική

Γ. Πειραματισμός Βιομετρία

ΠΕΡΙΕΧΟΜΕΝΑ ΠΡΟΛΟΓΟΣ 7. ΚΕΦΑΛΑΙΟ 1: Εισαγωγικές Έννοιες 13

ΑΠΟ ΤΟ ΔΕΙΓΜΑ ΣΤΟΝ ΠΛΗΘΥΣΜΟ

Εισαγωγή στη Χρήση του SPSS for Windows Σελίδα:

ΕΠΙΣΤΗΜΟΝΙΚΟ ΕΠΙΜΟΡΦΩΤΙΚΟ ΣΕΜΙΝΑΡΙΟ «ΚΑΤΑΡΤΙΣΗ ΕΡΩΤΗΜΑΤΟΛΟΓΙΟΥ ΚΑΙ ΣΤΑΤΙΣΤΙΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΔΕΔΟΜΕΝΩΝ» Τριανταφυλλίδου Ιωάννα Μαθηματικός

Διάστημα εμπιστοσύνης της μέσης τιμής

Περιγραφική Ανάλυση ποσοτικών μεταβλητών

H ΑΝΑΛΥΣΗ ΣΥΣΧΕΤΙΣΗΣ (PEARSON s r)

iii ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος

ΣΤΑΤΙΣΤΙΚΕΣ ΕΦΑΡΜΟΓΕΣ

Κεφ. Ιο ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΘΕΩΡΙΑΣ ΠΙΘΑΝΟΤΗΤΩΝ

Μεθοδολογία της Έρευνας και Εφαρμοσμένη Στατιστική

Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 19/5/2017

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium iv

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης

Οι στατιστικοί έλεγχοι x τετράγωνο, t- test, ANOVA & Correlation. Σταμάτης Πουλακιδάκος

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

Αναπλ. Καθηγήτρια, Ελένη Κανδηλώρου. Αθήνα Σημειώσεις. Εκτίμηση των Παραμέτρων β 0 & β 1. Απλό γραμμικό υπόδειγμα: (1)

10. ΠΟΛΛΑΠΛΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

Συνοπτικά περιεχόμενα

Kruskal-Wallis H

ΤΜΗΜΑ ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥ ΣΧΕΔΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ. ΟΙΚΟΝΟΜΕΤΡΙΚΑ ΠΡΟΤΥΠΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ 1 ο ΕΡΓΑΣΤΗΡΙΟΥ ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΣΤΑΤΙΣΤΙΚΗΣ

Στατιστικές Υποθέσεις

ΠΑΛΙΝΔΡΟΜΗΣΗ ΤΑΞΗΣ ΜΕΓΕΘΟΥΣ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΕΞΕΤΑΣΗ ΤΗΣ ΣΧΕΣΗΣ ΔΥΟ ΜΕΤΑΒΛΗΤΩΝ

Ενότητα 4 η : Ανάλυση ερευνητικών δεδομένων. Δημήτριος Σταμοβλάσης Φιλοσοφίας Παιδαγωγικής ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

Στατιστική Ι. Ενότητα 9: Κατανομή t-έλεγχος Υποθέσεων. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ 1

ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΧΡΗΣΗ SPSS

Κεφάλαιο 16 Απλή Γραμμική Παλινδρόμηση και Συσχέτιση

Εκπαιδευτική Έρευνα: Μέθοδοι Συλλογής και Ανάλυσης εδομένων Συσχέτιση

Μενύχτα, Πιπερίγκου, Σαββάτης. ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 6 ο

ΕΙΣΑΓΩΓΗ. Βασικές έννοιες

Συνάφεια μεταξύ ποιοτικών μεταβλητών. Εκδ. #3,

ΤΜΗΜΑ ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥ ΣΧΕΔΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ

Στατιστική Ι (ΨΥΧ-1202) Διάλεξη 6 Σχέσεις μεταξύ μεταβλητών

Εξέταση Φεβρουαρίου (2011/12) στο Μάθηµα: Γεωργικός Πειραµατισµός. Ζήτηµα 1 ο (2 µονάδες) Για κάθε λανθασµένη απάντηση δεν λαµβάνεται υπόψη µία σωστή

Μοντέλα Παλινδρόμησης. Άγγελος Μάρκος, Λέκτορας ΠΤ Ε, ΠΘ

Στατιστική Ι. Ενότητα 1: Στατιστική Ι (1/4) Αναπλ. Καθηγητής Νικόλαος Σαριαννίδης Τμήμα Διοίκησης Επιχειρήσεων (Κοζάνη)

Περιεχόμενα. Πρόλογος... 15

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

Εισαγωγή στη Χρήση του SPSS for Windows Σελίδα:

Κεφάλαιο 9. Έλεγχοι υποθέσεων

Διαχείριση Υδατικών Πόρων

Μέρος 1ο. Περιγραφική Στατιστική (Descriptive Statistics)

2.4 ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ ΓΙΑ ΜΙΑ ΠΙΘΑΝΟΤΗΤΑ

Παιδαγωγικά II. Εισαγωγή στη μεθοδολογία της Εκπαιδευτικής Έρευνας Ευαγγελία Παυλάτου, Αν. Καθηγήτρια ΕΜΠ Νίκος Καλογερόπουλος, ΕΔΙΠ ΕΜΠ

Στατιστική Επιχειρήσεων Ι

Κεφάλαιο 9. Έλεγχοι υποθέσεων

Χ. Εμμανουηλίδης, 1

3.4.2 Ο Συντελεστής Συσχέτισης τ Του Kendall

Εφαρμοσμένη Στατιστική: Συντελεστής συσχέτισης. Παλινδρόμηση απλή γραμμική, πολλαπλή γραμμική

Στατιστική, Άσκηση 2. (Κανονική κατανομή)

ΔΕΙΓΜΑ ΠΡΙΝ ΤΙΣ ΔΙΟΡΘΩΣΕΙΣ

ΠΕΡΙΓΡΑΦΙΚΗ και ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ. ΜΑΘΗΜΑ 4ο

5.1 Ο ΕΛΕΓΧΟΣ SMIRNOV

ΑΡΧΗ 1ΗΣ ΣΕΛΙ ΑΣ ΣΥΝΟΛΟ ΣΕΛΙ ΩΝ: ΤΕΣΣΕΡΙΣ (4)

ΠΕΡΙΕΧΟΜΕΝΑ ΜEΡOΣ A : ΓNΩΡΙΜΙΑ ΜΕ ΤΗΝ ΕΠΙΣΤΗΜOΝΙΚΗ ΕΡΓΑΣΙΑ

9. Παλινδρόμηση και Συσχέτιση

ΠΕΡΙΕΧΟΜΕΝΑ. Πρόλογος... 13

Απλή Παλινδρόμηση και Συσχέτιση

Συσχέτιση μεταξύ δύο συνόλων δεδομένων

ΘΕΩΡΙΑ ΟΙΚΟΝΟΜΕΤΡΙΑΣ ΣΥΝΟΠΤΙΚΕΣ ΣΗΜΕΙΩΣΕΙΣ

Εκπαιδευτική Έρευνα: Μέθοδοι Συλλογής και Ανάλυσης εδομένων Έλεγχοι Υποθέσεων

Εισαγωγή στην Ανάλυση Δεδομένων


Εφαρμοσμένη Στατιστική

Εισαγωγή στην Στατιστική (ΔΕ200Α-210Α)

ΚΟΙΝΩΝΙΟΒΙΟΛΟΓΙΑ, ΝΕΥΡΟΕΠΙΣΤΗΜΕΣ ΚΑΙ ΕΚΠΑΙΔΕΥΣΗ

Σύγκριση μέσου όρου πληθυσμού με τιμή ελέγχου. One-Sample t-test

Χρονικές σειρές 2 Ο μάθημα: Εισαγωγή στις χρονοσειρές

Στατιστική Ι (ΨΥΧ-1202) Διάλεξη 7. Στατιστικός έλεγχος υποθέσεων

Στόχος µαθήµατος: ΒΙΟΣΤΑΤΙΣΤΙΚΗ ΙΙ. 1. Απλή γραµµική παλινδρόµηση. 1.2 Παράδειγµα 6 (συνέχεια)

3. ΣΕΙΡΙΑΚΟΣ ΣΥΝΤΕΛΕΣΤΗΣ ΣΥΣΧΕΤΙΣΗΣ

ΕΙΣΑΓΩΓΗ ΣΤΗ ΒΙΟΛΟΓΙΑ

ΑΡΧΗ 1ΗΣ ΣΕΛΙ ΑΣ ΣΥΝΟΛΟ ΣΕΛΙ ΩΝ: ΤΕΣΣΕΡΙΣ (4)

Διάλεξη 1 Βασικές έννοιες

Ποσοτική & Ποιοτική Ανάλυση εδομένων Συσχέτιση. Παιδαγωγικό Τμήμα ημοτικής Εκπαίδευσης ημοκρίτειο Πανεπιστήμιο Θράκης Αλεξανδρούπολη,

Περιπτώσεις που η στατιστική συνάρτηση ελέγχου είναι η Ζ: 1. Η σ είναι γνωστή και ο πληθυσμός κανονικός.

Στατιστική. Ανάλυση ιασποράς με ένα Παράγοντα. One-Way Anova. 8.2 Προϋποθέσεις για την εφαρμογή της Ανάλυσης ιασποράς

Ανάλυση συνεχών μεταβλητών. Γεωργία Σαλαντή. Λέκτορας Εργαστήριο υγιεινής και Επιδημιολογίας

ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Τραπεζικής & Χρηματοοικονομικής

ΠΟΛΛΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ ΚΑΙ ΟΙΚΟΝΟΜΙΚΕΣ ΕΦΑΡΜΟΓΕΣ

Transcript:

ΕΙΣΑΓΩΓΗ ΣΥΣΧΕΤΙΣΗ Εισαγωγή Το διάγραμμα διασποράς (scatter plot) Ο συντελεστής συσχέτισης του Pearson (r) Έλεγχος στατιστικής σημαντικότητας & ΔΕ Ο συντελεστής συσχέτισης σειράς του Spearman (ρ) Συσχέτιση & αιτιότητα Εσφαλμένη χρήση της συσχέτισης. Οι συνηθισμένες τεχνικές που χρησιμοποιούνται για την εκτίμηση της σχέσης μεταξύ 2 ποσοτικών χαρακτηριστικών είναι δύο: 1) Συσχέτιση - ποια είναι η κατεύθυνση της σχέσης των 2 μεταβλητών; µε ή µε - ποιο είναι το μέγεθος (η ένταση) της σχέσης; 2) Εξάρτιση (παλινδρόμηση) Πρόβλεψη (prediction): γνωρίζοντας την τιμή της μιας μεταβλητής, μπορούμε να προβλέψουμε την τιμή της άλλης; Διαβάσετε και τις αναλυτικές σημειώσεις. Οι 2 τεχνικές έχουν στενή μαθηματική σχέση αλλά χρησιμοποιούνται για να απαντήσουν διαφορετικά ερωτήματα. Παραδείγματα : Συγκέντρωση GSH αίματος & επίπεδο θρέψης παιδιών με κυστική ίνωση. Ρυθμός επίπτωσης της ελκώδους κολίτιδας (UC) & ρυθμός επίπτωσης της νόσου του Crohn (CD) στον Καναδά. Το διάγραμμα διασποράς Συγκέντρωση λεπτίνης ορού & ΔΜΣ. Το 1 ο βήμα στην διερεύνηση της σχέσης των 2 ποσοτικών μεταβλητών είναι η παρουσίαση ενός διαγράμματος διασποράς (διάγραμμα σημείων δύο-κατευθύνσεων, διάγραμμα συσχέτισης, scatter plot). Παράδειγμα 1. Σε ένα τυχαίο δείγμα 20 παιδιών με κυστική ίνωση, σχετίστηκε η συγκέντρωση GSH αίματος* («glutathione») με επίπεδα θρέψης («% ideal body weight», % ιδανικού βάρους σώματος). Το διάγραμμα διασποράς μπορεί να δείξει εάν 1) Η σχέση φαίνεται γραμμική ή όχι. 2) Υπάρχουν ακραίες τιμές που ίσως έχουν ισχυρή επίδραση στην εκτίμηση της σχέσης. Και στο «έμπειρο μάτι» 3) Εάν οι κατανομές των 2 μεταβλητών φαίνονται περίπου κανονικές. *μειωμένα επίπεδα GSH σχετίζονται με αυξημένο oxidative stress στους πνεύμονες. 5 SPSS : Graphs Legacy Dialogs Scatter/Dot 6 1

Η αξιολόγηση της κατεύθυνσης και του μεγέθους της σχέσης γίνεται συνήθως με τον υπολογισμό του συντελεστή συσχέτισης του Pearson (r). Ο r δείχνει κατά πόσον υπάρχει γραμμική σχέση μεταξύ 2 συνεχών μεταβλητών. Ο συντελεστής συσχέτισης του Pearson (r) Ο συντελεστής συσχέτισης, r, κυμαίνεται μεταξύ 1 και 1. Αρνητική συσχέτιση υπάρχει όταν η μια μεταβλητή μειώνεται καθώς αυξάνεται η άλλη (r<0). Θετική συσχέτιση υπάρχει μεταξύ 2 μεταβλητών όταν η μια μεταβλητή αυξάνεται καθώς αυξάνεται η άλλη (r>0). Όταν δεν υπάρχει γραμμική σχέση, τότε r=0. 8 Πλήρης αρνητική συσχέτιση r = -1 Πλήρης θετική συσχέτιση r = 1 Μη-γραμμική συσχέτιση. Υπάρχει συσχέτιση αλλά δεν είναι γραμμική. r = 0! Πλήρης έλλειψη γραμμικής συσχέτισης r = 0 (y=x 2 ) 9 Ο συντελεστής συσχέτισης πρέπει να υπολογίζεται πάντα σε συνδυασμό με μια γραφική απεικόνιση της συσχέτισης. 10 If we wish to label the strength of the association, for absolute values of r, 0-0.19 is regarded as very weak, 0.2-0.39 as weak, 0.40-0.59 as moderate, 0.6-0.79 as strong and 0.8-1 as very strong correlation, but these are rather arbitrary limits, and the context of the results should be considered. (Swiscow, βιβλίο «Statistics at Square 1», free στο BMJ) Διαγράμματα διασποράς 100 παρατηρήσεων όπου οι 2 μεταβλητές έχουν κανονική κατανομή a) r = 0, b) r = 0,3, c) r = 0,6 d) r = 0,9. Αναπαραγωγή από τον Rice (σελ 128). 11 ΣΗΜΕΙΩΣΗ O r εξαρτάται από το εύρος των τιμών. Με μειωμένο εύρος, ο r αναμένεται να είναι μειωμένος. 12 2

Ο συντελεστής συσχέτισης του Pearson υπολογίζεται με τον εξής τρόπο (η εξίσωση είναι συμμετρική): Παράδειγμα 1. (συν) όπου τα x i και τα y i είναι οι τιμές για το άτομο i (i=1,2,..,n). Ο παρανομαστής εξασφαλίζει ότι ο r θα είναι μεταξύ 1 και 1. Μπορεί να υπολογιστεί με οποιεσδήποτε 2 συνεχείς μεταβλητές. Αριθμητής 176,1= (5,2*5943,2) 13 Παρανομαστής 14 Παράδειγμα 1 (συν). Διάγραμμα διασποράς του GSH με % ιδανικού βάρους. r=0,49 Έλεγχος στατιστικής σημαντικότητας & ΔΕ {Οι συγγραφείς υπολόγισαν τον «r» αλλά θα δούμε ότι δεν είναι κατάλληλος δείκτης} L Lands et al (1999) «Lymphocyte Glutathione Levels inchildren With Cystic Fibrosis» 15 Chest 201-205 Προϋποθέσεις για τον έλεγχο σημαντικότητας του συντελεστή συσχέτισης του Pearson, r: - Τουλάχιστον η μία μεταβλητή πρέπει να έχει κανονική κατανομή. - Δεν πρέπει να υπάρχουν ακραίες τιμές με ισχυρή επίδραση στον r. Γενική διαδικασία έλεγχου μιας στατιστικής υπόθεσης (ελέγχου στατιστικής σημαντικότητας). 1. Σχηματισμός της μηδενικής υπόθεσης (Η 0 ) και της εναλλακτικής της υπόθεσης. 2. Έλεγχος των προϋποθέσεων του ελέγχου. 3. Ορισμός του επιπέδου στατιστικής σημαντικότητας (α) 4. Υπολογισμός της τιμής του «στατιστικού κριτηρίου ελέγχου» (test statistic) που αντιστοιχεί στη συγκεκριμένη Η 0. 5. Σύγκριση της τιμής του κριτηρίου ελέγχου με τιμές από μια γνωστή κατανομή πιθανοτήτων. Εύρεση της πιθανότητας να προκύψει, όταν η Η 0 αληθεύει, μια τιμή του στατιστικού δείκτη ελέγχου που είναι όσο ή και περισσότερο ακραία από την παρατηρημένη τιμή. 6. Ερμηνεία της τιμής p. 17 18 3

Πώς ελέγχουμε τη στατιστική σημαντικότητα; Η μηδενική υπόθεση είναι ότι δεν υπάρχει γραμμική σχέση μεταξύ των 2 μεταβλητών (Η 0 :r πληθ =0). r πληθ = ο συντελεστής συσχέτισης στον πληθυσμό. Παράδειγμα 1. (συν.) Σε ένα τυχαίο δείγμα 20 παιδιών με κυστική ίνωση, σχετίστηκε η συγκέντρωση GSH αίματος («glutathione») με επίπεδα θρέψης και μια παράμετρο λειτουργίας των πνευμόνων (FEV% pred). Διάγραμμα διασποράς της GSH με FEV (%pred), όπου έχει προστεθεί η γραμμή της παλινδρόμησης Ο στατιστικός έλεγχος της μηδενικής υπόθεσης βασίζεται στην κατανομή t και ο στατιστικός δείκτης ελέγχου συγκρίνεται με την κατανομή t με n 2 β.ε. r = - 0,45 p<0,05 Προϋπόθεση εφαρμογής: Τουλάχιστον η μία μεταβλητή έχει κανονική κατανομή. 19 20 Παράδειγμα 2 (συν). Διάγραμμα διασποράς του ρυθμού επίπτωσης της ελκώδους κολίτιδας (UC) και της νόσου του Crohn (CD) σε 52 γεωγραφικές περιοχές της Mannitoba, Καναδάς JF Blanchard et al (2001) Am J Epidemiol 328-335 ΣΗΜΕΙΩΣΗ Στατιστική σημαντικότητα δεν σημαίνει (απαραίτητα) στενή σχέση. r = 0,49, p<0,001. Το ότι μια συσχέτιση βρίσκεται στατιστικά σημαντική (π.χ. p=0,003), δεν μας λέει πολλά για την ένταση (το μέγεθος) της σχέσης. Ακόμα και όταν η συσχέτιση δεν είναι ισχυρή (π.χ. r = 0,1), όταν το δείγμα είναι αρκετά μεγάλο (π.χ. >1000), το αποτέλεσμα μπορεί να είναι στατιστικά σημαντικό. Φαίνεται ότι υπάρχει θετική συσχέτιση μεταξύ του ρυθμού επίπτωσης ελκώδους κολίτιδας και ΝΚ στον Καναδά. {Απορρίπτεται η Η 0. Υπάρχει ισχυρή απόδειξη ότι οι 2 μεταβλητές σχετίζονται θετικά}. 21 22 Παράδειγμα 3. Διάγραμμα διασποράς του μήκους του αυτιού με την ηλικία σε 400 Ιάπωνες.. Fig 1--Scatter plot of ear length divided by height against age Μπορεί να δημιουργηθεί διάστημα εμπιστοσύνης για τον r, υπό την προϋπόθεση ότι και οι 2 μεταβλητές έχουν κανονική κατανομή. Asai, Y. et al. BMJ 1996;312:582c Copyright 1996 BMJ Publishing GroupLtd. 23 24 4

Ο συντελεστής συσχέτισης σειράς του Spearman (ρ) Το διάγραμμα διασποράς μπορεί να δείξει εάν 1) Η σχέση φαίνεται γραμμική ή όχι. 2) Υπάρχουν ακραίες τιμές που ίσως έχουν ισχυρή επίδραση στην εκτίμηση της σχέσης. 26 Παράδειγμα 1 (συν). Οι συγγραφείς επέλέξαν να υπολογίσουν τον συντελεστή συσχέτισης του Pearson (r=0,49). Παράδειγμα όπου υπάρχουν μερικές ακραίες τιμές που έχουν ισχυρή επίδραση στην εκτίμηση του συντελεστή συσχέτισης: Αφαιρώντας όμως τις 2 ακραίες τιμές, βρίσκουμε ότι r=0,15 (p=0,55, n=18). r = 0,964 Εδώ υπάρχουν δύο ακραίες τιμές που έχουν ισχυρή επίδραση στην εκτίμηση του συντελεστή συσχέτισης το μέγεθος του δείγματος είναι μικρό. 27 Αφαιρώντας μόνο μία μέτρηση. r = 0,034 28 Πώς μπορεί να ερευνηθεί η σχέση όταν δεν τηρούνται οι προϋποθέσεις για τον υπολογισμό του συντελεστή συσχέτισης του Pearson, r: Παράδειγμα 4. Fig 2--Association of serum leptin concentration with body mass index and waist circumference in non-diabetic and diabetic men and women. 1) Μετασχηματίζοντας τη μία μεταβλητή (ή και τις 2). 2) Υπολογίζοντας τον μη-παραμετρικό συντελεστή συσχέτισης του Spearman, ρ. {Γιατί δεν τον χρησιμοποιούμε πάντα τότε; Διότι η παραμετρική μέθοδος έχει θεωρητικά μεγαλύτερη ισχύ τεκμηρίωσης ενδεχόμενης συσχέτισης} SPSS : Analyse Correlate Bivariate (τσεκάροντας το κουτί Spearman). 29 Copyright 1996 BMJ Publishing Group Ltd. Zimmet, P. et al. BMJ 1996;313:965-969 30 5

Παράδειγμα 1 (συν). Οι συγγραφείς επέλέξαν να υπολογίσουν τον συντελεστή συσχέτισης του Pearson (r=0,49). r=0,49 (n=20, p=0,03) Η διαδικασία του υπολογισμού του συντελεστή συσχέτισης του Spearman, ρ είναι ίδια, αλλά στον υπολογισμό χρησιμοποιείται η σειρά (ranks) των παρατηρήσεων αντί για τις απόλυτες τιμές. Αφαιρώντας όμως τις 2 ακραίες τιμές, βρίσκουμε ότι r=0,15 (p=0,55, n=18). Εδώ υπάρχουν δύο ακραίες τιμές που έχουν ισχυρή επίδραση στην εκτίμηση του συντελεστή συσχέτισης το μέγεθος του δείγματος είναι μικρό. 31 32 Παράδειγμα 1. (συν) Συσχέτιση & αιτιότητα r=0,3 (n=20, p>0,2) 663,5= (664*663) 33 Συσχέτιση δεν σημαίνει αιτιότητα Συσχέτιση δεν σημαίνει αιτιότητα Πιθανά σενάρια: 1) Η Α επηρεάζει τη Β 2) Η Β επηρεάζει την Α 3) Και οι 2 επηρεάζονται από κάποιον άλλον παράγοντα. 35 Διάγραμμα διασποράς της συσχέτισης της πρόσληψης διαιτητικών ινών με την 25ετή θνησιμότητα από καρκίνο του παχέους εντέρου σε χώρες που έλαβαν μέρος στην Μελέτη των 7 Χωρών {αναπαράχθηκε από το Figure 2 των Jansen et al, IJC, 1999}. [Ecological study] 36 6

Συσχέτιση δεν σημαίνει αιτιότητα Συχνά, ο τρίτος παράγοντας είναι ο χρόνος. π.χ. η κατανάλωση «fast food» και το ποσοστό των διαζυγίων στην Κρήτη τα τελευταία τριάντα χρόνια μία θετική συσχέτιση! Εσφαλμένη χρήση της συσχέτισης Μπορεί η εμφανιζόμενη σχέση να έχει να κάνει με τη χρήση συχνοτήτων αντί για αναλογιών (ή ρυθμών). Π.χ. θετική συσχέτιση του αριθμού των εκκλησιών με τον αριθμό των κλοπών, σε διάφορες περιοχές της χώρας. [η τιμή του δεν επηρεάζεται από την κλίμακα μέτρησης των Χ & Υ] 37 Εσφαλμένη χρήση (misuse) της ανάλυσης της συσχέτισης Δεν πρέπει να χρησιμοποιηθεί η συσχέτιση: 1) Για τη σύγκριση 2 μεθόδων. Ο συντελεστής συσχέτισης είναι ένα μέτρο της σχέσης (measure of association). Εδώ χρειάζεται ένα μέτρο της συμφωνίας (measure of agreement). Ο συντελεστής συσχέτισης δεν μπορεί να θεωρηθεί μέτρο της συμφωνίας μεταξύ δύο μεθόδων. Γιατί; α) Αγνοεί την πιθανή μεροληψία. π.χ. Αν προσθέσουμε 10 σε όλες τις τιμές μίας μέτρησης, ο r παραμένει ίδιος. Θα έχουμε τέλεια συσχέτιση (r=1 ή -1) αν όλες οι παρατηρήσεις βρίσκονται πάνω σε μία ευθεία ΑΛΛΑ οι 2 μέθοδοι θα δίνουν τα ίδια αποτελέσματα μόνο εάν τα σημεία βρίσκονται στη συγκεκριμένη ευθεία γραμμή ψ=χ. Επίσης, ο έλεγχος σημαντικότητας δεν έχει νόημα για τη σύγκριση 2 μεθόδων (θα ήταν πολύ παράξενο αν 2 μέθοδοι που μετράνε την ίδια ουσία δεν είχαν κάποια σχέση!). 39 40 β) Ο r εξαρτάται από τη διασπορά των τιμών, οπότε από τον τρόπο δειγματοληψίας (τον πληθυσμό υπό-μελέτη). Αν πάρουμε χωριστά τα παιδία ανάλογα με το εάν έχουν μέτρηση <0 ή όχι, βρίσκουμε: Δεν πρέπει να χρησιμοποιηθεί η συσχέτιση: 2) Όταν το δείγμα περιλαμβάνει υπο-ομάδες ατόμων των οποίων τα χαρακτηριστικά τείνουν να διαφέρουν. Όταν το εύρος είναι μεγάλο, ο r είναι μεγαλύτερος απ ότι όταν το εύρος είναι μικρό. 41 42 7

Υπάρχουν 3 υπό-ομάδες και διαφορετικές τάσεις στις υπό-ομάδες απ ότι στο σύνολο. Καλύπτοντας την ενότητα «Συσχέτιση», ο σκοπός είναι να γνωρίζετε: - ότι ένα διάγραμμα διασποράς μπορεί να δείξει εάν ο υπολογισμός του συντελεστή συσχέτισης δικαιολογείται ή όχι. - τι τιμές μπορεί να πάρει και τι δείχνει ο συντελεστής συσχέτισης. - ποια είναι η μηδενική υπόθεση στον έλεγχο σημαντικότητας του συντελεστή συσχέτισης. - κάτω από ποιες συνθήκες προτιμάται ο μη-παραμετρικός συντελεστής συσχέτισης του Spearman από τον συντελεστή συσχέτισης του Pearson. - ότι συσχέτιση δεν σημαίνει ότι υπάρχει σχέση αιτιότητας. - γενικές κατηγορίες εσφαλμένης χρήσης της συσχέτισης (measurement agreement, υπο-ομάδες ατόμων). 43 44 8