Συσέτιση δύο μεταβλητώ Συσέτιση δύο μεταβλητώ Θεωρούμε δύο τυαίες μεταβλητές X, Y και ζεύγη παρατηρήσεω,,,,...,, από τυαίο δείγμα μεγέθους. Ααφερόμαστε, δηλαδή, σε μη πειραματικά δεδομέα ο ερευητής δε προκαθορίζει-ελέγει τις τιμές καμιάς από τις δύο μεταβλητές όπως, Χ το ύψος τω φοιτητώ εός παεπιστημιακού τμήματος και Υ το βάρος τους Χ οι ώρες μελέτης τω φοιτητώ εός παεπιστημιακού τμήματος και Υ η απόδοση τους σε έα τεστ Χ οι εβδομάδες εμπειρίας εός εργάτη σε μια επιείρηση και Υ ο αριθμός τω ελαττωματικώ προϊότω που παράγει Χ η κατάταξη δέκα προϊότω από έα κριτή και Υ η κατάταξη τω ιδίω προϊότω από έα άλλο κριτή Χ ο αριθμός τω πωλήσεω μουσικώ CD σε μια περιοή και Υ ο αριθμός τω έω στη ίδια περιοή. Δε ααφερόμαστε όμως σε περιπτώσεις όπως, Χ ο αριθμός τω αοιτώ ταμείω εός υποκαταστήματος τραπέζης που καθορίζει ο διευθυτής και Υ ο ρόος ααμοής τω πελατώ Χ η ποσότητα λιπάσματος που καθορίζει ο ερευητής και Υ η απόδοση του αγρού Χ το ύψος της διαφημιστικής δαπάης εός προϊότος που καθορίζει μια επιείρηση και Υ το ύψος τω πωλήσεω του προϊότος. Στις περιπτώσεις όπου από το πληθυσμό επιλέγουμε έα τυαίο δείγμα και σε κάθε μοάδα του δείγματος μελετάμε δύο ή περισσότερα αρακτηριστικά, είαι λογικό, α ααζητήσουμε μέτρα τα οποία α μπορού α εκφράσου και α ποσοτικοποιήσου τη πιθαή συμμεταβολή-συσέτιση τω αρακτηριστικώ. Για παράδειγμα, συσετίζοται-συμμεταβάλλοται ο μισθός και τα έτη σπουδώ τω εργαζομέω; Πώς συμμεταβάλλοται; Δηλαδή, ότα αυξάου τα έτη σπουδώ, αυξάει ο μισθός του εργαζομέου; μειώεται μήπως;!. Ποσό ισυρή είαι η συμμεταβολή τω μεταβλητώ έτη σπουδώ και μισθός; Έας απλός τρόπος για α αποκτήσουμε μια πρώτη ιδέα για το α και πώς δυο μεταβλητές συμμεταβάλλοται-συσετίζοται, είαι α κατασκευάσουμε το διάγραμμα διασποράς Scatter Dagram. Να ααπαραστήσουμε δηλαδή τα ζεύγη τω παρατηρήσεω σε έα διάγραμμα. Ας δούμε έα παράδειγμα: Στο πίακα που ακολουθεί φαίοται οι παρατηρήσεις που πήραμε για το ύψος και το βάρος 6 εργατώ μιας βιομηαίας. 3 4 5 6 7 8 Ύψος cm 83 6 7 8 80 68 76 80 Βάρος Kg 84 63 7 76 77 64 70 76 9 0 3 4 5 6 Ύψος cm 90 75 78 75 86 7 75 63 Βάρος Kg 8 68 75 73 86 73 75 7 Από το διάγραμμα διασποράς φαίεται ότι οι εργάτες στο δείγμα που έου μεγαλύτερο ύψος έου και μεγαλύτερο βάρος. Φαίεται, δηλαδή, α υπάρει μια αάλογη σέση μεταξύ του ύψους και του βάρους τω εργατώ. Εργaστήριο. Μαθηματικώ & Στατιστικής / Γ. Παπαδόπουλος www.aua.gr/gpapadopoulo 93
Συσέτιση δύο μεταβλητώ Εργaστήριο. Μαθηματικώ & Στατιστικής / Γ. Παπαδόπουλος www.aua.gr/gpapadopoulo 94 Πόσο ισυρή είαι όμως αυτή η συσέτιση; Πώς μπορεί, δηλαδή, α μετρηθεί; Στο πλαίσιο του μαθήματος, θα ασοληθούμε με τρία μέτρα συσέτισης: με το συτελεστή γραμμικής συσέτισης του Pearon, με το συτελεστή γραμμικής συσέτισης του Spearman και με το δείκτη Kendall.. Συτελεστής Γραμμικής Συσέτισης του Pearon Ο δειγματικός συτελεστής γραμμικής συσέτισης του Pearon συμβολίζεται με r και ορίζεται από το τύπο: r όπου,, Y X Cov και Επομέως r Ο πληθυσμιακός συτελεστής γραμμικής συσέτισης του Pearon ορίζεται αάλογα και συμβολίζεται με ρ. Ερώτηση: Ποια είαι η βασική ιδέα στο ορισμό του συτελεστή του Pearon; Στο παράδειγμα, το μέσο ύψος είαι 76 cm και το μέσο βάρος 74Kg. Παρατηρείστε ότι οι εργάτες που έου ύψος πάω από το μέσο ύψος έου στις περισσότερες περιπτώσεις και βάρος πάω από το μέσο βάρος. Αάλογα, οι εργάτες που έου ύψος κάτω από το μέσο ύψος έου στις περισσότερες περιπτώσεις και βάρος κάτω από το μέσο βάρος. 50 60 70 80 90 50 60 70 80 90 00 Ύψος cm ΒάροςKg
Συσέτιση δύο μεταβλητώ Δείτε και το ακόλουθο διάγραμμα: Z Ζ Παρατηρείστε επίσης ότι z z r όπου z και z. Ας δούμε δύο αριθμητικά παραδείγματα υπολογισμού του συτελεστή γραμμικής συσέτισης του Pearon. Παράδειγμα-. 4-4 4 6-8 - 4-3 0 0 0 0 0 0 4 - - 4-5 -4-4 4 6-8 5 0 0 40 0 3, 0 r 5 5 5 0 0 40 Εργaστήριο. Μαθηματικώ & Στατιστικής / Γ. Παπαδόπουλος www.aua.gr/gpapadopoulo 95
Παράδειγμα Συσέτιση δύο μεταβλητώ - 4-3 0 9 0 0 5 5 5 7 3 49 9 9 5 8 5 45 0 6 00 36 60 8 44 64 96 3 0 69 00 30 60 3 578 39 355 7,5 και 3,9 r 578 8 7,5 355 8 7,5 3,9 39 83,9 0,99 Ερμηεία και ιδιότητες του συτελεστή γραμμικής συσέτισης r Ο συτελεστής γραμμικής συσέτισης r δίει έα μέτρο του μεγέθους της γραμμικής συσέτισης μεταξύ δύο μεταβλητώ. Παίρει τιμές στο κλειστό διάστημα [-, ] Απόδειξη: Για κάθε λ R ισύει + λ 0. Άρα + λ + λ + λ + λ 0 λ + λ + 0 ή ή 0. Επειδή η τελευταία αισότητα ισύει για κάθε λ R, θα είαι β 4αγ 0και άρα 4 4 r r r. Α r ± υπάρει τέλεια γραμμική συσέτιση. Α 0,3 r < 0, 3 δε υπάρει γραμμική συσέτιση. Αυτό, όμως, δε σημαίει ότι δε υπάρει άλλου είδους συσέτιση μεταξύ τω δύο μεταβλητώ. Α 0,5 < r 0,3 ή 0,3 r < 0, 5 υπάρει ασθεής γραμμική συσέτιση. Α 0,7 < r 0,5 ή 0,5 r < 0, 7 υπάρει μέση γραμμική συσέτιση. Α 0,8 < r 0,7 ή 0,7 r < 0, 8 υπάρει ισυρή γραμμική συσέτιση. A < r 0,8 ή 0,8 r < υπάρει πολύ ισυρή γραμμική συσέτιση. Θετικές τιμές του r δε υποδηλώου, κατ αάγκη μεγαλύτερο βαθμό γραμμικής συσέτισης από το βαθμό γραμμικής συσέτισης που υποδηλώου αρητικές τιμές του r. Ο βαθμός γραμμικής συσέτισης καθορίζεται από τη απόλυτη τιμή του r και όι από το πρόσημο του r. Το πρόσημο του r καθορίζει το είδος, μόο, της συσέτισης θετική ή αρητική. Μας πληροφορεί δηλαδή για το α αύξηση της μιας μεταβλητής ατιστοιεί σε αύξηση ή σε μείωση της άλλης Εργaστήριο. Μαθηματικώ & Στατιστικής / Γ. Παπαδόπουλος www.aua.gr/gpapadopoulo 96
Συσέτιση δύο μεταβλητώ μεταβλητής. Για παράδειγμα η τιμή r 0, 9 δείει ισυρότερη γραμμική συσέτιση από τη τιμή r 0, 8 εώ οι τιμές r 0,6 και r 0, 6 δείου ίδιο βαθμό γραμμικής συσέτισης αλλά ατίθετο είδος. Στη πράξη, υπολογίζουμε το συτελεστή γραμμικής συσέτισης στις περιπτώσεις μόο που το διάγραμμα διασποράς στικτό διάγραμμα έει σήμα επιμήκους κεκλιμέης έλλειψης ή πλατυσμέου J. Α, όμως, το υπολογίσουμε και σε περιπτώσεις που το διάγραμμα διασποράς έει άλλη μορφή, η τιμή του η οποία θα είαι μικρή, δε συεπάγεται μη συσέτιση αλλά μη γραμμική συσέτιση. Είαι, δηλαδή, δυατό α υπάρει μεγάλη μη γραμμική συσέτιση. r0 0<r< -<r<0 r0 0<r< r0 Ο συτελεστής γραμμικής συσέτισης r ρησιμοποιείται ως μια εκτιμήτρια του πληθυσμιακού συτελεστή γραμμικής συσέτισης ρ, μόο ότα τα ζεύγη,,,,...,, προέροται από τυαία δειγματοληψία. Δε έει, επομέως, μεγάλη ρησιμότητα σε πειραματικές έρευες, όπου οι τιμές της μιας μεταβλητής ελέγοται-καθορίζοται από το ερευητή. Συσέτιση δε σημαίει αιτιότητα Ότα σε μια μη πειραματική έρευα δειγματοληψία δύο μεταβλητές X και Y βρίσκοται συσετισμέες αυτό σημαίει μόο ότι οι μεταβλητές αυτές συδέοται με κάποια σέση. Δε συεπάγεται, κατ αάγκη, αιτιότητα. Οι δύο μεταβλητές μπορεί βεβαία α συδέοται με σέση αιτιότητας, μπορεί όμως, όι. Για παράδειγμα, μπορεί και οι δύο α επηρεάζοται από μια τρίτη μεταβλητή. Ας δούμε δύο παραδείγματα: Παρατηρήθηκε ότι το ύψος τω μαθητώ εός σολείου, ηλικίας 6 έως 3 ετώ, έει ισυρή θετική γραμμική συσέτιση με τη ατιληπτική ικαότητα τω μαθητώ. Προφαώς η ατιληπτική ικαότητα τω μαθητώ δε επηρεάζεται από το ύψος τους. Απλώς τόσο η πευματική όσο και η φυσική αάπτυξη τω μικρώ μαθητώ επηρεάζοται παράλληλα από άλλους παράγοτες. Παρατηρήθηκε ότι οι πωλήσεις ταύπλοω στο Sdne εία, για μια μακρά περίοδο, ισυρή θετική συσέτιση με τις πωλήσεις έγρωμω τηλεοράσεω στη Melbourne. Προφαώς, τόσο οι πωλήσεις ταύπλοω όσο και οι πωλήσεις έγρωμω τηλεοράσεω ήτα συάρτηση γεικότερω ευοϊκώ οικοομικώ παραγότω. Είαι, κατά συέπεια, φαερό ότι η πρόειρη ή επιπόλαιη ερμηεία και ρήση του r οδηγεί πολλές φορές σε παρερμηείες ή και σε λαθασμέα συμπεράσματα. Για αιτιολογικά συμπεράσματα, σέδο πάτοτε, απαιτείται πειραματισμός. Σε κάθε περίπτωση, αιτιώδη σέση αλληλεξάρτηση μεταξύ δύο Εργaστήριο. Μαθηματικώ & Στατιστικής / Γ. Παπαδόπουλος www.aua.gr/gpapadopoulo 97
Συσέτιση δύο μεταβλητώ μεταβλητώ δεόμαστε μόο ότα υπάρει επιστημοική ή λογική βάση που τη υπαγορεύει. Με συμβολίζουμε τη δειγματική συδιασπορά τω μεταβλητώ Χ και Υ. Η πληθυσμιακή συδιασπορά ορίζεται αάλογα και συμβολίζεται με σ. Εκφράζει τη συμμεταβολή-συσέτιση δύο μεταβλητώ μέσω του αθροίσματος τω γιομέω τω αποκλίσεω τω τιμώ τους από τους ατίστοιους μέσους. Μεγάλες τιμές της υποδηλώου ότι υπάρει συμμεταβολή-συσέτιση εώ μικρές τιμές της υποδηλώου ότι δε υπάρει συμμεταβολή-συσέτιση. Όμως, δε ρησιμοποιείται ως μέτρο συσέτισης δύο μεταβλητώ διότι επηρεάζεται από τις μοάδες στις οποίες εκφράζοται οι μεταβλητές.. Συτελεστής συσέτισης του Spearman rho Δίει το μέγεθος της γραμμικής συσέτισης ποιοτικώ μεταβλητώ διάταξης. 6 δ rho όπου, το μέγεθος του δείγματος και δ,,,..., Παράδειγμα: Φοιτητές Σειρά κατάταξης στη Στατιστική X. Σειρά κατάταξης στα Μαθηματικά Y δ δ Α ος 4ος -3 9 Β ος ος 0 0 Γ 3ος 3ος 0 0 Δ 4ος 5ος - Ε 5ος ος 4 6 ΣΤ 6ος 6ος 0 0 Ζ 7ος 8ος - Η 8ος 7ος 6 8 rho 0,667 8 8 δ 8 Ιδιότητες-ρήσεις του Συτελεστή Γραμμικής Συσέτισης rho Παίρει τιμές στο κλειστό διάστημα [-, ]. Α συμφωού πλήρως οι δύο κατατάξεις είαι rho, εώ ότα η μια διάταξη είαι ριζικά διαφορετική από τη άλλη για παράδειγμα, α το μέγεθος δείγματος είαι 8 τότε το X είαι ότα το Y είαι 8, το X είαι ότα το Y είαι 7, κ.ο.κ είαι rho. Η τιμή 0 δείει το μικρότερο βαθμό συσέτισης. Α στη κατάταξη έουμε ισοβαθμίες, δίουμε, ως θέση, σε όλες τις θέσεις που ισοβαθμού, τη μέση τιμή τους. Για παράδειγμα, α η βαθμολογία οκτώ φοιτητώ στα Μαθηματικά είαι: 0, 9, 9, 8, 7, 6, 6, 6 τότε η κατάταξη γίεται ως εξής: Εργaστήριο. Μαθηματικώ & Στατιστικής / Γ. Παπαδόπουλος www.aua.gr/gpapadopoulo 98
Φοιτητές Βαθμός στα Κατάταξη Μαθηματικά Α 0 Β 9,5 Γ 9,5 Δ 8 4 Ε 7 5 ΣΤ 6 7 Ζ 6 7 Η 6 7 Συσέτιση δύο μεταβλητώ Ότα υπάρου πολλές ισοβαθμίες o συτελεστής rho δε είαι αξιόπιστος. Σε αυτή τη περίπτωση εδείκυται ο δείκτης Kendall W. 3. O δείκτης Kendall W Χρησιμοποιείται για α καθορισθεί ο βαθμός συμφωίας μεταξύ δύο ή περισσοτέρω κριτώ στη κατάταξη τακτική σειρά που δίου σε δύο ή περισσότερα πρόσωπα ή ατικείμεα. W k όπου, το μέγεθος του δείγματος το πλήθος τω αξιολογούμεω, k ο αριθμός τω κριτώ και η τυπική απόκλιση τω αθροισμάτω τω τακτικώ τιμώ που ατιστοιού σε κάθε αξιολογούμεο. Παράδειγμα: Προϊότα ος Κριτής ος Κριτής 3ος Κριτής 4ος Κριτής 5ος Κριτής Άθροισμα Α 5 6 4 5 4 4 576 Β 3 5 3 3 5 5 Γ 7 49 Δ 3 4 5 6 56 Ε 4 3 5 5 5 ΣΤ 7 4 6 6 7 30 900 Ζ 6 7 7 8 8 36 96 Η 8 8 8 7 6 37 369 80 4896 80,5 8 4.896 8,5 7 W 0,9 5 8 Ιδιότητες-ρήσεις του Δείκτη Kendall W Παίρει τιμές στο κλειστό διάστημα [0, ]. Α συμφωού πλήρως οι κριτές είαι W, εώ ότα υπάρει ριζική διαφωία, είαι W 0. Η περίπτωση ισοβαθμιώ ατιμετωπίζεται όπως και στο υπολογισμό του συτελεστή rho. Μπορούμε α εργασθούμε και με το συτελεστή rho υπολογίζοτάς το μεταξύ όλω τω δυατώ ζευγώ κατατάξεω ος κριτής, ος κριτής, ος κριτής, 3ος κριτής, ος κριτής, kος κριτής, ος κριτής, 3ος κριτής, κ.ο.κ. και παίροτας τη μέση τιμή rho. Ισύει rho W. Εργaστήριο. Μαθηματικώ & Στατιστικής / Γ. Παπαδόπουλος www.aua.gr/gpapadopoulo 99