Ν6_(6)_Σττιστική στη Φυσική Αγωγή 08_Πλινδρόμηση κι συσχέτιση Γούργουλης Βσίλειος Κθηγητής Τ.Ε.Φ.Α.Α. Σ.Ε.Φ.Α.Α. Δ.Π.Θ. Σε ορισμένες περιπτώσεις πιτείτι η νίχνευση της σχέσης μετξύ δύο ποσοτικών μετβλητών Χ κι Υ. Άτομ μετβλητή Χ μετβλητή 3 3 3......... Ν
Άτομ μετβλητή Χ μετβλητή 3 3 3......... Ν ) ποιά είνι η σχέση μετξύ των δύο ποσοτικών μετβλητών κι β) ν μπορούν ν εκτιμηθούν, δηλδή ν προβλεφθούν, οι τιμές της μις μετβλητής, γνωρίζοντς τις τιμές της άλλης μετβλητής (πρόβλημ πλινδρόμησης) 3 Γρμμική πλινδρόμηση του Χ στο Υ Άτομ μετβλητή Χ μετβλητή 3 3 3......... Ν κάθε ζεύγος τιμών (Χ, Υ) μπορεί ν νπρστθεί ως έν σημείο με συντετγμένες τις δύο τιμές του ζεύγους, δηλδή την επίδοση του κάθε τόμου στις μετβλητές Χ κι Υ. 4
Ανπράστση του κάθε τόμου ως σημείο με συντετγμένες (Χ, ) τις τιμές του κάθε τόμου στις μετβλητές Χ κι Υ Υ 980 960 940 Υ performance 90 900 880 860 6 8 0 4 6 Κάθε άτομο με επίδοση Χ στην μετβλητή Χ κι στην μετβλητή Υ 8 30 tranng hours Χ 5 Η νπράστση του «νέφους των σημείων» μπορεί ν γίνει με πολλές ευθείες γρμμές οι οποίες ν έχουν διάφορες διευθύνσεις Υ 980 960 940 90 Υ 900 performance 880 860 6 8 0 4 6 8 30 tranng hours Χ 6 3
Ποι ευθεί (γρμμή πλινδρόμησης) εκφράζει κλύτερ (με μεγλύτερη κρίβει) τ δεδομέν; Πώς κθορίζετι η διεύθυνση υτής της γρμμής πλινδρόμησης; 7 Κάθε ευθεί γρμμή σε έν σύστημ συντετγμένων, μπορεί ν νπρστθεί μθημτικά μέσω μις εξίσωσης που είνι της μορφής: Υ είνι η πόστση του σημείου τομής των ξόνων του συστήμτος συντετγμένων, δηλδή του μηδενός, πό το σημείο τομής της ευθείς με τον άξον των Υ κι νφέρετι στην κλίση της ευθείς. Υ Χ 8 4
5 Μεγλύτερη κρίβει γρμμής πλινδρόμησης ότν Ŷ) ( = ελάχιστο Υ Υ ˆ a e a Λ 9 Χ = στθερά (Constant) = κλίση ευθείς (slope) ) ( ) ( το άθροισμ των τιμών της μετβλητής Χ το άθροισμ των τιμών της μετβλητής Υ 0 το άθροισμ των τετργώνων των τιμών της μετβλητής Χ ) ( το άθροισμ των γινομένων των ζευγρωτών τιμών στην μετβλητή Χ κι στην μετβλητή Υ.
Πράδειγμ: Ένς προπονητής κτγράφει τις επιδόσεις των θλητών του (Ν= 7) στο άλμ σε μήκος (μετβλητή Χ) κι τις επιδόσεις τους στο τριπλούν (μετβλητή Υ), έχοντς ως στόχο ν μπορεί ν προβλέπει τις επιδόσεις των θλητών του στο τριπλούν, βάσει των επιδόσεών τους στο άλμ σε μήκος. / Άλμ σε μήκος (Χ) Άλμ τριπλούν () 5.70 4.0 5.50 4.0 3 5.90 4.35 4 5.60 4.5 5 5.90 4.30 6 6.0 4.50 7 6.0 4.65 Γι ν υπολογιστεί η εξίσωση πλινδρόμησης θ πρέπει ν κθοριστούν οι τιμές των κι ( ) ( ) / Άλμ σε μήκος (Χ ) Άλμ τριπλούν ( ) (Χ ) Χ 5.70 4.0 3.49 80.94 5.50 4.0 30.5 77.55 3 590 5.90 4.35 34.8 84.665 4 5.60 4.5 3.36 79.8 5 5.90 4.30 34.8 84.37 6 6.0 4.50 37. 88.45 7 6.0 4.65 38.44 90.83 =40.9 =0.35 =39.37 =586.605 6
7 / Άλμ σε μήκος (Χ ) Άλμ τριπλούν ( ) (Χ ) Χ 5.70 4.0 3.49 80.94 5.50 4.0 30.5 77.55 3 590 4 35 34 8 84 665 ) ( ) ( 3 5.90 4.35 34.8 84.665 4 5.60 4.5 3.36 79.8 5 5.90 4.30 34.8 84.37 6 6.0 4.50 37. 88.45 7 6.0 4.65 38.44 90.83 3 =40.9 =0.35 =39.37 =586.605 / Άλμ σε μήκος (Χ ) Άλμ τριπλούν ( ) (Χ ) Χ 5.70 4.0 3.49 80.94 5.50 4.0 30.5 77.55 3 590 4 35 34 8 84 665 ) ( ) ( 3 5.90 4.35 34.8 84.665 4 5.60 4.5 3.36 79.8 5 5.90 4.30 34.8 84.37 6 6.0 4.50 37. 88.45 7 6.0 4.65 38.44 90.83 4 =40.9 =0.35 =39.37 =586.605
8 / Άλμ σε μήκος (Χ ) Άλμ τριπλούν ( ) (Χ ) Χ 5.70 4.0 3.49 80.94 5.50 4.0 30.5 77.55 3 590 4 35 34 8 84 665 ) ( ) ( 3 5.90 4.35 34.8 84.665 4 5.60 4.5 3.36 79.8 5 5.90 4.30 34.8 84.37 6 6.0 4.50 37. 88.45 7 6.0 4.65 38.44 90.83 5 =40.9 =0.35 =39.37 =586.605 / Άλμ σε μήκος (Χ ) Άλμ τριπλούν ( ) (Χ ) Χ 5.70 4.0 3.49 80.94 5.50 4.0 30.5 77.55 3 590 4 35 34 8 84 665 ) ( ) ( 3 5.90 4.35 34.8 84.665 4 5.60 4.5 3.36 79.8 5 5.90 4.30 34.8 84.37 6 6.0 4.50 37. 88.45 7 6.0 4.65 38.44 90.83 6 =40.9 =0.35 =39.37 =586.605
9 / Άλμ σε μήκος (Χ ) Άλμ τριπλούν ( ) (Χ ) Χ 5.70 4.0 3.49 80.94 5.50 4.0 30.5 77.55 3 590 4 35 34 8 84 665 ) ( ) ( 3 5.90 4.35 34.8 84.665 4 5.60 4.5 3.36 79.8 5 5.90 4.30 34.8 84.37 6 6.0 4.50 37. 88.45 7 6.0 4.65 38.44 90.83 7 =40.9 =0.35 =39.37 =586.605 / Άλμ σε μήκος (Χ ) Άλμ τριπλούν ( ) (Χ ) Χ 5.70 4.0 3.49 80.94 5.50 4.0 30.5 77.55 3 590 4 35 34 8 84 665 ) ( ) ( 3 5.90 4.35 34.8 84.665 4 5.60 4.5 3.36 79.8 5 5.90 4.30 34.8 84.37 6 6.0 4.50 37. 88.45 7 6.0 4.65 38.44 90.83 8 =40.9 =0.35 =39.37 =586.605
( ) ( ) 7586.605 40.900,35 406.35 404.35.9 739.37 (40.9) 675.5967.8.78 0.69 00.35 0.6940.9 00.35 8. 7.9 0.3 7 7 7 Συνεπώς η εξίσωση πλινδρόμησης θ είνι Υ' 0.69 0.3 9 Υ' 0.69 0.3 Άρ ν κάποιος θλητής, με τ ίδι χρκτηριστικά των θλητών του δείγμτος, έχει επίδοση στο άλμ σε μήκος 6 m, τότε η νμενόμενη επίδοσή του στο άλμ τριπλούν θ είνι Υ' 0.696 0.3 4.4 0.3 4.44 0 0
Συντελεστής προσδιορισμού Η συνολική μετβολή του Υ, δηλδή η συνολική δικύμνση των επιδόσεων στην μετβλητή Υ, εκφράζετι πό το άθροισμ των τετργώνων της διφοράς της μέσης τιμής όλων των τόμων πό την επίδοση του κάθε τόμου (Υ Υ) κι οφείλετι σε δύο πράγοντες. Στη μετβολή της μετβλητής Υ, η οποί οφείλετι στην μετβολή της μετβλητής Χ:! (Υ Υ). σε άλλους πράγοντες που δεν μπορούν ν εκτιμηθούν (Υ Υ! ) Το ποσό της δικύμνσης, δηλδή της μετβολής του Υ, το οποίο μπορεί ν εκτιμηθεί βάσει της εξίσωσης πλινδρόμησης, σε σχέση με την συνολική δικύμνση του Υ, ποτελεί ένν δείκτη που εκφράζει το βθμό της σχέσης μετξύ των δύο μετβλητών Χ κι Υ. συντελεστής προσδιορισμού r! ( ) ( ) προβλεπόμενη μετβολή της μετβλητής Υ, που οφείλετι στην μετβλητή Χ συνολική μετβολή της μετβλητής Υ, πίρνει τιμές πό 0 έως μέτρο εκτίμησης της σχέσης μετξύ Χ κι Υ
Συντελεστής συσχέτισης η διεύθυνση της σχέσης μετξύ Χ κι Υ ορίζετι πό την τετργωνική ρίζ του συντελεστή προσδιορισμού: συντελεστής συσχέτισης! ( ) r ( ) 3 Ο συντελεστής συσχέτισης δεν είνι λοιπόν μι νλογί, λλά η τετργωνική ρίζ μις νλογίς. Αυτό σημίνει ότι, ο συντελεστής συσχέτισης που έχει την τιμή 0.80 δεν εκφράζει μι σχέση δύο φορές μεγλύτερη, πό τη σχέση που εκφράζετι πό ένν συντελεστή συσχέτισης με τιμή 0.40. Αν πιτείτι τέτοις μορφής πληροφορί, τότε χρησιμοποιείτι ο «συντελεστής προσδιορισμού». Γι πράδειγμ, ότν ο συντελεστής συσχέτισης μετξύ δύο ποσοτικών μετβλητών Χ κι Υ είνι r = 0.80, τότε ο συντελεστής προσδιορισμού θ είνι r = 0.64 κι υτό σημίνει ότι το 64% της μετβολής, δηλδή της δικύμνσης, της μετβλητής Υ μπορεί ν προβλεφθεί πό την μετβολή της μετβλητής Χ. 4
Η λγεβρική μορφή του συντελεστή συσχέτισης εκφράζετι πό τη σχέση r ( ( ) ( ) ) ( ) 5 Πράδειγμ: Ένς προπονητής ενδιφέρετι γι το βθμό συσχέτισης μετξύ των εβδομδιίων ωρών προπόνησης των θλητών του (μετβλητή Χ) κι της επίδοσης τους στην σκοποβολή (μετβλητή Υ). Γι το σκοπό υτό κτγράφει τις εβδομδιίες ώρες προπόνησης κι τις επιδόσεις των θλητών του (Ν = ). / (Χ ) ( ) 0 90 940 3 8 880 4 7 890 5 4 900 6 6 940 7 8 950 8 9 960 9 940 0 90 8 950 7 970 6 3
r ( ) ( ) ( ) ( ) θ πρέπει ρχικά ν υπολογιστούν η μέση τιμή της μετβλητής Χ, δηλδή η η μέση τιμή της μετβλητής Υ, δηλδή η 8 3.4 / (Χ ) ( ) 0 90 940 3 8 880 4 7 890 5 4 900 6 6 940 7 8 950 8 9 960 9 940 0 90 8 950 7 970 =8 =60 60 930 7 r ( ) ( ) ( ) ( ) θ πρέπει ρχικά ν υπολογιστούν η μέση τιμή της μετβλητής Χ, δηλδή η η μέση τιμή της μετβλητής Υ, δηλδή η 8 3.4 / (Χ ) ( ) 0 90 940 3 8 880 4 7 890 5 4 900 6 6 940 7 8 950 8 9 960 9 940 0 90 8 950 7 970 =8 =60 8 4
r ( ) ( ) ( ) ( ) θ πρέπει ρχικά ν υπολογιστούν η μέση τιμή της μετβλητής Χ, δηλδή η η μέση τιμή της μετβλητής Υ, δηλδή η 8 3.4 / (Χ ) ( ) 0 90 940 3 8 880 4 7 890 5 4 900 6 6 940 7 8 950 8 9 960 9 940 0 90 8 950 7 970 =8 =60 60 930 9 r ( ) ( ) ( ) ( ) θ πρέπει ν υπολογιστούν ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) / (Χ) () ( ) ( ) ( ) ( ) ( ) ( ) 0 90-3.4.69-0 00 34. 940 -.4 5.85 0 00-4. 3 8 880-5.4 9.37-50 500 7 4 7 890-6.4 4. -40 600 56.8 5 4 900 0.58 0.33-30 900-7.4 6 6 940.58 6.65 0 00 5.8 7 8 950 4.58 0.97 0 400 9.6 8 9 960 5.58 3.3 30 900 67.4 9 940 -.4.0 0 00-4. 0 90 -.4 5.85-0 00 4. 8 950 4.58 0.97 0 400 9.6 7 970 3.58.8 40 600 43. ( ) ( =8 =60 =88.84 = 8800 =050 ) ( ) ( ) r ( ) ( ) ( ) ( ) 050 050 0.84 88.848800 89. 30 5
r ( ) ( ) ( ) ( ) θ πρέπει ν υπολογιστούν ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) / (Χ) () ( ) ( ) ( ) ( ) ( ) ( ) 0 90-3.4.69-0 00 34. 940 -.4 5.85 0 00-4. 3 8 880-5.4 9.37-50 500 7 4 7 890-6.4 4. -40 600 56.8 5 4 900 0.58 0.33-30 900-7.4 6 6 940.58 6.65 0 00 5.8 7 8 950 4.58 0.97 0 400 9.6 8 9 960 5.58 3.3 30 900 67.4 9 940 -.4.0 0 00-4. 0 90 -.4 5.85-0 00 4. 8 950 4.58 0.97 0 400 9.6 7 970 3.58.8 40 600 43. ( ) ( =8 =60 =88.84 = 8800 =050 ) ( ) ( ) r ( ) ( ) ( ) ( ) 050 050 0.84 88.848800 89. 3 r ( ) ( ) ( ) ( ) θ πρέπει ν υπολογιστούν ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) / (Χ) () ( ) ( ) ( ) ( ) ( ) ( ) 0 90-3.4.69-0 00 34. 940 -.4 5.85 0 00-4. 3 8 880-5.4 9.37-50 500 7 4 7 890-6.4 4. -40 600 56.8 5 4 900 0.58 0.33-30 900-7.4 6 6 940.58 6.65 0 00 5.8 7 8 950 4.58 0.97 0 400 9.6 8 9 960 5.58 3.3 30 900 67.4 9 940 -.4.0 0 00-4. 0 90 -.4 5.85-0 00 4. 8 950 4.58 0.97 0 400 9.6 7 970 3.58.8 40 600 43. ( ) ( =8 =60 =88.84 = 8800 =050 ) ( ) ( ) r ( ) ( ) ( ) ( ) 050 050 0.84 88.848800 89. 3 6
r ( ) ( ) ( ) ( ) θ πρέπει ν υπολογιστούν ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) / (Χ) () ( ) ( ) ( ) ( ) ( ) ( ) 0 90-3.4.69-0 00 34. 940 -.4 5.85 0 00-4. 3 8 880-5.4 9.37-50 500 7 4 7 890-6.4 4. -40 600 56.8 5 4 900 0.58 0.33-30 900-7.4 6 6 940.58 6.65 0 00 5.8 7 8 950 4.58 0.97 0 400 9.6 8 9 960 5.58 3.3 30 900 67.4 9 940 -.4.0 0 00-4. 0 90 -.4 5.85-0 00 4. 8 950 4.58 0.97 0 400 9.6 7 970 3.58.8 40 600 43. ( ) ( =8 =60 =88.84 = 8800 =050 ) ( ) ( ) r ( ) ( ) ( ) ( ) 050 050 0.84 88.848800 89. 33 r ( ) ( ) ( ) ( ) θ πρέπει ν υπολογιστούν ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) / (Χ) () ( ) ( ) ( ) ( ) ( ) ( ) 0 90-3.4.69-0 00 34. 940 -.4 5.85 0 00-4. 3 8 880-5.4 9.37-50 500 7 4 7 890-6.4 4. -40 600 56.8 5 4 900 0.58 0.33-30 900-7.4 6 6 940.58 6.65 0 00 5.8 7 8 950 4.58 0.97 0 400 9.6 8 9 960 5.58 3.3 30 900 67.4 9 940 -.4.0 0 00-4. 0 90 -.4 5.85-0 00 4. 8 950 4.58 0.97 0 400 9.6 7 970 3.58.8 40 600 43. ( ) ( =8 =60 =88.84 = 8800 =050 ) ( ) ( ) r ( ) ( ) ( ) ( ) 050 050 0.84 88.848800 89. 34 7
r ( ) ( ) ( ) ( ) θ πρέπει ν υπολογιστούν ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) / (Χ) () ( ) ( ) ( ) ( ) ( ) ( ) 0 90-3.4.69-0 00 34. 940 -.4 5.85 0 00-4. 3 8 880-5.4 9.37-50 500 7 4 7 890-6.4 4. -40 600 56.8 5 4 900 0.58 0.33-30 900-7.4 6 6 940.58 6.65 0 00 5.8 7 8 950 4.58 0.97 0 400 9.6 8 9 960 5.58 3.3 30 900 67.4 9 940 -.4.0 0 00-4. 0 90 -.4 5.85-0 00 4. 8 950 4.58 0.97 0 400 9.6 7 970 3.58.8 40 600 43. ( ) ( =8 =60 =88.84 = 8800 =050 ) ( ) ( ) r ( ) ( ) ( ) ( ) 050 050 0.84 88.848800 89. 35 Συνεπώς, ο συντελεστής συσχέτισης μετξύ των εβδομδιίων ωρών προπόνησης κι της επίδοσης στην σκοποβολή είνι r 0.84 Άρ, ο συντελεστής προσδιορισμού θ είνι r (0.84) 0.663 Αυτό σημίνει ότι το 66.3% της επίδοσης στη σκοποβολή οφείλετι στις εβδομδιίες ώρες προπόνησης, ενώ το υπόλοιπο 33.7% οφείλετι σε άλλους πράγοντες, οι οποίοι δεν μπορούν ν υπολογιστούν με υτά τ δεδομέν. 36 8
Έλεγχος νεξρτησίς των δύο ποσοτικών μετβλητών Χ κι Υ κτά πόσο οι δύο ποσοτικές μετβλητές Χ κι Υ είνι νεξάρτητες ή όχι μετξύ τους σε επίπεδο πληθυσμού. r= δειγμτικός συντελεστής συσχέτισης ρ= συντελεστής συσχέτισης πληθυσμού με βάση τον r ν εκτιμήσουμε τον ρ μηδενική υπόθεση: Η ο : ρ=0 (οι μετβλητές είνι νεξάρτητες μετξύ τους) ενλλκτική υπόθεση: Η Α : ρ 0 (οι μετβλητές δεν είνι νεξάρτητες μετξύ τους, λλά συσχετίζοντι) 37 Έλεγχος μηδενικής υπόθεσης Η ο : ρ=0 (οι μετβλητές είνι νεξάρτητες μετξύ τους) t r r Αν η υπολογιζόμενη t τιμή είνι μικρότερη πό την κρίσιμη t τιμή, η οποί εντοπίζετι στον πίνκ της t κτνομής γι Ν βθμούς ελευθερίς, όπου = το μέγεθος του δείγμτος, κι προεπιλεγμένο επίπεδο σημντικότητς, τότε γίνετι ποδεκτή η μηδενική υπόθεση. 38 9
Πράδειγμ: Ο συντελεστής συσχέτισης μετξύ των εβδομδιίων ωρών προπόνησης κι της επίδοσης στην σκοποβολή ενός δείγμτος = τόμων είνι r= 0.84 Ερώτημ: κτά πόσο υτός ο βθμός συσχέτισης μετξύ των δύο μετβλητών μπορεί ν επεκτθεί κι σε επίπεδο πληθυσμού, με επίπεδο σημντικότητς = 0.05. 39 Αρχικά θ πρέπει ν υπολογιστεί το σττιστικό t. r t r 0.84 0.84,57 4.43 0.58 = r= 0.84 40 0
Αρχικά θ πρέπει ν υπολογιστεί το σττιστικό t. r t r 0.84 0.84,57 4.43 0.58 = r= 0.84 4 Αρχικά θ πρέπει ν υπολογιστεί το σττιστικό t. r t r 0.84 0.84,57 4.43 0.58 = r= 0.84 4
Στη συνέχει πρέπει ν εντοπιστεί η κρίσιμη t τιμή μέσ πό τον πίνκ της t-κτνομής. Εφόσον η ενλλκτική υπόθεση διτυπώνετι ως Η Α : ρ 0, πρόκειτι γι δίπλευρο έλεγχο 43 Το συνολικό εμβδόν κάτω πό την κμπύλη της t κτνομής ισούτι με. Κτά συνέπει γι ν εντοπιστεί η t τιμή που ντιστοιχεί στο επίπεδο σημντικότητς = 0.05 θ πρέπει ν δημιουργηθεί η διφορά: = - 0.05. Επειδή όμως μς ενδιφέρουν οι τιμές οι οποίες βρίσκοντι κι δεξιά κι ριστερά πό τον μέσο όρο, θ πρέπει ν υπολογιστεί η διφορά: /= - 0.05/= - 0.05 = 0.975. 44
/= - 0.05/= - 0.05 = 0.975 Ν = = 0 df \ p.60.70.80.90.95.975.99.995.35.77.367 3.08 6.3.7 3.8 63.66.89.67.06.89.9 4.30 6.96 9.9 3.77.584.978.64.35 3.8 4.54 5.84 4.7.569.94.53.3.78 3.75 4.60 5.67.559.90.48.0.57 3.36 4.03 6.65.553.906 44.44 94.94 45.45 34 3.4 37 3.7 7.63.549.896.4.90.36 3.00 3.50 8.6.546.889.40.86.3.90 3.36 9.6.543.883.38.83.6.8 3.5 0.60.54.879.37.8.3.76 3.7.60.540.876.36.80.0.7 3..59.539.873.36.78.8.68 3.06 3.59.538.870.35.77.6.65 3.0 4.58.537.868.34.76.4.6.98 5.58.536.866.34.75.3.60.95 6.58.535.865.34.75..58.9 7.57.534.863.33.74..57.90 8.57.534.86.33.73.0.55.88 9.57.533.86.33.73.09.54.86 0.57.533.860.3.7.09.53.84 45 Εφόσον η υπολογιζόμενη t τιμή (t= 4.43) είνι μεγλύτερη πό την t κρίσιμη βρίσκετι δηλδή στην κρίσιμη περιοχή, πορρίπτετι η μηδενική υπόθεση. 3, κρίσιμη =.3 Άρ οι δύο ποσοτικές μετβλητές, εβδομδιίες ώρες προπόνησης κι επίδοση στην σκοποβολή, δεν είνι νεξάρτητες μετξύ τους, λλά συσχετίζοντι σττιστικά σημντικά. 46 3
47 4