Ιδιότητες της ευθείας παλινδρόµησης Ηευθεία παλινδρόµησης περνάει από το σηµείο αφού a b, a b ( b ) b b ( + + + ) ( ) + b u u a b a b Αυτό όµως προϋποθέτει την ύπαρξη του a. Αν δηλαδή υποχρεώσουµε την ευθεία παλινδρόµησης να περάσει από την αρχή των αξόνων τότε η ιδιότητα αυτή δεν ισχύει
y b a + b + u a + b b + u y b + u y b yu yu ( b ) u b u b ( y b ) b y b b b b εν υπάρχει συσχέτιση µεταξύ y και u u u a b εν υπάρχει συσχέτιση µεταξύ και u
Συντελεστής προσδιορισµού Ο συντελεστής προσδιορισµού (coeffcet of determato) είναι ένα µέτρο του βαθµού προσαρµογής (goodess of ft) της ευθείας παλινδρόµησης στις παρατηρήσεις του δείγµατος. Συµβολίζεται µε r (στην περίπτωση της πολλαπλής παλινδρόµησης µε R ). Οαριθµητικός µέσος µιας µεταβλητής είναι η καλλίτερη πρόβλεψη όταν η µόνη διαθέσιµη πληροφορία είναι οι τιµές της ίδιας της µεταβλητής. Η Χ µπορεί να θεωρηθεί ότι ερµηνεύει την Υ στον βαθµό που συµβάλλει στην πρόβλεψή της πέρα από τον µέσο
Υ u a + b Χ Χ ( ) Συνολικό Άθροισµα Τετραγώνων (Total Sum of Squares) - TSS. Αντιπροσωπεύει την συνολική διακύµανση του Υ.
( ) Ερµηνευόµενο Άθροισµα Τετραγώνων (Regresso Sum of Squares) - RSS. Αντιπροσωπεύει την διακύµανση του Υ που ερµηνεύεται από την ευθεία παλινδρόµησης. ( ) u To Άθροισµα Τετραγώνων των σφαλµάτων (Error Sum of Squares) - ESS. Αντιπροσωπεύει την διακύµανση του Υ που δεν ερµηνεύεται από την ευθεία παλινδρόµησης. Αποδεικνύεται ότι TSSRSS+ESS
Συντελεστής Συντελεστής Προσδιορισµού Προσδιορισµού r RSS TSS ESS TSS r r r y y b y b y b y b S S
Παράδειγµα: ( ) ( ) 5.97 367.36 6.83 5.36 7 4.59 6.694 8 9 39.39 96.694 9 5.7 7.36 45 64.764 667.36 34.5 6.8 r ( ) 345. ( ). 7 6. 8 r b S 35 7 S. 45. 37 7.
Συντελεστής συσχέτισης Ο συντελεστής συσχέτισης (correlato coeffcet) µας δίνει τον βαθµό γραµµικής συσχέτισης ανάµεσα σε δύο µεταβλητές χωρίς να ενδιαφέρεται για την αιτιώδη σχέση που µπορεί να υπάρχει µεταξύ τους. Συµβολίζεται µε το r και συνδέεται άµεσα µε τον συντελεστή προσδιορισµού αφού r ± r r y y r var cov, var
Ιδιότητες. r. r r,, 3. Είναι ένα µέτρο γραµµικής συσχέτισης. Έτσι όταν r δεν συνεπάγεται αναγκαστικά ότι οι δύο µεταβλητές είναι ανεξάρτητες. a b + r b S S a + b r b S S r bb
Παράδειγµα: y y y 5-5 -9.7 479.67 65 367.36 6-5 -7.7 7.5 5 5.36 7 4-5 -5.7 5.833 5 6.694 8 9 5 9.83 49.67 5 96.694 9 5 5-4.7-6.5 5 7.36 45 5 5.83 645.833 65 667.36 45 75 6.833 r y y 45 75 6833. 8496. r bb 5.. 74. 8496. 8496
Έλεγχος υποθέσεων και διαστήµατα εµπιστοσύνης για τα a και b Υπόθεση: ut ~ N(, σ ) Επειδή κάθε γραµµικός µετασχηµατισµός µιας τυχαίας µεταβλητής που ακολουθεί την κανονική κατανοµή είναι επίσης τυχαία µεταβλητή µε κανονική κατανοµή, το ακολουθεί την κανονική κατανοµή αφού a+ b + u Για τον ίδιο λόγο τόσο το a όσο και το b είναι τυχαίες µεταβλητές που ακολουθούν την κανονική κατανοµή
~, a N a + σ ~, b N b σ
Στατιστικός έλεγχος του b Z b b b b σ b Z N σ ~, t b b S b b b σ u σ 5. 333+. 74 Παράδειγµα: S a. H : b (α.5) 38 8 S b. 7 t b b. 74. 7 S b 3. Από τους πίνακες t 54. / 776. Η υπόθεση H απορρίπτεται
Στατιστικός έλεγχος του a Z a a a a σa σ + Z ~ N(, ) t a a S b a a σ + 5. 333+. 74 Παράδειγµα: S a. H : a (α.5) 38 8 S b. 7 t a a 533.. 374. Από τους πίνακες t 54. /. 776 38 8 S a Η υπόθεση H δεν απορρίπτεται
ιαστήµατα εµπιστοσύνης για το a και b P ( t t t ) α α /, α /, ( /, /, ) Pb S t b b+ S t b α b α α b ± S t /, b α ± a α /, a S t 5. 333+. 74 Παράδειγµα: S a. b S t b b + S t b α/, b α/, 38 8 S b. 7 a S t a a + S t a α/, a α/,. 74. 7. 776 b. 74 +. 7. 776 5. 33 38. 8. 776 a 5. 33 + 38. 8. 776.987 b.34 3. 7 a. 4
Προβλέψεις Ένα από τα πεδία εφαρµογής της ανάλυσης παλινδρόµησης είναι και η πρόβλεψη (Forecastg) της εξαρτηµένης µεταβλητής για συγκεκριµένη τιµή της ανεξάρτητης. ιακρίνουµε δύο είδη προβλέψεων: (α) Την πρόβλεψη της µέσης τιµής του Υ όταν ΧΧ. Αυτό ισοδυναµεί µε κάποιο σηµείο πάνω στην γραµµή παλινδρόµησης του πληθυσµού. (β) Την πρόβλεψη της συγκεκριµένης τιµής του Υ όταν ΧΧ. Και στις δύο περιπτώσεις υπολογίζεται ένα διάστηµα εµπιστοσύνης µέσα στο οποίο βρίσκεται η πραγµατική τιµή του πληθυσµού.
Πρόβλεψη της µέσης τιµής του Υ Όταν a + b ˆ E( ) E( ) E Αρα το αποτελεί µια αµερόληπτη εκτίµηση του Var σ + Τα όρια µέσα στα οποία βρίσκεται το όσο περισσότερο απέχει η Χ από την µέση τιµή τόσο µεγαλύτερη είναι η διακύµανση και λιγότερο ακριβής η πρόβλεψη E( ) ± Zα σ + ή / ± t α /, σ +
Παράδειγµα: 5333. + 74. 75 σ 934. Ζητείται η προβλεπόµενη µέση τιµή του Υ στον πληθυσµό όταν Χ65 και Χ. Η πρώτη τιµή βρίσκεται κοντά στην µέση τιµή ενώ η δεύτερη βρίσκεται σε µεγαλύτερη απόσταση. 75 65 5. 333+. 74 65. 48 E 65 ±. 48. 776 9. 34 + 6 ( ) 99. 9 E 65 4. 75 75 65 75 5. 333+. 74 44. 6 E ( ) 44 6 776 9 34 75 ±... + 6 75 ( ) 97. E 67. 94
Πρόβλεψη συγκεκριµένης τιµής του Υ Όταν και a + b το λάθος της πρόβλεψης ( ) ( ) ( ) E Ea a + Eb b + Eu Αρα το αποτελεί µια αµερόληπτη εκτίµηση του σ σ + + ή S σ + + όσο περισσότερο απέχει η Χ από την µέση τιµή τόσο µεγαλύτερη είναι η διακύµανση και λιγότερο ακριβής η πρόβλέψη.
tα σ + + tα σ /, /, + + t α/, σ + + + tα/, σ + + Ηπρόβλεψη συγκεκριµένης τιµής γίνεται µε µικρότερη ακρίβεια απ ότι η πρόβλεψη της µέσης τιµής Παράδειγµα: 5. 333+. 74 65. 48 65 ±. 48. 776 9. 34 + + 6 83. 69 4. 4 75 65 75
ιάγραµµα 8.9: ιαστήµατα Εµπιστοσύνης των προβλέψεων της Υ Ŷ ± tα / s Ŷ Ŷ b + b Ŷ ± tα / s Ŷ
Ελαστικότητα Ελαστικότητα Η ελαστικότητα (της Υ ως προς την Χ) ισούται µε τον λόγο µεταξύ της ποσοστιαίας µεταβολής της Υ ως προς τη ποσοστιαία µεταβολή της Χ δηλαδή: b b ˆ / / / / b / Μέση ελαστικότητα