ΚΕΦΛΙΟ ΜΕΤΣΧΗΜΤΙΣΜΟΙ ΜΕΤΛΗΤΩΝ Μωυσιάδης Χρόνης 6 o Εξάµηνο Μαθηµατικών Ποιοτικές Μταβλητές ως προβλέπουσς Y= β + β X + β X + + β X + k k Προϋπόθση : Προβλέπουσς µταβλητές ποσοτικές (µτρήσιµς) Τι συµβαίνι αν κάποια (ή κάποις) Χ ίναι ποιοτική ; Έστω Χ ποιοτική προβλέπουσα µ ν κατηγορίς. Τότ αντικαθίσταται µ ν- βωβές µταβλητές τις: δίκτρις Ζ, Ζ,, Ζ ν- µταβλητές όπου X Z Z Z. Zν- ν- ν η κατηγορία η κατηγορία (ν-)-στή κατηγορία ν-στή κατηγορία Εφαρµοσµ. νάλ. Παλινδρ.& ιασποράς- Μτασχηµατισµοί Μταβλητών
Παράδιγµα,, C ποικιλίς από γαλοπούλς Χ ηλικία (σ βδοµ.) Υ βάρος (σ pounds) ιαφέρουν οι ποικιλίς; X 8 7 8 6 Y. 8. 5..4..4..8 Ποικ. = Y Yˆ -.5 -.47 -.7 -.75 -.67 -.8 -.45 -.7 X 7 5 Y.5 4. 5.4..8 Ποικ. = Y Yˆ.767.67..5.4 Παλινδροµήσις (ανά ποικιλία) 4 Μοντέλο Ŷ=.8+.467 X () s( ˆ β ) = 4.45,.5,.84 ( ) R =.6647 Y= β + β X+ Y= β + β X+ Y= β + β X+ Y= β + β X+ -.5 -.5.5.5 (για την ποικιλία ) (για την ποικιλία ) (για την ποικιλία ) Χ 8 Υ. 8. 5..4 Ŷ= -.7 +.56 X Εφαρµοσµ. νάλ. Παλινδρ.& ιασποράς- Μτασχηµατισµοί Μταβλητών
Μ βωβές µταβλητές 5 Χ Υ Ποικ. Z Z =Υ ˆ Yˆ Y = β + β X + α Ζ +αζ + 8 7 8 6 7 5. 8. 5..4..4..8.5 4. 5.4..8.58 -.48..7 -.55.8. -.5 -.5 -.74 -.47.474. R =.74 Y ˆ =.4+.4 X. Ζ. Ζ () Ŷ= -.4875 +.4868X Ŷ= -.76 +.4868X Ŷ=.4 +.4868X (για την ) (για την ) (για την ) Οπτικός έλγχος του µοντέλου 6 Υπόλοιπα ανά ποικιλία Παλινδρόµηση ανά ποικιλία -.4 -....4 6 4 8 5 5 5 Εφαρµοσµ. νάλ. Παλινδρ.& ιασποράς- Μτασχηµατισµοί Μταβλητών
ΕΡΩΤΗΜΤ 7 Οι ποικιλίς,, διαφέρουν; Η : β= β= β Η : όχι η Η SSR = 8.6575 SSR Π =6. s =. Όµως F,;.5 =.4 β= β+ α πιδή β= β+ α β = β Η : α= α= Η : όχι η Η το () ίναι πριορισµένο του () που ίναι το πλήρς ( 8.6575 6. )/ F= = 68.8. Άρα για α=.5 η Η ΠΟΡΡΙΠΤΕΤΙ ή δν αρκί το µοντέλο () να πριγράψι το Y ΕΡΩΤΗΜΤ (συν.) 8 Οι ποικιλίς, ίναι όµοις αλλά διαφέρουν από τη ; Η : β= β β Η : όχι η Η Τώρα πριορισµένο ίναι το: Η : α= α Η : όχι η Η Y = β + β X + α ( Ζ +Ζ ) + µ πλήρς το: Y = β + β X + α Ζ +αζ + ( SSR SSRΠ ) / 8.6575 8.4544 F= = =.56 s. Όµως F,;. =. Άρα για οποιοδήποτ α η Η ΕΝ ΠΟΡΡΙΠΤΕΤΙ ή δν ισοδύναµα έχουµ δύο ποικιλίς τις, και τη. Εφαρµοσµ. νάλ. Παλινδρ.& ιασποράς- Μτασχηµατισµοί Μταβλητών 4
ΤΕΛΙΚΟ ΜΟΝΤΕΛΟ Σφάλµατα Y ˆ =.68 +.47667 X.475( Ζ +Ζ ) ραφικές παραστάσις.6, -.6,.,.8, -.7, -.5,.6, -.5, -.8, -.58, -.7,.458,. µ =.55 (παράβαλ.5 στο (),.8 στο () ) R =.758 και s =.55 -.4 -....4 6 4 () ή 8 5 5 5 Μ αλληλπίδραση Y = β + β X + α Ζ +α Ζ + γ X Ζ +γ XΖ + (4) οι αλληλπιδράσις Y ˆ =.475+.445 X.454 Ζ.775 Ζ +.6 XΖ +.5 XΖ Ŷ= -.7 +.56 X Ŷ= -.+.47X Ŷ=.475+.445X (για την ) (για την ) (για την ) 4 R =.8 6 8 5 5 5 Εφαρµοσµ. νάλ. Παλινδρ.& ιασποράς- Μτασχηµατισµοί Μταβλητών 5
ΛΛ ΠΙΘΝ ΜΟΝΤΕΛ Y = β + β X + α ( Ζ + Ζ ) + γx ( Ζ + Ζ ) + (5) Το µοντέλο () µ αλληλπιδράσις Y = β + β X + β X + α ( Ζ + Ζ ) + a X ( Ζ + Ζ ) + a X ( Ζ + Ζ ) + Μ δυτροβάθµις σχέσις και αλληλπιδράσις Y β β X β X + + + Ζ + + Ζ + = + + + ( γ γx γ X ) + ( δ δx δ X ) + ( ζ + ζ X + ζ X )( Ζ + Ζ ) + Πιο πολύπλοκο µοντέλο Στο τλυταίο µοντέλο ίναι k=. Έτσι απαιτίται να ίναι το n-k- τουλάχιστον, δηλαδή n. (6) (7) Άλλς βωβές Μταβλητές Είναι οι µταβλητές W,,W 5 κατάλληλς να αντικαταστήσουν το Χ µ 6 κατηγορίς; Χ W W W W 4 W 5 4 5 6 Ισχύουν W = W = Z+ Z W = Z+ Z+ W4 = Z+ Z+ Z+ Z4 W = Z + Z + Z + Z + Z 5 4 5 Συγκρίνουµ µ τις µταβλητές Ζ k και Z Z Z Z 4 Z 5 5 5 4 Z = W Z = W W Z = W W Z4 = W4 W Z = W W άρα µπορούν οι W k να χρησιµοποιηθούν αντί των Z k Εφαρµοσµ. νάλ. Παλινδρ.& ιασποράς- Μτασχηµατισµοί Μταβλητών 6
ΠΡ ΕΙΜ (άσκηση.) x διαδοχικά έτη y ζήτηση σ τόνους Στο ο έτος ένα ανταγωνιστικό προϊόν αναβαθµίστηκ Θέτουµ Πρίοδος Ι τα έτη έως Πρίοδος ΙΙ τα έτη έως 5 Παρατηρούµ x αυξάνι στην Ι, σταθρό στην ΙΙ x αυξάνι στην ΙΙ, σταθρό στην Ι x +x =x, x ίναι δίκτρια της ΙΙ x y x x z 4 5 6 7 8 4 5 4 4 6 6 5 6 6 7 7 7 8 4 5 6 7 8 4 5 6 Το µοντέλο 4 Y = β + β X + β X + β X + ) Y ˆ = 8.674+.765 X +.48574 X.74 X () όπου s( β ˆ ) = (.75,.74,.,.48) ια x< ίναι x=x, x =, x =, οπότ: Yˆ = 8.674+.765 X, X < ια x> ίναι x=x +, x =, x =, οπότ: Yˆ =.4857+.48574 X, X > και SSR=.7857 () () Εφαρµοσµ. νάλ. Παλινδρ.& ιασποράς- Μτασχηµατισµοί Μταβλητών 7
ραφική παράσταση των µοντέλων 5 4 6 8 πρ. I πρ. IΙ 5 5 Υποθέσις 6 Η : β =.7 T= = 4. Η : β.48 αλλά t ;.5 =-.76 ΕΝ ΤΥΤΙΖΟΝΤΙ ΟΙ ΡΜΜΕΣ Η : β =β,β Η : όχι η Η SSR SSRΣ.7857 87.7476 F= = =.75 s.6 και F,;.5 =4.75 λέγχται µ το µοντέλο Y = β + β ( X + X ) + β X ) + που ίναι συµπτυγµένο του πλήρους ΕΝ ΕΊΝΙ ΠΡΛΛΗΛΕΣ ΟΙ ΡΜΜΕΣ Εφαρµοσµ. νάλ. Παλινδρ.& ιασποράς- Μτασχηµατισµοί Μταβλητών 8
ΕΤΕΡΟΣΚΕ ΣΤΙΚΟΤΗΤ 7 ναγκαίς προϋποθέσις φαρµογής γραµµικού µοντέλου Ν Ι οπτικός έλγχος Σχηµατίζουµ τα γραφήµατα x, s yˆ, s (, σ ) ή E( ) = V ( ) σ = Ι Σχόλια 8 () () () (4) σύµφωνα µ προϋποθέσις Υπάρχι αύξηση της διασποράς κατά τον άξονα x ή ŷ ανάλογα. Πιθανή βλτίωση: Να θωρηθί. Τότ προφανώς Var( και το µοντέλο Y = β +β X + / x ) = k γράφται Y/Χ = β +β (/X) + (/Χ) ή W = α +α Z + e που ικανοποιί τις προϋποθέσις Var( ) = k x Υπάρχι συστηµατικό λάθος. Το µοντέλο υπρ-κτιµά την πραγµατικότητα στις µικρές τιµές του x (ή ŷανάλογα) και την υπο-κτιµά στις µγάλς τιµές. Πιθανή βλτίωση µ προσθήκη σταθρών όρων ή γραµµικά συσχτισµένων µταβλητών. Υπάρχι συστηµατικό λάθος. Πιθανή βλτίωση µ προσθήκη δυτροβάθµιων όρων. Εφαρµοσµ. νάλ. Παλινδρ.& ιασποράς- Μτασχηµατισµοί Μταβλητών
ΠΡ ΕΙΜ (παρ..) x = πλήθος ργατών Μοντέλο Y= β+ β X+ y = πλήθος ξταστών Yˆ = 4.448+.5X (.56) (.) standardzed resduals - - 4 6 8 4 6 x Θέτουµ z=/x και w=y/x µ R =.776 α/α x 4 5 6 7 8 4 5 6 7 8 4 5 6 7 4 47 67 58 4 45 54 48 67 688 6 7 67 65 5 7 85 8 5 5 5 65 y 7 44 47 4 56 6 68 78 8 84 88 7 4 7 6 8 6 7 8 5 µ το µτασχηµατισµό Νέο Μοντέλο W=α +α Z+e α/α z w Wˆ =.+.8Z µ R (.) (4.57) =.7 standardzed resduals -....4 /x Yˆ =.8+.X Οι τλυταίοι συντλστές δν ίναι αξιόπιστοι 4 5 6 7 8 4 5 6 7 8 4 5 6 7.4.45.75.7.6...87.8.4.45.5.4.5.6..8..4.8..8.8.8.8.67.6.4.55.858...5756.444.6.555..68..4.547.66..55.57.54.55.65.56.5.5.86.4.88 Εφαρµοσµ. νάλ. Παλινδρ.& ιασποράς- Μτασχηµατισµοί Μταβλητών
Σύγκριση των δύο γραµµών y 5 5 y=.8+. x y=4.448+.5 x 4 6 8 4 6 x Μέθοδος Σταθµισµένων.τ. ς υποθέσουµ ότι στο µοντέλο Ν (, σ V ) ή Y= Xβ + E( ) = V ( ) = σ V ισχύουν: Επιδή V θ.ο. πίνακας πάντα µη=ιδιάζων συµµτρικός πίνακας P ώστ: f= P Ε ( f ) =Ε ( P ) = P Ε ( ) = V ( f ) = E ( f E( f ))( f E( f )) = E( f f ) = ( P P ) P ( ) P P V ( ) P P V P P P P P Θέτοντας: P P= P P= P = V =Ε = Ε = = = σ = σ = σι Εφαρµοσµ. νάλ. Παλινδρ.& ιασποράς- Μτασχηµατισµοί Μταβλητών
Εκτίµηση συντλστών µ σταθµ..τ. Άρα οπότ Y= Xβ + P Y= P Xβ + P Q= Zβ + f στο οποίο ικανοποιούνται οι γνωστές προϋποθέσις άρα ˆ - β = (Z Z) (Z Q) ˆ - β = (X P P X ) (X P P Y ) ˆ - β = (X V X ) (X V Y ) ια ασυσχέτιστς προβλέπουσς 4 σ σ V () = Vσ = σ σ όπου σ ω = σ Παρατηρούµ n = X V X ω x j x k = X V Y ω x j y ω ω - V = ω ω νώ νώ X X= x j x k X Y= x j y n ηλαδή τα ω λιτουργούν ως συντλστές στάθµισης Εφαρµοσµ. νάλ. Παλινδρ.& ιασποράς- Μτασχηµατισµοί Μταβλητών
ΠΡ ΕΙΜ (το προηγούµνο) 5 Y Στο µοντέλο Ισοδύναµα y y y = 7 X Y= β + β X+ υποθέτουµ = Y= Xβ + x x β x 7 ˆ - ) β = β όπου: = 7 και Var β = (X V X ) (X V Y =.467.465454.6474 = =.465454 7.44678.8 =. δηλαδή προέκυψ πάλι το ίδιο µοντέλο ( ) = σ x Φαίνται από το σχήµα x V ( ) σ x = x n ΣΤΤΙΣΤΙΚΟ Durbn - Watson 6 ν στο µοντέλο υποθέσουµ ότι και η t Y= β+ β X + + βk X k+ = ρ + η όπου η N(,σ ) t t- t ανξάρτητη των τότ ο συντ. συσχ. των σφαλµάτων Το στατιστικό λέγχι την υπόθση d= n t= ( - ) n t= t t- t Η : ρ= Η : ρ> t-, t-,,η t-,η t-,, ή t ίναι Η : ρ= Η : ρ< ρ = ρ s ή s Η : ρ= Η : ρ πό πίνακς υπολογίζονται για διάφορα α οι τιµές d L, d U, και συγκρίνουµ µ την τιµή του d. +s Εφαρµοσµ. νάλ. Παλινδρ.& ιασποράς- Μτασχηµατισµοί Μταβλητών
Σχηµατικός έλγχος DW τστ 7 H : ρ = θτική αυτοσυσχέτιση H : ρ > H : ρ = αρνητική αυτοσυσχέτιση H : ρ < ΠΟΡ. H δν αποφ. δν απορ. d L d u δν απορ. H : ρ = H : ρ δν αποφ. ΠΟΡ. H 4-d u 4-d L 4 DW (d) Παράδιγµα 8 Στο τλυταίο παράδιγµα βρίσκουµ: n ( - ) k k- k= d= = n k k=.57 πό πίνακς βρίσκουµ ότι για k= (προβλέπουσς µταβλητές) και n=7, και για α=.5 τα όρια ίναι d L =.6, και d U =.46 d L d u 4-d u 4-d L 4.6.46.5.684.57 ν µπορούµ να αποφασίσουµ Εφαρµοσµ. νάλ. Παλινδρ.& ιασποράς- Μτασχηµατισµοί Μταβλητών 4
Όρια του στατιστικού D-W Όρια του στατιστικού D-W (συν.) Εφαρµοσµ. νάλ. Παλινδρ.& ιασποράς- Μτασχηµατισµοί Μταβλητών 5
Θέµατα () Ο διπλανός πίνακας πριέχι ξαµηνιαίς µτρήσις των πωλήσων µιας πιχίρησης. Είναι γνωστό ότι οι πρώτς 5 µτρήσις έχουν µια γραµµική σχέση, οι πόµνς 4 έχουν µια άλλη γραµµική σχέση, όπως φαίνται οπτικά κι από το σχήµα. Το ρώτηµα ίναι κατά πόσον αυτές οι γραµµικές σχέσις ίναι ίδις ή διαφορτικές. Κάναµ δύο παλινδροµήσις και πήραµ τα παρακάτω µοντέλα πρόβλψης () yˆ =.56+.467 x, µ SSR=8.8, SST=.6 () yˆ =.874+.8 x+.5 x, µ SSR=.5 α) Να βρθούν οι γραµµικές σχέσις στα διαστήµατα x 5 και x 5, και να παρασταθούν γρα-φικά. β) Εξτάστ αν οι δύο γραµµές ταυτίζονται (να διατυπωθί η υπόθση την οποία θα λέγξτ) x Ηµροµηνία x x y Μάρ. 7-4. Σπ. 7 -.8 Μάρ. 7-6.5 4 Σπ. 7-7.4 5 Μάρ. 7. 6 Σπ. 7.5 7 Μάρ. 7. 8 Σπ. 7. Μάρ. 74 4.6 Θέµατα () Σ µια µλέτη της σχέσης των µισθών µ το κοινωνικο-οικονοµικό-κπαιδυτικό πίπδο των ργαζοµένων ο ρυνητής χώρισ τα 55 άτοµα που συµµτίχαν σ τρις κατηγορίς =χαµηλό, =µέσο και =υψηλό. Κατέγραψ τους µηνιαίους µισθούς τους Yσ την µπιρία τους Xσ έτη. Στη συνέχια όρισ βωβές µταβλητές Ζ µ τιµή για τα άτοµα χαµηλού πιπέδου και για τα άλλα και Ζ µ τιµή για τα άτοµα µσαίου πιπέδου και για τα άλλα. Συµβόλισ τέλος W =X Z και W =X Z τις µταβλητές που συνδυάζουν την µπιρία µ το πίπδο του ργαζοµένου. Όρισ τέλος και τις µταβλητές U =Z +Z και U =X (Z +Z )=W +W. Προκιµένου να βρθί ένα µοντέλο πρόβλψης του µισθού σ κάθ πίπδο των ργαζοµένων έγιν µια σιρά από παλινδροµήσις, ορισµένα από τα αποτλέσµατα των οποίων δίνονται στον πίνακα. Στο σχήµα δίνονται γραφικά οι τρις γραµµές παλινδρόµησης. Μταβλητές στο µοντέλο θροίσµατα, Συντλστές (Χ) SST=588, SSR=456, (β,β )=(46., 8.4). (Χ,Ζ,Ζ,W,W ) SSR=5, (β, β, γ, γ, δ, δ )=(684., 8.4,-.,-.6,-.,-.4) (Χ,U,U ) SSR=47, (β, β,, )=(684., 8.,-6.,-.8) Εφαρµοσµ. νάλ. Παλινδρ.& ιασποράς- Μτασχηµατισµοί Μταβλητών 6
Θέµατα ( συν.) Στο σχήµα δίνονται γραφικά οι τρις γραµµές παλινδρόµησης. α) ρέστ συνδυάζοντας κατάλληλα τις πληροφορίς του πίνακα, τα µοντέλα πρόβλψης του µισθού από την µπιρία σ κάθ πίπδο και σηµιώστ τα στο σχήµα. β) Ποια µηδνική υπόθση λέγχι το άν οι τρις υθίς ταυτίζονται; ιατυπώστ την υπόθση µ τρόπο που να αφορά τις παραµέτρους νός µοντέλου και στη συνέχια κάντ τον έλγχο. y 4 5 6 7 8 5 5 x Θέµατα () 4 Εικοσιµία παρατηρήσις της µταβλητής Υ γιαδοσµένς τιµές των Χ, Χ και Χ δίνονται στο διπλανό πίνακα. Προκιµένου να βρθί το καλύτρο µοντέλο που κτιµά τις τιµές της Υ από αυτές των Χ, Χ και Χ έγινανόλςοιδυνατέςπαλινδροµήσιςτηςυµτιςχ k, k=,,. ίνται ότι SST=548., και ότι το SSR για τα διάφορα µοντέλα ίναι: µταβλητές SSR () 848. () 4.6 () 45. (, ) 8. (, ) 86. (, ) 58.7 (,, ) 6. όπου οι αριθµοί στις παρνθέσις δηλώνουν ποις µταβλητές ίναι στο µοντέλο. Χ Χ Χ Y. 7..8 8.. 7..5 4.5. 8.5.7 8.. 8.5.6 8....7.5.6 4.5.6 5.5.6 7..7 4..6 7..8 4..6 5.5.7 45.5.6 7.. 8.5.6 8.5. 4..6.. 5.5.4 6..6 8..4..6 6..4 4.5.6 6..4 6.. 66.5.4 6.. 7. 5. 4.5.8 47. 5. 4.5.7.5 5. 7.5..5 5... 5.5 Εφαρµοσµ. νάλ. Παλινδρ.& ιασποράς- Μτασχηµατισµοί Μταβλητών 7
Θέµατα ( συν.) 5 α) ρέστ το καλύτρο και το αµέσως καλύτρο µοντέλο µ το κριτήριο R. Να αποδιχθί ο ισχυρισµός σας µ κατάλληλο έλγχο. β) Παρατηρώντας ότι η µταβλητή Χ έχι τέσσρις κατηγορίς, ορίσαµ τρις βωβές µταβλητές τις Ζ, Ζ και Ζ που παίρνουν την τιµή όταν η Χ ίναι αντίστοιχα,.6 και.4 και αλλού. Στη συνέχια κάναµ παλινδρόµηση θωρώντας το µοντέλο Υ=β +β Χ +β Χ +α Ζ +α Ζ +α Ζ +, και πήραµ R =.886, νώ οι συντλστές παλινδρόµησης ήταν αντίστοιχα: (β,β,β,α,α,α )=( 4.8, 4.,.7, 44.5, 5.64,.44). ρέστ το µοντέλο πρόβλψης της Υ για τις 4 κατηγορίς της Χ και δίξτ ότι τα τέσσρα αυτά µοντέλα ταυτίζονται αν ισχύι α =α =α =. Στη συνέχια, κάντ τον έλγχο αν τα τέσσρα µοντέλα ταυτίζονται. Εφαρµοσµ. νάλ. Παλινδρ.& ιασποράς- Μτασχηµατισµοί Μταβλητών 8