ΠΡΟΒΛΗΜΑ ΑΥΤΟΣΥΣΧΕΤΙΣΤΩΝ ΣΦΑΛΜΑΤΩΝ ΤΡΟΠΟΙ ΕΛΕΓΧΟΥ ΔΙΟΡΘΩΣΗ ΠΡΟΒΛΗΜΑΤΟΣ ΣΥΝΕΠΕΙΕΣ ΠΡΟΒΛΗΜΑΤΟΣ ΠΑΡΑΔΕΙΓΜΑΤΑ 1
ΤΡΟΠΟΙ ΕΛΕΓΧΟΥ Γραφική παράσταση των υπολοίπων (ή των μαθητικοποιημένων υπολοίπων) ως προς την χρονολογική σειρά των παρατηρήσεων. Τεστ των ροών για τα υπόλοιπα. Γραφική παράσταση των υπολοίπων ως προς k προηγούμενες τους τιμές. Τεστ των Durbin-Watson (1 ου βαθμού). 2
Τεστ των ροών 3
Τεστ των Durbin-Watson Το στατιστικό αυτό ελέγχει την μηδενική υπόθεση της μη ύπαρξης αυτοσυσχέτισης έναντι της εναλλακτικής ότι υπάρχει θετική αυτοσυσχέτιση πρώτου βαθμού (γραμμική). Η τιμή του D συγκρίνεται με τις τιμές d_l και d_u που δίνονται από κατάλληλους πίνακες. Αν D<d_l τότε απορρίπτεται η υπόθεση των ασυσχέτιστων σφαλμάτων. Αν D>d_u η υπόθεση δεν μπορεί να απορριφθεί, ενώ αν d_l<d<d_u δεν μπορούμε να πάρουμε απόφαση. 4
ΔΙΟΡΘΩΣΗ ΤΟΥ ΠΡΟΒΛΗΜΑΤΟΣ ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΣ ΠΡΟΣΘΗΚΗ ΜΕΤΑΒΛΗΤΗΣ ΑΝΕΞΑΡΤΗΤΗΣ ΧΡΗΣΗ ΓΕΝΙΚΕΥΜΕΝΩΝ ΕΚΤΙΜΗΤΩΝ ΕΛΑΧΙΣΤΩΝ ΤΕΤΡΑΓΩΝΩΝ 5
ΣΥΝΕΠΕΙΕΣ Οι εκτιμητές ελαχίστων τετραγώνων είναι αμερόληπτοι, αλλά όχι ΑΟΕΔ. Ο εκτιμητής του σ και τα τυπικά σφάλματα των συντελεστών της παλινδρόμησης μπορεί να υποεκτιμούνται. Αυτό οδηγεί σε μη αξιόπιστα αποτελέσματα για τα διαστήματα εμπιστοσύνης και για τους ελέγχους υποθέσεων για τις παραμέτρους του μοντέλου. 6
ΠΑΡΑΔΕΙΓΜΑ 1 Chatterjee and Price (1980) p.124 Στο αρχείο autocorrelation1.sav καταγράφονται τα τετραμηνιαία δεδομένα από το 1952 έως το 1956 που αφορούν τις δαπάνες και τις αποταμιεύσεις μετρούμενες σε δισ. δολάρια. Οι οικονομολόγοι ενδιαφέρονται για την μεταβολή στις δαπάνες που προκαλούνται από τη μεταβολή στις αποταμιεύσεις. 7
ΔΙΟΡΘΩΣΗ ΑΥΤΟΣΥΣΧΕΤΙΣΗΣ ΠΡΩΤΟΥ ΒΑΘΜΟΥ ΑΡΧΙΚΟ ΜΟΝΤΕΛΟ: Y X t 0 1 t t Η ΥΠΑΡΞΗ ΑΥΤΟΣΥΣΧΕΤΙΣΗΣ ΠΡΩΤΟΥ ΒΑΘΜΟΥ ΣΗΜΑΙΝΕΙ u, 1 t t1 t 8
Ποιο μοντέλο προκύπτει? Y X Y X u t 0 1 t t1 0 1 t1 t Y Y (1 ) X X u t t1 0 1 t t1 t 9
Ποιος ο μετασχηματισμός Y Y Y, X X X * * t t1 t t t1 t 10
Πρόβλημα Πως θα υπολογίσουμε το ρ???? Λύση: Εκτίμηση. Πως? Από το παρακάτω μοντέλο έχετε την απάντηση!!! Προσαρμογή του μοντέλου et et 1 ut, 1 11
Εφαρμογή του μετασχηματισμού Επιστροφή στο αρχικό μοντέλο Πως??? Yˆ Y ˆ * * * * t 0 1 t t ˆ 1 * 0 ˆ ˆ ˆ X * 1 X t 12
ΛΥΣΗ ΠΑΡΑΔΕΙΓΜΑΤΟΣ Αρχικά υπολογισμός του Δημιουργία των μεταβλητών Προσαρμογή του νέου μοντέλου Αναγωγή στο αρχικό ˆ 0.875 ˆ *, ˆ * t t1 t t t1 t Y Y Y X X X Y ˆ ˆ X 30.523 2.795X 0 1 ˆt * * * * * t t Y ˆt 244.184 2.795 X t 13
ΠΑΡΑΔΕΙΓΜΑ 2 Chatterjee and Price (1980), p. 133 Μία εταιρεία θέλει να κατανοήσει τη σχέση μεταξύ οικοδομικών αδειών (housing starts) και της ανάπτυξης του πληθυσμού. Στο αρχείο autocorrelation2.sav δίνονται τα δεδομένα αυτά για 25 χρόνια. Επιπλέον, σε μία τρίτη στήλη δίνεται η τιμή ενός δείκτη που μετρά την οικονομική δυνατότητα (mortgage money). 14
ΠΡΟΒΛΗΜΑ ΑΥΤΟΣΥΣΧΕΤΙΣΗΣ ΔΙΟΡΘΩΣΗ ΜΕ ΕΙΣΑΓΩΓΗ ΝΕΑΣ ΜΕΤΑΒΛΗΤΗΣ 15
ΠΑΡΑΔΕΙΓΜΑ 3 Chatterjee and Price (1980) p. 138 Μία εταιρεία της Αμερικής παράγει και πουλάει εξαρτήματα σκι. Θέλει να προβλέψει τις πωλήσεις της με βάση ένα δείκτη (PDI) που μετρά το εισόδημα. Δίνονται στο αρχείο autocorrelation3.sav τα δεδομένα που αφορούν 40 τρίμηνα από το 1964-1973. 16
ΠΡΟΒΛΗΜΑ ΑΥΤΟΣΥΣΧΕΤΙΣΤΩΝ ΣΦΑΛΜΑΤΩΝ ΔΙΟΡΘΩΣΗ ΜΕ ΕΙΣΑΓΩΓΗ ΔΕΙΚΤΡΙΑΣ ΜΕΤΑΒΛΗΤΗΣ!!!! 17
Παράδειγμα 1 Προσαρμόζω το μοντέλο χωρίς quarter
Τότε προκύπτουν Model Summary(b) Adjusted R Std. Error of Model R R Square Square the Estimate Durbin-Watson 1,978(a),957,955 3,98268,328 a Predictors: (Constant), Money Stoch b Dependent Variable: Consumer Expenditure Coefficients(a) Unstandardized Coefficients Standardized Coefficients t Sig. Model B Std. Error Beta B Std. Error 1 (Constant) -154,719 19,850-7,794,000 Money Stoch 2,300,115,978 20,080,000 a Dependent Variable: Consumer Expenditure Ελέγχω κανονικότητα σταθερή διακύμανση ορθότητα μοντέλου Καθώς οι παρατηρήσεις έχουν διαταχθεί κατά χρονολογική σειρά είναι δικαιολογημένο να περιμένω ότι μπορεί να εμφανιστεί αυτοσυσχέτιση
Τρόποι ελέγχου Γραφική παράσταση των υπολοίπων (ή των μαθητικοποιημένων υπολοίπων) ως προς την χρονολογική σειρά των παρατηρήσεων. Άρα δημιουργώ τη στήλη ΑΑ. Έπειτα γραφική από Chart Builder υπολοίπων ως προς ΑΑ. 8,00000 6,00000 Unstandardized Residual 4,00000 2,00000 0,00000-2,00000-4,00000-6,00000 0,00 5,00 10,00 aa 15,00 20,00 Παρατηρούμε ότι κάποια θετικά, μετά αρνητικά μετά θετικά.αρα υπάρχει αυτοσυσχέτιση!!!!! Τεστ των Durbin-Watson (1 ου βαθμού). Ένας άλλος στατιστικός τρόπος εξέτασης της αυτοσυσχέτισης πρώτου βαθμού επιτυγχάνεται με το στατιστικό των Durbin-Watson (Linear Regression Statistics). Το στατιστικό αυτό ελέγχει την μηδενική υπόθεση της μη ύπαρξης αυτοσυσχέτισης έναντι της εναλλακτικής ότι υπάρχει θετική αυτοσυσχέτιση πρώτου βαθμού (γραμμική). Η τιμή d αυτού του στατιστικού συγκρίνεται με τις τιμές d l και d u που δίνονται από κατάλληλους πίνακες. Αν d d τότε απορρίπτεται η υπόθεση των l
ασυσχέτιστων σφαλμάτων. Αν d d η υπόθεση δεν μπορεί να απορριφθεί, ενώ αν u d d d δεν μπορούμε να πάρουμε απόφαση. l u Model Summary(b) Adjusted R Std. Error of Model R R Square Square the Estimate Durbin-Watson 1,978(a),957,955 3,98268,328 a Predictors: (Constant), Money Stoch b Dependent Variable: Consumer Expenditure Για n=20 k=1 είναι dl 1.2 και du 1.41 οπότε απορρίπτεται η υπόθεση των ασυσχέτιστων σφαλμάτων. Άρα υπάρχει αυτοσυσχέτιση πρώτου βαθμού. Runs Test Unstandardize d Residual Test Value(a),0000000 Total Cases 20 Number of Runs 5 Z -2,447 Asymp. Sig. (2-tailed),014 a User-specified. Αν το αρχικό μοντέλο είναι το Y t 0 1 t t Ύπαρξη αυτοσυσχέτισης πρώτου βαθμού σημαίνει ότι:
Επομένως με πράξεις έχω t t 1 ut, 1 Y X Y X u t 0 1 t t1 0 1 t1 t Y Y (1 ) X X u t t1 0 1 t t1 t Επομένως μου υποδεικνύεται ποιος είναι ο μετασχηματισμός. Είναι ο Y Y Y, X X X * * t t1 t t t1 t Το θέμα είναι πως θα υπολογίσω το ρ. Λύση εκτίμηση Πως? Από το μοντέλο u t t 1 t Δηλαδή το μοντέλο χωρίς σταθερό όρο με εξαρτημένη τα υπόλοιπα και ανεξάρτητη τη Lag(υπόλοιπα,1). Coefficients(a,b) Unstandardized Coefficients Standardized Coefficients t Sig. Model B Std. Error Beta B Std. Error 1 lagres1,875,143,822 6,128,000 a Dependent Variable: Unstandardized Residual b Linear Regression through the Origin Άρα ˆ 0.874 επομένως είμαι σε θέση τώρα να κάνω το νέο μετασχηματισμό Y 0.875 Y Y, X 0.875X X * * t t1 t t t1 t Coefficients(a) Unstandardized Coefficients Standardized Coefficients t Sig. Model B Std. Error Beta B Std. Error 1 (Constant) -30,523 14,044-2,173,044 xasteri 2,795,613,742 4,557,000 a Dependent Variable: yasteri Model Summary(b)
Adjusted R Std. Error of Model R R Square Square the Estimate Durbin-Watson 1,742(a),550,523 2,25138 1,669 a Predictors: (Constant), xasteri b Dependent Variable: yasteri ˆ 30.523 0 1 ˆ 2.795 άρα 0 ˆ 30.523 244.184 ˆ 1ό 2.795 1 0.875 Παράδειγμα 2 Coefficients(a) Unstandardized Coefficients Standardized Coefficients t Sig. Model B Std. Error Beta B Std. Error 1 (Constant) -,061,010-5,845,000 popult,071,004,962 16,867,000 a Dependent Variable: starts
Model Summary(b) Adjusted R Std. Error of Model R R Square Square the Estimate Durbin-Watson 1,962(a),925,922,00408024,621 a Predictors: (Constant), popult b Dependent Variable: starts d 1.29 υπάρχει αυτοσυσχέτιση πρώτου βαθμού l 0,01000 Unstandardized Residual 0,00500 0,00000-0,00500-0,01000 0,00 5,00 10,00 id 15,00 20,00 25,00 Runs Test Unstandardize d Residual Test Value(a),0000000 Total Cases 25 Number of Runs 6 Z -2,829 Asymp. Sig. (2-tailed),005 a User-specified. Προσαρμόζω το μοντέλο βάζοντας και τη νέα μεταβλητή μέσα υποψιασμένος ότι δεν αρκούν αυτές οι δύο μεταβλητές Model Summary(b) Model R R Square Adjusted R Square Std. Error of the Estimate Durbin-Watson 1,986(a),973,971,00250302 1,852 a Predictors: (Constant), index, popult
b Dependent Variable: starts Coefficients(a) Unstandardized Coefficients Standardized Coefficients t Sig. Model B Std. Error Beta B Std. Error 1 (Constant) -,010,010-1,013,322 popult,035,006,467 5,394,000 index,760,122,541 6,254,000 a Dependent Variable: starts d 1.29 d 1, 45 άρα όχι αυτοσυσχέτιση πρώτου βαθμού. l u 0,00250 Unstandardized Residual 0,00000-0,00250-0,00500-0,00750 0,00 5,00 10,00 id 15,00 20,00 25,00 Runs Test Unstandardize d Residual Test Value(a),0000000 Total Cases 25 Number of Runs 13 Z,000 Asymp. Sig. (2-tailed) 1,000 a User-specified. Παράδειγμα 3
Model Summary(b) Adjusted R Std. Error of Model R R Square Square the Estimate Durbin-Watson 1,895(a),801,795 3,01938 1,968 a Predictors: (Constant), pdi b Dependent Variable: sales Coefficients(a) Unstandardized Coefficients Standardized Coefficients t Sig. Model B Std. Error Beta B Std. Error 1 (Constant) 12,392 2,539 4,880,000 pdi,198,016,895 12,351,000 a Dependent Variable: sales n=40 dl=1.44 du=1.54 όχι αυτοσυσχέτιση πρώτου βαθμού.
5,00000 Unstandardized Residual 2,50000 0,00000-2,50000-5,00000 0,00 10,00 20,00 aa 30,00 40,00 5,00000 Unstandardized Residual 2,50000 0,00000-2,50000-5,00000-5,00-2,50 0,00 reslag1 2,50 5,00
5,00000 Unstandardized Residual 2,50000 0,00000-2,50000-5,00000-5,00-2,50 0,00 reslag2 2,50 5,00
Εισαγωγή δείκτριας 1 για χειμώνα 0 για καλοκαίρι Model Summary(b) Adjusted R Std. Error of Model R R Square Square the Estimate Durbin-Watson 1,986(a),972,971 1,13737 1,772 a Predictors: (Constant), period, pdi b Dependent Variable: sales Coefficients(a) Unstandardized Coefficients Standardized Coefficients t Sig. Model B Std. Error Beta B Std. Error 1 (Constant) 20,469 1,094 18,704,000 pdi,199,006,898 32,915,000 period -5,464,360 -,415-15,192,000 a Dependent Variable: sales
3,00000 2,00000 Unstandardized Residual 1,00000 0,00000-1,00000-2,00000-3,00000 0,00 10,00 20,00 aa 30,00 40,00 Runs Test Unstandardize d Residual Test Value(a),0000000 Total Cases 40 Number of Runs 18 Z -,787 Asymp. Sig. (2-tailed),431 a User-specified.