ΚΕΦΑΛΑΙΟ 8 ΠΡΟΒΛΗΜΑΤΑ ΜΕ ΤΙΣ ΕΠΕΞΗΓΗΜΑΤΙΚΕΣ ΜΕΤΑΒΛΗΤΕΣ 8. ΕΙΣΑΓΩΓΗ Μέχρι τώρα τα προβλήματα που δημιουργούνται από την παραβίαση των υποθέσεων που πρέπει να ισχύουν ώστε οι OLS εκτιμητές να είναι BLUE είχαν να κάνουν με το διαταρακτικό όρο u του υποδείγματος y=xβ+u. Πιο συγκεκριμένα αν '.... E uu τότε έχουμε το πρόβλημα της ετεροσκεδαστικότητας, ενώ αν 0 E u u για t t s s 0 έχουμε το πρόβλημα της αυτοσυσχέτισης. Και οι δύο περιπτώσεις συνεπάγονται αμερόληπτους, συνεπείς, αλλά μη αποτελεσματικούς OLS εκτιμητές. Όπως είδαμε το πρόβλημα αυτό αντιμετωπίζεται με την χρήση GLS εκτιμητών. Σοβαρότερες είναι οι συνέπειες όταν τα προβλήματα αφορούν τις επεξηγηματικές μεταβλητές του υποδείγματος. Τέτοιου είδους προβλήματα μπορούμε να τα κατατάξουμε σε τρείς κατηγορίες. i. Συσχέτιση μεταξύ επεξηγηματικών μεταβλητών και διαταρακτικού όρου. Στην περίπτωση αυτή όπως θα δούμε οι OLS εκτιμήσεις είναι μεροληπτικές και ασυνεπείς και ένας τρόπος να επιλυθεί το πρόβλημα είναι η μέθοδο των βοηθητικών μεταβλητών (instrumental variables). ii. Ο πίνακας Χ δεν έχει πλήρη βαθμό. Τότε έχουμε το γνωστό πρόβλημα της πολυσυγγραμικότητας. iii. Σφάλμα εξειδικεύσεως του υποδείγματος. Σε αυτή την περίπτωση μπορεί να συμβαίνει ένα από τα παρακάτω, ή οποιοσδήποτε συνδυασμός τους. Α) παράλειψη ερμηνευτικής μεταβλητής Β) προσθήκη μη απαραίτητης ερμηνευτικής μεταβλητής. Γ) εσφαλμένη συναρτησιακή σχέση (π.χ. να υποθέσουμε ένα γραμμικό υπόδειγμα, ενώ το υπόδειγμα στον πληθυσμό είναι μη γραμμικό.
Στις ενότητες που ακολουθούν θα ασχοληθούμε με κάθε ένα από τα προβλήματα που παραθέσαμε. 8. ΣΥΣΧΕΤΙΣΗ ΜΕΤΑΞΥ ΕΠΕΞΗΓΗΜΑΤΙΚΩΝ ΜΕΤΑΒΛΗΤΩΝ ΚΑΙ ΔΙΑΤΑΡΑΚΤΙΚΟΥ ΟΡΟΥ Στη γενική περίπτωση θα έχουμε το υπόδειγμα: y X u Έστω ότι κάποια ανεξάρτητη μεταβλητή συσχετίζεται με το διαταρακτικό όρο. Γνωρίζουμε ήδη ότι για τον OLS εκτιμητή θα είναι: X X ˆ ' X ' u οπότε ˆ p lim p lim x' x p lim x' u N N Θέτοντας p lim N x' x xx ( να είναι ένας θετικά ορισμένος πίνακας με πλήρη βαθμό) και p lim x' u x' u 0 (καθώς N υποθέτουμε ότι υπάρχει συσχέτιση μεταξύ μιας τουλάχιστον επεξηγηματικής μεταβλητής με το διαταρακτικό όρο). Άρα: plim ˆ xxx ' u Συνεπώς οι OLS εκτιμητές είναι μεροληπτικοί και ασυνεπείς. 8. Η ΜΕΘΟΔΟΣ ΤΩΝ ΒΟΗΘΗΤΙΚΩΝ ΜΕΤΑΒΛΗΤΩΝ (INSTRUMENTAL VARIABLES) Το πρόβλημα των μεροληπτικών και ασυνεπών OLS εκτιμητών όταν κάποια από τις ανεξάρτητες μεταβλητές σχετίζεται με το διαταρακτικό όρο μπορεί να λυθεί με την μέθοδο των βοηθητικών μεταβλητών (instrumental variables). Η φιλοσοφία της μεθόδου
συνίσταται στην εύρεση κατάλληλων μεταβλητών που αφενός συσχετίζονται με τις «προβληματικές» ανεξάρτητες μεταβλητές και αφετέρου οριακά (δηλαδή όσο το μέγεθος του δείγματος τείνει στο άπειρο) δεν συσχετίζονται με το διαταρακτικό όρο. Πιο αυστηρά υποθέτουμε ότι μπορεί να βρεθεί πίνακας διαστάσεις N L ( L K ) με τι ακόλουθες ιδιότητες: Z με (α) Z' X p lim N ZX πεπερασμένος πίνακας με πλήρη βαθμό (β) Zu ' p lim 0 N Τότε θεωρώντας το γενικό υπόδειγμα y X u θα έχουμε : με VAR Z ' u Z ' Z Z ' y Z ' X Z ' u (*) Η περίπτωση αυτή μας παραπέμπει σε εκτιμήσεις GLS με, εξαρτημένη μεταβλητή την και πίνακα επεξηγηματικών μεταβλητών Z' X. Z' y (*) ZZ ' VAR Z ' u E Z ' u E u Z ' u E u ' E Z ' u Z ' u ' E Z ' uu ' Z Z ' E uu ' Z ' Επομένως: ˆ ˆ ' ' ' ' ' ' IV GLS X Z Z Z Z X X Z Z Z Z y X ' P X Z X ' P y P Z Z ' Z Z ' Z Z (σημείωση: ο δείκτης IV υποδηλώνει ότι έχουμε εκτίμηση με τη μέθοδο των Instrumental Variables). Ο πίνακας VAR-CΟV θα δίνεται από τη σχέση 3
ˆ ' IV Z VAR Cov X P X Ενώ ο εκτιμητής του ˆ y X ˆ ' ˆ IV y X IV N K θα δίνεται από τη σχέση: Θα πρέπει βεβαίως να αποδείξουμε τη συνέπεια των παραπάνω IV εκτιμητών. Θα έχουμε: X P X X P X u ˆ ' ' IV Z Z X ' P X X ' P X X ' P X X ' P u X ' P X X ' P u Z Z Z Z Z Z ' ' I X P X X P X Z Z X ' PZX X ' PZu N N X ' Z Z ' Z Z ' X X ' PZ u N N N N ˆ p lim IV p lim X ' Z Z ' Z Z ' X X ' PZ u N N N N X P u N XZ ZZ ZX plim ' Z XZ ZZ ZX XZ ZZ Zu 0 ο.ε.δ Στην περίπτωση που L K δηλαδή ο πίνακας έχει τον ίδιο αριθμό στηλών με τον X η σχέση που μας δίνει τον IV εκτιμητή του ˆ απλοποιείται καθώς: 4 Z
ˆ ' ' ' ' ' ' IV X Z Z Z Z X X Z Z Z Z y Z ' X Z ' Z X ' Z X ' Z Z ' Z Z ' y I X ' Z X ' Z ' ' ' ' I Z Z X Z X Z Z Z ˆ IV Z ' X Z ' y και ˆ IV ' ' ' VAR COV Z X Z Z X Z 8.3 ΕΚΤΙΜΗΤΕΣ ΕΛΑΧΙΣΤΩΝ ΤΕΤΡΑΓΩΝΩΝ ΔΥΟ ΣΤΑΔΙΩΝ- TWO STAGE LEAST SQUARES (SLS) Οι εκτιμητές μπορεί να θεωρηθεί ότι προέρχονται από την εφαρμογή των OLS εκτιμητών σε δύο στάδια ως εξής: IV Πρώτο στάδιο: παλινδρομούμε κάθε μια από τις μεταβλητές του πίνακα Χ με τις βοηθητικές μεταβλητές και συγκεντρώνουμε τις εκτιμήσεις στον πίνακα. ˆX Δεύτερο στάδιο: παλινδρομούμε την y με τις μεταβλητές του πίνακα Το διάνυσμα των συντελεστών αυτής της παλινδρόμησης είναι οι εκτιμητές. ˆX IV. Πράγματι από την πρώτη παλινδρόμηση έχουμε: Xˆ Z Z ' Z Z ' X PZ X Ο εκτιμητής του δεύτερου σταδίου τότε θα είναι: ˆ Xˆ ' Xˆ Xˆ ' y Xˆ ' P P Xˆ X ' P y SLS Z Z Z X ' Z Z ' Z Z ' Z Z ' Z Z ' X ' P y X ' P X X ' P y ˆ ˆ SLS IV Z Z Z 5
8.4 ΠΟΛΥΣΥΓΓΡΑΜΙΚΟΤΗΤΑ Στο CLRM (κλασσικό γραμμικό υπόδειγμα παλινδρόμησης) y X u ο OLS εκτιμητής του διανύσματος β δίνεται ως γνωστόν από ˆ ' X ' y. την σχέση: X X Αν μια από τις στήλες του Χ μπορεί να εκφραστεί σαν γραμμικός συνδυασμός άλλων στηλών του Χ, με άλλα λόγια αν κάποιες από τις επεξηγηματικές μεταβλητές είναι γραμμικά εξαρτημένες, η ορίζουσα είναι μηδέν, συνεπώς ο πίνακας είναι ιδιάζων. Επομένως σε X ' X X ' X αυτή την περίπτωση της πλήρους πολυσυγγραμικότητας οι συντελεστές παλινδρόμησης δεν μπορούν να προσδιοριστούν. Πιο συνηθισμένη στην πράξη είναι η περίπτωση της (όχι πλήρους) πολυσυγγραμικότητας κατά την οποία οι ανεξάρτητες μεταβλητές συσχετίζονται ως ένα βαθμό μεταξύ τους, χωρίς όμως οποιοσδήποτε μεταξύ τους συνδυασμός να συνεπάγεται γραμμικά εξαρτημένες μεταβλητές. Για παράδειγμα σε ένα υπόδειγμα με δύο ανεξάρτητες μεταβλητές: y X X u i 0 i i i Η μη πλήρης συγγραμικότητα μπορεί να παρασταθεί με τη σχέση: X ' ' X u ', i 0 i i δηλαδή με το γεγονός ότι X i, X συσχετίζονται μεταξύ τους. Η τιμή του συντελεστή προσδιορισμού της παλινδρόμησης της i X i με την αποτελεί ένα μέτρο της συγγραμικότητας. Θα πρέπει να σημειωθεί ότι στην περίπτωση που έχουμε περισσότερες από δύο ανεξάρτητες μεταβλητές είναι δυνατό να υπάρχει πλήρης πολυσυγγραμικότητα χωρίς να είναι απαραίτητο οι (μηδενικού βαθμού) απλοί συντελεστές συσχέτισης μεταξύ των ανεξάρτητων μεταβλητών να είναι κατ ανάγκη πολύ μεγάλοι. Για παράδειγμα έστω το υπόδειγμα: X i 6
y X X X u i i 3 3i 4 4i i Και έστω ότι η Χ4 μπορεί να εκφραστεί σαν γραμμικός συνδυασμός των Χ, Χ3 δηλαδή: X X X με ένα τουλάχιστον από τα 4 3 3, 3 0 Τότε R 4 / 3 ( R 4 / 3 = συντελεστής προσδιορισμού της παλινδρόμησης της Χ4 με τις Χ, Χ3). Ως γνωστόν όμως ισχύει: R r r r r r 4 43 4 43 3 4 / 3 r3 Η παραπάνω σχέση για R4 / 3 ικανοποιείται για άπειρους συνδυασμούς «μικρών» τιμών για τις και r 3 =-0,5. r 4, r 43, r 3. Π.χ. για r 4 = r 43 =0,5 Άρα θα πρέπει να είναι κανείς προσεκτικός με υποδείγματα με περισσότερες των δύο ανεξάρτητων μεταβλητών, καθώς μεγάλες τιμές των απλών συντελεστών συσχέτισης είναι ικανή αλλά όχι και αναγκαία συνθήκη για ύπαρξη υψηλής πολυσυγγραμικότητας. ΣΥΝΕΠΕΙΕΣ ΤΗΣ ΠΟΛΥΣΥΓΓΡΑΜΙΚΟΤΗΤΑΣ Στις προϋποθέσεις που πρέπει να πληρούνται ώστε οι OLS εκτιμητές του CLRM να είναι BLUE, όσον αφορά την πολυσυγγραμικότητα θα πρέπει ο ΧΧ να μην είναι ιδιάζων. Αυτό επιτυγχάνεται αν δεν έχουμε γραμμικές εξαρτήσεις μεταξύ των ανεξάρτητων μεταβλητών. Άρα έστω και αν έχουμε υψηλές γραμμικές συσχετίσεις (αλλά όχι γραμμικές εξαρτήσεις) οι προϋποθέσεις πληρούνται και οι OLS εκτιμητές παραμένουν BLUE. Όμως καθώς δεν μπορούμε να «απομονώσουμε» την επίδραση της κάθε ανεξάρτητης 7
μεταβλητής στην εξαρτημένη μεταβλητή η αβεβαιότητα σχετικά με τις επιδράσεις αυτές αυξάνει. Αυτό εκφράζεται με την «διόγκωση» των διακυμάνσεων των συντελεστών παλινδρόμησης. Πράγματι έστω για απλότητα το υπόδειγμα: y X X u i 0 i i i Cov X i, X i 0 τότε ˆ VAR X i Αν Ενώ αν Cov X i, X i 0 τότε ˆ VAR X i r Όπου r ο συντελεστής συσχέτισης μεταξύ Χ, Χ. Ως συντελεστή διογκώσεως της διακυμάνσεως (variance inflation factor) ορίζουμε την ποσότητα: VIF j r j Όπου r j είναι ο συντελεστής προσδιορισμού της παλινδρόμησης της Χj με τις υπόλοιπες ανεξάρτητες μεταβλητές. Στην περίπτωσή μας rj r. Άρα VAR ˆ VIF X i Ο VIF εκφράζει τον ρυθμό με τον οποίο αυξάνεται η διακύμανση ενός εκτιμητή όταν έχουμε πολυσυγγραμικότητα. Στο παρακάτω διάγραμμα φαίνεται η μεταβολή της διακύμανσης του ˆ ως συνάρτηση του VIF. Για VIF= έχουμε την ελάχιστη τιμή της διακύμανσης που αντιστοιχεί στην περίπτωση που η Χi δε συσχετίζεται με τις υπόλοιπες ερμηνευτικές μεταβλητές. 8
Παρατηρήσεις: Εκτός από μεγάλες διακυμάνσεις των εκτιμητών του υποδείγματος, η παρουσία πολυσυγγραμικότητας έχει ως αποτέλεσμα και μεγαλύτερες συνδιακυμάνσεις μεταξύ των εκτιμητών. Επιπλέον η πολυσυγγραμικότητα δημιουργεί ευαισθησία στους εκτιμητές και τις διακυμάνσεις τους σε έστω και μικρές μεταβολές στα δεδομένα. Από τα παραπάνω είναι φανερό ότι όταν υπάρχει πολυσυγγραμικότητα η εκτίμηση μεμονωμένων συντελεστών παλινδρόμησης δεν μπορεί να γίνει με ακρίβεια, όμως η ακρίβεια βελτιώνεται όταν θεωρήσουμε συνδυασμούς των συντελεστών παλινδρόμησης. Στην περίπτωση αυτή οι έλεγχοι σημαντικότητας διενεργούνται με το F-test (μέθοδος ελαχίστων τετραγώνων με περιορισμούς), αντί του t-test. 9
ΑΝΙΧΝΕΥΣΗ ΤΗΣ ΠΟΛΥΣΥΓΓΡΑΜΙΚΟΤΗΤΑΣ Η πολυσυγγραμικότητα αναφέρεται στις σχέσεις μεταξύ των επεξηγηματικών μεταβλητών που υποθέτουμε ότι είναι μη στοχαστικές και είναι ένα χαρακτηριστικό που αφορά το δείγμα και όχι τον πληθυσμό. Κατά συνέπεια δεν μπορεί να γίνει «έλεγχος» με τη στατιστική έννοια του όρου. Ούτε έχει νόημα να μιλάμε για παρουσία ή απουσία πολυσυγγραμικότητας. Το μόνο που έχει νόημα είναι να μετρήσουμε σε τι βαθμό υπάρχει πολυσυγγραμικότητα στα δεδομένα. Μια πρώτη ένδειξη πολυσυγγραμικότητας είναι να έχουμε υψηλή τιμή συντελεστή προσδιορισμού R και όχι στατιστικά σημαντικές τιμές t-test για κάποιους από τους συντελεστές παλινδρόμησης. Πολλά στατιστικά προγράμματα δίνουν και την τιμή του λεγόμενου δείκτη καταστάσεως (condition index) που ορίζεται ως εξής: CI έ _ ή ί _ X ά _ ή ί _ Για τις τιμές CI 0 η πολυσυγγραμικότητα υπάρχει σε μικρό βαθμό, για 0 CI 30έχουμε μέτρια πολυσυγγραμικότητα, ενώ για CI 30 έχουμε ισχυρή πολυσυγγραμικότητα. ΑΝΤΙΜΕΤΩΠΙΣΗ ΤΗΣ ΠΟΛΥΣΥΓΓΡΑΜΙΚΟΤΗΤΑΣ Όπως είδαμε όταν η πολυσυγγραμικότητα δεν είναι πλήρης η μόνη συνέπεια είναι να έχουμε αυξημένες διακυμάνσεις στους εκτιμητές των συντελεστών παλινδρόμησης. Όμως το ίδιο ισχύει και όταν η μεταβλητότητα των ανεξάρτητων μεταβλητών είναι μικρή. Άρα για να λυθεί το πρόβλημα χρειάζονται περισσότερα δεδομένα. Εναλλακτικά είναι δυνατό να έχουμε πρόσθετη πληροφόρηση, ανεξάρτητα από το συγκεκριμένο δείγμα, σχετικά με την τιμή ορισμένων συντελεστών. Π.χ. το λεγόμενο υπόδειγμα Cobb-Douglas που θα γνωρίσουμε στην Οικονομετρία και αναφέρεται πρωτίστως στη συνάρτηση 0
παραγωγής, στη στοχαστική εκδοχή του εκφράζεται με τη σχέση: Q 0 L K e u Όπου Q=ποσότητα, L=εργασία, K=κεφάλαιο, και u ο στοχαστικός όρος. Αν γνωρίζουμε ότι ισχύει (αυτό στην οικονομική επιστήμη σημαίνει ότι έχουμε σταθερές αποδόσεις κλίμακας), τότε: Q K L K 0 e u και έχουμε μια επεξηγηματική μεταβλητή (την L K ). Οπότε δεν υπάρχει θέμα πολυσυγγραμικότητας. Ένας άλλος τρόπος αντιμετώπισης της πολυσυγγραμικότητας είναι η λεγόμενη ραχοειδής παλινδρόμηση (ridge regression) σύμφωνα με την οποία ο πίνακας Χ Χ αντικαθίσταται από τον πίνακα ( Χ Χ + λi ) όπου λ μικρός αριθμός. Τότε προφανώς οι εκτιμητές που προκύπτουν είναι μεροληπτικοί. Όμως είναι δυνατόν η τιμή του λ να εκλεγεί έτσι ώστε αφενός οι τιμές των συντελεστών συσχετίσεως μεταξύ των ανεξάρτητων μεταβλητών να μειώνονται και αφετέρου το μέσο τετραγωνικό σφάλμα (MSE) των εκτιμητών που προκύπτουν από την ραχοειδή παλινδρόμηση να γίνεται μικρότερο του σφάλματος των εκτιμητών που προκύπτουν χωρίς την προσθήκη του λ. Βέβαια επειδή το λ είναι συνάρτηση των σ και βi που είναι άγνωστα, η επιλογή του λ γίνεται συνήθως με ad-hoc κριτήρια που δεν είναι αυστηρά θεμελιωμένα. Γι αυτό και η μέθοδος της ραχοειδούς παλινδρόμησης έχει δεχτεί κριτική. Τέλος θα πρέπει να αναφέρουμε και την μέθοδο των κύριων συνιστωσών (principal components) σύμφωνα με την οποία οι ανεξάρτητες μεταβλητές Χ, Χ,, Χκ- αντικαθίστανται με νέες μεταβλητές Z, Z,, Z k- που είναι ανά δύο ορθογώνιες. Αυτή η μέθοδος δίνει εκτιμητές με πολύ μικρότερη διακύμανση όμως πολλές φορές δεν είναι εύκολο να δοθεί οικονομική ερμηνεία στις νέες μεταβλητές Z, Z,, Z k-. 8.5 ΣΦΑΛΜΑ ΕΞΕΙΔΙΚΕΥΣΕΩΣ
.Παράλειψη σημαντικής ερμηνευτικής μεταβλητής. Έστω ότι η σωστή εξειδίκευση του υποδείγματος είναι η: y X X u i 0 i i i Και η μεταβλητή X i αυτή. Το υπόδειγμα που εκτιμάται είναι το: y X u * i 0 i i παραλείπεται γιατί δεν διαθέτουμε στοιχεία για Όπου u X u. * i i i Ο εκτιμητής του β θα είναι: x y ˆ i i x Εκφράζοντας το ορθό υπόδειγμα στη μορφή αποκλίσεων θα έχουμε: y x x u u Οπότε: ˆ x x x u u x ˆ xi u u x Όπου ˆ xx x ο συντελεστής παλινδρόμησης της Χ με την Χ. Παίρνοντας αναμενόμενες τιμές θα έχουμε: E ˆ ˆ x u u E ˆ i x Καθώς E i x u u x 0.
Επομένως ο ˆ ασυσχέτιστες. είναι μεροληπτικός εκτός αν ˆ =0. Δηλαδή οι Χ, Χ είναι Επιπλέον αποδεικνύεται ότι ο ˆ 0 είναι μεροληπτικός είτε οι Χ, Χ συσχετίζονται είτε όχι.. Προσθήκη μεταβλητής Αν τώρα στο υπόδειγμα προσθέσουμε μια επεξηγηματική μεταβλητή που δεν χρειάζεται θα έχουμε: y X u πραγματικό υπόδειγμα i i i y a a X a X u εκτιμηθέν υπόδειγμα i i 3 3i i Για την περίπτωση αυτή αποδεικνύεται ότι : (i) (ii) (iii) Οι OLS εκτιμητές στο λανθασμένο υπόδειγμα είναι αμερόληπτοι και συνεπείς. Η σ εκτιμάται σωστά Οι διακυμάνσεις των OLS εκτιμητών θα είναι μεγαλύτερες απ ότι στο πραγματικό υπόδειγμα καθώς: VAR ˆ VAR aˆ xi xi r3 VAR aˆ VAR ˆ r Επειδή 3 r3, VAR aˆ VAR ˆ 0 Άρα η προσθήκη μεταβλητών που δεν χρειάζονται έχει σαν αποτέλεσμα οι εκτιμήσεις των συντελεστών να είναι λιγότερο ακριβείς παρόλο που παραμένουν αμερόληπτες. 3. Εσφαλμένη συναρτησιακή σχέση 3
Στην περίπτωση αυτή αν και διαθέτουμε τις σωστές επεξηγηματικές μεταβλητές δεν χρησιμοποιούμε την κατάλληλη συναρτησιακή σχέση. Π.χ. έστω ότι το υπόδειγμα είναι το: y X X u i i 3 3i 3 3 3 Ενώ το υπόδειγμα που εκτιμάμε είναι το: y X X u i 3 3 Άρα και εδώ το πρόβλημα που δημιουργείται είναι ανάλογο με αυτό που προκύπτει όταν από το υπόδειγμα παραλείπονται επεξηγηματικές μεταβλητές. Δηλαδή οι εκτιμήσεις των συντελεστών είναι μεροληπτικές και ασυνεπείς. 4. O έλεγχος σφάλματος εξειδικεύσεως RESET του Ramsey Ένας γενικός έλεγχος σφαλμάτων εξειδικεύσεως έχει προταθεί από τον Ramsey (989) και είναι γνωστός ως έλεγχος RESET ( regression specification error test). Στην απλούστερη μορφή του ο έλεγχος RESET έχει ως εξής: ) Εκτιμάμε το αρχικό υπόδειγμα yt X u και υπολογίζουμε με τον συντελεστή προσδιορισμού ) Από τις τιμές y i R που εκτιμήσαμε στο () (δηλαδή τις δημιουργούμε καινούριες μεταβλητές, συνήθως τις ˆi 3 y, y. 3) Εκτιμάμε το υπόδειγμα (επαυξημένο υπόδειγμα) : 3 y X Z u όπου Ζ περιλαμβάνει τις y, y και υπολογίζουμε το νέο συντελεστή προσδιορισμού R 4) Υπολογίζουμε το: F R R / q R / N K ˆi ˆi ˆi yˆi όπου q=αριθμός νέων επεξηγηματικών μεταβλητών και Κ= συνολικός αριθμός παραμέτρων στο επαυξημένο υπόδειγμα. ) 4
5) Συγκρίνουμε την τιμή F που εκτιμήσαμε με αυτή της κατανομής F για προεπιλεγμένο επίπεδο σημαντικότητας και q, (N-K) βαθμούς ελευθερίας. Αν F>Fκρίσιμη τότε απορρίπτεται η Η0 (ότι το υπόδειγμα είναι σωστά ορισμένο). 8. 6 ΕΡΩΤΗΣΕΙΣ-ΑΣΚΗΣΕΙΣ ) μέτρηση επεξηγηματικών μεταβλητών με σφάλμα Έστω εν πρώτοις το υπόδειγμα απλής παλινδρόμησης για απλότητα παραλείπεται ο σταθερός όρος. y x u ' όπου Υποθέτουμε ότι η Χ μετριέται με σφάλμα και επομένως x x iid (0, ) όπου x ). η αληθής τιμή και το σφάλμα ( ακολουθεί Να αποδειχθεί ότι ο OLS εκτιμητής του β είναι μεροληπτικός και ασυνεπής. Λύση Θα είναι: ˆ yx x( x u) xx xu x x x x Υποθέτουμε ότι: cov( x, ) cov( x, u) cov(, u) 0 Τότε θα έχουμε: N N N ) plim x plim ( x ) plim x x x 5
) 3) p lim xx p lim ( x ) x plim x x N N N p lim xu 0 N Αντικαθιστώντας θα έχουμε: p lim ˆ 0 Άρα ο ˆ x x είναι μεροληπτικός και ασυνεπής και μάλιστα το όριο πιθανότητας των OLS εκτιμητών θα είναι πάντα πλησιέστερα προς το μηδέν σε σχέση με την αληθή τιμή (attenuation bias). ) Έστω η παρακάτω συνάρτηση παραγωγής: Y bl L K k m s όπου L = αριθμός ανειδίκευτων εργατών, L= αριθμός ειδικευμένων εργατών, Κ = κεφάλαιο, Υ = παραγόμενο προϊόν, u= στοχαστική διαταραχή, b,k,m,s σταθερές. (α) Να γράψετε το αντίστοιχο οικονομετρικό υπόδειγμα (β) Με ποιό τρόπο μπορεί να εκτιμηθεί το παραπάνω υπόδειγμα με τη μέθοδο των συνήθων ελαχίστων τετραγώνων; (γ) Tι αντιπροσωπεύουν οι σταθερές b,k,m,s; (γ) αν θα πρέπει να ισχύει πάντοτε ο περιορισμός: L+L =.000 δημιουργείται κάποιο πρόβλημα ως προς τη δυνατότητα εκτίμησης του υποδείγματος με τη μέθοδο των συνήθων ελαχίστων τετραγώνων; (δ) Σε περίπτωση που είναι εφικτή η εκτίμηση, κάτω από τον περιορισμό του (γ), πως αναμένεται να είναι οι τιμές των t-στατιστικών των εκτιμήσεων σε σχέση με τις αντίστοιχες τιμές των t-στατιστικών κατά την εκτίμηση στο ερώτημα (β); 6
3). Αυτοσυσχετιζόμενες διαταραχές και υστέρηση της εξαρτημένης μεταβλητής ως επεξηγηματική μεταβλητή Έστω το υπόδειγμα: y X u Αν t t t X t μη στοχαστική, αν οι διαταραχές ξέρουμε ο εκτιμητής ˆ u t αυτοσυσχετίζονται τότε όπως των OLS είναι αμερόληπτος και συνεπής αλλά όχι αποτελεσματικός. Στην περίπτωση αυτή χρησιμοποιούμε GLS οπότε: VAR ˆ ' GLS u X Ενώ VAR ˆ X ' X ' X ' OLS u Ο πίνακας Ω μπορεί να εκτιμηθεί αν γνωρίζουμε το χαρακτήρα της αυτοσυσχέτισης στις διαταραχές. Η κατάσταση είναι εντελώς διαφορετική αν Xt t Το υπόδειγμα τότε θα είναι: με y y u t t t Αν για τα u t υποθέσουμε ένα υπόδειγμα AR() u u με t t t Και t 0 ' I Να αποδείξετε ότι ο OLS εκτιμητής του β είναι μεροληπτικός και ασυνεπής. Λύση (σκιαγράφηση) Ο OLS εκτιμητής του β θα είναι: y y y u ˆ t t t yt yt οπότε 7
p lim ˆ p lim yt ut N plim yt N Όμως plim y t 0 N p lim yt ut N άρα η συνέπεια του ˆ εξαρτάται από το y y u y u Θα έχουμε: t t t t t n Όπου Β ο τελεστής χρονικής υστέρησης yt yt n Άρα y u u u u... t t t t t3 Επιπλέον: t ut u και N u u N t t u Οπότε 3 u p lim yt ut u u u... N Άρα ˆ μεροληπτικός και ασυνεπής. 8