ΟΙΚΟΝΟΜΕΤΡΙΑ Ενότητα 12: Σφάλματα μέτρησης στις μεταβλητές Η μέθοδος των βοηθητικών μεταβλητών Παπάνα Αγγελική Μεταδιδακτορική ερευνήτρια, ΑΠΘ E-mail: angeliki.papana@gmail.com, agpapana@auth.gr Webpage: http://users.auth.gr/agpapana 1
Περιεχόμενο ενότητας 1. Εισαγωγή 2. Συνέπειες των σφαλμάτων μέτρησης Α. Σφάλματα μόνο στις μεταβλητές Β. Σφάλματα στις μεταβλητές και στην εξίσωση 3. Εκτίμηση του υποδείγματος - Η μέθοδος των βοηθητικών μεταβλητών 4. Γενίκευση της μεθόδου των βοηθητικών μεταβλητών 5. Σφάλματα εξειδίκευσης και επιλογή υποδείγματος 2
1. Εισαγωγή Στην ανάλυση μας μέχρι εδώ, έχουμε υποθέσει ότι δεν υπάρχουν σφάλματα μετρήσεως στις μεταβλητές. Αυτό σημαίνει ότι οι παρατηρήσεις από το δείγμα είναι ακριβείς μετρήσεις των τιμών που παίρνουν οι μεταβλητές του υποδείγματος. Η υπόθεση αυτή στην πράξη μπορεί να παραβιάζεται από την φύση των οικονομικών δεδομένων. Τόσο η εξαρτημένη όσο και οι ερμηνευτικές μεταβλητές είναι πιθανό να περιέχουν σφάλματα μετρήσεως που να οφείλονται σε διάφορους λόγους, π.χ. στον τρόπο συλλογής των στατιστικών στοιχείων, στον γεγονός ότι τα δεδομένα μπορεί να μην εκφράζουν σωστά την αντίστοιχη μεταβλητή της οικονομικής θεωρίας κτλ. 3
Ο διαταρακτικός όρος αναφέρεται κυρίως στην επίδραση των μεταβλητών που έχουν παραληφθεί από το υπόδειγμα καθώς και στην ατέλεια των οικονομικών σχέσεων. Μπορεί όμως να περιλαμβάνει σφάλματα μέτρησης της εξαρτημένης μεταβλητής χωρίς όμως αυτό να επηρεάζει τα αποτελέσματα του κλασσικού γραμμικού υποδείγματος. Όταν όμως ο διαταρακτικός όρος περιλαμβάνει σφάλματα μέτρησης και στις ερμηνευτικές μεταβλητές, τότε παραβιάζεται η υπόθεση της ανεξαρτησίας ανάμεσα στις ερμηνευτικές μεταβλητές και στον διαταρακτικό όρο. Στην ενότητα αυτή θα εξετάσουμε τα προβλήματα που δημιουργούνται όταν υπάρχουν σφάλματα μέτρησης στις ερμηνευτικές μεταβλητές. 4
1. Συνέπειες των σφαλμάτων μέτρησης Α. Σφάλματα μόνο στις μεταβλητές Οι αποκλίσεις ή οι διαφορές των πραγματικών δεδομένων από το συστηματικό ή προσδιοριστικό μέρος μιας οικονομικής σχέσεως οφείλονται στη συμπεριφορά των τυχαίων παραγόντων που παριστάνει ο τυχαίος ή διαταρακτικός όρος. Αν θεωρήσουμε ότι η σχέση που συνδέει τις οικονομικές μεταβλητές είναι προσδιοριστική (ακριβής) και ότι οι αποκλίσεις από την προσδιοριστική σχέση οφείλονται αποκλειστικά στην ύπαρξη λαθών στις μεταβλητές, τότε έχουμε το υπόδειγμα με σφάλματα στις μεταβλητές. Δηλαδή σύμφωνα με την υπόθεση αυτή u t = 0. 5
Έστω το υπόδειγμα (προσδιοριστική σχέση) Υ = β 0 + β 1 Χ όπου Υ και Χ είναι αντίστοιχα οι τιμές των μεταβλητών Υ και Χ χωρίς σφάλματα (δηλαδή οι αληθινές τιμές των μεταβλητών). Για να εκτιμήσουμε το υπόδειγμα, εφόσον δεν έχουμε παρατηρήσεις για τις Υ και Χ, αλλά μόνο για τις Υ και Χ, οπότε Υ = β 0 + β 1 Χ + u όπου u = u y β 1 u x. Οι μεταβλητές u y, u x παριστάνουν αντίστοιχα τα σφάλματα μετρήσεως των μεταβλητών Υ και Χ, όπου Υ = Υ + u y X = X + u x 6
Οι εκτιμητές των συντελεστών του υποδείγματος παλινδρόμησης του δείγματος που προκύπτουν με την μέθοδο ελαχίστων τετραγώνων είναι μεροληπτικοί και ασυνεπείς. Η αιτία διαφοροποίησης των εκτιμώμενων συντελεστών του υποδείγματος από τα πραγματικά δεδομένα οφείλονται συνήθως σε τυχαίους παράγοντες ή σε σφάλματα μέτρησης, τα οποία καμμιά φορά δεν διαχωρίζονται απόλυτα. π.χ. Η υπόθεση του μόνιμου εισοδήματος Το τρέχον εισόδημα Χ του καταναλωτή αποτελείται από δύο μέρη: μόνιμο εισόδημα Χ (π.χ. μισθός) και έκτακτο u X (π.χ. λαχείο, μπόνους από δουλειά). Η τρέχουσα κατανάλωση C αποτελείται από δύο μέρη: μόνιμη κατανάλωση C (π.χ. ενοίκιο, λογαριασμοί) και έκτακτη u c (π.χ. δώρα) 7
Η σχέση ανάμεσα στην μόνιμη κατανάλωση C και στο μόνιμο εισόδημα Χ παίρνει τη μορφή C = βχ Οι μετρήσεις όμως που έχουμε για την κατανάλωση και το εισόδημα είναι για τις τρέχουσες περιπτώσεις, και το υπόδειγμα που σχηματίζεται είναι όπου C = C + u c X = X + u x u = u c u x C = βχ + u 8
B. Σφάλματα στις μεταβλητές και στην εξίσωση Έστω το υπόδειγμα Υ = β 0 + β 1 Χ + u (1) Υ και Χ είναι αντίστοιχα οι τιμές των μεταβλητών Υ και Χ χωρίς σφάλματα και u y, u x παριστάνουν αντίστοιχα τα σφάλματα μετρήσεως των μεταβλητών Υ και Χ Υ = Υ + u y (2) X = X + u x (3) Έστω ότι θέλουμε να εκτιμήσουμε τους συντελεστές του υποδείγματος και οι μεταβλητές Υ και Χ έχουν σφάλματα μέτρησης. Αντικαθιστούμε στην (1), τα Υ και Χ από τις σχέσεις (2) και (3): 9
Οπότε Υ = β 0 + β 1 Χ + u όπου u = u + u y β 1 u x Ο διαταρακτικός όρος u περιλαμβάνει σφάλματα τόσο στην εξίσωση (που παριστάνει ο όρος u) όσο και σφάλματα στις μεταβλητές (που παριστάνουν τα u y, u x ) (υπόδειγμα με σφάλματα στις μεταβλητές και στην εξίσωση). Οι υποθέσεις που κάνουμε σχετικά με τα σφάλματα μέτρησης u y, u x είναι ότι έχουν μέσο όρο μηδέν, σταθερή διακύμανση και ότι δεν συσχετίζονται ούτε μεταξύ τους ούτε με τα συστηματικά μέρη. Αν παραβιάζεται η υπόθεση σχετικά με τα σφάλματα μέτρησης της ερμηνευτικής μεταβλητής δηλ. cov(x, u ) 0, τότε οι εκτιμητές ελαχίστων τετραγώνων είναι μεροληπτικοί και ασυνεπείς. 10
3. Εκτίμηση του υποδείγματος Η βασικότερη μέθοδος εκτίμησης του υποδείγματος όταν υπάρχουν σφάλματα μετρήσεως στις ερμηνευτικές μεταβλητέ είναι η μέθοδος των βοηθητικών μεταβλητών. Υπάρχουν τρεις βασικές περιπτώσεις στις οποίες χρειαζόμαστε βοηθητικές μεταβλητές: Η μεροληψία από την παράλειψη κάποιας μεταβλητής που συσχετίζεται με μια ερμηνευτική μεταβλητή και η οποία δεν είναι παρατηρήσιμη, και επομένως δεν μπορεί να συμπεριληφθεί στην παλινδρόμηση. Η μεροληψία αμφίδρομης αιτιότητας (το X αιτιάζει τοy, το Y αιτιάζει το X). Η μεροληψία σφάλματος στις μεταβλητές, δηλαδή η ερμηνευτική μεταβλητή έχει μετρηθεί με κάποιο σφάλμα. 11
Η μέθοδος των βοηθητικών μεταβλητών (Instrumental Variables) Έστω το υπόδειγμα Υ = β 0 + β 1 Χ + u για το οποίο υποθέτουμε ότι ο διαταρακτικός όρος u σχετίζεται με την ερμηνευτική μεταβλητή Χ, δηλαδή cov(x, u) 0. Θεωρούμε μια βοηθητική μεταβλητή, έστω Ζ, η οποία συσχετίζεται με την X αλλά δε συσχετίζεται, στο όριο, με το u. Δηλαδή όσο αυξάνει το μέγεθος του δείγματος Τ, η συνδιακύμανση της Ζ και του u μικραίνει και όταν Τ, τότε μηδενίζεται. Οι εκτιμητές των συντελεστών του υποδείγματος (IV εκτιμητές) είναι: β 1 = yz, β xz 0 = Y β 1 X 12
Οι εκτιμητές των συντελεστών του υποδείγματος (IV εκτιμητές), δ 0, δ 1, προκύπτουν σε δύο στάδια, ως εξής: Εκτιμάται με την μέθοδο ελαχίστων τετραγώνων η παλινδρόμηση ανάμεσα στην μεταβλητή X και στην βοηθητική Ζ. Η εκτιμώμενη παλινδρόμηση είναι η ακόλουθη: Χ t = γ 0 + γ 1 Ζ t Εκτιμάται με την μέθοδο ελαχίστων τετραγώνων η παλινδρόμηση ανάμεσα στην μεταβλητή Υ και στην εκτιμόμενη Χ t από την προηγούμενη παλινδρόμηση. Η εκτιμώμενη παλινδρόμηση είναι η ακόλουθη: Υ t = δ 0 + δ 1 Χ t 13
Παράδειγμα Δίνονται οι δαπάνες για ιδιωτικές κατοικίες (Υ), το διαθέσιμο εισόδημα (Χ) και οι δαπάνες για στέγαση (Ζ) για την Ελληνική οικονομία για την περίοδο 1958-1979. Λύση Η παλινδρόμηση που προκύπτει από την κλασσική απλή γραμμική παλινδρόμηση με την μέθοδο των ελαχίστων τετραγώνων είναι: Y t = 0. 268 + 0. 0788X t (R 2 = 0. 839) 14
Εκτίμηση με τη μέθοδο των βοηθητικών μεταβλητών Εκτιμάται με την μέθοδο ελαχίστων τετραγώνων η παλινδρόμηση ανάμεσα στην μεταβλητή X και στην βοηθητική Ζ: Χ t = 4. 93 + 9. 62Ζ t 15
Εκτίμηση με τη μέθοδο των βοηθητικών μεταβλητών Εκτιμάται με την μέθοδο ελαχίστων τετραγώνων η παλινδρόμηση ανάμεσα στην μεταβλητή Υ και στην εκτιμώμενη Χ t από την προηγούμενη παλινδρόμηση: Υ t = δ 0 + δ 1 Χ t Στο Eviews επιλέγω View Representations (copy & paste equation) και έπειτα Quick Generate series 16
Παραλλαγές της μεθόδου των βοηθητικών μεταβλητών Α. Μέθοδος της ομαδοποιήσεως Ταξινομούμε τα ζεύγη των παρατηρήσεων (Υ, Χ) κατά αύξουσα τάξη των τιμών της Χ και μετά χωρίζουμε το δείγμα σε δύο ομάδες που περιέχουν ίσο αριθμό παρατηρήσεων. Αν το μέγεθος του δείγματος είναι περιττός αριθμός, παραλείπουμε την κεντρική παρατήρηση. Για κάθε ομάδα υπολογίζουμε τους μέσους όρους των μεταβλητών και εκτιμάμε τους συντελεστές: β 1 = Υ 2 Υ 1 Χ 2 Χ 1, β 0 = Y β 1 X όπου ( Υ 1, Χ 1 ) οι μέσοι της πρώτης ομάδας (με τις μικρότερες τιμές της Χ) και ( Υ 2, Χ 2 ) οι μέσοι της δεύτερης ομάδας και ( Y, Χ) οι μέσοι όλου του δείγματος. 17
Οι παραπάνω εκτιμητές είναι ίδιοι με αυτούς από την μέθοδο των βοηθητικών μεταβλητών όταν: Ζ = 1 για την ομάδα με τις μικρότερες τιμές Ζ = +1 για την ομάδα με τις μεγαλύτερες τιμές Η μέθοδος αυτή μπορεί να επεκταθεί και για περιπτώσεις που έχουμε περισσότερες από μια ερμηνευτικές μεταβλητές. 18
4. Γενίκευση της μεθόδου των βοηθητικών μεταβλητών Έστω ότι έχουμε παρατηρήσεις για Μ Κ + 1 μεταβλητές οι οποίες μπορούν να χρησιμεύσουν ως βοηθητικές μεταβλητές των Κ + 1 ερμηνευτικών μεταβλητών. Για τις Μ βοηθητικές μεταβλητές υποθέτουμε ότι δεν σχετίζονται με τον διαταρακτικό όρο αλλά σχετίζονται με τις ερμηνευτικές μεταβλητές. Εφαρμόζεται αντίστοιχα με την περίπτωση όπου έχουμε μια ερμηνευτική και μια βοηθητική μεταβλητή. 19
5. Σφάλματα εξειδίκευσης και επιλογή υποδείγματος Μια από τις βασικές υποθέσεις όταν εξετάζουμε γραμμικά υποδείγματα, είναι ότι το οικονομετρικό υπόδειγμα είναι σωστά εξειδικευμένο. Δηλαδή αντικατοπτρίζει την πραγματικότητα. Αν το οικονομετρικό υπόδειγμα δεν έχει διατυπωθεί σωστά, τότε προκύπτει το πρόβλημα της εξειδίκευσης του υποδείγματος. Αυτό το πρόβλημα αναφέρεται τόσο στην διατύπωση της εξίσωσης παλινδρόμησης όσο και στην διατύπωση των σχετικών υποθέσεων για τις ερμηνευτικές μεταβλητές και το διαταρακτικό όρο. Ο όρος σφάλμα εξειδίκευσης αναφέρεται στα σφάλματα από λανθασμένη διατύπωση της παλινδρόμησης. 20
Για να είναι σωστό ένα υπόδειγμα, πρέπει: 1. Να είναι απλό, δηλαδή να μπορεί να εξηγεί την πραγματικότητα. 2. Να έχει συνέπεια, δηλαδή να συμφωνεί με την οικονομική θεωρία. 3. Να έχει ακρίβεια, δηλαδή οι εκτιμήσεις των παραμέτρων που προκύπτουν από το υπόδειγμα να είναι όσο γίνεται πιο κοντά στις πραγματικές τιμές των παραμέτρων. 4. Να προβλέπει σωστά, δηλαδή το εκτιμώμενο υπόδειγμα να προβλέπει με αρκετή ακρίβεια τις μελλοντικές τιμές της εξαρτημένης μεταβλητής. 21
Επιλογή οικονομετρικού υποδείγματος Η κατασκευή ενός οικονομετρικού υποδείγματος είναι το σπουδαιότερο στάδιο της οικονομετρικής μεθοδολογίας. Αν και είναι δύσκολο να αξιολογήσουμε πότε ένα υπόδειγμα είναι «σωστό», τα παρακάτω κριτήρια εκφράζουν πότε θεωρείται ένα υπόδειγμα ικανοποιητικό: 1. Απλότητα υποδείγματος 2. Συνέπεια με την οικονομική θεωρία 3. Ταυτοποίηση των παραμέτρων (εκτίμηση μια μόνο τιμής για κάθε παράμετρο) 4. Καλή προσαρμογή (goodness of fit) του υποδείγματος: οι ανεξάρτητες μεταβλητές ερμηνεύουν μεγάλο ποσοστό της μεταβλητότητας της ανεξάρτητης μεταβλητής 22
5. Οι ερμηνευτικές μεταβλητές δεν συσχετίζονται με τον διαταρακτικό όρο 6. Κατάλληλα στατιστικά στοιχεία που απεικονίζουν με ακρίβεια την διαχρονική συμπεριφορά των μεταβλητών 7. Προβλεπτική ικανότητα υποδείγματος 23
Υπενθύμιση βασικών εννοιών Αμεροληψία εκτιμητών Ε β 0 = β 0 Ε β 1 = β 1 κ.ο.κ. Αποτελεσματικότητα εκτιμητή Ένας εκτιμητής λέγεται αποτελεσματικός, αν έχει την ελάχιστη διασπορά μεταξύ των αμερόληπτων εκτιμητών. Συνέπεια εκτιμητή lim Τ β 0 = β 0 lim Τ β 1 = β 1 κ.ο.κ. 24
Συνέπειες του σφάλματος εξειδίκευσης Η λανθασμένη εξειδίκευση ενός οικονομετρικού υποδείγματος μπορεί να οδηγήσει σε παραβιάσεις κάποιων από τις υποθέσεις της ανάλυσης παλινδρόμησης και εμπειρικά μπορεί να οδηγήσει σε ένα υπόδειγμα που αποτυγχάνει να ικανοποιήσει κάποια από τα κριτήρια με βάση τα οποία αξιολογούμε ένα υπόδειγμα ως «καλό» ή «ικανοποιητικό». Τα πιο συχνά σφάλματα εξειδίκευσης και οι συνέπειες τους είναι: Α. Παράλειψη μιας ερμηνευτικής μεταβλητής Η επιρροή από την παράλειψη της ερμηνευτικής μεταβλητής «απορροφάτε» από τον διαταρακτικό όρο του εκτιμώμενου υποδείγματος. Οι εκτιμήσεις και ο στατιστικός έλεγχος των εκτιμητών θα διέπονται από μεροληψία και ασυνέπεια. 25
Β. Συμπερίληψη μιας ερμηνευτικής μεταβλητής Έστω ότι συμπεριλαμβάνεται στο υπόδειγμα μια ερμηνευτική μεταβλητή η οποία δεν θα έπρεπε. Οι εκτιμήσεις του υποδείγματος δεν είναι αποτελεσματικές (αλλά είναι αμερόληπτες και συνεπείς). Γ. Λάθη στις μετρήσεις μιας ερμηνευτικής μεταβλητής Λάθη στις μετρήσεις μιας ερμηνευτικής μεταβλητής μπορεί να προκύψουν λόγω στρογγυλοποιήσεων, λάθη στη συλλογή των δεδομένων, συστηματικά λάθη στις μετρήσεις κτλ. Οι συντελεστές του υποδείγματος από την μέθοδο των ελαχίστων τετραγώνων είναι μεροληπτικοί και ασυνεπείς. Δ. Λάθη στις μετρήσεις της εξαρτημένης μεταβλητής Η μέθοδος ελαχίστων τετραγώνων μπορεί να εφαρμοστεί κανονικά, αλλά η διακύμανση του εκτιμητή της κλίσης είναι μεγάλη. 26
Ε. Λάθος συναρτησιακή μορφή υποδείγματος Οι συνέπειες είναι αντίστοιχες με αυτές που έχουμε όταν παραλείπουμε μια ερμηνευτική μεταβλητή: 1. Οι εκτιμήσεις των συντελεστών του υποδείγματος είναι μεροληπτικές και αναποτελεσματικές. 2. Ο εκτιμητής των ελαχίστων τετραγώνων της διακύμανσης είναι μεροληπτικός. 3. Οι διακυμάνσεις των εκτιμητών των ελαχίστων τετραγώνων είναι μεροληπτικές. 4. Οι στατιστικοί έλεγχοι δεν ισχύουν. 5. Οι διαταρακτικοί όροι μπορεί να παρουσιάζουν ετεροσκεδαστικότητα, είτε αυτοσυσχέτιση είτε και τα δύο αυτά προβλήματα μαζί. 27
Έλεγχοι διαπίστωσης των σφαλμάτων εξειδίκευσης Παρακάτω αναφέρονται κάποιες τεχνικές για τον έλεγχο της λανθασμένης εξειδίκευσης ενός υποδείγματος, ώστε να προσδιοριστεί ο βαθμός επάρκειας και αξιοπιστίας ενός υποδείγματος. Α. Έλεγχοι για παράλειψη μιας ερμηνευτικής μεταβλητής 1. Γραφική παράσταση των καταλοίπων Αν τα κατάλοιπα παρουσιάζουν κάποια συγκεκριμένη συμπεριφορά, π.χ. τάση ή μη γραμμικότητα, αυτό είναι ένδειξη παράλειψης ερμηνευτικής μεταβλητής. 2. Η στατιστική των Durbin-Watson Την χρησιμοποιήσαμε για τον έλεγχο αυτοσυσχέτισης των καταλοίπων αλλά μπορεί να χρησιμοποιηθεί και ως κριτήριο για τον έλεγχο των σφαλμάτων εξειδίκευσης. 28
Β. Έλεγχοι για (λανθασμένη) συμπερίληψη μιας ερμηνευτικής μεταβλητής 1. Έλεγχος της στατιστικής t Ελέγχουμε την στατιστική σημαντικότητα των εκτιμώμενων συντελεστών του υποδείγματος. 2. Έλεγχος της στατιστικής F (ή του Wald) Ελέγχουμε την μηδενική υπόθεση ότι όλοι οι συντελεστές του υποδείγματος είναι ίσοι με μηδέν. 29
Γ. Γενικοί έλεγχοι για σφάλματα εξειδίκευσης 1. Ο έλεγχος RESET Ο έλεγχος RESET (Regression Specification Error Test) είναι μια γενική τεχνική διαφόρων μορφών σφαλμάτων εξειδίκευσης. Διερευνούμε στο υπόδειγμα αν η μαθηματική διατύπωση είναι σωστή, αν υπάρχει συσχέτιση μεταξύ των ανεξάρτητων μεταβλητών και του διαταρακτικού όρου και αν στο υπόδειγμα έχουν συμπεριληφθεί οι πιο σημαντικές ερμηνευτικές μεταβλητές. Στο Eviews: Εκτιμάμε την γραμμική παλινδρόμηση με την μέθοδο των ελαχίστων τετραγώνων. Επιλέγουμε: View Stability Diagnostics Ramsey RESET Tests 30
Ορίζουμε την «δύναμη» των εκτιμώμενων τιμών της εξαρτημένης μεταβλητής από το παράθυρο «Number of fitted terms». Ελέγχουμε την πιθανότητα σφάλματος (Prob.) του ελέγχου. H 0 : δεν υπάρχει λάθος εξειδίκευσης στο υπόδειγμα Αν Prob. < 0.05, τότε απορρίπτουμε την Η 0. Όταν απορρίπτουμε την Η 0, ο έλεγχος δεν μας προσδιορίζει το είδος του προβλήματος. 31
Βιβλιογραφία Χρήστου Κ. Γεώργιος (2007) Εισαγωγή στην Οικονομετρία, Τόμος 1, Εκδότης: Γ. ΔΑΡΔΑΝΟΣ - Κ. ΔΑΡΔΑΝΟΣ Ο.Ε. Stock H. James, Watson W. Mark, επιμέλεια Πραγγίδης Ιωάννης - Χρυσόστομος (2017) Εισαγωγή στην Οικονομετρία, Εκδότης: Γ. ΔΑΡΔΑΝΟΣ - Κ. ΔΑΡΔΑΝΟΣ Ο.Ε. Χρήστου Κ. Γεώργιος (2006) Εισαγωγή στην Οικονομετρία Ασκήσεις, Εκδόσεις Gutenberg. Δριτσάκη Ν. Χάιδω, Δριτσάκη Ν. Μελίνα (2013) Εισαγωγή στην Οικονομετρία με τη Χρήση του Λογισμικού EViews, Κλειδάριθμος ΕΠΕ Εκδόσεις. 32