ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΤΜΗΜΑ ΟΙΚΟΝΟΜΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΣΤΗΝ ΟΙΚΟΝΟΜΙΚΗ ΕΠΙΣΤΗΜΗ Μία ανασκόπηση του ζητήματος των ασθενών βοηθητικών μεταβλητών (A review on the weak instruments issue ) ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ Χατζηκωνσταντή Βασιλική Επιβλέπων καθηγητής : Ιωάννης Βενέτης, Επίκουρος Καθηγητής Μάιος/Ιούνιος 009 Πάτρα
Ευχαριστίες Όταν φτάνεις επιτέλους στο τέλος ενός στόχου και κοιτάς πίσω μόνο τότε συνειδητοποιείς την συνολική σου πορεία και τους ανθρώπους που την επηρέασαν. Σε αυτούς θέλω να αναφερθώ και να τους ευχαριστήσω θερμά καθώς χωρίς τη βοήθεια και τη συμπαράσταση τους δεν θα μπορούσε να ολοκληρωθεί αυτή η εργασία. Αρχικά θα ήθελα να εκφράσω τις θερμότερες ευχαριστίες μου στον επιβλέποντα της διπλωματικής εργασίας, Επίκουρο Καθηγητή Ιωάννη Βενέτη, τόσο για την πολύτιμη καθοδήγηση, τη γενναιόδωρη και πολύπλευρη συμπαράσταση, την ενδελεχή παρακολούθησή του σε όλα τα στάδια εκπόνησης της εργασίας και την εμπιστοσύνη μου που μου επέδειξε, όσο και για ότι με έκανε να αγαπήσω το αντικείμενο της Οικονομετρίας. Παράλληλα, θα ήθελα να ευχαριστήσω τα μέλη της συμβουλευτικής επιτροπής, την Καθηγήτρια Ευθαλία Δημαρά και τον Λέκτορα Αθανάσιο Πολυμένη για την βοήθεια που μου προσέφεραν όποτε τη χρειάστηκα καθώς και για την προσεκτική ανάγνωση και αξιολόγηση της διπλωματικής εργασίας. Τέλος, ένα μεγάλο ευχαριστώ ανήκει στην οικογένειά μου, στους γονείς μου, Μαρία και Ιωάννη για την ηθική και οικονομική τους στήριξη και στον αδελφό μου Παναγιώτη για την συνεχή του αγάπη και συμπαράσταση. 1
Περιεχόμενα 1. Εισαγωγή...3. Μέθοδος Βοηθητικών Μεταβλητών...5 3. Ασθενείς Βοηθητικές Μεταβλητές (Weak Instruments)...10 3.1 Ορισμός των Ασθενών Βοηθητικών Μεταβλητών...10 3. Προβλήματα των Ασθενών Βοηθητικών Μεταβλητών...15 3.3 Ανίχνευση Ασθενών Βοηθητικών Μεταβλητών...19 3.4 Εκτιμήσεις διαστημάτων εμπιστοσύνης και έλεγχοι στατιστικών υποθέσεων...4 3.5 Αξιόπιστοι εκτιμητές...8 4. Εμπειρικές εφαρμογές...3 4.1 Αποδόσεις εκπαίδευσης...3 4. Ελαστικότητα διαχρονικής υποκατάστασης...37 4.3 Προσφορά εργασίας...4 5. Monte Carlo Experiment...45 5.1 Σχεδιασμός του πειράματος...45 5. Μέτρα αξιολόγησης των εκτιμητών...48 5.3 Αποτελέσματα...48 6. Συμπεράσματα...5 Βιβλιογραφία...54 Παράρτημα I...59 Παράρτημα II...6 Παράρτημα III...70
1. Εισαγωγή Στην Οικονομετρική ανάλυση η μέθοδος των βοηθητικών μεταβλητών (IV) αποτελεί την πιο δημοφιλή μέθοδο εκτίμησης όταν οι ερμηνευτικές μεταβλητές του υποδείγματος είναι ενδογενείς, δηλαδή όταν συσχετίζονται με τον διαταρακτικό όρο, καθώς δίνει συνεπείς εκτιμητές, που κατανέμονται ασυμπτωτικά σύμφωνα με την κανονική κατανομή. Η εφαρμογή, όμως, αυτής της μεθόδου προϋποθέτει από τη μια ότι οι βοηθητικές μεταβλητές είναι εξωγενείς, δεν συσχετίζονται, δηλαδή, με το διαταρακτικό όρο και από την άλλη ότι είναι σημαντικές, δηλαδή συσχετίζονται «ισχυρά» με τις ερμηνευτικές μεταβλητές. Η δεύτερη απαίτηση, ωστόσο, δύσκολα ικανοποιείται στην πράξη, συνήθως οι βοηθητικές μεταβλητές συσχετίζονται «ασθενώς» με τις ενδογενείς ερμηνευτικές μεταβλητές. Το ζήτημα αυτό είναι γνωστό στην βιβλιογραφία, ως το ζήτημα των «ασθενών» βοηθητικών μεταβλητών. Το ερευνητικό ενδιαφέρον για το εν λόγω ζήτημα άρχισε να αναπτύσσεται στις αρχές της δεκαετίας του 1990 μετά τη δημοσίευση της σημαντικής ερευνητικής εργασίας των Angrist και Krueger (1991). Οι Angrist και Krueger μελέτησαν τον τρόπο με τον οποίο οι αποδόσεις της εκπαίδευσης επιδρούν στην ευημερία των ατόμων. Οι Bound, Jaeger και Baker (1995) αμφισβήτησαν τα αποτελέσματα τους, υποστηρίζοντας ότι οι βοηθητικές μεταβλητές που χρησιμοποίησαν στην εκτίμησή τους συσχετίζονται «ασθενώς» με τις ερμηνευτικές μεταβλητές. Κάτω από την υπόθεση των ασθενών μεταβλητών οι εκτιμητές IV, και ειδικότερα ο εκτιμητής TSLS, είναι μεροληπτικοί και μάλιστα μπορεί σε κάποιες περιπτώσεις η μεροληψία αυτών να είναι μεγαλύτερη από την αντίστοιχη του εκτιμητή OLS. Επίσης, η ασυμπτωτική ανάλυση καταρρέει και τα τυπικά σφάλματα των εκτιμητών είναι και αυτά μεροληπτικά καθιστώντας αναξιόπιστη τη στατιστική επαγωγή. Η ερευνητική δραστηριότητα όλα αυτά τα χρόνια εστίασε σε όλες τις πτυχές των ασθενών βοηθητικών μεταβλητών. Ιδιαίτερη έμφαση δόθηκε στην εύρεση μέτρων για την ανίχνευση των ασθενών βοηθητικών μεταβλητών. Ενδιαφέρον παρουσίασε, επίσης, ο ορισμός τους με τους Stock και Yogo (005) να τυποποιούν τον ορισμό 3
αυτών χρησιμοποιώντας την έννοια της μεροληψίας και της αλλοίωσης μεγέθους. Ερευνητές όπως οι Hahn και Hausman (00a, 00b, 003a) και Staiger και Stock (1997) εστίασαν στα προβλήματα που ανακύπτουν όταν οι βοηθητικές μεταβλητές που έχει στη διάθεσή του ο ερευνητής χαρακτηρίζονται ως ασθενείς. Μια άλλη πτυχή του ζητήματος που προσέλκυσε μερίδα ερευνητών αφορά στην εύρεση αξιόπιστων ελέγχων για τη στατιστική επαγωγή, εκτίμηση διαστημάτων εμπιστοσύνης και έλεγχοι στατιστικών υποθέσεων. Τέλος, η εύρεση αξιόπιστων εκτιμητών, εκτιμητές με μικρότερη μεροληψία από τον TSLS, αποτέλεσε και συνεχίζει να αποτελεί την πιο επίπονη και απαιτητική πλευρά του ζητήματος των ασθενών βοηθητικών μεταβλητών. Από θεωρητικής πλευράς για το ζήτημα των ασθενών βοηθητικών μεταβλητών θα μπορούσε κανείς να ισχυριστεί ότι έχει καλυφθεί ως ένα ικανοποιητικό βαθμό, με τα αποτελέσματα να τεκμηριώνονται μέσα από πειράματα Monte Carlo. Οι εμπειρικές έρευνες με πραγματικά δεδομένα είναι πολύ περιορισμένες, καθώς η διαδικασία αναζήτησης δεδομένων είναι ιδιαίτερα δύσκολη. Στην εν λόγω εργασία διερευνήσαμε μέσω ενός Monte Carlo πειράματος την απόδοση εκτιμητών που από τη βιβλιογραφία προτείνονται ως εναλλακτικοί του εκτιμητή TSLS, χωρίς όμως να καταλήξουμε σε έναν γενικά αποδεκτό εκτιμητή. Η διάρθρωση της μελέτης είναι η εξής: Στην ενότητα παρουσιάζεται εν συντομία η μέθοδος των βοηθητικών μεταβλητών. Οι διάφορες πτυχές του ζητήματος των ασθενών βοηθητικών μεταβλητών εξετάζονται στην ενότητα 3. Στην ενότητα 4 αναλύονται τα αποτελέσματα τριών εμπειρικών εφαρμογών. Η ενότητα 5 εμπεριέχει την περιγραφή του πειράματος Monte Carlo που υιοθετήσαμε και την ερμηνεία των αποτελεσμάτων. Η τελευταία ενότητα (Ενότητα 6) αναφέρεται στα συμπεράσματα αυτής της εργασίας. 4
. Μέθοδος Βοηθητικών Μεταβλητών Το γραμμικό υπόδειγμα παλινδρόμησης αποτελεί ένα από τα βασικότερα εργαλεία της ποσοτικής ανάλυσης και χρησιμοποιείται στην εκτίμηση σχέσεων μεταβλητών, δηλαδή πως ένα σύνολο ανεξάρτητων μεταβλητών επηρεάζει την εξαρτημένη μεταβλητή ενός υποδείγματος. Μια από τις πιο κρίσιμες υποθέσεις για την εκτίμηση αφορά στην ανεξαρτησία της ερμηνευτικής μεταβλητής με το σφάλμα του υποδείγματος, δηλαδή με τον διαταρακτικό όρο. Σε αυτή την περίπτωση οι ερμηνευτικές μεταβλητές χαρακτηρίζονται ως εξωγενείς, αφού θεωρούμε ότι δημιουργούνται εκτός του υποδείγματος. Όταν όμως η εξωγένεια δεν ικανοποιείται, κάτι το οποίο είναι εξαιρετικά συνηθισμένο στα οικονομετρικά υποδείγματα, οι εκτιμητές θα είναι μεροληπτικοί - και μάλιστα δεν θα πληρούν ούτε την ελάχιστη απαίτηση που έχουμε από έναν εκτιμητή, δηλαδή δεν θα είναι συνεπείς 1 - και η εκτίμηση του υποδείγματος με τη μέθοδο των Ελαχίστων Τετραγώνων θα μας οδηγήσει σε λάθος συμπεράσματα. Όταν η ασθενέστερη μορφή εξωγένειας δεν ικανοποιείται, δηλαδή, όταν έστω και μια ερμηνευτική μεταβλητή συσχετίζεται με το διαταρακτικό όρο, τότε έχουμε το «πρόβλημα της ενδογένειας». Όπως προαναφέραμε το φαινόμενο της ενδογένειας είναι σύνηθες στην οικονομετρική πρακτική. Για παράδειγμα α) ενδογένεια λόγω σφάλματος μέτρησης των μεταβλητών β) ενδογένεια όταν η ερμηνευτική μεταβλητή ακολουθεί μια AR(1) διαδικασία, της οποίας ο διαταρακτικός όρος συσχετίζεται με το διαταρακτικό όρο του υποδείγματος γ) ενδογένεια που δημιουργείται από την ύπαρξη ταυτόχρονων εξισώσεων δ) ενδογένεια λόγω παράλειψης σχετικών με το υπόδειγμα ερμηνευτικών μεταβλητών ε) ενδογένεια σε υποδείγματα ορθολογικών προσδοκιών. Για να αντιμετωπίσουμε το πρόβλημα της ενδογένειας των ερμηνευτικών μεταβλητών χρησιμοποιούμε τη μέθοδο των βοηθητικών ή τεχνητών μεταβλητών 1 Βλ. Βενέτης (009) Βενέτης (009) 5
(instrumental variables method, IV). Ο εκτιμητής των βοηθητικών μεταβλητών ή εκτιμητής τεχνητών μεταβλητών (εκτιμητής IV) ικανοποιεί υπό προϋποθέσεις την ελάχιστη απαίτηση της συνέπειας και βασίζεται σε ένα σύνολο μεταβλητών εκτός των ενδογενών ερμηνευτικών μεταβλητών ή της εξαρτημένης μεταβλητής. Συγκεκριμένα, η μέθοδος συνίσταται στην εύρεση μεταβλητών οι οποίες συσχετίζονται με τις ενδογενείς ερμηνευτικές μεταβλητές αλλά δεν συσχετίζονται με τον διαταρακτικό όρο του υποδείγματος. Στην κατηγορία των IV εκτιμητών ο πιο «γνωστός» και ευρύτατα χρησιμοποιούμενος εκτιμητής είναι αυτός των ελαχίστων τετραγώνων σε δύο στάδια (TSLS), όπου είναι και ο πιο αποτελεσματικός όσο αυξάνεται η συσχέτιση των βοηθητικών μεταβλητών με τις ερμηνευτικές μεταβλητές. Παρά το ότι η μέθοδος είναι τεχνικά ανεπτυγμένη, βασίζεται στην θεωρητική επιλογή των συγκεκριμένων (βοηθητικών) μεταβλητών η οποία συχνά είναι αρκετά επίπονη, καθώς δεν υπάρχει συγκεκριμένος τρόπος επιλογής αυτών (Sargan, 1958). Στη σύγχρονη βιβλιογραφία και σε συγκεκριμένες υποπεριπτώσεις σχετικά με τη μέθοδο βοηθητικών μεταβλητών έχουν αναπτυχθεί μεθοδολογίες επιλογής. Οι Bowden και Turkington (1984) πρότειναν την Ανάλυση Κύριων Συνιστωσών (Principal Components Analysis) αναφορικά με την επιλογή των βοηθητικών μεταβλητών, μια μεθοδολογία, ωστόσο, που δεν λαμβάνει υπόψη τη συσχέτιση μεταξύ των βοηθητικών και ερμηνευτικών μεταβλητών. Οι Donald και Newey (001) υποστήριξαν ότι θα πρέπει να επιλέγεται ένα σύνολο βοηθητικών μεταβλητών που ελαχιστοποιεί το μέσο τετραγωνικό σφάλμα (mean-squared error, MSE). Σχετικά με τη μέθοδο των βοηθητικών μεταβλητών έχουμε: Έστω το πολυμεταβλητό γραμμικό υπόδειγμα όπου y = Y β + u (.1) T 1 T n n 1 T 1 Y = Z Π+ ν (.) T n T K K n T n ( 0, σ ) ( 0, ) u T v T και u N I, v N σ I. Η Z είναι η μήτρα παρατηρήσεων των τεχνητών μεταβλητών οι οποίες θεωρούνται δεδομένες και ρ ο συντελεστής 6
( ) Cov ut, vt σύγχρονης συσχέτισης, ρ = των διαταρακτικών όρων στις σχέσεις (.1) σσ u v και (.). Τέλος η μήτρα Π «ελέγχει» την ποιότητα των βοηθητικών μεταβλητών και εκφράζει το πώς επηρεάζονται οι ερμηνευτικές από τις τεχνητές μεταβλητές. Η εξίσωση (.1) αποτελεί τη δομική εξίσωση του υποδείγματος, ενώ η (.) είναι μία «βοηθητική» παλινδρόμηση, η οποία καθιστά τις Y και Z γραμμικά συσχετιζόμενες. Ωστόσο απαραίτητη προϋπόθεση για να εκτιμήσουμε ένα υπόδειγμα με την μέθοδο των βοηθητικών μεταβλητών είναι η ικανοποίηση της υπόθεση της υπερταυποίησης ή τουλάχιστον της ταυτοποίησης, δηλαδή ο αριθμός των βοηθητικών μεταβλητών θα πρέπει να είναι μεγαλύτερος ή ίσος από τον αριθμό των ερμηνευτικών μεταβλητών, K n. Ο εκτιμητής ελαχίστων τετραγώνων σε δύο στάδια του β (two stage least squares estimator, TSLS) δίνεται από β ( YPY) 1 = YP y (.3) ˆTSLS Z Z όπου Z ( ) 1 P = Z ZZ Z η μήτρα προβολής των βοηθητικών μεταβλητών, η οποία είναι συμμετρική ( P = Z P ) και ταυτοδύναμη ( Z P P = P ). Z Z Z Αναφορικά με τις στατιστικές ιδιότητες του εκτιμητή και την κατανομή του σε μεγάλα δείγματα θα πρέπει να ισχύουν οι παρακάτω υποθέσεις Υ.1: οι ενδογενείς ερμηνευτικές μεταβλητές συσχετίζονται «ισχυρά» με τις βοηθητικές μεταβλητές, 1 plim ZY ZY T = Σ και ο βαθμός της μήτρας Σ ZY είναι ίσος με τον αριθμό των ερμηνευτικών μεταβλητών ( rank ( ) Σ = n ) Υ.: οι βοηθητικές μεταβλητές είναι γραμμικά ανεξάρτητες, και ο βαθμός της μήτρας ( ) ( rank Σ = K ) ZZ ΣZZ ZY 1 plim ZZ T =Σ είναι ίσος με τον αριθμό των βοηθητικών μεταβλητών ZZ 7
Υ.3: οι βοηθητικές μεταβλητές δεν συσχετίζονται με το διαταρακτικό όρο, 1 plim Zu 0 T = Υ.4: ισχύει το Κεντρικό Οριακό Θεώρημα (Κ.Ο.Θ.), 1 Zu T ( 0, σ u ZZ) d N Σ Με βάση τα παραπάνω και κάτω από την υπόθεση της ομοσκεδαστικότητας ο εκτιμητής TSLS θα είναι συνεπής ( ˆ TSLS ) p lim β β = 0 και θα κατανέμεται ασυμπτωτικά σύμφωνα με την κανονική κατανομή T 1 ( ˆ ) ( 0, ( ) ) d βtsls β N σ u ZZ ΠΣ Π. Η εκτίμηση της παραμέτρου β με τη μέθοδο των τεχνητών μεταβλητών προϋποθέτει οι μεταβλητές που έχει στη διάθεσή του ο εκάστοτε ερευνητής να είναι έγκυρες. Η επιλογή τέτοιων μεταβλητών απαιτεί αφενός οι βοηθητικές μεταβλητές να είναι εξωγενείς, να μη συσχετίζονται σύγχρονα με το διαταρακτικό όρο, και αφετέρου να είναι σημαντικές, δηλαδή να υπάρχει ισχυρή συσχέτιση μεταξύ των βοηθητικών και των ερμηνευτικών μεταβλητών. Ο Hausman (1978) πρότεινε ένα στατιστικό κριτήριο για τον έλεγχο ύπαρξης συσχέτισης μεταξύ των ερμηνευτικών μεταβλητών του υποδείγματος και του διαταρακτικού όρου. Καθώς ο έλεγχος αυτός αφορά τη σωστή εξειδίκευση των ανεξάρτητων μεταβλητών του υποδείγματος, αναφέρεται στην βιβλιογραφία ως έλεγχος εξειδίκευσης του υποδείγματος. Η μηδενική υπόθεση του ελέγχου αφορά στη μη ύπαρξη συσχέτισης μεταξύ των ανεξάρτητων μεταβλητών και του διαταρακτικού όρου του υποδείγματος έναντι της εναλλακτικής ότι αυτές οι μεταβλητές συσχετίζονται. Κάτω από τη μηδενική υπόθεση οι εκτιμητές OLS και IV θα είναι συνεπείς εκτιμητές της παραμέτρου και επομένως η διαφορά μεταξύ των εκτιμητών δεν θα είναι στατιστικά σημαντική. Ο έλεγχος της μηδενικής υπόθεσης στηρίζεται σε έναν έλεγχο τύπου πολλαπλασιαστή Lagrange (Lagrange Multiplier, LM test), ο 8
οποίος ασυμπτωτικά κατανέμεται σύμφωνα με την χ κατανομή με βαθμούς ελευθερίας ίσους με τον αριθμό των πιθανών ενδογενών μεταβλητών. Απόρριψη της μηδενικής υπόθεσης συνεπάγεται ότι οι ερμηνευτικές μεταβλητές συσχετίζονται με το διαταρακτικό όρο, επιβάλλεται, επομένως, να εκτιμήσουμε το υπόδειγμα με τη μέθοδο των βοηθητικών μεταβλητών. Αναφορικά με τη σημαντικότητα των μεταβλητών είναι σύνηθες για τους ερευνητές να καταλήγουν σε βοηθητικές μεταβλητές που συσχετίζονται «ασθενώς» με τις ερμηνευτικές μεταβλητές. Οι Stock, Wright και Yogo (00) επισήμαναν ότι η εύρεση εξωγενών βοηθητικών μεταβλητών είναι μια δύσκολη «διαδικασία» και οι παράγοντες που συμβάλλουν στην εξωγένεια μπορεί την ίδια στιγμή να αποτελούν αιτία για την δημιουργία «ασθενών» βοηθητικών μεταβλητών. 9
3. Ασθενείς Βοηθητικές Μεταβλητές (Weak Instruments) Σε αυτή την ενότητα θα αναλύσουμε το θεωρητικό υπόβαθρο των «ασθενών» βοηθητικών μεταβλητών. Θα εξετάσουμε ζητήματα αναφορικά με τον ορισμό και την ανίχνευση τέτοιων μεταβλητών, τα προβλήματα που ανακύπτουν από την υιοθέτηση τους και τις πιθανές λύσεις σε αυτά. 3.1 Ορισμός των Ασθενών Βοηθητικών Μεταβλητών Η εκτίμηση ενός υποδείγματος με τη μέθοδο των βοηθητικών μεταβλητών προϋποθέτει, όπως αναφέρθηκε και παραπάνω, ότι οι μεταβλητές είναι εξωγενείς και σημαντικές. Ωστόσο για μεγάλο χρονικό διάστημα οι ερευνητές ενδιαφέρονταν για μεταβλητές που ικανοποιούσαν την μία ιδιότητα, αυτή της εξωγένειας. Τελευταία, όμως, παρατηρείται έκδηλο ενδιαφέρον για βοηθητικές μεταβλητές που συσχετίζονται ισχυρά με τους παλινδρομητές. Στην περίπτωση ασθενής συσχέτισης τα αποτελέσματα από την εκτίμηση ενός υποδείγματος θα είναι αναξιόπιστα. Συγκεκριμένα, οι εκτιμητές Ελαχίστων Τετραγώνων σε Δύο Στάδια θα είναι μεροληπτικοί, οι έλεγχοι υποθέσεων και τα διαστήματα εμπιστοσύνης δεν θα είναι έγκυρα, ενώ η ασυμπτωτική κατανομή των εκτιμητών δεν θα ακολουθεί την κανονική κατανομή. Το «ζήτημα των ασθενών βοηθητικών μεταβλητών» έγινε ευρύτατα γνωστό μετά τη δημοσίευση ενός ερευνητικού άρθρου των Angrist και Krueger (1991), το οποίο μελετά τις αποδόσεις της εκπαίδευσης στην ευημερία των ατόμων. Οι Bound, Jaeger και Baker (1995) αμφισβήτησαν την ισχύ συγκεκριμένων βοηθητικών μεταβλητών που υιοθέτησαν οι Angrist και Krueger και υποστήριξαν ότι η συσχέτιση των τεχνητών μεταβλητών με τις ερμηνευτικές είναι ασθενής με αποτέλεσμα οι εκτιμητές να είναι μεροληπτικοί και να επηρεάζεται σημαντικά η διακύμανσή τους. 10
Έστω το γραμμικό υπόδειγμα βοηθητικών μεταβλητών με μια ενδογενή ερμηνευτική μεταβλητή (linear instrumental variable regression model) y = Y β + u (3.1.1) T 1 T 1 T 1 και Y = Z Π+ v (3.1.) T K K 1 T 1 Όπου u N( 0, σ I ) και v N( 0, σ ) u T vit ενώ Z είναι η μήτρα δεδομένων των τεχνητών μεταβλητών οι οποίες θεωρούνται δεδομένες και ρ ο συντελεστής σύγχρονης συσχέτισης, ρ (, ) Cov u v t t = των διαταρακτικών όρων στις (3.1.1) και σσ u v (3.1.). Η βοηθητική παλινδρόμηση εκφράζει τη σχέση που υπάρχει μεταξύ των βοηθητικών και των ερμηνευτικών μεταβλητών. Η ισχύ των τεχνητών μεταβλητών εκφράζεται από τον δείκτη συγκέντρωσης, ορίζεται ως εξής v μ, (concentration parameter). και ΠΖΖΠ μ =. Σύμφωνα με τους Stock και Yogo (005) όταν η σ τιμή του δείκτη συγκέντρωσης είναι «χαμηλή», οι βοηθητικές μεταβλητές χαρακτηρίζονται ως «ασθενείς». Η ένταση των βοηθητικών μεταβλητών είναι προς διερεύνηση κατά συνέπεια και η τιμή του μ. Επίσης, τίθεται το ερώτημα αν οι ερευνητές πρέπει να στηρίζουν την ανάλυση τους στο δείκτη, αφού τα είναι άγνωστα άρα και το μ. Π και σ v Ο εκτιμητής ελαχίστων τετραγώνων σε δύο στάδια του β δίνεται από τη σχέση β = ( ) 1 YPY YP y. Μια άλλη ιδιαιτέρα χρήσιμη απεικόνιση του εκτιμητή TSLS ˆTSLS Z Z διατυπώθηκε από τον Rothenberg (1984) (απόδειξη και ανάλυση των επιμέρους όρων του εκτιμητή δίνονται στο Παράρτημα I) ( ˆ zu + Suv / μ TSLS ) = ( u / ν ) μ β β σ σ 1+ z / μ + S / μ ν νν (3.1.3) 11
Από τη σχέση (3.1.3) προκύπτει ότι με δεδομένες τις τεχνητές μεταβλητές και τα σφάλματα του υποδείγματος να κατανέμονται σύμφωνα με την κανονική κατανομή, το μέγεθος του δείγματος εισέρχεται στην κατανομή του εκτιμητή μέσω του δείκτη συγκέντρωσης. Είναι προφανές, επομένως, ότι ο συντελεστής συγκέντρωσης αντιστοιχεί στο μέγεθος του δείγματος και στην ασυμπτωτική ανάλυση το μ συμπίπτει με την τετραγωνική ρίζα του μεγέθους του δείγματος ( T ). Μια χαμηλή τιμή του δείκτη συγκέντρωσης θα έχει ως αποτέλεσμα η κατανομή των z, z, u v Suv και S vv να μην ακολουθεί την κανονική κατανομή. Αντίθετα μια «μεγάλη» τιμή του δείκτη θα «εξασφαλίσει» ότι ο εκτιμητής ελαχίστων τετραγώνων σε δύο στάδια θα ακολουθεί τη κανονική κατανομή, δηλαδή καθώς ( ˆ ) d N ( 0, u ν ) μ β β σ σ. μ + έχουμε ότι Θα ήταν παράλειψη να μην αναφέρουμε την περίπτωση της υποταυτοποίησης όπου Π=0 και κατά συνέπεια μ = 0 (unidentified case), όπου οι βοηθητικές μεταβλητές δεν είναι απλώς ασθενείς αλλά και μη σημαντικές. Ο εκτιμητής TSLS θα δίνεται από τον τύπο β ˆTSLS Z u β = (απόδειξη του τύπου στο Παράρτημα I), δεν θα είναι Z ν συνεπής και ασυμπτωτικά θα κατανέμεται σύμφωνα με την Cauchy κατανομή (βλέπε ενότητα 3.). Ο ορισμός των «ασθενών» βοηθητικών μεταβλητών στηρίζεται στο λόγο μ K. Όταν αυτός ο λόγος λαμβάνει τόσο χαμηλές τιμές ώστε η στατιστική επαγωγή που στηρίζεται στην κανονική ασυμπτωτική ανάλυση μας δίνει αναξιόπιστα αποτελέσματα, οι βοηθητικές μεταβλητές θα είναι «ασθενείς». Οι Stock και Yogo (005) αναζήτησαν μέτρα έτσι ώστε να τυποποιήσουν τον εν λόγω ορισμό. Στην προσπάθεια τους αυτή στηρίχτηκαν στη μεροληψία του εκτιμητή και στην «αλλοίωση μεγέθους» (size distortion) που υφίστανται οι έλεγχοι Wald κάτω από την υπόθεση των «ασθενών» βοηθητικών μεταβλητών. Στην περίπτωση των ασθενών βοηθητικών μεταβλητών γνωρίζουμε ότι ο εκτιμητής των τεχνητών μεταβλητών είναι μεροληπτικός (βλέπε ενότητα 3.). Στηριζόμενοι σ αυτό οι Stock και Yogo (005) όρισαν το μέτρο της σχετικής μεροληψίας του εκτιμητή IV ως προς τον εκτιμητή των ελαχίστων τετραγώνων 1
Β = T ( ˆ ) ( ( ˆ ) ( Εβ β Σ Ε ˆ β β IV YY IV ) ) Εβ β Σ Ε ˆ β β OLS YY OLS (3.1.4) όπου Όταν Σ = 1 YY plim Y T Y. n =1το μέτρο της σχετικής μεροληψίας γίνεται Ε ˆ βiv β Β T =. Ε ˆ β β OLS Το τετράγωνο της σχετικής ασυμπτωτικής μεροληψίας δίνεται από το lim Β = T ( ˆ Εβ ) ( ˆ IV β ΣYY ΕβIV β) σ ρρ καθώς ασυμπτωτικά ισχύει ότι ( ) u 1 Ε ˆOLS β β σ u Σ vv ρ και ΣYY vv παρονομαστής της σχέσης (3.1.4) γίνεται ( ) ( ) Σ, άρα ο ˆ Εβ β Σ Ε ˆ β β σ ρρ. OLS YY OLS u Αυτό που κυρίως μας ενδιαφέρει είναι η τετραγωνική ρίζα της μέγιστης σχετικής ασυμπτωτικής μεροληψίας, δηλαδή η λύση του παρακάτω προβλήματος max ρ max Β = :0 ρρ 1 Β. Στην πράξη η λύση αυτού του προβλήματος συνίσταται στη σύγκριση του λόγου μ K με μια κριτική τιμή. Επομένως, ένα σύνολο βοηθητικών μεταβλητών θα χαρακτηρίζεται ως ασθενές όταν η ασυμπτωτική σχετική μεροληψία θα είναι μεγαλύτερη από μια τιμή κατώφλι και κατά συνέπεια ο λόγος μ K θα είναι αρκετά μικρός. Ωστόσο πολλοί ερευνητές ενδιαφέρονται για έλεγχο υποθέσεων, κατ αντιστοιχία με το μέτρο της σχετικής μεροληψίας. Τώρα οι βοηθητικές μεταβλητές χαρακτηρίζονται 13
με βάση τα αποτελέσματα της στατιστικής Wald. Κάτω από την μηδενική υπόθεση, H : 0 β β0 =, η περιοχή απόρριψης είναι R Pr W n IV T = β0 χn, a όπου W IV ο έλεγχος Wald για τον εκτιμητή βοηθητικών μεταβλητών,ο οποίος κατανέμεται σύμφωνα με την χ κατανομή με n βαθμούς ελευθερίας. Το αντίστοιχο μέτρο ασυμτωτικά είναι R max = max ρρρ : 1 R όπου R = lim R T. Με βάση τον παραπάνω ορισμό οι βοηθητικές μεταβλητές θα είναι T ασθενείς αν ο λόγος μ K είναι αρκετά μικρός ώστε ένας έλεγχος υπόθεσης σε επίπεδο σημαντικότητας 5% θα απορρίπτεται σε συχνότητα μεγαλύτερη από μια τιμή κατώφλι. Πίνακας 3.1.1 14
Στον Πίνακα 3.1.1 παρουσιάζονται, για συγκεκριμένο αριθμό βοηθητικών μεταβλητών, τιμές του λόγου μ K και κριτικές τιμές από την F στατιστική για έλεγχο μηδενικής υπόθεσης περί ασθενών βοηθητικών μεταβλητών. Ο εν λόγω διαγνωστικός έλεγχος αποτελεί ένα κριτήριο ανίχνευσης ασθενών βοηθητικών μεταβλητών, σύμφωνα με το οποίο οι βοηθητικές μεταβλητές χαρακτηρίζονται ως ασθενείς όταν αυτό λαμβάνει τιμές μικρότερες του 10 (βλέπε ενότητα 3.3). Για παράδειγμα, στην περίπτωση των 5 βοηθητικών μεταβλητών και κάτω από τον ορισμό των ασθενών βοηθητικών μεταβλητών σύμφωνα με τη μεροληψία του εκτιμητή TSLS η τιμή κατώφλι για το λόγο μ K είναι 5.8. Επομένως, η μηδενική υπόθεση ελέγχου, μ K 5.8, απορρίπτεται έναντι της εναλλακτικής, μ K 5.8, καθώς η κριτική τιμή της F στατιστικής είναι 10.83. Συμπερασματικά, ο χαρακτηρισμός των βοηθητικών μεταβλητών εξαρτάται από μια κριτική τιμή, αν η πραγματική τιμή του λόγου μ K είναι μεγαλύτερη από το κατώφλι τότε οι μεταβλητές χαρακτηρίζονται ως ισχυρές, σε αντίθετη περίπτωση θα είναι ασθενείς. Ωστόσο, η τιμή αυτή εξαρτάται από την ανοχή του εκάστοτε ερευνητή και αν δίνει μεγαλύτερη σημασία στη μεροληψία του εκτιμητή ή στον έλεγχο υπόθεσης. 3. Προβλήματα των Ασθενών Βοηθητικών Μεταβλητών Η «ισχυρή» συσχέτιση των βοηθητικών μεταβλητών με τις ερμηνευτικές μεταβλητές καθιστά τη μέθοδο ελαχίστων τετραγώνων σε δύο στάδια (TSLS) ένα ιδιαίτερα χρήσιμο εργαλείο της οικονομετρικής ανάλυσης. Γεγονός που είναι έκδηλο τόσο στην περίπτωση της υπερταυτοποίησης, όσο και της ταυτοποίησης όπου ο μέσος του εκτιμητή δεν υφίσταται με αποτέλεσμα η πραγματική παράμετρος να ελέγχεται με βάση τη διάμεσο του εκτιμητή TSLS. Η ύπαρξη, όμως, ασθενών βοηθητικών μεταβλητών επηρεάζει σημαντικά την αξιοπιστία της μεθόδου. Ο εκτιμητής θα είναι μεροληπτικός και η κατανομή του πλέον δεν θα ακολουθεί την κανονική κατανομή, ενώ ακόμη και μια «μικρή» συσχέτιση των βοηθητικών μεταβλητών με το διαταρακτικό όρο του υποδείγματος συνεπάγεται την ασυνέπεια του εκτιμητή. 15
Οι Hahn και Hausman (00a, 00b, 003a) υπολόγισαν τη μεροληψία του εκτιμητή TSLS υιοθετώντας ανάλυση δεύτερης τάξης (second-order approximation) για την περίπτωση που ο αριθμός των βοηθητικών μεταβλητών είναι μεγαλύτερος από τον αριθμό των ενδογενών ερμηνευτικών μεταβλητών (υπερταυτοποίηση). Σε αυτή τους την ανάλυση χρησιμοποίησαν ένα υπόδειγμα βοηθητικών μεταβλητών με μία ενδογενή ερμηνευτική μεταβλητή όπου τα σφάλματα του υποδείγματος ακολουθούν την κανονική κατανομή με μέσο μηδέν και διακύμανση ίση με τη μονάδα, σ = 1και σ = 1, με αποτέλεσμα να ισχύει ότι ο συντελεστής σύγχρονης συσχέτισης είναι ίσος v u με τη συνδιακύμανση των σφαλμάτων, ρ = σ uv 3. Επομένως η μεροληψία δεύτερης τάξης του εκτιμητή σε πεπερασμένο δείγμα είναι ( 1 ) Kρ R Ε( ˆTSLS β ) β = TR όπου το R εκφράζει τη συσχέτιση μεταξύ των βοηθητικών μεταβλητών και των ενδογενών ερμηνευτικών μεταβλητών. Από την παραπάνω σχέση μπορούμε να παρατηρήσουμε ότι η μεροληψία του εκτιμητή είναι αύξουσα συνάρτηση του αριθμού των βοηθητικών μεταβλητών K, του συντελεστή συσχέτισης ρ καθώς και του όρου ( 1 R ), η τιμή του οποίου αυξάνεται όσο μειώνεται η συσχέτιση μεταξύ βοηθητικών και ερμηνευτικών μεταβλητών. Ο συντελεστής συσχέτισης λαμβάνει τόσο θετικές, όσο και αρνητικές τιμές, με αποτέλεσμα να καθορίζει αν η μεροληψία του εκτιμητή θα είναι θετική ή αρνητική. Η μεροληψία του εκτιμητή αντίθετα μειώνεται όταν αυξάνεται το μέγεθος του δείγματος T 4 και όσο πιο μεγάλη είναι η τιμή του R (ισχυρές βοηθητικές μεταβλητές). Οι ερευνητές, ωστόσο, δεν ενδιαφέρονται για την μεροληψία αυτή καθαυτή αλλά για τη σχέση μεταξύ της μεροληψίας του εκτιμητή TSLS με την αντίστοιχη του εκτιμητή ελαχίστων τετραγώνων και αυτό γιατί στην πράξη η χρήση της μεθόδου ελαχίστων τετραγώνων σε δύο στάδια στοχεύει στη μείωση της μεροληψίας του εκτιμητή OLS. 3 Ο συντελεστής συσχέτισης εκφράζει και το βαθμό συσχέτισης της ενδογενής ερμηνευτικής μεταβλητής με το σφάλμα από την παλινδρόμηση ελαχίστων τετραγώνων. 4 Θεωρητικά η μεροληψία του εκτιμητή θα πλησιάζει το μηδέν όταν το δείγμα είναι πολύ μεγάλο, εξασφαλίζοντας και τη συνέπεια του εκτιμητή. 16
Οι Hahn και Hausman (003b) έδειξαν ότι ο λόγος της μεροληψίας του εκτιμητή TSLS ως προς τη μεροληψία του εκτιμητή OLS είναι Bias Bias ( ˆ βtsls ) ( ˆ βols ) K = TR Η μεροληψία του εκτιμητή OLS δίνεται από τον τύπο ( ˆ βols ) β ρ( 1 R ) Ε =. Η σχετική μεροληψία του εκτιμητή TSLS αυξάνεται καθώς αυξάνεται ο αριθμός των βοηθητικών μεταβλητών, μειώνεται το δείγμα καθώς και η ισχύ των βοηθητικών μεταβλητών. Στο βαθμό που ισχύει ότι ο παρονομαστής της παραπάνω σχέσης, TR είναι μεγαλύτερος από τον αριθμητή, δηλαδή από τον αριθμό των βοηθητικών μεταβλητών K η μεροληψία του εκτιμητή TSLS είναι μικρότερη από την μεροληψία του εκτιμητή OLS. Μια τελευταία παρατήρηση που προκύπτει από την σχέση της μεροληψίας των δύο εκτιμητών αφορά στη «διεύθυνση» αυτής. Οι εκτιμητές θα είναι μεροληπτικοί προς την ίδια κατεύθυνση. Οι Hahn και Hausman (00b) αναφέρουν ότι στην περίπτωση των μη σημαντικών βοηθητικών μεταβλητών, Π=0, οι εκτιμητές TSLS και OLS θα έχουν την ίδια μεροληψία ( ˆ ) ( ˆ σ β ) uv TSLS β βols β Ε =Ε = σ v 5. Η ασυμπτωτική κατανομή του εκτιμητή TSLS κάτω από την υπόθεση των ασθενών βοηθητικών μεταβλητών καταρρέει. Σύμφωνα με τους Nelson και Startz (1990) η ασυμπτωτική διακύμανση του εκτιμητή θα είναι «μεγάλη» και η κατανομή του θα ιδιόμορφη. 5 Οι Stock, Wright και Yogo (00) αναφέρουν ότι η μεροληψία του εκτιμητή TSLS θα είναι ίση με ˆ lim ˆ σ uy Ε β β = p β β =, με την προϋπόθεση σ την ασυνέπεια του εκτιμητή OLS, ( TSLS ) ( OLS ) ότι K 3,ώστε να υπάρχει ο μέσος. Y 17
Οι Staiger και Stock (1997) κατά την διαδικασία εύρεσης της ασυμπτωτικής κατανομής του εκτιμητή όρισαν τη ασθενή σχέση μεταξύ των βοηθητικών και των C ερμηνευτικών μεταβλητών ως εξής Π=, όπου C μια σταθερά. Ουσιαστικά από T την τελευταία σχέση έχουμε ότι όσο αυξάνεται το μέγεθος του δείγματος η τιμή του Π θα προσεγγίζει το μηδέν, γι αυτό και το ονόμασαν «local to zero». Υιοθετώντας την υπόθεση των Staiger και Stock η ασυμπτωτική κατανομή του εκτιμητή ελαχίστων τετραγώνων σε δύο στάδια είναι T ( βtsls β) N ˆ d Zu C Σ + ZZ NZ v δηλαδή ο εκτιμητής TSLS συγκλίνει στο λόγο δύο κανονικών μεταβλητών. Ο αριθμητής έχει μηδενικό μέσο ενώ ο παρονομαστής έχει μέσο CΣ ZZ. Η κατανομή αυτού του όρου είναι μη-τυποποιημένη και η χρήση των κλασσικών διαδικασιών στατιστικής επαγωγής θα οδηγήσει σε επισφαλή συμπεράσματα (η απόδειξη της ασυμπτωτικής κατανομής του εκτιμητή δίνεται στο Παράρτημα I). Όταν οι βοηθητικές μεταβλητές είναι μη σημαντικές, δηλαδή όταν ασυμπτωτική κατανομή του εκτιμητή TSLS θα είναι Π=0, η T ( βtsls β) N. N ˆ d Zu Zv Ο εκτιμητής θα συγκλίνει στο λόγο δύο κανονικών μεταβλητών με μέσο μηδέν. Θα κατανέμεται, δηλαδή σύμφωνα με την κατανομή Cauchy, η οποία δεν έχει μέσο ενώ η διακύμανσή της είναι άπειρη. Τέλος, οι ασθενείς βοηθητικές μεταβλητές μπορούν να επηρεάσουν την συνέπεια του εκτιμητή TSLS. Οι Bound, Jaeger και Baker (1995) εξέφρασαν την ασυνέπεια του εκτιμητή TSLS ως προς την ασυνέπεια του εκτιμητή OLS κάτω από την υπόθεση των ασθενών βοηθητικών μεταβλητών, η οποία δίνεται ως εξής ( K = 1) 18
p lim ˆ β / IV β ρ ρ = p lim ˆ β β ρ OLS Z, u Y, u YZ,. Η ασθενή συσχέτιση των βοηθητικών μεταβλητών με τις ερμηνευτικές μεταβλητές (χαμηλή τιμή του ρ Y, Z) ακόμα και αν η συσχέτιση των βοηθητικών μεταβλητών με το διαταρακτικό όρο του υποδείγματος είναι χαμηλή μπορεί να οδηγήσει σε ασυνεπείς εκτιμητές TSLS. Η ασυνέπεια του είναι δυνατό να είναι μεγαλύτερη από την ασυνέπεια του εκτιμητή OLS. 3.3 Ανίχνευση Ασθενών Βοηθητικών Μεταβλητών Η μέθοδος των βοηθητικών μεταβλητών, όπως έχει ήδη αναφερθεί, αποτελεί μια ιδιαίτερα χρήσιμη μέθοδο εκτίμησης όταν οι ερμηνευτικές μεταβλητές σχετίζονται σύγχρονα με τα σφάλματα. Ωστόσο η απόδοση (performance) των εκτιμητών εξαρτάται από το βαθμό συσχέτισης των βοηθητικών μεταβλητών με τις ενδογενείς ερμηνευτικές μεταβλητές, δηλαδή από την ύπαρξη ασθενών ή ισχυρών βοηθητικών μεταβλητών. Καθώς οι ερευνητές, πριν από οποιαδήποτε εκτίμηση, έπρεπε να γνωρίζουν την ισχύ των βοηθητικών μεταβλητών, εστίασαν στον «σχεδιασμό» μέτρων για να ελεγχθεί η ύπαρξη ή μη ασθενών βοηθητικών μεταβλητών. Σε υποδείγματα με μια ερμηνευτική μεταβλητή ο συντελεστής προσδιορισμού ( R ) από την παλινδρόμηση των ενδογενών ερμηνευτικών μεταβλητών με τις βοηθητικές μεταβλητές αποτελεί ένα μέτρο ανίχνευσης της ισχύς των βοηθητικών μεταβλητών, καθώς χαμηλές τιμές του R αποτελούν ένδειξη για ασθενείς βοηθητικές μεταβλητές. Όταν, όμως, έχουμε προς εκτίμηση ένα πολυμεταβλητό υπόδειγμα ο Shea (1997) προτείνει την χρήση ενός συντελεστή μερικού προσδιορισμού (partial R ). Για τον υπολογισμό του συντελεστή μερικού προσδιορισμού ο Shea στηρίχτηκε στην εκτιμημένη ασυμπτωτική διακύμανση των εκτιμητών IV και OLS, θεωρώντας την διακύμανση των σφαλμάτων γνωστή. Στην πράξη, όμως, το τελευταίο δεν μπορεί να ισχύει. Έτσι ο Godfrey (1999) πρότεινε μια «διόρθωση» στον διαδικασία υπολογισμού του συντελεστή, η οποία και λιγότερο επίπονη είναι και μειώνει την πιθανότητα υποεκτίμησης της απόδοσης των βοηθητικών μεταβλητών. Ο Godfrey για 19
την εύρεση του συντελεστή στηρίχτηκε στο λόγο των διακυμάνσεων των εκτιμητών IV και OLS και στο λόγο των εκτιμημένων διακυμάνσεων των σφαλμάτων των αντίστοιχων μεθόδων εκτίμησης. Ωστόσο έχει αποδειχτεί ότι τα παραπάνω μέτρα δεν παρέχουν τις απαραίτητες πληροφορίες για να χαρακτηρίσουμε τις βοηθητικές μεταβλητές ως ασθενείς. Ένας άλλος έλεγχος για την ύπαρξη ασθενών βοηθητικών μεταβλητών είναι η F στατιστική (first stage F statistic) που προκύπτει από την παλινδρόμηση των ενδογενών ερμηνευτικών μεταβλητών με τις τεχνητές μεταβλητές. Η στατιστική αυτή χρησιμοποιήθηκε αρχικά από τους Hall, Rudebusch και Wilcox, για να ελέγξουν την υπόθεση της μη ταυτοποίησης (nonidentification), Π = 0, δηλαδή αποτελεί έναν έλεγχο σημαντικότητας των βοηθητικών μεταβλητών, συμπεριλαμβανομένου και του σταθερού όρου. Στο υπόδειγμα Y = Z Π+ v T K K 1 T 1 ο εκτιμητής ελαχίστων τετραγώνων του παραπάνω υποδείγματος είναι ( ) 1 Π ˆ OLS = Z Z ZY και η ασυμπτωτική κατανομή του ˆ (, ( ) Π Ν Π σ ZZ 1 ). Κάτω από την μηδενική υπόθεση H : 0 0 Π = ή ισοδύναμα H : RΠ r = 0 0 και σύμφωνα με τον ορισμό της F στατιστικής έχουμε F = ( ˆ Π ) ( ) 1 1 ( ) ( Π ˆ ) R r R ZZ R R r σ ˆv 1 K όπου R η μοναδιαία μήτρα με διάσταση K K. Αν αντικαταστήσουμε στην προηγούμενη σχέση την R =Ι και τον εκτιμητή Πˆ OLS έχουμε την τελική μορφή της στατιστικής (όταν n =1) 0
( ) 1 YZ ZZ ZY 1 F =. σ K ˆv Ωστόσο, όπως, αποδείχτηκε η συγκεκριμένη στατιστική δεν ενδείκνυται για τον έλεγχο της υπόθεσης της μη ταυτοποίησης, δεν αποτελεί, δηλαδή, ένα επαρκές μέτρο για τον χαρακτηρισμό των βοηθητικών μεταβλητών. Οι Stock και Yogo (005) χρησιμοποίησαν την F στατιστική για να ελέγξουν τη μηδενική υπόθεση ότι ο λόγος μ K είναι μικρότερος ή ίσος από μια κριτική τιμή, έναντι της εναλλακτικής ότι θα είναι μεγαλύτερος. Θέλησαν με αυτό τον τρόπο να ελέγξουν τον ορισμό που «έδωσαν» οι ίδιοι για τις βοηθητικές μεταβλητές, με βάσει τη μεροληψία και την «αλλοίωση μεγέθους» του ελέγχου Wald. Η κριτική τιμή για την F στατιστική λαμβάνεται από την ασυμπτωτική ανάλυση των Staiger και Stock (1997), οι οποίοι υποστήριξαν ότι αυτή θα πρέπει να λαμβάνει την τιμή 10. Αν η τιμή της F είναι μικρότερη ή ίση της τιμής του κατωφλίου, δηλαδή F 10, τότε δεν απορρίπτεται η μηδενική υπόθεση και οι βοηθητικές μεταβλητές χαρακτηρίζονται ως ασθενείς, ενώ στην περίπτωση απόρριψης της μηδενικής υπόθεσης ως ισχυρές. Όταν έχουμε ένα υπόδειγμα προς εκτίμηση με πολλές ενδογενείς ερμηνευτικές μεταβλητές η μήτρα των συντελεστών των βοηθητικών μεταβλητών θα έχει διάσταση K n και ο έλεγχος θα βασιστεί σε μία μήτρα διάστασης n n ανάλογη της F στατιστικής, η οποία είναι G T Σˆ = ( ) 1 YZ ZZ ZY Σˆ 1/ 1/ vv vv K όπου ˆ Y Μ ZY Σ vv = T K και Μ Z = I PZ. Στην περίπτωση του πολυμεταβλητού υποδείγματος ο συντελεστή συγκέντρωσης είναι μια μήτρα διάστασης K K, 1 μ vv = Σ Π ZZΠΣ (για λόγους ευκολίας χρησιμοποιούμε τον ίδιο συμβολισμό για το συντελεστή συγκέντρωσης, είτε είναι μήτρα, είτε βαθμωτό). Ο έλεγχος τώρα βασίζεται στις ελάχιστες ιδιοτιμές της μήτρας 1 vv 1
G T, gmin = min eigenvalue( G T ), δηλαδή η κριτική τιμή του ελέγχου θα είναι η ελάχιστη ιδιοτιμή της G T. Η απόρριψη ή μη της μηδενικής υπόθεσης, ο λόγος μ K είναι μικρότερος ή ίσος από μια κριτική τιμή, θα εξαρτάται από την ελάχιστη ιδιοτιμή της μήτρας ελέγχου G T. Από τη θεωρία μητρών έχουμε ότι μια τετραγωνική μήτρα θα είναι αντιστρέψιμη ή μη-ιδιάζουσα αν είναι πλήρως βαθμού, δηλαδή για την μήτρα του συντελεστή συγκέντρωσης θα ισχύει ότι ο βαθμός της θα είναι ίσος με r( μ ) = K. Επίσης γνωρίζουμε ότι ο βαθμός μιας μήτρας είναι ίσος με τον αριθμό των μη-μηδενικών ιδιοτιμών της. Η στατιστική K, χρησιμοποιήθηκε από τους Cragg και Donald (1993) αρχικά για τον έλεγχο της υποταυτοποίησης (underidentification), όταν δηλαδή η μήτρα του συντελεστή συγκέντρωσης (concentration matrix) είναι μηαντιστρέψιμη ή ιδιάζουσα (singular). Οι Stock και Yogo (005) χρησιμοποιούν τη συγκεκριμένη στατιστική όταν η μήτρα του συντελεστή συγκέντρωσης είναι αντιστρέψιμη (nonsingular), γεγονός που ικανοποιεί την υπόθεση της ταυτοποίησης (απαραίτητη στην μέθοδο IV). G T Οι Hall, Rudebusch και Wilcox (1996) πρότειναν έναν έλεγχο για την απόδοση των ασθενών βοηθητικών μεταβλητών που στηρίζεται στην τετραγωνική κανονική συσχέτιση (squared canonical correlation) των παλινδρομητών και των βοηθητικών μεταβλητών. Είναι ένα γενικό μέτρο ελέγχου καθώς συμπεριλαμβάνει δύο επιμέρους ελέγχους για την ανίχνευση ασθενών βοηθητικών μεταβλητών, τη στατιστική F και τον συντελεστή μερικού προσδιορισμού. Η μηδενική υπόθεση αφορά στην ύπαρξη τουλάχιστον μιας κανονικής συσχέτισης που είναι κοντά στο μηδέν ή είναι ίση με το μηδέν. Ο έλεγχος της μηδενικής υπόθεσης γίνεται μέσω του κριτηρίου λόγου πιθανοφάνειας, Likelihood Ratio (LR). Όταν έχουμε προς εκτίμηση υπόδειγμα με μία ερμηνευτική και μια βοηθητική μεταβλητή, τότε η μορφή του κριτηρίου είναι ( ) LR = T log 1 r χ 1 το οποίο κατανέμεται ασυμπτωτικά με βάσει την κατανομή χ με έναν βαθμό ελευθερίας, ενώ το r είναι η τετραγωνική κανονική συσχέτιση μεταξύ της ερμηνευτικής και της βοηθητικής μεταβλητής. Στην περίπτωση του πολυμεταβλητού υποδείγματος το κριτήριο γίνεται
n i= j+ 1 ( i ) LR = T log 1 r χ v όπου την r i η τετραγωνική κανονική συσχέτιση του δείγματος και το κριτήριο ακολουθεί χ κατανομή με v ( K j)( n j) = βαθμούς ελευθερίας. Οι τετραγωνικές κανονικές συσχετίσεις του δείγματος μεταξύ των ερμηνευτικών και βοηθητικών μεταβλητών μπορεί να υπολογιστούν ως οι ιδιοτιμές της μήτρας 1 1 ( ) ( )( ) ( D= YY YZ ZZ ZY = ( YY) 1 YPY Z ) που προκύπτει από το πρώτο στάδιο της μεθόδου εκτίμησης TSLS. Η ύπαρξη κανονικής συσχέτισης με τιμή κοντά στο μηδέν συνεπάγεται ότι στο υπόδειγμα υπάρχουν ασθενείς βοηθητικές μεταβλητές. Οι Nelson και Startz (1990a) επισήμαναν ότι αν η τιμή του λόγου πιθανοφάνειας είναι μικρότερη του δύο, η σημαντικότητα των βοηθητικών μεταβλητών θα είναι τόσο χαμηλή που τα αποτελέσματα της στατιστικής επαγωγής θα είναι αναξιόπιστα. Οι Hahn και Hausman (00) πρότειναν ένα διαφορετικό έλεγχο για την ανίχνευση των ασθενών βοηθητικών μεταβλητών. Η μηδενική υπόθεση του ελέγχου αφορά στην ύπαρξη ισχυρών μεταβλητών έναντι της εναλλακτικής των ασθενών βοηθητικών μεταβλητών. Κάτω από τη μηδενική υπόθεση ο εκτιμητής ελαχίστων τετραγώνων σε δύο στάδια (forward TSLS) θα είναι ασυμπτωτικά ισοδύναμος με τον αντίστροφο του (reverse TSLS). Στην πράξη ελέγχεται αν η διαφορά μεταξύ των δύο εκτιμητών είναι στατιστικά σημαντική. Αν η διαφορά τους είναι «μικρή», η μηδενική υπόθεση δεν απορρίπτεται και οι μεταβλητές που αντιμετωπίζει ο ερευνητές θα είναι «ισχυρές». Επομένως, η εκτίμηση του υποδείγματος με τη μέθοδο TSLS θα δώσει αξιόπιστα αποτελέσματα και η ασυμπτωτική ανάλυση θα έχει ισχύ. Απόρριψη, όμως, της μηδενικής υπόθεσης συνεπάγεται ύπαρξη ασθενών βοηθητικών μεταβλητών. Αυτό σημαίνει ότι η διαφορά των δύο εκτιμητών θα είναι «μεγάλη», στατιστικά σημαντική 3
και έτσι προτείνουν την υιοθέτηση ασυμπτωτικής ανάλυσης δεύτερης τάξης και την χρήση των άλλων εκτιμητών (βλέπε ενότητα 3.5). 3.4 Εκτιμήσεις διαστημάτων εμπιστοσύνης και έλεγχοι στατιστικών υποθέσεων Οι έλεγχοι υποθέσεων και οι εκτιμήσεις διαστημάτων εμπιστοσύνης των εκτιμητών ενός οικονομετρικού υποδείγματος αποτελούν μια από τις σπουδαιότερες διαδικασίες της εμπειρικής ανάλυσης. Με βάσει τις εκτιμήσεις των παραμέτρων του υποδείγματος μπορούμε να οδηγηθούμε σε συμπεράσματα σχετικά με τον πληθυσμό από τον οποίο προέρχεται το δείγμα που μελετάμε. Οι έλεγχοι στατιστικών υποθέσεων ενδιαφέρονται να ελέγξουν αν οι συντελεστές του υποδείγματος λαμβάνουν συγκεκριμένες τιμές. Η πιο συχνά ελεγχόμενη υπόθεση είναι αυτή της στατιστικής σημαντικότητας των συντελεστών κλίσης των ανεξάρτητων μεταβλητών, δηλαδή ελέγχουμε αν διαφέρουν από το μηδέν. Αν όμως, το παραπάνω δεν ισχύει τότε οι ανεξάρτητες μεταβλητές δεν είναι σημαντικές, δεν έχουν ερμηνευτική ικανότητα για τις μεταβολές της εξαρτημένης μεταβλητής και επομένως θα μπορούσαμε να τις παραλείψουμε από το υπόδειγμα. Εκτός από τη στατιστική σημαντικότητα, πολλές φορές ενδιαφερόμαστε για τον έλεγχο υποθέσεων που προκύπτουν από την οικονομική θεωρία. Ο έλεγχος μιας στατιστικής υπόθεσης προϋποθέτει τον ορισμό της μηδενικής υπόθεσης H 0, της υπόθεσης, δηλαδή, που θέλουμε να ελέγξουμε και της εναλλακτικής H 1, την υιοθέτηση ενός στατιστικού κριτηρίου για τη διεξαγωγή του ελέγχου και τέλος έναν κανόνα με βάσει τον οποίο αποφασίζουμε την απόρριψη ή μη της μηδενικής υπόθεσης. Έστω η μηδενική υπόθεση προς έλεγχο H : 0 β β0 =, όπου β 0 μια υποθετική τιμή του β που θέλουμε να ελέγξουμε αν ισχύει στον πληθυσμό και η εναλλακτική : 1 β β. Για τον έλεγχο της παραπάνω υπόθεσης μπορούμε να H 0 κάνουμε χρήση του κριτηρίου 6 t 6 Η χρήση αυτού του κριτηρίου ενδείκνυται όταν οι κατανομή του πληθυσμού από τον οποίο προέρχεται το δείγμα θεωρείται γνωστή και όταν το μέγεθος του δείγματος είναι μικρό. Η κατανομή t τείνει προς την κανονική κατανομή όσο αυξάνονται οι βαθμοί ελευθερίας ( 30 ). 4
ˆ β β = se 0 a t t T K ( ˆ β ) όπου se( ˆ β ) το τυπικό σφάλμα του ˆ β. Το κριτήριο κατανέμεται με σύμφωνα με την t-student κατανομή, με T K βαθμούς ελευθερίας και a το επίπεδο σημαντικότητας 7. Η μηδενική υπόθεση απορρίπτεται αν ισχύει ότι t t, δηλαδή c όταν η απόλυτη τιμή του κριτηρίου t είναι μεγαλύτερη από την κριτική τιμή, t. c Ο υπολογισμός των διαστημάτων εμπιστοσύνης ενός συντελεστή συνίσταται στην εκτίμηση ενός διαστήματος τιμών εντός του οποίου είναι πιθανό να βρίσκεται η αληθινή τιμή της παραμέτρου στον πληθυσμό. Αυτό απαιτεί τη γνώση της κατανομής των εκτιμητών του υποδείγματος και των στατιστικών κριτηρίων. Με βάσει τον παραπάνω έλεγχο μπορούμε να προβούμε στον υπολογισμό του διαστήματος εμπιστοσύνης για το συντελεστή β ή a ( ) ( ) ˆ β t se ˆ β β ˆ β + t se ˆ β a T K T K ˆ β ± t a T K se ( ˆ β ) Αν η τιμή της μηδενικής υπόθεσης βρίσκεται εντός των ορίων του διαστήματος τότε δεν απορρίπτουμε την H 0. Η παραπάνω ανάλυση θα μπορούσε να εφαρμοστεί για τον εκτιμητή ελαχίστων τετραγώνων σε δύο στάδια η ύπαρξη, όμως, ασθενών βοηθητικών μεταβλητών περιπλέκει τα πράγματα. Όταν οι βοηθητικές μεταβλητές είναι ασθενείς, οι εκτιμητές TSLS είναι μεροληπτικοί, γεγονός που δεν εξαλείφεται όταν το δείγμα είναι μεγάλο. Επίσης, σε αυτή την περίπτωση τα τυπικά σφάλματα των εκτιμητών είναι πολύ «μικρά», με αποτέλεσμα οι ελεγχόμενες υποθέσεις να απορρίπτονται πολύ συχνά, ενώ τα διαστήματα εμπιστοσύνης για τους εκτιμητές TSLS να είναι «παραπλανητικά» 7 Το επίπεδο σημαντικότητας είναι a καθώς ο έλεγχος που χρησιμοποιούμε είναι δικατάληκτος. 5
καθώς το εύρος (width) τους είναι περιορισμένο (narrow). Τέλος όπως έχουμε αναφέρει η ασυμπτωτική κατανομή του εκτιμητή TSLS είναι μη κανονική. Το ζητούμενο, επομένως, είναι ένας έλεγχος πλήρως αξιόπιστος (fully robust), που να έχει σωστό μέγεθος (correct size) και ισχύ (power) όταν έχουμε ασθενείς βοηθητικές μεταβλητές και διαστήματα εμπιστοσύνης που ασυμπτωτικά θα έχουν σωστό ποσοστό κάλυψης (coverage rate). Στην πράξη θέλουμε μια στατιστική ελέγχου που να μην εξαρτάται από την παράμετρο συγκέντρωσης, μ. Αρχικά αναπτύχθηκαν έλεγχοι στα πλαίσια ενός υποδείγματος με μία ενδογενή ερμηνευτική μεταβλητή και ανεξάρτητα και ομοιογενώς κατανεμημένα (iid) ομοσκεδαστικά σφάλματα ενώ στη συνέχεια γενικεύθηκαν ώστε να συμπεριλάβουν περισσότερες μεταβλητές και ετεροσκεδαστικά σφάλματα. Μια στατιστική αξιόπιστη και ανεξάρτητη από την ποιότητα των βοηθητικών μεταβλητών είναι ο έλεγχος Anderson Rubin, AR (Anderson and Rubin (1949)). Κάτω από τη μηδενική υπόθεση ελέγχου, H0 : β = β0, και την υπόθεση των iid και ομοσκεδαστικών σφαλμάτων η στατιστική AR κατανέμεται σύμφωνα με την χ κατανομή με K βαθμούς ελευθερίας, ενώ όταν τα σφάλματα κατανέμονται σύμφωνα με την κανονική κατανομή, τότε ο έλεγχος ακολουθεί την F κατανομή με T K βαθμούς ελευθερίας. Στην περίπτωση ενός ταυτοποιημένου υποδείγματος ο έλεγχος διατηρεί την αξιοπιστία του και έχει ισχύ, όταν όμως εξετάζουμε την περίπτωση της υπερταυτοποίησης ο έλεγχος συνεχίζει να είναι αξιόπιστος αλλά η ισχύ του μειώνεται καθώς δεν λαμβάνονται υπόψη κάποιοι περιορισμοί. Οι βαθμοί ελευθερίας του ελέγχου ταυτίζονται με τον αριθμό των βοηθητικών μεταβλητών, επομένως όταν ο αριθμός των βοηθητικών μεταβλητών είναι μεγαλύτερος από τον αριθμό των παραμέτρων, κάτι εξαιρετικά σύνηθες σε εμπειρικό επίπεδο, η ισχύ του ελέγχου είναι χαμηλή. Τέλος, ο έλεγχος χάνει σε αποτελεσματικότητα κάτω από την υπόθεση των ισχυρών βοηθητικών μεταβλητών. Ο Kleibergen (00) πρότεινε ένα στατιστικό έλεγχο τύπου Πολλαπλασιαστή Lagrange (Lagrange Multiplier, LM), ο οποίος αντιμετωπίζει το μειονέκτημα του ελέγχου AR. Κάτω από τη μηδενική υπόθεση ελέγχου και ανεξάρτητα από το εάν οι βοηθητικές μεταβλητές είναι ασθενείς ή όχι, ο έλεγχος K (K statistic), όπως ονομάζεται, κατανέμεται σύμφωνα με την χ κατανομή με βαθμούς ελευθερίας 6
ίσους με τον συνολικό αριθμό των παραμέτρων του υποδείγματος. Ο έλεγχος K αποτελεί τετραγωνική μορφή των πρώτων παραγώγων της λογαριθμικής συνάρτησης πιθανοφάνειας (scores) με αποτέλεσμα να λαμβάνει την τιμή μηδέν όταν ο εκτιμητής πιθανοφάνειας περιορισμένης πληροφόρησης (LIML) είναι ίσος με το μηδέν, καθώς αυτός ο εκτιμητής θέτει τις πρώτες παραγώγους ίσες με το μηδέν. Γενικά, ο έλεγχος K είναι αξιόπιστος και έχει μεγαλύτερη ισχύ από τον έλεγχο AR όταν έχουμε περισσότερες από μια βοηθητικές μεταβλητές, ενώ όταν έχουμε μία βοηθητική μεταβλητή οι έλεγχοι είναι ισοδύναμοι, ωστόσο δεν στερείται μειονεκτημάτων, καθώς παρουσιάζει μη-μονοτονικές ιδιότητες «ισχύος» Τέλος ο υπό συνθήκη έλεγχος του λόγου πιθανοφάνειας (conditional likelihood ratio, CLR) (Moreira, 003) κυριαρχεί έναντι των δύο προηγούμενων ελέγχων, τόσο από την πλευρά της αξιοπιστίας, όσο και της ισχύς. Οι καλύτερες ιδιότητες, από άποψη μεγέθους, οφείλονται στο ότι η κριτική τιμή για τον διαγνωστικό έλεγχο προσαρμόζεται από δείγμα σε δείγμα έτσι ώστε κάθε φορά να έχουμε το «σωστό» επίπεδο σημαντικότητας. Αν και σύμφωνα με τους Andrews, Moreira και Stock (006) δεν υπάρχει έλεγχος που να έχει μέγιστη ισχύ, ο CLR θεωρείται σχεδόν άριστος και προτείνεται η χρήση του για εμπειρική έρευνα, αφού στην περίπτωση της υπέρταυτοποίησης η ισχύ του βρίσκεται πολύ κοντά στην άριστη θεωρητική τιμή του (power envelope) και στην περίπτωση της ταυτοποίησης ανήκει στην κατηγορία ελέγχων με τη μέγιστη ισχύ. Ωστόσο, δεν πρέπει να παραλειφθεί το γεγονός ότι η παραπάνω τεκμηρίωση αφορά μόνο την περίπτωση υποδείγματος με μία ενδογενή ερμηνευτική μεταβλητή. Αναφορικά, με τα διαστήματα εμπιστοσύνης, αυτά συνεχίζουν να έχουν τη μορφή ( β) ˆ β ± se ˆ σταθερά όπου σταθερά είναι η κριτική τιμή του εκάστοτε κριτηρίου. Καθώς, όμως, ο έλεγχος CLR είναι ο πιο αξιόπιστος συνεπάγεται ότι και τα διαστήματα εμπιστοσύνης που στηρίζονται σε αυτόν θα είναι σχεδόν άριστα. Κάτω από τη μηδενική υπόθεση, H : 0 β β0 =, ένα διάστημα εμπιστοσύνης από τον έλεγχο CLR ελαχιστοποιεί την πιθανότητα να περιλαμβάνεται σε αυτό μια λανθασμένη τιμή της παραμέτρου. Αν ο 7
έλεγχος δεν απορρίψει τη μηδενική υπόθεση, τότε η τιμή αυτή, β 0, θα βρίσκεται ενός του διαστήματος εμπιστοσύνης. 3.5 Αξιόπιστοι εκτιμητές Η εκτίμηση ενός υποδείγματος είναι αρκετά επίπονη διαδικασία και πολλοί ερευνητές θεωρούν ότι ίσως είναι πιο απαιτητική από την πραγματοποίηση ενός διαγνωστικού ελέγχου ή την δημιουργία διαστημάτων εμπιστοσύνης. Το ζητούμενο είναι η εκτίμηση των παραμέτρων ενός οικονομετρικού υποδείγματος χρησιμοποιώντας την κατάλληλη μέθοδο εκτίμησης κάθε φορά. Στην περίπτωση των ασθενών βοηθητικών μεταβλητών μεγάλος αριθμός ερευνητών χρησιμοποιεί για την εκτίμηση των εκάστοτε υποδειγμάτων τη μέθοδο των ελαχίστων τετραγώνων σε δύο στάδια (TSLS), ωστόσο τα αποτελέσματα της μεθόδου δεν μπορούν να θεωρηθούν ιδιαίτερα Εκτιμητής 1 k τάξης ˆ β ( k) = Y ( I kmz) Y Y ( I kmz) y OLS k = 0 TSLS k = 1 LIML k = k ˆLIML Fuller-k k = kˆliml c T K BTSLS k = T ( T K + ) JIVE k = 1+ K ( T K) Nagar K K k = 1 T T αξιόπιστα καθώς οι εκτιμητές TSLS σε μικρά δείγματα αντιμετωπίζουν προβλήματα, με κυριότερο αυτό της μεροληψίας. Αυτό είχε ως αποτέλεσμα την αναζήτηση άλλων μεθόδων εκτίμησης που να τα εξαλείφουν ή τουλάχιστον να τα περιορίζουν (robust estimators). Έτσι από τον εκτιμητή k τάξης ( k class estimator) 1 ( ) = ( ) ( ) ˆ β k Y I kmz Y Y I kmz y 8
προκύπτει πληθώρα εκτιμητών πρώτης και δεύτερης τάξης. Οι εκτιμητές δεύτερης τάξης στην πράξη δίνουν λύση στα προβλήματα του εκτιμητή ελαχίστων τετραγώνων σε δύο στάδια. Oι πιο γνωστοί και ευρέως χρησιμοποιούμενοι εκτιμητές πρώτης τάξης, είναι ο εκτιμητής Ελαχίστων Τετραγώνων (OLS) όταν k = 0 και ο εκτιμητής Ελαχίστων Τετραγώνων σε δύο στάδια (TSLS) όταν k = 1. Αναφορικά με τους εκτιμητές δεύτερης τάξης, έχουμε τον εκτιμητή μέγιστης πιθανοφάνειας περιορισμένης πληροφόρησης (LIML),όταν η ισχύει ότι k = k, όπου τώρα το k αντιστοιχεί στην ˆLIML μικρότερη ρίζα της χαρακτηριστικής εξίσωσης, [ yy] [ yy] k[ yy] M [ yy] Z ενώ όταν k = kˆliml c T K, όπου c μια θετική σταθερά έχουμε μια τροποποιημένη μορφή του εκτιμητή LIML, τον εκτιμητή Fuller-k. Ένας άλλος εκτιμητής αυτής της κατηγορίας είναι ο προσαρμοσμένος ως προς τη μεροληψία εκτιμητής ελαχίστων τετραγώνων σε δύο στάδια (BTSLS), όταν ( ) k = T T K +. O εκτιμητής βοηθητικών μεταβλητών Jackknife (JIVE) ασυμπτωτικά προκύπτει όταν ( ) k = 1+ K T K, ενώ τέλος, ο εκτιμητής Nagar προκύπτει όταν K K k = 1 T T. Η μέθοδος Ελαχίστων Τετραγώνων αν και αποτελεί «σημείο αναφοράς» (benchmark) δεν μπορεί να χρησιμοποιηθεί για την εκτίμηση υποδειγμάτων που μελετώνται στα πλαίσια αυτής της εργασίας. Οι εκτιμητές θα είναι μεροληπτικοί και ασυνεπείς. Από την άλλη οι εκτιμητές TSLS θα είναι συνεπείς όταν οι βοηθητικές μεταβλητές δεν συσχετίζονται με το διαταρακτικό όρο του υποδείγματος, όμως θα είναι μεροληπτικοί προς την ίδια κατεύθυνση με τον εκτιμητή OLS και μάλιστα όταν η συσχέτιση των βοηθητικών μεταβλητών με τις ενδογενείς ερμηνευτικές μεταβλητές είναι πολύ «μικρή» ή μηδενική οι δύο εκτιμητές θα έχουν την ίδια μεροληψία (Bound, Jaeger and Baker, 1995). Επίσης, η μεροληψία του εκτιμητή σε μικρά δείγματα εξαρτάται από τον αριθμό των βοηθητικών μεταβλητών και αντιστρόφως ανάλογα από τον συντελεστή προσδιορισμού, ενώ η μεγαλύτερης τάξης μέση μεροληψία (higher-order mean bias) του εκτιμητή είναι ανάλογη του αριθμού των βοηθητικών μεταβλητών. 9
Παρόλα αυτά το μέσο τετραγωνικό σφάλμα (mean square error) του εκτιμητή λαμβάνει τιμές μικρότερες από το αντίστοιχο του εκτιμητή μέγιστης πιθανοφάνειας περιορισμένης πληροφόρησης (LIML). Ο εκτιμητής LIML θεωρείται πιο αξιόπιστος καθώς είναι λιγότερο μεροληπτικός από τον TSLS, η μεγαλύτερης τάξης μέση μεροληψία του είναι ανεξάρτητη από τον αριθμό των βοηθητικών μεταβλητών και μάλιστα θεωρείται ο καλύτερος αμερόληπτος ως προς τη διάμεσο εκτιμητής δεύτερης τάξης, ενώ η υιοθέτησή του ελαχιστοποιεί τον διαγνωστικό έλεγχο AR. Έχει, όμως, ένα σημαντικό μειονέκτημα, δεν έχει ροπές και γι αυτό οι Hahn και Hausman (003a) υποστηρίζουν ότι μπορεί η υιοθέτησή του σε εμπειρικό επίπεδο να δημιουργήσει περισσότερα προβλήματα, με πιο σοβαρό αυτό της ύπαρξης εξαιρετικά ακραίων τιμών (extreme outliers), από αυτά που ενδεχομένως μπορεί να λύσει. Οι εκτιμητές τύπου Nagar αν και αμερόληπτοι ως προς το μέσο (mean unbiased), έχουν και αυτοί το μειονέκτημα των ροπών. Ο Fuller (1977) πρότεινε μια μορφή εκτιμητή τάξης που διαθέτει ροπές και είναι αμερόληπτος, τον εκτιμητή Fuller-k. Ο εκτιμητής αποτελεί μια τροποποιημένη μορφή του εκτιμητή LIML, ώστε να έχει ροπές, και μάλιστα όταν c = 1 ο εκτιμητής Fuller k είναι άριστος αμερόληπτος εκτιμητής δεύτερης τάξης, ενώ το μέσο τετραγωνικό σφάλμα δεύτερης τάξης του εκτιμητή λαμβάνει χαμηλότερες τιμές συγκριτικά με το μέσο τετραγωνικό σφάλμα των άλλων εκτιμητών. Στην περίπτωση που ισχύει ότι c = 4 ο εκτιμητής είναι μεροληπτικός, αλλά το μέσο τετραγωνικό σφάλμα είναι μικρότερο από το αντίστοιχο όταν k c =1. Οι ιδιότητες του εκτιμητή βοηθητικών μεταβλητών Jackknife (JIVE) εμφανίζουν ομοιότητες με τις αντίστοιχες του εκτιμητή Nagar, καθώς ο εκτιμητής JIVE δεν έχει ροπές σε πεπερασμένα δείγματα και είναι αμερόληπτος δεύτερης τάξης ως προς το μέσο. Τέλος, ο προσαρμοσμένος ως προς τη μεροληψία εκτιμητής ελαχίστων τετραγώνων σε δύο στάδια (BTSLS) είναι αμερόληπτος ως προς το μέσο αλλά δεν έχει ροπές. Ο Flores-Lagunes (007) προτείνει, εκτός από τους εκτιμητές k τάξης, δύο άλλες ομάδες εκτιμητών. Η πρώτη αφορά τους εκτιμητές TSLS, LIML και Fuller (BCTSLS, BCLIML, BCFULL) στους οποίους εφαρμόζεται η μέθοδος «bootstrap» ως μια διαδικασία μείωσης της μεροληψίας τους (bias-reduction technique). Η μέθοδος αυτή αφορά στον υπολογισμό ενός εκτιμητή για την μεροληψίας του εκάστοτε εκτιμητή 30