ΟΙΚΟΝΟΜΕΤΡΙΑ 2 ΦΡΟΝΤΙΣΤΗΡΙΟ 2 BASICS OF IV ESTIMATION USING STATA Στις ασκήσεις που ακολουθούν χρησιμοποιούμε δεδομένα για 3010 εργαζόμενους άνδρες ηλικίας 24 έως 34 από έρευνα που πραγματοποιήθηκε το 1976 στην Αμερική. Οι μεταβλητές που διαθέτουμε είναι οι ακόλουθες: λογάριθμος του ωριαίου μισθού (lwage), τα χρόνια εκπαίδευσης (educ), η προϋπηρεσία (exper), μια ψευδομεταβλητή για την οικογενειακή κατάσταση (married), μια ψευδομεταβλητή για την φυλή (black), και 7 ψευδομεταβλητές για τον τόπο κατοικίας (reg661 reg667). Επίσης διαθέτουμε μια ψευδομεταβλητή που λαμβάνει την τιμή 1 όταν το άτομο ζούσε το 1966 σε μια περιοχή κοντά σε τετραετές κολλέγιο (nearc4), και μεταβλητές για την εκπαίδευση του πατέρα (fathereduc) και την εκπαίδευση της μητέρας (mothereduc) σε χρόνια. Αρχικά ανοίγουμε την βάση δεδομένων μας και εξετάζουμε συνοπτικά κάποιες από τις διαθέσιμες μεταβλητές:. use card. sum educ lwage age black exper nearc4 Variable Obs Mean Std. Dev. Min Max educ 3010 13.26346 2.676913 1 18 lwage 3010 6.261832.4437976 4.60517 7.784889 age 3010 28.1196 3.137004 24 34 black 3010.2335548.4231624 0 1 exper 3010 8.856146 4.141672 0 23 nearc4 3010.6820598.4657535 0 1 Ερώτημα 1 Έστω ότι θέλουμε να εξετάσουμε την επίδραση της εκπαίδευσης στον ωριαίο μισθό του ατόμου, λαμβάνοντας επίσης υπ όψιν την προϋπηρεσία, την φυλή, την οικογενειακή κατάσταση και τον τόπο κατοικίας. α. Γράψτε το θεωρητικό υπόδειγμα προς εκτίμηση, την εντολή παλινδρόμησης στο STATA και την εντολή ελέγχου για ετεροσκεδαστικότητα.
β. Παρακάτω δίνονται τα αποτελέσματα. Σχολιάστε εν συντομία και τεκμηριώστε εάν θα πρέπει να γίνει διόρθωση των τυπικών σφαλμάτων, όπως διδαχτήκατε στο προηγούμενο μάθημα.. reg lwage educ exper black married reg661 reg662 reg663 reg664 reg665 reg666 reg667 F( 11, 2991) = 101.53 Model 160.666558 11 14.6060507 Prob > F = 0.0000 Residual 430.294593 2991.14386312 R-squared = 0.2719 Adj R-squared = 0.2692 Total 590.961151 3002.196855813 Root MSE =.37929 lwage Coef. Std. Err. t P> t [95% Conf. Interval] educ.0764378.0035528 21.51 0.000.0694716.0834041 exper.0343021.0022753 15.08 0.000.0298407.0387634 black -.1579087.0187103-8.44 0.000 -.194595 -.1212224 married -.0330703.0034855-9.49 0.000 -.0399045 -.026236 reg661 -.0872066.0379341-2.30 0.022 -.1615863 -.012827 reg662.0231396.0265591 0.87 0.384 -.0289363.0752156 reg663.0543842.0255867 2.13 0.034.0042149.1045535 reg664 -.0834315.0340474-2.45 0.014 -.1501903 -.0166728 reg665 -.1165883.0264355-4.41 0.000 -.1684219 -.0647548 reg666 -.1280406.0313596-4.08 0.000 -.1895292 -.066552 reg667 -.1177484.0298158-3.95 0.000 -.1762099 -.0592868 _cons 5.100724.0686511 74.30 0.000 4.966116 5.235333. hettest Breusch-Pagan / Cook-Weisberg test for heteroskedasticity Ho: Constant variance Variables: fitted values of lwage chi2(1) = 0.09 Prob > chi2 = 0.7649 γ. Η παραπάνω εκτίμηση με OLS θεωρείτε ότι είναι η κατάλληλότερη ως μέθοδος; Ποιο πρόβλημα παρουσιάζει η μεταβλητή educ και ποιες είναι οι συνέπειες για τους εκτιμητές που προκύπτουν από τη χρήση της OLS; δ. Έστω τώρα ότι αποφασίζουμε να χρησιμοποιήσουμε την μεταβλητή nearc4 ως βοηθητική μεταβλητή για την educ. Ποιες είναι οι συνθήκες οι οποίες θα πρέπει να ισχύουν ώστε η nearc4 να είναι καλή ως βοηθητική μεταβλητή; Θεωρείτε ότι ισχύουν σε αυτήν την περίπτωση;
Ερώτημα 2 Τώρα καλείστε να εκτιμήσετε εκ νέου το υπόδειγμα με την μέθοδο των βοηθητικών μεταβλητών (IV). α. Να γράψετε την διαρθρωτικό (αρχικό) υπόδειγμα και τα δύο στάδια της 2SLS με την μορφή εξισώσεων. β. Να γράψετε την εντολή της 2SLS που θα πρέπει να χρησιμοποιηθεί στο STATA. γ. Παρακάτω δίνονται τα αποτελέσματα της εντολής από το (β). Σε τι ακριβώς αντιστοιχούν;. ivreg lwage exper black married reg661 reg662 reg663 reg664 reg665 reg666 reg667 (educ=nearc4) Instrumental variables (2SLS) regression F( 11, 2991) = 37.51 Model -136.974668 11-12.4522426 Prob > F = 0.0000 Residual 727.93582 2991.243375399 R-squared =. Adj R-squared =. Total 590.961151 3002.196855813 Root MSE =.49333 lwage Coef. Std. Err. t P> t [95% Conf. Interval] educ.2380396.0466674 5.10 0.000.1465361.3295431 exper.1006818.0193032 5.22 0.000.062833.1385306 black -.0229738.0457791-0.50 0.616 -.1127356.066788 married -.0219909.0055398-3.97 0.000 -.0328531 -.0111288 reg661 -.0371688.0513919-0.72 0.470 -.1379359.0635983 reg662.0745371.0375693 1.98 0.047.0008728.1482015 reg663.1121733.0371927 3.02 0.003.0392474.1850993 reg664 -.0213335.0477442-0.45 0.655 -.1149483.0722814 reg665.0076103.049558 0.15 0.878 -.0895609.1047816 reg666.0201673.0589705 0.34 0.732 -.0954595.135794 reg667 -.0060178.0503464-0.12 0.905 -.104735.0926993 _cons 2.23399.8286135 2.70 0.007.6092801 3.8587 Instrumented: educ Instruments: exper black married reg661 reg662 reg663 reg664 reg665 reg666 reg667 nearc4 δ. Ποια η στατιστική σημαντικότητα του υποδείγματος; Σχολιάστε σύντομα την επίδραση των ερμηνευτικών μεταβλητών του υποδείγματος στην lwage συγκριτικά με τα αποτελέσματα από την παλινδρόμηση OLS:
. esttab OLS IV (1) (2) lwage lwage educ 0.0764*** 0.238*** (21.51) (5.10) exper 0.0343*** 0.101*** (15.08) (5.22) black -0.158*** -0.0230 (-8.44) (-0.50) married -0.0331*** -0.0220*** (-9.49) (-3.97) reg661-0.0872* -0.0372 (-2.30) (-0.72) reg662 0.0231 0.0745* (0.87) (1.98) reg663 0.0544* 0.112** (2.13) (3.02) reg664-0.0834* -0.0213 (-2.45) (-0.45) reg665-0.117*** 0.00761 (-4.41) (0.15) reg666-0.128*** 0.0202 (-4.08) (0.34) reg667-0.118*** -0.00602 (-3.95) (-0.12) _cons 5.101*** 2.234** (74.30) (2.70) N 3003 3003 t statistics in parentheses * p<0.05, ** p<0.01, *** p<0.001
Ερώτημα 3 Παρακάτω προχωρούμε στην εκτίμηση των 2 σταδίων της 2SLS στο STATA χωρίς να χρησιμοποιήσουμε την εντολή ivregress. α. Μελετήστε και εξηγήστε ποια είναι τα στάδια που ακολουθήθηκαν.. reg educ exper black married reg661 reg662 reg663 reg664 reg665 reg666 reg667 nearc4 F( 11, 2991) = 246.51 Model 10231.3619 11 930.123812 Prob > F = 0.0000 Residual 11285.5179 2991 3.77315876 R-squared = 0.4755 Adj R-squared = 0.4736 Total 21516.8798 3002 7.16751492 Root MSE = 1.9425 educ Coef. Std. Err. t P> t [95% Conf. Interval] exper -.4089221.0089463-45.71 0.000 -.4264636 -.3913807 black -.8602601.0947222-9.08 0.000-1.045987 -.6745329 married -.0684014.0178068-3.84 0.000 -.1033161 -.0334866 reg661 -.3314666.1942307-1.71 0.088 -.7123059.0493727 reg662 -.3665937.1361857-2.69 0.007 -.6336208 -.0995666 reg663 -.3403751.130913-2.60 0.009 -.5970637 -.0836865 reg664 -.3156232.1746818-1.81 0.071 -.6581318.0268854 reg665 -.6812699.1356107-5.02 0.000 -.9471695 -.4153703 reg666 -.7407676.1629856-4.54 0.000-1.060343 -.4211924 reg667 -.5937166.1532305-3.87 0.000 -.8941644 -.2932688 nearc4.4368212.0802661 5.44 0.000.2794389.5942035 _cons 17.38557.1538118 113.03 0.000 17.08398 17.68716. predict educhat (option xb assumed; fitted values) (7 missing values generated)
. reg lwage educhat exper black married reg661 reg662 reg663 reg664 reg665 reg666 reg667 F( 11, 2991) = 55.65 Model 100.407369 11 9.1279426 Prob > F = 0.0000 Residual 490.553782 2991.164009957 R-squared = 0.1699 Adj R-squared = 0.1669 Total 590.961151 3002.196855813 Root MSE =.40498 lwage Coef. Std. Err. t P> t [95% Conf. Interval] educhat.2380396.0383099 6.21 0.000.1629232.3131559 exper.1006818.0158462 6.35 0.000.0696112.1317523 black -.0229739.0375807-0.61 0.541 -.0966604.0507127 married -.0219909.0045477-4.84 0.000 -.0309078 -.0130741 reg661 -.0371688.0421883-0.88 0.378 -.1198897.0455521 reg662.0745371.0308411 2.42 0.016.0140652.1350091 reg663.1121734.030532 3.67 0.000.0523075.1720392 reg664 -.0213335.0391938-0.54 0.586 -.098183.0555161 reg665.0076103.0406828 0.19 0.852 -.0721587.0873794 reg666.0201673.0484096 0.42 0.677 -.0747522.1150867 reg667 -.0060178.04133-0.15 0.884 -.087056.0750203 _cons 2.233991.6802189 3.28 0.001.9002463 3.567735 β. Ξαναδείτε τους πίνακες από τα ερωτήματα 2 και 3. Ποια βασική διαφορά στα αποτελέσματα παρατηρείτε συγκρίνοντας τους 2 διαφορετικούς τρόπους εκτίμησης με IV που ακολουθήσαμε στο STATA; STATA CODE use filename reg depvar indepvars hettest ivreg depvar varlist1 (varlist2= varlistiv) example: ivreg y1 x1 x2 (y2= z1 z2)