ΟΙΚΟΝΟΜΕΤΡΙΑ Βιολέττα Δάλλα Τµήµα Οικονοµικών Επιστηµών Εθνικό και Καποδιστριακό Πανεπιστήµιο Αθηνών 1
Εισαγωγή Οικονοµετρία (Econometrics) είναι ο τοµέας της Οικονοµικής επιστήµης που περιγράφει και αναλύει οικονοµικά συστήµατα µε τη χρήση στατιστικών µεθόδων. Οι βασικοί σκοποί της Οικονοµετρίας είναι Να βρεθούν και να ποσοτικοποιήθουν αιτιακές σχέσεις µεταξύ οικονοµικών µεταβλητών, π.χ. αν το εισόδηµα µειωθεί κατά πόσο µεταβάλλεται η κατανάλωση, αν το εισόδηµα εξαρτάται από το φύλο. Να γίνουν προβλέψεις οικονοµικών µεταβλητών, π.χ. ποιο θα είναι το ΑΕΠ το επόµενο τρίµηνο, πόσο θα µεταβληθεί η ανεργία τα επόµενα δύο έτη. Το βασικότερο εργαλείο στην Οικονοµετρία είναι η Ανάλυση Παλινδρόµησης (Regression Analysis). 2
Ανάλογα µε την πηγή, τα στατιστικά στοιχεία ή δεδοµένα χωρίζονται σε Πειραµατικά δεδοµένα (experimental data) Παρατηρήσιµα δεδοµένα (observational data) Ανάλογα µε την µεταβλητή, οι βασικές κατηγορίες δεδοµένων είναι Διαστρωµατικά δεδοµένα (cross-sectional data), π.χ. η εκπαίδευση 100 ατοµών. Δεδοµένα χρονολογικών σειρών (time series data), π.χ. το µηνιαίο επιτόκιο για τη χρονική περίοδο Ιανουάριος 2000-Δεκέµβριος 2006. Μεικτά δεδοµένα (panel data), π.χ. το ετήσιο εισόδηµα 5 ατόµων για τη χρονική περίοδο 2000-2005. 3
Παράδειγµα διαστρωµατικών δεδοµένων 4
Παράδειγµα δεδοµένων χρονολογικής σειράς 5
Παράδειγµα διαστρωµατικών δεδοµένων 6
Γραµµικό υπόδειγµα πολυµεταβλητής παλινδρόµησης Y είναι η εξαρτηµένη µεταβλητή (dependent variable). X 1,..., X K είναι οι ανεξάρτητες ή ερµηνευτικές µεταβλητές (independent variables or regressors). Δείγµα µέγεθους T για την εξαρτηµένη µεταβλητή Y 1,..., Y T και για κάθε ανεξάρτητη µεταβλήτη X 1j,..., X T j, j = 1,..., K. Το γραµµικό υπόδειγµα πολυµεταβλητής παλινδρόµησης (multiple linear regression model) Y t = β 0 + β 1 X t1 +... + β K X tk + u t, t = 1,..., T β 0, β 1,..., β K είναι οι συντελεστές παλινδρόµησης (regression coefficients). 7
β 0 είναι ο σταθερός όρος (intercept) και β 1,..., β K είναι οι συντελεστές κλίσεις (slope coefficients). β 0 + β 1 X 1 +... + β K X K είναι η γραµµή παλινδρόµησης (regression line). u t, t = 1,..., T είναι ο διαταρακτικός όρος ή σφάλµα (disturbance term or error). Για K = 1 έχουµε το απλό γραµµικό υπόδειγµα παλινδρόµησης (simple linear regression model). 8
Συµβολισµός µε πίνακες: Y = Xβ + u όπου Y = Y 1. Y T, X = 1 X 11... X 1K... 1 X T 1... X T K = X 1. X T, β = β 0 β 1. β K, u = u 1. u T. Σηµείωση: Αν δεν υπαρχεί σταθερός όρος β 0, τότε αφαιρείτε η πρώτη στήλη του πίνακα X. 9
Βασικές υποθέσεις Α.1 Y t = β 0 + β 1 X t1 +... + β K X tk + u t, t = 1,..., T, είναι το σωστό υπόδειγµα και E(u t ) = 0, t = 1,..., T. Α.2 Δεν υπάρχουν ακριβής γραµµικές σχέσεις µεταξύ των X 1,..., X K και T > K + 1. Α.3 Οι X 1,..., X K είναι µη στοχαστικές. Α.4 Ισχύει ότι V (u t ) = σ 2, t = 1,..., T και Cov(u t, u s ) = 0, t, s = 1,..., T, t s. Α.5 u t, t = 1,..., T ακολουθούν την κανονική κατανοµή. 10
Βασικές υποθέσεις µε συµβολισµό πινάκων Α.1 Y = Xβ + u είναι το σωστό υπόδειγµα και E(u) = 0. Α.2 X είναι πλήρους βαθµού και T > K + 1. Α.3 X είναι µη στοχαστικός. Α.4 Ισχύει ότι V (u) = σ 2 I. Α.5 u ακολούθει την κανονική κατανοµή. 11
Ερµηνεία συντελεστών παλινδρόµησης Από τις υποθέσεις Α.1-Α.4 ισχύει ότι και άρα E (Y t ) = β 0 + β 1 X t1 +... + β K X tk β j = E (Y t), j = 1,..., K X tj Ο συντελεστής κλίσης β j µετράει τη µεταβολή στη µέση τιµή της εξαρτηµένης µεταβλητής Y όταν η ερµηνευτική µεταβλητή X j µεταβληθεί κατά 1 µονάδα, ενώ οι υπόλοιπες ερµηνευτικές µεταβλητές παραµείνουν σταθερές. Ο σταθερός όρος β 0 µετράει τη µέση τιµή της εξαρτηµένης µεταβλητής Y όταν όλες οι ερµηνευτικές µεταβλητές X 1,..., X K παίρνουν τη τιµή 0. 12
Μέθοδος ελαχίστων τετραγώνων (OLS) Ελαχιστοποιούµε ως προς β το άθροισµα των τετραγώνων S( β) = T ( ) Yt β 0 β 1 X t1... β ( 2 K X tk = Y X β ) ( Y Xβ ) t=1 Από τη συνθήκη πρώτου βαθµού βρίσκουµε τις κανονικές εξισώσεις (normal equations) Αν η υπόθεση Α.2 ισχύει, έχουµε Η συνθήκη δεύτερου βαθµού δίνει (X X ) β = X Y β = ( X X ) 1 X Y d 2 S( β) dβ 2 = 2X X > 0 13
Ο εκτιµητής ελαχίστων τετραγώνων OLS (ordinary least squares) του β είναι β = ( X X ) 1 X Y Οι υπολογισµένες τιµές (fitted values) είναι Τα κατάλοιπα (residuals) είναι Y = Xβ û = Y Y Ισχύει ότι û = 0 και X û = 0 Ο OLS εκτιµητής του σ 2 είναι s 2 = 1 T K 1 T û 2 t t=1 14
Ο OLS εκτιµητής του πίνακα διακυµάνσεων-συνδιακυµάνσεων του β είναι V ( β ) = s 2 ( X X ) 1 Το τυπικό σφάλµα (standard error) του εκτιµητή β j είναι s β j = s 2 [ (X X) 1] j+1,j+1 όπου [ (X X) 1] j+1,j+1 είναι το j + 1 διαγώνειο στοιχείο του (X X) 1. Το τυπικό σφάλµα είναι ένας εκτιµητής της τυπικής απόκλισης του εκτιµητή β j. Γενικά, η διακύµανση του εκτιµητή β j µειώνεται όταν Το µέγεθος του δείγµατος αυξάνεται. Η διακύµανση της ερµηνευτικής µεταβλητής X j αυξάνεται. Η συσχέτιση µεταξύ της ερµηνευτικής µεταβλητής X j και των υπολοίπων ερµηνευτικών µεταβλητών µειώνεται. Η διακύµανση του σφάλµατος u µειώνεται. 15
Το συνολικό άθροισµα των τετραγώνων (total sum of squared SST) είναι SST = T t=1 (Y t Y ) 2 Το άθροισµα των τετραγώνων της παλινδρόµησης (explained sum of squared SSR) είναι SSR = T t=1 ( Y t Y ) 2 Το άθροισµα των τετραγώνων των καταλοίπων (sum of squared residuals SSE) είναι SSE = T t=1 û 2 t = û û Ισχύει ότι SST = SSR + SSE 16
Ο συντελεστής προσδιορισµού (coefficient of determination) R 2 είναι R 2 = SSR SST = 1 SSE SST Μετράει το ποσοστό της µεταβλητότητας της εξαρτηµένης µεταβλητής που ερµηνεύεται από τη γραµµική παλινδρόµηση. Ισχύει ότι 0 R 2 1. Γενικά, ο R 2 δεν µειώνεται όταν το µέγεθος του δείγµατος T ή ο αριθµός των ερµηνευτικών µεταβλητών K αυξάνεται. Ο R 2 δεν είναι κατάλληλο µέτρο σύγκρισης υποδειγµάτων που έχουν διαφορετικό αριθµό ερµηνευτικών µεταβλητών. 17
Ο διορθωµένος συντελεστής προσδιορισµού (adjusted coefficient of determination) R 2 είναι R 2 = 1 SSE/(T K 1) SST /(T 1) Ισχύει ότι R 2 1 και o R 2 µπορεί να πάρει αρνητικές τιµές. Ισχύει ότι R 2 < R 2 και ισχύει ότι R 2 = R 2 µόνο όταν R 2 = 1 ή όταν T. Ο R 2 λαµβάνει υπόψη το µέγεθος του δείγµατος T και τον αριθµό των ερµηνευτικών µεταβλητών K. Ο R 2 είναι κατάλληλο µέτρο σύγκρισης υποδειγµάτων που έχουν διαφορετικό αριθµό ερµηνευτικών µεταβλητών. 18
Στατιστικές ιδιότητες πεπερασµένων δειγµάτων των β, s 2 και V ( β ) 1. Αν οι Α.1-Α.3 ισχύουν, ο β είναι αµερόληπτος εκτιµητής του β. 2. Αν οι Α.1-Α.4 ισχύουν, ο πίνακας διακυµάνσεων-συνδιακυµάνσεων του β είναι ο V ( β ) = σ 2 (X X) 1. 3. Θεώρηµα Gauss-Markov: Αν οι Α.1-Α.4 ισχύουν, ο β είναι ο άριστος, γραµµικός και αµερόληπτος εκτιµήτης του β. 4. Αν οι Α.1-Α.4 ισχύουν, ο s 2 είναι αµερόληπτος εκτιµητής του σ 2. 5. Αν οι Α.1-Α.4 ισχύουν, ο V ( β ) είναι αµερόληπτος εκτιµητής του V ( β ). 6. Αν οι Α.1-Α.5 ισχύουν, β~n ( β, σ 2 (X X) 1), (T K 1) s2 σ ~χ 2 2 T K 1 β, s 2 είναι ανεξάρτητοι. 7. Αν οι Α.1-Α.5 ισχύουν ο β είναι άριστος αµερόληπτος εκτιµητής του β. και οι 19