מבוא לאקונומטריקה 57322

Σχετικά έγγραφα
פתרון תרגיל מרחבים וקטורים. x = s t ולכן. ur uur נסמן, ur uur לכן U הוא. ur uur. ur uur

פתרון תרגיל 8. מרחבים וקטורים פרישה, תלות \ אי-תלות לינארית, בסיס ומימד ... ( ) ( ) ( ) = L. uuruuruur. { v,v,v ( ) ( ) ( ) ( )

פתרון תרגיל 5 מבוא ללוגיקה ותורת הקבוצות, סתיו תשע"ד

תרגיל 13 משפטי רול ולגראנז הערות

חורף תש''ע פתרון בחינה סופית מועד א'

= 2. + sin(240 ) = = 3 ( tan(α) = 5 2 = sin(α) = sin(α) = 5. os(α) = + c ot(α) = π)) sin( 60 ) sin( 60 ) sin(

יסודות לוגיקה ותורת הקבוצות למערכות מידע (סמסטר ב 2012)

שדות תזכורת: פולינום ממעלה 2 או 3 מעל שדה הוא פריק אם ורק אם יש לו שורש בשדה. שקיימים 5 מספרים שלמים שונים , ראשוני. שעבורם

תרגול 1 חזרה טורי פורייה והתמרות אינטגרליות חורף תשע"ב זהויות טריגונומטריות

x = r m r f y = r i r f

1 תוחלת מותנה. c ארזים 3 במאי G מדיד לפי Y.1 E (X1 A ) = E (Y 1 A )

תרגול מס' 6 פתרון מערכת משוואות ליניארית

לדוגמה: במפורט: x C. ,a,7 ו- 13. כלומר בקיצור

ניהול תמיכה מערכות שלבים: DFfactor=a-1 DFt=an-1 DFeror=a(n-1) (סכום _ הנתונים ( (מספר _ חזרות ( (מספר _ רמות ( (סכום _ ריבועי _ כל _ הנתונים (

הסקה סטטיסטית/תקציר/תלמה לויתן

ל הזכויות שמורות לדפנה וסטרייך

Logic and Set Theory for Comp. Sci.

[ ] Observability, Controllability תרגול 6. ( t) t t קונטרולבילית H למימדים!!) והאובז' דוגמא: x. נשתמש בעובדה ש ) SS rank( S) = rank( עבור מטריצה m

קורס: מבוא למיקרו כלכלה שיעור מס. 17 נושא: גמישויות מיוחדות ושיווי משקל בשוק למוצר יחיד

תרגול פעולות מומצאות 3

לוגיקה ותורת הקבוצות פתרון תרגיל בית 8 חורף תשע"ו ( ) ... חלק ראשון: שאלות שאינן להגשה נפריד למקרים:

מתכנס בהחלט אם n n=1 a. k=m. k=m a k n n שקטן מאפסילון. אם קח, ניקח את ה- N שאנחנו. sin 2n מתכנס משום ש- n=1 n. ( 1) n 1

טושפ הרעשה ןחבמ t ןחבמ

משוואות רקורסיביות רקורסיה זו משוואה או אי שוויון אשר מתארת פונקציה בעזרת ערכי הפונקציה על ארגומנטים קטנים. למשל: יונתן יניב, דוד וייץ

דף פתרונות 7 נושא: תחשיב הפסוקים: צורה דיסיונקטיבית נורמלית, מערכת קשרים שלמה, עקביות

The No Arbitrage Theorem for Factor Models ג'רמי שיף - המחלקה למתמטיקה, אוניברסיטת בר-אילן

אינפי - 1 תרגול בינואר 2012

גבול ורציפות של פונקציה סקלרית שאלות נוספות

- הסקה סטטיסטית - מושגים

gcd 24,15 = 3 3 =

אקונומטריקה ד"ר חמי גוטליבובסקי סמסטר א' תש "ע

תרגילים בנושא משתנה דמי:

{ } { } { A חוקי דה-מורגן: הגדרה הסתברות מותנית P P P. נוסחת בייס ) :(Bayes P P נוסחת ההסתברות הכוללת:

גמישויות. x p Δ p x נקודתית. 1,1

תרגיל 7 פונקציות טריגונומטריות הערות

c ארזים 26 בינואר משפט ברנסייד פתירה. Cl (z) = G / Cent (z) = q b r 2 הצגות ממשיות V = V 0 R C אזי מקבלים הצגה מרוכבת G GL R (V 0 ) GL C (V )

x a x n D f (iii) x n a ,Cauchy

קיום ויחידות פתרונות למשוואות דיפרנציאליות

{ : Halts on every input}

לוגיקה ותורת הקבוצות פתרון תרגיל בית 4 אביב תשע"ו (2016)

I. גבולות. x 0. מתקיים L < ε. lim אם ורק אם. ( x) = 1. lim = 1. lim. x x ( ) הפונקציה נגזרות Δ 0. x Δx

סיכום בנושא של דיפרנציאביליות ונגזרות כיווניות

אלגברה לינארית (1) - פתרון תרגיל 11

צעד ראשון להצטיינות מבוא: קבוצות מיוחדות של מספרים ממשיים

סיכום- בעיות מינימוםמקסימום - שאלון 806

אלגברה ליניארית (1) - תרגיל 6

אלגברה מודרנית פתרון שיעורי בית 6

הרצאה. α α פלוני, וכדומה. הזוויות α ל- β שווה ל-

מתמטיקה בדידה תרגול מס' 5

הרצאה 7: CTMC הסתברויות גבוליות, הפיכות בזמן, תהליכי לידה ומוות

התפלגות χ: Analyze. Non parametric test

brookal/logic.html לוגיקה מתמטית תרגיל אלון ברוק

co ארזים 3 במרץ 2016

א הקיטסי ' טטסל אובמ רלדנ הינור בג '

מבחן t לשני מדגמים בלתי תלויים. T test for independent samples

( k) ( ) = ( ) ( ) ( ) ( ) A Ω P( B) P A B P A P B תכונות: A ו- B ב"ת, אזי: A, B ב "ת. בינומי: (ההסתברות לk הצלחות מתוך n ניסויים) n.

סיכום חקירת משוואות מהמעלה הראשונה ומהמעלה השנייה פרק זה הינו חלק מסיכום כולל לשאלון 005 שנכתב על-ידי מאיר בכור

שאלה 1 V AB פתרון AB 30 R3 20 R

פתרון תרגיל 6 ממשוואות למבנים אלגברה למדעי ההוראה.

( )( ) ( ) f : B C היא פונקציה חח"ע ועל מכיוון שהיא מוגדרת ע"י. מכיוון ש f היא פונקציהאז )) 2 ( ( = ) ( ( )) היא פונקציה חח"ע אז ועל פי הגדרת

תשובות מלאות לבחינת הבגרות במתמטיקה מועד ג' תשע"ד, מיום 0/8/0610 שאלונים: 315, מוצע על ידי בית הספר לבגרות ולפסיכומטרי של אבירם פלדמן

הרצאה תרגילים סמינר תורת המספרים, סמסטר אביב פרופ' יעקב ורשבסקי

אוסף שאלות מס. 3 פתרונות

פתרונות , כך שאי השוויון המבוקש הוא ברור מאליו ולכן גם קודמו תקף ובכך מוכחת המונוטוניות העולה של הסדרה הנתונה.

אלגברה ליניארית 1 א' פתרון 2

לדוגמא : dy dx. xdx = x. cos 1. cos. x dx 2. dx = 2xdx לסיכום: 5 sin 5 1 = + ( ) הוכחה: [ ] ( ) ( )

בסל A רמת התועלת היא: ) - השקה: שיפוע קו תקציב=שיפוע עקומת אדישות. P x P y. U y P y A: 10>6 B: 9>7 A: 5>3 B: 4>3 C: 3=3 C: 8=8 תנאי שני : מגבלת התקציב

Charles Augustin COULOMB ( ) קולון חוק = K F E המרחק סטט-קולון.

c ארזים 15 במרץ 2017

ןמנירג ןואל \ הקיטסיטטס הקיטסיטטסב הרזח ה יפד ךותמ 14 דו 1 מע

רשימת משפטים והגדרות

תורת המחירים ב' 57308

החשמלי השדה הקדמה: (אדום) הוא גוף הטעון במטען q, כאשר גוף B, נכנס אל תוך התחום בו השדה משפיע, השדה מפעיל עליו כוח.

תרגול מס' 1 3 בנובמבר 2012

מתמטיקה בדידה תרגול מס' 12

מבוא לאקונומטריקה א' החוג לכלכלה

מבני נתונים ואלגוריתמים תרגול #11

שעה 0 חשיבה כמותית, שיטות מחקר כמותיות, רקע, כלי מחקר, מגבלות. שעה - 2 שיטות דגימה, דגימה אקראית, דגימה שיטתית ויעילות הדגימה.

טענה חשובה : העתקה לינארית הינה חד חד ערכית האפס ב- הוא הוקטור היחיד שמועתק לוקטור אפס של. נקבל מחד חד הערכיות כי בהכרח.

אלגוריתמים ללכסון מטריצות ואופרטורים

תורת ההסתברות 1 יובל קפלן סיכום הרצאות פרופ יורי קיפר בקורס "תורת ההסתברות 1" (80420) באוניברסיטה העברית,

אלגברה ליניארית 1 א' פתרון 7

תדירות הנתונים, שנתיים,annual רבעונים quarterly וכו'. 5 ומשתנה Yהינו 3,6,9,5 ו- 7. נבחר, file-open data-import בשלב זה התוכנה

ההימצאות (או שכיחות) (prevalence) של תכונה שווה. ההארעות (incidence) של תכונה שווה לפרופורציית נתון. = 645/72, או 89 לכל 10,000 אחיות.

מודלים חישוביים תרגולמס 5

פתרון תרגיל בית 6 מבוא לתורת החבורות סמסטר א תשע ז

מתמטיקה בדידה תרגול מס' 2

מבוא ללוגיקה מתמטית 80423

חידה לחימום. כתבו תכappleית מחשב, המקבלת כקלט את M ו- N, מחליטה האם ברצוappleה להיות השחקן הפותח או השחקן השappleי, ותשחק כך שהיא תappleצח תמיד.

תרגול משפט הדיברגנץ. D תחום חסום וסגור בעל שפה חלקה למדי D, ותהי F פו' וקטורית :F, R n R n אזי: נוסחת גרין I: הוכחה: F = u v כאשר u פו' סקלרית:

מתמטיקה בדידה תרגול מס' 13

3-9 - a < x < a, a < x < a

הגדרה: מצבים k -בני-הפרדה

(ספר לימוד שאלון )

ב הקירטמונוקא ל והינ ו הלכל ל כ גוחה

תאריך עדכון אחרון: 27 בפברואר ניתוח לשיעורין analysis) (amortized הוא טכניקה לניתוח זמן ריצה לסדרת פעולות, אשר מאפשר קבלת

PDF created with pdffactory trial version

"קשר-חם" : לקידום שיפור וריענון החינוך המתמטי

יווקיינ לש תוביציה ןוירטירק

תורת ההסתברות 2: (או הסתברות ותהליכים סטוכסטים)

Transcript:

מבוא לאקונומטריקה 57322 חיים שחור סיכומי הרצאות של פרופ' שאול לאך 21 ביוני 2012 5 תכונות אסימפטוטיות של OLS ז' סיון תשע"ב (שעור 1) נרצה לעשות ניתוח כאשר n. יש שתי תכונות עיקריות של :OLS ] [,MLR1 בעיקר = 0 ] k,mlr4 : E [u x 1... x שהובילה לכך MLR4.1 ש.E ˆβj = β j ( ),V ar ˆβj = σ 2 SST j ( 1 R 2 j MLR5 2. הומוסקדסטיות, שהובילה לכך ש (,SST j = n ו j R 2 הוא R 2 מרגרסיה של x j על כל כאשר ) 2 j i=1 (x ij x המשתנים האחרים. בעזרת הנחות 1, 5 יש לנו משפט גאוס מרקוב כי OLS הוא.BLUE βˆ. מכאן ניתן להשתמש במבחני ( ( )) j N β j, var ˆβj גררה כי MLR6 : y x N,t f לבדיקת השערות. למה חשוב ניתוח אסימפטוטי? משתנה נורמלי הוא רציף, יכול לקבל כל ערך אפשרי. משתנים בכלכלה הם לפעמים בדידים, ולפעמים חיוביים ומוגבלים בטווח מסויים. נרצה להראות שבמדגם מאוד גדול הנחה MLR6 לא חשובה, וניתן עדיין להשתמש במבחנים הנ"ל. אם מגדילים את גודל המדגם, למה האומד ישאף? האם βˆ j שואף ל β? j בשביל זה נצטרך לפתח את המונח גבול של אומדים, ואם כן, נאמר שהאומד הוא עקיב (קונסיסטנטי). מה ההבדל בין עקביות לחוסר הטיה? 1

חוסר הטיה של אומד משמעותו שעל פני מספר גדול של מדגמים, הממוצע של האומד הוא האומד האמיתי. נשתמש בסימולציה לבנות מודל פשוט.y = β 0 + β 1 x 1 + u נניח = 2 1.β 0 = 1, β שולפים עבור = 150,n תצפיות מסוג (1) χ2.{x i1, u i } n i=1 מתוך זה בונים את.y = 1 + 2x i + u i מריצים רגרסיה של y על,x ומקבלים אומדים ˆβ 0, ˆβ 1. הנוסחא היא βˆ. בהרצה של 1000 מדגמים של 150 תצפיות, הממוצע הוא מאוד (x1i x 1 ) y i 1 = (x1i x 1 ) 2 קרוב ל 2, והחותך מאוד קרוב ל 1. מספר המדגמים הוא סופי, ולכן זה רק כמעט. אם עושים היסטוגרמה מגלים שרוב הערכים הם סביב 2, אבל יש גם 2.4. βˆ 1 את האומד עבור n תצפיות. (n) האומד תלוי בגודל המדגם n, ולכן נסמן נרצה βˆ j. נרצה למצוא גבול (k+1), ˆβj (k+2) ˆβ1. נסתכל על הסדרה..., (n) לשאול? n לסדרה הזו. יש כאן בעיה מהותית בהגדרה. עד כה היו לנו סדרות של מספרים. כעת יש לנו סדרות של משתנים מקריים. כל אומד הוא מקרי ותלוי במדגם, ולכן עבור ערכים גדולים של n, אולי נקבל ערכים רחוקים מהגבול במדגם מסויים. { } (n) יהי > 0.ε נגדיר.p n = P r ˆβj c < ε נגדיר התכנסות בהסתברות.ε לכל > 0 p n אם 1 ˆβ p j c n n.n עבור = 1, 2, 3 β ˆ(n) בעמ' 4 יש דוגמא של התפלגויות j אם האומד מתכנס בהסתברות לפרמטר האמיתי, נאמר ש βˆ j עקיב ל β. j נרצה להראות אלו הנחות צריך כדי לומר שאומד הוא עקיב..β j עקיב ל ˆβ j אזי,lim n V ar ( ˆβj n ) = ו 0,n לכל E [ ˆβj טענה 5.1 אם (n) ] = β j האם OLS עקיב? [ ] E ˆβj = β j מבטיח כי MLR1 MLR4.1.V ar בהנחה ( ˆβj (n) ) = σ 2 n.2 בעזרת MLR5 נקבל j) i=1 (x ij x j ) 2 ( 1 R 2 השלישית אנחנו שוללים את העובדה ש 1 j R, 2 ולכן ככל ש n, המונה עולה, והשונות שואפת לאפס. בהמשך נראה כי ההנחות הדרושות הן.MLR1 MLR4 נצרכת. ההנחה החמישית אינה 2

סימולציה במחשב: עבור. 10, 000.. 2 =,n מגרילים (1) 2.x i, u i χ מחשבים y. = 1 + 3x + u אם בודקים, בהתחלה יש שונות גדולה, אבל ככל ש n גדל, אנחנו מתכנסים ל 3. אם מסתכלים על הענן בזנב, מקבלים שמעבר ל 9000, הטווחים הם בתוך [3.03,2.97]. למרות שיש לנו התכנסות, עדיין יש פה ושם נקודות שסוטות יותר. ניתן = 1 ˆβ, לכן להמשיך עוד ועוד. (xi1 x 1 ) y i (xi1 x 1 ) u i (x1i x i ) 2 = β 1 + באופן כללי ) 2 i (x1i x [ ].p lim ˆβ (xi1 x 1 ) u i 1 = β 1 + p lim (x1i x i ) 2 i=1 {z i } ב"ת הבאים מאותה התפלגות,i.i.d. ותוחלת לפי חוק המספרים הגדולים, עבור.z 1, z 2,... יש לנו סדרת ממוצעים,z n = 1 n n i=1 z i אזי בחישוב הממוצע.E [z] < לפי חוק המספרים הגדולים, [z].p lim z n = E כעת נחשב את הגבול של המנה, אזי [ ] (xi1 x 1 ) u i p lim (x1i x i ) 2 = p lim 1 n n i=1 (x i1 x 1 ) u i p lim 1 n n i=1 (x i1 x 1 ) 2 = cov (x 1, u) V ar (x 1 ) לכן האומד ˆβ 1 עקיב אם = 0 u).cov (x 1, זה נובע מהנחת MLR4 (ואפילו חלש ממנה).?p lim 1 n איך נחשב את (xi1 x 1 ) u i [u])].cov (x 1, u) = E (x 1 u) E (x 1 ) E (u) = E [(x 1 E [x 1 ]) (u E לפי חוק 1, לכן (xi1 x 1 ) u i = 1 המספרים הגדולים, (xi1 u i ) x 1 u n n p lim 1 n (xi1 x 1 ) u i = p lim 1 n xi1 u i p lim x 1 ū = = p lim 1 n xi1 u i p lim x 1 lim u = = E [x 1 u] E [x 1 ] E [u] = cov (x 1, u) 1 n לפי טריק מס' 1, ומכאן להמשיך אותו (xi x) 2 = 1 n את המכנה (xi x) x i.p lim 1 n דבר. בעזרת [X] 2 p lim x 2 = (p lim x 2 ) = E ו [ x 2 = p lim x 2 = E [x 2 י' סיון תשע"ב (שעור 2) הוכחנו שאם האומד חסר הטיה, הוא יהיה עקיב, וזה מתקיים תחת הנחות 4 1. נתנו הוכחה למודל הפשוט,y = β 0 + β 1 x 1 + u והראינו כי. ˆβ (xi1 x 1 ) y i p 1 = (xi1 x 1 ) 2 β1 + cov (x 1, u) V ar (x 1 ) 3

נרצה לדעת האם השאיפה היא עם סטייה חיובית או שלילית. המכנה הוא שונות, ולכן תמיד חיובי. נרצה לתת "ניחוש מלומד" על (u.cov x) 1, קשה לדעת מה זה u בדיוק, לכן ניתן דוגמא ספציפית. אפשר לקבל את הרושם המוטעה שבמודל כללי יותר,y = β 0 + β i x i + u התנאי ל p lim ˆβ j = β j הוא גם כן u),cov (x j, אבל זה לא מספיק. דרוש שלכל i יתקיים u).cov (x i, זה עדיין נגרר ע"י הנחה E [u x 1,... x k ] = 0,MLR4 שהיא אפילו חזקה יותר (אי תלות בתוחלת חזקה מחוסר מתאם). הדוגמא שלנו תהיה השמטת משתנה. נניח,y = β 0 + β 1 x 1 + β 2 x 2 + v תחת MLR4 כי = 0 ] 2.E [v x 1, x אם נריץ רגרסיה נקבל ˆβ 0, ˆβ 1, ˆβ 2 עקיבים. אם אין נתונים על x, 2 נריץ רק על x 1 ונקבל 1 βˆ. בשלב זה x 2 הופך להיות חלק מהטעות. נשים לב כי cov (x 1, u) = cov (x 1, β 2 x 2 + v) = β 2 cov (x 1, x 2 )+cov (x 1, v) = (by MRL4 :) β 2 cov (x 1, x 2 ) u).p lim ˆβ 1 = β 1 + cov (x 1, כעת אני יכול לדבר על = β 1 + β 2cov (x 1, x 2 ) לכן V ar (x 1 ) V ar (x 1 ) הנחות על המקדם של β, 2 ועל המתאם ) 2 cov x) 1, x כדי לדעת האם האומדן נוטה כלפי מעלה או כלפי מטה. גם אם β 2 לא מעניין אותי, הוא מעניין כדי לא לקלקל את האומדן של β. 1 נשים לב שהנוסחה מתאימה להשמטת משתנה, לא למקרה הכללי. הנחת M LR6 (נורמליות) היא בעייתית כי לא תמיד הערכים המתקבלים חוקיים. הרווחנו מההנחה את היכולת להשתמש בסטטיסטי t או f. אם ) 2 u, N,0) σ אזי y = β 0 + β 1 x 1 + u יהיה בעל התפלגות שתלויה ב x וב y. אבל E [y] = β 0 + β 1 E [x] + E [u] V ar (y) = β1v 2 ar (x 1 ) + V ar (u) + 2β 1 cov (x 1, u) E [y x 1 = x o 1] = β 0 + β 1 x o 1 + E [u x 1 = x o 1] V ar (y x 1 ) = V ar (u x 1 ) לכן )) 1,y x 1 N (β 0 + β 1 x 1, V ar (u x ובמקרה של MLR5 אנחנו מקבלים.y x 1 N (β 0 + β 1 x 1, σ 2 ) אם לא מניחים את,MLR6 אזי בבדיקת השערה של H, 0 : β 1 = β1 o אנחנו מקבלים f. ובאופן דומה לא ניתן להשתמש בסטטיסטי t = ˆβ 1 β1 o ( ) t n k 1 V ar ˆβ1 4

ניתוח אסימפטוטי בא לפתור את הבעיה הזו. הניתוח אומר שתחת ההנחות MLR1. לכן ניתן להמשיך ˆβ 1 β1 o ( ) a N (0, 1) אנו מקבלים n כאשר,MLR4 V ar ˆβ1 לומר כי (1,0) N t כשמשתמשים ב n גדול, ובאופן דומה לסטטיסטי f. בעזרת מהפכת המחשוב יש לנו הרבה נתונים במקרים גדולים. היום 6 פונקציית המודל הליניארי 6.1 שינוי ביחידות המדידה של x ו y לפעמים אנחנו משנים את היחידות, למשל מעבר מסיגריות לחפיסות וכד'. זה לא משנה את המודל, אבל נראה שזה משפיע על האומדים והשונויות שלהם. דוגמא: מחיר דירה ביחס לרמת השכונה ומספר החדרים. אם מריצים רגרסיה מקבלים שכל חדר מוסיף $ 8200 למחיר. מה יקרה אם מחשבים את המחיר באלפי דולרים? האומד צריך להשתנות ל 8.2 (וכל המקדמים מתחלקים באלף). סטיית התקן מתחלקת גם היא, והסטטיסטי t, ו R 2 לא השתנו. גם המשמעות של המודל לא השתנתה. נניח כי המודל המקורי הוא.y = β 0 + β 1 x 1 + u אנו רוצים לעבור ל y,ỹ = d. ˆ β1 = t = ו x 1 = cx 1 עבור > 0 d.c, אם נריץ רגרסיה של ỹ על x 1, נקבל y = β 0 + β 1 x 1 + u ỹ d = β x 1 0 + β 1 c + u ỹ = dβ 0 + dβ 1 x 1 + ũ c = β 0 + β 1 x 1 + ũ המטרה היא לבצע טרנספורמציות של המשוואה המקורית כדי לקבל את ỹ ו x. V ( ) x1i x 1 ỹ1 ( ) 2 x1i x 1 d ˆ β 1 ( ) = ˆ β1 d c c ˆβ 1 V אם רק y משתנה (1 = c), כל המקדמים מוכפלים ב d. אם x 1 משתנה 1) =,(d רק המקדם β 1 מוכפל ב c. = cd (x1i x 1 ) y 1 נסתכל על האומדים: c 2 (x 1i x 1 ) 2 = d c ˆβ 1 ( ˆβ1 ) = t לכן הסטטיסטי,V ar ( ˆ β1 ) = 5 ( ) 2 d ( ) V ar ˆβ1 c

לא השתנה. רווח הסמך משתנה גם הוא בהתאם לשינוי בסטיית התקן. R 2 לא משתנה (להוכיח בבית מהנוסחא לחישוב השאריות). כי,ũ = du לכן גם ˆũ = dû ˆũ. R 2 i = 1 (ỹi ỹ) 2 = 1 d 2 û i d 2 (y i ȳ) 2 = R2 מה קורה במודל?ln y = β 0 + β 1 x 1 + u אם נשנה,ỹ = dy נקבל ln ỹ = ln y + ln d = d + β 0 + β 1 x 1 + u לכן כלומר החותך השתנה, אבל לא שאר האומדים. לכן אם משתנה מופיע בלוג במשוואה, הכפלתו משפיעה רק על החותך. אם יש לי משוואה של,ln y = β 0 + β 1 ln x 1 + u שינוי של יחידות x 1 לא ישנה את האומד (גמישות לא תלויה ביחידות). נניח שאנו רוצים להוסיף את אחוז האנשים באוכלוסיה עם מצב סוציו אקונומי נמוך. אפשר למדוד 12% כ 12, או כ 0.12. למשל אם מעלים את האחוז בנקודה אחת, המחיר יורד ב 583$. אם נבדוק כמספר, נקבל מקדם של,58. 300 המשמעות אותה משמעות, אבל צריך להיזהר בהבנה שלה. 6.2 מדד R 2 מתוקן י"ד סיון תשע"ב (שעור 3) R 2 û2 0. זהו מדד מטעה. בעבר השתמשו יותר מדי במדד = 1 (yi ȳ) 2 1 הזה, ושאפו לקבל R 2 גבוה ככל הניתן. בעיקרון R 2 מסביר עד כמה ה x מסבירים את השונות של y. בקורס שלנו, המטרה שלנו היא למדוד את האפקט של x על y. בעיקר אם מדובר במשתנים מסבירים שניתן לשנות אותם כדי לקבל תוצאה שונה. בד"כ מעניינת אותי המטרה של משתנה ספציפי. והדגש של R 2 הוא לא כ"כ חשוב. כיום הרבה עבודות מציגות רגרסיות עם R 2 נמוך (של 2). 5% אם היינו רוצים למקסם את R, 2 היינו רוצים להוסיף עוד ועוד משתנים מסבירים. זה מפתה להכניס כל מיני דברים שאין בהם תועלת מלבד העלאת R. 2 בשביל זה המציאו 1. במצב זה, אם מגדילים את k, û2 /n k 1 את מדד.R2 המדד הוא 1 /n (yi ȳ) 2 המונה עולה, והסך הכל יורד. במצב כזה המדד אומר לי יותר הצלחתי להגיע ל R 2 גבוה בלי להוסיף מלא משתנים..corr (y, ŷ) הוא ריבוע של R 2 טענה 6.1 6

בכל אופן, כיום פחות מסתכלים על ה R, 2 ומתמקדים בשאלה האם הפרמטרים נאמדו בצורה נכונה. 6.3 צורה פונקציונלית של המודל אנחנו מזכירים את המילה "ליניארי" בכמה מקומות:.1 מודל הרגרסיה הלינארית. משוואה מסוג.(1) y = β 0 + β 1 x 1 + u 2. קשר לינארי בין x ל y. הוא אומד לינארי ב y. OLS 3. גם אם יש לנו מודל של y, = e β β+0 1 x 1 u+ אנחנו יכולים להשתמש במודל הלינארי עבור.(2) ln y = β 0 + β 1 x 1 + u.(3)ln y = β 0 + β 1 ln x 1 + ניתן לכתוב כ u y = e β 0 x β 1 את המודל 1 e u מה המשמעות של כל אחד מהמקדמים. במודל הליניארי, אנחנו מניחים כי התוספת השולית של כל משתנה היא קבועה, והמשמעות של המקדם הוא שיעור התוספת השולית. במודל השני, המשמעות הכלכלית של המקדם הוא בכמה אחוזים המשתנה המוסבר יעלה, כשהמשתנה המסביר עולה ביחידה..x במודל השלישי, אנו מודדים את הגמישות תוספת של אחוז למשתנה המסביר, בכמה אחוזים היא תעלה את המשתנה המוסבר. אם, d ln y = β 1 כשנריץ את מודל (2), ונרצה לתת את התוספת האבסולוטית, נקבל dx 1 d ln y y כי y = β 1 y. נהוג לבחור את הממוצע של y או את הממוצע של מ x 1 y בדוגמאות יש לנו רגרסיה של השכר לעומת ההשכלה בשלושת המודלים. באופן דומה אם רוצים לתרגם את הגמישות לתוספת אבסולוטית. הרבה פעמים, משתנים בני מניה, לא מומלץ להמיר אותם עם.log בד"כ אנחנו לא נדבר על כמה מוסיף לי עוד 10% של שנות לימוד. באופן דומה, כשמדובר על אחוזים באוכלוסיה זה עשוי להיות מאוד מבלבל. דרך אחרת לחמוק מהמודל הליניארי הנוקשה (תוספת שולית קבועה), היא להשתמש בפולינום,y = β 0 + β 1 x 1 + β 2 x 2 1 + u או אינטראקציות של המשתנים המסבירים 7.y = β 0 + β 1 x 1 + β 2 x 2 + β 3 x 1 x 2 + u

השאלה הקשה היא מהו המודל הנכון לבחור. הדרך הכי נכונה היא להתבסס על מודל כלכלי שמבוסס בתיאוריה. הבעיה היא שהרבה פעמים אנחנו קופצים לאמצע, והמטרה היא לאפשר כמה שיותר גמישות למודל..y = Ak β 1 אם נוציא log נקבל L β 2 דוגמא: פונקציית ייצור קוב דאגלס e u.ln y = ln A+β 1 ln K +β 2 ln L+u התפוקות השוליות אינן קבועות, אבל הגמישויות β. 1 = d ln y איך נאפשר גמישות לא קבועה? ניתן להכניס משתנים נוספים קבועות d ln k. d ln y כמו.ln y = β 0 + β 1 ln k + β 2 ln l + β 3 (ln k) 2 + u עכשיו d ln k = β 1 + 2β 3 ln k אפשר גם להוסיף ln k ln l ולקבל גמישות שהיא פונקציה של l. אח"כ ניתן לבצע בדיקת השערות של מבחן t איזה מקדם כנראה שווה לאפס. 8 הטרוסקדסטיות הנחת הומוסקדסטיות M LR5 נתנה לנו נוסחא לחישוב השונות: ( ) V ar ˆβj = σ 2 (xij x j ) ( 1 R 2 j) הדבר השני, הוא הוכחה של משפט גאוס מרקוב. V ar (u i x i1,..., x ik ) = σi (אין כאן הנחה. אם ההנחה MLR5 לא מתקיימת, 2 נסמן ב σi 2 את השונות של u בהינתן ערכי x של תצפית i. בשיעור קודם הראינו למשפחה עם יותר שההנחה חזקה ואומרת ש.V ar (y x) = σ 2 הרעיון האינטואטיבי השונות בד"כ תלויה בגודל של היחידה. נפשות, השונות של סך הצריכה תהיה גבוהה יותר. W LS אומד חסר הטיה שהוא יותר טוב מ OLS אם MLR5 לא ידוע. כדי להשתמש.σi לא נשתמש בו בקורס. בו צריך לדעת את כל 2 0 1 p = y, במקרה של המודל, דוגמא: עבור משתנה מוסבר בינארי, 1 p,e [y x] = p (x) = β 0 +β 1 x 1 ו ( V ar (y x) = (β 0 + β 1 x 1 ) (1 β 0 β 1 x 1 והוא תלוי ב x. זה פוגע בתכונה של,BLUE ובנוסחא של השונות. 8

= 1 ˆβ, אנו נחשב את (xi x) y i (xi x) 2 ( ) נפתח את הנוסחא V. ar ˆβj נזכור כי ( ) V ar ˆβ1 x = V ar = n i=1 ( n i=1 ) (x i x) j (x j x) 2 u i x = (x i x) 2 ( j (x j x) 2) 2 V ar (u i x) = ( ) n x i x V ar j (x j x) 2 u i x = i=1 n i=1 (x i x) 2 ( j (x j x) 2) 2 σ2 i (החלפתי את האינדקס במכנה ל j, כדי למנוע בלבול). V הוא אומד עקיב (לא הוכיחו שהוא חסר ( ) (xi x) 2 û i האומד x) 2 ar ˆβ1 x = (xi הטיה, וכנראה שהוא מוטה). הוא מכונה כשונות רובוסטית. התוכנה stata מחשבת אותו באופן אוטומטי אם מוסיפים את המילה robust לפקודה. בדוגמא האם נשים בכוח העבודה כפונקציה של מספר הילדים ועוד משתנים. האומדים לא משתנים. סטיות התקן וערכי t משתנים. הנורמה היום היא להשתמש ברובוסטיות, כיון שבד"כ המדגמים גדולים מספיק. כדאי להשתמש. המבחנים גם הם מותאמים לפי הרגרסיה האחרונה. בעבר היו בודקים באיזה מבחן למדנו לחשב את f תחת הרצות של שתי רגרסיות החישוב לא נכון עבור הטרוסקדסטיות. ניתן להשתמש ב test. 15 אנדוגניות ושימוש במשתני עזר 15.1 סיבות לאנדוגניות של משתנה י"ז סיון תשע"ב (שעור 4) [ ] הנחות MLR1 MLR4 גוררות אומד OLS חסרת הטיה. j, E ˆβj = β j ההנחה, (p lim ˆβ ) הרביעית היא הקריטית: = 0 s].e [u x מכאן קיבלנו גם עקיבות j = β j אבל לצורך כך מספיק להניח = 0 (u.cov x) j, נרצה לדון מה קורה כשההנחה לא מתקיימת..cov (x j, u) יוגדר כמשתנה אנדוגני אם 0 x j הגדרה 15.1.cov (x j, u) יוגדר כמשתנה אקסוגני אם = 0 x j 9

בכל שימוש ברגרסיה, צריך לשכנע (את עצמנו, ואת השומעים) למה המשתנה המסביר הוא אקסוגני. האם ניתן לבדוק האם משתנה הוא אנדוגני? לכאורה לא. הרי אין לנו נתונים על u, ולכן לא ניתן לבדוק את המדגם. האם ניתן להשתמש בשאריות û במקום הטעות? השאריות תמיד לא מתואמות = 0 (û,cov x) j, גם אם המשתנה אנדוגני, ולכן ברור שלא ניתן להשתמש בהם. צעד מאוד גדול לקראת השכנוע, הוא הרחבת המודל ע"י הוספת משתנים נוספים. עדיין יכולים להיות דברים ב u שהינם מתואמים. מאחר ואין לנו נתונים סטטיסטיים, מאוד חשוב להבין את הסיבות לאנדוגניות. נדבר על שלוש סיבות מרכזיות. 15.1.1 השמטת משתנה ברגע שמשמיטים משתנה הוא אוטומטית מתווסף לטעות, ואם הוא מתואם, גם הטעות תהיה מתואמת. אם במודל y = β 0 + β 1 x 1 + β 2 x 2 + v מתקיים = 0 ] 2.E [v x 1, x אבל אם אין לנו נתונים על x, 2 או שאפילו לא חשבנו על קיומו, והרצנו את y רק על.p lim ˆβ 1 cov (x 1, x 2 ) = β 1 + אז β 2,x 1 V ar (x 1 ) 15.1.2 סימולטניות (פרק 16) נתבונן במודל,y = β 0 + β 1 x 1 + u לפעמים יש סימולטניות שבה y משפיע על.x 1 למשל x 1 מספר השוטרים באוכלוסיה, ו y שיעור הפשע. קיימת משוואה גם של.x 1 = α 0 + α 1 y + v משתי המשוואות נובע כי 0 u).cov (x 1, אם u משתנה, זה משנה את y, ואז משנה גם את x. 1 ניתן גם לפתור את זה אלגברית ע"י הצבת y במשוואה השנייה, וחילוץ.x 1 אם 0 1 x 1,α משתנה עם.u cov (x 1, u) = E [x 1 u] E [x] E [u] = E [x 1 u] x 1 = α 0 + α 1 (β 0 + β 1 x 1 + u) + v = α 0 + α 1 β 0 + α 1 β 1 x 1 + α 1 u + v α 1 x 1 = α 0 + α 1 β 0 + u + 1 α 1 β 1 1 α 1 β 1 α 1 cov (x 1, u) = E [x 1 u] = E [ u 2] + 1 α 1 β 1 α 1 = σ 2 + 1 α 1 β 1 1 1 α 1 β 1 v 1 1 α 1 β 1 E [uv] 0 1 1 α 1 β 1 E [uv] 10

אם = 0 [uv] E (או שונה מהערך שיאפס את המשוואה). סטיב לויט רצה לפתור את הבעיה שתמיד יש קשר חיובי בין מספר השוטרים למספר הפשעים. הוא פתר את הבעיה ע"י שימוש באומד אחר שנלמד עוד מעט, ואז מוצאים שהאומד של β 1 שלילי מובהק. אם משתמשים ברגרסיה לינארית, אנו יודעים כי > 0 (u,cov x) 1, ואז אנחנו מקבלים הטיה כלפי מעלה של האומד, ולכן למרות ש 0 < 1 β, קבלנו > 0 1 βˆ. ניתן לחשוב גם על קשר בין רמת הכנסה לצריכת אלכוהול. טעויות במדידה של המשתנים המסבירים (פותח ע"י מילטון פרידמן) 15.1.3 לא תמיד אנחנו מודדים כמו שצריך. אם בעוד 20 שנה נישאל על מספר שנות לימוד, זה לא פשוט לדעת. כששואלים על תואר, זה הרבה יותר פשוט. שאלו זוגות של תאומים על כמה שנים הם והתאומים שלהם למדו, וגילו שיש הבדלים של 10 20% במספר השנים. יש טעויות מדידה קלאסיות. יש גם בעיות שהמשתנה שנבחר הוא לא ברור. איך משפיע שער הריבית על השקעות של פירמה איזה שער ריבית למדוד. את זה שהפירמה משלמת בפועל לבנק? אין לנו נתונים עליו. יש לנו ריבית בנק ישראל, ריבית ממוצעת של פירמות, וכד'. נניח 1 x עבור המשתנה האמיתי, ו x 1 עבור המשתנה הנצפה. נשתמש בסימון של שמתקיים,x 1 = x 1 + ε ו 0 = [ε].e המודל שלנו מקיים y = β 0 + β 1 x 1 + v ו.y = β 0 +β 1 x 1 +v β 1 ε במשוואה מה יגרום המעבר לשימוש ב?x 1.E [v x 1] = 0 נסמן את הטעות u. = v β 1 ε ודאי ש ε מתואם עם x, 1 כי הוא חלק מהמרכיבים של.x 1 מה אם.E [ε] = a אזי x 1 = x! + ε = a + x 1 + (ε a) y = β 0 + β 1 (x 1 a = ε) + v = β 0 β 1 a + β 1 x 1 + v β 1 ε ועדיין יש לנו תיאום של x 1 עם v. β ε 1 באופן כללי cov (x 1, u) = cov (x 1 + ε, v β 1 ε) = cov (x 1, v) β 1 cov (x 1, ε) + cov (ε, v) β 1 cov (ε, ε) = β 1 cov (x 1, ε) + cov (ε, v) β 1 V ar (ε) 11

"מקובל" להניח כי = 0 1] x E [ε וכן = 0 v),cov (ε, ואז אנחנו מקבלים cov (x 1, u) = β 1 V ar (ε) p lim ˆβ 1 = β 1 + cov (x 1, u) V ar (x 1 ) = β 1 ( 1 ) V ar (ε) V ar (x 1 ) לכן כשיש טעות במדידה, האומד המתקבל מוטה כלפי אפס. מילטון דן האם ההכנסה הפרמננטית היא המודל הנכון או המודל הקיינסיאני (נש"צ). כשהריצו רגרסיה של תצרוכת כנגד הכנסה גילו שיש קשר. פרידמן אמר שצריך למדוד את ההכנסה הפרמננטית, לא את הנוכחית. אם הנוכחית היא שונה קצת מהקבועה, זה תלוי עד כמה השונות של ε גדולה. 15.2 הטיפול במשתנה אנדוגני 15.2.1 שימוש במשתנה העזר נניח כי אנו רוצים למדוד את האפקט x. 1 y אם היתה לנו מעבדה, היינו מודדים את y על x 1 במעבדה. מאחר שיש לנו גם u, שהם גורמים חיצוניים, שמשפיע על y, ובנוסף מושפע דרך x. 1 אין לנו דרך להבדיל בין ההשפעה של x 1 דרך u לזו הישירה. נניח כי 1 u). corr (x 1, יש ל x 1 מרכיבים שמתואמים עם,u ומרכיבים שאינם מתואמים. נניח שקיים z 1 שמשפיע על x 1 ללא קשר ל u. נקרא לו instrumental באופן שלא מושפע מ u. y ותזיז את תזיז את x, 1 z הזזה של.I.V. או variable יש לזה מחיר אנחנו צריכים למצוא את z 1 הזה, ולקבל נתונים עליו. במצב זה.cov (z 1, x 1 ) אבל 0 cov (z 1, u) = 0 דוגמא ראשונה שאנשים השתמשו בה, אבל לא טובה. במודל של הכנסה והשכלה, משתנה עזר צריך להיות מתואם עם ההשכלה, אבל לא עם היכולת. אנשים נטו להסתכל על הקשר החזק בין השכלת האב להשכלה. אבל קשה להגן על ההנחה שהשכלת האב לא מתואמת עם היכולת. כאן בא חלק גדול של אמונה ושכנוע. דוגמא נוספת מספר ת.ז. של הפרט סביר להניח שאינה מתואמת עם היכולת, אבל גם לא מתואמת עם ההשכלה. 1 born in Q1 = 1 z (האם הפרט נולד ברבעון דוגמא קלאסית היא המשתנה הבא: 0 o.w. הראשון של השנה). זה לא אמור להשפיע על היכולת של האדם. האם זה מתואם עם שנות השכלה? אפשר לבדוק את זה סטטיסטית, ויש גרף יפה שמראה את זה. חוק 12

חינוך חובה מחייב ללמוד עד גיל 16 ויום. אנשים שרוצים לעזוב את בית הספר יעזבו בגיל 16 ויום. רוב האנשים ממשיכים ומסיימים, אבל יש קבוצה שנושרת. ככל שנולדים מאוחר יותר בשנה, לומדים כמה חודשים יותר. זה יוצר מתאם שלילי בין אלו שנולדים בתחילת השנה לרמת ההשכלה שלהם. הבעיה היא שהקשר הוא מאוד חלש. מסתבר שע"מ שלאומד תהיה תכונות סטטיסטיות טובות, דרוש קשר מאוד חזק. התפתח נושא שדן מה קורה כשמשתני העזר חלשים. נגדיר אומד,IV ונאמוד אותו בשיטת המומנטים. y = β 0 + β 1 x 1 + u כאשר cov (z 1, u) = ו 0,cov (z 1, x 1 ) כך ש 0 נניח שקיים z 1.cov (x 1, u) 0, E [u] = 0 אזי = 0 u] OLS.E [z 1 בוסס על = 0 u] E [x 1 שלא היה נכון. אבל אם = 0 u] E [z 1 E [z (y β 0 β 1 x 1 )] = 0 1 [z i1 (y 1 n ˆβ )] IV IV 0 ˆβ1 xi1 = 0 1 (y 1 n ˆβ ) IV IV 0 ˆβ1 xi1 = 0 ˆβ 0 IV ˆβ 1 IV מאפשר לי להשתמש בשיטת המומנטים: בשיעור הבא נראה כי האומד אכן = ȳ ˆβ 1 IV x1 = (zi1 z 1 ) y i (zi1 z 1 ) (x i1 x 1 ) p n β 1 כשהאומד עקיב אפילו כאשר 0 u).cov (x 1, עקיב. כ"א סיון תשע"ב (שעור 5) נראה היום בנוסחאות פורמליות את האינטואיציה בשימוש במשתנה עזר. אח"כ ניתן כמה הערות על האומד. ˆβ 1 IV = (zi1 z 1 ) y i (zi1 z 1 ) (x i1 x 1 ) = β 1 + 1 n (zi1 z 1 ) u i 1 (zi1 z n 1 ) (x i1 x 1 ) p lim ˆβ IV 1 = β 1 + cov (z 1, u) cov (z 1, x 1 ) = β 1 (cov (z 1, u) = 0, cov (z 1, x 1 ) 0) 1 (zi z) u i = 1 p zi u i zu n n E [z iu i ] E [z] E [u] n לכן האומד שלנו הוא עקיב. מה לגבי הטיה? [ ] IV (zi1 z 1 ) E [u i x 1, z 1 ] E ˆβ1 x1, z 1 = β 1 + (zi1 z 1 ) (x i1 x 1 ) 13

לכן השאלה הגדולה היא האם = 0 ] 1.E [u i x 1, z האם ניתן להניח זאת? לא. מאחר ו 0 ] 1,E [u x לכן האומד IV הוא מוטה. לכן אם רוצים להשתמש באומד הזה, צריך להשתמש במספרים גדולים (לא כמה עשרות תצפיות). ב z. 1 לא מתקבל מלהחליף את x 1 βˆ IV הערה 1 15.2 הערה 15.3 אומד IV עקיב גם כאשר x 1 אקסוגני. OLS גם הוא עקיב במצב זה. במה נבחר במצב זה? אם x 1 אקסוגני, אז OLS הוא מקרה פרטי של,IV ע"י בחירת.z 1 = x 1 הערה 15.4 התנאי 0 ) 1 cov z) 1, x ניתן לבדיקה, ורצוי לבצע זאת. ניתן ע"י הרצת הרגרסיה.x 1 = π 0 + π 1 z 1 + v 1 נשים לב שתמיד ניתן להריץ רגרסיה כזו, ולקבל טעות המקיימת = 0 ) 1.cov z) 1, v כך גם נוכל לדעת עד כמה יש קשר ביניהם, ולבדוק את ההשערה = 0 1 H. 0 : π הקשר לא יכול להיות חזק מדי, כי אז לא נוכל לקבל = 0 (u.cov z) 1, מה הקשר בין הנוסחא של β1ˆ והאינטואיציה של הזזה ב x 1 דרך z 1 כדי לאמוד את IV?β 1 נחשוב על x 1 כמתואם בחלקו עם u, ובחלק לא. ניתן גם לחשוב עליו כעל x 1 = π 0 + π 1 z 1 + v 1 החלק π 0 π+ 1 z 1 אינו מתואם עם u, ולכן החלק המתואם הוא דרך v. 1 לפי האינטואיציה צריך להסתכל על החלק של x 1 שמתואם עם u. אם הייתי יודע את π, 0, π 1 הייתי יכול להשתמש בהם. אני לא יודע, אבל אני יכול לאמוד אותם, ולקבל את xˆ. = πˆ 0 + πˆ 1 z 1 האומד הזה הוא החלק של x 1 שלא מתואם עם u. טענה 15.5 רגרסית OLS של y על xˆ 1 נותן את אומד IV 14

הוכחה: ˆγ 1 OLS = ( ˆxi ˆx ) y i ( ˆxi ˆx ) 2 x i1 = ˆπ 0 + ˆπ 1 z i1 + vˆ i1 x 1 = ˆπ 0 + ˆπ 1 z 1 + 0 x i1 x 1 = ˆπ 1 (z i1 z 1 ) + vˆ i1 (z i1 z 1 ) (x i1 x 1 ) = ˆπ 1 (z i1 z 1 ) 2 + (z i1 z 1 ) vˆ i1 = ˆπ 1 (z i1 z 1 ) 2 i ˆx i = ˆπ 0 + ˆπ 1 z i1 ˆx = ˆπ 0 + ˆπ 1 z 1 = x 1 ( ˆxi ˆx ) = ˆπ 1 (z i1 z 1 ) i i ˆβ 1 IV = = (zi1 z 1 ) y i (zi1 z 1 ) (x i1 x 1 ) = ˆπ 1 (zi1 z 1 ) y i 2 ˆπ 1 (z i1 z 1 ) 2 = ( ˆxi ˆx ) y i ( ˆxi ˆx ) 2 = β ˆ y, ˆx OLS בדוגמא אנו רואים כיצד ניתן לקבל את אותו אומד, אבל סטיות התקן שונות. זו אחת הסיבות שבעבר קראו לזה רגרסיה דו שלבית. עבודה מלפני 20 שנה דנה בקשר בין רבעון לידה להשכלה. לקחו נתונים מבוססים על מפקדים, ובדקו ממוצע שנות לימוד לכל רבעון. בשנות ה 30 יש מגמת עלייה בהשכלה על פני עשור. חוץ מזה, מי שנולד בתחילת השנה תמיד לומד קצת פחות. הפער הוא בכמה חודשים. הסבה להבדלים המובהקים הוא מתופעת הנשירה בתום חוק חינוך חובה. מתברר שהאומד הזה תופס בדיוק את החלק הזה של האוכלוסיה, ולא ניתן להשתמש בו למדידה כללית. הממצאים: האומד טיפה יותר קטן, וטעות התקן הרבה יותר גדולה. נחזור לזה בהמשך. דוגמא נוספת: פשיעה ומשטרה. הראינו איך מנגנון הסימולטניות מטה את האומד. סטיב לויט חיפש משתנה עזר שישפיע על מספר השוטרים, אבל לא על רמת הפשע. הוא השתמש בשאלה האם באותה שנה יש בחירות. מסתבר שכאשר יש כלכלת בחירות, המושלים מוציאים עוד כסף על שוטרים, כאשר מצד שני אנשים לא בוחרים בפשע בגלל בחירות. הממצאים: בשנות בחירות השינויים במספר השוטרים גדולים יותר. כשמריצים את 15

המודל ריבועים פחותים מקבלים קשר חיובי מובהק, אבל קטן. כשמתקנים את זה עם משתנה עזר, מקבלים אומד שלילי ומובהק, אבל עם סטיית תקן הרבה יותר גדולה. דוגמא: grade = β 0 + β 1 skipped + u האם החסרת שיעורים משפיעה על הציון. הבעיה: skipped אנדוגני, כי יש הרבה דברים שמשפיעים על הציון, ומתואמים עם.skipped למשל, יכולת, רקע בחומר הלימוד (יכול להשפיע בשני הכיוונים מי שמבין בלי השיעור, לא יבוא לשיעור, ומי שלא מבין גם אתו גם לא יבוא). נשתמש במשתנה עזר z 1 של המרחק מהר הצופים (גיאוגרפי \ זמן הגעה). סביר להניח שיש קשר בין z 1 לskipped. האם יש ל z 1 תיאום עם u? זה יכול להיות מתואם עם הכנסה או הכנסת הורים. יש מחקרים שהכנסה משפיעה על הציונים. לכן אם יש לנו נתונים על הכנסה, והיינו מוסיפים אותם למשוואה, z 1 הוא כבר משתנה עזר סביר יותר. הכל תלוי בקונטקסט הספציפי, ולא תמיד נדע אם הוא אכן כזה, אלא נצטרך לקוות. דוגמא נוספת: איך משפיעה השתתפות במלחמת ויאטנם על השכר. חלק מהמשרתים התנדבו, והיתה סלקציה בגיוס. לכן השתמשו במספרי ההגרלה (draft) של האנשים. יש קשר בין ההגרלה לשירות, אבל לא באופן מלא, וההגרלה היא אקראית, ולכן לא מתואמת לפי ההגדרה. כדי לבדוק השערות נשתמש באותם מושגים של מבחני,t. f השונות: V ar ( ˆβ1 IV ) = (zi1 z 1 ) V ar (u i x 1, z 1 ) ( (z i1 z 1 ) (x i1 x 1 )) 2 ואם מניחים שונות קבועה V ar (u i x 1, z 1 ) = σ 2 נקבל ( ) (zi1 z 1 ) σ 2 V ar ˆβ1 = ( (z i1 z 1 ) (x i1 x 1 )) 2 נשאר רק לחשב את.û IV i = y i ˆβ IV IV 1 0 ˆβ1 xi1 ו = ˆσ2 = u ˆ IV 2 כאשר משתמשים ב i n k 1 למה סטיית התקן ברגרסיה דו שלבית נותנת תוצאה שונה? כי לא משתמשים באותה הגדרה (משתמשים ב x ˆ). לכן חשוב להשתמש ב ivreg במקום רגרסיה דו שלבית. σ 2. ניתן לראות במקרה של הטרוסטדסטיות כי סטיית התקן שווה ל ) 2 1 (xi1 x Rx 2 1 z 1 נניח ו x הוא אקסוגני, יש משמעות להשוואת השונויות. למה OLS יותר טוב? כי ה R 2 של x עם עצמו הוא 1, לכן השונות תהיה קטנה יותר. ברוב המקרים לאומדי IV יש שונות גדולה יותר, וזה מאוד בולט בעבודות אמפיריות, וזה משקף את עוצמת הקשר בין x 1 ל z. 1 16

כ"ד סיון תשע"ב (שעור 6) ראינו כי עבור,y = β 0 + β 1 x 1 + u אם 0 u) cov (x 1, אז OLS מוטה ולא עקיב. אבל אם קיים z 1 כך ש 0 = u),cov (z 1, ו 0 ) 1 cov (z 1, x אומד IV עקיב ל β 1 (אבל מוטה). את החלק 0 x) cov (z 1, ניתן לבדוק ע"י בדיקת ההשערה = 0 1 π ברגרסיה.x 1 = π 0 + π 1 z 1 + v 1 את ההנחה = 0 u) cov (z 1, אי אפשר לבדוק, צריך לשכנע. V ar תחת הומוסקדסטיות והטרוסקדסטיות, מומלץ ( ˆβ1 ניתן לאמוד את השונות ) IV ישירות דרך הפקודה.ivreg כדי לדחות את = 0 1,H 0 : π צריך מתאם בין z 1 ל.x 1 σ 2 ( ) IV = ˆβ1.V ar אם במקרה של הומוסקדסטיות, אנו מקבלים ) 2 1 (xi1 x Rx 2 1 z 1 יהיה לנו R 2 חלש בקשר בין z, 1, x 1 נקבל שונות גבוהה יותר. זה גם גורם לכך שלאומדי IV יש שונות גבוהה יותר. ניתן לחלץ מתוך הפער בשונות את עוצמת הקשר. במחקר שהשתמש ברבעון הלידה, יש R 2 של פחות מ 0.001. עדיין הצליחו להגיע לתוצאות מובהקות..p lim ˆβ IV 1 = β1 + cov (z 1, u) אבל זו לא הבעיה העיקרית. הבעיה המרכזית היא cov (z 1, x 1 ) אין לנו בטחון כי = 0 (u.cov z) 1, אנחנו יכולים לומר כי הוא מאוד נמוך, אבל אם גם ) 1 cov (z 1, x נמוך, שוב אנו עשויים להגיע להטיה. לא נוח לדבר על cov שהוא משתנה לפי היחידות, לכן נדבר על מתאם: p lim ˆβ IV 1 = β1 + ρ z 1 u V ar (u) ρ z1 x 1 V ar (x 1 ).ρ z1 u קטן באותו סדר גודל של ρ z1 x 1 הסטייה לא תהיה קטנה אם המתאם 15.3 יציאה מהמודל הבסיסי 15.3.1 הוספת משתנים מסבירים נסתכל על המודל.y 1 = β 0 + β 1 y 2 + β 2 z 1 +... + β k z k 1 + u1 נניח כי y 1, y 2 אנדוגנים 0 ) 1,cov (y 1, u 1 ), cov (y 2, u וכי z 1,..., z k אקסוגניים.. i [k 1], cov (z i, u 1 ) = 0 השאלה המעניינת היא: אם אנו מניחים ש z i אקסוגניים, האם הם עצמם יכולים לשמש כמשתני עזר? 17

יש לנו בעצם y. 2 y, 1 גם לא דרך ל z 1 יש אפקט ישיר על התשובה היא לא. נראה בצורה יותר β 1, β 2 ביחד. לא ניתן לאמוד את מולטיקוליניאריות מושלמת. מדויקת בהמשך. אנחנו צריכים z k שיקיים = 0 u),cov (z k, וגם 0 ) k 1.cov (z k, y 2 z 1,..., z כעת בשלב ראשון נבצע רגרסיה.y 2 = π 0 + π 1 z 1 +... + π k z k + v נוודא שאנו דוחים את = 0 k.h 0 : π במקרה של משתנים מרובים יש נוסחא מתאימה לאומד.IV בסטאטה רושמים ivreg.y1 (y2 = zk) z1 z2... zk-1 גם במקרה הזה לאומד IV תהיה שונות גבוהה יותר. 15.3.2 הוספת משתני עזר נסתכל במודל.y 1 = β 0 + β 1 y 2 + β 2 z 1 + u כאשר y 2 אנדוגני, z 1 אקסוגני. נניח שיש לנו שני משתני עזר z 2, z 3 שיקיימו 0 ) 2,cov (z 2, y 2 ), cov (z 3, y וגם.cov (z 2, u 1 ), cov (z 3, u 1 ) = 0 גם כל צירוף לינארי של z 2, z 3 יכולים להיות טובים. במה נבחר? הפתרון הוא להשתמש ב ŷ 2 = ˆπ 0 + ˆπ 1 z 1 + ˆπ 2 z 2 + ˆπ 3 z 3 מתוך הרגרסיה.y 2 = π 0 + π 1 z 1 + π 2 z 2 + π 3 z 3 כאשר אנחנו משתמשים גם במשתנים המסבירים החיצוניים. בצורה הזו אנחנו מצמצמים את הבעיה מריבוי משתני עזר שאיננו יודעים להחליט ביניהם, למשתנה יחיד להשתמש בו. זה גם סבה נוספת לשם T. SLS בשלב שני מריצים OLS של y 1 על ŷ 2 ו.z 1 הוכחנו אלגברית שבצורה הפשוטה אנחנו מקבלים בדיוק את.IV אלגברית, אבל נראה שזו אותו אומדן. כאן לא נוכיח מה המשמעות של הרגרסיה הזו? מה קורה כשאנחנו מחליפים את y 2 ב ŷ? 2 y 1 = β 0 + β 1 y 2 + β 2 z 1 + u = β 0 + β 1 ŷ 2 + β 2 z 1 + u 1 + β 1 ˆv 2 נרצה לדעת האם האומד הזה עקיב, ואם הוא זהה לאומד.IV למה האומד עקיב. כדי שהאומד יהיה עקיב אנחנו דורשים שכל אחד מהמשתנים המסבירים ברגרסיה החדשה לא מתואם עם הטעות החדשה. z 1 לא מתואם עם u 1 מההנחה, ולא עם vˆ 2 כי הוא השתתף בחיזוי של ŷ 2 ŷ. 2 לא מתואם עם u 1 כי הוא צ"ל של z. i הוא לא מתואם עם vˆ 2 כי הערך החזוי לא מתואם עם השארית. 18

לכן האומד יהיה עקיב, אבל זה לא אומר שהוא זהה לאומד.IV לא נוכיח את זה, אבל נראה דוגמא. יש פער בשאריות: כשמחשבים את השאריות בצורה הידנית, β 2 vˆ 2 נכנסים לשאריות, ולכן חישוב השונות משתנה. לכן עדיף להשתמש ב ivreg. R 2 שונה גם הוא. כאשר מניחים שאין מתאם בין,x, u ניתן לחשב R, 2 אבל כאשר יש מתאם, אין טעם לחשב את R, 2 ולכן למרות שהוא מדווח, לא מסתכלים עליו. 15.4 סיכום כ"ח סיון תשע"ב (שעור 7 קבוצה אחרת) 15.4.1 המודל הפשוט y 2.y 1 = β 0 + β 1 y 2 + w 1 אנדוגני. קיים z 1 כך ש 0 = ) 1 cov (z 1, w אבל 0 ) 2.cov (z 1, y במקרה זה IV (zi1 z 1 ) y i1 p ˆβ 1 = (zi1 z 1 ) (y i2 y 2 ) β 1 n הוכחנו כי IV שקול ל OLS של y 1 על,ŷ 2 כאשר ŷ 2 = ˆπ 0 + ˆπ 1 z 1 (החלק הלא מתואם של.(y 2 15.4.2 הוספת משתני עזר אותו מודל,,y 1 = β 0 + β 1 y 2 + w 1 אבל z 1, z 2 משתני עזר. הקומבינציה האופטימלית לאומד IV עם השונות הקטנה ביותר הוא.ŷ 2 = ˆπ 0 + ˆπ 1 z 1 + ˆπ 2 z 2 בעצם ( ) IV yi2 ˆ ŷ 2 yi1 ˆβ 1 = ( ) yi2 ˆ ŷ 2 (yi2 y 2 ) הוספת משתנים מסבירים אקסוגניים 15.4.3 אי אפשר להשתמש ב.y 1 = β 0 + β 1 y 2 + β 2 z 1 +... + β k z k 1 + u 1 המודל צריך משתנה עזר 1 k z 1... z כמשתני עזר, כי זה יוצר מולטיקולינאריות מושלמת..y 2 = π 0 + π 1 z 1 +... + π k 1 z k 1 + π k z k + v 2 אם לא היינו משתמשים חיצוני. 19

ב z, k השלב הראשון היה נותן לנו ŷ 2 שהוא צירוף ליניארי של 1 k z, 1..., z ובשלב השני של הרגרסיה, היה לנו מולטיקוליניאריות. כדי להשתמש ב z k אנחנו צריכים לדחות את = 0 k H 0 : π (אם משתמשים בכמה, צריך לשער על כולם). עכשיו אנו משתמשים y 1 = β 0 + β 1 ŷ 2 + β 2 z 1 +... + β k z k 1 + (u 1 + β 1 ˆv 2 ) ŷ 2 = ˆπ 0 + ˆπ 1 z 1 +... + π k 1 ˆ z k 1 + ˆπ k z k בSLS T ומקבלים: הערה z k 15.6 שובר את המולטיקוליניאריות בהנחה סטנדרטית ש z k לא מולטיקוליניארי עם k 1.z 1,..., z 15.4.4 הוספת משתנים מסבירים אנדוגניים.y 1 = β 0 + β 1 y 2 + β 2 y 3 + β 3 z 1 (+... + β k z k 1 ) + u 1 זה לא קורה הרבה, אבל יכול לקרות, ויותר מזה לא עושים (משקרים לעצמנו ואומרים ש"אנחנו מתעניינים בתוצאה של β 1 בלבד, כל השאר הם לצורך ביקורת"). זו לא ההנחה הכי סבירה, אבל זה מה שעושים במציאות. נניח כי z 2 משתנה עזר (מתואם עם y 2, y 3 אבל לא עם u). 1 כעת ניתן לחשב את ŷ 2 = ˆπ 0 + ˆπ 1 z 1 + ˆπ 2 z 2 ŷ 3 = ˆδ 0 + ˆδ 1 z 1 + ˆδ 2 z 2 y 1 = β 0 + β 1 ŷ 2 + β 2 ŷ 3 + β 3 z 1 + u 1 + β 1 ˆv 2 + β 2 ˆv 3 אבל במשוואה יש מולטיקוליניאריות מושלמת, אפשר לחלץ את z 2 כפונקציה של z, 1, ŷ 3 ואז ŷ 2 הוא גם פונקציה של z. 1, ŷ 3 לכן חייבים משתנה עזר נוסף. נקבל ŷ 2 = ˆπ 0 + ˆπ 1 z 1 + ˆπ 2 z 2 + ˆπ 3 z 3 ŷ 3 = ˆδ 0 + ˆδ 1 z 1 + ˆδ 2 z 2 + ˆδ 3 z 3 y 1 = β 0 + β 1 ŷ 2 + β 2 ŷ 3 + β 3 z 1 + u 1 + β 1 ˆv 2 + β 2 ˆv 3 וכעת נפטרנו מהמולטיקולינאריות. 20

16 סימולטניות 16.1 משוואות ביקוש והיצע המסגרת הטבעית לדבר על סימולטניות היא כשאנו עוסקים באמידת פונקציות ביקוש והיצע. זה די דומה למה שעשינו על שוטרים וגנבים. נדבר על ביקוש לשעות עבודה ע"י פירמות. z 1.h d = β 0 + β 1 w + β 2 z 1 + u 1 יכול להיות גודל הפירמה \ שטח חקלאי למשל. אנחנו נצפה ל β 1 שלילי, כאשר לפירמות שונות יש תזוזה בעקומת הביקוש לפי z. 1 נניח כי z 1 אקסוגני. נניח שיש לנו מדגם i.i.d. של.h i, w i, z i1 האם ניתן להריץ רגרסית OLS ולקבל אומדים עקיבים? זה ייתכן רק תחת ההנחה = 0 (u.cov,w) נניח כי u 1 הם גורמים אקראיים (מזג אויר, מכונות מתקלקלות), שמשפיעים על הביקוש לשעות עבודה. ממה שאנחנו יודעים על שיווי משקל, אנחנו נקבל כי גם w יעלה. אנחנו מניחים שאנו עוסקים בתצפיות של שיווי משקל, וכי היצע העבודה אינו גמיש לחלוטין. אנחנו צריכים למצוא משתנה עזר, שיזיז את השכר, אבל לא את הביקוש. לכן נחשוב על היצע שעות העבודה ע"י הפרטים. עקומת היצע הפוכה inverse supply function של.w = α 0 + α 1 h s + α 2 z 2 + u 2 ההיצע מורכב מהשכר, ועוד גורמים נוספים, וניתן לחלץ משם את השכר. תנאי לשיווי משקל הוא.h = h s = h d נניח = 0 2,Eu ו 0 = ) 2 E. z) 2 u על מנת להשתמש ב z 2 כמשתנה עזר ל w בפונקצית הביקוש, צריך להניח = 0 ) 1,cov (z 2, u כלומר שינויים ב,z 2 לא מזיזים את עקומת הביקוש. ניתן לחשב את ) 1 E, (wu ולחשב ע"י הצבות (לראות בסיכומים) כי α 1 ) 2,E (wu 1 ) = V ar (u 1 ) + E (u 1u וזה חיובי. 1 α 1 β 1 1 α 1 β 1 גם בדוגמא של לויט אפשר לחשוב על זה כעל שתי משוואות עם קשר סימולטני. בתור כלכלן הוא הבין שיש כאן קשר סימולטני כמו ביקוש והיצע. זיהוי: אמרנו קודם שעבור משתנה אנדוגני יחיד צריך משתנה עזר נוסף, ולשנים צריך שנים. הגדרה 16.1 נאמר שיש לנו זיהוי מדויק (just-identication) כאשר מספר משתני העזר החיצוניים שווה למספר המשתנים האנדוגניים. under-) כאשר יש יותר משתני עזר, וזיהוי חסר נגדיר זיהוי יתר (over-identication) כאשר יש קצת מדי משתני עזר. (identication 21

למשל עבור דוגמא אחת (עמ' 9) יש זיהוי חסר, לדוגמא 2 זיהוי מדויק, ודוגמא 3 זיהוי יתר. כאשר יש לי זיהוי יתר, עקרונית כאשר משתמשים בשני המשתנים, מקבלים שהשאריות לא מתואמות עם u, 1 אבל אם נשתמש בחלק, ניתן אח"כ לבדוק את השאריות כדי לבחון (הנסן) האם השאריות מתואמות עם המשתנה השני או לא. זה לא מספיק כדי להצדיק את השימוש במשתנה, אלא להסביר למה אין מנגנון שיוצר מתאם בין הטעויות. ר"ח תמוז תשע"ב (שעור 8) 17 סיכום ראינו את מודל הרגרסיה הליניארית, שהתבסס על אוסף הנחות, ואיך לאמוד אותו על סמך נתונים. אח"כ דברנו על הסקה סטטיסטית ובדיקת השערות, ואז עברנו להתרת ההנחות של המודל. מה עושים כשהנחה ספציפית לא מתקיימת? 17.1 מודל הרגרסיה הלינארית המודל מבוסס על ההנחות הבאות:.y = β 0 + β 1 x 1 +... + β n x n + u.1 2. מדגם מקרי. 3. חוסר מולטיקוליניאריות מושלמת בין ה xים (הנחה טכנית). הדגש הוא על קשר מושלם. אם הקשר לא מושלם ניתן לטפל בו..4 אקסוגניות = 0 x].e [u 5. (מכאן הנחות ניתנות להסרה בקלות) הומוסקדסטיות..6 נורמליות של.y x 17.2 שיטות אמידה כאשר יש לנו נוסחא, יש לנו כמה שיטות לאמוד. ראינו את האומדים: OLS.1 22

IV.2 יש גם אומדים אחרים כמו מהירות מקסימלית. דרך אחת היא להסביר את העקרון בבחירת המודל (מומנטים, מזעור ריבועים), אבל מה שמעניין אותנו אלו התכונות. התמקדנו גם במה מוביל אותנו אל האומד. 17.2.1 תכונות האומדים יש כמה סוגים של תכונות. תכונות סטטיסטיות: חוסר הטיה 4),(1 עקיבות 0) = u),(1 4 or 1-3 and cov (x j, יעילות ("שונות קטנה", גאוס מרקוב)( 5 1), התפלגות (נותן לנו את בדיקת ההשערות יחד עם הקודמים). התכונות תלויות בהנחות. תכונות אלגבריות: (תמיד מתקיימות ב OLS ) ûi = 0 xij û i = 0 ŷi û i = 0 מה לגבי אומד?IV אי אפשר להוכיח חוסר הטיה. IV עקיב תחת הנחות 1 3 וזה שמשתני העזר לא מתואמים עם u, אבל מתואמים עם המשתנים האנדוגניים. עקיבות היא התכונה המרכזית שאנו מחפשים. מהי השונות של?IV האם יש טענה דומה לגאוס מרקוב? יש רמז לכך: בין כל האומדים העקיבים שמשתשמשים באותם משתני עזר, אומד IV שהוצג הוא הטוב ביותר. קל לחשוב על אומדים עם שונות קטנה יותר, אבל הם עשויים להיות מוטים. למשל האומד = 0.17 1 β הוא אומד עם שונות אפס. בהינתן,x, z ייתכן ו y יתנהג בצורה נורמלית. 17.3 בדיקת השערות גם הבדיקה מתבצעת על ידי האומדים, אבל יש שני דברים בבדיקת השערות: 23

1. צריך לעבור מהשערה מילולית להשערה מתמטית שנכתבת למחשב. 2. איך בודקים. הדבר הקריטי לצורך בדיקת השערות הוא לדעת מה ההתפלגות של האומד. בלי זה אי אפשר להתקדם. איך נדע האם 0.69 קרוב ל 0.7, או 0.6? אם ידועה השונות, ניתן לחשב את הסטטיסטי, ולהשוות אותו מול טבלת ההתפלגות. זה מה שLR6 M נותנת לנו. בד"כ נרצה לדעת עד כמה הסטטיסטי שונה מאפס, לפי ההתפלגות של t (כי לסטטיסטי יש התפלגות t). תמיד אפשר לבנות את הסטטיסטי, אבל הם לא יתפלגו לפי ההתפלגות בלי ההנחות. 17.4 התרת ההנחות כל מה שדברנו על הוספת x 2 או,log x זה קשור להנחה 1, הפונקציונלית של המודל. ככה אנחנו מאפשרים קשרים לא ליניאריים במשוואה. שימוש במשתני דמי מאפשר למודל להבדיל בין קבוצות שונות באוכלוסיה. אם מריצים על המדגמים בנפרד, אנחנו כופים את זה שכל המקדמים יהיו שונים. במשתנה דמי אנחנו בוחרים אלו מקדמים יכולים להיות שונים, ולבדוק האם ההפרש מובהק. במחצית השניה של הקורס התחלנו להסיר את ההנחות. 17.4.1 הנחת הנורמליות הנחת הנורמליות נחוצה לצורך בדיקת השערות, אבל הראינו שאם המדגם מספיק גדול, לפי משפט הגבול המרכזי עדיין הסטטיסטי t יתפלג t. n k האומד לא מתפלג נורמלית, אלא ההתפלגות הנורמלית היא קירוב טוב להתפלגות האמיתית של האומד (התפלגות אסימפטוטית). 17.4.2 הומוסקדסטיות ההנחה לא מאוד נחוצה, והיא לא מציאותית. זה עוזר לחישוב הנוסחא של השונות, אבל השונות קיימת גם כשאין הומוסקדסטיות. נכון שהנוסחא קצת מסובכת, אבל עדיין ניתנת לחישוב. הדבר היחיד שנעלם עם ההנחה זה.BLUE שתי ההנחות לא משפיעות על חוסר ההטיה והעקיבות של האומדים. כשMLR5 לא מתקיים, צריך לחשב את s.e. ע"י נוסחת אמידה הטרוסקדסטית. בstata ע"י.robust 24

17.4.3 אקסוגניות מאוד קשה להסביר את ההנחה, והיא קריטית לעקיבות. הבעיה. הראינו 3 סיבות: מה שעשינו זה עקפנו את 1. השמטת משתנה רלוונטי 2. סימולטניות 3. טעויות במדידת המשתנים למה לא להריץ רגרסיה של צריכת דלק לפי מיסים בלבד? אנחנו נשים משתנים נוספים כדי להקטין את הטעות, ואז הסיכוי לתיאום הולך וקטן. גם כשנוסיף משתנים, זה לא פותר את שתי הבעיות האחרות. אבל יש לנו פתרון בצורת משתנה עזר שמתואם עם x ולא עם u. אבל צריך להניח שהוא עצמו לא מתואם עם u. לפעמים זה פשוט, אבל לא באמת עוזר (רבעון לידה למשל). מאז משתמשים במספרי הגרלות. בארה"ב, האם אנשים בוחרים ללכת לבי"ס פרטי. האם זה ישפיע על ציוני התלמידים? הבעיה היא כלכלית. המציאו משתנה של האם יש נהר בעיר. לא משפיע על הציונים, אבל משפיע על ההחלטה. לפעמים המציאו את המשתנה, ואח"כ סביבו את הבעיה. אם משתנה העזר הוא חלש, עשויה להיות הטיה. 18 שימוש בנתוני פאנל (לא למבחן) משתנה העזר צורך שכנוע שהוא מתאים. נרצה לראות דרך אחרת לעקוף את האנדוגניות. המודל בנתוני פאנל הוא,y it = β 0 + β 1 x it + u it כאשר i הוא אינדקס הפרט, ו t הוא אינדקס השנה. נניח שאנו רוצים לבדוק את התגובה לשינויים במחירי הדלק. לא נוכל לתפוס את זה בתצפית בודדת. אבל אם יש לנו נתונים עד 2015, נוכל לראות האם יש לנו נתונים. הכל תלוי באופק השנים. קיום של נתוני פאנל פותרת את בעיית האנדוגניות. יש לנו בעיה אם u מתואם עם x. אם מבצעים (pooled),ols הוא לא יהיה עקיב אם x מתואם עם u. 25

נניח שניתן לכתוב u. it = v i + ε it הטעות מפורקת לטעות קבועה על פני הפרט (אפקט אינדיבידואלי למשל מרכיב היכולת בשכר), ולתנודה זמנית. אם מניחים שהמתאם בין u ל x נובע מ v (כלומר,ε x לא מתואמים), ניתן לפתור את הבעיה. אפשר להשתמש במודל y it y i(t 1) = β 1 (x it x it 1 ) + ε it ε it 1 כדי שהמודל יהיה עקיב, צריך שx לא יהיה מתואם עם ε משנה ליד. לאומד הזה נקרא.F.D. אומד מפורסם יותר הוא y it y = β 1 (x it x i ) + ε it ε i ריבועים פחותים ייתן אומד עקיב אם x לא מתואם עם ε. it, ε נקרא אומד est. F. ixed Effect היום עם התפתחות הנתונים עוברים להשתמש בנתוני פאנל. הרבה פעמים השימוש הוא אנדוגני, אבל החוק הוא אקסוגני (?) ניתן להראות שאף שנומרית יש הבדל בין שני האומדים, אין צורך לחשב את הסטיות x, it x i אלא להוסיף משתני דמי לכל פרט למודל המקורי, וזה נותן תוצאות כמו.F.E. הרבה פעמים,x y הם בלוגריתם. זה נקרא שיעור השינוי. כשאומדים בצורה כזו, אומדים השפעה של שיעור שינוי על שיעור שינוי. האומדים שלנו עובדים בד"כ על רמות. אם יש לנו לוגריתמים, זה גמישות. אם אנחנו מדברים על האינפרטציה, זה יותר פשוט במודל הבסיסי. יש בסטאטה את כל הפקודות, כולל שילוב ביניהם. הרבה פעמים יש לנו את המיסוי בשנים קודמות, וניתן לעמוד עליהם לאורך זמן. האם ההנחה u it = v i + ε it תקפה? אם אין פקטורים,v i נקבל = 0 i,v ו.u it = ε it... יכול להיות שיש נתונים קבועים לאורך כל התקופה, אבל סט הפקטורים הקבועים הולך וקטן ככל שהתקופה גדלה. לכן המודלים עובדים טוב על פני תקופה של 10 5 שנים. 26