מבוא לאקונומטריקה א' החוג לכלכלה

Σχετικά έγγραφα
חורף תש''ע פתרון בחינה סופית מועד א'

תרגילים בנושא משתנה דמי:

פתרון תרגיל מרחבים וקטורים. x = s t ולכן. ur uur נסמן, ur uur לכן U הוא. ur uur. ur uur

פתרון תרגיל 8. מרחבים וקטורים פרישה, תלות \ אי-תלות לינארית, בסיס ומימד ... ( ) ( ) ( ) = L. uuruuruur. { v,v,v ( ) ( ) ( ) ( )

תרגול פעולות מומצאות 3

הסקה סטטיסטית/תקציר/תלמה לויתן

ניהול תמיכה מערכות שלבים: DFfactor=a-1 DFt=an-1 DFeror=a(n-1) (סכום _ הנתונים ( (מספר _ חזרות ( (מספר _ רמות ( (סכום _ ריבועי _ כל _ הנתונים (

x = r m r f y = r i r f

התפלגות χ: Analyze. Non parametric test

תרגיל 13 משפטי רול ולגראנז הערות

ל הזכויות שמורות לדפנה וסטרייך

תשובות מלאות לבחינת הבגרות במתמטיקה מועד ג' תשע"ד, מיום 0/8/0610 שאלונים: 315, מוצע על ידי בית הספר לבגרות ולפסיכומטרי של אבירם פלדמן

[ ] Observability, Controllability תרגול 6. ( t) t t קונטרולבילית H למימדים!!) והאובז' דוגמא: x. נשתמש בעובדה ש ) SS rank( S) = rank( עבור מטריצה m

תרגול 1 חזרה טורי פורייה והתמרות אינטגרליות חורף תשע"ב זהויות טריגונומטריות

שדות תזכורת: פולינום ממעלה 2 או 3 מעל שדה הוא פריק אם ורק אם יש לו שורש בשדה. שקיימים 5 מספרים שלמים שונים , ראשוני. שעבורם

סיכום חקירת משוואות מהמעלה הראשונה ומהמעלה השנייה פרק זה הינו חלק מסיכום כולל לשאלון 005 שנכתב על-ידי מאיר בכור

- הסקה סטטיסטית - מושגים

טושפ הרעשה ןחבמ t ןחבמ

מבחן t לשני מדגמים בלתי תלויים. T test for independent samples

= 2. + sin(240 ) = = 3 ( tan(α) = 5 2 = sin(α) = sin(α) = 5. os(α) = + c ot(α) = π)) sin( 60 ) sin( 60 ) sin(

תרגול מס' 6 פתרון מערכת משוואות ליניארית

אקונומטריקה ד"ר חמי גוטליבובסקי סמסטר א' תש "ע

{ } { } { A חוקי דה-מורגן: הגדרה הסתברות מותנית P P P. נוסחת בייס ) :(Bayes P P נוסחת ההסתברות הכוללת:

רגרסיה ושיטות ניתוח ליניאריות סטודנטים יקרים לפניכם ספר תרגילים בקורס רגרסיה ושיטות ניתוח לינאריות פסיכולוגיה אוניברסיטת בן גוריון.

גמישויות. x p Δ p x נקודתית. 1,1

שאלה 1 V AB פתרון AB 30 R3 20 R

פתרון תרגיל 5 מבוא ללוגיקה ותורת הקבוצות, סתיו תשע"ד

יסודות לוגיקה ותורת הקבוצות למערכות מידע (סמסטר ב 2012)

3-9 - a < x < a, a < x < a

gcd 24,15 = 3 3 =

מבוא לאקונומטריקה ב' החוג לכלכלה [1]

גבול ורציפות של פונקציה סקלרית שאלות נוספות

סיכום בנושא של דיפרנציאביליות ונגזרות כיווניות

The No Arbitrage Theorem for Factor Models ג'רמי שיף - המחלקה למתמטיקה, אוניברסיטת בר-אילן

לדוגמה: במפורט: x C. ,a,7 ו- 13. כלומר בקיצור

מבוא לאקונומטריקה 57322

( k) ( ) = ( ) ( ) ( ) ( ) A Ω P( B) P A B P A P B תכונות: A ו- B ב"ת, אזי: A, B ב "ת. בינומי: (ההסתברות לk הצלחות מתוך n ניסויים) n.

ןמנירג ןואל \ הקיטסיטטס הקיטסיטטסב הרזח ה יפד ךותמ 14 דו 1 מע

הרצאה. α α פלוני, וכדומה. הזוויות α ל- β שווה ל-

I. גבולות. x 0. מתקיים L < ε. lim אם ורק אם. ( x) = 1. lim = 1. lim. x x ( ) הפונקציה נגזרות Δ 0. x Δx

Logic and Set Theory for Comp. Sci.

משוואות רקורסיביות רקורסיה זו משוואה או אי שוויון אשר מתארת פונקציה בעזרת ערכי הפונקציה על ארגומנטים קטנים. למשל: יונתן יניב, דוד וייץ

"קשר-חם" : לקידום שיפור וריענון החינוך המתמטי

קורס: מבוא למיקרו כלכלה שיעור מס. 17 נושא: גמישויות מיוחדות ושיווי משקל בשוק למוצר יחיד

ב הקירטמונוקא ל והינ ו הלכל ל כ גוחה

צעד ראשון להצטיינות מבוא: קבוצות מיוחדות של מספרים ממשיים

Charles Augustin COULOMB ( ) קולון חוק = K F E המרחק סטט-קולון.

סיכום- בעיות מינימוםמקסימום - שאלון 806

קיום ויחידות פתרונות למשוואות דיפרנציאליות

א הקיטסי ' טטסל אובמ רלדנ הינור בג '

לוגיקה ותורת הקבוצות פתרון תרגיל בית 8 חורף תשע"ו ( ) ... חלק ראשון: שאלות שאינן להגשה נפריד למקרים:

1 תוחלת מותנה. c ארזים 3 במאי G מדיד לפי Y.1 E (X1 A ) = E (Y 1 A )

בסל A רמת התועלת היא: ) - השקה: שיפוע קו תקציב=שיפוע עקומת אדישות. P x P y. U y P y A: 10>6 B: 9>7 A: 5>3 B: 4>3 C: 3=3 C: 8=8 תנאי שני : מגבלת התקציב

תדירות הנתונים, שנתיים,annual רבעונים quarterly וכו'. 5 ומשתנה Yהינו 3,6,9,5 ו- 7. נבחר, file-open data-import בשלב זה התוכנה

תרגילים באמצעות Q. תרגיל 2 CD,BF,AE הם גבהים במשולש .ABC הקטעים. ABC D נמצאת על המעגל בין A ל- C כך ש-. AD BF ABC FME

תרגיל 7 פונקציות טריגונומטריות הערות

דף פתרונות 7 נושא: תחשיב הפסוקים: צורה דיסיונקטיבית נורמלית, מערכת קשרים שלמה, עקביות

{ : Halts on every input}

מתמטיקה בדידה תרגול מס' 5

אלגברה ליניארית 1 א' פתרון 2

סדרות - תרגילים הכנה לבגרות 5 יח"ל

PDF created with pdffactory trial version

c ארזים 26 בינואר משפט ברנסייד פתירה. Cl (z) = G / Cent (z) = q b r 2 הצגות ממשיות V = V 0 R C אזי מקבלים הצגה מרוכבת G GL R (V 0 ) GL C (V )

אלגברה מודרנית פתרון שיעורי בית 6

Domain Relational Calculus דוגמאות. {<bn> dn(<dn, bn> likes dn = Yossi )}

אוסף שאלות מס. 3 פתרונות

אלגברה ליניארית (1) - תרגיל 6

TECHNION Israel Institute of Technology, Faculty of Mechanical Engineering מבוא לבקרה (034040) גליון תרגילי בית מס 5 ציור 1: דיאגרמת הבלוקים

אלגברה לינארית מטריצות מטריצות הפיכות

החשמלי השדה הקדמה: (אדום) הוא גוף הטעון במטען q, כאשר גוף B, נכנס אל תוך התחום בו השדה משפיע, השדה מפעיל עליו כוח.

אלגברה לינארית (1) - פתרון תרגיל 11

מתכנס בהחלט אם n n=1 a. k=m. k=m a k n n שקטן מאפסילון. אם קח, ניקח את ה- N שאנחנו. sin 2n מתכנס משום ש- n=1 n. ( 1) n 1

(ספר לימוד שאלון )

מתמטיקה בדידה תרגול מס' 12

s ק"מ קמ"ש מ - A A מ - מ - 5 p vp v=

סטודנטים יקרים. לפניכם ספר תרגילים בקורס הסקה סטטיסטית. הספר הוא חלק מקורס חדשני וראשון מסוגו בארץ בנושא זה, המועבר ברשת האינטרנט.

מתמטיקה בדידה תרגול מס' 2

טודנטים יקרים. הספר הוא חלק מקורס חדשני וראשון מסוגו בארץ בנושא זה, המועבר ברשת האינטרנט.On-line

סטודנטים יקרים. מקורס חדשני וראשון מסוגו בארץ בנושא זה, המועבר ברשת האינטרנט.On-line

( )( ) ( ) f : B C היא פונקציה חח"ע ועל מכיוון שהיא מוגדרת ע"י. מכיוון ש f היא פונקציהאז )) 2 ( ( = ) ( ( )) היא פונקציה חח"ע אז ועל פי הגדרת

brookal/logic.html לוגיקה מתמטית תרגיל אלון ברוק

דיאגמת פאזת ברזל פחמן

נגזר ות צולבות F KK = 0 K MP יריבים אדישים מסייעים MP = = L MP X=F(L,K) שני: L K X =

תשובות מלאות לבחינת הבגרות במתמטיקה מועד חורף תשע"א, מיום 31/1/2011 שאלון: מוצע על ידי בית הספר לבגרות ולפסיכומטרי של אבירם פלדמן.

לוגיקה ותורת הקבוצות פתרון תרגיל בית 4 אביב תשע"ו (2016)

רשימת משפטים והגדרות

אלגברה ליניארית 1 א' פתרון 7

קבוצה היא שם כללי לתיאור אוסף כלשהו של איברים.

משפטי בקרה ולולאות שעור מס. 3 כל הזכויות שמורות דר' דרור טובי המרכז האוניברסיטאי אריאל

בס"ד פאניה - PANYA חוברת סטטיסטיקה ב' קורס סטטיסטיקה ב' למדעי החברה כתבה: ענבל יולזרי החישובי, כולל הדוגמאות המובאות בו, של

לדוגמא : dy dx. xdx = x. cos 1. cos. x dx 2. dx = 2xdx לסיכום: 5 sin 5 1 = + ( ) הוכחה: [ ] ( ) ( )

סטודנטים יקרים. מקורס חדשני וראשון מסוגו בארץ בנושא זה, המועבר ברשת האינטרנט.On-line

co ארזים 3 במרץ 2016

טענה חשובה : העתקה לינארית הינה חד חד ערכית האפס ב- הוא הוקטור היחיד שמועתק לוקטור אפס של. נקבל מחד חד הערכיות כי בהכרח.

חידה לחימום. כתבו תכappleית מחשב, המקבלת כקלט את M ו- N, מחליטה האם ברצוappleה להיות השחקן הפותח או השחקן השappleי, ותשחק כך שהיא תappleצח תמיד.

ההוצאה תהיה: RTS = ( L B, K B ( L A, K A TC C A L K K 15.03

רחת 3 קרפ ( שוקיבה תמוקע)שוקיבה תיצקנופ

בחינה בסיבוכיות עמר ברקמן, ישי חביב מדבקית ברקוד

מודלים חישוביים תרגולמס 5

אינפי - 1 תרגול בינואר 2012

Transcript:

מבוא לאקונומטריקה א' החוג לכלכלה גוּל זה בּוּל. בשבילך!

תוכן העניינים: הקדמה: תזכורת של סטטיסטיקהומתמטיקה... הגדרותוסימונים... אמידה...3 נוסחאותוחוקיםבסטטיסטיקה...4 חוקיהסיגמה...4 חוקיהתוחלת... 5 חוקי השונות... 5 חוקיהשונותהמשותפת...6 פרקראשון: מה זואקונומטריקה?... 7 פרק שני: שלבי התהליךהאקונומטרי... פרק שלישי: אומדי הריבועים הפחותים (אר"פ) וההנחות הקלאסיות... ההנחותהקלאסיות של מודלהרגרסיה:...3 תכונותהאומדים...6 ) לינאריות 6... ( חוסר הטיה... 7 3) יעילות 9... (4 עקיבות... סיכום: השלבים להוכחתהתכונות... תרגולממבחנים... פרקרביעי: מודליםלאליניאריים...5 פרקחמישי: מבחני המובהקות וקריאתפלטים (שלתוכנתSAS )...5 פלטניתוח שונות Variance) 33...(Analysis of מדדיםחשובים של מודל הרגרסיה...33 מבחןF למובהקותמודל הרגרסיה... 34 פלטמקדמיהרגרסיה Esimaes) 36...(Parameer פלטה- Esimaes 39...Covariance of עריכת תחזיתוקריאתפלטים (של (SPSS...43 אמידה נקודתית... 43 43... E(Y ) אמידתמרווחל- אמידתמרווחל- Y...43 פרק שישי: שינוי יחידותמדידה... 46 פרק שביעי: רגרסיהרב משתנית... 48 מבחני המובהקות... 48 מבחןF למובהקותהמודל...48 מבחן למובהקותה- βטות...48 השוואה בין מודלים- R וחוקחיטובסקי...49 מבחן 50...WALD תרגולמסכם...57 סיכום: מבחניםלדוגמא...59 מבחןלדוגמאמס' 59... מבחןלדוגמאמס' 63... מבחןלדוגמאמס' 67... 3 מבחןלדוגמאמס' 75... 4 מבחןלדוגמאמס' 8... 5

הקדמה: תזכורת של סטטיסטיקה ומתמטיקה הגדרות וסימונים יש להבחין בין שני סוגים של משתנים: משתנים אמפיריים ("רגילים") לעומת משתנים מקריים. משתנה אמפירי - משתנה שתוצאותיו ידועות מראש (כמו למשל המשתנה רמת הכנסה, גיל, מס' שנות לימוד במדגם מסוים). משתנה מקרי - משתנה שתוצאותיו לא ידועות מראש (כגון תוצאה בהטלת קוביה או בהטלת מטבע) שני סוגי המשתנים יסומנו באות לועזית עם אינדקס (כמו למשל Y ( או בנוסף לכך ישנם גם קבועים- המקבלים ערך קבוע ומסומנים באות לועזית ללא אינדקס (כמו למשל a או b) באקונומטריקה נעסוק בעיקר במשתנים מקריים. לכל משתנה מקרי התוחלת מסומנת µ יש תוחלת המייצגת את מרכז ההתפלגות. ). E( או.σ השונות מייצגת את מידת הפיזור של ההתפלגות. השונות מסומנת.V( ) σ או סטית התקן היא השורש של השונות והיא מסומנת לשני משתנים מקריים ו- Y יש שונות משותפת (covariance) המהווה מדד להתפלגות המשותפת של שני משתנים מקריים ומייצגת את הכיוון של הקשר ביניהם (יחס ישר או יחס הפוך). השונות המשותפת מסומנת (x,y) cov

כאשר: Cov(,Y)0 Y, בלתי מתואמים Cov(,Y)>0 מתאם חיובי בין המשתנים Cov(,Y)<0 מתאם שלילי בין המשתנים,Y בלתי תלויים,Y בלתי מתואמים מקדם מתאם של פירסון - מדד לכיוון ועוצמת הקשר הלניארי בין שני משתנים: η xy מקדם המתאם מסומן η xy cov( x, y) σ σ x y S S Y n S n n η כאשר: η מתאם ליניארי חיובי מלא בין שני המשתנים η מתאם ליניארי שלילי מלא בין שני המשתנים 0 ηלא קיים מתאם ליניארי בין שני המשתנים אמידה פרמטר- ערך המשתנה הנחקר המתאר את כל האוכלוסיה סטטיסטי/אומד-ערך המשתנה הנחקר המתאר את המדגם n i ( אוכלוסיה מדגם n i i n n ) ( i )( Yi Y ) i n r Y S S Y S i YY V E( ) µ ( ) σ E( E( cov(, Y ) E( E( ))( Y E( Y)) η Y cov(, Y ) V ( ) )) V ( Y) 3

4 -ל וסנכיה ואדיו ןוטרסב אלמ ןורתפל www.gool.co.il דרסורב ןרק תואחסונ םיקוחו הקיטסיטטסב ויהי a-ו,םיירקמ םינתשמ Y-ו :םיעובק b, המגיסה יקוח ( + + + +... 3 ( :עובק לש םוכס a a (3 :םוכסה לופכ עובקל הנתשמ לופכ עובק לש םוכס i a a (4 :םימוכסה שרפה/םוכסלשרפה/םוכס לש םוכס ± ± Y Y ) ( (5 :יכ בל םישל שי Y Y םיחותיפו תורדגה ( :0עצוממהמ תויטסה םוכס 0 ) ( ( עצוממהמ תויעובירה תויטסה םוכס :(תונושה הנומ) S ) ( ) ( (3 :תפתושמה תונושה לש הנומ Y Y Y Y Y Y Y Y S ) ( ) ( ) )( (

חוקיהתוחלת ) תוחלת של קבועקבוע: תוחלת של סכום/הפרש לסכום/הפרש התוחלות: )) E ( a) a ( E( ± Y) E( ) ± E( Y) E( ( E( i i תוחלת של כפל/חילוק לכפל/חילוק התוחלות: E( ) E( ) Y E( Y ) E( [ E( ] ) ) (3 E( Y ) E( ) E( Y ) 4) השפעת טרנספורמציה ליניארית על התוחלת: E ( a / ± b) a / E( ) ± b a a ) חוקיהשונות ) עבור ו- Y בלתי תלויים/בלתי מתואמים מתקיים: שונות של סכום/הפרש סכום/הפרש השונויות V ( ± Y) V ( ) ± V ( Y) V ( i ) V ( i ) עבור ו- Y תלויים/מתואמים מתקיים: שונות של סכום/הפרש סכום/הפרשהשונויות V ( ± Y) V ( ) + V ( Y ) ± Cov(, Y ) שונות של קבוע 0 : V ( a) 0 ( (3 V ( a± x) V ( ) 4) השפעת טרנספורמציה ליניארית על השונות: ( + ) ( ) V a b a V 5

הערה חשובה: חוקי התוחלת והשונות מתייחסים למשתנים אמפיריים כאל קבועים (יוצאים מחוץ לתוחלת או לשונות). חוקי הסכום מתייחסים למשתנים אמפיריים כמשתנים הנשארים בתוך הסיגמא (רק הקבועים ייצאו מחוץ לסיגמא). חוקיהשונותהמשותפת ) שונות משותפת בין משתנה לקבוע 0: cov(, a) 0 ( שונות משותפת של משתנים המוכפלים בקבוע: cov( a, by) ab cov(, Y ) (3 שונות משותפת של משתנה עם עצמושונות המשתנה: cov(, ) V ( ) cov( Y, Y ) V ( Y ) 6

פרק ראשון: מה זו אקונומטריקה? אקונומטריקה היא שיטת מחקר שבאמצעותה אנחנו מוצאים קשר בין משתנים. למשל, אם נדע את הקשר בין שער הריבית לבין שער הדולר, נוכל לדעת איך שער הריבית משפיע על שער הדולר, ונוכל להשתמש בזה לתחזיות כלכליות. במציאות קיימים חוקים הקושרים בין משתנים. חוקים אלה אינם ידועים לנו, אבל אנו יכולים לראות התוצאות שנובעות מהחוקים האלה. אנו משתמשים בתוצאות אלו כדי לשחזר את החוקים. השיחזור נקרא רגרסיה. נתחיל בדוגמא: מתווך דירות בתל אביב רצה לבדוק איך משפיע גודלה של דירה על המחיר שבו היא נמכרת. הוא הניח הנחות מקדימות: ) רק גודל הדירה משפיע על מחיר הדירה באופן שיטתי. כל שאר הדברים המשפיעים על מחיר הדירה הם אקראיים ולא ניתנים לחיזוי. ) ההשפעה של גודל הדירה על מחיר הדירה היא לינארית. שתי ההנחות האלה מאפיינות את הקשר. אם נסמן את גודל הדירה ב- ואת מחיר הדירה ב- Y, נוכל לכתוב באופן מתמטי כי. Y α+ β + u זהו המודל של המתווך. ההנחות של המתווך נקראות הספציפיקציה של המודל. המשתנים של המודל. Y הוא המשתנה המוסבר של המודל. ו- Y הם הוא המשתנה המסביר של המודל (יכול להיות יותר ממשתנה מסביר אחד). α ו- β הם הפרמטרים של המודל. α נקרא חותך. β, או כל מקדם אחר של משתנה מסביר, נקרא שיפוע. u מכונה ההפרעה האקראית (לעיתים מכונה בבדיחות הדעת קריזה). מודל: Y α + β + u משתנה פרמטרים: משתנה הפרעה אקראית מוסבר - α חותך מסביר "קריזה" - β שיפוע 7

אחרי הגדרת המודל המתווך אסף נתונים על 6 דירות, שנמכרו בחודש האחרון באותו איזור. זהו המדגם של המתווך. במדגם יש 6 תצפיות. נוהגים להציג את המודל כאשר לכל. Y α+ β + u האינדקס מייצג את מספר התצפית. משתנה נוסף אינדקס מספר הדירה 3 4 5 6 גודל הדירה במ"ר מחיר הדירה באלפי דולרים Y 90 Y 0 Y 3 50 Y 4 90 Y 5 360 Y 6 380 70 70 3 80 4 00 5 0 6 0 נציג את 6 התצפיות בגרף: 400 360 30 Y 80 40 00 60 60 70 80 90 00 0 0 30 8

מהו הקו הישר המתאר את הקשר בין שני המשתנים בצורה הטובה ביותר? (הקו הוא ישר בגלל שהמתווך הניח לינאריות של המודל). מסתבר שקו הרגרסיה הטוב ביותר הוא קו שחושב בשיטת הריבועים הפחותים (השיטה תתואר במלואה בהמשך): הנוסחה של הקו היא:. Yˆ 7.3+ 3.9 זהו כנראה לא הקו האמיתי, אך ממילא את הקו האמיתי אף פעם אי אפשר לדעת. סביר שקו זה הוא די קרוב לקו האמיתי. לפי הנוסחה כל מ"ר נוסף שיש בדירה מעלה את מחירה ב- 3,90 דולר. מקו זה יודע המתווך להעריך מחירים של דירות. כשפנה אליו בעל דירה שגודלה 90 מ"ר ושאל אותו מה שווי הדירה, חישב המתווך לפי הנוסחה, 90 3.9, +7.3 והשיב לבעל הדירה: "המחיר שאתה יכול לקבל עליה 68.78 הוא 68,780 דולר. אם יהיה לך מזל תקבל יותר, אבל יכול להיות שתצטרך למכור בפחות". בשפה אקונומטרית נוכל לומר כי אם יהיה לו מזל אז ההפרעה האקראית תהיה חיובית, ואם לא היא תהיה שלילית. 9

לסיכום: ) במודל ( αו-, Y α+ β + u β הם מספרים קבועים אך לא ידועים. אנו יכולים להעריך אותם ולקבל אומדים (תהליך קבלת האומדנים נקרא אמידה). ˆα הוא האומד ל-.α βˆ הוא האומד ל- β. 3) אומדי ריבועים פחותים (אר"פ) הם אומדים שחושבו בשיטת הריבועים הפחותים. אומדי הריבועים הפחותים מסומנים בד"כ ע"י 'כובע' - ˆβ. אומדים אחרים מסומנים בד"כ ע"י 'תלתל' -. ɶ β 4) בעוד α ו- β הם קבועים, αˆ מדגם מתקבלים βˆ ˆ αו- אחרים. ו- ˆβ הם משתנים מקריים. מדוע? מפני שבכל 5) את αו- β אי אפשר לדעת, ולכן אי אפשר לדעת מהו הקו האמיתי, וכן אי אפשר לדעת את.u 6) אפשר לדעת את * עבור הוא,uˆ שהיא הסטיה מקו הרגרסיה. נגדיר זאת באופן הבא:, הערך הצפוי של המשתנה המוסבר ). Yˆ ˆ α+ ˆ β * הסטיה של התצפית (Yˆ המתקבל לפי הרגרסיה. u Y Yˆ ˆ היא (Yˆ Y) מהערך הצפוי לפי הרגרסיה ) ) Y Yˆ ˆ α + ˆ β Y uˆ קו הרגרסיה (הקו הנאמד) תצפית בודדת 0

הגדרת מודל פרק שני: שלבי התהליך האקונומטרי כל הגורמים המשפיעים באופן שיטתי חייבים להופיע במודל. כל ההשפעות האקראיות באות לידי ביטוי בקריזה. איסוף נתונים ככל שמספר התצפיות במדגם גדול יותר כן יהיו התוצאות טובות יותר. אמידה יש שיטות אמידה רבות. אנחנו לומדים רק על אומדי הריבועים הפחותים. ניתוח סטטיסטי של התוצאות מובהקות הרגרסיה (באמצעות מבחן מובהקות האומדים (באמצעות מבחן ניתוח כלכלי של התוצאות ), F איכות הרגרסיה (באמצעות,( R.( משמעות הקשר בין המשתנים וביצוע תחזיות אם יש צורך. במבחן: הגדרת מודל בד"כ איננו צריכים להגדיר את המודל אלא מגדירים אותו בשבילנו. איסוף נתונים את הנתונים איננו צריכים לאסוף. אמידה אנחנו צריכים לדעת באופן תאורטי איך אומדים וכן את תכונות האומדים. האמידה עצמה מבוצעת ע"י מחשב, ואנו מקבלים את תוצאותיה. ניתוח סטטיסטי של התוצאות אנו צריכים לשלוט הן בתאוריה והן בפרקטיקה של הניתוח. ניתוח כלכלי של התוצאות נדרש ברמה בסיסית.

פרקשלישי: אומדיהריבועיםהפחותים (אר"פ) וההנחותהקלאסיות שיטת האמידה של αושל βנקראת שיטת הריבועים הפחותים Ordinary Leas Squares (OLS) השאלה הנשאלת בשיטת אמידה זו היא: איזה ריבועי טעויות האמידה. ובתרגום מתימטי: ˆ αו- ˆ βיביאו למינימום את סכום [ ( ˆ y ˆ α + βx) ]? min ˆ min ( ˆ ) min ˆ ˆ u ˆ ˆ y y ˆ ˆ αβ αβ αβ מתוך גזירת הפונקציה הזו מתקבלית האומדים ˆ αו- ˆβ. מודל עם חותך ושיפוע מודל ללא חותך מודל רק עם Y β + u חותך Y α+ β + u Y α+ u ˆ α Y ˆ β Y ˆ S S Y β ( ( )( Y Y) ( ( ) ) Y ) חישוב האומדים E( ˆ α) α E( ˆ β) β ˆ α Y ˆ β E( ˆ β) β E( ˆ α) α תוחלת האומדים σ V( ˆ α ) u V ( ˆ β) σ i u V V ( ˆ) σ β S ( ˆ) u α σ u + S שונות האומדים

**הערה חשובה: "המשוואות הנורמליות": עבור המודל הקלאסי (עם חותך): בתהליך הגזירה של פונקציית הריבועים הפחותים מתקבלות בגזירה של α מתקבלת המשוואה הנורמאלית: û 0 uˆ x בגזירה של β מתקבלת המשוואה הנורמאלית: 0 עבור מודל ללא חותך: מתקבלת משוואה נורמאלית אחת מגזירת β בלבד: uˆ x 0 פיתרון המשוואות הנורמאליות נותן את נוסחאות האומדים- בטבלה לעיל. ˆ αו- ˆ βהנתונות.( המשוואות הנורמאליות צריכות להתקיים על מנת שפונקציית הריבועים הפחותים תתקיים uˆmin) ההנחות הקלאסיות של מודל הרגרסיה: כדי שהנוסחאות הנ"ל יהיו נכונות וכדי שתכונות האומדים (שיפורטו בהמשך) יתקיימו, צריכים להשמר מספר כללים. כללים אלו נקראים ההנחות הקלאסיות. קיימות 7 הנחות כאלה: ) קיים קשר ליניארי בין המשתנה המוסבר למשתנה המסביר. u +מסביר α+β מוסבר מקדם β: שיפוע הקו המתאר את הקשר בין המסביר למוסבר. כדי שהקשר יהיה ליניארי שיפוע β צריך להיות קבוע. ** שימולבכיישנםמודליםבהםהקשרבין ל- Y הואלאליניאריאבלבין המסבירלמוסברכןנקבלקוישרששיפועוקבוע, כמולמשלבמודל:. y α+ β ln x+ u 3

( קיימים לפחות שני ערכי ששונים זה מזה: המשמעות הסטטיסטית של הנחה זו היא כי פיזור או שונות השונה מ- 0. הבעיהב- קבועהיאששונותושווהל- 0 וכאשר שווה גם הוא ל- 0. S ( ) הואמשתנהולא קבוע. כלומר, ישלו 0 0 S הקשרביןה- ל- Y (3 תוחלת ההפרעה האקראית היא אפס לכל תצפית: E( u ) 0 לכל לכל ערך באוכלוסיה יש פיזור מקרי של ערכי Y ושל טעויות או "קריזות" (u), כל אחת מקריזות אלו איננה ניתנת לחיזוי אך בממוצע הן מתקזזות ומתאפסות ואנחנו פועלים לפי ההיגיון הכלכלי אותו ניתן לנבא על סמך הקו. 4) ה- ים אינם משתנים מקריים. אנו מניחים שהמשתנה המסביר הוא אקסוגני, כלומר ידוע מראש, משפיע על Y אבל לא מושפע ממנו בחזרה. במילים אחרות, ניבוי Y על סמך מסוים, מחייב את ה- להיות משתנה אמפירי, ידוע מראש ולא אקראי ולהיות המשתנה המסביר, המשפיע במודל. למשל, אם נרצה לנבא את תצרוכת משפחה על סמך הכנסתה, כאשר נדגום משפחה ונשאל להכנסתה נצפה לקבל תשובה מסויימת (שההכנסה למשפחה לא תהיה אקראית) ולהניח כי זהו המשתנה המשפיע על התצרוכת ולא להיפךבמודל הניבוי הנוכחי בו אנו משתמשים. ** שימו לב כי מהנחה זו משתמע גם כי המתאם בין הטעויות לערכי שווה ל- 0 :.( שווה ל- 0 עבור כל U לבין המתאם בין (שכן cov (, u ) 0 5) הומוסקדסטיות: השונות של ההפרעה האקראית זהה לכל תצפית ותצפית: לכל V u ( ) σ u הפיזור סביב קו הרגרסיה הוא אחיד. 4

) ( לכל s (6 אין מתאם בין הפרעות אקראיות: 0 u cov u, s "הקריזות" של תצפיות שונות אינן תלויות אחת בשניה. הדבר תלוי בדגימה האקראית של התצפיות. למשל, אם אנו בוחנים השפעה של ההכנסה על התצרוכת של משפחות, אם דגמנו באופן אקראי את המשפחות, לא יהיה קשר בין הטעות בניבוי של תצרוכת משפחה.( u s ( u לטעות בניבוי התצרוכת של משפחה אחרת ) מסוימת ) u 7) ההפרעות האקראיות מתפלגות נורמלית : N התפלגות נורמלית של טעויות סביב התוחלת (ששווה כאמור ל- 0 ) משמעה שרוב הטעויות בניבוי הן קטנות ולא מאוד משמעותיות. לסיכום: ( קיים קשר ליניארי בין המשתנה המוסבר למשתנה המסביר. S ( ) איננו קבוע: 0 ( (3 תוחלת ההפרעה האקראית היא אפס לכל תצפית: E( u ) 0 אינם משתנים מקריים ולשונות 0 ) u cov (, (4 (5 ניתן להוציא אותם מחוף לתוחלת לכל הומוסקדסטיות: שונות ההפרעה האקראית קבועה לכל תצפית: לכל V u ( ) σ u u ב"ת: 6) s ( ) 0 u cov u, לכל s (7 ההפרעות האקראיות מתפלגות נורמלית : N u 5

תכונות האומדים אומדי הריבועים הפחותים הם לינאריים, חסרי הטיה, יעילים ועקיבים. ) לינאריות.Y אר"פ ניתנים להצגה כקומבינציה לינארית של במילים אחרות, כדי ש- ˆ βלמשל, תהיה אומד ליניארי צריך להתקיים:. היא קומבינציה של ערכי W ˆ β ˆ W β Y a ˆ β ˆ βכאשר W Y Y למשל: אומד זה ניתן להצגה בצורה הבאה: Y + Y +... + Y לפיכך מדובר באומד ליניארי. הוכחת ליניאריות עבור המודל הקלאסי: ; S xy β α S xx v Y, v w Y, w w i S xx כלל אצבע-כיצד יודעים אם אומד הוא לינארי? הלכה למעשה יש לבדוק האם מתקיימים 3 התנאים הבאים: המשתנים המקריים בחזקה או בשורש). בין המשתנים המקריים כל שאר הגורמים פרט ל- y ( y הם ממעלה ראשונה (כלומר לא יהיו נתונים (ה- 6 כזכור, איננו משתנה מקרי). ( y יש סכום או הפרש (ולא כפל או חילוק). (ה- אינם משתנים מקריים (בהתאם להנחות, x ( ( (3

לסיכום: אם בנוסחה של האומד לא מופיעים סימני כפל בין בחזקה/שורש של Y Y -ים או העלאה וכן ה- Y -ים לא מופיעים במכנה, אז סביר להניח שהאומד לינארי.?האם האומדים הבאים הם אומדים ליניאריים? βˆ ( ( ) Y ) א. ~ β 3 Y ( Z + Y ) ב. ) חוסר הטיה התוחלת של אר"פ שווה לערך האמיתי של הפרמטר. כלומר, אומד יהווה אח"ה לפרמטר ϑאותו הוא אומד באוכלוסיה אם מתקיים: ˆ ϑמסויים E( ˆ) ϑ ϑ זהו מושג תאורטי (ולא קונקרטי) שאומר כי ממוצע כל האומדים המדגמים האפשריים בגודל מסוים שווה לפרמטר ) ϑ). ) ˆϑ) של אינסוף עבור מדגם מקרי אחד האומד איננו שווה לפרמטר (ϑ ˆ ϑ ( אבל על פני אינסוף המדגמים האפשריים, ממוצע האומדים כדי שהאומד יהיה אח"ה. ( E(ϑˆ) ) צריך להיות שווה לפרמטר ) ϑ) כיצד יודעים אם אומד הוא חסר הטיה? בשלב הראשון יש לבצע עבודת הכנה מבטאים את האומד באמצעות הפרמטר האמיתי: מתחילים מהאומד המוצע, Y את המודל ומפתחים אלגברית. מציבים במקום ה- 7

** יש לזכור כי: u מהווים משתנים מקריים נשארים בתוך התוחלת, השונות וה-. y x איננו משתנה מקרי (על פי הנחה מס' 4) יוצא מחוץ לתוחלת ולשונות אך נשאר בתוך ה- α קבועים יוצאים מחוץ לתוחלת, לשונות ול- β Y ˆ :β Y β + u והאומד המתאים לו דוגמא: עבור המודל ( β + ) β Y u u u ˆ + β+ β שלב מקדים זה יעשה לפני בדיקת חוסר הטייה, יעילות ועקיבות. הוכחת חוסר הטיה מפעילים תוחלת על האומד, ואם התוחלת שווה לפרמטר האמיתי אז האומד חסר הטיה. ( הוא אומד חסר הטיה ל- β. ˆ) בשפה מתמטית: אם, E β β אז βˆ כדי שהדבר יתקיים הנחות (3) ו- (4) חייבות להתקיים. המשך הדוגמא שלעיל: ( ) ( ˆ u u E u E β) E β+ E ( β) + E β+ β מסקנה: האומד חסר הטיה! 8

( u כלל אצבע: אם בעבודת ההכנה נשארים בסוף הפיתוח רק שני סוגי איברים: ) הפרמטר האמיתי ) איבר או כמה איברים שמכילים את אז האומד חסר הטיה. למשל, בעבודת ההכנה שלעיל: u u ˆ + β β (קומבינציה ליניארית של איבר המכיל את הפרמטר האמיתי u?נתון האומד הבא: ~ β Y האם האומד הנ"ל הוא חסר הטיה? בדוק במודל עם חותך. בדוק במודל ללא חותך. 3) יעילות ) יעילות פירושה השונות הקטנה ביותר. ככל שהשונות של האומד קטנה יותר, כך יש הסתברות גבוהה יותר שהוא יהיה קרוב יותר לפרמטר האמיתי באוכלוסייה אותו הוא אומד. ˆ ϑיקרא אומד יעיל יותר מ- ϑˆ אם מתקיים שהשונות שלו קטנה יותר: V ϑˆ ) < V ( ˆ ( ϑ 9

משפט גאוס מרקוב: יעילות היא תמיד מושג השוואתי. לכן בכדי לדעת האם השונות של האומד היא המינימאלית האפשרית נשתמש במשפט גאוס מרקוב. לפי משפט גאוס-מרקוב אר"פ הם בעלי השונות הנמוכה ביותר בקבוצה שלהם (קבוצת האומדים הלינאריים חסרי ההטיה), והם נקראים Bes ).B.L.U.E.(Linear Unbiased Esimaion כלומר: אם האומד שלנו הוא ליניארי וחסר הטייה מבלי לחשב את שונותו נדע לפי משפט גאוס-מרקוב שהיא גדולה יותר משל אומד הריבועים הפחותים. אם האומד איננו ליניארי ו/או חסר הטיה לא ניתן להשתמש במשפט גאוס- מרקוב ואז היחס בין שונות האומד לשונות אומד הריבועים הפחותים המקביל איננו ידוע. כיצד מחשבים שונות של אומד? ראשית כל, הנחות (4), (5) ו-( 6 ) חייבות להתקיים. אם הן מתקיימות, מחשבים u את השונות של האיברים המכילים את מהפיתוח הקודם. V ( β) נדגים על ידי חישוב שונות אר"פ ˆβ:. במודל ללא חותך ˆ u V ( u) V u V ( ) ( ) V( u) σ u σ u σ u ( ) ( ) ( ) ( ) V ( ˆ) β V ( [ ( ) V ( u )] [ ( ) V ( u )] S ( ) u V ) S S ( S ) u. במודל עם חותך σ S S V ( S ) u σ s xx 0

4) עקיבות ככל שהמדגם יגדל כן יתקרב האומד לערך האמיתי של הפרמטר. אם נגדיל את המדגם לאינסוף תצפיות ונחשב את האומד, הוא יהיה שווה לפרמטר θˆ ϑ האמיתי באוכלוסיה ) ( תנאי הכרחי לעקיבות: האומד חייב להיות פונקציה של גודל המדגם. במילים אחרות, האומד צריך להיות מושפע מגודל המדגם. ברגע שהאומד עונה על תנאי זה הוא יהיה עקיב. אומד המחושב במדגם סופי בהגדרה לא יוכל להיות עקיב לפרמטר באוכלוסיה. **הערה חשובה: בכדי שאומד יהיה עקיב, הנחות -4 צריכות להתקיים. סיכום: השלביםלהוכחתהתכונות הוכחת ליניאריות הכנת האומד להציב במקום במודל עם חותך: Y Y α + β + u במודל ללא חותך: פיתוח האלגברה Y β + u את המודל האמיתי. חישוב תוחלת, שונות, עקיבות. ליניאריות מהווה תנאי הכרחי לחוסר הטיה. ליניאריות וחוסר הטייה מהוות תנאי הכרחי לבחינת היעילות של האומד לפי משפט גאוס-מרקוב. עקיבות איננה תלויה בתכונות האחרות, אלא רק בהיותו של האומד פונקציה של גודל המדגם (לא מחושב על מדגם סופי). כך שאומד לא חייב להיות ליניארי או חסר הטיה כדי להיות עקיב. ( ( (3 (4

העקיבות משפיעה על היעילות של האומד. עבור אומדים התלוים בגודל המדגם: ככל שגודל המדגם גדול יותר כך שונות האומד קטנה והאומד יהיה יעיל יותר לפרמטר באוכ'. תרגולממבחנים?תרגיל המבוסס על שאלה ממבחן לדוגמא (בשווי של 5 נקודות) נתון המודל 00, Y α+ β + u כאשר מתקיימות כל ההנחות הקלאסיות. 00 50 Y Y ɶ 5 β 00 50 5 נתון האומד א. האומד ב. האומד ג. האומד ד. האומד נכון / לא נכון נכון / לא נכון נכון / לא נכון נכון / לא נכון β הינו אומד חסר הטיה ל- ɶ β β ɶ β ɶ β ɶ β הינו אומד עקיב ל- הינו אומד לינארי ל- β הינו אומד יעיל ל- β ה. השונות האמיתית של ɶ β היא:?תרגיל המבוסס על שאלה ממבחן לדוגמא (בשווי של 4 נקודות) נתון המודל, Y β + u כאשר כל ההנחות הקלאסיות מתקיימות. (יש לשים לב המודל ללא חותך) נתון האומד: א. האומד ɶ Y β β ɶ הינו אומד מוטה ל- :β נכון / לא נכון / אי אפשר לדעת

ב. על סמך משפט גאוס-מרקוב ניתן להסיק כי ɶ β איננו אומד יעיל יותר מאומד נכון / לא נכון/ לא ניתן לדעת הריבועים הפחותים: ג. מהי השונות האמיתית של β? ɶ?תרגיל המבוסס על שאלה ממבחן לדוגמא (בשווי של 6 נקודות) נתון המודל, Y β + u כאשר כל ההנחות הקלאסיות מתקיימות. (יש לשים לב המודל ללא חותך) β ɶ נתון האומד: Y ( ) א. מהי התוחלת של β? ɶ ( ) ב.. E ɶ β < β נכון / לא נכון / אי אפשר לדעת ג. על סמך משפט גאוס-מרקוב ניתן להסיק כי אומד הריבועים הפחותים הינו אומד יעיל יותר מ-. ɶ β נכון / לא נכון/לא ניתן לדעת? Y ד. מהי השונות האמיתית של האומד?שאלות נוספות מתוך מבחנים בכל השאלות ההנחות הקלאסיות מתקיימות. האומדים הם אר"פ, והמודל הוא. Y α+ β + u ( ) ( ˆ E Y) E Y. נכון / לא נכון / אי אפשר לדעת נכון / לא נכון / אי אפשר לדעת ( ) Y 0. 3

3. אמידת המודל בשיטת הריבועים הפחותים תתן את התוצאה: 0 u נכון / לא נכון / אי אפשר לדעת.4 אם נתון ש- 0.57 r, אזי :βˆ Y א. הוא בהכרח שלילי ב. הוא בהכרח חיובי ג. הוא בהכרח שווה לאפס ד. לא ניתן לקבוע את סימנו על סמך הנתונים הקיימים 5. סמן את הטענה הנכונה בהכרח: ( ) Y uˆ 0 ( ) S א. ב. ג. 0 u ד. אף אחת מהטענות הנ"ל אינה נכונה בהכרח. 6. אומדי הריבועים הפחותים אינם חסרי הטיה, אם נתון שהשונות של u אינה נכון / לא נכון / אי אפשר לדעת קבועה. 7. אומד חסר הטיה הוא אינו בהכרח גם אומד עקיב. נכון / לא נכון / אי אפשר לדעת 4

פרק רביעי: מודלים לא ליניאריים עד עכשיו דיברנו רק על מודלים ליניאריים.(linear-linear) בפרק זה נלמד גם על מודלים שאינם ליניאריים: מודל חצי לוגריתמי,(semi-log) מודל לוגריתמי כפול.(linear-log) ומודל לוג ליניארי (double-log) נשאלת השאלה-מתי מודל מוגדר כליניארי? מודל מוגדר כליניארי כאשר הוא מתאר קשר קוי בין המשתנים- המסביר והמוסבר שלו. למשל המודל הליניארי הקלאסי: Y α+ β + u Y המשמעות של קשר ליניארי היא שהנגזרת- היא קבועה. מתאר קשר קוי בין x ל- y. נגזרת זו מתארת את השינוי השולי (השיפוע של הגרף): אם מגדילים את x ביחידה אחת, בכמה יחידות משתנה y. במודל הליניארי- שינוי זה הוא קבוע ושווה ל-.β בניגוד למודל הליניארי, שלושת המודלים האחרים (המודלים הלוגריתמים) מתארים קשרים שאינם ליניאריים בין ל- Y. במודלים אלו השינוי השולי (השיפוע) לא יהיה קבוע, אלא תלוי במשתנים- x או y או בשניהם: במודל החצי לוגריתמי הקשר בין x ל- yמתואר על ידי הפונקציה הבאה: Y e α+ βx+ u Y השינוי השולי איננו קבוע אלא תלוי ב- y : β Y. ככל ש- Y גדל כך השיפוע ) β ( גדל. ( משמעות ה- βבמודל כזה היא שיעור השינוי השולי: β Y Y 5

שיעור שינוי שולי אומר: אם מגדילים את ביחידה, בכמה % ישתנה Y. במודל החצי לוגריתמי עבור עליה ביחידה אחת של Yישתנה, ב-. 00 β % במודלים אלו, המתארים שיעורי תשואה, השינוי באחוזים הוא קבוע למרות שהשינוי השולי איננו קבוע. ב במודל הלוגריתמי הכפול הקשר בין xל- y מתואר על ידי הפונקציה הבאה: Y e α β e u השינוי השולי איננו קבוע אלא תלוי ב- xוב- y : משמעות ה- β במודל כזה היא הגמישות: Y. β β Y Y Y Y Y משמעות הגמישות היא שינוי שולי באחוזים: אם מגדילים את ב-% אחד, בכמה % ישתנה Y. במודל הלוגריתמי הכפול ה- βמייצגת את הגמישות, כלומר אם נגדיל את %- אחד, Y ישתנה ב-.%β במודלים אלו הגמישות היא קבועה למרות שהשינוי השולי איננו קבוע. ( e y e u במודל הלוג-ליניארי הקשר בין xל- yמתואר על ידי הפונקציה הבאה: e α β השינוי השולי איננו קבוע אלא תלוי ב-. Y β השולי:. במודל זה אםעולה ב-% אחד, Yעולה ב- β: ככל ש- עולה כך פוחת השינוי β Y ל- β אין משמעות כלכלית במודל זה. (3 6

גמישות בנוסף למשמעות ה- βבכל אחד מהמודלים, מושג נוסף שיש להכיר הוא מושג הגמישות. כאמור, גמישות משמעה: שינוי שולי באחוזים. כלומר בכמה % ישתנה Y אם יגדל ב-% אחד. הביטוי המתימטי לגמישות: Y Y Y Y כלומר, כדי לחשב גמישות יש להכפיל את השינוי השולי ) Y Y ( ב- ( במודל הליניארי- הגמישות: β Y ( (3 (4 β Y במודל החצי לוגריתמי-הגמישות: β Y Y במודל הלוגריתמי הכפול- הגמישות: β β Y β במודל הלוג-ליניארי-הגמישות: Y β Y ניתן לראות כי פרט למודל הלוגריתמי הכפול שבו הגמישות היא קבועה, הגמישות של המודלים האחרים משתנה כפונקציה של או של Y או של שניהם. כלומר ( בלבד., Y ניתן לחשבה עבור נקודה ספציפית על הגרף ) טרנספורמציות של המודלים הלא ליניאריים לקו ישר: בכדי שניתן יהיה לאמוד את המודלים הלא ליניאריים בשיטת,OLS עליהם לעבור טרנספורמציה לקו ישר. טרנספורמציה של המודלים לקו ישר תאפשר לתאר את הקשר בין המשתנה המסביר למשתנה המוסבר באופן לינארי. 7

טרנספורמציה זו תתבצע על ידי הוצאת ln (לוג טבעי) משתי צידי המשוואה בכדי לבטל את ה- e. תזכורת של חוקי לוגים: LN( e x LN( ) Y ) Y LN( ) LN( Y) LN( ) + LN( Y) LN( ) LN ( ) LN( Y) Y המודל ) לוג-ליניארי לפני הטרנספורמציה אחרי הטרנספורמציה Y α+ β ln + u lny α+ βln + u lny α+ β+ u e y e α Y e α Y e β β e u e u α+ βx+ u ) לוגריתמי כפול 3) חצי לוגריתמי אם נתייחס למשתנה המסביר או המוסבר בתוספת הלוג, ניתן יהיה לתאר את הקשר ביניהם באופן ליניארי. 8

סיכום: המודל משמעות ה- β השינוי השולי הגמישות Y ( Y ) Y ( ) בכמה ישתנה Y בכמה % ישתנה Y אם אם נגדיל את נגדיל את ב- %? ביחידה? β Y β ליניארי השינוי השולי Y α+ β + u אם נגדיל את ביחידה Y ישתנה ב- βיחידות β βy חצי לוגריתמי שיעור השינוי השולי lny α+ β + u אם נגדיל את ביחידה β βy 00 β % ישתנה ב- Y ( Y e α+ βx+ u ) לוגריתמי כפול הגמישות lny α+ β ln + u אם נגדיל את ב- % β Y β β% ב- Yישתנה ( Y e α β e לוג ליניארי אין משמעות כלכלית אם נגדיל את ב- % u ) Y α+ β ln + u β ישתנה ב- Y ( e y e α β e u ) **המשתנה שיש בו LN השינוי בו יהיה באחוזים 9

תרגול? על מנת לאמוד את התשואה להשכלה בישראל בשנים 948-990 נאמדו המודלים הבאים: MWAGE 39.547+ 8. 68 SCL MWAGE 445.08+ 39.60 LN ( SCL) LN ( MWAGE) 5.44+ 0.778 LN( SCL) LN( MWAGE) 6.9+ 0. 070 SCL () () (3) (4) א. הסבירו את המשמעות של βבכל אחד מהמודלים ב. חשבו את הגמישות בנקודת הממוצעים : (.3,600.0) עבור כל אחד מהמודלים.?נתונים תוצאות האמידה של המודלים הבאים: Yˆ e 4.5 ˆ 4.5+ 0.05 Y e 0.05 () () Yˆ 0.05 4.5+ (3) ˆ + e Y 4.5+ 0. 05 (4) א. כתבו את המודלים בצורה ליניארית בעזרת טרנספורמציה מתאימה. ב. עבור כל אחד מהמודלים ערכו תחזית נקודתית עבור 6 30

?נתונים המודלים הבאים עבור התוצר במשק:. i β i Q AK e u i. Q i Ae β L i + u i 3. 4. i β i Q A+ K + e i u i β Q i A+ + u L i 5. Q A+ β K + u i i i 6. Q i e A+ β Ki+ u i 7. K i β Qi A( + 7) e u i 8. Q A+ β L + u i K i Q A+ β ( ) + Li 9. i i כאשר: Q- הוצאות צריכה על מוצר מסוים על ידי פרט מסוים. A- הוצאות צריכה על המוצר בהינתן רמת הכנסה ו/או שנות לימוד אפסיים. K- הכנסת הפרט. L- שנות לימוד. i i u 3

א. ב. ג. ד. מי מהמודלים הבאים ניתן לאמידה בשיטת?OLS מי מבין המודלים שלא ניתנים לאמידה בשיטת OLS ניתן להביא למודל ליניארי בפרמטרים ועל כן לאמוד את הפרמטרים שלו? עבור כל אחד מהמודלים קבעו מיהו המשתנה המוסבר ומיהו המסביר במשוואת הרגרסיה הליניארית. עקומת אנג'ל מתארת את גמישות הצריכה של הפרט מוצר מסוים ביחס להכנסתו. איזה מהמודלים מתאים כדי לתאר את עקומת אנג'ל?? נתון המודל הבא: Q i K A i β e u i i i האם ניתן לאמוד את המודל בשיטת?OLS א. מה המשוואה שצריך לאמוד על מנת לקבל את הפרמטרים למודל זה ב. (כלומר כיצד הופכים את המודל לליניארי בפרמטרים)? נאמד המודל הבא : ג. ln( i ) + Q α 0 α ln( K ) + u ˆ α 3, ˆ α 0 והתקבלו התוצאות הבאות: 0.8 מהם האומדנים עבור? A, β 3

פרקחמישי: מבחניהמובהקות וקריאתפלטים (שלתוכנת (SAS פלט ניתוח שונות Variance) (Analysis of להלן פלט ניתוח שונות של :SAS Analysis of Variance Sum of Mean Source DF Squares Square F Value Prob>F Model k RSS RSS MSR k MSR F PF + + MSE Error k C oal ESS SS ESS MSE k --------------------------------------------------------------------------------------------- Roo MSE MSE s R-square Dep Mean Y Adj R-sq s C.V. u 00 Y u RSS R SS R SS k ESS פלט זה מתחלק לשני חלקים: החלק הראשון (מעל לקו המקווקו) מתאר את מבחן F למובהקות מודל הרגרסיה. החלק השני (מתחת לקו המקווקו) מתאר מדדים חשובים של מודל הרגרסיה. מדדים חשובים של מודל הרגרסיה מדד לטיב ההתאמה (R-square) עונה על השאלה: איזה אחוז מהשונות של המשתנה התלוי (Y) מוסבר על ידי קו R ( הרגרסיה, ההיגיון הכלכלי ( ים)? מדד לפרופורציית השונות המוסברת. 33

0 R RSS SS ESS SS R נע בין 0 ל-. ככל שקרוב יותר ל- ההתאמה טובה יותר. אר"פ מביא למקסימום את R בהוספת משתנים מסבירים נוספים למודל, R ( יכול רק לעלות או "להתנפח" או לכל היותר להשאר ללא שינוי (כתוצאה מהירידה בשונות הלא מוסברת.(ESS (Adj R-sq) המתוקן R - R עונה על השאלה: האם כדאי היה לי להוסיף משתנים ב"ת נוספים למודל? משמש להשוואה בין מודלים בעלי מספר שונה של משתנים מסבירים: R R ( ) k המדד המתוקן לפרופורצית השונות המוסברת ) R ( לוקח בחשבון את "ההפסד" בדרגות החופש כתוצאה מהוספת המשתנים למודל ולא רק את "הרווח" בירידת השונות הלא מוסברת (ה- ESS ). לכן, בניגוד ל- לעלות. R ה-, R יכול לרדת בהוספת משתנים למודל ולא רק מבחןF למובהקותמודלהרגרסיה מבחן מובהקות העונה לשאלה: האם מודל הרגרסיה שלנו לניבוי משתנה תלוי מסויים על ידי k משתנים ב"ת, מובהק באוכלוסיה? השערות: 34 H H 0 : R : R 0 > 0 סטטיסטי המבחן: F MSR MSE RSS R K K ESS R K K

את סטטיסטי F נחשב בעזרת לוח ניתוח השונות המוצג בחלק הראשון בפלט. כלל החלטה ומסקנה: נדחה את H0 כאשר: שימוש בטבלת F>F(K,-K-;-α) F: שימוש בפלט: PF<α מסקנה: יש/אין עדות לכך שמודל הרגרסיה מובהק באוכלוסיה.?חוקר רצה לבחון את השפעת ההכנסה (INCOME) על גובה המס (A). A α + β INCOME + u (במיליארדי $) שגובה מדינה במערב לפי המודל : לשם כך אסף נתונים מ- 5 מדינות. להלן התוצאות: Model: MODEL Dependen Variable: A Analysis of Variance Sum of Mean Source DF Squares Square F Value Prob>F Model 046.89694 046.89694 8798.67 0.000 Error 49.399 0.364 C oal 50 058.965 Roo MSE 0.483 R-square 0.9945 Dep Mean 5.44 Adj R-sq 0.9943 C.V. 8.887 בדקו את ההשערה כי המודל מובהק ברמת מובהקות של 0.05. 35

פלט מקדמי הרגרסיה Esimaes) (Parameer להלן פלט מקדמי הרגרסיה של :SAS Parameer Esimaes Parameer Sandard for H0: Variable DF Esimae Error Parameer0 Prob> INERCEP ˆ α ˆ β s ˆ α ˆ α s ˆ α ˆ β P ˆ α ( ˆ α 0) s ˆ β ( ˆ 0 s β ) ˆ ˆ β P β βˆ ˆ αו- ניתוח הפלט הפלט לעיל מתאר את מקדמי הרגרסיה: שורה ראשונה מתייחסת ל- ˆα ומובהקותם. המכונה ה"חותך" של קו הרגרסיה (INERCEP) ומובהקותו. השורות הבאות מתייחסות למקדם של המשתנים הבלתי תלויים, ל- βˆ טות. בדוגמא שלהלן קיים משתנה מסביר אחד בלבד (k). במודל של רגרסיה רבת משתנים יתווספו שורות נוספות כמספר המשתנים הבלתי תלויים במודל. Parameer Esimae מתאר את ערך המקדמים ˆ αוה- βˆ טות. כל שאר הנתונים מתייחסים למבחני המובהקות שלהם. 36

מבחן למובהקותה- β מבחן מובהקות העונה לשאלה:האם משתנה מסביר מסויים רלוונטי למודל β > 0 ( K, α ) P (מובהק)? השערות: H H 0 : β 0 : β 0 סטטיסטי המבחן: β 0 ˆ β β 0 S ˆ β כלל הכרעה ומסקנה: ˆ β נדחה את H0 אם: שימוש בטבלת : שימוש בפלט: α> מסקנה: יש/אין עדות לכך שהמשתנה הב"ת המסויים מובהק באוכ' (ולכן רלוונטי למודל). הערות: ניתן גם לבצע מבחן מובהקות חד צדדי ל- βהנותן מענה על השאלה: האם מקדם השיפוע או הקשר בין המשתנים הוא חיובי או שלילי באוכ'? H H ההשערות: 0 : β 0 : β > / < 0 כלל ההכרעה: שימוש בטבלת : β 0 β 0 > < ( K, α ) ( K, α ) שימוש בפלט: p ˆ β <α 37

H H 0 ניתן לבדוק בנוסף האם ה- β (השינוי השולי) שווה לערך מסויים באוכ'. השערות לדוגמא: : β : β סטטיסטי המבחן: β ˆ β S ˆ β (זה לא נתון בפלט של SAS וצריך לחשב) כלל הכרעה: ניתן להשתמש בטבלת אך לא ניתן להשתמש ב- P βˆ שבפלט. במקרה זה ניתן גם לחשב רווח בר סמך ל- β ולראות האם הוא מכיל את הערך המבוקש (את רב"ס ל- β : ) α ( β 0 אם כן- נקבל את H0 ואם לא-נדחה אותה. P ˆ β S β ˆ β + S ( α ˆ β α ˆ ( K, ) ( K, ) β?בהמשך לדוגמא הקודמת- בדיקת השפעת ההכנסה על גודל המס, התקבלו גם התוצאות הבאות: Parameer Esimaes Parameer Sandard for H0: Variable DF Esimae Error Parameer0 Prob> INERCEP - 0.0869 0.08953904-0.97 0.3365 INCOME 0.53 0.0069 93.80 0.000 A α + β INCOME+ U א. אמדו את המודל : מהי המשמעות הכלכלית של? β ב. האם המודל מובהק? בדקו על סמך הפלט הנ"ל ברמת מובהקות של 0.05. ג. מהי רמת המובהקות הקטנה ביותר, עבורה עדיין תידחה השערת האפס מסעיף ב'? ד. בדקו את ההשערה כי ככל שההכנסה עולה כך עולה גם המס (שיפוע β חיובי) ברמת מובהקות של 0.0. ה. בנו רווח-סמך ברמת סמך של 95% עבור β 38

ו. בדקו את ההשערה שתוספת של מיליארד $ להכנסה תגדיל את המס ב - 0. מיליארד $, ברמת מובהקות של 0.05. שימו לב כי- במודל עם משתנה מסביר אחד בלבד קיימת זהות בין מבחן F למובהקות המודל לבין מבחן למובהקות ה- β : F (, ; α ) F ˆ β PF P ˆ β α (, ) כלומר: כל החלטה המתקבלת במבחן אחד חייבת להיות זהה להחלטה המתקבלת במבחן השני. בשאלה לדוגמא ניתן לראות כי: F (,49;0.95) 4 F 8798.67 PF 0.000 P (49,0.975) βˆ 93.80 ˆβ: ˆ αו- פלט ה- Esimaes Covariance of פלט שמתאר את השונות המשותפת (covariance) של האומדנים- Covariance of Esimaes COVB INERCEP INERCEP cov ( ˆ α, ˆ β ) s ˆ α cov ( ˆ α, ˆ β ) שימוש בטבלת ה- cov של SAS יעשה במקרה שבו בהשערת האפס מופיעים שני s ˆ β וα הפרמטרים- - β במקרה כזה יוצרים פרמטר חדש: γ (גמה) המהווה קומבינציה ליניארית של וα β - 39

ˆγ על ידי הצבת האומדנים- השערות: H H 0 : γ 0 : γ 0 סטטיסטי המבחן: ˆ γ γ S ˆ γ מחשבים את את השונות של מחשבים תוך שימוש בנוסחאות :.(SAS הפלט של (מתוך ˆβ ˆ αו- V ( ± Y) V ( ) + V ( Y) ± cov(, Y ) γˆ ( ) a V( ) V a ( a by) a b ( Y) cov, cov, ואחר כך מוציאים לשונות שורש כדי לקבל את סטית התקן. Y α+ β + u דוגמא: נתון פלט האמידה של המודל שלצורך אמידתו נאספו 40 תצפיות: Parameer Esimaes Parameer Sandard for H0: Variable DF Esimae Error Parameer0 Prob> INERCEP 5.5 0.5 0.0000 0.96 0. 8 0.0000 Covariance of Esimaes INERCEP INERCEP 0.065-0.003-0.003 0.044 γ α 5β : H : α 5β 0 יש לבדוק את ההשערה ניצור פרמטר חדש γ השווה לקומבינציה ליניארית של αו- β 40 ההשערות: H : γ 0 H 0 : γ 0

γˆ ˆ α 5 ˆ β 5.5 5 0.96 0.45 :( S γˆ ) γˆ סטטיסטי המבחן: ˆ γ γ S ˆ γ נציב את האומדים: חישוב השונות של V ( ˆ) γ V ( ˆ α 5 ˆ) β V ( ˆ) α + V (5β ) cov( ˆ,5 α ˆ) β V ( ˆ) α + 5 V ( ˆ) β 5cov( ˆ, α ˆ) β 0.065+ 5 0.044 0 ( 0.003) 0.455 S γ ˆ 0.455 0.45 0 0.676 ˆ γ, γ לכן אין סיבה מספקת לדחות את 0.66< (38,0.975) ˆ 0.66 סטית התקן היא :0.676.96 נחשב את הסטטיסטי: כלל הכרעה ומסקנה: השערת האפס. מסקנה: אין עדות לכך שה- α 5β?חוקר רצה לבדוק את השפעת הותק בעבודה (EP) על השכר (SALARY) לפי ( ). ln SALARY הוא אסף 403 תצפיות, ואמד את α+ β EP + u המודל: הפרמטרים בתוכנת.SAS להלן חלקים מהפלט ויש להשלימו: Analysis of Variance Sum of Mean Source DF Squares Square F Value Prob>F Model ---- ---- 5.6805 ---- ---- Error ---- 05.539 ---- C oal ---- ---- Roo MSE ---- R-square ---- Dep Mean 7.447 Adj R-sq 0.045 C.V. 0.060 4

Parameer Esimaes Parameer Sandard for H0: Variable DF Esimae Error Parameer0 Prob> INERCEP ---- (*) ---- ---- ---- EP -0.008740 ---- ---- 0.0009 Covariance of Esimaes COVB INERCEP EP INERCEP 0.00474630 ---- EP -0.00054685 6.88844 E-6 EP (*) נתון נוסף: א. קיים קשר חיובי מובהק בין ותק ללוג השכר. ב. שיעור התשואה בשכר לשנת ותק הוא: ג. תחזית לוג השכר עבור אדם בעל 0 שנות ותק היא: נכון / לא נכון 4

עריכת תחזית וקריאת פלטים (של (SPSS אמידה נקודתית 0 אמידה נקודתית עבור מסוים (תחזית) מחושבת על פי קו הרגרסיה במדגם: Yˆ 0 ˆ α + ˆ β 0 אמידת מרווח ל- ) E(Y 0 כאשר אנו מתבקשים לאמוד את התחזית באוכלוסיה עבור בר סמך לערך ממוצע של Y באוכ' עבור מסוים, נחשב רווח ( ברמת סמך. α E(Y ) ) מסוים 0 נוסחת הרב"ס: ˆ σ u SSE MSE n Yˆ ± ασˆ ( 0 ) + n ( i u n, ) ( i ) S ( n ) S p( E( Y) רישום הרב"ס: α ) אמידת מרווח ל- Y כאשר אנו מתבקשים לאמוד ערך בודד של Y באוכלוסיה עבור 0 מסוים, נחשב מסוים ) Y) 0 ברמת סמך. α 0 רווח בר סמך לערך בודד של Y באוכ' עבור Yˆ ± ασˆ נוסחת הרב"ס: ( 0 ) + + n ( i u n, ) רישום הרב"ס: p( Y ) α 43

רב"ס לערך בודד יהיה רחב יותר מאשר רב"ס לערך ממוצע משום שטעות התקן בראשון גדולה מאשר באחרון. רב"ס לערך ממוצע מנסה לאמוד את התחזית באוכ' עבור ערך מסוים של ואילו רב"ס לערך בודד מנסה לאמוד את תחום ערכי Y באוכ' עבור ערך מסוים. התחזית מדויקת יותר (שונות התחזית קטנה יותר) כאשר: n (גודל המדגם) גדול יותר שונות המשתנה המסביר גדולה יותר קרוב יותר ל 0 האומד לשונות הטעויות- ˆσ, קטן יותר. u...3.4 דוגמא: במדגם של 30 דירות מושכרות לסטודנטים ברדיוס של עד ק"מ מסביב למכללה נחקר הקשר בין שכר דירה למספר הסטודנטים הגרים בדירה. להלן התוצאות: Descripive Saisics Mean Sd. Deviaion N 386.7667 שכרהדירה 509.4607 30 3.0000 מספרהסטודנטים.3306 30 Model Summary b Model R R Square Adjused R Square Sd. Error of he Esimae.60 a.36.339 44.05503 a. Predicors: (Consan), number of sudens b. Dependen Variable:ren ANOVA b Model Sum of Squares Df Mean Square F Sig. Regression 76579.50 76579.50 5.904.000 a Residual 4800363.847 8 744.566 oal 756943.367 9 a. Predicors: (Consan), number of sudens b. Dependen Variable: ren Coefficiens a Model Sandardized Unsandardized Coefficiens Coefficiens B Sd. Error Bea Sig. (Consan) 686.07 9.44 3.588.00 33.50 מספרהסטודנטים 58.556.60 3.988.000 44

חשב אומדן נקודתי לשכר הדירה אותו ישלמו סטודנטים החולקים את הדירה עם שותף אחד בלבד. אמוד את שכר הדירה הממוצע שישלמו סטודנטים החולקים את הדירה עם שותף אחד בלבד, ברמת בטחון של. 95% אמוד את שכר הדירה שישלם סטודנט יחיד החולק את הדירה עם שותף אחד בלבד, ברמת ביטחון של. 95%...3 45

פרק שישי: שינוי יחידות מדידה שינוי ליניארי (טרנספורמציה ליניארית) שנעשה במשתנה המוסבר או במשתנה המסביר במודל. שינוי ליניארי משמעו: הוספה/החסרה של קבוע ו/או הכפלה/חילוק של קבוע של אחד או שני המשתנים.. PF - βˆ, F טרנספורמציה ליניארית של המשתנים לא תשפיע על, R ˆ αו- ˆβ ( וסטיות התקן שלהם ) ו αˆ S ו- βˆ ( S עשויים להשתנות וכך האומדים ) ו- β גם את הפרמטרים שלאחר השינוי ב- α (נסמן ˆα ו- ˆ β.( ואת האומדים ב- ˆα השינויים מסוכמים בטבלה הבאה: Sαˆ S βˆ α ˆ ˆ β הוספת קבוע ל- : s ˆ α s ˆ α s ˆ β s ˆ β ˆ α ˆ α ˆ β d ˆ β ˆ β ( ) Y α + β + d + v s ˆ α s ˆ α s ˆ β s ˆ β ˆ α ˆ α+ d ˆ β ˆ β הוספת קבוע ל- Y: Y+ d α + β + v s ˆ α s ˆ α s β ˆ s ˆ β d ˆ α ˆ α ˆ ˆ β β d הכפלת פי קבוע: ( ) Y α + β d + v s ˆ α ds ˆ α s ˆ β ds ˆ β ˆ α d ˆ α ˆ β d ˆ β הכפלת Y פי קבוע: dy α + β + v 46 מסקנות מהטבלה: תמיד. ( ˆ β 0 ) ( ˆ β 0 ) רק בהכפלות. ( ˆ α 0) ( ˆ α 0)

? חוקר ביקש לאמוד את הקשר בין שכר בש"ח (MWAGE) לבין שנות לימוד MWAGE 39.54+ 8. 6 SCL (SCL) באמצעות מודלים שונים. להלן תוצאות האמידה : () MWAGE 445.08+ 39.60 LN ( SCL) () חשבו מחדש את מקדמי הרגרסיה וסטטיסטי המבחן F בכל אחד מהמודלים כתוצאה: מספר שנות הלימוד, ויש צורך התברר כי נעשה טעות בחישוב. להוסיף 0% למשתנה המקורי. התברר כי הקשר בין שכר לשנות לימוד הוא ריבועי ולכן יש צורך. להעלות את המשתנה המקורי של מספר שנות הלימוד בריבוע.?בהמשך לנתוני השאלה לדוגמא מהפרק החמישי: החוקר טען כי יש לבדוק את הקשר בין שכר לותק ע"י שימוש בשכר נטו (NE) ולא בשכר ברוטו.(SALARY) קיים שיעור מס קבוע של 0%. המודל הוא: ( ). ln NE α + β EP + v מה יהיו ערכי האומדים, סטיות התקן שלהם וטיב ההתאמה באמידת מודל זה? תזכורתשלחוקילוגים: LN( Y) LN( ) + LN( Y) LN( ) LN( ) LN( Y) Y 47

פרק שביעי: רגרסיה רב משתנית כאשר יש יותר ממשתנה מסביר אחד, מדובר ברגרסיה מרובה. 3 המודל הקלאסי: Y α + β + β + β +... + β + u 3 קבוע αיש אחד מספר ה- β טות כמספר המשתנים הב"ת במודל. מבחני המובהקות k k מבחןF למובהקותהמודל H H השערות: : β β... β 0 0 K : OHERWISE סטטיסטי המבחן F וכלל ההכרעה: RSS R F k k > F( k, k ; α ) ESS R k k מבחן למובהקותה- βטות מבחן לבדיקת מובהקותβספציפית. השערות: H : β 0 H 0 : β 0 i i סטטיסטי המבחן וכלל ההכרעה: ˆ β i ˆ > β α i S ( k ; ) ˆ β I 48

Y α+ β + β Z + β W + β S + u והתקבלו התוצאות הבאות: x z w s? נאמד המודל Analysis of Variance Sum of Mean Source DF Squares Square F Value Prob>F Model ------ 64669.84 ------------ ----------- 0.0000 Error ------ ----------- ------------ C oal 03 646790.0 Roo MSE ------------ R-square ------------- Dep Mean 78.6645 Adj R-sq 0.9990 C.V. 0.988075 Parameer Esimaes Parameer Sandard for H0: Variable DF Esimae Error Parameer0 Prob> INERCEP 5.06773 0.456604.09874 0.0000 ------------- 0.047.84485 0.0000 Z 3.005385 0.008679 346.7 0.0000 W -5.090 0.07349 ------------- 0.0000 S 8.97406 0.09075 308.6485 0.0000 א. ב. ג. השלם את הנתונים החסרים בפלט. האם המודל מובהק? בדקו ברמת מובהקות של 0.05 האם משתנה W רלוונטי למודל? בדקו ברמת מובהקות של 0.0 R השוואהביןמודלים- R וחוקחיטובסקי לעיתים אנו מתבקשים להכריע בסוגיה האם כדאי לנו להוסיף למודל משתנה ב"ת מסויים. במקרה זה נשווה את פרופורציית השונות המוסברת המתוקנת בין המודל ללא המשתנה המסביר לבין המודל עם המשתנה המסביר שהוספנו. להזכירכם R לוקח בחשבון לא רק את הרווח שבהקטנת החלק הלא R בניגוד ל- מוסבר בהוספת משתנים ב"ת למודל אלא גם את ההפסד שבירידה בדרגות החופש. לכן בניגוד ל- R הוא יכול לקטון בהוספת משתנים ב"ת למודל. 49

לפי חוק חיטובסקי-בהוספת משתנה מסביר אחד בלבד למודל ה- R יעלה אך ורק. ˆ β אם > כאשר (מובהק). כאשר ˆ < β אז R ˆ > β אז ירד בהוספת המשתנה והוא גם לא יהיה רלוונטי למודל R יעלה והמשתנה שהוסף יהיה גם מובהק. R אז ה- ˆ < < β כאשר יעלה אך יש לבדוק את רלוונטיות המשתנה שהוסף למודל על פי מבחן.? במודל לניבוי ההכנסה על פי שנות לימוד וותק במקום העבודה, התקבל R 0.66 התקבל: למודל?. הוסף המשתנה היקף המשרה. במבחן למובהקות המשתנה הנוסף ˆ o.456 β. האם ערך R יעלה/ירד/לא ישתנה בהוספת המשתנה הנוסף **הערה חשובה: ניתן להשתמש גם באומד המוטה- R להשוואה בין מודלים אם מתקיימים שני התנאים הבאים: ) מספר המשתנים זהה ) המשתנה המוסבר זהה מבחן WALD אם רוצים לבדוק השערת אפס שיש בה מספר לא מוגבל של שוויונים משתמשים במבחן WALD (במבחן היה רק שוויון אחד בהשערת האפס). איך עושים זאת? ) אומדים את המודל המקורי. מודל זה נקרא המודל החופשי או המודל הלא- מוגבל, ובאנגלית.Unresriced בתהליך האמידה של המודל הלא-מוגבל מקבלים את סכום ריבועי הסטיות של המודל, נסמן אותו ב- ) מגדירים את כל השוויונים של השערת האפס.. ESS U 50

3) מציבים את השוויונים של השערת האפס במודל המקורי. באופן הזה הופכים אותו למודל כפוי (כופים עליו את השערת האפס), או מודל מוגבל, או באנגלית.Resriced 4) אומדים את המודל המוגבל. בתהליך האמידה של המודל המוגבל מקבלים את סכום ריבועי הסטיות של המודל, נסמן אותו ב- 5) אם יודעים את מספר התצפיות, מוגבל,, k ומספר השוויונים בהשערת האפס,. ESS R sa ESSR ESS m ESSU k U, מספר המשתנים המסבירים במודל הלא- WALD (המודל המקורי עם חותך)., m אפשר לחשב את הסטטיסטי: - m דרגות החופש של המונה k - דרגות החופש של המכנה אם במעבר ממודל U ל- R המשתנה המוסבר לא השתנה, ניתן לחשב את סטטיסטי המבחן WALD גם במונחים של : R R DF U RR DF R WALDsa RU DF U U כלל הכרעה לדחיית H0: WALD sa > F DF ( R DFU, DFU ; α ) אם דוחים את H0 המסקנה היא שהמודל המקורי (הלא-מוגבל) הוא הרלוונטי ולהיפך. 5

Y α+ β + β Z + β W + β S + u והתקבלו התוצאות הבאות: x z w s?נאמד המודל Analysis of Variance Sum of Mean Source DF Squares Square F Value Prob>F Model 4 64669.84 654.46 5835.84 0.0000 Error 99 60.683 3.6436 C oal 03 646790.0 Roo MSE.7653395 R-square 0.99904 Dep Mean 78.6645 Adj R-sq 0.9990 C.V. 0.988075 Parameer Esimaes Parameer Sandard for H0: Variable DF Esimae Error Parameer0 Prob> INERCEP 5.06773 0.456604.09874 0.0000 0.975736 0.047.84485 0.0000 Z 3.005385 0.008679 346.7 0.0000 W -5.090 0.07349-68.754 0.0000 S 8.97406 0.09075 308.6485 0.0000 הועלתה ההשערה כי ההשפעה על Y של משתנה S היא פי 3 מזו של משתנה, Z וכן כי החותך הוא 5. א. מהי השערת האפס? ב. מהו המודל המוגבל שאותו צריך לאמוד? 5

המשך השאלה להלן אמידת המודל המוגבל: Analysis of Variance Sum of Mean Source DF Squares Square F Value Prob>F Model 64666.0 33083.0 Error 0 63.9983 3.04469 C oal 03 646790.0 Roo MSE.769504 R-square 0.999035 Dep Mean 73.6645 Adj R-sq 0.99906 C.V..04574 Parameer Esimaes Parameer Sandard for H0: Variable DF Esimae Error Parameer0 Prob> 0.97849 0.036399 6.8840 0.0000 Z+3S.999995 0.003669 87.6080 0.0000 W -5.04309 0.078-70.849 0.0000 ג. חשב את הסטטיסטי של.WALD ד. כמה דרגות חופש יש במונה וכמה במכנה? ה. האם דוחים או מקבלים את השערת האפס? מקריםפרטייםשלמבחן WALD ) מבחן F למובהקות המודל הוא מקרה פרטי של : WALD השערות: U: H H 0 : β β... β k : OHERWISE אם נבצע זאת במבחן : WALD המודל הלא מוגבל יהיה: Y α + β + β +... + β + u k k 0 המודל המוגבל יהיה: 53

R: Y α + u במקרה זה : WALD sa F WALD RU RR DFR DF RU DF U RU k RU k U sa מבחן למובהקות ה- βהוא מקרה פרטי של מבחן :WALD ( F למשל במודל: Y α + β + β +... + β + u β רוצים לבדוק את מובהקות H H k k השערות: 0 : β 0 : β 0 ניתן לבדוק זאת גם במבחן :WALD U: Y α + β + β + β +... + β u 3 3 k k + R: Y α + β + β3 3 +... + β k k + u במקרה זה : WALD F sa ˆ β (, DF U ; α ) α ( DFU ; ).γˆ PF WALD כשיש מגבלה אחת ב- HO - ניתן לבצע גם מבחן עם הגדרת סטטיסטי WALD F sa P βˆ (, DF ; α ) U PF WALD (3 במקרה זה: ˆ γ P γˆ α ( DFˆ γ ; ) 54

לדוגמא: על מנת לאמוד את פונקצית התצרוכת נאספו נתונים על 4 משקי בית בשנת 007 ונאמדה המשוואה הבאה: C P + u α + β W + β להלן תוצאות האמידה של המשוואה הנ"ל: Analysis of Variance Sum of Mean Source DF Squares Square F Value Prob>F Model --- --------- -------- ------- -------- Error --- --------- 5968 C oal --- --------- Parameer Esimaes Parameer Sandard for H0: Variable DF Esimae Error Parameer0 Prob> INERCEP -07.6 ------ ---------- ------- W 0.743 ------ P 0.56 ------- Covariance of Esimaes COV INERCEP W P INERCEP ----------- ----------- -------- W ----------- 0.0046-0.0090 P ----------- -0.0090 0.06 על מנת לבדוק את ההשערה שהנטיה השולית לצרוך מתוך ההכנסה זהה לנטיה השולית לצרוך מתוך ההון, נאמדה גם המשוואה הבאה: ההכנסה של משק בית Y סה"כ C α + β Y כאשר: + u התקבל: ESS0.4566 בידקו את ההשערה בשתי דרכים. 55

לסיכום: מתי נשתמש במבחן- ומתי במבחן- F? כאשר בהשערות ישנם סימני אי שיוויון (השערות חד צדדיות), נשתמש בהתפלגות כאשר יש סימן שיוויון אחד בהשערת האפס, ניתן להשתמש ב- או ב- F (תלוי מה יותר נוח ואילו נתונים זמינים לנו). כאשר יש בהשערת האפס יותר מסימן שיוויון אחד, נשתמש בהתפלגות F. 56

תרגול מסכם חוקר אמד את התצרוכת של 500 משקי בית כפונקציה של הכנסה שלהן לפי. EPENSE α+ β INCOME + u המשוואה: - EPENSE התצרוכת של משק הבית ה- -י באלפי שקלים - INCOME ההכנסה של משק הבית ה- -י באלפי שקלים ההפרעות האקראיות מקיימות את כל ההנחות הקלאסיות התקבל הפלט הבא: Analysis of Variance Sum of Mean Source DF Squares Square F Value Prob>F Model 03.05 03.05 6495.745 0.0000 Error 498 54.3358 0.3099 C oal 499 67.44 Roo MSE 0.556697 R-square 0.98794 Dep Mean 3.99008 Adj R-sq 0.9865 C.V. 3.9557 Parameer Esimaes Parameer Sandard for H0: Variable DF Esimae Error Parameer0 Prob> INERCEP 0.04995 0.05495 0.76436 0.445 INCOME 0.73503 0.008853 80.5968 0.0000 מהו Pvalue לבדיקת מובהקות המודל ע"י מבחן F? מהו אחוז השונות בתצרוכת המוסבר ע"י ההכנסה? מהו אומדן לתצרוכת ההתחלתית של משק בית? האם אומדן זה מובהק? על עוזר מחקר הטיל החוקר לבדוק את ההשערה כי על כל 000 ש"ח נוספים בהכנסה צורך הפרט 700 ש"ח, כנגד ההשערה כי הוא צורך יותר מ- 700 ש"ח. נסח את השערת האפס ואת ההשערה האלטרנטיבית. ( ( (3 (4 (5 57

(6 (7 (8 מהו הסטטיסטי לבדיקת ההשערה? מהו הסטטיסטי WALD לבדיקת ההשערה? התברר כי היתה טעות בנתונים, וכי יש להוסיף 000 ש"ח לתצרוכת של כל משק בית: א. ההוספה תגדיל את האומד ל- α: נכון / לא נכון / לא ניתן לדעת. ב. בעקבות ההוספה האומד ל- αיהיה מובהק: נכון / לא נכון / לא ניתן לדעת. ג. ההוספה תשנה את האומד ל- β: ד. ההוספה תשנה את : R נכון / לא נכון / לא ניתן לדעת. נכון / לא נכון / לא ניתן לדעת. החוקר טען כי יש להוסיף לפונקצית התצרוכת גם את השפעת העושר. העושר של משק בית מורכב מתוכניות החסכון שלו ) SAVINGS ( ומניירות הערך שיש לו ) NE ). שתי סדרות הנתונים הן באלפי שקלים. החוקר אמד את המשוואה: EPENSE α+ β INCOME + β SAVINGS + β NE + u 3 וקיבל כי סכום ריבועי הסטיות של הטעויות הוא. 9) מהי השערת האפס לבדיקת הטענה של החוקר (שהמודל החדש נכון ולא המקורי)? 0) מהו הסטטיסטי WALD לבדיקת ההשערה? החוקר רצה לבדוק את ההשערה כי הנש"צ מתוך ההכנסה שווה ל- 0.6 וכי השפעת ניירות הערך על התצרוכת היא פי מהשפעת תוכניות החסכון. ) מהי השערת האפס לבדיקה זו?. Z γ + γ W + v 0 ) המודל המוגבל לבדיקת ההשערה יהיה מהצורה, Z ו- בטא את W באמצעות המשתנים המקוריים. 58

סיכום: מבחנים לדוגמא מבחן לדוגמא מס' שאלה (55 נקודות) חוקר רצה לבדוק את השפעת התל"ג על ההשקעה במשק לפי המודל הבא: Y הוא התוצר I היא ההשקעה באלפי שקלים,, ln I α+ β lny + u כאשר : u, מקיימת את כל ההנחות הקלאסיות. באלפי שקלים, וההפרעה האקראית, באמידה התקבל הפלט הבא: Analysis of Variance Sum of Mean Source DF Squares Square F Value Prob>F Model 0.3853 0.3853 7.4 <.000 Error 99.0666 0.00534 C oal 00.44789 Roo MSE 0.073075 R-square 0.733936 Dep Mean 0.07 Adj R-sq 0.7304 C.V. 0.79494 Parameer Esimaes Parameer Sandard for H0: 95% Variable DF Esimae Error Parameer0 Prob> conf. lim. INERCEP 3.4703 0.85463 4.0659 0.000.79 5.5 lny 0.57004 0.0645 8.49356 0.0000 ---- ---- מהו Pvalue לבדיקת מובהקות המודל ע"י מבחן F? אם נגדיל את התוצר ב- % בכמה תגדל ההשקעה? מהו רווח הסמך ל- α? מהו רווח הסמך ל- β? הועלתה הטענה כי הגמישות שווה ל- 0.4. מהן ההשערות לבדיקת הטענה? מהי הרגרסיה המוגבלת למבחן WALD תחת H0? מהו הסטטיסטי של WALD למבחן זה (אם ניתן לחישוב)? 7) אם ההשקעה נמדדת בשקלים במקום באלפי שקלים: א) המקדם של lny לא ישתנה. נכון / לא נכון / לא ניתן לדעת ( ( (3 (4 (5 (6 59

ב) החותך לא ישתנה. ג) הסטטיסטי ה) R לבדיקת המובהקות של βלא ישתנה. ד) הסטטיסטי F לבדיקת מובהקות המודל לא ישתנה. לא ישתנה. נכון / לא נכון / לא ניתן לדעת נכון / לא נכון / לא ניתן לדעת נכון / לא נכון / לא ניתן לדעת נכון / לא נכון / לא ניתן לדעת החוקר טען כי גם גודל האוכלוסיה, ln I α+ β ln Y + β ln P+ u (8 מהי השערה האפס לבדיקת הטענה?, P משפיע על ההשקעה לפי המודל הבא: התקבל הפלט הבא: Parameer Esimaes Parameer Sandard for H0: Variable DF Esimae Error Parameer0 Prob> INERCEP.3853.43547 0.788489 0.4435 lny.035467 0.5756 4.0094 0.0004 lnp -.77456 0.94657 -.87477 0.0736 (9 (0 באיזו רמת מובהקות נקבל את טענת החוקר? R של המשוואה החדשה קטן מזה של המשוואה המקורית. נכון / לא נכון / לא ניתן לדעת במשוואה החדשה הועלתה הטענה כי סכום הגמישויות שווה ל- 0. )מהי השערת האפס לבדיקת הטענה? ( ) )מהו הסטטיסטי לבדיקת ההשערה? (נתון כי 0.5 β ( cov ˆ β, ˆ 3 )האם ניתן לדחות את השערת האפס? 60

שאלה (4 נקודות) ( ברגרסיה מרובה, כמו ברגרסיה חד משתנית, לריבוע של מבחן מבחן F למובהקות המודל שווה למובהקות של.β ) אם הערך 0 נמצא בתוך רווח הסמך ל- β, אזי β מובהקת. נכון / לא נכון / לא ניתן לדעת נכון / לא נכון / לא ניתן לדעת 3) בהוספת משתנה לא רלוונטי למודל האומד המתוקן לפרופורצית השונות המוסברת ירד בהכרח. נכון / לא נכון / לא ניתן לדעת 4) אומדי הריבועים הפחותים אינם חסרי הטיה אם ידוע שהשונות של קבועה (הפרה של הנחה קלאסית). u אינה נכון / לא נכון / לא ניתן לדעת 5) אם דוחים H0 ברמת מובהקות מסויימת, אזי דוחים H0 בכל רמות המובהקות הקטנות יותר. 6) אומד חסר הטיה הוא אינו בהכרח אומד עקיב נכון / לא נכון / לא ניתן לדעת נכון / לא נכון / לא ניתן לדעת שאלה (4 3 נקודות) נתון מודל ללא חותך ɶ β S Y, Y β + u ונתון האומד ɶ β הוא אר"פ. ɶ β הוא אומד חסר הטיה. ɶ β הוא אומד לינארי. ) האומד ) האומד 3) האומד 4) אר"פ יעיל יותר מ-. ɶ β 5) מהי השונות של β? ɶ נכון / לא נכון / לא ניתן לדעת נכון / לא נכון / לא ניתן לדעת נכון / לא נכון / לא ניתן לדעת נכון / לא נכון / לא ניתן לדעת 6

שאלה (7 4 נקודות) נתון מודל ללא חותך ˆ β Y, Y β + u ונתון האומד נכון / לא נכון / לא ניתן לדעת ) האומד ˆβ הוא אר"פ. נכון / לא נכון / לא ניתן לדעת ) האומד ˆβ הוא אומד חסר הטיה. נכון / לא נכון / לא ניתן לדעת 3) האומד ˆβ הוא אומד לינארי. 4) מהי השונות של ˆβ? נכון / לא נכון / לא ניתן לדעת 5) האומד ˆβ הוא אומד עקיב. 6

מבחן לדוגמא מס' שאלה (60 נקודות) חוקר בדק את השפעת שעות העבודה בשבוע (HOURS) על השכר החודשי ברוטו. SALARY α+ β HOURS + u : S 35079 בשקלים (SALARY) לפי המודל: הסטיה המקרית מקיימת את כל ההנחות הקלאסיות., 46.040873 Analysis of Variance Sum of Mean השלם את הפלט הבא, אם ידוע כי Source DF Squares Square F Value Prob>F Model --- --- --- --- Error 40 407435 --- C oal --- 449757359 Roo MSE --- R-square --- Dep Mean 580 Adj R-sq --- C.V. --- Parameer Esimaes Parameer Sandard for H0: Variable DF Esimae Error Parameer0 Prob> INERCEP --- --- --- 0.7476 HOURS 36.06745 --- --- 0.000 מהו Pvalue לבדיקת מובהקות המודל ע"י מבחן F? מהו האומדן לשכר התחלתי? ( ( החוקר רצה לבדוק את הטענה כי אם יעבוד שעה אחת נוספת בשבוע, שכרו יגדל ב- 40 ש"ח. 3) מהן ההשערות לבדיקת הטענה? 4) מהו הסטטיסטי למבחן? 5) מהו הסטטיסטי WALD למבחן? 6) מהי התחזית לשכר של עובד העובד 55 שעות בשבוע? 63

(7 החוקר טען כי יש לבדוק את הקשר בין השכר לשעות העבודה ע"י שימוש בנתונים שנתיים, כלומר, שכר שנתי (בהנחה שהשכר החודשי קבוע כל השנה) ושעות עבודה שנתיות (בהנחה ששעות העבודה קבועות בכל 5 השבועות בשנה). שימוש בנתונים שנתיים: א. ישנה את הסטטיסטי ב. יכפיל את האומד של β ב- 0.3. ג. יכפיל את סטית התקן של לבדיקת המובהקות של.α ב- 0.3. ˆβ ד. ישנה את Pvalue לבדיקת מובהקות המודל. נכון / לא נכון / לא ניתן לדעת נכון / לא נכון / לא ניתן לדעת נכון / לא נכון / לא ניתן לדעת נכון / לא נכון / לא ניתן לדעת החוקר טען כי יש להוסיף למשוואה גם את השפעת הגיל (AGE) ומספר שנות הלימוד.(SCL) לשם כך הוא אמד את המשוואה הבאה: SALARY α+ β HOURS + β AGE + β SCL + u 3 8) מהי השערת האפס לבדיקת הטענה? 9) מהו הנתון הנדרש כדי לחשב את הסטטיסטי של WALD לבדיקת טענת החוקר? 0) בפלט האמידה של המשוואה החדשה לא היה ברור אם ערכו של נתון זה הוא 35968434 או 55968434 (בשל בעיה במדפסת). מהו הסטטיסטי של WALD לבדיקת טענת החוקר? )מהם הנתונים הנדרשים לחישוב הסטטיסטי? החוקר רוצה לבדוק את הטענה כי השפעת ההשכלה על השכר גדולה פי 8 מהשפעת הגיל על השכר. Parameer Esimaes Parameer Sandard for H0: Variable DF Esimae Error Parameer0 Prob> INERCEP -995.075 33.7857-6.03 0.000 HOURS 36.40846 4.700 7.730 0.000 AGE 3.67454 3.8646 3.583 0.0004 SCL 09.93799 0.63745 0.335 0.000 64

)הנתונים בפלט אינם מספיקים לבדיקת ההשערה לפי מבחן. מהו הנתון החסר? באיזה פלט של SAS ניתן למצוא אותו? 3) בהנחה שנתון זה הוא 8.3969, חשב את הסטטיסטי לבדיקת הטענה. מהי מסקנתך לגבי נכונות הטענה? 4) אם תרצה לבדוק את הטענה לפי מבחן,WALD יהיה המודל המוגבל: Z כאשר: 0 0 Z Z 0 Z Z γ + γ Z + γ + ν 5) אם יש מספיק נתונים, חשב את הסטטיסטי של WALD לבדיקת הטענה?. Y α+ β + u ידוע כי כל ההנחות הקלאסיות מתקיימות. שאלה (30 נקודות) נתון המודל. ɶ β S Y נתון האומד: uˆ 0, ) אומד זה הוא הפתרון של המשוואות הנורמליות 0 ˆu ) התוחלת של נכון / לא נכון / לא ניתן לדעת ɶ β היא: β א. β S ב. ה. כל התשובות אינן נכונות. 65 β S β S ג. ד.

( ) (3 הטענה כי : E ɶ β < β א. תמיד נכונה ב. אינה נכונה ג. נכונה אם ורק אם > 0 ד. נכונה אם ורק אם 0 ה. כל התשובות אינן נכונות (4 אם 0 אז השונות של ɶ β היא: σ σ σ S S א. ב. ג. ד. σ S ה. כל התשובות אינן נכונות 0, אז ɶ β הינו האומד הלינארי חסר ההטיה בעל השונות הקטנה ביותר. נכון / לא נכון / לא ניתן לדעת 5) אם שאלה (0 3 נקודות) נתון המודל נתון כי. Y α+ β + u ידוע כי כל ההנחות הקלאסיות מתקיימות. β ɶ Y הוא אומד לינארי וחסר הטיה ל-, β אך איננו אומד עקיב ל-. β מאחר ש- ɶ β אינו אומד עקיב, לא נוכל להשתמש במשפט גאוס מרקוב ולקבוע כי ˆ S β (אר"פ) הינו אומד יעיל יותר. S נכון / לא נכון / לא ניתן לדעת 66

מבחן לדוגמא מס' 3 שאלה מס' (50 נקודות) על מנת לאמוד את פונקצית הייצור נאספו נתונים על 50 פירמות בשנת 007 ונאמדה המשוואה הבאה: () כאשר: () ln( Y) α+β ln(l) + U ln(y) תפוקה שנתית באלפי ש"ח בלוגים ln(l) מספר העובדים בלוגים U הטעות המיקרית המקיימת את כל ההנחות הקלאסיות. משוואה מס' () נאמדה בפלט מס' לבדיקת מובהקות המודל: (3) א. סטטיסטי F לא ניתן לחשב את סטטיסטי F בעזרת הנתונים הקיימים.. ניתן לחשבו וערכו הוא:. (3) ב. סטטיסטי לבדיקת מובהקות המודל: לא ניתן להשתמש בסטטיסטי בהשערה מסוג זה. לא ניתן לחשבו בעזרת הנתונים הקיימים.. ניתן לחשבו וערכו הוא: 3. הועלתה הטענה כי עליה ב- % במס' העובדים תגדיל את התפוקה בפחות מ- % (3) ג. ההשערות לבדיקת הטענה הן: : H0 H: 67

(4) ד. הסטטיסטי לבדיקת הטענה הינו:. לא ניתן לחשבו בנתונים הקיימים. 5.5. -5.5.3-5.5.4 5.5.5 (3) ה. הסטטיסטי של WALD לבדיקת הטענה:. לא ניתן לחשבו בעזרת הנתונים הקיימים.. ניתן לחשבו וערכו הוא: (3) ו. לאור התשובות לסעיפים הקודמים, אחוז התפוקה קטן ככל שאחוז מס' העובדים גדל: נכון/לא נכון/אי אפשר לדעת החוקרת טענה כי יש משתנים נוספים המסבירים את תפוקת הפירמה ואמדה את המשוואה הבאה: כאשר: () ln( Y) α+β ln(l) +β ln(k) +β ln(py) + U 3 ln(k) מלאי ההון של הפירמה באלפי בלוגים ln(py ) הוצאות למחקר ופיתוח באלפי בלוגים משוואה מס' () נאמדה בפלט מס' () ז. ההשערות לבדיקת הטענה הינן : : H 0 : H () ח. הסטטיסטי של WALD לבדיקת הטענה הינו:. לא ניתן לחשב את הסטטיסטי בעזרת הנתונים הקיימים. ניתן לחישוב וערכו:. 68