מבוא לאקונומטריקה ב' החוג לכלכלה [1]

Σχετικά έγγραφα
תרגילים בנושא משתנה דמי:

ב הקירטמונוקא ל והינ ו הלכל ל כ גוחה

חורף תש''ע פתרון בחינה סופית מועד א'

פתרון תרגיל 8. מרחבים וקטורים פרישה, תלות \ אי-תלות לינארית, בסיס ומימד ... ( ) ( ) ( ) = L. uuruuruur. { v,v,v ( ) ( ) ( ) ( )

פתרון תרגיל מרחבים וקטורים. x = s t ולכן. ur uur נסמן, ur uur לכן U הוא. ur uur. ur uur

התפלגות χ: Analyze. Non parametric test

מבוא לאקונומטריקה א' החוג לכלכלה

ל הזכויות שמורות לדפנה וסטרייך

ניהול תמיכה מערכות שלבים: DFfactor=a-1 DFt=an-1 DFeror=a(n-1) (סכום _ הנתונים ( (מספר _ חזרות ( (מספר _ רמות ( (סכום _ ריבועי _ כל _ הנתונים (

תרגיל 13 משפטי רול ולגראנז הערות

פתרון תרגיל 5 מבוא ללוגיקה ותורת הקבוצות, סתיו תשע"ד

[ ] Observability, Controllability תרגול 6. ( t) t t קונטרולבילית H למימדים!!) והאובז' דוגמא: x. נשתמש בעובדה ש ) SS rank( S) = rank( עבור מטריצה m

= 2. + sin(240 ) = = 3 ( tan(α) = 5 2 = sin(α) = sin(α) = 5. os(α) = + c ot(α) = π)) sin( 60 ) sin( 60 ) sin(

תרגול מס' 6 פתרון מערכת משוואות ליניארית

טושפ הרעשה ןחבמ t ןחבמ

תרגול 1 חזרה טורי פורייה והתמרות אינטגרליות חורף תשע"ב זהויות טריגונומטריות

שאלה 1 V AB פתרון AB 30 R3 20 R

יסודות לוגיקה ותורת הקבוצות למערכות מידע (סמסטר ב 2012)

מבחן t לשני מדגמים בלתי תלויים. T test for independent samples

תדירות הנתונים, שנתיים,annual רבעונים quarterly וכו'. 5 ומשתנה Yהינו 3,6,9,5 ו- 7. נבחר, file-open data-import בשלב זה התוכנה

x = r m r f y = r i r f

סיכום חקירת משוואות מהמעלה הראשונה ומהמעלה השנייה פרק זה הינו חלק מסיכום כולל לשאלון 005 שנכתב על-ידי מאיר בכור

I. גבולות. x 0. מתקיים L < ε. lim אם ורק אם. ( x) = 1. lim = 1. lim. x x ( ) הפונקציה נגזרות Δ 0. x Δx

לוגיקה ותורת הקבוצות פתרון תרגיל בית 4 אביב תשע"ו (2016)

גמישויות. x p Δ p x נקודתית. 1,1

Logic and Set Theory for Comp. Sci.

דף פתרונות 7 נושא: תחשיב הפסוקים: צורה דיסיונקטיבית נורמלית, מערכת קשרים שלמה, עקביות

תרגול פעולות מומצאות 3

אלגברה ליניארית (1) - תרגיל 6

שדות תזכורת: פולינום ממעלה 2 או 3 מעל שדה הוא פריק אם ורק אם יש לו שורש בשדה. שקיימים 5 מספרים שלמים שונים , ראשוני. שעבורם

לוגיקה ותורת הקבוצות פתרון תרגיל בית 8 חורף תשע"ו ( ) ... חלק ראשון: שאלות שאינן להגשה נפריד למקרים:

לדוגמה: במפורט: x C. ,a,7 ו- 13. כלומר בקיצור

{ : Halts on every input}

3-9 - a < x < a, a < x < a

מבוא לאקונומטריקה 57322

אקונומטריקה ד"ר חמי גוטליבובסקי סמסטר א' תש "ע

מתמטיקה בדידה תרגול מס' 5

גבול ורציפות של פונקציה סקלרית שאלות נוספות

תשובות מלאות לבחינת הבגרות במתמטיקה מועד ג' תשע"ד, מיום 0/8/0610 שאלונים: 315, מוצע על ידי בית הספר לבגרות ולפסיכומטרי של אבירם פלדמן

הסקה סטטיסטית/תקציר/תלמה לויתן

משוואות רקורסיביות רקורסיה זו משוואה או אי שוויון אשר מתארת פונקציה בעזרת ערכי הפונקציה על ארגומנטים קטנים. למשל: יונתן יניב, דוד וייץ

סיכום- בעיות מינימוםמקסימום - שאלון 806

( )( ) ( ) f : B C היא פונקציה חח"ע ועל מכיוון שהיא מוגדרת ע"י. מכיוון ש f היא פונקציהאז )) 2 ( ( = ) ( ( )) היא פונקציה חח"ע אז ועל פי הגדרת

הרצאה. α α פלוני, וכדומה. הזוויות α ל- β שווה ל-

רגרסיה ושיטות ניתוח ליניאריות סטודנטים יקרים לפניכם ספר תרגילים בקורס רגרסיה ושיטות ניתוח לינאריות פסיכולוגיה אוניברסיטת בן גוריון.

תרגיל 7 פונקציות טריגונומטריות הערות

1 תוחלת מותנה. c ארזים 3 במאי G מדיד לפי Y.1 E (X1 A ) = E (Y 1 A )

קיום ויחידות פתרונות למשוואות דיפרנציאליות

קורס: מבוא למיקרו כלכלה שיעור מס. 17 נושא: גמישויות מיוחדות ושיווי משקל בשוק למוצר יחיד

ןמנירג ןואל \ הקיטסיטטס הקיטסיטטסב הרזח ה יפד ךותמ 14 דו 1 מע

{ } { } { A חוקי דה-מורגן: הגדרה הסתברות מותנית P P P. נוסחת בייס ) :(Bayes P P נוסחת ההסתברות הכוללת:

סיכום בנושא של דיפרנציאביליות ונגזרות כיווניות

"קשר-חם" : לקידום שיפור וריענון החינוך המתמטי

מתכנס בהחלט אם n n=1 a. k=m. k=m a k n n שקטן מאפסילון. אם קח, ניקח את ה- N שאנחנו. sin 2n מתכנס משום ש- n=1 n. ( 1) n 1

אלגברה מודרנית פתרון שיעורי בית 6

- הסקה סטטיסטית - מושגים

צעד ראשון להצטיינות מבוא: קבוצות מיוחדות של מספרים ממשיים

s ק"מ קמ"ש מ - A A מ - מ - 5 p vp v=

אוסף שאלות מס. 3 פתרונות

gcd 24,15 = 3 3 =

סדרות - תרגילים הכנה לבגרות 5 יח"ל

TECHNION Israel Institute of Technology, Faculty of Mechanical Engineering מבוא לבקרה (034040) גליון תרגילי בית מס 5 ציור 1: דיאגרמת הבלוקים

בסל A רמת התועלת היא: ) - השקה: שיפוע קו תקציב=שיפוע עקומת אדישות. P x P y. U y P y A: 10>6 B: 9>7 A: 5>3 B: 4>3 C: 3=3 C: 8=8 תנאי שני : מגבלת התקציב

The No Arbitrage Theorem for Factor Models ג'רמי שיף - המחלקה למתמטיקה, אוניברסיטת בר-אילן

א הקיטסי ' טטסל אובמ רלדנ הינור בג '

אלגברה ליניארית 1 א' פתרון 2

brookal/logic.html לוגיקה מתמטית תרגיל אלון ברוק

אלגברה לינארית (1) - פתרון תרגיל 11

השאלות..h(k) = k mod m

אינפי - 1 תרגול בינואר 2012

טענה חשובה : העתקה לינארית הינה חד חד ערכית האפס ב- הוא הוקטור היחיד שמועתק לוקטור אפס של. נקבל מחד חד הערכיות כי בהכרח.

Charles Augustin COULOMB ( ) קולון חוק = K F E המרחק סטט-קולון.

פתרונות , כך שאי השוויון המבוקש הוא ברור מאליו ולכן גם קודמו תקף ובכך מוכחת המונוטוניות העולה של הסדרה הנתונה.

(ספר לימוד שאלון )

לוגיקה ותורת הקבוצות מבחן סופי אביב תשע"ב (2012) דפי עזר

c ארזים 26 בינואר משפט ברנסייד פתירה. Cl (z) = G / Cent (z) = q b r 2 הצגות ממשיות V = V 0 R C אזי מקבלים הצגה מרוכבת G GL R (V 0 ) GL C (V )

טריגונומטריה הגדרות הפונקציות הטריגונומטריות הבסיסיות

תשס"ז, סמסטר א', מועד א'

הרצאה תרגילים סמינר תורת המספרים, סמסטר אביב פרופ' יעקב ורשבסקי

שעה 0 חשיבה כמותית, שיטות מחקר כמותיות, רקע, כלי מחקר, מגבלות. שעה - 2 שיטות דגימה, דגימה אקראית, דגימה שיטתית ויעילות הדגימה.

פתרון תרגיל 6 ממשוואות למבנים אלגברה למדעי ההוראה.

PDF created with pdffactory trial version

The Sensitivity of the Wage Equation to the Regression Method

תרגול משפט הדיברגנץ. D תחום חסום וסגור בעל שפה חלקה למדי D, ותהי F פו' וקטורית :F, R n R n אזי: נוסחת גרין I: הוכחה: F = u v כאשר u פו' סקלרית:

שאלה 5: להלן סטטיסטיקה תיאורית מפורטת עם טבלת שכיחות לציוני בית ספר לוח 1: סטטיסטיקה תיאורית של ציוני בית ספר

תורת הקבוצות תרגיל בית 2 פתרונות

x a x n D f (iii) x n a ,Cauchy

הסתברות שבתחנה יש 0 מוניות ו- 0 נוסעים. הסתברות שבתחנה יש k-t נוסעים ו- 0 מוניות. λ λ λ λ λ λ λ λ P...

בחינה בסיבוכיות עמר ברקמן, ישי חביב מדבקית ברקוד

מצולעים מצולעהוא צורה דו ממדית,עשויה קו"שבור"סגור. לדוגמה: משולש, מרובע, מחומש, משושה וכו'. לדוגמה:בסרטוט שלפappleיכם EC אלכסוןבמצולע.

חישוביות הרצאה 4 לא! זיהוי שפות ע''י מכונות טיורינג הוכחה: הגדרת! : f r

ההוצאה תהיה: RTS = ( L B, K B ( L A, K A TC C A L K K 15.03

( k) ( ) = ( ) ( ) ( ) ( ) A Ω P( B) P A B P A P B תכונות: A ו- B ב"ת, אזי: A, B ב "ת. בינומי: (ההסתברות לk הצלחות מתוך n ניסויים) n.

הגדרה: מצבים k -בני-הפרדה

פתרון תרגיל בית 6 מבוא לתורת החבורות סמסטר א תשע ז

מתמטיקה בדידה תרגול מס' 2

פתרון 4. a = Δv Δt = = 2.5 m s 10 0 = 25. y = y v = 15.33m s = 40 2 = 20 m s. v = = 30m x = t. x = x 0.

לוגיקה ותורת הקבוצות מבחן סופי אביב תשע"ד (2014) דפי עזר

מודלים חישוביים תרגולמס 5

אוסף שאלות מס. 5. שאלה 1 בדוגמאות הבאות, נגדיר פונקציה על ידי הרכבה: y(t)).g(t) = f(x(t), בשתי דרכים:

Transcript:

מבוא לאקונומטריקה ב' החוג לכלכלה []

תוכן עניינים מבחני ספציפיקציה- מבחן LM (כופלי לגרנג')... 4 טעויות ספציפיקציה... ) הוספת משתנה לא רלוונטי.... ) השמטת משתנה רלוונטי... מולטיקוליניאריות... 4 ) מולטיקוליניאריות מלאה....4 ) מולטיקוליניאריות חלקית...5 סיכום ותרגול של טעויות ספציפיקציה ומולטי קולינאריות...8 משתני דמי... 3 () משתנה דמי לחותך...4 () משתנה דמי לשיפוע... 5 (3) משתנה דמי לכל הפונקציה... 6 משתני דמי אם המשתנה האיכותי יכול לקבל יותר משני ערכים...35 משתני דמי עבור שני משתנים איכותיים... 38 הפרה של ההנחות הקלאסיות... 45 הטרוסקדסטיות... 46 46... ההשלכות על אומדי הריבועים הפחותים (OLS) מבחנים לזיהוי הטרוסקדסטיות: GQ ו- WHITE...46 פיתרון בעיית ההטרוסקדסטיות:ריבועים פחותים משוקללים (WLS)...55 מתאם סידרתי... 59 השלכות על אומדי...6 OLS מבנה המתאם הסדרתי...6 תכונות המתאם הסדרתי...6 מבחנים לזיהוי מתאם סדרתי: DW (דרבין ווטסון) ו- LM...63 פיתרון בעיית המתאם הסדרתי: רגרסיית הפרשים (שיטת קוקרן-אורקט)... 69 סיכום בעיית המתאם הסדרתי והטרוסקדסטיות... 676 []

מודלים דינמיים...77 המכפילים הדינמיים...77 הקשר בין מתאם סדרתי למודלים דינמיים...8 השלכות על אר"פ של משתנה מוסבר בפיגור כמשתנה מסביר...8 שאלות מסכמות: מתאם סדרתי ומודלים דינמיים...8 [3]

מבחני ספציפיקציה- מבחן LM (כופלי לגרנג') במבחן כופלי לגרנג' (LM) אנו בודקים האם משתנה או משתנים מסבירים מסוימים רלוונטיים למודל. לדוגמא: נניח שיש לנו מודל הכולל 4 משתנים מסבירים :(UNRESTRICTED) Y α βx β x β3x3 β 4 x4 לגבי השניים הראשונים אנו בטוחים כי הם רלוונטיים וחייבים להופיע במודל. לגבי השניים האחרונים אנחנו לא בטוחים. השערות: H : β3 β4 H: OTHERWISE המודל המוגבל (RESTRICTED) הינו: α Y β x β x במבחן LMאומדים את המודל המוגבל ומקבלים עבור כל תצפית את הסטייה מקו. Y Yˆ uˆ הרגרסיה - כעת אומדים את רגרסיית העזר שבה מנסים לנבא את הסטייה מקו הרגרסיה עבור כל תצפית: uˆ δx δ x δ 3x3 δ 4 x4 δ ω הרציונאל של המבחן הוא: אחת מן ההנחות הקלאסיות של מודל הרגרסיה היא כי המשתנים הב"ת אינם [4] ( ). cov X, u מתואמים עם טעות האמידה:

המשתנים המצויים בתוך המודל (השניים הראשונים), לא מתואמים עם טעות האמידה ).( R u ˆ לגבי שני המשתנים שיש לנו ספק לגביהם: אם הם יהיו מתואמים עם טעות האמידה ) להוסיפם למודל וכי הם רלוונטיים (דוחים H). אם הם אינם מתואמים עם טעות האמידה ) (מקבלים את H). ( זו אינדיקציה ש"שכחנו" R u ˆ34 R u ˆ 34 ), המודל מושלם כמו שהוא הסבר באמצעות מעגלי וואן: חישוב הסטטיסטי: הכפלת ה- R של רגרסיית העזר במספר התצפיות (T). LM sa R T כלל הכרעה של H: נדחה את H. LM sa > χ m אם מס' ההגבלות ב- H. m- [5]

לדוגמא: UNRESTRICTED Dependen variable: Y Analysis of Variance Sum of Mean Source DF Squares Square F Value Prob>F Model ------ 64669.84 ------------ -----------. Error ------ 6.7 C Toal 3 64679. Roo MSE ------ R-square ----- Dep Mean ---- Adj R-sq ----- C.V. ----- Parameer Esimaes Parameer Sandard T for H: Variable DF Esimae Error Parameer Prob> T INTERCEP 5.6773.45664.9874. X.97576.47.84485. X 3.5385.8679 346.7. X3-5.9.7349-68.7546. X4 8.9746.975 38.6485. [6]

RESTRICTED Dependen variable: Y Analysis of Variance Sum of Mean Source DF Squares Square F Value Prob>F Model ------ 646.8 Error ------ 788. C Toal 3 64679. Roo MSE --------- R-square ----- Dep Mean --------- Adj R-sq ----- C.V. --------- Parameer Esimaes Parameer Sandard T for H: Variable DF Esimae Error Parameer Prob> T INTERCEP 7.6773.65664.7646. X 6.36455.75667 34.84485. X 9.5866.76993 384.7. רגרסיית עזר Dependen variable :RES Analysis of Variance Sum of Mean Source DF Squares Square F Value Prob>F Model ------ 64669.84 -------- -------. Error ------ 6.7 C Toal 3 64679. [7]

Roo MSE --------- R-square.3 Dep Mean --------- Adj R-sq ------- C.V. --------- Parameer Esimaes Parameer Sandard T for H: Variable DF Esimae Error Parameer Prob> T INTERCEP 5.96889.77664 7.675584. X.7773.978845.33875.8455 X.484697.886754.545889.9976 X3-5.9.7349-68.7546. X4 8.9746.975 38.6485. בדקו את הטענה כי לפחות אחד מן המשתנים הנוספים רלוונטי למודל בשתי דרכים. איזה מן המשתנים הנוספים רלוונטי למודל? ( ( **שימו לב כי: -כל המדדים (הבטות, ערכי וה- Pvalu ) ברגרסיית עבור המשתנים הנוספים למודל העזר שווים לאלו של הרגרסיה הלא מוגבלת. עבור המשתנים הקיימים במודל -המדדים אינם שווים בין שתי הרגרסיות. 3) הסבירו את הקשרים בין שלוש המשוואות: (R ( (U ( ו (עזר) ואת הקשר בין מבחן.LM WALDומבחן [8]

הקשר בין משוואות ה- U, ה- Rוהעזר: עזר UR א. ESS U ע ESS ב. ESS R ע TSS ג. R U R R U ד. ע ע ע ESS TSS ESS ESS ESS R ESS ESS LM sa 4) שחזרו בעזרת שתי המשוואות הראשונות ) Uו- R) את WALD sa 5) שחזרו בעזרת המשוואה האחרונה (רגרסיית העזר) את [9]

טעויות ספציפיקציה טעויות ספציפיקציה הן טעויות בניסוח משוואת הרגרסיה. ישנם שני סוגים של טעויות ספציפיקציה: הוספת משתנה בלתי תלוי שאיננו רלוונטי (איננו מובהק) למודל. השמטת משתנה בלתי תלוי רלוונטי (מובהק) למודל. ( ( ) הוספתמשתנהלארלוונטי נניח שהמודל האמיתי (הנכון) כולל שני משתנים בלתי תלויים, אבל אנחנו חושבים בטעות כי הוא כולל גם משתנה בלתי תלוי שלישי. המודל האמיתי: α β x β x ε Y המודל הנאמד (הטעותי): α β x β x β x ε Y 3 3 βנסיק 3 כי המשתנה איננו רלוונטי ונאמוד את אם נקבל את HOבמבחן למובהקות המודל מחדש הפעם ללא המשתנה השלישי. אולם, גם אם לא נוכל לאמוד מחדש, הימצאותו של משתנה שאיננו רלוונטי במודל הרגרסיה איננה פוגמת ברלוונטיות של המשתנים האחרים במודל ולא בתכונות החיוניות למבחני המובהקות שלהם. ˆα) יהיו חסרי הטיה, יעילים ועקיבים לפרמטרים כלומר, האומדים האחרים ) β ˆ β, ˆ, באוכלוסיה ) β α), β וגם השונויות הנאמדות תהיינה חסרות הטיה, כך שניתן יהיה, לבצע על האומדים האחרים בדיקת השערות תקפה. מסקנה: טעות ספציפיקציה של הוספת משתנה שאיננו רלוונטי למודל איננה טעות שיוצרת בעיה. []

**שימו לב כי לעיתים נרצה להשאיר משתנה שאיננו מובהק במודל. מדובר במקרים בהם המשתנה הנוסף מעלה את AdjR למרות שאיננו מובהק, כיוון ש: < βˆ חיטובסקי). (לפי חוק ) השמטת משתנה רלוונטי נניח שהמודל האמיתי כולל שני משתנים בלתי תלויים אולם אנו אומדים בטעות מודל הכולל רק את אחד המשתנים הב"ת: המודל האמיתי: α β x β x ε Y המודל הנאמד (הטעותי): α β x ε Y. x במקרה זה עלולה להיווצר בעיה בהשמטת משתנה : β א. בעיה באמידה של הבעיה תיווצר במקרה ובו קיים קשר בין המשתנה הב"ת שהושמט לבין המשתנים הב"ת האחרים במודל. β βˆ, x כאשר, r בהיעדר לא ישקף טוב את הפרמטר באוכלוסיה (יהיה אומד מוטה לפרמטר) מכיוון שהוא "יספח לעצמו" חלק מן ההשפעה שיש ל-.Y על x הדגמה באמצעות מעגלי ואן: **שימו לב- אם מקדם השיפוע של cov להסיק מכך כי x שונה במודל הנאמד לעומת במודל האמיתי ניתן []

וβ ניתן להעריך את כיוון ההטיה (חיובית או שלילית) של האומד ל- βˆ ביחס לפרמטר β באוכלוסיה: S β S cov( x, x ) βאו גודל ההטיה: cov( x, x ) S E( ˆ β ) β β S x מהמודל). אם S βיהיה חסר הטיה (למרות היעדרו של האומד ל- S אם אם ו- β יהיה מוטה כלפי מעלה. β הם שווי סימן-ההטיה חיובית-האומד ל- ו- βיהיה מוטה כלפי מטה. βהם שוני סימן-ההטיה שלילית- האומד ל- S ב. בעיה באמידה של α: E( ˆ) α α β ( x x S S ) ניתן לראות כי גם כאשר S האומד ל- α יהיה מוטה. x האומד ל- α יהיה חסר הטיה. רק כאשר S וגם - :α ג. בעיה באמידת השונות של אומד השונות יהיה מוטה תמיד כלפי מעלה כי הוא איננו לוקח בחשבון את החלק ש- מסביר ב- Y : x s β מוטה כלפי מעלה. ˆ מכיוון ש- ESSמוטה כלפי מעלה אז S ˆ β ESS T k מסקנה: בדיקת ההשערות על הפרמטרים של המודל הנאמד איננה תקפה. []

סיכום: בהיעדר, x בדיקות ההשערות לפרמטרים של המודל הטעותי אינן תקפות:: אומד ל- α אומד לשונות הפרמטרים β אומד ל- חסר הטיה מוטה מוטה (כלפי מעלה) S אלא אם- x מוטה מוטה S כיוון ההטיה: βשווי סימן S ו- חיובי: βמנוגדי סימן S ו- שלילי: [3]

מולטיקוליניאריות מולטיקוליניאריות היא תופעה סטטיסטית בעייתית המתייחסת למתאם בין המשתנים המסבירים במודל. נבחין בין מולטיקוליניאריות מלאה לחלקית. ) מולטיקוליניאריות מלאה מתאם מלא בין המשתנים המסבירים במודל. הדבר קורה כאשר משתנה מסביר אחד הוא קומבינציה ליניארית מלאה של המשתנה המסביר השני:. r ( מכאן ש: x x הוא קומבינציה ליניארית מלאה של ) x a bx **שימו לב כי מדובר בטרנספורמציה ליניארית ולא בטרנספורמציה אחרת (למשל. r ), x אז בהכרח x במצב של מולטיקוליניאריות מלאה אין כל השפעה של המשתנה האחד מעבר לשני. לדוגמא: נניח שאנו רוצים לאמוד את הביקוש לדירות בתל אביב כפונקציה של מחירן :( x ( x ובדולרים ) בשקלים ) Y α β x β x u בהנחה ששער הדולר נותר קבוע, המחיר בדולרים מהווה קומבינציה ליניארית מלאה של המחיר בשקלים (המחיר בשקלים * שער הדולר). במקרה כזה לא ניתן להפריד את ההשפעה של שני המשתנים הב"ת זה מזה ומדובר בעצם באותו המשתנה. מדוע זה בעייתי? כיוון שלא ניתן לאמוד את המודל שכן אר"פ אינם מוגדרים. [4]

הסבר: בגזירת אר"פ, נוצר מצב של תלות ליניארית בין המשוואות הנורמאליות וחלקן יתבטלו. ניוותר עם יותר נעלמים ממשוואות ועם אינסוף פיתרונות, כך שלא נוכל להגדיר את האומדים. בדוגמא שלנו: Y α β x β x u uˆ :αˆ uˆ x :βˆ uˆ x :βˆ גזירת גזירת גזירת b uˆ ( bx uˆ x ) :βˆ (b x שער הדולר) אז גזירת bx מכיוון ש: והמשוואה מתבטלת. ( פיתרון: הורדת אחד המשתנים ואמידת המשוואה מחדש בלעדיו. מולטיקוליניאריות חלקית כאשר יש מתאם גבוה מאוד בין משתנים מסבירים במודל (אך לא מושלם) עלולה להיווצר בעיה של מולטיקוליניאריות חלקית. לדוגמא: נניח שאנו רוצים לאמוד את הציונים בתואר ראשון ע"י ציוני הפסיכומטרי :( x ( x וציוני הבגרות ) ) Y α β x β x u מכיוון שיש מתאם גבוה בין ציוני הפסיכומטרי וציוני הבגרות לא נוכל לבודד באופן מלא את ההשפעה המדויקת של כל אחד מהם על ציוני ה-. B.A. כל אחד מהמשתנים הב"ת "יגזול" מן ההשפעה הייחודית שיש למשתנה הב"ת השני על המשתנה התלוי, כך שבסופו של דבר, למרות שהמודל עם שני המשתנים הב"ת יהיה מובהק, התרומה הייחודית של כל משתנה ב"ת לניבוי התלוי לא תהיה מובהקת. [5]

זיהוי מולטיקוליניאריות חלקית: כאשר קיימת סתירה בין התוצאה במבחן Fלמובהקות המודל (המודל מובהק) לבין מבחני למובהקות השיפועים (אף אחד מן השיפועים איננו מובהק). ( הסתירה נוצרת כתוצאה מהגדלת השונות של כל אחד מהשיפועים בשל המתאם הגבוה בין הב"ת, באופן שלא מאפשר לדחות את השערת האפס למובהקות השיפועים: MSE s ˆ β SSX( r ˆ β S ˆ β ) רגישות לספציפיקציה- הורדת משתנה ב"ת שאיננו מובהק תהפוך משתנים ב"ת אחרים במודל למובהקים. אם אין בעיה של מולטיקוליניאריות, הורדת משתנים ב"ת שאינם רלוונטיים מהמודל, לא אמורה להשפיע על מובהקותם של המשתנים הב"ת האחרים. סימנים הפוכים-כאשר השיפועים של המשתנים הב"ת מקבלים סימנים x משפיע הפוכים מכיוון ההשפעה שלהם על המשתנה התלוי. אם למשל, x משפיע שלילית עלYאבל הם יופיעו במשוואת הרגרסיה חיובית על Yואילו ( (3 עם סימנים הפוכים (ˆβ שלילית ואילו [6] ˆ βחיובית), יש לחשוד שקיימת בעיה של מולטי קולינאריות במודל (מתאם גבוה מאוד בין המשתנים הב"ת ש"מבלבל" את הסימנים שלהם). השלכות של מולטיקוליניאריות חלקית: מולטיקוליניאריות חלקית איננה פוגעת בתכונות של אר"פ (הם נותרים ליניאריים, חסרי הטיה, יעילים ועקיבים) ולא באומד השונות של האומדים (שנותר חסר הטיה) כך שבדיקת השערות תוך שימוש באומדים הללו תהיה תקפה (זאת בניגוד למולטיקוליניאריות מלאה). במובן הזה, בעיה של מולטיקוליניאריות חלקית דומה לבעיה של הוספת משתנה ב"ת שאיננו רלוונטי.

פיתרונות למולטיקוליניאריות חלקית: ) ברוב המקרים נשקול להוריד את אחד המשתנים. < ˆ, יתכן < β יחד עם זאת, כאשר המובהקות של המשתנים היא גבולית ונותיר את שניהם בתוך המודל כיוון שבסך הכול יש עליה ב- AdjR (לפי חוק חיטובסקי). ניתן לעיתים לאחד את שני המשתנים למשתנה אחד. למשל, בדוגמא של ניבוי ציוני ה-. B.Aעל ידי ציוני הפסיכומטרי והבגרות, יש לשקול להגדיר משתנה חדש שיהווה שקלול ציוני הפסיכומטרי והבגרות ולהשתמש בו לניבוי ה-.B.A. ( שלבי בדיקת ההשערות: מבצעים מבחן Fלבדיקת מובהקות המודל. במידה והמודל מובהק, מבצעים מבחן למובהקות כל אחד מהשיפועים. ביצוע מבחן WALDלבדיקת כל השיפועים שלא יצאו מובהקים: ( ( (3 א. ב. אם מקבלים את H: אין סתירה עם מבחני - אין בעיה של מולטיקוליניאריות חלקית, נוריד את קבוצת המשתנים הלא רלוונטיים מהמודל. אם דוחים את H: יש סתירה עם מבחני - קיימת בעיה של מולטיקוליניאריות חלקית, יש להוריד מן המודל כל פעם משתנה אחד ולבצע מבחן WALDבלעדיו, עד שמזהים את המשתנה/משתנים שיש להוריד מהמודל. [7]

סיכום ותרגול של טעויות ספציפיקציה ומולטי קולינאריות הבעיה סיכום הגדרה זיהוי השלכות פיתרון הוספת משתנה לא רלוונטי המודל האמיתי: קבלת H במבחן β למובהקות ניתן לבצע בדיקת השערות *הורדת המשתנה ˆα) חסרי הטיה אר"פ ) β ˆ β, ˆ, α β x ε Y S S ˆ α, ˆ, β ˆ β S המודל הנאמד (הטעותי): α β x β x ε אומדי השונות ) ( חסרי הטיה Y השמטת משתנה רלוונטי המודל האמיתי: דחית H במבחן β למובהקות לא ניתן לבצע בדיקת השערות אומד ל- α אומד לשונות הפרמטרים הוספת המשתנה β אומד ל- בהיעדר : x α β x β x ε Y S המודל הנאמד (הטעותי): חסר הטיה מוטה מוטה חיובית אלא אם- x Y α β x ε מוטה חיובית: מוטה מוטה חיובית S β שווי סימן S ו- מוטה שלילית: β מנוגדי סימן S ו x a bx מולטיקוליניאריות מלאה מתאם מלא בין המשתנים המסבירים במודל אם: r אז: לא ניתן לבצע בדיקת השערות הורדת אחד המשתנים α, ˆ ( בלתי מוגדרים. אר"פ ) β ˆ β, ˆ α β x β x ε Y כאשר ± r מולטיקוליניאריות חלקית מתאם חזק בין המשתנים המסבירים במודל א.סתירה בין מבחן Fל- ב.רגישות לספציפיקציה ג.סימנים הפוכים ניתן לבצע בדיקת השערות אין פגיעה בתכונות אר"פ ושונותם **הורדת אחד המשתנים או איחודם α β x β x ε Y כאשר.7< r < ( נשקול להשאיר משתנה לא רלוונטי כי מעלה את AdjR (חוק חיטובסקי). [8] < β ˆ < * במידה והמובהקות גבולית ( > (>ˆ β ( נשקול להשאיר את שניהם בשל העלייה ב- AdjR (חוק חיטובסקי). ** במידה ומובהקותם גבולית

: S תרגול שאלה מס' להלן מודל של שכר W, כפונקציה של שנות לימוד W α β S u () : A S ושל גיל להלן מודל של שכר W, כפונקציה של שנות לימוד W A v α β S β () כל האומדים חיוביים ומובהקים וקיים קשר שלילי בין גיל להשכלה. βˆ א. במשוואה () הוא: אומד חסר הטיה אומד מוטה שלילית אומד מוטה חיובית אומד מוטה, אך לא ניתן לדעת את כיוון ההטיה....3.4 ב. ג. ניתן להשתמש במבחן לבדיקת מובהקות השיפוע במשוואה (). נכון/לא נכון/ לא ניתן לדעת בנוסף למשתנים במשוואה השנייה, החליט החוקר להוסיף גם את משתנה הוותק,. EXP מכיוון שלא היו בידו נתונים על הוותק, החליט החוקר להעריכו עבור כל עובד על ידי הגיל של העובד פחות 4 שנים (מתוך ההנחה שהחיים המקצועיים מתחילים בגיל זה לערך). להלן משוואה מס' 3: W EXP w α β S β A β3 (3) חווה דעתך על המשוואה השלישית. [9]

שאלה מס' נתונות ארבע משוואות הרגרסיה הבאות (כאשר הסטיות במודל האמיתי מקיימות את הנחות הרגרסיה הקלאסיות): Vɵ ( X X ) X λ δ X V כאשר התקבל : () Y α β X β X U (. 3) ( 9. 8) () Y α β X β X β3 X3 W ( 9. 9) ( 7. 3) (. 37) (3) Y α β X Σ (4) (6.3) (המספרים בסוגריים הם ערכי של אומדני המקדמים). לגבי הטענות הבאות, קבעו לגבי כל טענה אם היא נכונה או לא, והסבירו : βמוטה. א. האומד של βבמשוואה () הינו חסר הטיה, אך אומד השונות של βמוטה. βמוטה. ב.האומד של ג. האומד של βבמשוואה (3) הינו חסר הטיה, אך אומד השונות של βבמשוואה (4) הינו חסר הטיה, אך אומד השונות של במשוואה (4) זהה ל ɵβ ד. האומדן ɵβ במשוואה (). ɵβ ה. השונות התיאורטית של האומדן במשוואה (4) זהה לשונות התיאורטית של ɵβבמשוואה (), אך אומדני השונויות שונים. []

α במשוואה (4) הינו חסר הטיה. α ו. האומד ל - ז. האומד ל - במשוואה (3) הינו חסר הטיה. ח. ט. R של משוואה () גדול מ - R של משוואה.(3) R של משוואה () גדול מ - R של משוואה.(3) שאלה מס' 3 Y α β X β X U נתון המודל : חוו דעתכם על הטענות הבאות (כל סעיף עומד בפני עצמו): R.9 Y α β X β X U א. בהנחה כי מתקיים: (.5) (.3) הערכים בסוגריים הם ערכי למובהקות הבטות. יש טעות במודל כי המודל מובהק והמקדמים לא: נכון/לא נכון/ לא ניתן לדעת X X ב. בהנחה כי מתקיים : לא ניתן לאמוד את המודל בשיטת הריבועים הפחותים: נכון/לא נכון/ לא ניתן לדעת. x x ג. בהנחה כי מתקיים: לא ניתן לאמוד את המודל בשיטת הריבועים הפחותים: נכון/לא נכון/ לא ניתן לדעת. ד. הוכיחו תשובותיכם לסעיפים א ו- ב. r.98 ה. בהנחה כי מתקיים:. לא ניתן לאמוד את המודל בשיטת הריבועים הפחותים: נכון/לא נכון/ לא ניתן לדעת. []

איזו בעיה עלולה להיווצר במודל ומהן השלכותיה. בהנחה שהמודל יצא מובהק אולם הבטות אינן מובהקות וערכי..3, מה יהיה הפיתרון הטוב ˆ β ˆ β.3 למובהקות הבטות הן כדלקמן:.45 ביותר, לדעתכם, לבעיה במודל (אליה התייחסתם בסעיף )? x x א. ב. להוריד את להוריד את ג. ד. להוריד את שני המשתנים. להותיר את שני המשתנים. []

משתני דמי הנושא של משתני דמי מטפל בהכנסת משתנים ב"ת איכותיים למודל הרגרסיה. עד כה כל המשתנים הב"ת שהכנסנו למודל היו כמותיים, כלומר קיבלו ערכים מספריים. למשל, נניח שאנו סבורים שמס' שנות הלימוד של אדם משפיעות על שכרו: W השכר (המשתנה התלוי) שנות לימוד (המשתנה הב"ת ( S W α β S משוואת הרגרסיה: במקרה זה המשתנה המסביר (כמו גם המוסבר) הוא כמותי. נניח שאנו סבורים שגם משתנה המגדר משפיע על השכר. משתנה זה איננו כמותי כמו שנות לימוד אלא איכותי שכן הוא לא מקבל ערכים מספריים אלא ערכים קטגוריאליים כ"גבר" או "אישה". נשאלת השאלה כיצד נכניס אותו לתוך משוואת הרגרסיה? נגדיר משתנה Dשיקבל את הערך אם מדובר ב"אישה" ואת הערך אם מדובר ב"גבר". משתנה כזה נקרא משתנה דמי variable).(dummy לעומת משתנה רגיל ש"פועל" תמיד, משתנה זה "יפעל" רק אם מדובר בגבר. ניתן להכניס את משתנה הדמי למודל בשלושה אופנים שונים: () משתנה דמי לחותך- המין משפיע על השכר ההתחלתי בלבד () משתנה דמי לשיפוע- המין משפיע על התוספת לשכר בגין שנות הלימוד (3) משתנה דמי לכל הפונקציה- המין משפיע גם על החותך וגם על השיפוע [3]

( )משתנה דמי לחותך המין משפיע על השכר ההתחלתי בלבד. W α D β S u α המודל: החותך מייצג כאן את השכר ההתחלתי. α שכר ההתחלתי של אישה: α α שכר התחלתי של גבר: α (הפרש בין החותכים) הבדל בשכר בין נשים וגברים: H : α בדיקת השערות על משתנה הדמי: מבחן למובהקות הפרש החותכים: W? ** השיפוע מייצג את התוספת בשכר כפונקציה של מס' שנות הלימוד והוא זהה עבור נשים וגברים. על בסיס מדגם של 5 איש העובדים בחברה מסוימת התקבלו התוצאות הבאות: 55 43 D 9 S (S.E) (34) (56) ( 4) המספרים בסוגריים הם טעויות התקן של מבחני המובהקות לפרמטרים. מהו השכר ההתחלתי של גבר בעל שנות לימוד? א. מה ההבדל בשכר ההתחלתי בין גברים לנשים? ב. האם הבדל זה מובהק באוכלוסיה? ג. בדקו את הטענה כי השכר ההתחלתי של גברים גבוה ביותר מ- 5 מזה של ד. נשים. ה. בדקו את הטענה שהשכר ההתחלתי של נשים נמוך ב- 6 מזה של גברים. [4]

פונקצית רגרסיה המכילה משתנים איכותיים בלבד המגדר הוא המשתנה היחיד במשוואה: α αd u W החותך מייצג כאן את השכר הממוצע עבור כל קטגוריה. α שכר הממוצע של אישה: α α שכר הממוצע של גבר: α (הפרש בין החותכים) הבדל בשכר הממוצע בין נשים וגברים: בדיקת השערות על משתנה הדמי: מבחן בין ממוצעים). α H : (מבחן זהה למבחן להבדל :? על אותו המדגם של 5 איש העובדים בחברה מסוימת ביקש החוקר לבדוק האם יש הבדל בשכר הממוצע בין גברים לנשים. תוצאות האמידה: W 5 D S ˆ α נתון: 63 בדקו האם קיים הבדל מובהק בשכר הממוצע בין נשים וגברים? ( )משתנה דמי לשיפוע המגדר משפיע על התוספת לשכר בגין שנות הלימוד. W α β β DS u S השיפוע מייצג כאן את התוספת לשכר בגין שנות לימוד. אצל אישה: התוספת לשכר בגין שנות לימוד- β [5]

β β אצל גבר: התוספת לשכר בגין שנות לימוד- β (הפרש השיפועים) הבדל בין גברים לנשים בתוספת לשכר בגין שנות הלימוד: H : β בדיקת השערות על משתנה הדמי: מבחן למובהקות הפרש השיפועים:? ** החותך, המייצג את השכר ההתחלתי, יהיה זהה עבור גברים ונשים. על בסיס אותו מדגם, ביקש החוקר לדעת האם קיים הבדל מובהק בין גברים לנשים בתוספת לשכר בגין שנות הלימוד. תוצאות האמידה נתונות להלן: W 5 S D S u (68) (3) (5) בדוק את ההשערה. ( 3 )משתנה דמי לכל הפונקציה המין משפיע גם על החותך וגם על השיפוע. הווה אומר, גם על השכר ההתחלתי וגם על התוספת לשכר ההתחלתי בגין שנות הלימוד. α αd βs β W DS u המודל: α השכר ההתחלתי של אישה: α α השכר ההתחלתי של גבר: הבדל בשכר ההתחלתי בין המינים: α (הבדל בחותכים) β אצל אישה-התוספת לשכר בגין שנות הלימוד: β β אצל גבר-התוספת לשכר בגין שנות הלימוד: β (הבדל בשיפועים) הבדל בין המינים בתוספת לשכר בגין שנות הלימוד: [6]

בדיקת השערות למשתני הדמי: H : α β באמצעות מבחן WALDיש לבדוק: לפחות אחד הפרמטרים שונה מ- H: אם דוחים את השערת האפס, יש לבצע מבחני עבור כל אחד מהפרמטרים בנפרד: H : β α HO : ו- מבחן CHOW דרך נוספת לבדיקת ההבדל בין הקטגוריות, בלא יצירת משתני דמי: (T m ושל חלוקת המדגם לפי הקטגוריות של המשתנה האיכותי. מדגם של גברים ).(T f נשים ) עבור כל קבוצה לאמוד משוואות רגרסיה לניבוי שכר על ידי שנות לימוד. נשים: W α β X u f f גברים: W α β X u m m H : α α ; β β f m f m השערות: לבדיקת ההשערה נשתמש במבחן CHOW (הזהה למבחן WALDשהשתמשנו בו מקודם): המודל המוגבל (R) לא לוקח בחשבון את השפעת המגדר ולכן לא יכלול את המדגם המאוחד כי אין צורך בשתי רגרסיות נפרדות: W α β X u ESS DF U U ESS DF f f ESS DF m m המודל הלא מוגבל (U) כולל את שני חלקי המדגם: [7]

ESS R ( ESS DFR ( DFf DF m) CHOW sa WALD ESS ESS DF f f f DF ESS m m m ) sa למרות התוצאות הזהות בשתי הדרכים, שיטת משתני הדמי עדיפה:. אם דחינו את HOבמבחן CHOWנתקשה לברר את מקור ההבדל שנמצא.. בהרצת שתי רגרסיות נפרדות אנו בודקים הבדל בכל הפונקציה ואילו שיטת משתני הדמי מאפשרת לבדוק הבדל רק בחותך או רק בשיפוע. חוקר רצה לבדוק את הטענה שסוג הכביש משפיע על מס' תאונות הדרכים בקטעי כביש בינעירוניים, בהינתן נפח התנועה. החוקר בדק האם הפונקציה של מס' התאונות בהינתן נפח התנועה, שונה בין כבישים מהירים לבין כבישים שאינם מהירים. לשם כך אמד החוקר את ארבע המשוואות הבאות:? כבישים מהירים בלבד כבישים לא - מהירים בלבד שני סוגי הכביש (כל המדגם) NUM NUM NUM γ δ AVGD ε γ δ AVGD ε γ δ AVGD ε 3 3 3 () () (3) NUM α β TYPE β AVGD β3 ( AVGD TYPE) U (4) מס' תאונות הדרכים הקטלניות בקטע כביש בשנה NUM כאשר : AVGD נפח התנועה בקטע כביש ליום באלפים משתנה דמי המקבל את הערך כאשר הכביש מהיר, ו- TYPE כאשר הכביש לא מהיר. תוצאות אמידת המשוואות מופיעות בהמשך השאלה. [8]

בדקו את טענת החוקר בשתי דרכים שונות. ציינו איזה מן המשוואות רלוונטיות עבור כל דרך. חשבו את הערכים המספריים עבור אומדני משוואה (4). מהו האומדן הנקודתי למס' התאונות בכביש מהיר כאשר נפח התנועה עומד על ארבעת מכוניות ליום בקטע הכביש האמור? ( ( (3 הועלתה הטענה כי המקדם להשפעה של נפח התנועה בדרכים מהירות הינו כפול מזה שבדרכים לא -מהירות. 4) מהי השערת האפס לבדיקת הטענה (במונחי משוואה (4))? (5 מהי הרגרסיה "תחת " H למבחן?WALD [9]

- כבישיםמהיריםבלבד משוואה () The REG Procedure Model: MODEL Dependen Variable: num num Number of Observaions Read 344 Number of Observaions Used 344 Analysis of Variance Sum of Mean Source DF Squares Square F Value Pr > F Model 47.874 47.874 89. <. Error 34 839 5.74684 Correced Toal 343 74 Roo MSE 7.67 R-Square.67 Dependen Mean 5.465 Adj R-Sq.44 Coeff Var 4.767 Parameer Esimaes Parameer Sandard Variable DF Esimae Error Value Pr > Inercep.5589.5433.86.45 avgd.98. 9.44 <. [3]

- כבישיםלאמהירים בלבד משוואה () The REG Procedure Model: MODEL Dependen Variable: num num Number of Observaions Read 4 Number of Observaions Used 4 Analysis of Variance Sum of Mean Source DF Squares Square F Value Pr > F Model 97.9973 97.9973 45.83 <. Error 48 79.3483 6.6657 Correced Toal 49 369.339 Roo MSE.5868 R-Square.633 Dependen Mean.3878 Adj R-Sq.65 Coeff Var 86.6 Parameer Esimaes Parameer Sandard Variable DF Esimae Error Value Pr > Inercep.4978.636.9.365 avgd.877.38.8 <. [3]

- שניסוגיהכביש (כלהמדגם) משוואה (3) The REG Procedure Model: MODEL Dependen Variable: num num Number of Observaions Read 754 Number of Observaions Used 754 Analysis of Variance Sum of Mean Source DF Squares Square F Value Pr > F Model 85.84 85.84 88.84 <. Error 75 964 7.8773 Correced Toal 753 96 Roo MSE 5.799 R-Square.775 Dependen Mean 3.8355 Adj R-Sq.765 Coeff Var 7.758 Parameer Esimaes Parameer Sandard Variable DF Esimae Error Value Pr > Inercep.7393.3665 3..9 avgd.33.37 7. <. [3]

משוואה (4) The REG Procedure Model: MODEL Dependen Variable: num num Number of Observaions Read 754 Number of Observaions Used 754 Analysis of Variance Sum of Mean Source DF Squares Square F Value Pr > F Model 3 856.966 75.3 99.44 <. Error 75 759 7.678 Correced Toal 753 96 Roo MSE 5.6 R-Square.846 Dependen Mean 3.8355 Adj R-Sq.87 Coeff Var 7.6553 Parameer Esimaes Parameer Sandard Variable DF Esimae Error Value Pr > Inercep.4978.3334.45.6534 ype.67 avgd <. avgdype.83 [33]

סיכום ביניים: משתנה דמי לחותך משתנה דמי לשיפוע משתנה דמי לכל הפונקציה α αd β X β Y DX u Y α β β DX u X Y α D β X u α המודל ההשערה במילים קיים הבדל בין הקטגוריות ב- Yההתחלתי (בחותך). קיים הבדל בין הקטגוריות בתוספת ל- Yבגין X (בשיפוע). קיים הבדל בין הקטגוריות במשוואת הרגרסיה כולה (בחותך ובשיפוע). בדיקת ההשערה מבחן להפרש החותכים: מבחן להפרש השיפועים: מבחן WALDלהפרש בין הפונקציות (החותכים והשיפועים): H : α β H : β H : α **ניתן לבדוק את ההשערה בדבר הבדל בין הפונקציות גם במבחן.CHOW אם דוחים את HOיש לברר את מקור ההבדל באמצעות מבחני (אפשרי רק ב- WALD ): H : α H : β [34]

משתני דמי אם המשתנה האיכותי יכול לקבל יותר משני ערכים כאשר המשתנה האיכותי כלל שני ערכים בלבד (למשל, מגדר: גבר, אישה) הסתפקנו במשתנה דמי אחד. במקרים רבים המשתנה האיכותי כולל יותר משני ערכים/קטגוריות. במקרה כזה נגדיר מס' משתני דמי כמספר הקטגוריות פחות אחד. למשל, את המשתנה האיכותי של עונות השנה הכולל 4 ערכים: אביב, קיץ, סתיו, חורף נייצג באמצעות 3 משתני דמי: יקבל את הערך אם מדובר באביב ו- אחרת. יקבל את הערך אם מדובר בקיץ ו- אחרת. יקבל את הערך אם מדובר בסתיו ו- אחרת. D D D 3 אם מדובר בחורף אז כל משתני הדמי יקבלו את הערך ולכן החורף היא קבוצת הייחוס. נניח שאנו רוצים לבדוק עונתיות במחירי הירקות: V מדד מחירי הירקות p מדד המחירים לצרכן ( )משתנידמילחותך הטענה: יש הבדל בין עונות השנה במחיר ההתחלתי של הירקות α αd α D α 3D3 V β P u המודל: כל עליה של יחידה אחת במדד המחירים לצרכן תעלה את מחירי הירקות ב-.β למחיר זה יתווסף αבסתיו. α 3 αבקיץ ו- α α באביב, α αבחורף, ניתן לראות כי: α :החותך בקטגוריה שהושמטה i. בקטגוריה :החותך α α i [35]

בדיקת השערות: השערות: H : α α α3 H: OTHERWISE המבחן הסטטיסטי : מבחן :WALD α αd α D α 3D3 V β P u V α β P u (U) (R) **שימו לב שהחותך במשוואה המוגבלת איננו השנה ירד. α שכן המשתנה המסביר של עונות אם נדחה את HOבמבחן הסטטיסטי של הסעיף הקודם, יש לבדוק מה מקור ההבדל בין החותכים על ידי מבחני : H : α האם יש הבדל במחיר ההתחלתי של הירקות בין האביב לחורף: H : α האם יש הבדל במחיר ההתחלתי של הירקות בין הקיץ לחורף: H : α 3 האם יש הבדל במחיר ההתחלתי של הירקות בין הסתיו לחורף:...3? א. הועלתה הטענה כי יש הבדל במחיר ההתחלתי בין האביב לקיץ. מהי השערת האפס לבדיקת הטענה? פרטו שני מבחנים סטטיסטיים בעזרתם ניתן לבדוק את הטענה... ב. הועלתה הטענה כי יש רק שתי עונות המשפיעות על מחיר הירקות ההתחלתי: קיץאביב, חורףסתיו.. מהי השערת האפס לבדיקת הטענה? [36]

. מהו המבחן הסטטיסטי המתאים? פרטו. ( )משתני דמי לשיפוע הטענה: יש הבדל בין עונות השנה בתוספת למחיר הירקות בגין המחיר לצרכן V α β P ) u P β( D ip ) β ( Di P ) β3( D3i המודל: המחיר ההתחלתי של הירקות שווה בין עונות השנה ) α) אולם כל עליה של יחידה אחת במדד המחירים לצרכן תעלה את מחירי הירקות ב: βבסתיו. β 3 βבקיץ ו- β β באביב, β β בחורף, ניתן לראות כי: β: השיפוע בקטגוריה שהושמטה.i השיפוע בקטגוריה : β β i בדיקת השערות: השערות: H : β β β3 H: OTHERWISE המבחן הסטטיסטי : מבחן :WALD V α β P ) u P β( D ip ) β ( Di P ) β3( D3i V α β P u (U) (R) β **שימו לב שהשיפוע במשוואה המוגבלת איננו השנה ירד. שכן המשתנה המסביר של עונות אם נדחה את HOבמבחן הסטטיסטי של הסעיף הקודם, יש לבדוק מה מקור ההבדל בין השיפועים על ידי מבחני. [37]

( 3 )משתני דמי לכל הפונקציה הטענה:יש הבדל בין עונות השנה בפונקצית הרגרסיה לניבוי מחיר הירקות באמצעות המחיר לצרכן. V α P ) u αd i α Di α 3D3i β P β( D ip ) β ( Di P ) β3( D3i המודל: בדיקת השערות: השערות: HO α α α β β β : 3 3 המבחן הסטטיסטי: מבחן :WALD V α P ) u αd i α Di α 3D3i β P β( D ip ) β ( Di P ) β3( D3i V α β P u (U) (R) אם דוחים את,HO יש לבדוק במבחני WALDהאם ההבדל הוא בין החותכים או בין השיפועים: HO β β β : 3 HO α α α : 3 באם דוחים את H יש להמשיך לבדוק באמצעות מבחני : : HO β j H : α j משתני דמי עבור שני משתנים איכותיים נתבונן בדוגמא שבה יש שני משתנים איכותיים המשפיעים על פונקצית השכר- מגדר (אישה, גבר) וגזע (לבן, שחור). נגדיר משתנה דמי Gשיקבל אם מדובר בגבר ו- אחרת (אישה). [38]

נגדיר משתנה דמי Rשיקבל אם מדובר בלבן ו- אחרת (שחור). נבדוק כיצד מגדר וגזע משפיעים על השכר ההתחלתי (החותך), כאשר השכר תלוי גם בשנות לימוד ).( S () הבדל בחותך ללא אינטראקציה W α G α R β S u α המודל: במודל זה- אין השפעה משולבת של מגדר וגזע על השכר ההתחלתי. במילים אחרות, ההבדל בשכר ההתחלתי בין גברים ונשים לא תלוי בגזע (זהה עבור שחורים ועבור לבנים) ולהיפך-ההבדל בשכר ההתחלתי בין לבנים לשחורים לא תלוי במגדר (זהה עבור נשים וגברים). ניתן לבדוק השערות על כל אחד מהמשתנים הב"ת האיכותיים בנפרד: הבדל בשכר ההתחלתי בין גברים לנשים : α HO :. H : α. הבדל בשכר ההתחלתי בין שחורים ללבנים: () הבדל בחותך עם אינטראקציה המודל: W α G α R α G R β S u α 3 במודל זה הטענה היא כי קיימת, בנוסף להשפעה של מגדר וגזע בנפרד על השכר, גם השפעה משולבת (אינטראקציה) של מגדר וגזע על השכר ההתחלתי. במילים אחרות, ההבדל בשכר ההתחלתי בין גברים ונשים תלוי בגזע (שונה אם מדובר בשחורים או בלבנים) ולהיפך. במודל זה, לעומת הקודם, נוספת ההשערה לבדיקת השפעת האינטראקציה בין מגדר לגזע על השכר ההתחלתי: HO : α 3.3 [39]

דרך נוספת ליצירת מודל עם אינטראקציה: הגדרת משתני דמי המייצגים שילוב בין המשתנים האיכותיים גזע ומגדר באופן הבא: D יקבל אם מדובר בגבר לבן ו- אחרת D יקבל אם מדובר בגבר שחור ו- אחרת D 3 יקבל אם מדובר באשה לבנה ו- אחרת הנשים השחורות מהוות כאן את קבוצת הייחוס. W γ D γ D γ D δ S u γ 3 3 המודל: נעזר בטבלה בכדי לנסח את ההשערות לבדיקת האינטראקציה: גבר אישה הפרש γ γ 3 γ γ 3 γ γ לבן γ γ γ γ שחור γ 3 γ γ הפרש ההשערות לבדיקת קיום האינטראקציה: HO : γ γ γ 3 HO : γ γ או γ 3 התוצאות שיתקבלו כאן יהיו כמובן זהות לחלוטין לתוצאות שהתקבלו בדרך הקודמת: WALD PF P [4]

? שאלה מס' חוקר בדק השפעות של השכלה, גזע (שחור, לבן) וניסיון (EXP) על לוג השכר (ln(y)) במדגם בן 36 תצפיות: ln( Y ) α α D α D α D β EXP β EXP u 3 3 ( ln(y -לוג השכר -EXP שנות ניסיון D מקבל את הערך עבור שחורים בעלי השכלה גבוהה (ו- אחרת) D מקבל את הערך עבור שחורים בעלי השכלה נמוכה (ו- אחרת) D 3 מקבל את הערך עבור לבנים בעלי השכלה גבוהה (ו- אחרת) תוצאות אמידת משוואת הרגרסיה מוצגות בפלט להלן: Analysis of Variance Sum of Mean Source DF Squares Square F Value Pr > F Model 5 -------- ------ ------ ------ Error 3 4 ------ Correced Toal 35 Roo MSE ------- R-Square ------- Dependen Mean ------- Adj R-Sq ------- Coeff Var ------- [4]

א( ב( ג( ד( ה( Parameer Esimaes Parameer Sandard Variable DF Esimae Error Value Pr > Inercep ------- -------- 6.84. D ------- -------- - 3.. D ------- -------- - 5.56. D3 ------- -------- 7.3. EXP ------- -------- 8.. EXP -------- -------- - 7.45. בטרם ניגשים לפיתרון השאלה יש להכין את טבלת העזר הבאה: השכלה נמוכה השכלה גבוהה הפרש α 3 α α 3 α לבנים α α α α α α שחורים α α 3 α הפרש ( לפי המשוואה הניסיון זהה עבור שחורים ולבנים: נכון/לא נכון/ לא ניתן לדעת ( בדוק את הטענה כי בקרב אנשים בעלי השכלה נמוכה אין השפעה לגזע. ( בדוק את הטענה כי אין השפעות השכלה בקרב לבנים. ( הי השערת האפס לבדיקת הטענה כי אין אינטראקציה בין גזע להשכלה? ( לבדיקת ההשערה של הסעיף הקודם בוצע מבחן.WALD [4]

ו( ז( ח( הרגרסיה המוגבלת תחת השערת האפס הינה: Z מהם ה- Zים? γ γ Z γ Z γ Z γ ν 3 3 4Z 4 ( בדוק את ההשערה אם ידוע שבמודל המוגבל.33 R ( החוקר החליט לאמוד במקום את המשוואה המקורית את המשוואה: ln( Y ) λ λ S λ E λ ( S E δ EXP δ EXP ω 3 ) כאשר: Sמקבל את הערך עבור שחורים ו- אחרת (לבנים) Eמקבל את הערך עבור השכלה גבוהה ו- אחרת (השכלה נמוכה). מה הקשר בין המקדמים של שני המודלים? ( אם יאמוד החוקר את המשוואה: ln( Y ) λ λ S λ E δ EXP δ EXP ω האם תהיה טעות ספציפיקציה של השמטת משתנה רלוונטי (היעזר בסעיפים ד',ו' ו- ז'). שאלה מס' חוקרת הבאה: בדקה השפעות השכלה, מגדר וניסיון על הכנסה מעבודה לפי המשוואה ln( MWAGE) α α S α E α ( S E) β EXP β ( EXP S) β ( EXP E) β ( EXP S E) U 3 3 משתנה דמי : עבור נשים, גברים משתנה דמי : עבור השכלה גבוהה ) < scl (, השכלה נמוכה S E כאשר : [43]

בטרם ניגשים לפיתרון השאלה יש להכין את טבלת העזר הבאה: (E) השכלה גבוהה (E) השכלה נמוכה הפרש α α 3 α חותך: α ( β β)exp α ( )EXP α α α3 β β β β3 נשים (S) β β 3 שיפוע: α חותך: α β EXP α ( )EXP α β β גברים (S) β שיפוע: α α חותך: α 3 הפרש חותך: β β שיפוע: β 3 שיפוע: א. רשמו את הפונקציה לחישוב: תחזית לוג השכר עבור גבר בעל השכלה נמוכה ו- שנות ניסיון. תחזית לוג השכר ההתחלתי עבור נשים משכילות. לאחר כמה שנות ניסיון ישתווה השכר של נשים משכילות לזה של גברים משכילים?...3 ב. רשמו את השערות האפס המתאימות לבדיקת הטענות הבאות: אין השפעה של מגדר והשכלה על השכר. השפעת ההשכלה אינה תלויה במגדר. אין השפעות השכלה אצל גברים. אין הבדל בשיעורי התשואה לניסיון, בקרב הנשים....3.4 [44]

הפרה של ההנחות הקלאסיות ארבעת הנושאים האחרונים שנלמד עוסקים במצב של הפרת אחת ההנחות הקלאסיות הדרושות לאמידת הפרמטרים בשיטת.OLS הנושא הראשון- הטרוסקדסטיות, עוסק בהפרת הנחה מס' 5 המדברת על שונות קבועה ויחידה לאורך קו הרגרסיה:.V ( ) σ u הנושא השני- מתאם סידרתי, עוסק בהפרת הנחה מס' 6 המדברת על אי תלות בין cov( u, u s הטעויות: ) הנושא השלישי-מודלים דינמיים, והרביעי-משוואות סימולטניות, עוסקים בהפרת cov( x, u) הנחה מס' 4 המדברת על אי תלות בין המשתנים הב"ת לטעויות: בכל אחד מן הנושאים נלמד: מהן ההשלכות של הפרת ההנחות הללו על אומדי הריבועים הפחותים. מהם המבחנים הסטטיסטיים המשמשים לזיהוי קיומה של ההפרה. כיצד נתקן את משוואת הרגרסיה כך שניתן יהיה לאמוד את הפרמטרים בשיטת.OLS [45]

הטרוסקדסטיות הטרוסקדסטיות הוא מצב שבו מופרת הנחה מס' 5, הנחת ההומוסקדסטיות, הגורסת כי השונות של ה"קריזה" היא אותה שונות עבור כל תצפית ותצפית: Vלכל ( ) σ, כלומר התצפיות מפוזרות באופן אחיד סביב קו הרגרסיה. V u במצב של הטרוסקדסטיות הקריזה של כל תצפית היא בעלת שונות אחרת: ( u ) σ למשל כאשר בודקים את הקשר שבין הכנסה ותצרוכת מגלים כי ברמות הכנסה נמוכות אין גמישות רבה בהוצאות ולכן התצפיות מרוכזות סביב קו הרגרסיה. לעומת זאת ברמות גבוהות של הכנסה התצפיות מפוזרות יותר ויש שונות גבוהה יותר בתצרוכת. השונות, אם כן, איננה אחידה סביב קו הרגרסיה והיא תלויה בתצפית- זהו מצב של הטרוסקדסטיות. ההשלכות של הטרוסקדסטיות על אומדי OLS מבין התכונות של אר"פ (ליניאריות, חוסר הטיה, עקיבות ויעילות) היחידה שמופרת בהינתן הטרוסקדסטיות היא: יעילות של אומדי הרבועים הפחותים. זאת מכיוון שבכדי להוכיח יעילות של האומדים השתמשנו בהנחה מס' 5 של שונות קבועה. לכן הפרתה גוררת פגיעה ביעילות האומד. מבחנים לזיהוי הטרוסקדסטיות החשד לקיומה של בעיית הטרוסקדסטיות בנתונים צריך להתעורר כאשר אנו בוחנים את גרף השאריות. גרף השאריות גם מאפשר לנו לבחון את הצורה הפונקציונאלית של השונות, כלומר באיזה אופן השונות משתנה בין תצפית לתצפית. קיימות שתי שיטות לזיהוי הטרוסקדסטיות: מבחן (Goldfeld-Qauand) GQ ומבחן.Whie [46]

ההבדל בין שני המבחנים הוא בהחלטה על הצורה הפונקציונאלית של השונות. כלומר על האופן שבו השונות משתנה בין תצפית לתצפית, (על פי דיאגראמת הפיזור). מבחן GQמניח כי במקום שונות אחת אחידה של הטעויות לכל התצפיות, קיימות שתי שונויות שונות בלבד. ואילו מבחן Whieמניח כי לכל תצפית ותצפית שונות שונה של טעויות. ( מבחן GQ ההנחה העומדת בבסיס מבחן זה היא כי קיימות שתי שונויות שונות של טעויות. ביצוע המבחן: מחלקים את המדגם לשני חלקים: החלק שבו אנו חושדים שיש שונות גבוהה יותר החלק שבו אנו חושדים שיש שונות נמוכה יותר.. מקובל להשמיט מס' תצפיות (בין /6 ל- /3 ) במרכז המדגם. אומדים כל אחד מהחלקים בנפרד ומקבלים את ה- ESSשל כל חלק. ESS ESS / T / T K K מחשבים את הסטטיסטי : F sa (תמיד השונות הגבוהה חלקי הקטנה). F α ; T K, T K ) ( סטטיסטי זה מתפלג F sa > F C כלל ההכרעה: אם אז דוחים את H. HO : σ σ H: σ > σ ההשערות: [47]

Y α βx u לדוגמא: נאמד הקשר שבין הכנסה לתצרוכת: גרף השאריות של הרגרסיה הנ"ל נתון להלן: Scaerplo Dependen Variable: Y 5 Regression Sandardized Residual 4 3 - - -3-4 -5 Rsq. - - Regression Sandardized Prediced Value מגרף זה אנו למדים כי ככל שעולים ברמת ההכנסה כך השונות בהוצאות הפרט עולה. כלומר השונות איננה אחידה סביב קו הרגרסיה אלא תלויה ברמת ההכנסה- זהו מצב של הטרוסקדסטיות. בכדי לבצע מבחן : GQ התצפיות של המשתנה הכנסה סודרו מהגדול לקטן והמדגם חולק לשלוש קבוצות שוות. רגרסיה נפרדת הורצה על השליש הראשון ועל השליש האחרון. התוצאות של אמידת הקשר בין הכנסה לתצרוכת מוצג בפלטים ו- בהתאמה: [48]

משוואה () The REG Procedure Model: MODEL Dependen Variable: Y Number of Observaions Read 6 Number of Observaions Used 6 Analysis of Variance Sum of Mean Source DF Squares Square F Value Pr > F Model -- ------- ------ ---- ------ Error 4 6645.9 ----- Correced Toal --- ----- משוואה () The REG Procedure Model: MODEL Dependen Variable: y Number of Observaions Read 6 Number of Observaions Used 6 Analysis of Variance Sum of Mean Source DF Squares Square F Value Pr > F Model --- -------- -------- ------ ----- Error 4 934638 ------ Correced Toal --- ---- [49]

השערות: HO : σ σ H: σ > σ F sa סטטיסטי המבחן: ESS ESS / T / T K,934,638 K 66,45.9 7.6 כלל הכרעה: F sa לכן יש סיבה מספקת לדחות את HOברמת 7.6> F(.5;4,4).48 מובהקות של 5%. מסקנה: יש עדות להטרוסקדסטיות בנתונים.? על מנת לבחון את פונקצית הייצור בענף מסוים נאספו נתונים על 5 פירמות. נסמן: Qתפוקה שנתית באלפי שקלים. Lמספר עובדים ln( Q) α β המודל הנאמד: (L ln( החוקר חשש שההפרעה המקרית איננה הומוסקדסטית. לשם כך הוא מיין את התצפיות בסדר עולה של מספר העובדים, השמיט /3 מהתצפיות האמצעיות והריץ שתי רגרסיות נפרדות עם מספר שווה של תצפיות: ברגרסיה הכוללת את הערכים הנמוכים יחסית של תשומת העבודה הוא קיבל: [5] ESS79.3 R. 43

ברגרסיה הכוללת את הערכים הגבוהים יחסית של תשומת העבודה הוא קיבל: ESS493.8 R.38 האם יש עדות לקיום הטרוסקדסטיות בנתונים? (בצעו את המבחן המתאים: רשמו השערות, חשבו סטטיסטי מבחן, רשמו כלל הכרעה והגיעו למסקנה). ( מבחן Whie ההנחה העומדת בבסיס מבחן זה כי לכל תצפית ותצפית שונות שונה של טעויות. הביטוי המתמטי של הנחה זו היא היותה של השונות פונקציה ליניארית של כל המשתנים המסבירים, ריבועיהם והאיברים הצולבים: σ σ f ( x j, x, x x j α α x... α x j j ) k k β x k... β x k k γ x x uˆ γ x x... 3 σהוא האומד ל- המבחן הוא מבחן :LM 3 û אומדים את המודל המקורי ומקבלים את הסטיות מקו הרגרסיה (המכונה ב.(RES- SAS אומדים את uˆ כפונקציה ליניארית של כל המשתנים המסבירים, ריבועיהם u ˆ / x, x, x j j j x j והאיברים הצולבים: זוהי רגרסיית העזר. LM sa T ע נחשב את סטטיסטי :LM ע R LM כאשר m מס' המשתנים ברגרסיית העזר. sa > χ m אם השערות: [5] HO : α β γ j H: OTHERWISE j jj

נדגים על אותו הקשר שבין הכנסה לתצרוכת: Y α βx u שאנו חושדים על פי גרף השאריות כי קיים בו מצב של הטרוסקדסטיות. בכדי לבצע את מבחן : WHITE, uˆ Y Yˆ נחשב את השאריות של הרגרסיה: נעלה את השאריות בריבוע: uˆ uˆ α α X β X ν נאמוד את המשוואה: תוצאות האמידה מוצגות להלן: The REG Procedure Model: MODEL Dependen Variable: RES Number of Observaions Read 48 Number of Observaions Used 48 Analysis of Variance Sum of Mean Source DF Squares Square F Value Pr > F Model --- ------- ------ ------ ----- Error --- ------- ------ Correced Toal --- ---- Roo MSE ------- R-Square.39763 Dependen Mean ------- Adj R-Sq ------- [5]

השערות: H : α β H: OTHERWISE סטטיסטי המבחן: LM sa 48 עR עT.397 8.75 כלל הכרעה: LM sa לכן יש סיבה מספקת לדחות את H ברמת מובהקות 8.75> χ (.5) 5.99 של 5%. מסקנה יש עדות לקיום של הטרוסקדסטיות בנתונים. **הערה חשובה: אם חלק מערכי uˆ יצאו שליליים (והרי שונות לא יכולה להיות ln uˆ שלילית) יש להוציא לוג ולאמוד את כך התחזית תצא תמיד חיובית.? חוקר מניח כי מכירות של חנות הן פונקציה של שיטחה, דמי שכירות והאפשרות של מכירת עיתונים. נסמן: Y_SALES מכירות חודשיות (ש"ח) X_SQUARES שטח החנות(מ"ר) X_RENT דמי שכירות( ($ PAPERS משתנה איכותי המקבל -אם החנות מוכרת גם עיתונים ו- אם לא. החוקר חשד כי קיימת בעיה של הטרוסקדסטיות בנתונים. [53]

החוקר ביצע מבחן לזיהוי הטרוסקדסטיות שתוצאותיו נתונות להלן: Dependen Variable: Number of Observaions Read Number of Observaions Used Analysis of Variance Sum of Mean Source DF Squares Square F Value Pr > F Model --- ------- ------ ------ ----- Error --- ------- ------ Correced Toal --- ---- Roo MSE ------- R-Square.8694 Dependen Mean ------- Adj R-Sq ------- Parameer Esimaes Parameer Sandard Variable DF Esimae Error Value Pr > Inercep ------- ---- ------- ----- X_SQUARE ------- ----- ------ ------ X_SQUARE^ ------- ----- ----- ------ X_SQUARE*X_RENT ------- ----- ------ ----- X_RENT ------- -------- ----- ---- X_RENT^ -------- -------- ----- ----- X_RENT*PAPERS ------- ------ ----- ----- PAPERS ------ ------ ----- ---- [54]

הרגרסיה המופיעה בפלט לעיל נועדה לבדיקת : על ידי מבחן : המשתנה התלוי הינו: המשתנים הב"ת: ההשערות הינן: גודל הסטטיסטי למבחן הינו (רשמו תוצאה מספרית): המסקנה המתקבלת היא: פיתרוןבעייתההטרוסקדסטיות- ריבועים פחותיםמשוקללים (WLS) α Yוידוע כי לכל קריזה שונות βx u נניח שאנו רוצים לאמוד את המודל : אחרת. ההנחה שעומדת בבסיס שיטת ה- WLSהיא כי השונות המשתנה כוללת בתוכה מרכיב קבוע ומרכיב משתנה: σ Z σ את המרכיב המשתנה בשונות ) ( Z יש לנטרל. לשם כך ניצור משתנה חדש- Wשיהווה השורש ההופכי לאותו מרכיב משתנה: W Z W נכפיל כל תצפית במשתנה החדש המשוואה המקורית : וניצור משוואה שהיא קומבינציה ליניארית של Y α βx Y W u α W β ( X W ) u W [55]

Y Z α β Z X Z u Z בצורתה המפורשת המשוואה החדשה נראית כך: קיבלנו מודל חדש שבו : u Z הקריזה היא : Y Z המשתנה המוסבר: Z X Z המשתנים המסבירים הם : ו- במודל זה אין חותך. הפרמטרים βו- αהם של המשוואה המקורית (שימו לב כי ל- α אין משמעות של חותך). למשוואה זו אין משמעות כלכלית אך היא מאפשרת לנו לאמוד את הפרמטרים α ו- βבשיטת OLSכך שנקבל אומדים ˆ αו- ˆ βיעילים. ניתן להוכיח כי הטרנספורמציה הליניארית של השונות הפכה אותה לקבועה: V u ( ) V ( u ) σ Z σ Z Z Z Z e כך שיש ln uˆ הערה: אם ביצענו את מבחן WHITE והוצאנו logלנתונים אז.W e ln uˆ לשקלל את הרגרסיה ב: [56]

? שאלה מס' Y α β X U נתון המודל : () ) Z VAR( U ) σ Z ונתון כי : משתנה ידוע). א. ב. מהי הבעיה שנוצרת באמידת משוואה ()? מהן תכונות אומדי הריבועים הפחותים של משוואה ()? כדי לפתור את הבעיה שנוצרה, נאמדה המשוואה הבאה: Y W α W β ( X W ) U W () β α מהו ג. W שבעזרתו ניתן לאמוד את ו- בצורה יעילה??σ ד. מהו האומד היעיל של ה. ו. האם ניתן להשוות בין המודלים על בסיס זאת איזה מודל טוב יותר? חוו דעתכם על הטענות הבאות, ונמקו:? R אם לא, האם ניתן להחליט בכל b, Z a התשובות לסעיפים א' ו- ב' נשארות ללא שינוי.. אם נתון כי X ε U W (כאשר ( היא אחת ˆ ε המשוואה הנורמאלית : המשוואות הנורמאליות לאמידת משוואה ().. שאלה מס'. VAR( U ) X עני על שאלה מס', כאשר נתון כי σ [57]

שאלה מס' 3 Y α βx u נתון המודל: וקיים מדגם של תצפיות כאשר נתון כי: (שאר ההנחות הקלאסיות מתקיימות) V ( u ) σ } } X σ 5 X σ 5 א. ב. במשוואה מס' יש בעיה של: אמידת משוואה () תניב אומדים בלתי מוטים ועקיבים: נכון/ לא נכון/ לא ניתן לדעת ג. פיתרון הבעיה הקיימת במשוואה () ייתכן על ידי אמידת המשוואה הבאה: Y W α W β ( X W ) ω () W כאשר: V ( u ) σ 3σ 5 σ 5 ד. } ם נתון כי: } האם ישתנו תשובותיכם לסעיפים א ו-ב : כן/ לא/ לא ניתן לדעת [58]

מתאם סידרתי מתאם סידרתי עוסק במצב שבו מופרת ההנחה הקלאסית מס' 6 -אי תלות בין cov( u, u s הטעויות: ). cov( u, u s זהו מצב שבו קיימת תלות סטטיסטית בין הטעויות במודל: ) תלות כזו בין הטעויות קיימת בדרך כלל כאשר הנתונים הנאספים הם נתוני סדרות עיתיות ולא נתוני חתך בהם עסקנו עד כה. נתוני חתך- מתייחסים לפרטים שונים בתקופת זמן נתונה. נתוני סדרות עיתיות- מתייחסים לאותו הפרט לאורך זמנים שונים. בנתוני החתך סביר שמאחר ומדובר בפרטים שונים -הטעויות בניבוי שלהם תהיינה בלתי תלויות. לעומת זאת בנתוני סדרות עיתיות, מאחר ומדובר באותו הפרט הנמדד בזמנים שונים סביר דווקא שהטעויות בניבוי שלו תהיינה תלויות אחת בשנייה. אם אנחנו מדברים, למשל, על פונקציות תצרוכת: Y α βx u אם מדובר בנתוני חתך- החלטות התצרוכת של פרט לא אמורות להשפיע על החלטותיו של פרט sוהנחה 6 תתקיים: cov( u, u s ) אולם אם מדובר על נתוני סדרה עיתית: החלטותיו של פרט מסוים היום סביר שיושפעו מהחלטות שעשה בעבר או שישפיעו על החלטות שיעשה בעתיד: cov( u, u s ). בזמן "קריזה" - u כאשר : [59]. -s בזמן -"קריזה" u s

השלכות על אומדי הריבועים הפחותים (OLS) מבין התכונות של אר"פ (ליניאריות, חוסר הטיה, עקיבות ויעילות) היחידה שמופרת כאשר קיים מתאם סידרתי היא: תכונת היעילות. משום שתכונת היעילות היא היחידה מבין תכונות אר"פ התלויה להוכחתה בקיומה של הנחת אי התלות בין הטעויות. משום הפגיעה בתכונת היעילות, בדיקת ההשערות לא תהיה תקפה. **שימו לב כי במידה וקיים מתאם סידרתי חיובי בין הטעויות ולמשתנים יש מגמת זמן ( Xעולה או יורד עם הזמן) אומד השונות (ESS) יהיה מוטה כלפי מטה ואז נקבל Fו-, R מוטים כלפי מעלה. מבנה המתאם הסדרתי הגדרנו מתאם סדרתי כהפרה של הנחה מס' 6: Y α βx u cov( u, u s ) נשאלת השאלה כיצד נראית הפרה זו? מתאםסדרתימסדרראשון: u ההנחה היא כי יש מתאם בין קריזות במרחק אחד, כלומר : u תלוי ישירות רק ב- cov( u, u ) את המתאם בין ה"קריזות" מסדר ראשון ניתן לנסח באופן הבא: u ρ ε u [6]

כך ש: ρאין מתאם) (כי אם חורג מ- ה"קריזה" הולכת וגדלה עם הזמן) ρ (כי אם <ρ< () () מε (3) ρחיובי פירושו מתאם סדרתי חיובי ואילו ρ שלילי פירושו מתאם סדרתי שלילי (לא נפוץ). קיים את ההנחות הקלאסיות מאחר ומהווה סטייה מקרית לחלוטין (בניגוד ל- ( u כך ש: E( ε ) V ( ε ) σ cov( ε, ε ε s ) המודל יכיל שתי משוואות-המשוואה העיקרית והגדרת המתאם הסדרתי (מסדר (4) ראשון): Y α βx u u ρ ε u מלבד α ו- βנרצה לאמוד גם את. ρ מתאם סדרתי מסדר שני: u ρ ρ ε u u. u u u והן הן משפיעים ישירות על מתאם סדרתי מסדרP : u ρ u ρ u ρ u ε... P P u מושפע מתקופות שונות בעבר. [6]

לu לu תכונות המתאם הסדרתי ניתן להוכיח כי מכיוון שכל טעות בזמן מסוים מתואמת עם הטעות הסמוכה לה בזמן: r ( u, u s ) s ρ מכיוון שכך המתאם של u הולך ופוחת עם הזמן: ρ > ρ > ρ >... > ρ u u u u 3 u u 3 s u u s בנוסף לכך, התוחלת, השונות והשונות המשותפת של הטעויות: E( u ) V ( u σε ) σ u ρ COV ( u, u s s ) ρ σ u s σ ρ ρ s u נתון מתאם סדרתי מסדר ראשון: ρ ε u? V ( ε ) σ ε נתון כי.9 ρוכי מצאו את: u - א. המתאם בין ב. המתאם בין 4 u. הסבר את ההבדל בין המתאמים (סעיף א' ו-ב'). - σ u השונות ג. ד. חזרו על סעיפים א' עד ג' עבור.4 ρ. הסבירו את ההבדל בין התוצאות. [6]

מבחנים לזיהוי מתאם סדרתי קיימים שני מבחנים סטטיסטיים לזיהוי קיומו של מתאם סדרתי: מבחן DW (דרבין ווטסון) ומבחן.LM ) מבחן DW (דרבין ווטסון) לקיום מתאם סדרתי מסדר ראשון: נניח תחילה כי אין מתאם סדרתי ונאמוד את המשוואה הראשית בשיטת.OLS כחלק מתוצאות האמידה נקבל ציון DW (יכול לקבל ערכים בין ל- 4 בלבד). נתבונן בטבלת DW ולפי K מס' המשתנים הב"ת במודל ו- T מס' התצפיות d L d U ו- במדגם נשלוף שני ערכים: נחלק את הטווח שבין ל- 4 באופן הבא: ρ > ]_? [ ρ ]? [ ρ < _4 d L d U 4 d U 4 d L נראה היכן נופל ציון ה- DWשהתקבל כחלק מתוצאות האמידה. ניתן לדעת אם יש מתאם ואיזה סוג של מתאם רק אם ציון ה- DWייפול בחלקים המודגשים. השערות: HO : ρ H: ρ >, ρ < חישוב הסטטיסטי DW sa ( ˆ) ρ [63]

. DW sa אם אנו מקבלים ציון ˆρ ניתן להציב בנוסחה ולקבל לדוגמא: חוקר רצה לאמוד את מחיר סגירה של מניה כפונקציה של הזמן שעובר: CLOSE α β TIME u כאשר:. מחיר סגירה של מניה ב-$ ביום CLOSE TIME משתנה זמן שמקבל את הערכים:,,3 תוצאות האמידה שהתקבלו: Dependen variable: CLOSE Analysis of Variance Sum of Mean Source DF Squares Square F Value Prob>F Model ------- 55.78 Error 5 ------- C Toal 5 ------- Roo MSE ---- R-square.8 Dep Mean ---- Adj R-sq ------ C.V. ---- Parameer Esimaes Parameer Sandard T for H: Variable DF Esimae Error Parameer Prob> T INTERCEP.3474.48 9.47. TIME -.75. -7.468. Durbin-Wason D.5 [64]

האם קיים מתאם סדרתי? נתבונן בטבלת DWכאשר נתון כי K ו- T53 : [65]

ה- d d L U.65.69 לפי הטבלה (עבור T) : נציב בטווח: [ ρ > ] [ ρ ] [ ρ < _].65.69.3.35 4 DW.5 מסקנה: יש עדות לקיום מתאם סדרתי חיובי מסדר ראשון. Y u α βx ρu ε ε? המודל הינו: u פרעה מקרית קלאסית T וידוע כי: u.9u d L.57 d.65 האם קיים מתאם סדרתי ברמת מובהקות של 5%? U למבחן DW יש שתי בעיות עיקריות: מתאים רק למתאם סדרתי מסדר ראשון יש אזורים "מתים" בטווח בהם לא ניתן לדעת האם יש מתאם סדרתי. ( ( [66]

בנוסף לכך על מספר תנאים להתקיים כדי שאפשר יהיה להשתמש במבחן : DW u הרגרסיה כוללת חותך ה- Xים קבועים ולא משתנים אין משתנים מסבירים שהם פיגור של המשתנה המוסבר אין תצפיות חסרות באמצע אם קיים מתאם סדרתי מסדר ראשון אז הוא מהצורה: ρ ε u מבחן LM...3.4.5 ( לעומת מבחן DWמבחן LMמתאים גם לבחון קיומו של מתאם סדרתי מסדרים גבוהים יותר מסדר ראשון. Y u α β X ρ u ε u ניתן לרשום את המודל הלא מוגבל: Y α β X ρ u ε (U) ˆ u ניתן להתייחס לבחינת קיומו של מתאם סדרתי כהוספת משתנה מסביר: השלבים לביצוע המבחן: u ו- ˆ û נאמוד את המודל המקורי ונחשב uˆ / x, x ˆ,..., xk ; u נאמוד את רגרסיית העזר: LM sa T ע נחשב סטטיסטי :LM ע R m נדחה את H כאשר: LM כאשרm סדר המתאם הסדרתי. sa > χ [67]

ˆ u אם נדחה את H נדע את סימנו של המתאם הסדרתי לפי המקדם של ברגרסיית העזר ששווה ל- ˆρ. שימו לב כי אם נרצה לבדוק מתאם סדרתי מסדרים גבוהים יותר: HO ההשערות: : ρ ρ... ρ s אחרת :H uˆ / x, x,..., xk ; uˆ, uˆ,..., uˆ s רגרסיית העזר: לדוגמא: עבור הדוגמא הקודמת- ניבוי מחיר סגירה של מניה כפונקציה של CLOSE α β TIME u הזמן: נבחן את קיומו של מתאם סדרתי מסדר ראשון באמצעות מבחן.LM נאמוד את רגרסיית העזר: u γ γ ρ ε TIME u תוצאות האמידה שהתקבלו: Dependen variable: RES Analysis of Variance Sum of Mean Source DF Squares Square F Value Prob>F Model ------- Error 5 -------- C Toal 5 ------- Roo MSE ------ R-square.855 Dep Mean ---- Adj R-sq ------ C.V. ----- [68]

Parameer Esimaes Parameer Variable DF Esimae INTERCEP -96 TIME.633E-5 RES.977 א. ב. ג. האם קיים מתאם סדרתי? מהו ערכו של המתאם הסדרתי הנאמד? מהו כיוונו של המתאם הסדרתי באוכלוסיה? פיתרוןבעייתהמתאםהסדרתי רגרסייתהפרשים (שיטתקוקרן-אורקט) ניצור משוואה שהיא קומבינציה ליניארית של המשוואה המקורית שבה לא יהיה מתאם סדרתי ולכן ניתן יהיה לאמוד אותה בשיטת הריבועים הפחותים, האומדים יהיו יעילים וניתן יהיה לבצע בדיקת השערות. Y α βx u משוואה () : המודל בזמן : ρ Y ρ α ρ X ρ u Y משוואה () : המודל בזמן - מוכפל ב- ρ: החסרת משוואה () ממשוואה (): ρy α( ρ) β ( X ρx ) ( u ρu ) כדי לאמוד את הפרמטרים של רגרסיית ההפרשים נגדיר: Y * * Y * α α( ρ ) * β X β X ε u ρy ρx ρu [69]

כך "נטרלנו" את המתאם הסדרתי: ρ u u u ρ ε u εמקיים את כל ההנחות הקלאסיות ולכן ε נזכור כי שונות הרגרסיה וכן שונות הפרמטרים הנאמדים לא תהיה תלויה במקדם המתאם הסדרתי. המשוואה "המתוקנת" אותה נאמוד: Y * * α β * ε * X לאחר אמידת משוואה זו ניתן לחלץ את האומדים של הפרמטרים המקוריים: מאחר ש- ρ איננו ידוע יש צורך לאמוד אותו. ˆ, α ˆ β Y α βx u? סטודנט הניח כי במודל: קיים מתאם סדרתי מסדר ראשון בשאריות כך שמתקיים: ε את המודל: u ולכן במקום לאמוד את המודל המקורי אמד.7u.7Y α(.7) β ( X.7X ) Y u הסטודנט טען כי במודל החדש לא קיים מתאם סדרתי. טענת הסטודנט: נכונה /לא נכונה /לא ניתן לדעת אמידת ρ בשיטת קוקרן אורקוט שיטת קוקרן אורקוט לאמידת ρהיא שיטה איטרטיבית מבוססת על חזרות של תהליך מסוים עד להתכנסות. התהליך מתבצע באופן הבא: אמידת המשוואה המקורית בה אנו מניחים כי קיים מתאם סדרתי. [7]

וû וû ˆ u - חישוב וקבלת האומד ρ ˆ ε : ידי אמידת המשוואה ˆ ρעל uˆ u הבעיה היא כי האומד איננו יעיל כיוון שהאומדים לפרמטרים במשוואה המקורית אינם יעילים (בשל קיומו של מתאם סדרתי). לכן נמשיך ונבצע את הפעולות הבאות: ˆ u - הצבת האומד הזה ברגרסיית ההפרשים וחילוץ ˆ αו- ˆ βחדשים. שוב נחשב תוך שימוש באומדים החדשים ונקבל אומד ˆρ חדש. נחזור על התהליך הזה מספר פעמים נוספות עד שנגיע להתכנסות (עד שהאומד ˆ ρישתווה לזה שקיבלנו בתחילה). אין צורך לבצע תהליך זה ידנית משום שרוב תוכנות המחשב מבצעות הליך זה באופן מיידי ומדווחות על התוצאות הסופיות. התהליך הממוחשב נקרא אוטו רגרסיה (AUTOREGRESION) מסדר ראשון, שני, שלישי וכו' (תלוי בסדר המתאם הסדרתי). התיקון למתאם הסדרתי יתבצע על ידי הרצת רגרסיה עם משתנה AR() (אוטו רגרסיה מסדר ראשון), ( AR( ו-( AR( (אם מניחים קיום אוטו רגרסיה מסדר שני) וכו' אם משתנה ARמובהק זו אינדיקציה שפתרנו את הבעיה של המודל המקורי. לדוגמא: נמשיך עם הדוגמא של ניבוי מחיר סגירה של מניה כפונקציה של הזמן: CLOSE α β TIME u נניח כי קיים מתאם סדרתי מסדר ראשון בנתונים. תוצאות האמידה בשיטת אוטורגרסיה מסדר ראשון מוצגות להלן: [7]

Parameer Esimaes Parameer Sandard T for H: Variable DF Esimae Error Parameer Prob> T INTERCEP.333 TIME -.6 AR().97. Durbin-Wason D.35 א. ב. בדקו האם נפתרה בעיית המתאם הסדרתי. מהי המשוואה לאמידת מחיר הסגירה הצפוי ביום המסחר הבא??שאלה מס' נאמד הקשר שבין הכנסה לתצרוכת לתקופה ינואר 994 עד דצמבר (48T). 997 C α βy u המודל הינו: u בניסיון לבדוק האם מתקיים קשר מהסוג הבא: ρ u ρ u ρ u ε 3 3 uˆ γ uˆ γ uˆ נאמדה המשוואה הבאה: γ u γ Y ω ˆ 3 3 4 Depended Variable: RES תוצאות האמידה מוצגות להלן: Parameer Esimaes Parameer Sandard T for H: Variable DF Esimae Error Parameer Prob> T INTERCEP -54.79 7.85 -.76.939 RESID.75.5 4.63. RESID -.66.88 -.35.97 RESID3 -.337.67 -..5 Y.7.3.85.93 Durbin-Wason D.954 [7]

נתון בנוסף כי.479 R א. הרגרסיה המופיעה בפלט לעיל נועדה לבדיקת : על ידי מבחן : ההשערות הינן: גודל הסטטיסטי למבחן הינו (רשמו תוצאה מספרית): המסקנה המתקבלת היא: בהנחה כי קיים מתאם סדרתי מסדר שלישי בנתונים נאמד מחדש הקשר שבין ההכנסה לתצרוכת בהתאם לשיטתם של קוקרן ואורקוט. תוצאות האמידה מוצגות להלן: Depended Variable:C Parameer Esimaes Parameer Sandard T for H: Variable DF Esimae Error Parameer Prob> T INTERCEP -3.53 8.38 -.864.69 Y.7944.5 4.86. AR().77.55 4.634. AR() -.64.889 -.34.97 AR(3) -.38.669 -.966.56 Durbin-Wason D.954 ב. רשמו את המשוואה המתוקנת המשמשת לעריכת תחזיות. [73]

שאלה מס' חוקר רצה לאמוד את עקומת הביקוש לטיסות לאירופה. לרשותו נתונים שבועיים לאורך 3 שנים (5 שבועות). נסמן: כרטיסי הטיסה לאירופה שנמכרו בשבוע Y מספר מחיר ממוצע ב-$ של הכרטיסים שנמכרו בשבוע p Y α β e P β P e u החוקר אמד את המודל: וקיבל לאחר הטרנספורמציה הלוגריתמית:. R.8 û לבדיקת ההשערה כי קיים מתאם סדרתי בנתונים מסדר ראשון הוא חישב את ערכי ולאחר מכן חישב את הרגרסיה: u γ γ γ γ v ln P ln P 3u מקדם ההסבר המרובה ברגרסיה זו הוא.8 א. נסח את ההשערה ובחן אותה בר"מ של.5. החוקר מניח שיש מתאם סדרתי מסדר ראשון. לאחר תיקון Cochrane-Orcuהתקבל: lnˆ Y 7.3.ln P.4ln P ˆ ρ. הניחו שהשבוע ובשבוע שעבר מחיר ממוצע של כרטיס היה $5. השבוע נמכרו 6,85 כרטיסים. בשבוע הבא צפוי מחיר של $4. ב. כמה כרטיסים יימכרו? [74]

החוקר גם מנסה לקבוע האם בנתונים אלה קיים מתאם מסדר שני. ג. רשמו את המשוואה הנוספת שעליו לאמוד. במשוואה הנוספת התקבל מתאם מרובה השווה ל-.. ד. מהי המסקנה בר"מ של.5? [75]

סיכום בעיית המתאם הסדרתי והטרוסקדסטיות מתאם סדרתי הטרוסקדסטיות Y α βx u V ( ) σ V u ( u ) σ V ( u ) W σ למשל: cov( u, u s ) cov( u, u s ) u ρ ε u המשוואה העיקרית של המודל ההנחה הקלאסית המופרת המצב לאחר ההפרה המשוואה המאפיינת את ההפרה מה קורה אם אומדים ב- OLS מתקבלים אומדים חסרי הטיה ועקיבים, אך תכונת היעילות נפגעת. מבחן DW מבחן LM זיהוי הבעיה פתרון הבעיה שיטתקוקרן אורקוט (רגרסיית ההפרשים) הכנסת משתנה מוסבר בפיגור (מודל דינמי) מבחן GQ מבחןWhie שיטתWLS [76]