רגרסיה ושיטות ניתוח ליניאריות סטודנטים יקרים לפניכם ספר תרגילים בקורס רגרסיה ושיטות ניתוח לינאריות פסיכולוגיה אוניברסיטת בן גוריון.

Σχετικά έγγραφα
התפלגות χ: Analyze. Non parametric test

מבחן t לשני מדגמים בלתי תלויים. T test for independent samples

ניהול תמיכה מערכות שלבים: DFfactor=a-1 DFt=an-1 DFeror=a(n-1) (סכום _ הנתונים ( (מספר _ חזרות ( (מספר _ רמות ( (סכום _ ריבועי _ כל _ הנתונים (

x = r m r f y = r i r f

חורף תש''ע פתרון בחינה סופית מועד א'

פתרון תרגיל מרחבים וקטורים. x = s t ולכן. ur uur נסמן, ur uur לכן U הוא. ur uur. ur uur

שאלה 1 V AB פתרון AB 30 R3 20 R

מבוא לאקונומטריקה א' החוג לכלכלה

טושפ הרעשה ןחבמ t ןחבמ

תרגילים בנושא משתנה דמי:

ל הזכויות שמורות לדפנה וסטרייך

לדוגמה: במפורט: x C. ,a,7 ו- 13. כלומר בקיצור

פתרון תרגיל 8. מרחבים וקטורים פרישה, תלות \ אי-תלות לינארית, בסיס ומימד ... ( ) ( ) ( ) = L. uuruuruur. { v,v,v ( ) ( ) ( ) ( )

סיכום- בעיות מינימוםמקסימום - שאלון 806

Εισαγωγή στην Ανάλυση Διακύμανσης

τατιςτική ςτην Εκπαίδευςη II

תרגול מס' 6 פתרון מערכת משוואות ליניארית

Επιστηµονική Επιµέλεια ρ. Γεώργιος Μενεξές. Εργαστήριο Γεωργίας. Viola adorata

Μενύχτα, Πιπερίγκου, Σαββάτης. ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 6 ο

הסקה סטטיסטית/תקציר/תלמה לויתן

סיכום חקירת משוואות מהמעלה הראשונה ומהמעלה השנייה פרק זה הינו חלק מסיכום כולל לשאלון 005 שנכתב על-ידי מאיר בכור

תרגול 1 חזרה טורי פורייה והתמרות אינטגרליות חורף תשע"ב זהויות טריגונומטריות

(ספר לימוד שאלון )

- הסקה סטטיסטית - מושגים

תרגול פעולות מומצאות 3

Λυμένες Ασκήσεις για το μάθημα:

3-9 - a < x < a, a < x < a

תשובות מלאות לבחינת הבגרות במתמטיקה מועד ג' תשע"ד, מיום 0/8/0610 שאלונים: 315, מוצע על ידי בית הספר לבגרות ולפסיכומטרי של אבירם פלדמן

Analyze scale reliability analysis

Απλή Ευθύγραµµη Συµµεταβολή

Άσκηση 11. Δίνονται οι παρακάτω παρατηρήσεις:

א הקיטסי ' טטסל אובמ רלדנ הינור בג '

Ερμηνεία αποτελεσμάτων Ανάλυση διακύμανσης κατά ένα παράγοντα

שדות תזכורת: פולינום ממעלה 2 או 3 מעל שדה הוא פריק אם ורק אם יש לו שורש בשדה. שקיימים 5 מספרים שלמים שונים , ראשוני. שעבורם

דף פתרונות 7 נושא: תחשיב הפסוקים: צורה דיסיונקטיבית נורמלית, מערכת קשרים שלמה, עקביות

Ασκήσεις Εξετάσεων. Μεταπτυχιακό Πρόγραμμα Σπουδών στη. Διοίκηση των Επιχειρήσεων

תרגיל 7 פונקציות טריגונומטריות הערות

ןמנירג ןואל \ הקיטסיטטס הקיטסיטטסב הרזח ה יפד ךותמ 14 דו 1 מע

Lampiran 1 Output SPSS MODEL I

שאלה 5: להלן סטטיסטיקה תיאורית מפורטת עם טבלת שכיחות לציוני בית ספר לוח 1: סטטיסטיקה תיאורית של ציוני בית ספר

סיכום בנושא של דיפרנציאביליות ונגזרות כיווניות

[ ] Observability, Controllability תרגול 6. ( t) t t קונטרולבילית H למימדים!!) והאובז' דוגמא: x. נשתמש בעובדה ש ) SS rank( S) = rank( עבור מטריצה m

הרצאה. α α פלוני, וכדומה. הזוויות α ל- β שווה ל-

1. Hasil Pengukuran Kadar TNF-α. DATA PENGAMATAN ABSORBANSI STANDAR TNF α PADA PANJANG GELOMBANG 450 nm

ΑΝΑΛΥΣΗ Ε ΟΜΕΝΩΝ. 7. Παλινδρόµηση

גבול ורציפות של פונקציה סקלרית שאלות נוספות

PENGARUHKEPEMIMPINANINSTRUKSIONAL KEPALASEKOLAHDAN MOTIVASI BERPRESTASI GURU TERHADAP KINERJA MENGAJAR GURU SD NEGERI DI KOTA SUKABUMI

מבוא לאקונומטריקה 57322

לוגיקה ותורת הקבוצות פתרון תרגיל בית 8 חורף תשע"ו ( ) ... חלק ראשון: שאלות שאינן להגשה נפריד למקרים:

תדירות הנתונים, שנתיים,annual רבעונים quarterly וכו'. 5 ומשתנה Yהינו 3,6,9,5 ו- 7. נבחר, file-open data-import בשלב זה התוכנה

I. גבולות. x 0. מתקיים L < ε. lim אם ורק אם. ( x) = 1. lim = 1. lim. x x ( ) הפונקציה נגזרות Δ 0. x Δx

יסודות לוגיקה ותורת הקבוצות למערכות מידע (סמסטר ב 2012)

brookal/logic.html לוגיקה מתמטית תרגיל אלון ברוק

קבוצה היא שם כללי לתיאור אוסף כלשהו של איברים.

τατιστική στην Εκπαίδευση II

ΑΝΑΛΥΣΗ Ε ΟΜΕΝΩΝ. 8. Ανάλυση διασποράς (ANOVA)

= 2. + sin(240 ) = = 3 ( tan(α) = 5 2 = sin(α) = sin(α) = 5. os(α) = + c ot(α) = π)) sin( 60 ) sin( 60 ) sin(

{ } { } { A חוקי דה-מורגן: הגדרה הסתברות מותנית P P P. נוסחת בייס ) :(Bayes P P נוסחת ההסתברות הכוללת:

סטודנטים יקרים. לפניכם ספר תרגילים בקורס הסקה סטטיסטית. הספר הוא חלק מקורס חדשני וראשון מסוגו בארץ בנושא זה, המועבר ברשת האינטרנט.

צעד ראשון להצטיינות מבוא: קבוצות מיוחדות של מספרים ממשיים

לוגיקה ותורת הקבוצות פתרון תרגיל בית 4 אביב תשע"ו (2016)

תרגילים באמצעות Q. תרגיל 2 CD,BF,AE הם גבהים במשולש .ABC הקטעים. ABC D נמצאת על המעגל בין A ל- C כך ש-. AD BF ABC FME

אקונומטריקה ד"ר חמי גוטליבובסקי סמסטר א' תש "ע

מבוא לאקונומטריקה ב' החוג לכלכלה [1]

סטודנטים יקרים. מקורס חדשני וראשון מסוגו בארץ בנושא זה, המועבר ברשת האינטרנט.On-line

סדרות - תרגילים הכנה לבגרות 5 יח"ל

בס"ד פאניה - PANYA חוברת סטטיסטיקה ב' קורס סטטיסטיקה ב' למדעי החברה כתבה: ענבל יולזרי החישובי, כולל הדוגמאות המובאות בו, של

"קשר-חם" : לקידום שיפור וריענון החינוך המתמטי

פתרון תרגיל 5 מבוא ללוגיקה ותורת הקבוצות, סתיו תשע"ד

Παράδειγμα: Γούργουλης Βασίλειος, Επίκουρος Καθηγητής Τ.Ε.Φ.Α.Α. Δ.Π.Θ.

גמישויות. x p Δ p x נקודתית. 1,1

תרגיל 13 משפטי רול ולגראנז הערות

The No Arbitrage Theorem for Factor Models ג'רמי שיף - המחלקה למתמטיקה, אוניברסיטת בר-אילן

ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Δρ. Βασίλης Π. Αγγελίδης Τμήμα Μηχανικών Παραγωγής & Διοίκησης Δημοκρίτειο Πανεπιστήμιο Θράκης

Charles Augustin COULOMB ( ) קולון חוק = K F E המרחק סטט-קולון.

תוכנת ה :SPSS חוברת הסברים מפורטת לסטודנט

קורס: מבוא למיקרו כלכלה שיעור מס. 17 נושא: גמישויות מיוחדות ושיווי משקל בשוק למוצר יחיד

( k) ( ) = ( ) ( ) ( ) ( ) A Ω P( B) P A B P A P B תכונות: A ו- B ב"ת, אזי: A, B ב "ת. בינומי: (ההסתברות לk הצלחות מתוך n ניסויים) n.

Μονοπαραγοντική Ανάλυση Διακύμανσης Ανεξάρτητων Δειγμάτων

gcd 24,15 = 3 3 =

) תיביטנרטלאה הרעשהה תיב

Logic and Set Theory for Comp. Sci.

1 תוחלת מותנה. c ארזים 3 במאי G מדיד לפי Y.1 E (X1 A ) = E (Y 1 A )

Δείγμα (μεγάλο) από οποιαδήποτε κατανομή

Μενύχτα, Πιπερίγκου, Σαββάτης. ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 5 ο

{ : Halts on every input}

Μαντζούνη, Πιπερίγκου, Χατζή. ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 5 ο

s ק"מ קמ"ש מ - A A מ - מ - 5 p vp v=

-107- גיאומטריה זוויות מבוא מטרתנו בפרק זה היא לחזור על המושגים שנלמדו ולהעמיק את הלימוד בנושא זה.

משוואות רקורסיביות רקורסיה זו משוואה או אי שוויון אשר מתארת פונקציה בעזרת ערכי הפונקציה על ארגומנטים קטנים. למשל: יונתן יניב, דוד וייץ

בחינה בסיבוכיות עמר ברקמן, ישי חביב מדבקית ברקוד

$ι ιι η ι ι!η ηι ι ANOVA. To ANOVA ι ι ι η η η ιη (Analysis of Variance). * ι! ι ι ι ι ι η ιη. ;, ι ι ι! η ιι ηιη ι ι!η ι η η ιη ι ι η ι η.

אלגברה מודרנית פתרון שיעורי בית 6

519.22(07.07) 78 : ( ) /.. ; c (07.07) , , 2008

ο),,),--,ο< $ι ιι!η ι ηι ι ιι ιι t (t-test): ι ι η ι ι. $ι ι η ι ι ι 2 x s ι ι η η ιη ι η η SE x

טודנטים יקרים. הספר הוא חלק מקורס חדשני וראשון מסוגו בארץ בנושא זה, המועבר ברשת האינטרנט.On-line

Αν οι προϋποθέσεις αυτές δεν ισχύουν, τότε ανατρέχουµε σε µη παραµετρικό τεστ.

PDF created with pdffactory trial version

ההימצאות (או שכיחות) (prevalence) של תכונה שווה. ההארעות (incidence) של תכונה שווה לפרופורציית נתון. = 645/72, או 89 לכל 10,000 אחיות.

ב הקירטמונוקא ל והינ ו הלכל ל כ גוחה

Transcript:

רגרסיה ושיטות ניתוח ליניאריות סטודנטים יקרים לפניכם ספר תרגילים בקורס רגרסיה ושיטות ניתוח לינאריות פסיכולוגיה אוניברסיטת בן גוריון. לחוג הספר הוא חלק מפרויקט חדשני וראשון מסוגו בארץ במקצוע זה, המועבר ברשת האינטרנט.On-line הקורס באתר כולל פתרונות מלאים לספר התרגילים. הפתרונות מוגשים מוגשים בסרטוני וידאו המלווים בהסבר קולי, כך שאתם רואים את התהליכים בצורה מובנית, שיטתית ופשוטה, ממש כפי שנעשה בשיעור פרטי. הקורס נבנה ע"י קרן ברוסרד, המנוסה בלימוד בקורס יותר מ 0 שנים עם הצלחות מוכחות של מאות סטודנטים. אז אם אתם עסוקים מידי בעבודה, סובלים מלקויות למידה, רוצים להצטיין או פשוט אוהבים ללמוד בשקט בבית, אנחנו מזמינים אתכם לחוויית לימודים יוצאת דופן וחדשה לחלוטין, היכנסו עכשיו לאתר אנו מאחלים לכם הצלחה מלאה בבחינות ש בילך! בּ זה בּוּל. גוּל כל הזכויות שמורות לאתר GOOL

תוכן עניינים הקדמה...5 חלקא'- ניתוח שונות חד גורמי...6. מתי משתמשים בניתוח שונות חד גורמי?...6. זיהויהמודלהמחקרי... 6 השערות...6 אמידת גודל האפקט...7 ביצוע המבחן הסטטיסטי...9..3.4 חישוב סטטיסטי המבחן F...9 כללהכרעה... 9 מסקנה... 9 4. 4. 4.3 5. הנחותהמודל... 5. רישוםההנחותבמונחיהשאלה... 5. הנחת שוויון שונויות... 6. ניתוח פלטים... 3 6. ביצוע המבחן הסטטיסטי על סמך פלט ה- Descriptives...3 6. בדיקת ההנחות על סמך הפלטים...3 5... 7. פרופורציית השונות המוסברת- eta השוואות מרובות 7... (POST-HOC TESTS).8 8. השערות... 7 8. השיטות להשוואות מרובות: TUKY ו-...7 L.S.D 8.3 ניתוחפלטים... 8 חלקב' רגרסיה ליניאריתחדמשתנית.... מבוא- מקדםהמתאםהליניארי... הגדרה... דיאגראמת פיזור..... כל הזכויות שמורות לאתר GOOL

תכונותמקדםהמתאםהליניארי... 3 קיצוץ תחום השפעת והשפעתו על המתאם...5 ערכים קיצוניים/חריגים על המתאם...6 השפעת טרנספורמציה ליניארית על המתאם...8 נוסחת המתאם הליניארי...8 מובהקות המתאם...9.3.4.5.6.7.8. קוהרגרסיהבמדגם... 3 בנייתקו הרגרסיה במדגם...3 תכונותקו הרגרסיה במדגם...34 אומדנים חשובים ברגרסיה פשוטה...34 מתאמיםביןמשתניהרגרסיה... 36 משוואת הרגרסיה המתוקננת...37...3.4.5.6 השוואה בין מודל רגרסיה חד משתנית לביןמודלניתוח שונות חד כיוונית...38 3. מובהקותהרגרסיהבאוכלוסיה... 39 ההנחות הנדרשות למודלהרגרסיההפשוטה... 39 בדיקת השערות למובהקות משוואת הרגרסיה באוכלוסיה...43 בדיקת השערות למובהקות מקדם השיפוע באוכלוסיה...46 3. 3. 3.3 ו- 48...F T עבור ערךמסויםשל 49...X ( µ 0 ) Y קשר בין התפלגויות רב"סלתוחלתערכי 3.4 3.5 רב"סלערכיY עבורערךמסויםשל X...5 שאלותמסכמות... 5 3.6 3.7 חלקג'-רגרסיה מרובה ומשתנה דמי... 55 רגרסיהמרובה... 55. מאפייני קוהרגרסיהבמדגם... 55 מקדמיהרגרסיה... 55 אומדניםחשוביםברגרסיהמרובה... 58... מובהקותקו הרגרסיה ומקדמיו באוכלוסיה...6 הנחותמודלהרגרסיההמרובה... 6. 3 כל הזכויות שמורות לאתר GOOL

מובהקותמשוואתהרגרסיההמרובה... 6 מובהקות השיפועים...6..3 3. שיטותלהרצתרגרסיה רבתמשתנים... 65 3. שיטת 65... ENTER 3. רגרסיהבצעדים חכמים 67...(stepwise) 3.3 רגרסיה היררכית...69 3.4 השוואה בין שיטת stepwise והיררכית... 70 3.5 התוספת לניבוי ומובהקותה... 73 בדיקתקו ליניאריות... 78 שאלותמסכמות... 79.4.5 משתנה דמי... 83 יצירתמשתניהדמי... 83 רגרסיהעםמשתנהב"ת איכותיאחדבלבד... 83.. בניית משוואת הרגרסיה...83 השוואה בין מודל הרגרסיה עם משתני דמילניתוח שונות חד גורמי...84.. השוואהביןמודלרגרסיהעםמשתנידמילרגרסיה פשוטה... 88.3 3. רגרסיה המשלבת משתנים ב"ת איכותיים וכמותיים... 90 בניית קו הרגרסיה...9 ניתוח הרגרסיה...9 3. 3. 4 מבחנים לדוגמה + 4 כל הזכויות שמורות לאתר GOOL

מבנה הקורס: הקדמה ( ( (3 (4 ניתוח שונות חד גורמי רגרסיה חד משתנית ("פשוטה") רגרסיה מרובה ומשתני דמי פיתרון מבחנים לדוגמא 5 כל הזכויות שמורות לאתר GOOL

ניתוח שונות חד גורמי. מתימשתמשיםבניתוחשונותחדגורמי? בניתוח שונות חד גורמי משתמשים כאשר רוצים לבדוק האם קיים הבדל בין מספר קבוצות במשתנה מסוים. דוגמאמס' : חוקר רצה לבחון השפעתן של שלוש שיטות טיפול פיזיותרפי שונות על רמת ההתפתחות המוטורית של ילדים קטנים (ציוני ההתפתחות המוטורית נעים בין "נמוכה מאד" ל- 0 "גבוהה מאד").. זיהויהמודלהמחקרי זיהוי המודל המחקרי יתבצע על ידי הגדרת המשתנים: התלוי והבלתי-תלוי שאלהמס' (מבוססתעלדוגמאמס' ) הגדר את המשתנים וזהה את המודל המחקרי תשובה:. השערות המשךדוגמאמס' : לצורך הבדיקה נבדקו 4 ילדים בעלי רמת התפתחות זהה והם חולקו באקראי ל- 3 קבוצות. לאחר 8 חודשי טיפול עבר כל אחד מהילדים הערכה של רמת ההתפתחות המוטורית שלו. להלן התוצאות שהתקבלו: שיטהא' שיטהב' שיטהג' 5 8 4 4 5 3 7 4 7 7 4 6 n= 4 n 3 = 5 n = 4 n = 5 n j x= 4.86 x 3 = 3 x = 5.75 x = 6 x j ˆ =.9 s T sˆ3 = sˆ =.5 sˆ =.58 ŝ j 6 כל הזכויות שמורות לאתר GOOL

H H: otherwise השערות: 0: µ = µ = µ 3=... = µ K אפקט הטיפול= =הבדל בין התוחלות באוכלוסיה אמידת גודל האפקט?( µ j ( x j שקיים הבדל בין התוחלות באוכ' ) כיצד נסיק על פי ההבדל בין הממוצעים במדגם ).3 התשובה: באמצעות ניתוח השונות (סטטיסטי המבחן F): F = MSB MSW E( MSB) = + σ E( MSW ) = σ e e בכדי להבין את הרציונאל עליו נשען סטטיסטי המבחן F נעזר בדוגמא ההיפותטית הבאה: נתונות שתי אוכלוסיות שבשתיהן = 0 0 σ j = 0 σ j אוכ' מס' : אוכ' מס' : שיטה שיטה שיטה שיטה שיטה שיטה ג' ב' א' ג' ב' א' 6 6 6 4 5 3 6 6 6 5 6 6 6 6 6 7 6 6 6 6 6 8 7 0 6 6 6 0 0 8 6 6 6 µ 3 = 6 µ = 6 µ = 6 µ 3 = 6 µ = 6 µ = 6 x µ j j x = µ j j 7 כל הזכויות שמורות לאתר GOOL

שאלהמס' חווה/י דעתך על הטענות הבאות: א. MSB הוא אומד חסר הטיה ל:. שונות הטעויות. תשובה:. לגודל האפקט תשובה: ב. תשובה: במבחן Fהבודק הבדלים בין תוחלות, ה- MSB וה- MSWהינם משתנים מקריים בעלי תוחלת E(MSB) ו- E(MSW) בהתאמה. במידה ולא קיים הבדל בין התוחלות של המשתנה התלוי, ציין מה מבין שלהלן מתקיים ונמק תשובתך: E(MSW) =E(MSB).a.b.c MSW שווה או קטן מ- MSBבהכרח MSW שווה ל- MSBבהכרח E(MSB)<E(MSW).d.e אף אחת מהתשובות הנ"ל 8 כל הזכויות שמורות לאתר GOOL

S= 4. ביצועהמבחןהסטטיסטי 4. חישובסטטיסטיהמבחן F F = MSB MSW את סטטיסטי המבחן נחשב באמצעות טבלת מקור שונות :(ANOVA) df (degrees of freedom) SS (sum of squares) MS (Mean of squares) שונויות סכומי ריבועים דרגות חופש מקור השונות F B C- SSB C = j= nj( x x) j MSB=SSB/C - F = MSB MSW W n-c SSW = C j= Sˆ j ( n j ) MSW=SSW/n-C T n- SST = ( N ) = SSB+ SSW ˆ T S MST=SST/n- = S ˆT הערה חשובה: MST MSB+MS W 4. כללהכרעה F > FCα ( c, n דוחים את H0 אם: (c 4.3 מסקנה יש/אין עדות להבדל במשתנה התלוי בין קבוצות המשתנה הב"ת באוכלוסייה, ברמת מובהקות של אלפא 9 כל הזכויות שמורות לאתר GOOL

שאלהמס' 3 (מבוססתעלדוגמאמס' ) האם שיטת הטיפול משפיעה על רמת ההתפתחות המוטורית של הילדים? בדוק ברמת מובהקות של.0.05 תשובה: 0

5. הנחותהמודל 5. רישוםההנחותבמונחיהשאלה דגימה מקרית של האובייקט שנדגם. מדגמים בלתי תלויים. התפלגות נורמאלית של המשתנה התלוי בתוך כל אוכלוסיית המשתנה הב"ת. שונות המשתנה התלוי שווה בכל אוכלוסיות המשתנה הב"ת. מודל קבוע. 5. הנחת שוויון שונויות הנחת שוויון שונויות גורסת כי כל השונויות של האוכלוסיות שוות אחת לשנייה ולשונות הטעויות.( σ = σ = σ 3 =... = σ k = σ e ) תחת הנחת שוויון שונויות : כל אחת מן האומדים לשונויות מתוך נתוני המדגם ) ( s וה- MSW (המהווה ממוצע משוקלל של ˆj ( ( MSW אומדים את כל אחת משונויות האומדים לשונויות של כל קבוצה s j n j = ˆ ( ) n c.(σ e σ) j וגם את השונות הטעויות ) האוכלוסייה ),(σ e נעדיף σ) j כמו גם את שונות הטעויות ) ) בכדי לאמוד כל אחת מן השונויות באוכלוסיה ) להשתמש באומד לשונות MSW במקום באומדים לשונויות. sˆj הסיבה להעדפה זו היא שחישוב ה- MSW מבוסס על כל תצפיות המדגם ואילו חישוב ה- מבוסס רק על מס' התצפיות של הקבוצה הספציפית. ככל שהאומד לשונות מבוסס על יותר תצפיות כך הוא יהיה יעיל ומדויק יותר כאומדן לפרמטר. sˆj חישוב ה- MSW (האומד לשונות הטעויות σ) e נשען על הנחת שוויון שונויות. (3

שאלהמס' 4 חווה/י דעתך על הטענות הבאות: א. תחת הנחות המודל כל אחת משונויות המדגמים היא אומדן חסר הטיה ל-.σ e תשובה: ב. הנחת שוויון שונויות משמשת להערכת גודל האפקט. תשובה: ג. תחת הנחות המודל, בכדי לאמוד את השונות של אחת האוכלוסיות נעדיף להשתמש ב- MSW.( sˆj במקום באומד לשונות הספציפי של אותה אוכלוסייה ) תשובה:

6. ניתוח פלטים 6. ביצוע המבחן הסטטיסטי על סמך פלט ה- Descriptives דוגמא מס' : במחקר מסוים רצו לבדוק האם קיימים הבדלים בהישגים בבחינה בסטטיסטיקה 3 של הסטודנטים במכללה כפונקציה של שיטות למידה שונות. לשם כך נדגמו באופן מקרי מהמכללה מס' תלמידים מכל אחת משיטות הלימוד ולהלן הנתונים שהתקבלו: =GRADES ציונים בבחינה = TRAINING METHOD שיטת הלימוד שאלהמס' 5 בדוק את שאלת המחקר ברמת מובהקות של, 0.05 לפי השלבים הבאים: א. ב. ג. ד. הצב השערות רשום את ההנחות הדרושות למודל במונחי השאלה המחקרית הצג את הטבלה המקובלת לניתוח הנתונים וסכם בה את הממצאים נסח מסקנה מילולית GRADES Score on training exam alone class 3 small groups Total Descriptives 95% Confidence Interval for Mean N Mean Std. Deviation Std. Error Lower Bound Upper Bound Minimum Maximum 0.00 63.70 3.50 3.0 57.38 70.0 33.00 87.00 0.00 73.50 0.5.35 68.58 78.4 48.00 90.00 0.00 78.45 6.35.4 75.48 8.4 65.00 90.00 60.00 7.88.06.56 68.77 75.00 33.00 90.00 תשובה: 6. בדיקתההנחותעלסמךהפלטים 3

שתי ההנחות הניתנות לבדיקה באמצעות הפלטים הן הנחת שוויון שונויות והנחת הנורמאליות. נדגים את בדיקת ההנחות ברמת מובהקות של 0.05 על נתוני דוגמא מס'. 6.. בדיקתהנחת שוויוןשונויות הפלט המתאים לבדיקת הנחת שוויון שונויות הוא הפלט הבא: Test of Homogeneity of Variances GRADES Score on training exam Levene Statistic df df Sig..604 57.083 השערות: H 0 : σ = σ = 3 σ 3 H: otherwise כלל הכרעה (על סמך ה- sig שבפלט): <083. = 0 sig לכן אין סיבה מספקת לדחות את H0 ברמת מובהקות של 0.05 α = 0.05 מסקנה: ניתן להניח שוויון שונויות של הציונים בבחינה בכל אוכלוסיית שיטות הלימוד ברמת מובהקות של.0.05 6.. בדיקתהנחתהנורמאליות הפלט המתאים לבדיקת הנחת הנורמאליות הוא הפלט הבא: GRADES Score on training exam GROUP Sales training method alone class 3 small groups *. This is a lower bound of the true significance. a. Lilliefors Significance Correction Tests of Normality Kolmogorov-Smirnov a Shapiro-Wilk Statistic df Sig. Statistic df Sig..47 0.00*.956 0.470.3 0.00*.954 0.433.56 0.00*.944 0.8 **יש להתייחס רק למבחן Kolmogorov-Smirnov השערות: 4

עבור כל אחת משלושת אוכלוסיות שיטות הלימוד יש להניח: התפלגות נורמאלית :H0 התפלגות אחרת :H כלל הכרעה (על סמך ה- sig שבפלט): עבור כל אחת משלושת אוכלוסיות שיטות הלימוד: = 0.> α = 0.05 מסקנה: sig ולכן אין סיבה מספקת לדחות את H0 ברמת מובהקות של 0.05 ניתן להניח התפלגות נורמאלית של הציונים בבחינה עבור כל אחת מאוכלוסיות שיטות הלימוד ברמת מובהקות של 0.05. **הערה: מספיק שנדחה את H0 עבור אחת האוכלוסיות בכדי שהנחת הנורמאליות תופר. שאלהנוספת (מבוססתעלדוגמאמס' ) סטודנט שעיין בפלטים הציע אומדנים חסרי הטיה לשונות ציוני הבחינה בקבוצת הלומדים לבד. הערך האחד הוא: ומדוע? תשובה: 3.5 והערך השני הוא:.0. רשום מתי היית מעדיף את אומדן א', מתי את אומדן ב'.7 פרופורציית השונות המוסברת- eta מדד זה מהווה פרופורציה של השונות המוסברת מתוך כלל השונות: 5

0 eta = SSB SST פרופורציית השונות הלא מוסברת: 0 eta SSW = SST שאלהמס' 6 (מתייחסתלדוגמאמס' ( א. כמה אחוזים מן השונות של ציוני הבחינה מוסברים ע"י שיטות הלימוד? תשובה: ב. כמה אחוזים מן השונות של ציוני הבחינה אינם מוסברים ע"י שיטות הלימוד? תשובה: ג. מהי עוצמת הקשר בין הציונים בבחינה לבין שיטות הלימוד? תשובה: 6

.8 השוואות מרובות TESTS) (POST-HOC תוצאה מובהקת בניתוח השונות משמעה כאמור- לפחות אחד מן הממוצעים באוכלוסייה שונה מהאחרים. בכדי לדעת איזה מן הממוצעים שונה מהאחרים יש לבצע מבחני המשך tests).(post-hoc אנו נשווה כל זוג ממוצעים זה לזה. מספר ההשוואות הזוגיות האפשריות עבור C קבוצות: בדוגמא מס' : c ( c ) 3 = 3 מס' ההשוואות המרובות: 8. השערות **מתייחסות לדוגמא מס' H0 : µ µ = 0 H: µ µ 0 3 3 H0 : µ µ = 0 H: µ µ 0 3 3 H0 : µ µ = 0 H: µ µ 0 8. השיטותלהשוואותמרובות: TUKY ו- L.S.D נלמדו שתי שיטות להשוואות מרובות: TUKY L.S.D ( ( α 8.. ההבדלביןהשיטות. L.S.D מ מחמירה יותר בדחיית H0 TUKY למה? בשיטת L.S.D קיימת בעיית תיסוף ה- α: ככל שנעשה יותר השוואות כך הטעות מסוג ראשון ) α) של כל מערכת ההשוואות תתנפח. = α N PE ( PC ) שיטת TUKY מתגברת על בעיית תיסוף ה- αעל ידי כך שקובעת את ה- αהכללית או הסופית של כל מערכת ההשוואות מראש. כתוצאה מכך ה- αעבור כל השוואה קטנה וקשה יותר לדחות את H0 לעומת שיטת.L.S.D משמעות ההבדל בין השיטות: 7

אם דחינו H0 ב- TUKY נדחה את H0 גם ב-.L.S.D אם קיבלנו את H0 ב- L.S.D נקבל את H0 גם ב- TUKY. אם קיבלנו את H0 ב- TUKY לא ניתן לדעת האם נקבל או נדחה את H0 ב- L.S.D. אם דחינו את H0 ב- L.S.D לא ניתן לדעת האם נקבל או נדחה את H0 ב- TUKY. 8.3 ניתוחפלטים ישנם שני פלטים העוסקים בהשוואות מרובות: ) פלט ה- Comparisons Multiple ) פלט ה- Subsets Homogeneous המשךדוגמאמס'... ) Post Hoc Tests Dependent Variable: GRADES Score on training exam Multiple Comparisons Tukey HSD LSD (I) GROUP Sales training method alone class 3 small groups alone class 3 small groups (J) GROUP Sales training method class 3 small groups alone 3 small groups alone class class 3 small groups alone 3 small groups alone class *. The mean difference is significant at the.05 level. Mean Difference 95% Confidence Interval (I-J) Std. Error Sig. Lower Bound Upper Bound -9.80* 3.33.0-7.8 -.78-4.75* 3.33.00 -.77-6.73 9.80* 3.33.0.78 7.8-4.95 3.33.3 -.97 3.07 4.75* 3.33.00 6.73.77 4.95 3.33.3-3.07.97-9.80* 3.33.00-6.47-3.3-4.75* 3.33.00 -.4-8.08 9.80* 3.33.00 3.3 6.47-4.95 3.33.4 -.6.7 4.75* 3.33.00 8.08.4 4.95 3.33.4 -.7.6 שאלהמס' 7 א. בהסתמך על הפלט -Multiple Comparisons מהן שיטות הלימוד אשר קיימים ביניהן הבדלים מובהקים בהישגים בבחינה? תשובה: 8

ב. מדוע קיים הבדל ב- sig בהשוואה בין הקבוצה של הלומדים בקבוצה קטנה לבין קבוצת הלומדים בכיתה בין השיטות TUKY ו-?L.S.D תשובה: ג. באיזה שיטה- TUKY או L.S.D הרב"ס לאותו ההפרש בין התוחלות יהיה צר יותר? נמק. תשובה: ) Homogeneous Subsets GRADES Score on training exam GROUP Sales training method Tukey HSD a alone 0.00 63.70 N.00.00 0.00 73.50 class 3 small groups Sig. 0.00 78.45.00.3 Means for groups in homogeneous subsets are displayed. a. Uses Harmonic Mean Sample Size = 0.000. Subset for alpha =.05 ד. בהסתמך על הפלט Homogeneous Subsets -מהן שיטות הלימוד אשר קיימים ביניהן הבדלים מובהקים על פי שיטת?TUKY תשובה: ה. מה צפויות להיות תוצאות הבדיקה לפי שיטת?L.S.D לגבי כל השוואה ציין מה תהיה מסקנה. במידה ואינך יכול לתת תשובה חד משמעית נמק מדוע. 9

תשובה: ו. מכון מחקר בדק את השאלה האם המקצוע הנלמד משפיע על המשכורת ההתחלתית (באלפי שקלים). להלן הנתונים: SALARY starting salary.00 Agriculture.00 Business 3.00 Engineering 4.00 Communication Total Descriptives 95% Confidence Interval for Mean N Mean Std. Deviation Std. Error Lower Bound Upper Bound Minimum Maximum 55 6.59.75608.3679 6.64 7.0659.90 0.5 6 7.539.968.4489 7.040 8.07 3.48.59 53 9.7779.33067.304 9.355 0.403 4.60 4.34 8 8..55649.8405 7.5568 8.6873.74 5.0 50 7.993.4403.5433 7.6883 8.96.74 5.0 בוצעו השוואות מרובות והתקבלו התוצאות הבאות: Dependent Variable: SALARY starting salary Multiple Comparisons Tukey HSD LSD (I) COLLEGE.00 Agriculture.00 Business 3.00 Engineering 4.00 Communication.00 Agriculture.00 Business 3.00 Engineering 4.00 Communication (J) COLLEGE.00 Business 3.00 Engineering 4.00 Communication.00 Agriculture 3.00 Engineering 4.00 Communication.00 Agriculture.00 Business 4.00 Communication.00 Agriculture.00 Business 3.00 Engineering.00 Business 3.00 Engineering 4.00 Communication.00 Agriculture 3.00 Engineering 4.00 Communication.00 Agriculture.00 Business 4.00 Communication.00 Agriculture.00 Business 3.00 Engineering *. The mean difference is significant at the.05 level. Mean Difference 95% Confidence Interval (I-J) Std. Error Sig. Lower Bound Upper Bound -.9408.4090.0 -.999.77-3.868*.4359.000-4.85 -.09 -.5309*.38450.00 -.555 -.5364.9408.4090.0 -.77.999 -.460*.434.000-3.350 -.77 -.590.37307.39 -.555.3748 3.868*.4359.000.09 4.85.460*.434.000.77 3.350.6559*.38880.000.650.666.5309*.38450.00.5364.555.590.37307.39 -.3748.555 -.6559*.38880.000 -.666 -.650 -.9408*.4090.0 -.7467 -.348-3.868*.4359.000-4.0 -.355 -.5309*.38450.000 -.883 -.7736.9408*.4090.0.348.7467 -.460*.434.000-3.0600 -.43 -.590.37307.5 -.350.446 3.868*.4359.000.355 4.0.460*.434.000.43 3.0600.6559*.38880.000.890.47.5309*.38450.000.7736.883.590.37307.5 -.446.350 -.6559*.38880.000 -.47 -.890 שחזר את פלט ה- Homogeneous Subsets לפי שיטת TUKY ברמת מובהקות של 0.05. 0

תשובה: ז. בהיסתמך על פלט ה- Homogeneous Subsets שבנית, אילו היית עורך השוואות מרובות עבור רמת מובהקות של 0., בין אילו קבוצות היית מוצא הבדלים מובהקים? תשובה: רגרסיה ליניארית חד משתנית מטרת הרגרסיה הליניארית היא ניבוי משתנה מסוים (משתנה תלוי, המכונה "משתנה מנובא") באמצעות משתנים אחרים (משתנים ב"ת, המכונים "משתנים מנבאים"). כאשר יש לי משתנה מנבא/ב"ת אחד בלבד מדובר ברגרסיה חד משתנית ("פשוטה").

ניתוח מודל הרגרסיה מתחלק ל- 3 שלבים: זיהויצורתהקשרבין המשתניםכקשרליניארי. בנייתקו הרגרסיהבמדגם. בדיקתמובהקותקו הרגרסיהומקדמיובאוכלוסיה. מבוא- מקדם המתאם הליניארי ( ( (3.. הגדרה קשרביןשני משתניםכמותייםאשרניתן להגדירועלפינוסחתהקוהישר.(Y=a+bX). דיאגראמתפיזור דוגמאמס' : קשרבין שעות למידהבבחינהוהציוניםבבחינה: ציונים שעות למידה 76 60 85... 70 9 7 30... 6 3... 09 בכדי לאמוד את טיב הקשר בין המשתנים יש להציגו בדיאגראמת פיזור: 0 00 90 80 70 60 50 Test mark 40 30 5 0 5 0 5 30 35 No. of learning hours before exam מדיאגראמת הפיזור הנ"ל נוכל להתרשם כי הקשר הוא ליניארי, חיובי וחזק.

.3 תכונותמקדםהמתאםהליניארי r מקדם המתאם של פירסון מוגדר על ידי שני פרמטרים בלתי תלויים אחד בשני-כיוון ועוצמה: p ) כיוון הקשר א. ב. חיובי/עולה/ישר- שניהמשתנים נעיםבאותוהכיוון. אםהאחדעולהאויורד אזגם השני. מקדםהמתאם ) r ( יקבלסימן+. שלילי/יורד/הפוך-שני המשתנים נעים בכיוונים הפוכים. אם האחד עולה השני יורד ולהפך. מקדם המתאם יקבל סימן (-). ) עוצמת הקשר ככל שעוצמת הקשר גבוהה יותר כך יהיה ערך מקדם המתאם קרוב יותר ל- בערך מוחלט. ככל שהעוצמה נמוכה יותר כל יהיה קרוב יותר ל- 0 בערך מוחלט. א. דוגמאות לקשר ליניארי חלקי: Graph 4 0 8 ככל שהנקודות קרובות יותר לקו הישר כך עוצמת הקשר חזקה יותר ולהיפך: X Y3 Correlations a Pearson Correlatio Sig. (-tailed) Pearson Correlatio Sig. (-tailed) X Y3.979**..000.979**.000. **. Correlation is significant at the 0.0 level (-tailed). a. Listwise N=09 Y3 6 4 6 8 0 4 6 8 X 5 0 5 0 5 X Y4 Correlations a Sig. (-tailed) Sig. (-tailed) X Y4.58**..000.58**.000. **. Correlation is significant at the 0.0 level a. (-tailed). Listwise N=09 Y4 0 4 6 8 0 4 6 8 X 3

30 0 0 0 X Y5 Correlations a Sig. (-tailed) Sig. (-tailed) a. Listwise N=09 X Y5...07..07. Y5-0 4 6 8 0 4 6 8 X הערכת עוצמת הקשר: 0< r מתאםנמוך 0.3< r מתאםבינוני < 0.3 <0.7 0.7< r מתאםחזק < ב. דוגמאות לקשר ליניארי מושלם/מלא: תכונה מס' : קשר ליניארי מושלם מהווה קשר בין משתנה א' לבין משתנה ב' המהווה טרנספורמציה ליניארית של משתנה א'. **תזכורת: טרנספורמציה ליניארית של משתנה-הוספה/החסרה של קבוע ו/או הכפלה/חילוק בקבוע של כל ערכי המשתנה r xy = לדוגמא: כאשר Y=X+, (כיY הוא טרנספורמציהליניאריתשל X). ג. דוגמאות לחוסר קשר (ליניארי): 8 6 4 Correlations a Y 0 8 6 4 X 4 4 6 8 0 4 6 8 X Y Pearson Correlatio Sig. (-tailed) Pearson Correlatio Sig. (-tailed) a. Listwise N=0 X Y.000..998.000.998.

80 Correlations Y6 60 40 0 0-0 4 6 8 0 4 6 8 X Y6 Sig. (-tailed) N Sig. (-tailed) N X Y6 -.043..639 0 0 -.043.639. 0 0 X. 0.8 0.6 0.4 0. 0 0 5 0 5 0 8 6 4 0 0 0.5.5 Y X Y X 6 4... 7... 3... 9...... 3... 8 0 7 8 S ˆ Y = 0 S ˆ = X 0 תכונה מס' : קשר בין משתנה לקבוע יהיה שווה תמיד 0..4 קיצוץ תחוםוהשפעתועלהמתאם קיצוץתחוםמשמעוהתייחסות לתחוםצר יותרשלאחדהמשתנים (בדר"כהמשתנההב"ת) באופן המקטיןאתהשונותשל המשתנים. הקטנתהשונותשל המשתניםגוררתהקטנת המתאםביניהם. המתאםבין המשתניםאחריהקיצוץיהיה נמוךיותרמןהמתאםלפני הקיצוץ. 5

בדוגמא - מתואר קשר בין שעות לימוד לפני המבחן לציון במבחן. הקשרנבדק כעתעלקבוצה בעלתתחוםצר יותרבשעותלימוד (מעל- 5). לפני הקיצוץ: אחרי הקיצוץ: Descriptive Statistics Descriptive Statistics No. of learning hours before exam Test mark Mean Std. Deviation N 7.05.87348 88.057 8.833 HOURS No. of learni hours before exam MARK Test mark Mean Std. Deviation N 0.754 5.03946 09 70.530 6.455 09 דיאגראמת הפיזור המקורית: דיאגראמת הפיזור לאחר הקיצוץ: 0 0 00 00 90 90 80 80 70 70 60 60 50 50 Test mark 40 30 5 0 5 0 5 30 35 Test mark 40 30 5 0 5 0 5 30 35 No. of learning hours before exam r=0.64 No. of learning hours before exam r=0.88.5 השפעת ערכיםקיצוניים/חריגיםעלהמתאם מקרהראשוןשבו הקיצונייםמקטיניםקשר: 30 0 0 X Y7 Correlations a Sig. (-tailed) Sig. (-tailed) a. Listwise N=4 X Y7.03..799.03.799. Y7 0 0 0 0 30 X 6

אותם נתונים לאחר השמטת 4 תצפיות שבניגוד למגמה: 8 6 4 Correlations a Y7 0 8 6 4 0 4 6 8 0 4 6 8 X Y7 Sig. (-tailed) Sig. (-tailed) **. Correlation is significant at the 0.0 level (-tailed). a. Listwise N=0 X Y7.43**..000.43**.000. X 40 מקרה אחר שבו הקיצוניים מחזקים קשר: 30 Correlations a Y8 0 0 0-0 0 5 0 5 0 5 X Y8 Pearson Correlatio Sig. (-tailed) Pearson Correlatio Sig. (-tailed) X Y8.350**..000.350**.000. **. Correlation is significant at the 0.0 level (-tailed). a. Listwise N=4 X אותם נתונים לאחר השמטת 4 תצפיות שגורמות למגמה: 30 Correlations a 0 0 0 X Y8 Sig. (-tailed) Sig. (-tailed) a. Listwise N=0 X Y8.8..65.8.65. Y8-0 4 6 8 0 4 6 8 X לסיכום: מקדם המתאם מושפע מאוד מערכים חריגים. כאשר הערכים החריגים הם בניגוד למגמה הליניארית של מרבית הנתונים-הם יפגעו בעוצמת המתאם 7

כאשר הערכים החריגים מצויים בהתאם למגמה הליניארית של מרבית הנתונים- הם "ינפחו" את המתאם..6 השפעת טרנספורמציהליניאריתעלהמתאם טרנספורמציהליניארית איננהמשנה אתערכושלהמתאם. הדגמהעלדוגמאמס' (הקשרבין שעותלימודלבחינה לציוןבבחינה): הוחלטלתת פקטורלציוןבבחינה-להוסיףלכלציון 0 נקודות. המתאםבין הציוןלאחר הטרנספורמציהלביןשעותהלימוד יהיהשווהלמתאםלפניהטרנספורמציה : r = r = 0.88 r נוסחת המתאם הליניארי cov( x, y) = sˆ x sˆ y.7 הנוסחה מבוססתעל ההשתנותהמשותפת של X ושלY : ( xi x)( y cov( x, y) = n i y) ההשתנות המשותפת של משתנה עם עצמו מהווה את האומד לשונות של המשתנה: cov( x, x) = cov( y, y) = ( x i x) n n ( y y) i = sˆ x = sˆ כך שניתן לרשום את הנוסחה של המתאם גם כך: y r = cov( x, y) cov( x, x) cov( y, y) פלט ה- correlation מתאר את המתאם ואת אומדני ה- cov השונים: 8

Correlations a HOURS No. of learning hours before exam MARK Test mark Sig. (-tailed) Sum of Squares and Cross-products Covariance Sig. (-tailed) Sum of Squares and Cross-products Covariance **. Correlation is significant at the 0.0 level (-tailed). a. Listwise N=09 HOURS No. of learning hours before MARK exam Test mark.880**..000 74.785 7766.854 5.396 7.95.880**.000. 7766.854 849.479 7.95 63.36.8 מובהקותהמתאם את מובהקותהמתאם נבדוקעלסמךהפלטבלבד (ללאחישוב). הפלטהרלוונטי למובהקותהמתאםהואפלט ה- correlations. נדגיםאתבדיקת מובהקותהמתאם (ברמתמובהקותשל 0.05) עלנתונידוגמאמס' (הקשרבין שעותלימודלבחינהלציון בבחינה): HOURS No. of learning hours before exam MARK Test mark Correlations a Sig. (-tailed) Sum of Squares and Cross-products Covariance Sig. (-tailed) Sum of Squares and Cross-products Covariance **. Correlation is significant at the 0.0 level (-tailed). a. Listwise N=09 HOURS No. of learning hours before MARK exam Test mark.880**..000 74.785 7766.854 5.396 7.95.880**.000. 7766.854 849.479 7.95 63.36 השערות: H0 : η = 0 H: η 0 כלל הכרעה (על סמך ה- sig שבפלט ה- correlations ): Sig=0.00< α = 0. 05 9

יש סיבהמספקתלדחותאתH0 ברמתמובהקותשל 0.05 מסקנה: יש עדות למתאם מובהק באוכלוסייה בין שעות לימוד לבחינה לבין הציונים בבחינה ברמת מובהקות של 0.05. 30

e = y y ˆ = y ˆ + ˆ i y / x ( i i ) ( i ( α β x i ) ) = MI N קו הרגרסיה במדגם בניית קו הרגרסיה במדגם.... עיקרון הריבועים הפחותים (L.S.E) לאחר שנוכחנו שיש מתאם ליניארי בין שני המשתנים אנו מעוניינים לבנות את קו הניבוי שיאפשר לנו לנבא משתנה אחד על סמך השני. נשאלת השאלה: מהו הקו (מבין קוים רבים אפשריים) שיהיה המתאים ביותר לנתוני המדגם? 00 000 900 800 700 600 500 400 300 00 sales 00 0 Rsq = 0.6046 0 0 0 30 40 50 60 70 advertise expenses תשובה: קו הרגרסיה אשר יביא למינימום את הטעויות בניבוי ממנו. אתהניבוילמשתנה y במדגםנסמן: ŷ i y i אתהערךהאמיתישלy במדגםנסמן: e i = y i yˆ i הטעות בניבוי במדגם מהווה את ההפרש בין שני הערכים: הקו הטוב ביותר בנתוני המדגםהוא הקו שמבטיח כי סכום כל הטעויות הריבועיות הוא המינימאלי ביותר, או במילים אחרות קו רגרסיה אשר נבנה על בסיס "עיקרון הריבועים הפחותים" Estimation) :(Least Square [ y ( αˆ + ˆ x )] MIN ei = ( y i yˆ i ) = i i β i i = 3

באמצעותפונקציהזו (L.S.E) נוכללמצואאתמקדמיהקוהישר ) β ˆ, α ˆ ( אשריביאו למינימוםאתהטעויותמהקו. : βˆ לאחר פיתרון המשוואה (אין צורך לדעת לפתור) מתקבלות הנוסחאות הבאות עבור ˆα ו- sˆ ˆ β = r sˆ y x ˆ α = y ˆ βx cos( x, y) = sˆ x מקדמי הקו א. משמעות המקדמים:.. ˆβ -מקדם השיפוע של הקו. (. x i ŷ i קצב ההשתנות של כפונקציה של עליה ביחידה אחת של. βˆ ŷ i, x i עבור עליה ביחידה אחת של עולה פי יש קשר ישיר בין r-לβˆ : ה- ˆ βמקבלת אתהסימןשלה- r.. βˆ כאשראיןקשרביןX ל- Y =0,( r=0 ) ) ˆ α -מקדם החיתוך של הקו. נקודתהחיתוך של קו הרגרסיה עם ציר ה- Y.. yˆ i =αˆ כאשר, x i =0 yˆ i =αˆ = y כאשרr=0, ב. חישוב המקדמים:? דוגמאמס' : ניבוי המכירותבאמצעות ההוצאותעלפרסום (אלפי ). להלן הנתונים המתארים את הקשר בין המכירות לבין ההוצאות על הפרסום: 3

Case Summaries X advertise expenses Y sales N Mean Std. Deviation Minimum Maximum 5 8.040 6.3693 3.70 60.00 5 49.400 7.8583 55.00 994.00 X advertise expenses Y sales Correlations a Sig. (-tailed) Sum of Squares and Cross-products Covariance Sig. (-tailed) Sum of Squares and Cross-products Covariance **. Correlation is significant at the 0.0 level (-tailed). a. Listwise N=5 X advertise expenses Y sales.778**..000 6430.90 66548.76 67.955 77.845.778**.000. 66548.76 39037 77.845 47459.857 א. חשב את משוואת הרגרסיה לניבוי המכירות על סמך הוצאות הפרסום. ב. מה יהיהניבויהמכירותעבור הוצאותפרסוםשל 50 אלף? ג. מהיהיהניבוי הוצאותהפרסוםעבורמכירותשל 67 אלף? 33

. תכונותקוהרגרסיהבמדגם (e i שוויםל- :0 ei ( וממוצעהטעויותבניבוי ) סכוםהטעויותבניבוי ) e i = e i = 0 ( ( x, נקודת הממוצעים (y נמצאת תמיד על קו הרגרסיה. ( ממוצעהניבויים/האומדנים ) ŷ ( =ממוצעציוניםאמיתיים/מנובאים ) y ( : (Yˆi ( X i קרוב יותרלממוצעשלו ) X ( כךהניבויבאמצעותו ) ) y ˆ = y ככלשהציוןהמנבא יהיהמדויקיותר. ניתןלהשתמשבקו הרגרסיהרקעבורתחוםציוניהמנבא- X עליוהואנבנה. (3 (4 (5 x i עבור ערך מסוים מתקיים כי: (6 טעותבניבוי+ אומדןלניבוי= ציוןאמיתי y = yˆ + e i i i עבור כלל התצפיות מתקיים כי: סכום ריבועי הטעויות+ סכום ריבועי הניבויים= סכום ריבועי הציונים האמיתיים ssy = ssreg + ssres y = ˆ i y ) ( y i y ) + ( y i ( i yˆ ).3 אומדניםחשוביםברגרסיה פשוטה פרופורציית השונות המוסברת ssreg r = ssy.3. פרופורציית השונות הלא-מוסברת: ssres r = ssy MSRES = SSRES n.3. שונותהטעויות ( r = ) ( n ) sˆ n y 34

E MSRES σ ( ) e MSRES מהווה אומד חסר הטיה לשונות הלא מוסברת: ניסוחים נוספים לשונות הלא מוסברת: אומד לשונות שלY לאחר ניכוי הקשר הקווי בין X ל- Y. אומד לשונות שלY עבור ערך מסוים שלX.? עלסמךנתונידוגמאמס' : Case Summaries X advertise expenses Y sales N Mean Std. Deviation Minimum Maximum 5 8.040 6.3693 3.70 60.00 5 49.400 7.8583 55.00 994.00 r xy כאשר נתון בנוסף כי = 0.778 חשב את האומדנים הבאים: א. ב. ג. ד. ה. ו. ז. ח. ט. סכום הסטיות הריבועיות של המכירות אומד לשונות הכללית של המכירות אומד לשונות הכללית של המכירות לאחר ניכוי הקשר הקווי עם הוצאות הפרסום אומד לשונות של המכירות עבור הוצאות פרסום של 5 אלף אומד לשונות הלא מוסברת של המכירות אומד לסטיית התקן של הטעויות בניבוי המכירות אומד לפרופורציית השונות הלא מוסברת של המכירות על ידי הוצאות הפרסום אומדלפרופורציית שונותהטעויותשל הוצאותהפרסוםעלידי המכירותסכוםריבועי הסטיות שלניבוייהמכירות סכום ריבועי הסטיות של הטעויות בניבוי המכירות סכום הסטיות הריבועיות של הוצאות הפרסום 35

.4 מתאמיםביןמשתניהרגרסיה ŷ ניבויים/אומדנים/ PRED E טעויותבניבוי/ שאריות/ RES r xe = 0 כימתאםביןקבוע (x) למשתנה (e) שווה תמידל- 0. y ערכיהמשתנה התלוי/מנובא X ערכי המשתנה הב"ת/מנבא r xy r xy ˆ = כיהמתאםביןמשתנה (x) לטרנספורמציה הליניאריתשלאותו משתנה ) ŷ ( שווהתמיד ל-. y ŷ r = r yyˆ xy r ye = r xy כי r ye מהווה את פרופורצייתשונות הטעויותולכןשווהל- r xy **ישיחסהפוךבין לבין או כיטרנספורמציה ליניארית (מ- x ל- ( ŷ לא משנהאתערךהמתאם. ryy ˆ r xy r ye r ye ˆ = 0 כימתאםביןקבוע (e) למשתנה ( ŷ ) שווהתמידל- 0. r xy? עלסמךנתונידוגמאמס', כאשרנתוןכי: = 0.778 נא השלם את המתאמים בין משתני הרגרסיה: X X Y PRED RES Y PRED RES 36

x.5 משוואת הרגרסיההמתוקננת עד עתה בנינו את משוואת הרגרסיה בציוני גלם. כעת נבנה את משוואת הרגרסיה בציוני תקן. להזכירכם- ציוןתקן הואמדדלמיקוםיחסי;מדדזה נותןאינפורמציהעלמיקומה שלתצפית מסוימת ביחסלהתפלגותכללהתצפיות: xi x Z i = sˆ בדוגמא א' נתון קשר בין שעות לימוד לפני המבחן לציון במבחן ערכו טרנספורמציה ליניארית לשניהמשתנים והעבירואותםלציוניתקן. דוגמאלטרנספורמציהעל 5 תצפיות ראשונותבקובץ: Case Summaries a 3 4 5 Total a. N Limited to first 5 cases. HOURS No. of learning hours before exam MARK ZHOURS Zscore: No. of learning hours before ZMARK Zscore: Test mark ex Test mark. 69.4.8838 -.05646 5.75 5.00 -.879 -.8054 4.0 50. -.70 -.90 0.3 70. -.0087 -.0083 3.5 77.07.66.4633 5 5 5 5 Descriptive Statistics ZHOURS Zscore: No. of learning hours before ex ZMARK Zscore: Test mark Mean Std. Deviation N.000.000 09.000.000 09 r xy = r zxzy = 0.88 מקדמי המשוואה המתוקננת א. מקדם השיפוע המתוקנן:.5. z βˆ = r sˆ zy z ˆβ = rzxzy = rxy = r sˆ zx xy הסבר: מקדם השיפועבמשוואה המתוקננתשווהלמתאםבין X ל- Y ב. מקדם החיתוך המתוקנן: 37

ˆ = 0 zα z ˆ α = zy z ˆ β zx = 0 r 0= הסבר: 0 משוואת הרגרסיה המתוקננת יוצאת תמיד מראשית הצירים. ג. משוואת הרגרסיה המתוקננת: zyˆ = r i zx i? חוקרמנבאאתYע"יX דרךמשוואתהרגרסיה. הנתונים שהיובפניוהינם: א.ח.הלשונותשל X=6 א.ח.הלשונותשל Y=00 הממוצעשל =X 0 ממוצעערכיהניבויים= 45 המתאםביןX ל- = Y 0 א. חשב אתמשוואתהניבוישלY ע"יX בציוניתקן. ב. ג. מהוהציון הגולמישננבאעבורX = 5? חווה דעתךעלהטענההבאה: ברגרסיהבציוניתקן, ציוןהתקןהמנובאיהיה קטןיותרבערכו המוחלטמציוןהתקןהמנבא..6 השוואה בין מודל רגרסיה חד משתנית לבין מודל ניתוח שונות חד כיוונית רגרסיה חד משתנית היא מקרה פרטי של ניתוח שונות חד כיוונית: eta r א. כאשר בין ממוצעי הקבוצות קיים פער קבוע ) ˆβ )-הנתוניםליניאריים, eta = r ב. מודל הרגרסיה מתאים יותר לניתוח הנתונים מניתוח השונות כי הוא ממוקד ויעיל יותר. כאשר הפער בין ממוצעי הקבוצות איננו קבוע- הנתונים אינם ליניאריים, eta > r מודלהרגרסיה איננומתאיםלנתונים (אינםליניאריים) וישלבצע ניתוח שונות.? חברה יצרה מוצר חדש ומתלבטת ביחס למחיר המכירה של מוצר זה. 38

מנהל השיווקיודע שישלקבועמחיר שהינובסביבות 0 ליחידהאולםהואאיננו בטוחאםקביעתהמחירכ- ליחידהאו 9 ליחידהישנה באופןמשמעותיאת רמתהמכירות. לצורךמתן מענהלשאלהזובוצעהניסויהבא: המוצרהחדששווק למדגםמקרישל 60 חנויותהנמצאותבאזורים בעלימאפייניםדומים. ב- 0 חנויותשנבחרובאופן מקרימביןה- 60 נמכר המוצרבמחירשל ליחידה, 9 ב- 0 חנויותמקריותאחרות הואנמכרב- 0 ליחידהוביתרבמחירשל ליחידה. בתוםתקופתהניסוינרשםסך היחידותשנמכרו בכלאחתמהחנויות. לפניךפלטובו סכוםחלקמהממצאים: Level 9 0 Number 0 0 0 Mean 53.6 5.5 3. שניסטודנטים שהסתכלועלהנתונים, הציעולנתחםבאמצעות מודליםשונים: סטודנטא' הציעלנתח אתהנתוניםבאמצעות מודל ניתוח שונותחדכיווני. סטודנטב' הציעלנתחאתהנתוניםבאמצעות מודלהרגרסיההפשוטה כאשרX הינוהמחירבונמכר המוצרבחנותואילוה- Y הואמספר האריזותהנמכרות בחנותזו (במחירזה). סטודנט ג' שהתבקש לחוות את דעתו טען שהיות ובשני המודלים נבדקת השפעה של המחיר על המכירות לא חשוב באמצעות איזה מודל ינותחו הנתונים. התוצאות תהינה זהות בשני המודלים. א. ב. חווה דעתך על טענתו של הסטודנט השלישי. במידה ואתה סבור שיש הבדל בין שני המודלים, באיזה מודל היית בוחר לצורך ניתוח הנתונים? נמק. במידהוהייתמחשבאת הקשרביןהמחירלמס' האריזותהנמכרבשניהמודלים- מה להערכתך היההיחסביןשנימדדיהקשר- r ו- eta (שוויםאו שאחדגדוליותרמהשני)? נמק. 3. מובהקות הרגרסיה באוכלוסיה 3. ההנחות הנדרשות למודל הרגרסיה הפשוטה 3.. ההנחות ומשמעותן למודל הרגרסיה החד משתנית נדרשות שתי ההנחות הבאות: 39

דגימה מקרית של התצפיות; אי תלות בין הטעויות cov( ε i, ε ) = 0 j :i עבורכל j ( הסבר: ההנחה הראשונה טוענת שאם התצפיות נדגמו באופן בלתי תלוי אחת בשנייה, הדבר מבטיח שהטעויות בניבוי שלהן יהיו אף הן בלתי תלויות.. Xi ε עבור כלערךקבועשל i N(0, σ e ) ( הסבר: ההנחה השנייה מגלמת בתוכה 3 הנחות שונות המתייחסות להתפלגות הטעויות א. תוחלת התפלגות הטעויות שווה לאפס ) 0. x i ( E( ε i עבורכלערךשל ) = i x i הנחהזומבטיחה שקוהרגרסיהבאוכלוסיה הואקוהתוחלות הציוניםהמנובאיםשווים α+.( µ = במיליםאחרותהנחהזו βx לממוצעערכי Y עבור כלערךקבועשל ) מבטיחהכימדובר במודלליניארי ולאאחר. yi / x= xi רק כאשרהנחהזומתקיימת- מקדמיקוהרגרסיהבמדגם- ˆα ו- ˆ βהםאומדניםחסרי הטיה למקדמי הקו באוכלוסיה- וα. β - ב. σ) e שווהוקבועהעבור כלערךשל שונותהטעויות ). x i הנחהזומבטיחהכישונות הטעויותתהיהשווהסביבקו הרגרסיהומינימאלית. תחת הנחהזו, האומדלשונותהטעויות MSRES מהווהאומדלשונותערכי Y עבורכלאחד מערכי.( MSRES σ = σ =... = σ ) y y e x i רק כאשר הנחה זו מתקיימת האומדנים ˆα ו- ˆ βיהיו אומדניםיעיליםלפרמטרים αו- β.באוכלוסיה.. x i ג. הטעויות מתפלגות נורמאלית עבור כל ערך של הנחהזומבטיחההתפלגות נורמאליתשלהטעויות (אוערכי Y) עבורכל ערךקבועשל. x i לסיכוםההנחותשלמודלהרגרסיה:. דגימהמקרית שלתצפיות/ טעויותב"ת. עבורכל j cov( ε i, ε ) = 0 :i j. Xi עבורכלערךקבועשל ε i N(0, σ e ). 40

שונות קבועה ומינימאלית תוחלת התפלגות הטעויות =0 האומדנים ˆ, α ˆ β האומדנים חסרי הטיה לפרמטרים, αבאוכ' β α ˆ ˆ, β יעיליםלפרמטרים, αבאוכ' β 3.. בדיקתההנחות את ההנחות נהוג לבדוק על ידי דיאגראמת פיזור של ניבויים כמו לדוגמא: ( ze i בציוניתקן *( zˆ y i שאריות ) ) Scatterplot Dependent Variable: thousands $ 3 58 Regression Standardized Residual 0 - - -3 -.0 -.5 5 -.0 -.5 0.0.5.0.5.0 Regression Standardized Predicted Value על דיאגראמה מעין זו ניתן לבצע הערכה (שאיננה מבחן סטטיסטי) האם מתקיימות כל אחת משלושת ההנחות. דיאגראמה זו מאפשרת בנוסף איתור תצפיות חריגות (הסוטות יותר משתי סטיות תקן מעל או מתחת לממוצע). דוגמאות לאי עמידה בהנחות המודל: : )עבורכלערךשלX E( ε i א. איעמידה בהנחתתוחלתהטעויות= 0 (0 = ) 4

3 Scatterplot Dependent Variable: Y Regression Standardized Residual 0 - - Rsq = 0.0000 - - 0 Regression Standardized Predicted Value המשמעות של הפרת הנחה זו היא כי קו הרגרסיה איננו קו התוחלות ולמעשה המודל איננו ליניארי: 5 0 5 0 5 Y 0 Rsq = 0.7780 0 0 0 30 40 X במקרה זה האומדנים ˆα ו- ˆ βיהיואומדנים מוטיםלפרמטרים αו- βבאוכלוסיה. ב. אי עמידה בהנחת שוויון שונויות: 4

Scatterplot Dependent Variable: Y 5 Regression Standardized Residual 4 3 0 - - -3-4 -5 Rsq = 0.0000 - - 0 Regression Standardized Predicted Value במקרהזהשונותערכי Y איננהשווהלאורךקו הרגרסיה: 50 40 30 0 0 Y 0 Rsq = 0.476 0 0 0 30 40 X במקרה זה האומדנים ˆα ו- ˆ βיהיו אומדנים בלתייעיליםלפרמטרים αו- β באוכלוסיה. 3. בדיקת השערותלמובהקותמשוואתהרגרסיהבאוכלוסיה מבחן סטטיסטי שמטרתו לבדוק האם קו הרגרסיה שבנינו במדגם מובהק באוכלוסיה. 43

3.. השערות HO; β = 0 H; β 0 ההשערותמנוסחות במונחיהפרמטר, β שיפועהקו. האפקטבמודל הרגרסיהתלויבמקדם השיפוע. כאשר הוא שונה מאפס יש אפקט של ניבוי לקו הרגרסיה ואילו כאשר השיפוע = 0 אין אפקט ניבוי לקו הרגרסיה. 3.. סטטיסטי המבחן F = MSREG MSRES רציונאל המבחן זהה לרציונאל של ניתוח שונות חד כיוונית: E( MSREG) = + σ E( MSRES) = σ e e תחתH0 ) :( =0 E( MSREG) =σ = e E( MSRES) 3..3 חישובהסטטיסטי אתסטטיסטיהמבחן F נחשבבאמצעותטבלתה- ANOVA : SS SSreg MS=SS/df F = MSREG MSRES סטטיסטי דרגות חופש df מקור השונות רגרסיה reg k= MSreg טעויותres n-k-=n- SSres MSres F c α; (, n ) y n- SSy קריטי אמיתית ניתןלחשב אתסטטיסטיהמבחן F גםבאמצעות נוסחהמקוצרת (כאשראנולאנדרשיםלבנות אתטבלתה- ANOVA ): r F= ( r ) / n 3..4 כללהכרעהומסקנה נדחהאת H0 אםF מחושב> F קריטי 44

מסקנה: יש/איןעדותלכךשמשוואתהרגרסיהלניבויY עלידיX מובהקת באוכלוסיהברמת מובהקותשל.α? מבוססתעלדוגמאמס' 3: ניבוימחירהדירהעלידישטחה. בבדיקתהקשרבין המשתניםהתקבלוהנתוניםהבאים: Case Summaries SIZE square meter PRICE thousands $ N Mean Std. Deviation Minimum Maximum 6.7404 39.394 50.46 79.76 85.0664 44.45345 86.0 86.56 Correlations a SIZE square meter PRICE thousands $ **. a. Sig. (-tailed) Sig. (-tailed) Correlation is significant at the 0.0 level (-tailed). Listwise N= SIZE square PRICE meter thousands $.83**..000.83**.000. א. ב. בדוקהאםהמשוואה לניבוימחירהדירה (באלפידולרים) עלידי שטחהדירה (במטר מרובע) מובהקתבאוכלוסיהברמת מובהקותשלאלפא= 0.0 (רשוםהנחות, הצב השערות, רשוםטבלתמקורשונות והסקמסקנה). בדוקאתמובהקות המשוואהעלסמךהפלטהבא: Model Summary b Model a. b. Adjusted Std. Error of R R Square R Square the Estimate.83 a.677.674 5.3955 Predictors: (Constant), SIZE square meter Dependent Variable: PRICE thousands $ כאשרנתוןבנוסףש: =n. עם חישוב טבלת מקור שונות.. ללא צורך בחישוב טבלת מקור שונות. ג. בנה טבלת מקור שונות על פי הפלט הבא: 45

Descriptive Statistics SIZE square meter PRICE thousands $ PRE_ Unstandardized Predicted Value RES_ Unstandardized Residual Mean Std. Deviation N 6.740 39.39 85.066 44.453 85.066 36.568.000 5.77 3.3 בדיקתהשערותלמובהקות מקדםהשיפועבאוכלוסיה מבחן סטטיסטי שמטרתו לבדוק האם מקדם השיפוע מובהק באוכלוסיה. 3.3. השערות HO; β = 0 H; β 0 הערה: שימולבכיניתןלשער גםהשערותחדצדדיות וכמוכןהשערות המייחסותערךכלשהו (שאינו 0 ) לשיפוע. t ˆ β = סטטיסטי המבחן ˆ β β MSRES SSX 3.3. כלל הכרעה ומסקנה t ˆ β 3.3.3 נדחהאת H0 אם: α > ± t n ( ) הערה: במבחןחדצדדיישלקחת α שלמה. מסקנה: יש/אין עדותלכך ששיפועקוהרגרסיהלניבוי מובהקותשל α. Y עלידיX מובהקבאוכלוסייהברמת 3.3.4 גורמים המשפיעים על טעות התקן של ˆβ s ˆβˆ = MSRES SSX βˆ ŝ )מושפעתמשניגורמים: ) טעות התקן של ˆβ. ŝ βˆ א. במונה-האומד לשונותהטעויות-.MSRES קייםקשרישירבינולבין 46

קיים קשר הפוך בין ה- MSRES לבין עוצמת הקשר הליניארי בין המשתנים.( r xy ).SSX- קייםקשרהפוךבינולבין במכנה-סכוםהסטיות הריבועיותשל X. ŝ βˆ ב. קשורלתופעתקיצוץתחום; כאשרמקוצץתחוםערכיX (הב"ת), ה- SSX קטן. רב"ס ל- β כאשר אנומתבקשיםלאמודאת שיפועהמשוואה, נבנהרווחברסמךל- : β ˆ α ± t n ( ) β 3.3.5 MSRES SSX?? ) עלסמךנתונידוגמאמס' 3 (ניבוי מחירהדירהעלסמךשטחה): Case Summaries SIZE square meter PRICE thousands $ N Mean Std. Deviation Minimum Maximum 6.7404 39.394 50.46 79.76 85.0664 44.45345 86.0 86.56 Correlations a SIZE square meter PRICE thousands $ **. a. Sig. (-tailed) Sig. (-tailed) Correlation is significant at the 0.0 level (-tailed). Listwise N= SIZE square PRICE meter thousands $.83**..000.83**.000. א. בדוק האם השיפוע לניבוי מחיר הדירה על ידי שטחה מובהק באוכלוסיה ברמת מובהקות של 0.05. ב. אמוד את השיפוע באוכלוסייה ברמת ביטחון של 0.95. ) חווה דעתך על הטענות הבאות: א. ברגרסיה חד משתנית, ככל שנדגום טווח ערכים גדול יותר במשתנה הב"ת, אזי נגדיל את הפיזור ועקב כך ברוב המקרים שונות הטעויות תגדל ויהיה קשה יותר לדחות את השערת האפס למובהקות מקדם בטא. 47

ב. השונות של התפלגות הדגימה של בטא גדלה ככל שהקשר בין המשתנה התלוי למשתנה הבלתי תלוי חלש יותר. 3.3.6 פלטהמקדמים (coefficients) להלן פלטהמציג אתמקדמיהרגרסיה ומובהקותם בציוני גלםובציוניתקן: Model (Constant) SIZE square meter Unstandardized Coefficients a. Dependent Variable: PRICE thousands $ Coefficients a Standardized Coefficients 95% Confidence Interval for B t Sig. Lower Bound Upper Bound B Std. Error Beta 75.997 7.578 0.08.000 60.979 9.05.934.06.83 5.73.000.8.056 **שימולבלקשרבין סטטיסטיהמבחן T לערךהמקדםוטעותהתקן: B t = Std. Error 3.4 קשרביןהתפלגויות T ו- F ברגרסיהחדמשתנית קיימתזהותביןשלושת המבחנים הסטטיסטייםהבאים: מבחןF למובהקות משוואתהרגרסיה מבחןT למובהקותמקדםהשיפוע ) β ( מבחן למובהקות מקדם המתאם ) η) ( ( (3 כל אחד מן המבחנים מעיד על האחרים: ה- sig בשלושת שווה. בנוסףקייםקשר ביןסטטיסטיהמבחן T ו- F (המבחןהראשוןוהשני): α F(, n ) = tn ( ) עלפינתונידוגמאמס' (ניבוי מחירהדירהעלפישטחה) ניתןלראותכי: סטטיסטיהמבחן F שחישבנולמובהקות משוואתהרגרסיהשווה לריבועסטטיסטי המבחןT שחישבנולמובהקות מקדםהשיפוע: F = t 30.9= = 5. ניתןלראותבנוסףכיה- sig של שלושתהמבחניםשווה: ה- sig של מובהקותהמשוואה (המופיעבפלטה- ANOVA ): 48

Model Regression Residual Total a. Predictors: (Constant), SIZE square meter b. Dependent Variable: PRICE thousands $ ANOVA b Sum of Squares df Mean Square F Sig. 4847.7 4847.680 30.6.000 a 7090.396 0 644.73 9348. שווה ל- sig של מובהקות השיפוע (שורה שנייה בפלט ה- coefficients ): Model (Constant) SIZE square mete Unstandardized Coefficients a. Dependent Variable: PRICE thousands $ Coefficients a Standardized Coefficients 95% Confidence Interval for B t Sig. Lower Bound Upper Bound B Std. Error Beta 75.997 7.578 0.08.000 60.979 9.05.934.06.83 5.73.000.8.056 ול- sig של מובהקותמקדםהמתאם ביןשניהמשתנים (המופיע בפלטה- correlations ): SIZE square meter PRICE thousands $ Correlations a Sig. (-tailed) Sig. (-tailed) **. Correlation is significant at the 0.0 level (-tailed). a. Listwise N= SIZE square PRICE meter thousands $.83**..000.83**.000. עבורערךמסויםשלX ( µ 0 ) 3.5 רב"ס לתוחלת ערכי Y ( µ 0 עבורערךמסוים שלהמשתנה רב"ס שמטרתולאמודאתתוחלתערכי המשתנההתלוי ) הב"ת ) 0 ). x במיליםאחרותאנו מתבקשיםלאמודאתהניבוי באוכלוסיהעבורערךמסויםשלX. האומדהנקודתי (הסטטיסטי) סביבובנוי הרב"סהואהניבויבמדגםעבוראותוה- X :. ˆ µ = yˆ = ɺ α + ˆ βx 0 0 0 נוסחת הרב"ס: α ˆ µ 0± t n ( ) ( x0 x) MSRES ( + n SSX ) 49

טעותהתקן/גודל הרב"סמושפעים מ- 4 גורמים: MSRES -האומדלשונותהטעויות. ככלשגדל, טעותהתקן/ הרב"סגדליםולהפך. n- גודלהמדגם. ככלשגדל, טעותהתקן/ הרב"סקטניםולהפך. א. ב. ג. ד. SSX -מונההשונותשל X (קשורלתופעת קיצוץתחום). ככלשגדל, טעות התקן/הרב"ס קטניםולהפך. ( x 0 -הסטייהשלערך X המסויםמהממוצעשל X. ככל שגדלהטעות התקן/הרב"ס x) גדלים ולהפך.? השאלהמבוססתעל נתונידוגמאמס' (ניבויהקשרביןמחיר הדירהעלסמךשטחה) והפלטיםהבאים: Case Summaries SIZE square meter PRICE thousands $ N Mean Std. Deviation Minimum Maximum 6.7404 39.394 50.46 79.76 85.0664 44.45345 86.0 86.56 Model (Constant) SIZE square meter Unstandardized Coefficients a. Dependent Variable: PRICE thousands $ Coefficients a Standardized Coefficients 95% Confidence Interval for B t Sig. Lower Bound Upper Bound B Std. Error Beta 75.997 7.578 0.08.000 60.979 9.05.934.06.83 5.73.000.8.056 Descriptive Statistics SIZE square meter PRICE thousands $ PRE_ Unstandardized Predicted Value RES_ Unstandardized Residual Mean Std. Deviation N 6.740 39.39 85.066 44.453 85.066 36.568.000 5.77 א. ב. חשברב"ס ברמתסמךשל 95% לתוחלתמחיר הדירהכאשרשטחהדירההוא 00 מ"ר. תןאומדןנקודתילתוחלת מחירהדירהעבור שטחהדירה 05 מ"ר ועבורשטחדירה של 70 מ"ר. מימשניהאומדניםהללו יעילומדויק יותרבניבויהתוחלת שלמחיר הדירה? נמק. 40 ג. האם נוכללנבאעלסמךמשוואת הרגרסיההנ"ל אתמחירהדירהעבורשטחשל מ"ר? 50

ד. ה. ו. מהו האומדן לשינוי בתוחלת מחיר הדירה עבור עליה ביחידה אחת של שטח הדירה? מהו האומדן להפרש הצפוי בתוחלת מחיר הדירה בין שטח דירה ששווה ל- 0 מ"ר לבין שטח דירה ששווה ל- 90 מ"ר? אמוד את שונות מחירהדירה עבור שטח של 00 מ"ר. על איזה הנחה מהנחות המודל מבוסס אומדן זה? 3.6 רב"סלערכיY עבורערךמסויםשלX ( y 0 עבורערך רב"ס שמטרתולאמודאתכלטווחערכיY ) נוסחת הרב"ס:.( x 0 Xמסוים ) α ˆ µ 0± t n ( ) ( x0 x) MSRES (+ + n SSX ) ניתןלראות כיגםרב"ס זהבנויסביבהאומדן הנקודתילתוחלת ערכיYעבורערךה- X המסוים.( ˆµ 0 ) ההבדלביןרב"סלערכי Yלבין הרב"סלתוחלתערכיY באלידי ביטויבטעותהתקן. ניתןלראות כי טעותהתקןשלהרב"סלערכיY גדולהיותר מטעותהתקן שלהרב"ס לתוחלתערכיY. כאשרכליתר הפרמטריםנשאריםקבועיםרב"סזה יהיהרחביותרמןהרב"סלתוחלת. התרשים הבא מתאר רב"ס לתוחלת ולערך המשתנה התלוי וממחיש זאת בבירור: 5

300 50 00 50 00 thousands $ 50 0 40 60 80 00 0 40 60 80 00 : square meter? חשב רב"סברמתביטחוןשל 95% למחירהדירהעבור שטחדירהשל 00 מ"ר. מהההבדל ביןרב"ס זהלרב"סהקודם? 3.7 שאלות מסכמות ( בנק הפועליםערךמחקרלבדיקתהשפעת הפעילותבבורסה עלהפעילותבחשבונות החיסכוןשללקוחותיו. לשםכךנדגמו 5 נבדקיםמסניפיםשונים ברחביהארץ. להלן המשתנים שנחקרו: -ISKA3 פעילות בבורסה -ISKA6 פעילות בחשבונות חיסכון להלן הממצאים: N Mean Std. Deviation ISKA3 5 34.783 73.8843 ISKA6 5 67.5057 Valid N (listwise) 5 Model Summary: 5

Model R R Square Adjusted Error Std. R Square Of the Estimate 0.339 0.5 0.07 48.3545 Predictors: (constant), ISKA3 Dependent Variable: ISKA6 **נתוןבנוסףכיבמבחן F לבדיקתמובהקותהמשוואההתקבל sig=0.0 א. ב. ג. ד. בדוקהאם שיפועהרגרסיהלניבוי פעילותבחשבונות חיסכוןע"יפעילותבבורסה מובהקת ברמתמובהקותשלאלפא= 5 0.0, על סמךהנתוניםבלבד (רשוםהנחות, הצב השערות והסקמסקנהמילולית). חשב את האומד חסר ההטיה לשונות של ערכי פעילות בחשבון חיסכון. בנה את משוואת הרגרסיה לניבוי פעילות בחשבונות חיסכון ע"י פעילות בבורסה. מהוהאומדן הנקודתילתוחלתפעילות בחשבוןחיסכוןעבורלקוח שפעילותובבורסה היא 0? מכון מחקר בחן עבור חברה מסוימת את הקשר בין סך מכירותיה החודשיות (באלפי ש"ח) לבין הוצאותיה על פרסום בחודש (באלפי ש"ח). לשם כך נדגמו 5 חודשים ונבדקו המשתנים הבאים: ( Advertise expenses Sales להלן הממצאים: Model (Constant) X advertise expenses a. Dependent Variable: Y sales Coefficients a Unstandardized Coefficients Standardized Coefficients B Std. Error Beta t Sig. -4.586 56.465 -.736.469 0.348.745.778 5.930.000 N Mean Std.Deviation 53

Advertise expenses 5 8.040 Sales 5 49.400 7.8583 Valid N (listwise) 5 א. ב. ג. ד. ה. ו. ז. ח. האםהמשוואה לניבויהמכירותעלידיהוצאות הפרסוםמובהקתבאוכלוסיה? בדוק ברמתמובהקותשל 0.05 עלפי נתוניהפלטבלבד (רשוםהנחות, הצבהשערות והסקמסקנהמילולית). מהוערךסטטיסטיהמבחן F למובהקותהמשוואה? ענהללאחישוב. מהו האומדן לשונות ערכי המכירות כאשר הוצאות הפרסום מצויות במשוואה? בנהרב"ס ברמתביטחוןשל 95% לתוחלתהמכירותעבור הוצאותפרסוםשל 35 אלף. מהו ערכו של המתאם בין האומדנים של המכירות לבין ערכי הוצאות הפרסום? מהו ערכו של המתאם בין האומדנים של המכירות לביןערכי המכירות? מהו ערכו של המתאם בין המכירות לבין הטעות בניבוי המכירות? מהו האומדן לשינוי בתוחלת ערכי המכירות עבור עליה ביחידה אחת בהוצאות הפרסום? 54

חלק ג'-רגרסיה מרובה ומשתנה דמי רגרסיה מרובה כאשר אנו מנסים לנבא את המשתנה התלוי ביותר ממשתנה ב"ת אחד מדובר ברגרסיה מרובה. חלק זה יתחלק ל- 3 חלקים: מאפייני קוהרגרסיהבמדגם מובהקותקו הרגרסיהומקדמיובאוכלוסיה שיטותלהרצתרגרסיהרבתמשתנים ( ( (3 הערה: החלק הראשון והשני יעסקו בעיקר ברגרסיה דו משתנית: ניבוי המשתנה התלוי באמצעותשני משתניםב"תבלבד. מאפייניקוהרגרסיה במדגם ˆ. נוסחת קו הרגרסיה המרובה: ˆ yˆ i = ˆ α + β xi + β xi + β 3x3i +... + ˆ ˆ β x האומדןלניבוי ) ŷ ( מהווה קומבינציהליניאריתשלערכי.X מספרהשיפועים (ה- ˆβ ( הםכמספרהמשתניםהב"ת ואילוקבועהרגרסיה ) ˆα) הואאחד. k ki מקדמי הרגרסיה נציג את מקדמי קו הרגרסיה המרובה בציוני גלם ובציוני תקן:. המקדם ציוני גלם ציוני תקן zαˆ =0 α = y ˆ β x ˆ β x ˆ... ˆ β k x k אלפא המשמעות קבוע החיתוך של קו הרגרסיה עם ציר ה-.Y קו הרגרסיה יוצא מראשית הצירים ˆ =αˆ y i כאשרכלה- Xיםשוויםל- 0 אז: ˆ ( r zβ = y ˆ ( r zβ = y r r y r * r y r * r ) ) ˆ ( r β = y ˆ ( r β = y r r y r * r y r * r ) sˆ * sˆ y x ) sˆ * sˆ y x בטה "מקדמי רגרסיה חלקיים" הערה: ניתן לחישוברק ברגרסיהדומשתנית 55

המשמעות כאשר המתאם בין המשתנים הב"ת= 0 r = 0 התרומה הייחודית של המשתנה הב"ת לניבוי של המשתנה התלוי (בניכוי שאר המשתנים הב"ת המצויים במשוואה). התרומה היחסית שלהמשתנההב"תלניבוי המשתנההתלוי. השוואתהבטות המתוקננותבערךמוחלט- zβˆ מאפשרת להעריך אתהתרומההיחסית של כל אחד מהמשתנים הב"ת לניבוי המשתנה התלוי. הסיבה שאנו משווים בין השיפועים המתוקננים ולא הגולמיים היא כי המתוקננים בניגוד לגולמיים מנוקים מיחידות המדידה של המשתנים. z ˆ β = r z ˆ β = r y y ˆ β = r ˆ β y = r y sˆ sˆ y x sˆ sˆ y x שיפועי הרגרסיה המרובה שווים לשיפועי הפשוטה הבטה המתוקננת שווה למתאם הפשוט.? יציבותהשיפועים (הבטות): כאשר נכניסמשתניםב"תלתוך משוואתהרגרסיה, נשאלתהשאלה מהיקרהלבטות שלהמשתניםהב"ת שכברמצוייםבתוךהמשוואה? התשובה: ככל שהמתאםביןהמשתנה הב"תשנכניסעםמשתניםב"ת אחריםשכברמצויים במשוואהיהיהחזק יותרכךהבטותיהיופחות יציבות/קבועותבהכנסתוולהפך. דוגמה : ניבויהשכר הנוכחיבאמצעותרמתההשכלה והוותקבמקוםהעבודה: Case Summaries SALNOW Current salary EDUCATE Level of education in years TIME Job seniority in months N Mean Std. Deviation Minimum Maximum 8965.6734 39.3897 54.49 07.9 3.7438.76746 8.00 0.00 76.653 3.67 38.00 0.00 56

SALNOW Current salar EDUCATE Level of education in years TIME Job seniority in months Correlations a Sig. (-tailed) Sig. (-tailed) Sig. (-tailed) SALNOW Current salary **. Correlation is significant at the 0.0 level (-tailed). a. Listwise N= EDUCATE Level of education in TIME Job seniority years in months.55**.66**..000.000.55**.008.000..97.66**.008.000.97. א. חשב את משוואת הרגרסיה לניבוי השכר הנוכחי על ידי רמת ההשכלה והוותק בציוני גלם ובציוני תקן. מה יהיה הניבוי, בציוני גלם ובציוני תקן, של השכר הנוכחי לאדם שרמת השכלתו= 4 שנים והוותק שלו בעבודה= 75 חודשים? מה דעתך על מידת הדיוק של ניבוי זה?. אמוד את ההפרש בשכר הנוכחי של שני עובדים בעלי אותה רמת השכלה אך מס' חודשי הוותק שלהראשוןגבוהפי.5 ממספרחודשיהוותקשלהשני.. למי משני המשתנים הב"ת-רמת השכלה או וותק תרומה ייחודית גבוהה יותר לניבוי המשתנה המנובא?.3 r? = 5 4. בשלבהראשוןהוחלטלנבאאת השכרהנוכחיע"ירמת ההשכלהבלבד. בנהאת משוואתהרגרסיה. 5. עלסמךהפלטבלבד: האם המשוואהשבניתבסעיףהקודם מובהקתברמתמובהקות שלאלפא= 0.05? (הצבהשערות, רשוםהנחות והסקמסקנהמילוליתבלבד). 6. בשלבהשניהוסיףהחוקראת המשתנהוותק. האם ישתנהמקדםהרגרסיההחלקישל רמתההשכלהלאחר הכנסתהוותקלתוךהמשוואה? הסבר ללאחישוב. חוקרערךמחקר שבוניבאאתY על ידישנימשתניםב"ת. להלןהנתונים: = 0 x = 0, x sˆ x 9, ˆ = s x = 50 המשוואה המתוקננת שהתקבלה: האם המשוואה הנ"ל הגיונית? חווה דעתך. ˆ zyi =.8zx i. zxi 57

? חווה דעתך על הטענה הבאה: המשתנה בעל התרומה היחסית הנמוכה ביותר במשוואת הרגרסיההמונה 3 משתניםב"תלפחות, הוא בהכרחזהבעל הקשרהחלש ביותרעםהמשתנה התלוי.. אומדניםחשוביםברגרסיהמרובה.. המתאם המרובה R עדעתה הכרנואתמקדםהמתאםr המכונהגםה"מתאםהפשוט" המתייחסלקשרביןשני משתנים בלבד. המתאם המרובה- R מתייחס לקשר בין המשתנה התלוי לכמה משתנים ב"ת,. R y3 (שימולבכיהמשתניםהב"ת (ה- Xים) מסומניםבמספרים). למשל: בניגוד למתאם הפשוט (r) המתאם המרובה (R) מגדיר רק את עוצמת הקשר ולא את כיוונו ( R 0 ). בנוסףלכךלעומת המתאםהפשוטהמהווה מקדםמתאםסימטרי (לאחשובמיהו המשתנה התלוי ומיהו הב"ת: ), r מקדםהמתאםהמרובההואא- סימטרי. xy = r yx.. פרופורציית השונות המוסברת R משמעותה (כמו ברגרסיה פשוטה) כמה מתוך השונות של המשתנה התלוי הצליחו המשתנים הב"ת להסביר: 0 R = ssreg ssy כאשר ישנם שני משתנים ב"ת בלבד (רגרסיה דו משתנית), ניתן לחשב את פרופורציית השונות המוסברת גם על ידי הנוסחה הבאה: R y r = y + r y r r y r y r המתאם המרובה מושפע מהתלות הסטטיסטית בין המשתנים הב"ת:. כאשר = 0 : r פרופורציית השונותהמוסברתשל Y על ידישניהמשתניםהב"ת, תהייהשווהלסכום הפרופורציות המוסברות ה"פשוטות": R = r + r y y y 58

: r. כאשר 0 פרופורציית השונות המוסברת של Y ע"י שני המשתנים הב"ת, תהיה קטנה מסכום הפרופורציות המוסברות ה"פשוטות": R < r + r y y y תכונה חשובה של : R בהוספת משתניםב"תלתוך משוואתהרגרסיהיכולרקלגדול ("להתנפח") או להישאר אותו דבר אך לא יוכל לעולם לקטון...3 האומד המתוקן (חסר ההטיה) לפרופורציית השונות המוסברת- AdjR האומד המתוקן לפרופורציית השונות המוסברת- לכן AdjR בניגודלאומדהמוטה- R עלוללקטון (ואף לקבל ערכים שליליים) בהוספת משתנים ב"ת לא איכותיים לתוך משוואת הרגרסיה (כאלה שהם בעליקשרנמוךעםY וקשריםגבוהיםעם Xים אחריםהמצוייםבמשוואה ). AdjR? משמש ככלי חשוב כאשר נרצה להעריך האם כדאי לנו להכניס משתנה/משתנים ב"תמסוימיםלתוך משוואתהרגרסיהאו בכדילבחוראת המשוואההאופטימאלית במדגם. במחקר מסוים מנבאים את ציוני ה- B.A באמצעות ציוני הבגרות בלבד כאשר פרופורציית. r xy בשלבהשניהוחלט להוסיףלמשוואתהניבוי השונות המוסברת שהתקבלה היא: = 0.64 משתנה מנבא נוסף-פסיכומטרי והתקבל ש:. AdjR y = 0.6. R y = 0.6 א. ב. חווהדעתךלגבישניהאומדנים הנ"ללפרופורצייתהשונות המוסברתשלה- B.A עלידי פסיכומטרי ובגרות- האם הגיוניים? נמק. תשובה: האומד הראשון הגיוני ואילו האומד השני איננו הגיוני. שני האומדים מצביעים על ירידה בפרופורציית השונות המוסברת בהוספה של משתנה ב"ת נוסף לתוך המשוואה- הפסיכומטרי. אולםרקהאומד המתוקן לפרופורצייתהשונותהמוסברת ) AdjR ( יכוללקטון בהוספתמשתנים ב"תלתוך משוואתהרגרסיה. האומדהמוטה ) R ( יכולרקלגדול ("להתנפח") ובכלמקרהלא יכול לקטון. 59

? עלסמךנתוני דוגמה העבודה): (ניבוי השכר הנוכחי באמצעות רמת ההשכלה והוותק במקום Case Summaries SALNOW Current salary EDUCATE Level of education in years TIME Job seniority in months N Mean Std. Deviation Minimum Maximum 8965.6734 39.3897 54.49 07.9 3.7438.76746 8.00 0.00 76.653 3.67 38.00 0.00 SALNOW Current sala EDUCATE Level of education in years TIME Job seniority in months Correlations a Sig. (-tailed) Sig. (-tailed) Sig. (-tailed) SALNOW Current salary **. Correlation is significant at the 0.0 level (-tailed). a. Listwise N= EDUCATE Level of education in TIME Job seniority years in months.55**.66**..000.000.55**.008.000..97.66**.008.000.97. חשב את האומדנים הבאים: א. ב. ג. ד. האומד לפרופורצייתהשונותהלאמוסברתשלהשכרהנוכחי ע"ירמתההשכלה והוותק א.ח.הלשונותשל ההשכרהנוכחי א.ח.ה לשונותשלהשכר הנוכחיכאשררמתההשכלה והוותקמצוייםבמשוואה האומדלשונות שלהשכרהנוכחיעבוררמתהשכלה= 4 שניםוותק= 68 חודשים 60

. מובהקות קו הרגרסיה ומקדמיו באוכלוסיה. הנחותמודלהרגרסיההמרובה. דגימה מקרית של תצפיות/ טעויות ב"ת. cov( ε i, ε ) = 0 j :i עבורכל j ערכי X. ε עבורכל קומבינציהליניארית קבועה של i N(0, σ e ). 3. אין מתאם מלא בין המשתנים הב"ת.. מובהקותמשוואתהרגרסיההמרובה נבצע מבחן זה כשנרצה לבדוק האם משוואת הרגרסיה שקיבלנו במדגם מובהקת באוכ'. H β = β β H; notho השערות: 0; =... = K = **מספיקשבטה אחתשונהמ- 0 כדי שהמשוואהתהיהמובהקת 0 סטטיסטי המבחן: MSREG F = MSRES נחשבו באמצעות טבלת :ANOVA SS MS=SS/df F = MSREG MSRES סטטיסטי דרגות חופש df k n-k- n- SSreg SSres SSy MSreg MSres F c α; ( k, n k ) קריטי מקורהשונות רגרסיהreg טעויותres אמיתית y הערה: ניתןלחשבאתסטטיסטי F גם באמצעות הנוסחההמקוצרת: R F = k ( R ) n k 6

כלל הכרעה ומסקנה: F > F C אם יש סיבהמספקתלדחותאתH0. מסקנה: יש/אין עדותלכךשמשוואתהרגרסיה מובהקתבאוכלוסייה ברמתמובהקותשל α? בדוקהאם המשוואהלניבויהשכרהנוכחי שלהעובד ע"י ההשכלה והוותקשלו מובהקת באוכ' ברמת מובהקותשלאלפא= 0.05 (הצבהשערות, רשוםהנחות, בנהטבלתמקורשונות והסק מסקנה).בנהאתטבלתמקור השונותעלסמךה- Model Summary בהינתןגם =n: Model Model Summary b Adjusted Std. Error of R R Square R Square the Estimate.857 a.735.73 7.66594 a. Predictors: (Constant), TIME Job seniority in months, EDUCATE Level of education in years b. Dependent Variable: SALNOW Current salary.3 מובהקותהשיפועים.3. המבחן הסטטיסטי נבצע מבחן סטטיסטי זה כאשר נרצה לבדוק האם מקדם השיפוע (הבטה) של אחד המשתנים הב"ת מובהק באוכלוסיה. השערות: כאשרהמשתניםהב"תהאחרים מצויים במשוואה H 0; β H; β j j = 0 0 **הערה: ניתןלשערגם השערותחדצדדיות וגםעלבטהששווהלערך מסויםבאוכלוסיה. 6