מחקר כמותי וסטטיסטיקה
מה אנחנו הולכים לעשות היום? מהי סטטיסטיקה? סטטיסטיקה תיאורית והסקית הצגה בלוחות ובגרפים מדדי מרכז ופיזור מדדי מיקום יחסי התפלגות נורמאלית
מהי סטטיסטיקה מדע העוסק בנתונים כמותיים עוסקת באיסופם, עיבודם, הצגתם, והסקת מסקנות.
תהליך ביצוע המחקר חוקר שואל שאלה לגבי האוכלוסייה תכנון המחקר החוקר דוגם תת קבוצה מהאוכלוסייה
מדגם ואוכלוסייה אוכלוסייה כללהמקריםבתופעהאותהחוקרים מדגם תתקבוצהמתוךהאוכלוסייה קב' קטנהשלאנשים, שאםהיאנדגמתהיטב, אפשרלהסיק ממנהעלכללהאוכלוסייה. שיטות הסתברותיות לדגימה: דגימה מקרית פשוטה דגימה מקרית שיטתית דגימת שכבות פרופורציונלית דגימת אשכולות
נתייחס באופן נפרד למדדים בסטטיסטיקה (למשל הממוצע) כאשר הם באוכלוסייה או במדגם. מדד מדד במדגםנקראסטטיסטיומסומןבאותיותלועזיות באוכלוסייהנקראפרמטרומסומןבאותיותיווניות ממוצע שונות מתאםפירסון פרופורציה פרמטר סטטיסטי µ 2 σ ρ P x S r p 2
תהליך ביצוע המחקר חוקר שואל שאלה לגבי האוכלוסייה תכנון המחקר החוקר דוגם תת קבוצה מהאוכלוסייה איסוף נתונים סטטיסטיקה תיאורית סטטיסטיקה הסקית קיבוץ הנתונים בהתאם לשאלה המחקרית, לסוג האינפורמציה ולטיבה של התופעה החוקר מסיק מהמשתנים במדגם למשתנים באוכלוסיה- ❿ ❿ ❿ אמידה בדיקת השערות ניבוי מסקנות ודיון
משתנים פרמטר קבוע לא ידוע, שאנו מעוניינים לאמוד. ערכים - האפשרויות השונות "לתשובה" לכל משתנה הבחנות בין משתנים - איכותי / כמותי משתנה כמותי בדיד ורציף סולמות מדידה משתנה בלתי תלוי ומשתנה תלוי.
סוגי משתנים איכותי / כמותי איכותי: צבע עיניים, ארץ לידה כמותי: מספר שעות האזנה לחדשות ביום, פוליטית דרגת מעורבות רציף / כמותי: בדיד בדיד: מספר פעמים של זכייה בפרס פוליצר, מספר מנויים לעיתון, מספר ילדים רציף: שעות צפייה בטלוויזיה, הכנסה
סולמות מדידה נומינלי שמי/ / אורדינלי / אינטרוולי סדר רווח / רציונלי יחס מנה /
סולמות מדידה למספרים שמי/ נומינלי איכותי, קטגוריות מוציאות, ללא סדר אבחנה, הניתנים לקטגוריות אין משמעות מין, דת, ארץ מוצא סדר / אורדינלי כמותי/איכותי, יודעים מי גדול ממי, אך לא בכמה מידת הסכמה - מסכים מאוד, מסכים, נייטרלי, לא מסכים, מאוד לא מסכים ; דרגות ניהול; מידת דתיות
סולמות מדידה רווח / אינטרוולי (בכמה יותר גדול) יודעים מי גדול ממי ובכמה, 0 שרירותי טמפרטורה, גובה של הרים. מנה / יחס / רציונלי (בכמה/פי כמה יותר גדול) נקודת 0 מוחלט (כלומר, ה- 0 משמעותו אין) שנות לימוד, מרחק, הכנסה כאשר ההכנסה שלי היא 0 אין לי הכנסה
סולמות מדידה סולם קוואזי-רווח סולם הנמצא בין סולם הסדר וסולם הרווח. בעל תכונות של סולם סדר אבל מתנהגים אליו סטטיסטיים) כאילו הוא סולם רווח (מבצעים ניתוחים שני תנאים: סולם בעל 5 רמות לפחות ומעל 30 נבדקים. לדוגמא: עד כמה אתה מאמין לחדשות בטלוויזיה 5 מסכים מאוד 4 3 מסכים במידה בינונית 2 1 מאוד לא מסכים
סולמות מדידה הסולם שמי - נומינלי סדר - אורדינלי מרווחי - אינטרוולי מנה רציו תכונות שייכות שייכות סדר שייכות סדר רווח (בכמה) 0 שרירותי שייכות סדר רווח (בכמה) יחס ) פי כמה) 0 מוחלט
סולמות מדידה הסולם דוגמא מדד הפיזור המתאים דרך הצגה גראפית מתאימה שמי נומינלי מין ארץ לידה שכיחויות עוגה סדר אורדינלי קטגוריית גיל מהו גילך? פחות מ- 18 1. 18-35.2 36-64.3 65 ומעלה.4 דרוג עדיפות של אמצעי תקשורת שכיח חציון רבעונים עשירונים גרף עמודות מרווחי אינטרוולי מעלות צלסיוס IQ הנ"ל ובנוסף ממוצע וסטיית תקן גרף עמודות גרף קו היסטוגרמה יחס רציו הכנסה חודשית שנות לימוד
סולמות מדידה? האם ניתן לומר שהאחד גדול מהשני לא: שמי האם ניתן לסדר אותם מהגדול לקטן? כן: אורדינלי ומעלה? האם ניתן לומר בכמה האחד גדול מהשני לא: אורדינלי; כן: אינטרוולי ומעלה.
סולמות מדידה האם יש 0 מוחלט? לא: אינטרוולי, כן: מנה. האם יש משמעות כמותית למספרים? לא: איכותי; כמותי. כן: האם ניתן להכניס ערך בין כל שני ערכים? לא: בדיד, כן: רציף.
סולמות מדידה ניתן להעביר משתנה מסולם גבוה לנמוך לדוגמא, אם נשתמש בסולם מנה נוכל תמיד לקבץ קטגוריות ולהוריד אותו לסולם סדר. אבל לא להפך
סולמות מדידה השערת המחקר והגדרת המשתנים קובעים את דרך מדידתם של המשתנים ובחינת המדדים הסטטיסטיים משתנה זהה יכול להימדד בדרכים שונות (לפי סולם המדידה) - לדוגמא צפייה בטלוויזיה:
אופן ההצגה של נתונים בהתאם לסולם המדידה של המשתנה השערת המחקר והגדרת המשתנים קובעים את דרך הצגתם של הנתונים
סולם נומינלי שמי דיאגראמת פאי - אחוזי הצפייה לפי סוג התוכנית 21
סולם אורדינלי - סדר בר-עמודות תדירות צפייה בז'אנרים שונים בטלוויזיה 32% מהצופים בחדשות, הינם צופים לעיתים קרובות מאוד 22
סולם אורדינלי -סדר עוגה / פאי (פחות מקובל כי העיגול לא ממחיש את הסדר בין הערכים) תדירות צפייה בחדשות ותכניות אקטואליה בטלוויזיה 23
סולם כמותי (רווח ומנה) בדיד בר, עמודות או קו המתאר מגמה משך צפייה ממוצע בז'אנרים שונים בטלוויזיה (בדקות) במהלך תהליך והאינתיפאדה השנייה 24
סולם כמותי (רווח ומנה) היסטוגרמה רציף 4 0 שכיחות שנות הותק אצל הפועלים 3 0 y c n e u q re F 20 1 0 0 4.0 0 4.5 0 5.0 0 5.5 0 6.0 0 6.5 0 p arents' m ea n c o llec tiv is m M e a n = 5.40 1 2 S td. De v. = 0.4 3 7 1 5 N = 2 4 9 25
מדדי מרכז ופיזור
מדדי נטייה מרכזית: ערכים מרכזיים שאמורים לאפיין את כל ההתפלגות שכיח / mode = הערך שמופיע מספר הפעמים הרב ביותר בהתפלגות. אמצע טווח/ = MR ממוצע שני הערכים הקיצוניים ביותר חציון / median = הערך שעד אליו ו/או כולל אותו ישנם 50% מההתפלגות ומעליו ו/או כולל אותו ישנם 50% מההתפלגות. ממוצע / mean = סכום הערכים לחלק למספרם בהתפלגות.
מדדי פיזור ומיקום מרכזי מהו פיזור? מדדים: אחוז השגיאות סולם סדר טווח טווח בינרבעוני ממוצע ריבועי הסטיות שונות וסטיית תקן
ציוני תקן והתפלגות נורמאלית
תקן ציוני למיקום יחסי מדד היחיד של
ציון התקן ממקם את היחיד יחסית לממוצע. ניתן לדעת אם הנבדק נמצא מעל הממוצע או מתחתיו ובכמה הוא רחוק מהממוצע. ציון תקן הוא ציון הניתן ועוזר לקבוע מי מבין שני לכל יחיד במדגמים ציונים גבוה או נמוך שונים יותר.
נוסחת ציון התקן: Zi= Xi - X S ציון התקן שמחושב לכל נבדק הממוצע של המדגם ציונו הגולמי של הנבדק סטיית התקן של המדגם Zi X Xi S
דוגמה לחשיבות השימוש בציוני התקן תלמיד קיבל במבחן בתנ"ך 75, ו- 70 במבחן במתמטיקה. אנו רוצים לקבוע באיזה מקצוע התלמיד טוב יותר. לכאורה נראה שהתלמיד טוב יותר בתנ"ך בהשוואה למתמטיקה. אולם, אם נתחשב בממוצע הכיתה ובסטיית התקן נקבל תמונה מדויקת יותר. Zi= Xi - X S הציון המקצוע תנ"ך מתמטיקה 75 70
דוגמה לחשיבות השימוש בציוני התקן תלמיד קיבל במבחן בתנ"ך 75, ו- 70 במבחן במתמטיקה. אנו רוצים לקבוע באיזה מקצוע התלמיד טוב יותר. לכאורה נראה שהתלמיד טוב יותר בתנ"ך בהשוואה למתמטיקה. אולם, אם נתחשב בממוצע הכיתה ובסטיית התקן נקבל תמונה מדויקת יותר. Zi= Xi - X S הציון המקצוע X S 75 תנ"ך 70 5 70 מתמטיקה 65 2.5
חישוב ציוני התקן... ציון תקן בתנ"ך Zi= Xi - X S = 75-70 5 = 1 ציון תקן במתמטיקה Zi= Xi - X S = 70-65 2.5 = 2 הציון המקצוע X S 75 תנ"ך 70 5 70 מתמטיקה 65 2.5
Zi= Xi - X S הציון המקצוע X S Z 75 תנ"ך 70 5 1 70 מתמטיקה 65 2.5 2
לציון התקן שני מאפיינים: הסימן מראה את הכיוון יחסית לממוצע הערך המספרי מציין את המרחק מהממוצע סימן שלילי = הנתון קטן מהממוצע סימן חיובי = הנתון גדול מהממוצע אפס = הנתון שווה לממוצע ככל שהערך של ציון התקן גדול יותר בערך המוחלט שלו (חיובי או שלילי), הנתון רחוק יותר מהממוצע.
תכונות ציוני התקן ממוצע ציוני התקן של מדגם כלשהו תמיד שווה ל- 0. סטיית התקן של ציוני תקן במדגם כלשהו שווה 1. ל- צורת ההתפלגות של ציוני תקן המקורית שממנה הם חושבו. לצורת דומה ההתפלגות אם ההתפלגות המקורית ציוני התקן תהיה נורמלית. התפלגות גם נורמלית הינה
התפלגות נורמלית
התפלגות נורמלית לתופעות רבות בטבע התפלגות הדומה לצורת פעמון: - משקל - גובה - מנת משכל התפלגויות אלה ניתנות לקירוב טוב ע"י מודל מתמטי ההתפלגות הנורמלית. ככל שהמדגם גדול יותר, כך הקירוב להתפלגות הנורמלית יהיה טוב יותר
היסטוגרמה (שכיחויות יחסיות) של משקל תינוקות: 0.0 0.0002 0.0004 0.0006 0.0008 2000 2500 3000 3500 4000 4500 Weight
2000 2500 3000 3500 4000 4500 5000 Weight 0.0 0.0002 0.0004 0.0006 0.0008
התפלגות נורמלית (מקרה פרטי של התפלגות פעמון) Normal Densities משפחה של התפלגויות סימטריות חד-שיאית דמויות פעמון הממוצע=חציון= שכיח התפלגות אסימפטוטית 0.0 0.2 0.4 0.6 0.8 N(0,1) N(3,1) N(0,4) N(0,0.25) -4-2 0 2 4 6 8
ציוני תקן וגלם בהתפלגות 450 400 נורמלית M=70 S=10 350 300 250 200 150 100 50 0-3 -2-1 ציוני תקן 0 1 2 3 40 50 60 ציוני גלם 70 80 90 100
תכונות התפלגות נורמלית בציוני תקן: ההתפלגות סימטרית סביב 0 מודל המתאים לאוכלוסייה אין-סופית בגודלה הממוצע באוכלוסייה הוא 0 סטיית התקן באוכלוסייה היא 1 בין 1=Z ל 1-=Z נמצאים (0.6826) 68.26% מהמקרים בין 2=Z ל 2-=Z נמצאים (0.9544) 95.44% מהמקרים בין 3=Z ל 3-=Z נמצאים (0.9974) 99.74% מהמקרים
מיקום יחסי והעקומה הנורמלית 34% 34% - ממוצע - סטיית תקן µ σ 2% 14% 14% µ 2σ µ σ µ µ+σ µ+2σ 2% 16% 50% 84% 98% 2%
התפלגות נורמלית - דוגמא ממוצע הגובה לנשים באוכלוסיה הוא 163 סנטימטרים. סטיית התקן של ההתפלגות היא 14. מה המיקום היחסי (כמה נשים מעל וכמה מתחת) של אשה בגובה 177 ס"מ? µ = 163 σ = 14 µ 2σ 163 28 µ σ µ µ+σ µ+2σ 163 14 14 163 163+14 14 163+28
µ 2σ µ σ µ µ+σ µ+2σ 163 28 163 14 14 163 163+14 14 163+28 בדוגמא הנ"ל: סטיות תקן מתחת לממוצע (2- סטיות מעל לממוצע) סטיות תקן מתחת לממוצע (1- סטיות מעל לממוצע) סטיות תקן מעל לממוצע סטיות תקן מעל לממוצע סטיות תקן מעל לממוצע 135 ממוקם 2 149 ממוקם 1 163 ממוקם 0 177 ממוקם 1 191 ממוקם 2 ניתן להמיר כל ציון לציון התקן על ידי החסרת הממוצע וחלוקה בסטיית התקן: Zi= Xi - X S
ניתן לחשב לכל ערך Z את השטח המתאים לו מתחת להתפלגות הנורמלית על ידי שימוש בלוח Z. לדוגמא: z Zi= Xi - X S = 80 75 9.09 = 0.55 סטודנט שציון המבחן שלו =80 ממוצע הכיתה =75 סטיית התקן= 9.09
טבלת Z
השוואת ציונים מהתפלגויות נורמליות שונות שני סטודנטים משתתפים בכיתות תרגול שונות. שניהם קיבלו ציון 80 באחד הבחנים. בכיתת תרגול א', הממוצע היה 70 בכיתת תרגול ב' הממוצע היה 70 וסטיית התקן 10 וסטיית התקן 5 בהנחה שציוני הסטודנטים בשתי הכיתות מתפלגים נורמלית, מה המיקום של שני הסטודנטים האחד לעומת השני?
השוואת ציונים המשך דוגמא ציון א': ;X=70 sd=10 ציון ב': ;X=70 sd=5 70 80 70 80 80 ברור שציון 80 ב' בקבוצה א' אינו מקביל לציון בקבוצה
השוואת ציונים המשך דוגמא כדי להשוות, יש ראשית להפוך את הציונים לציוני תקן ב z 80 70 = = 2 5 80 70 10 ציון א': =z ציון ב': = 1 14% 0 1 2 84% 98%
דוגמא.1.2 משקלכיכרלחםמתפלגנורמליתעםממוצעשל 750 גרם וסטייתתקןשל 10 גרם. מההסיכוישכיכרמקריתתשקולפחותמ- 740 גרם? מהוהמשקלשרק 5% מהכיכרותשוקליםפחותממנו?
X ~ N (750,100) פתרון נסמן ב- X את המשקל של כיכר מקרית. מהנתונים:? מה הסיכוי שכיכר מקרית תשקול פחות מ- 740 גרם.1 740 750 P Z =Φ( 1) 10 עדערךZ=1 מתפלגים 0.8413 מהשטח לכןעדערךZ=-1 מתפלגים 0.1587=1-0.8413 מהשטח ההסתברותשכיכרתשקולפחותמ- 740 גרםהיאלכן 15.87% 2. מהוהמשקלשרק 5% מהכיכרותשוקליםפחותממנו? z z 0.95 x = = 1.65 = 750 1.65*10= 733.5 0.05 0.05 x= 733.5 פעולה הפוכה לתיקנון, כיכר לחם שנמצאת 1.65 סטיות תקן מתחת לממוצע המשקל
תרגיל.1 התפלגות מנת המשכל של אוכלוסייה שואפת להתפלגות נורמלית עם ממוצע 100 וסטיית תקן 15. חשב את אחוז המקרים בעלי מנת משכל: מהו התחום הסימטרי סביב הממוצע בו מרוכזים 95% מהמקרים באוכלוסייה? ( ) x~n 100, 225 z = 1.96 0.975 x x 0.025 0.975 = 100 1.96*15= 70.6 = 100+ 1.96*15= 129.4
תרגיל 2000 2. מועמדים נרשמים ללמוד רפואה, אך מתקבלים רק 200 הטובים ביותר על פי בחינת מיון שנערכת. הציון הממוצע בבחינה הוא 81 וסטיית התקן היא 5. בהנחה שהתפלגות הציונים שואפת לנורמלית, מהו הציון המנימלי כדי להתקבל ללימודי רפואה? x~n 81, 25 z x ( ) 0.9 0.9 0.9 = 1.282 x = 81+ 1.282*5= 87.41 = 87.41
תרגיל 5. באוניברסיטה מסוימת הציון הממוצע של התואר הראשון הוא 85 וסטיית התקן של הציונים היא 5. נדבן מסוים מעוניין לקדם את החינוך והעניק סכום כסף לצורך חלוקת מלגות. הוא דרש שהכסף יחולק בין 3% הסטודנטים שציוניהם הטובים ביותר. מהו ציון הגלם הנמוך ביותר של מקבלי המלגות (החל מאיזה ציון זכאים למלגה)? תשובה: יש לחשב את האחוזון ה- 97. x~n 85,25 z x ( ) 0.97 0.97 0.97 = 1.881 x = 85+ 1.881*5= 94.4 = 94.4
תרגיל 3. מורה החליט להכשיל 25% מן הכיתה. ממוצע הציון בבחינה היה 72 עם סטיית תקן של 6 נקודות. מהו ציון המעבר? x~n 72,36 z x ( ) 0.25 0.25 0.25 = 0.674 x = 72 0.674*6= 67.95 = 67.95