מבוא לסטטיסטיקה א' נדלר רוניה גב'
סכימת המחקר שאלת המחקר כלל האוכלוסיה מדגם - תת אוכלוסיה דרך מדידה איסוף נתונים קיבוץ נתונים סטטיסטיקה תיאורית סיכום נתונים
האם הנתונים הינם לגבי כלל האוכלוסייה? מדגם - תת אוכלוסייה כלל האוכלוסייה הסקה ממדד המדגם למדד האוכלוסייה סטטיסטיקה היסקית הסקת מסקנות לגבי האוכלוסייה הסקת מסקנות לגבי האוכלוסייה 3
שאלת המחקר - השאלה המרכזית אותה החוקר רוצה לחקור אוכלוסיית המחקר -הקבוצה עליה נשאלת שאלת המחקר: כלל האוכלוסיה או מדגם דרך מדידה -בשלב זה על החוקר להחליט: מה הוא בודק מהי התכונה, המהות אותה הוא בודק איך הוא בודק כיצד הוא מודד את אותה תכונה איסוף נתונים -בשלב זה מבצעים בפועל את המחקר ואוספים את כל נתוני המחקר 4
הגדרות משתנה מול קבוע משתנה בדיד מול משתנה רציף עיגול של תוצאה אנו נעגל תוצאות עשרוניות לפי הספרה השלישית לאחר הנקודה,.43 הופך להיות.4.47 הופך להיות.5 למשל: 5
מיון לפי רמת המדידה סוגי משתנים משתנה נומינלי שמי משתנה אורדינלי - סדר משתנה אינטרוולי - רווח משתנה יחס - מנה 6
מיון לפי מהות המשתנה משתנה איכותי משתנה כמותי מיון לפי רמת המדידה ולפי מהות המשתנה משתנה איכותי משתנה כמותי בדיד רציף נומינלי אורדינלי אינטרוולי יחס 7
קיבוץ נתונים כדי לקבל תמונה ברורה יותר מהנתונים, יש לארגן אותם בטבלה, בגרף או בחוק )מתמטי(. ארגון הנתונים בטבלה בעריכת טבלה חובה להציג כותרת. בכותרת צריכים להופיע משתני המחקר, המקום בו נעשה המחקר והזמן שבו הוא נערך יש לערוך את הנתונים בסדר עולה...3 יש לקבוע את מספר המחלקות/הקבוצות על פיהן יחולקו הנתונים. מספר מקובל של מחלקות הוא כאשר הוא גודל המדגם 4. יש לקבוע את רוחב המחלקות l max m um _ of _ catagores רוחב המחלקה מחושב על-ידי: 5. הכנסת הנתונים לטבלה 8
מחקר על רמת הידע בעברית של פוליטיקאים. שאלת המחקר:. אוכלוסיית המחקר: 3. כלל האוכלוסייה או מדגם? 4. דרך מדידה: 5. איסוף נתונים: 70,40,8,85,0,0,04,95,34,07,98,5,75,95, 6. קיבוץ הנתונים: 9
מחקר על רמת הידע בעברית של פוליטיקאים - המשך כותרת: רמת הידע בעברית של ח"כ בישראל בשנת 000 יש לסדר את הערכים בסדר עולה um_ of _ catagores חישוב מספר המחלקות: 4 l 9.5 חישוב רוחב מחלקה: בניית הטבלה והכנסת הנתונים אינדקס (dex) מספר סידורי של המחלקות בטבלה שם המשתנה ערכי המשתנה במדגם )frequecy( שכיחות f מספר הפעמים שמופעים ערכי משתנה 3 4 50-80 80-0 0-40 40-70 f 8 4 =5 0
P f f, P (%) 00 משתנה נומינלי טבלאות במשתנה מסוג זה ניתן להוסיף עמודה של שכיחות יחסית נערך סקר על 50 מפעלי תעשיה בגוש דן לפי סוג הענף שבו עוסק המפעל בשנת 0 3 4 5 גוש דן - f ענף - 8 4 0 6 = 50 חשמל מתכת ביגוד שירותים דפוס P 0.6 0.4 0.8 0.0 0..00 P (%) 6% 4 8 0 00 סקר דומה נעשה באזור ירושלים כדי ללמוד באיזה איזור יש משקל חזק יותר לענף הביגוד - ענף f - ירושלים P P (%) 5 חשמל 0 מתכת 6 ביגוד 3 שירותים 4 8 דפוס 5 = 00
משתנה אורדינלי (%) CP במשתנה מסוג זה ניתן להוסיף עמודה של שכיחות מצטברת F, ושכיחות יחסית מצטברת 50 מנהלי המפעלים של גוש דן נשאלו לגבי רמת השכלתם משתנה אינטרוולי/יחס P(%) F CP(%) f -מס' מפעלים רמת השכלה 7 יסודי 5 חטיבה 4 תיכון 3 9 תואר ראשון 4 5 תואר שני 5 = 50 7 36 45 50 4% 44% 7% 90% 00% משתנה מסוג זה יכול להיות בדיד או רציף ובוודאי שניתן לחשב שכיחות מצטברת ושכיחות יחסית מצטברת. בנוסף, במקרה של משתנה רציף ניתן לחשב את נקודת האמצע נקח לדוגמא את הטבלה של מספר השגיאות של ח"כ 50-80 f F P (%) CP (%) m.p. 65 80-0 8 95 3 0-40 4 5 4 40-70 55 = 5
הצגה גרפית הצגה גרפית אינה מוסיפה ידע, זוהי דרך נוחה וברורה להבלטת התופעה הנחקרת דיאגרמת שטחים - Pe הצגה זו מתאימה למשתנה איכותי נומינלי אסיה אפריקה אמריקה אירופה 3
דיאגרמת מקלות הצגה גרפית כזו מתאימה למשתנה איכותי אורדינלי וכן למשתנה כמותי בדיד מיועדת למשתנים בדידים. ציר ה- מייצג את ערכי המשתנה. ציר ה- Y מייצג את השכיחות. לערכי המשתנה מעלים אנכים )מקלות( בגובה שכיחותם. גרף זה אינו מתאים להצגת התפלגות שכיחויות של קטגוריות המבוטאות בטווחים 4
f משתנה איכותי - אורדינלי למשל: ציוני התנהגות בכיתה 40-0 - טוב מאד טוב בינוני גרוע f משתנה כמותי בדיד למשל: מספר התלמידים בכל כיתה 0-5 - 5 6 7 8 9 30 5
היסטוגרמה הצגה זו מתאימה למשתנה כמותי-רציף אינטרוולי או יחס * במשתנה רציף המח' מוגדרות ע"י קב' של ערכים ויש משמעות לרוחב הקב'. ציר ה- x כולל את הערכים האפשריים של המשתנה. כל מלבן מייצג את השכיחות של אותה מח'. * במשתנה רציף אנו לא מתייחסים לשכיחות המוחלטת, אלא יש להתייחס לשכיחות עבור כל אחת מיחידות המשתנה, כלומר צפיפות. צפיפות = שכיחות ליחידה אחת של המשתנה * l legth d desty f l 6
היסטוגרמה - מחלקות שוות רוחב נתונה טבלה המתארת את כמות העובדים לפי שנות הותק שלהם במפעל. לשרטט הסטוגרמה במשתנה רציף יש לחשב : על-מנת רוחב של כל מחלקה צפיפות של כל מחלקה נקודת האמצע של כל מחלקה...3 7 בשרטוט ההיסטוגרמה כל מלבן מייצג את השכיחות/צפיפות של אותה מח' במחלקות שוות רוחב, המלבן הגבוה ביותר הוא גם בעל השכיחות הגבוהה ביותר וכן בעל הצפיפות הגבוהה ביותר.
מההיסטוגרמה אנו עוברים למצולע שכיחויות פוליגון * הפוליגון נותן תמונה נכונה יותר של מהלך ההתפלגות שבו מחברים את אמצעי המח' ויוצרים תמונה אמיתית יותר. בפוליגון יש העברה של שכיחויות-מקרים ממח' למח'. * הפוליגון מוביל אותנו לעקומת השכיחויות, שבעזרתה ניתן לחשב שטחים שהם האחוזים המתאימים באוכלוסיה בין כל ערכים נתונים של x. * 8
היסטוגרמה - מחלקות בעלות רוחב שונה למשל: טבלה המתארת התפלגות ציונים של כיתה בת 40 סטודנטים...3 נוסיף עמודה של רוחב המחלקה נוסיף עמודה של צפיפות נוסיף עמודה של נקודת האמצע לפי איזה נתון נשרטט את ההיסטוגרמה? היסטוגרמה ע"י שכיחות היסטוגרמה ע "י צפיפות 9
היסטוגרמה ע"י שכיחות היסטוגרמה ע "י צפיפות בהיסטוגרמה לפי f גובה המלבן אינו מבטא נכון את השכיחות כיוון שהמח' אינן שוות ברוחבן. לכן במח' בעלות רוחב שונה נבנה טור של d השכיחות ליח' אחת של המשתנה )צפיפות(. וציר ה- y לא יבטא את השכיחות אלא את 0 מסקנה: במח' בעלות רוחב שונה חובה לבנות את ההיסטוגרמה לפי הצפיפות
ניתן לנצל את הצפיפות למטרה נוספת: איחוד טבלאות בעלות רוחב מחלקות שונה למשל: נתונה התפלגות הכנסות של 340 עובדים במפעל מסויים בשלב מאוחר יותר התקבלו נתונים של יתר העובדים 60= והתפלגות ההכנסות שלהם הייתה: המנהל מעוניין לצרף את הנתונים שהתקבלו באיחור להתפלגות ההכנסות הראשונה, לוח שכיחויות עבור כל 500 העובדים. ולבנות
שלב א: הפיכת הטבלה של 60 העובדים לטבלה עם מחלקות שוות רוחב כמו בטבלה הראשונה )של 340 העובדים( שלב ב: צרוף הטבלאות לטבלת שכיחויות אחת.
צורות התפלגות התפלגויות סימטריות. סימטרית חד שיאית. סימטרית דו שיאית 3. התפלגות אחידה 3
צורות התפלגות התפלגויות א-סימטריות אסימטרית חיובית זנב ימני.4 אסימטרית שלילית זנב שמאלי.5 4
5 Sum הלימה תא תלמסמ אמגיס - תולודג תויתואב םינמוסמ םינתשמה, Y, Z, T תונטק תויתואב םינמוסמ םיעובקה a, b, c, d. :הרדסה ירביא לכ םוכס. הרדסב תיקלח הצובק םוכס :.3 a עובק םיפיסומ רביא לכל רשאכ הרדסה ירביא לכ םוכס.4 הרדסב םירביאה יעוביר םוכס : אמגיס יללכ Σ -.5 :הרדסה ירביא םוכס עוביר Y Y Y Y 5 4 3 5 3 a a a a a ) ( ) ( ) (
6.6 :a עובקב הרדסב רביא לכ םיליפכמ רשאכ הרדסה ירביא םוכס.7 :המאתהב תורדס יתש לש םירביא רוביח םוכס.8 :המאתהב תורדס יתש לש םירביאה לש תולפכמה םוכס.9 :המאתהב תורדס יתש לש םירביאה לש םימוכסה תלפכמ a a a a a Y Y Y Y Y ) ( Y Y Y Y ) ( ) ( ) )( ( Y Y Y Y ) )( ( Y Y
- Σ כללי סיגמא דוגמא Y 6. סכום כל אברי הסדרה 5 3 4 ( ). סכום של קב' חלקית מהסדרה )איבר ) 3-5 3. סכום כל אברי הסדרה כאשר לכל איבר מסוים מוסיפים קבוע 63 4. סכום ריבועי האיברים בסדרה ( ) ( ) 5. ריבוע סכום איברי הסדרה 7
סכום איברי הסדרה כאשר מכפילים כל איבר וסידרה בקבוע :.6 ( Y) 7 7. סכום חיבור איברים של שתי סדרות בהתאמה: Y 30 8. סכום מכפלת האיברים של שתי סדרות בהתאמה: ( ) ( 9. מכפלת הסכומים של האיברים של שתי סדרות בהתאמה : Y) 76 Y ( )( Y) 8