- הסקה סטטיסטית - מושגים

Σχετικά έγγραφα
הסקה סטטיסטית/תקציר/תלמה לויתן

התפלגות χ: Analyze. Non parametric test

פתרון תרגיל מרחבים וקטורים. x = s t ולכן. ur uur נסמן, ur uur לכן U הוא. ur uur. ur uur

טושפ הרעשה ןחבמ t ןחבמ

לדוגמה: במפורט: x C. ,a,7 ו- 13. כלומר בקיצור

הרצאה. α α פלוני, וכדומה. הזוויות α ל- β שווה ל-

תרגול 1 חזרה טורי פורייה והתמרות אינטגרליות חורף תשע"ב זהויות טריגונומטריות

ניהול תמיכה מערכות שלבים: DFfactor=a-1 DFt=an-1 DFeror=a(n-1) (סכום _ הנתונים ( (מספר _ חזרות ( (מספר _ רמות ( (סכום _ ריבועי _ כל _ הנתונים (

פתרון תרגיל 5 מבוא ללוגיקה ותורת הקבוצות, סתיו תשע"ד

סיכום- בעיות מינימוםמקסימום - שאלון 806

Charles Augustin COULOMB ( ) קולון חוק = K F E המרחק סטט-קולון.

סטודנטים יקרים. לפניכם ספר תרגילים בקורס הסקה סטטיסטית. הספר הוא חלק מקורס חדשני וראשון מסוגו בארץ בנושא זה, המועבר ברשת האינטרנט.

[ ] Observability, Controllability תרגול 6. ( t) t t קונטרולבילית H למימדים!!) והאובז' דוגמא: x. נשתמש בעובדה ש ) SS rank( S) = rank( עבור מטריצה m

תרגול פעולות מומצאות 3

ההימצאות (או שכיחות) (prevalence) של תכונה שווה. ההארעות (incidence) של תכונה שווה לפרופורציית נתון. = 645/72, או 89 לכל 10,000 אחיות.

מבחן t לשני מדגמים בלתי תלויים. T test for independent samples

{ } { } { A חוקי דה-מורגן: הגדרה הסתברות מותנית P P P. נוסחת בייס ) :(Bayes P P נוסחת ההסתברות הכוללת:

תרגול מס' 6 פתרון מערכת משוואות ליניארית

ןמנירג ןואל \ הקיטסיטטס הקיטסיטטסב הרזח ה יפד ךותמ 14 דו 1 מע

חורף תש''ע פתרון בחינה סופית מועד א'

Logic and Set Theory for Comp. Sci.

פתרון תרגיל 8. מרחבים וקטורים פרישה, תלות \ אי-תלות לינארית, בסיס ומימד ... ( ) ( ) ( ) = L. uuruuruur. { v,v,v ( ) ( ) ( ) ( )

סטודנטים יקרים. מקורס חדשני וראשון מסוגו בארץ בנושא זה, המועבר ברשת האינטרנט.On-line

תרגיל 7 פונקציות טריגונומטריות הערות

תרגיל 13 משפטי רול ולגראנז הערות

I. גבולות. x 0. מתקיים L < ε. lim אם ורק אם. ( x) = 1. lim = 1. lim. x x ( ) הפונקציה נגזרות Δ 0. x Δx

סיכום חקירת משוואות מהמעלה הראשונה ומהמעלה השנייה פרק זה הינו חלק מסיכום כולל לשאלון 005 שנכתב על-ידי מאיר בכור

סטודנטים יקרים הקורס באתר כולל פתרונות מלאים לספר התרגילים, וכן את התיאוריה הרלוונטית לכל נושא ונושא.

דף פתרונות 7 נושא: תחשיב הפסוקים: צורה דיסיונקטיבית נורמלית, מערכת קשרים שלמה, עקביות

יסודות לוגיקה ותורת הקבוצות למערכות מידע (סמסטר ב 2012)

גבול ורציפות של פונקציה סקלרית שאלות נוספות

x = r m r f y = r i r f

שאלה 1 V AB פתרון AB 30 R3 20 R

סטודנטים יקרים. מקורס חדשני וראשון מסוגו בארץ בנושא זה, המועבר ברשת האינטרנט.On-line

לוגיקה ותורת הקבוצות פתרון תרגיל בית 8 חורף תשע"ו ( ) ... חלק ראשון: שאלות שאינן להגשה נפריד למקרים:

צעד ראשון להצטיינות מבוא: קבוצות מיוחדות של מספרים ממשיים

ל הזכויות שמורות לדפנה וסטרייך

סיכום בנושא של דיפרנציאביליות ונגזרות כיווניות

סטודנטים יקרים. לפניכם ספר תרגילים בקורס הסקה סטטיסטית. הספר הוא חלק מקורס חדשני וראשון מסוגו בארץ בנושא זה, המועבר ברשת האינטרנט.

3-9 - a < x < a, a < x < a

תרגילים באמצעות Q. תרגיל 2 CD,BF,AE הם גבהים במשולש .ABC הקטעים. ABC D נמצאת על המעגל בין A ל- C כך ש-. AD BF ABC FME

שדות תזכורת: פולינום ממעלה 2 או 3 מעל שדה הוא פריק אם ורק אם יש לו שורש בשדה. שקיימים 5 מספרים שלמים שונים , ראשוני. שעבורם

"קשר-חם" : לקידום שיפור וריענון החינוך המתמטי

gcd 24,15 = 3 3 =

אלגברה מודרנית פתרון שיעורי בית 6

ניסוי מקרי: ניסוי שיש לו מספר תוצאות אפשריות ואי-אפשר לדעת מראש באיזה תוצאה יסתיים הניסוי.

לוגיקה ותורת הקבוצות מבחן סופי אביב תשע"ב (2012) דפי עזר

{ : Halts on every input}

) תיביטנרטלאה הרעשהה תיב

הרצאה 7 טרנזיסטור ביפולרי BJT

x a x n D f (iii) x n a ,Cauchy

אלגברה ליניארית (1) - תרגיל 6

הגדרה: מצבים k -בני-הפרדה

(ספר לימוד שאלון )

( k) ( ) = ( ) ( ) ( ) ( ) A Ω P( B) P A B P A P B תכונות: A ו- B ב"ת, אזי: A, B ב "ת. בינומי: (ההסתברות לk הצלחות מתוך n ניסויים) n.

גמישויות. x p Δ p x נקודתית. 1,1

תשובות מלאות לבחינת הבגרות במתמטיקה מועד ג' תשע"ד, מיום 0/8/0610 שאלונים: 315, מוצע על ידי בית הספר לבגרות ולפסיכומטרי של אבירם פלדמן

ב ה צ ל ח ה! /המשך מעבר לדף/

השאלות..h(k) = k mod m

הרצאה 5 הגדרה D5.1 בין 1 N . כלומר, t N

= 2. + sin(240 ) = = 3 ( tan(α) = 5 2 = sin(α) = sin(α) = 5. os(α) = + c ot(α) = π)) sin( 60 ) sin( 60 ) sin(

פתרון תרגיל בית 6 מבוא לתורת החבורות סמסטר א תשע ז

קיום ויחידות פתרונות למשוואות דיפרנציאליות

בס"ד פאניה - PANYA חוברת סטטיסטיקה ב' קורס סטטיסטיקה ב' למדעי החברה כתבה: ענבל יולזרי החישובי, כולל הדוגמאות המובאות בו, של

לוגיקה ותורת הקבוצות מבחן סופי אביב תשע"ד (2014) דפי עזר

בחינה בסיבוכיות עמר ברקמן, ישי חביב מדבקית ברקוד

קבוצה היא שם כללי לתיאור אוסף כלשהו של איברים.

Prerequisites for the MBA course: Statistics for managers".

תוכניות דגימה לפי תקן ISO2859

The No Arbitrage Theorem for Factor Models ג'רמי שיף - המחלקה למתמטיקה, אוניברסיטת בר-אילן

תורת ההסתברות (1) 80420

אקונומטריקה ד"ר חמי גוטליבובסקי סמסטר א' תש "ע

סדרות - תרגילים הכנה לבגרות 5 יח"ל

( )( ) ( ) f : B C היא פונקציה חח"ע ועל מכיוון שהיא מוגדרת ע"י. מכיוון ש f היא פונקציהאז )) 2 ( ( = ) ( ( )) היא פונקציה חח"ע אז ועל פי הגדרת

א הקיטסי ' טטסל אובמ רלדנ הינור בג '

תשובות מלאות לבחינת הבגרות במתמטיקה מועד חורף תשע"א, מיום 31/1/2011 שאלון: מוצע על ידי בית הספר לבגרות ולפסיכומטרי של אבירם פלדמן.

מבוא לאקונומטריקה א' החוג לכלכלה

פתרונות , כך שאי השוויון המבוקש הוא ברור מאליו ולכן גם קודמו תקף ובכך מוכחת המונוטוניות העולה של הסדרה הנתונה.

תורת ההסתברות 2: (או הסתברות ותהליכים סטוכסטים)

c ארזים 26 בינואר משפט ברנסייד פתירה. Cl (z) = G / Cent (z) = q b r 2 הצגות ממשיות V = V 0 R C אזי מקבלים הצגה מרוכבת G GL R (V 0 ) GL C (V )

לוגיקה ותורת הקבוצות פתרון תרגיל בית 4 אביב תשע"ו (2016)

תצפיות } n X={x 1,,x העולם.

-107- גיאומטריה זוויות מבוא מטרתנו בפרק זה היא לחזור על המושגים שנלמדו ולהעמיק את הלימוד בנושא זה.

c ארזים 15 במרץ 2017

דיאגמת פאזת ברזל פחמן

החשמלי השדה הקדמה: (אדום) הוא גוף הטעון במטען q, כאשר גוף B, נכנס אל תוך התחום בו השדה משפיע, השדה מפעיל עליו כוח.

למידה חישובית אלי דיין 1.

מתמטיקה בדידה תרגול מס' 13

משוואות רקורסיביות רקורסיה זו משוואה או אי שוויון אשר מתארת פונקציה בעזרת ערכי הפונקציה על ארגומנטים קטנים. למשל: יונתן יניב, דוד וייץ

טענה חשובה : העתקה לינארית הינה חד חד ערכית האפס ב- הוא הוקטור היחיד שמועתק לוקטור אפס של. נקבל מחד חד הערכיות כי בהכרח.

יווקיינ לש תוביציה ןוירטירק

אלקטרומגנטיות אנליטית תירגול #2 סטטיקה

מבני נתונים ואלגוריתמים תרגול #11

תרגילים בנושא משתנה דמי:

מתמטיקה בדידה תרגול מס' 5

co ארזים 3 במרץ 2016

מתכנס בהחלט אם n n=1 a. k=m. k=m a k n n שקטן מאפסילון. אם קח, ניקח את ה- N שאנחנו. sin 2n מתכנס משום ש- n=1 n. ( 1) n 1

אלגברה ליניארית 1 א' פתרון 2

brookal/logic.html לוגיקה מתמטית תרגיל אלון ברוק

אינפי - 1 תרגול בינואר 2012

Transcript:

- הסקה סטטיסטית - מושגים פרק נעסוק באכלוסיה שהתפלגותה המדויקת אינה ידועה. פרמטרים לא ידועים של ההתפלגות. מתקבלים מ"מ ב"ת ושווי התפלגות לשם כך,,..., סימון: התפלגות האכלוסיה תסומן בפרק זה המטרה לענות על שאלות שונות לגבי נעזרים במדגם מקרי שנלקח מתוך האכלוסיה. שהתפלגותם כהתפלגות האכלוסיה. כאשר θ הוא פרמטר הלא ידוע של ההתפלגות. הפרמטרים הנפוצים ביותר המעורבים בבעיות של הסקה סטטיסטית הם: µ - ממוצע האכלוסיה, - שונות האוכלוסייה, - p פרופורציית בעלי תכונה כלשהי A באכלוסיה. σ. אמידה נקודתית נרצה להעריך (לאמוד) בעזרת ערכי המדגם את ערכו של הפרמטר המבוקש שיסומן θ. אומד ל- θ הוא פונקציה כלשהי של. המטרה למצוא אומד שיהיה "קרוב" ככל,..., האפשר ל- θ האמיתי (שאינו ידוע). התורה מציעה הגדרות שונות ל"טיב" של אומד: חוסר הטיה, שגיאה ריבועית מינימלית, טכניקות שונות למציאת (ראה סוגיות,9 עמ' -.) אומד טוב: עקיבות וכו' (ראה תרגילים שיטת הנראות המקסימלית, עמ' -7,(3-4 וכן שיטת המומנטים וכו' להלן רשימת אומדים מקובלים למספר פרמטרים נפוצים במיוחד, שעומדים בקריטריונים כאלו (מאליו ברור גם שככל שנגדיל את המדגם, ישתפר טיבו של האומד): θ הפרמטר µ µידוע) ) σ ידוע) µלא )σ p=p(a) = i ( i µ ) S = ( i ) ( - מספר הפרטים מסוג A במדגם) אומד מקובל. רווחי סמך המטרה - למצוא, בעזרת המדגם, רווח (קטן ככל האפשר) שיכיל בהסתברות גבוהה ככל האפשר את הפרמטר הלא ידוע. הסתברות זו נקראת רמת הסמך ותסומן α. הרווח המתקבל נקרא רווח בר סמך ברמת סמך α, (או ברמת סמך %( α )). להלן רווחי סמך מקובלים במספר בעיות נפוצות. חישובי ההסתברות מבוססים על שימוש פשוט במשפט הגבול המרכזי (דרוש מספיק גדול). ראה סוגיה עמ'. 98

z σ, + z α α σ σ ) רווח סמך α ל- µ ידוע):. α של התפלגות נורמלית סטנדרטית. - z α ערך החלוקה ה- כאשר. z. = 96 975.. z. = 64 95. רווח סמך 95% מתקבל כאשר מציבים רווח סמך 9% מתקבל כאשר מציבים אינו ידוע והאוכלוסייה בעלת התפלגות נורמלית, ניתן להחליף את α של z α יוחלף בערך החלוקה * הערה: כאשר σ σ ב- S (ראה טבלה סעיף.). ערך החלוקה התפלגות t (התפלגות סטודנט) עם דרגות חופש, וניתן למצוא אותו בלוחות t (ראה [4] וכן [6]. ראה גם סוגיה עמ' 5.) pˆ( pˆ) pˆ( pˆ) z + α, z α רווח סמך α ל- p : כאשר מציבים בד"כ ɵp = - מספר ההצלחות ב- ניסויים בעלי הסתברות לא ידועה p להצלחה... p= ɵ / הערות: עבור: = ɵp, רמת הסמך היא מקורבת. ניתן לחלופין להציב כזה יתקבל רווח סמך פשוט יותר: + z α אבל ארוך יתר על המידה בדרך כלל. א. במקרה z α, ב. שים לב שבשני המודלים מרכז הרווח הוא האומד הנקודתי המתאים והוא מ"מ. אורך / ɵ ( =p תלוי רק ב- ו- α (ולא במדגם עצמו). ג. הרווח במודל ובמודל (כשמציבים ניתן, אם כך, לקבוע מראש את אורך הרווח הרצוי לנו, זאת ע"י שליטה בגודל המדגם... 96 כאשר מציבים / ɵ p= במודל, חצי אורך רווח סמך 95% הוא גודל זה נקרא לפעמים שגיאה מקסימלית. (זהו מינוח שגוי ומטעה.) בסקרים בישראל מקובל לקחת 5= במקרה זה הגודל המתקבל הוא בקירוב 5%. 99

ד. ניתן למצוא בספרות המקצועית רווחי סמך ל- σ רווחי סמך לפרמטרים נוספים. (תוך שימוש בהתפלגות חי בריבוע) וכן

.3 בדיקת השערות H המטרה - למצוא שיטת החלטה (מבחן סטטיסטי) המבוססת על המדגם, שתכריע בין שתי השערות חלופיות לגבי ערכי הפרמטר( םי ( הלא ידוע, כאשר: - השערת האפס, H - השערה אלטרנטיבית. מבחן סטטיסטי הוא חלוקה של כל ערכי המדגם האפשריים לאיזור דחיה - R ואיזור קבלה כך שכאשר ערכי המדגם שיילקח יפלו ב- R, ההחלטה תהיה לדחות את H וכאשר, R - המדגם ייפול ב-, R יוחלט לקבל את. H.3. הגישה הקלאסית, מבחני עוצמה מקסימלית טעות מסוג I של מבחן נגרמת כאשר על פי ערכי המדגם שהתקבל מחליטים לדחות את, H בעת שלמעשה H נכונה..( P H, P(R H ההסתברות לכך תסומן: ) (או טעות מסוג - II נגרמת כאשר על פי המדגם מחליטים לקבל את, H בעת שלמעשה H נכונה..( P H ההסתברות לכך תסומן: H). P(R (או מטרה (בלתי אפשרית להשגה) - למצוא מבחן סטטיסטי (כלומר חלוקת כל ערכי המדגם האפשריים ל- R ו- ( R שיהפוך את הסתברויות שני סוגי הטעויות למינימליות. הערה: כיוון שבדרך כלל מטפלים בבדיקת השערות מורכבות (דהיינו אחת H ו- H כוללות כל אוסף של ערכים אפשריים עבור הפרמטר θ), הרי שמדובר באוסף של הסתברויות לטעות מסוג I: ( R) לכל ;θ H ( R) לכל ובמקביל, אוסף של הסתברויות לטעות מסוג :II θ. H שאת כולם נרצה כמובן להפוך למינימליות. מטרה אלטרנטיבית - מבחן בעל עצמה מקסימלית (ע"מ) ברמת מובהקות α: א. קובעים מראש חסם α לכל ההסתברויות לטעות מסוג, I החסם יקרא רמת המובהקות. ב. מבין כל המבחנים שרמת מובהקותם אינה עולה על ההסתברויות לטעות מסוג,α הן II למקסימום את ההסתברויות המשלימות מינימליות. ( R) או בניסוח אחר, לכל.θ H מחפשים מבחן שעבורו מבחן כזה שיגדיל α, מבחן הפונקציה (θ )π נקראת פונקצית העצמה של המבחן. = Pθ לסיכום: המטרה היא למצוא מבין כל המבחנים שרמת מובהקותם אינה עולה על שעבורו העצמה π( θ) = Pθ היא מקסימלית עבור כל.θ H

דוגמה: בדיקת השערות חד צדדיות על ממוצע האכלוסיה - µ,..., מדגם בגודל ( מספיק גדול) מהתפלגות בעלת ממוצע לא ידוע µ ושונות H H : µ=µ : µ>µ ידועה.σ מבחן עצמה מקסימלית ברמת מובהקות α לבדיקת σ µ > µ + z α = > z α σ / קובע לדחות את H כאשר. R = {T > z α, T ולרשום } = σ / µ נהוג להגדיר את סטטיסטי המבחן שים לב שאם H נכונה, הרי ש- T הוא משתנה נורמלי סטנדרטי. במלים אחרות: אזור הדחייה של מבחן בעל עצמה מקסימלית ברמה α ניתן על ידי הזנב הימני בעל הסתברות α של התפלגות הסטטיסטי T תחת H (שהיא כאמור נורמלית סטנדרטית).. H :µ µ הערות: א. המבחן לעיל הוא בעל עצמה מקסימלית ברמה α גם כאשר H ב. אינה נכונה. לכן קל במקרה זה לחשב את, π( µ ) = P ( >µ + Z µ α. N( µ, σ (ראה תרגיל 5 עמ'.(6 מתפלג בקירוב נורמלית גם כאשר σ ) העצמה לכל :µ>µ ) P µ ג. כאשר תחת, מתפלג בקירוב אם σ אינו ידוע והתפלגות האוכלוסייה היא נורמלית, נהוג להחליף את ערכו של σ במכנה של הסטטיסטי T, באומד שלו S (ראה גם סעיף.). במקרה זה, תחת, H µ =T מתפלג t עם דרגות חופש (ראה סוגיה עמ' 9) ואיזור הדחייה S/ ניתן על ידי הזנב הימני בעל הסתברות α של התפלגות t בעלת דרגות חופש: µ. R= { T > t, α } = { > t, α } S / ד. באופן אנלוגי, ניתן לרשום בקלות מבחנים בעלי עצמה מקסימלית ברמת מובהקות α. H :µ< כנגד µ H :µ µ R = {T < z α } כאשר ההשערות הן איזור הדחייה המתקבל הוא כאשר σ ידוע,

R {T < t, = α ו- } כאשר σ אינו ידוע ומוחלף ב- S (ראה תרגיל 6 עמ' 6). ה. בבדיקת השערות על פרופורציה p של בעלי תכונה באכלוסיה, על סמך מדגם מספיק p. T= גדול מהאוכלוסייה, משתמשים באופן דומה בסטטיסטי p ( p ) / כמו במודל הקודם, כאשר, p=p T הוא בקירוב בעל התפלגות נורמלית סטנדרטית. אזורי הדחייה המתאימים לאלטרנטיבות החד צדדיות השונות מהווים, שוב זנב מתאים בעל הסתברות α של ההתפלגות הנורמלית סטנדרטית. (ראה סוגיה 7 עמ' ). ו. ניתן למצוא בספרות מבחנים מקובלים לרשימה ארוכה נוספת של בעיות (ראה למשל תרגילים 7,8, 9 עמ' 6-7 וסוגיות 7,6 עמ'.(.3. מובהקות תוצאת המדגם (P-value) מקובל להתבונן בתוצאה שהתקבלה בפועל במדגם ולחשב, תחת ההנחה שהשערת האפס ( H ) נכונה, את ההסתברות לקבל תוצאה "קיצונית" במדגם. הסתברות זו נקראת מובהקות התוצאה (P-value). (תוצאה "קיצונית" פרושה שהיא מתיישבת יותר עם H דוגמה: בדיקת השערות חד צדדיות על ממוצע האכלוסיה אם במדגם התקבל לפחות כמו התוצאה שהתקבלה ופחות עם. H :µ> µ. P = Pµ (.( H H : µ µ כנגד > x, = x מובהקות התוצאה היא: ).µ=µ, כלומר, הסתברות הזנב הימני המתחיל ב- של התפלגות תחת x ~ N µ,σ אזור דחייה P-value µ µ µ + z σ α x הסבר: ממוצע מדגם גבוה במיוחד יחשב כאן כתוצאה קיצונית, היות והוא צפוי יותר H תחת מאשר תחת. H כזכור, אזור הדחייה של H בדוגמה זו בנוי מערכים גבוהים של (ראה איור). אופן השימוש: 3

H ככל שמובהקות תוצאת המדגם קטנה יותר, כך פחות סביר ש- נכונה. מתחת לרמה קריטית מסוימת α של מובהקות (מקובל לחתוך ב- = 5% α), נסיק ש- H אינה נכונה. 4