همبستگی و رگرسیون در این مبحث هدف بررسی وجود یک رابطه بین دو یا چند متغیر می باشد لذا هدف اصلی این است که آیا بین

Σχετικά έγγραφα
محاسبه ی برآیند بردارها به روش تحلیلی

روش محاسبه ی توان منابع جریان و منابع ولتاژ

فصل دهم: همبستگی و رگرسیون

آزمون مقایسه میانگین های دو جامعه )نمونه های بزرگ(

تصاویر استریوگرافی.

تخمین با معیار مربع خطا: حالت صفر: X: مکان هواپیما بدون مشاهده X را تخمین بزنیم. بهترین تخمین مقداری است که متوسط مربع خطا مینیمم باشد:

مثال( مساله الپالس در ناحیه داده شده را حل کنید. u(x,0)=f(x) f(x) حل: به کمک جداسازی متغیرها: ثابت = k. u(x,y)=x(x)y(y) X"Y=-XY" X" X" kx = 0

مفاهیم ولتاژ افت ولتاژ و اختالف پتانسیل

تحلیل مدار به روش جریان حلقه

قاعده زنجیره ای برای مشتقات جزي ی (حالت اول) :

شاخصهای پراکندگی دامنهی تغییرات:

مسائل. 2 = (20)2 (1.96) 2 (5) 2 = 61.5 بنابراین اندازه ی نمونه الزم باید حداقل 62=n باشد.

مدار معادل تونن و نورتن

تمرینات درس ریاض عموم ٢. r(t) = (a cos t, b sin t), ٠ t ٢π. cos ٢ t sin tdt = ka۴. x = ١ ka ۴. m ٣ = ٢a. κds باشد. حاصل x٢

جلسه ی ۱۰: الگوریتم مرتب سازی سریع

آزمایش 8: تقویت کننده عملیاتی 2


جلسه 3 ابتدا نکته اي در مورد عمل توابع بر روي ماتریس ها گفته می شود و در ادامه ي این جلسه اصول مکانیک کوانتمی بیان. d 1. i=0. i=0. λ 2 i v i v i.

هندسه تحلیلی بردارها در فضای R

1) { } 6) {, } {{, }} 2) {{ }} 7 ) { } 3) { } { } 8) { } 4) {{, }} 9) { } { }

دانشکده ی علوم ریاضی جلسه ی ۵: چند مثال

سايت ويژه رياضيات درسنامه ها و جزوه هاي دروس رياضيات

آزمایش 1: پاسخ فرکانسی تقویتکننده امیتر مشترك

فعالیت = ) ( )10 6 ( 8 = )-4( 3 * )-5( 3 = ) ( ) ( )-36( = m n m+ m n. m m m. m n mn

دبیرستان غیر دولتی موحد

آموزش SPSS مقدماتی و پیشرفته مدیریت آمار و فناوری اطالعات -

فصل چهارم : مولتی ویبراتورهای ترانزیستوری مقدمه: فیدبک مثبت

Angle Resolved Photoemission Spectroscopy (ARPES)

جلسه ی ۲۴: ماشین تورینگ

ﯽﺳﻮﻃ ﺮﯿﺼﻧ ﻪﺟاﻮﺧ ﯽﺘﻌﻨﺻ هﺎﮕﺸﻧاد

جلسه 9 1 مدل جعبه-سیاه یا جستاري. 2 الگوریتم جستجوي Grover 1.2 مسا له 2.2 مقدمات محاسبات کوانتمی (22671) ترم بهار

ویرایشسال 95 شیمیمعدنی تقارن رضافالحتی

جلسه ی ۳: نزدیک ترین زوج نقاط

جلسه 14 را نیز تعریف کرد. عملگري که به دنبال آن هستیم باید ماتریس چگالی مربوط به یک توزیع را به ماتریس چگالی مربوط به توزیع حاشیه اي آن ببرد.

تئوری جامع ماشین بخش سوم جهت سادگی بحث یک ماشین سنکرون دو قطبی از نوع قطب برجسته مطالعه میشود.

بسم اهلل الرحمن الرحیم آزمایشگاه فیزیک )2( shimiomd

تحلیل الگوریتم پیدا کردن ماکزیمم

فصل پنجم زبان های فارغ از متن

هو الحق دانشکده ي مهندسی کامپیوتر جلسه هفتم

جلسه 15 1 اثر و اثر جزي ی نظریه ي اطلاعات کوانتومی 1 ترم پاي یز جدایی پذیر باشد یعنی:

تلفات خط انتقال ابررسی یک شبکة قدرت با 2 به شبکة شکل زیر توجه کنید. ژنراتور فرضیات شبکه: میباشد. تلفات خط انتقال با مربع توان انتقالی متناسب

جلسه ی ۴: تحلیل مجانبی الگوریتم ها

Beta Coefficient نویسنده : محمد حق وردی

جلسه 2 جهت تعریف یک فضاي برداري نیازمند یک میدان 2 هستیم. یک میدان مجموعه اي از اعداد یا اسکالر ها به همراه اعمال

دانشکده علوم ریاضی دانشگاه گیلان آزمون پایان ترم درس: هندسه منیفلد 1 باشد. دهید.f (gx) = (gof 1 )f X شده باشند سوالات بخش میان ترم

معادلهی مشخصه(کمکی) آن است. در اینجا سه وضعیت متفاوت برای ریشههای معادله مشخصه رخ میدهد:

1 دایره فصل او ل کاربردهای بسیاری داشته است. یک قضیۀ بنیادی در هندسه موسوم با محیط ثابت دایره دارای بیشترین مساحت است. این موضوع در طراحی

باشند و c عددی ثابت باشد آنگاه تابع های زیر نیز در a پیوسته اند. به شرطی که g(a) 0 f g

جلسه 12 به صورت دنباله اي از,0 1 نمایش داده شده اند در حین محاسبه ممکن است با خطا مواجه شده و یکی از بیت هاي آن. p 1

فصل 5 :اصل گسترش و اعداد فازی

تبدیل ها هندسه سوم دبیرستان ( D با یک و تنها یک عضو از مجموعه Rست که در آن هر عضو مجموعه نگاشت از Dبه R تناظری بین مجموعه های D و Rمتناظر باشد.

جلسه ی ۵: حل روابط بازگشتی

خالصه درس: نویسنده:مینا سلیمان گندمی و هاجر کشاورز امید ریاضی شرطی. استقالل متغیر های تصادفی پیوسته x و y استقالل و امید ریاضی

تئوری رفتار مصرف کننده : می گیریم. فرض اول: فرض دوم: فرض سوم: فرض چهارم: برای بیان تئوری رفتار مصرف کننده ابتدا چهار فرض زیر را در نظر

فهرست جزوه ی فصل دوم مدارهای الکتریکی ( بردارها(

تحلیل آماری جلسه اول )جمعه مورخه 1131/70/11(

فهرست مطالب جزوه ی فصل اول مدارهای الکتریکی مفاهیم ولتاژ افت ولتاژ و اختالف پتانسیل تحلیل مدار به روش جریان حلقه... 22

:موس لصف یسدنه یاه لکش رد یلوط طباور

بررسی اثر تبلیغات رسانه ای بر جذب مشتری بانک ها )مطالعه موردی: بانک صادرات شهرستان نیشابور(

تمرین اول درس کامپایلر

جلسه 2 1 فضاي برداري محاسبات کوانتمی (22671) ترم بهار

4 آمار استنباطی 2 برآورد 1 فصل چهارم: آمار استنباطی

فصل سوم جریان های الکتریکی و مدارهای جریان مستقیم جریان الکتریکی

هدف از این آزمایش آشنایی با رفتار فرکانسی مدارهاي مرتبه اول نحوه تأثیر مقادیر عناصر در این رفتار مشاهده پاسخ دامنه

سلسله مزاتب سبان مقدمه فصل : زبان های فارغ از متن زبان های منظم

نویسنده: محمدرضا تیموری محمد نصری مدرس: دکتر پرورش خالصۀ موضوع درس سیستم های مینیمم فاز: به نام خدا

جلسه 22 1 نامساویهایی در مورد اثر ماتریس ها تي وري اطلاعات کوانتومی ترم پاییز

فصل دوم مثلثات نسبت های مثلثاتی دایره مثلثاتی روابط بین نسبتهای مثلثاتی

جلسه 16 نظریه اطلاعات کوانتمی 1 ترم پاییز

کارگاه آموزشی پاییز 1395 تحلیلهای آماری و تجزیه و تحلیل طرح و آزمایشات در نرم افزار SPSS دکتر مرتضی زنگنه. (M. ZANGANEH, 1395)

ندرک درگ ندرک درگ شور

برابری کار نیروی برآیند و تغییرات انرژی جنبشی( را بدست آورید. ماتریس ممان اینرسی s I A

مینامند یا میگویند α یک صفر تابع

به نام خدا. الف( توضیح دهید چرا از این تکنیک استفاده میشود چرا تحلیل را روی کل سیگنال x[n] انجام نمیدهیم

آموزش شناسایی خودهمبستگی در دادههای سری زمانی و نحوه رفع آن در نرم افزار EViews

اصول انتخاب موتور با مفاهیم بسیار ساده شروع و با نکات کاربردی به پایان می رسد که این خود به درک و همراهی خواننده کمک بسیاری می کند.

فصل چهارم تعیین موقعیت و امتدادهای مبنا

بسم هللا الرحمن الرحیم

هد ف های هفته ششم: 1- اجسام متحرک و ساکن را از هم تشخیص دهد. 2- اندازه مسافت و جا به جایی اجسام متحرک را محاسبه و آن ها را مقایسه کند 3- تندی متوسط

مود لصف یسدنه یاه لیدبت

SanatiSharif.ir مقطع مخروطی: دایره: از دوران خط متقاطع d با L حول آن یک مخروط نامحدود بدست میآید که سطح مقطع آن با یک

Spacecraft thermal control handbook. Space mission analysis and design. Cubesat, Thermal control system

3 لصف یربج یاه ترابع و ایوگ یاه ناوت

راهنمای کاربری موتور بنزینی )سیکل اتو(

سینماتیک مستقیم و وارون

فیلتر کالمن Kalman Filter

تعیین محل قرار گیری رله ها در شبکه های سلولی چندگانه تقسیم کد

Delaunay Triangulations محیا بهلولی پاییز 93

ثابت. Clausius - Clapeyran 1

یدنب هشوخ یاه متیروگلا

جلسه ی ۱۸: درهم سازی سرتاسری - درخت جست و جوی دودویی

نظریه زبان ها و ماشین ها

تمرین صفحه 91 تمرین صفحه 95 1 میزان رضایت مشتریان بانک از نحوه برخورد و رسیدگی به درخواست های آنها

چکیده مقدمه کلید واژه ها:

CD = AB, BC = ٢DA, BCD = ٣٠ الاضلاع است.

Nonparametric Shewhart-Type Signed-Rank Control Chart with Variable Sampling Interval

محاسبات کوانتمی 1 علم ساخت و استفاده از کامپیوتري است که بر پایه ي اصول مکانیک کوانتم قرار گرفته است.

هندسه تحلیلی و جبر خطی ( خط و صفحه )

Top Down Parsing LL(1) Narges S. Bathaeian

به نام خدا. Sparse Coding ستاره فرامرزپور

Transcript:

همبستگی و رگرسیون در این مبحث هدف بررسی وجود یک رابطه بین دو یا چند متغیر می باشد لذا هدف اصلی این است که آیا بین دو صفت متغیر x و y رابطه و همبستگی وجود دارد یا خیر و آیا می توان یک مدل ریاضی و یک رابطه رگرسیون ساده بین x و y پیدا نمود به طوریکه با معلوم بودن مقدار متغیر x مقدار متغیر y را برآورد نمود توجه: در آزمون رگرسیون بر اساس نتایج مشاهده شده در نمونه در مورد رابطه بین دو متغیر نتیجه گیری خواهیم کرد. اگر کل یک جامعه را مشاهده کنیم خط رگرسیونی که بدست می آورید صحیح و خط رگرسیون جامعه است اما از آنجایی که تنها نمونه ای از جامعه را مشاهده می کنید نمی دانید مه مقدار صحیح شیب و عرض از مبدا چقدر است لذا مقدار آن را از روی نمونه تخمین می زنیم. توجه: آزمون رگرسیون برای متغیر های اسمی معنا ندارد همچنین باید این فرض صحیح باشد که رابطه متغیرها خطی است. تعریف متغیر مستقل: متغیری که توسط آزمایشگر کنترل می شود و با x نشان می دهیم آن را متغیر مستقل می نامیم.

تعریف متغیر وابسته: متغیری که مقدار آن به x بستگی دارد و با y نشان می دهیم و آن را متغیر اثر یا متغیر پاسخ می نامیم. فرض های مسئله: -مشاهدات باید مستقل باشند. -برای تمام مقادیر متغیر مستقل توزیع مقادیر متغیر وابسته باید نرمال باشد. -واریانس متغیر وابسته باید برای تمام مقادیر متغیر مستقل یکسان باشد. -رابطه بین متغیر مستقل و وابسته در جامعه باید خطی باشد. ضریب همبستگی: ضریب همبستگی شاخصی است که درجه همبستگی بین دو متغیر را به صورت عددی نشان می دهد و به این صورت تحلیل همبستگی به سهولت و روشنی بیشتری امکان پذیر می شود. توجه: برای محاسبه ضریب همبستگی چند روش وجود دارد که هر کدام دارای کاربرد خاصی است که معروفترین آن ها عبارت است از: - ضریب همبستگی خطی پیرسون: میزان ارتباط خطی دو متغیر کمی را می دهد. ضریب همبستگی خطی اسپیرمن: از این ضریب برای تعیین میزان ارتباط بین متغیرهای رتبه ای - استفاده می شود.) از توزیع متغیر های کمی نرمال نباشد نیز از این ضریب استفاده می شود.( 3- ضریب همبستگی کندال: میزان ارتباط بین متغیر های رتبه ای و اسمی را می دهد.

ضریب همبستگی پیرسون: هرگاه بدانیم که بین دو متغیر رابطه خطی وجود دارد و داده های مربوط به هر یک از متغیرها به صورت نرمال توزیع شده باشد ضریب همبستگی خطی پیرسون را با استفاده از فرمول زیر محاسبه می کنیم. r = n (xy) ( x)( y) [n (x ) ( x) ][n (y ) ( y) ] مثال: نمرات آزمون آمار و ریاضیات هفت دانشجو به شرح زیر می باشد برای این نمرات ضریب همبستگی پیرسون را محاسبه کنید و در سطح خطای 5/50 وجود همبستگی خطی بین دو متغیر را بیابید. X دانشجو X X A 5 B 0 C 0 D 7 5 E 9 F 0 G مجموع 3

تفسیر ضریب همبستگی پیرسون: مقدار r بین - و تغییر می کند. اگر -=r باشد به معنای همبستگی کامل منفی بین دو متغیر است. اگر 0=r باشد به معنای عدم وجود همبستگی بین دو متغیر است. اگر =r باشد به معنای همبستگی کامل مثبت بین دو متغیر است. اگر ضریب همبستگی به دست آمده غیر از - و 5 و + باشد باید به روش زیر فرض آزمایی کنیم. - - - - y x توجه: ضریب همبستگی مثبت منظور اینکه بین دو متغیر همبستگی وجود دارد و با افزایش نیز افزایش پیدا می کند و برعکس. y و همینطور ضریب همبستگی منفی منظور اینکه بین دو متغیر همبستگی وجود دارد و با افزایش x پیدا می کند و برعکس. کاهش تذکر : ضریب همبستگی می تواند بود و نبود و شدت ارتباط بین دو متغیر را نشان دهد لیکن مقادیر جز -=r +=r, 0=r, را نمی توان به صورت معنی دار تفسیر کرد. مثال برای 0/8=r و 0/=r نمی توان گفت ارتباط r دو متغیر مزبور در بررسی اول چهار برابر شدیدتر از بررسی دوم است مگر آنکه )ضریب تعیین ) را مبنای مقایسه قرار دهیم. ضریب تعیین: ضریب تعیین شدت ارتباط بین دو متغیر را مشخص می کند در حقیقت قدرت پیشگویی یک خط با ضریب تعیین مشخص می شود که هر چه به یک یا 55 نزدیکتر باشد مطمئن تر است. 4

مثال: اگر 0/8=r باشد آن گاه 0/64= r است که این بدان معنی است که ) 5/ درصد(از تغییرات yرا توسط تغییرات x می توان توضیح داد. تذکر: وجود همبستگی شدید بین دو متغیر الزاما بدان معنی نیست که بین این دو متغیر رابطه علیت ( علت و معلولی ) وجود دارد. استفاده از جدول t استیودنت: ابتدا فرضیه های آماری را به شرح زیر تشکیل می دهیم: H 0 : ρ = 0 ; H : ρ 0 توجه: فرض صفر " بین متغیر x و متغیر y همبستگی وجود ندارد." فرض می کنیم که )x,y( متغیر تصادفی دو بعدی با توزیع دومتغیر نرمال باشد آماره t را به صورت زیر محاسبه t = r n r df=n- نقطه بحرانی t را به دست می آوریم اگر آماره آزمون در می کنیم. اکنون از جدول t در سطح α و با درجه آزادی ناحیه بحرانی قرار بگیرد فرضیه رد می شود) H0 اگر آماره آزمون در ناحیه بحرانی قرار نگیرد فرضیه ( α t > t (یعنی در سطح α همبستگی وجود دارد و,n ) H0 رد نمی شود یعنی بین x و y همبستگی وجود ندارد. 5

همبستگی رتبه ای اسپیرمن: اگر محقق بتواند بپذیرد که در جامعه ای که نمونه ها از آن انتخاب شده اند داده ها دارای توزیع نرمال هستند می تواند از ضریب همبستگی پیرسون استفاده کند همراه خواهد بود. وگرنه ضریب همبستگی پیرسون با اشتباه و گمراه کننده در چنین مواردی باید ضریب همبستگی رتبه ای اسپیرمن را محاسبه و تفسیر نمود زیرا در محاسبه این ضریب همبستگی به جای مقادیر واقعی داده ها رتبه هر داده در مقایسه با داده های دیگر به کار می رود. به عبارت دیگر داده ها را به ترتیب غیر صعودی مرتب کرده به بزرگترین داده رتبه به داده بالفاصله بعد آن رتبه و... و باالخره به کوچکترین داده باالترین رتبه نسبت می دهیم. فرمول محاسبه ضریب رتبه ای اسپیرمن: ζ = 4 d n(n ) که در آن d تفاوت بین رتبه هر دو زوج مرتب و n تعداد زوج های مرتب است. مثال: نمرات آزمون های زبان انگلیسی و ادبیات فارسی یک گروه از دانشجویان دانشکده ای به شرح زیر است همبستگی رتبه ای اسپیرمن را محاسبه کنید. A دانشجو B C D E F G 5 نمره زبان انگلیسی 5 0 5 نمره ادبیات فارسی 0 5 0 0 6

حل: رتبه نمره ادبیاتy رتبه نمره زبانx نمره ادبیات نمره زبان X دانشجو d=x-y d A 0 0 3/5 /0 /0 B 8 5 0 C - D 4 0 7-3 E 4 5 7 3 9 F 0 5 3/0-5/0 5/0 G 5 6 ζ = 6 (84 5 ) 7(7 ) = 0/5 تفسیر ضریب همبستگی رتبه ای اسپیرمن: تفسیر ضریب همبستگی رتبه ای اسپیرمن با استفاده از جدول مقادیر بحرانی ζ صورت می گیرد. ابتدا فرضیه های آماری را به شرح زیر تشکیل می دهیم: H 0 : ζ = 0 ; H : ζ 0 توجه: فرض صفر " بین رتبه های مربوط به متغیر x و متغیر y همبستگی وجود ندارد." 7

df=n- نقطه بحرانی ζ را به دست می آوریم اگر آماره آزمون اکنون از جدول ζ در سطح α و با درجه آزادی α در ناحیه بحرانی قرار بگیرد فرضیه H0 رد می شود) در سطح (یعنی همبستگی وجود ζ > ζ ( α,n ) دارد و اگر آماره آزمون در ناحیه بحرانی قرار نگیرد فرضیه H0 رد نمی شود یعنی بین رتبه های x و y همبستگی وجود ندارد.)جدول مقادیر ζ برای آزمون معنی دار بودن فرض صفر دو دنباله تهیه شده است یعنی در محاسبات عملی نیازی به تقسیم α بر عدد نیست( رگرسیون: اگر بین دو متغیر X و همبستگی وجود داشته باشد می توان یکی از این دو متغیر را بر حسب دیگری برآورد کرد این عمل محتوای مبحث رگرسیون است. خط رگرسیون ما را به پیش بینی ویژگی های آنچه که در نمونه ما موجود نیست قادر ی سازد. = a + bx معادله خط رگرسیون عبارت است از: که در آن b ضریب رگرسیون نامیده می شود و از روابط زیر به دست می آیند. b = n (xy) ( x)( y) y b x n (x ) ( x) ; a = n توجه: اگر زوج هی مرتب که برای محاسبه خط رگرسیون داریم را روی صفحه مشخص کنیم می بینیم که بی نهایت خط می توان رسم کرد اما بهترین خط ها آنهایی هستند که کمترین فاصله را با نقاط داشته باشند منظور اینکه زمانی که فاصله بین خطوط و نقاط را بدست بیاوریم این فاصله کمترین باشد بهترین خط آن است که مجموع مربعات فاصله نقاط از خط کمترین شود که پس از محاسبات فرمول های باال حاصل می شوند. 8

تمرین : برای 0 زوج مشاهده های زیراز جامعه ای نرمال وجود ارتباط بین دو متغیر را یررسی کرده و معادله خط رگرسیون را در صورت وجود بیابید. X 0 3 5 5 - تمرین : برای زوج مشاهده های زیراز جامعه ای نرمال وجود ارتباط بین دو متغیر را یررسی کرده و معادله خط رگرسیون را در صورت وجود بیابید. X 0 3 3 3 5 0 3 تمرین 3: تعداد دقایقی که 5 دانش آموز صرف مطالعه یک صفحه کتاب در صبح و عصر می کنند به ترتیب با x و y در جدول زیر نشان داده شده است ضریب همبستگی اسپیرمن را بیابید و آنرا تفسیر کنید. X 5 0 3 7 0 5 3 3 9 7 9 تمرین 4 : جدول زیر یک نمونه تصادفی 5 تایی از نمرات درس آمار که به صورت تستی و تشریحی گرفته شده است را نشان می دهد وجود ارتباط بین دو متغیر را در سطح خطای 0 درصد بررسی و معادله خط رگرسیون را بیابید و بررسی کنید اگر نمره تستی فردی 9 باشد نمره تشریحی این فرد چند خواهد بود. X )تستی( 39 3 07 7 70 3 0 )تشریحی( 0 7 0 9 9 73 9 0 70 9