Параметарски и непараметарски тестови

Σχετικά έγγραφα
Tестирање хипотеза. 5.час. 30. март Боjана Тодић Статистички софтвер март / 10

Прост случаjан узорак (Simple Random Sampling)

Нелинеарни регресиони модели и линеаризациjа

Логистичка регресиjа

η πιθανότητα επιτυχίας. Επομένως, η συνάρτηση πιθανοφάνειας είναι ίση με: ( ) 32 = p 18 1 p

Монте Карло Интеграциjа

Μενύχτα, Πιπερίγκου, Σαββάτης. ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 5 ο

НЕПАРАМЕТАРСКИ ТЕСТОВИ. Илија Иванов Невена Маркус

Μαντζούνη, Πιπερίγκου, Χατζή. ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 5 ο

Тестирање статистичких хипотеза. Методичка упутства и варијанте домаћих задатака

ο),,),--,ο< $ι ιι!η ι ηι ι ιι ιι t (t-test): ι ι η ι ι. $ι ι η ι ι ι 2 x s ι ι η η ιη ι η η SE x

Επιστηµονική Επιµέλεια ρ. Γεώργιος Μενεξές. Εργαστήριο Γεωργίας. Viola adorata

Први корак у дефинисању случајне променљиве је. дефинисање и исписивање свих могућих eлементарних догађаја.

7. Модели расподела случајних променљивих ПРОМЕНЉИВИХ

Για να ελέγξουµε αν η κατανοµή µιας µεταβλητής είναι συµβατή µε την κανονική εφαρµόζουµε το test Kolmogorov-Smirnov.

налазе се у диелектрику, релативне диелектричне константе ε r = 2, на међусобном растојању 2 a ( a =1cm

СИСТЕМ ЛИНЕАРНИХ ЈЕДНАЧИНА С ДВЕ НЕПОЗНАТЕ

1.2. Сличност троуглова

Δείγμα (μεγάλο) από οποιαδήποτε κατανομή

= p 20 1 p p Το σημείο στο οποίο μηδενίζεται η παραπάνω μερική παράγωγος είναι

Упутство за избор домаћих задатака

1 Неодрђеност и информациjа

ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΧΡΗΣΗ SPSS

Теорија електричних кола

I део ТЕОРИЈА ВЕРОВАТНОЋЕ Глава 1

АКАДЕМСКЕ ДОКТОРСКЕ СТУДИЈЕ - МЕДИЦИНСКЕ НАУКЕ

b) Израз за угиб дате плоче, ако се користи само први члан реда усвојеног решења, је:

Ασκήσεις Εξετάσεων. Μεταπτυχιακό Πρόγραμμα Σπουδών στη. Διοίκηση των Επιχειρήσεων

Теорија електричних кола

7. ЈЕДНОСТАВНИЈЕ КВАДРАТНЕ ДИОФАНТОВE ЈЕДНАЧИНЕ

МАТРИЧНА АНАЛИЗА КОНСТРУКЦИЈА

1. Hasil Pengukuran Kadar TNF-α. DATA PENGAMATAN ABSORBANSI STANDAR TNF α PADA PANJANG GELOMBANG 450 nm

г) страница aa и пречник 2RR описаног круга правилног шестоугла јесте рац. бр. јесу самерљиве

Αν οι προϋποθέσεις αυτές δεν ισχύουν, τότε ανατρέχουµε σε µη παραµετρικό τεστ.

2. Наставни колоквијум Задаци за вежбање ОЈЛЕРОВА МЕТОДА

Екстремне статистике поретка и примjене у неживотном осигурању

Предмет: Задатак 4: Слика 1.0

ΠΕΡΙΕΧΟΜΕΝΑ 1 ΕΙΣΑΓΩΓΗ ΤΟ PASW ΜΕ ΜΙΑ ΜΑΤΙΑ ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ: Η ΜΕΣΗ ΤΙΜΗ ΚΑΙ Η ΔΙΑΜΕΣΟΣ... 29

Biostatistics for Health Sciences Review Sheet

Висока техничка школа струковних студија Београд Математика 2 Интервали поверења и линеарна регресија предавач: др Мићо Милетић

ПОГЛАВЉЕ 3: РАСПОДЕЛА РЕЗУЛТАТА МЕРЕЊА

Теорија одлучивања. Анализа ризика

Κλωνάρης Στάθης. ΠΜΣ: Οργάνωση & Διοίκηση Επιχειρήσεων Τροφίμων και Γεωργίας

ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ. Δρ. Βασίλης Π. Αγγελίδης Τμήμα Μηχανικών Παραγωγής & Διοίκησης Δημοκρίτειο Πανεπιστήμιο Θράκης

4. ЗАКОН ВЕЛИКИХ БРОЈЕВА

FORMULAS FOR STATISTICS 1

Примена статистике у кинематографији

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ. Κεφάλαιο 13. Συμπεράσματα για τη σύγκριση δύο πληθυσμών

Έλεγχος για τις παραμέτρους θέσης δύο πληθυσμών με ανεξάρτητα δείγματα

PENGARUHKEPEMIMPINANINSTRUKSIONAL KEPALASEKOLAHDAN MOTIVASI BERPRESTASI GURU TERHADAP KINERJA MENGAJAR GURU SD NEGERI DI KOTA SUKABUMI

ВЕЛИЧИНА ЕФЕКТА СТАТИСТИЧКИХ ТЕСТОВА У АГРОЕКОНОМСКИМ ИСТРАЖИВАЊИМА

ИНТЕГРИСАНЕ АКАДЕМСКЕ СТУДИЈЕ ФАРМАЦИЈЕ

предмет МЕХАНИКА 1 Студијски програми ИНДУСТРИЈСКО ИНЖЕЊЕРСТВО ДРУМСКИ САОБРАЋАЈ II ПРЕДАВАЊЕ УСЛОВИ РАВНОТЕЖЕ СИСТЕМА СУЧЕЉНИХ СИЛА

1. Функција интензитета отказа и век трајања система

Хомогена диференцијална једначина је она која може да се напише у облику: = t( x)

Положај сваке тачке кружне плоче је одређен са поларним координатама r и ϕ.

ЛИНЕАРНА ФУНКЦИЈА. k, k 0), осна и централна симетрија и сл. 2, x 0. У претходном примеру неке функције су линеарне а неке то нису.

ΚΟΙΝΩΝΙΟΒΙΟΛΟΓΙΑ, ΝΕΥΡΟΕΠΙΣΤΗΜΕΣ ΚΑΙ ΕΚΠΑΙΔΕΥΣΗ

ТРАПЕЗ РЕГИОНАЛНИ ЦЕНТАР ИЗ ПРИРОДНИХ И ТЕХНИЧКИХ НАУКА У ВРАЊУ. Аутор :Петар Спасић, ученик 8. разреда ОШ 8. Октобар, Власотинце

Βοήθημα Εξετάσεων. Μεταπτυχιακό Πρόγραμμα Σπουδών στη Διοίκηση των Επιχειρήσεων

Примена статистике у медицини

Анализа Петријевих мрежа

Статистичко истраживање у новинарству

6.2. Симетрала дужи. Примена

Решења задатака са првог колоквиjума из Математике 1Б II група задатака

МЕДИЦИНСКА СТАТИСТИКА И ИНФОРМАТИКА

5.2. Имплицитни облик линеарне функције

Средња вредност популације (m), односно независно промењљиве t чија је густина расподеле (СЛИКА ) дата функцијом f(t) одређена је изразом:

τατιστική στην Εκπαίδευση II

Република Србија МИНИСТАРСТВО ПРОСВЕТЕ И НАУКЕ ЗАВОД ЗА ВРЕДНОВАЊЕ КВАЛИТЕТА ОБРАЗОВАЊА И ВАСПИТАЊА

Универзитет у Београду. Математички факултет. Мастер рад. Тема: Геометријски случајни процеси

Repeated measures Επαναληπτικές μετρήσεις

Μη Παραμετρικοί Έλεγχοι & Η Δοκιμασία Χ 2

Република Србија МИНИСТАРСТВО ПРОСВЕТЕ, НАУКЕ И ТЕХНОЛОШКОГ РАЗВОЈА ЗАВОД ЗА ВРЕДНОВАЊЕ КВАЛИТЕТА ОБРАЗОВАЊА И ВАСПИТАЊА

ΕΚΠΑΙΔΕΥΤΙΚΗ ΤΕΧΝΟΛΟΓΙΑ ΚΑΙ ΑΝΑΠΤΥΞΗ ΑΝΘΡΩΠΙΝΩΝ ΠΟΡΩΝ

Потрошачки трендови и социјално стање у друштву

Могућност примене статистике у породилишту

1. Ιστόγραμμα. Προκειμένου να αλλάξουμε το εύρος των bins κάνουμε διπλό κλικ οπουδήποτε στο ιστόγραμμα και μετά

Неки нелинеарни модели временских серија и њихова примена

ПОВРШИНа ЧЕТВОРОУГЛОВА И ТРОУГЛОВА

Република Србија МИНИСТАРСТВО ПРОСВЕТЕ И НАУКЕ ЗАВОД ЗА ВРЕДНОВАЊЕ КВАЛИТЕТА ОБРАЗОВАЊА И ВАСПИТАЊА

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΕΡΓΑΣΤΗΡΙΟ (SPSS)

Στατιστική Συµπερασµατολογία

Количина топлоте и топлотна равнотежа

Τίτλος Μαθήματος: Στατιστική Ανάλυση Δεδομένων

( ) ( ) STAT 5031 Statistical Methods for Quality Improvement. Homework n = 8; x = 127 psi; σ = 2 psi (a) µ 0 = 125; α = 0.

6.1. Осна симетрија у равни. Симетричност двеју фигура у односу на праву. Осна симетрија фигуре

Έλεγχος ότι η παράμετρος θέσης ενός πληθυσμού είναι ίση με δοθείσα γνωστή τιμή. μεγέθους n από έναν πληθυσμό με μέση τιμή μ

APPENDICES APPENDIX A. STATISTICAL TABLES AND CHARTS 651 APPENDIX B. BIBLIOGRAPHY 677 APPENDIX C. ANSWERS TO SELECTED EXERCISES 679

ОБЛАСТИ: 1) Тачка 2) Права 3) Криве другог реда

Η ΣΤΑΤΙΣΤΙΚΗ ΣΤΟ ΕΡΓΑΣΤΗΡΙΟ ΣΠΕΡΜΑΤΟΣ

6.5 Површина круга и његових делова

Конструкциjе Адамарових матрица

2. EЛЕМЕНТАРНЕ ДИОФАНТОВЕ ЈЕДНАЧИНЕ

Основе теорије вероватноће

РЕШЕЊА ЗАДАТАКА - IV РАЗЕД 1. Мањи број: : x,

Ваљак. cm, а површина осног пресека 180 cm. 252π, 540π,... ТРЕБА ЗНАТИ: ВАЉАК P=2B + M V= B H B= r 2 p M=2rp H Pосн.пресека = 2r H ЗАДАЦИ:

Статистичка анализа територијалног распореда врста библиотека на територији Републике Србије

ΠΕΡΙΓΡΑΦΙΚΗ και ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

Transcript:

Параметарски и непараметарски тестови 6.час 12. април 2016. Боjана Тодић Статистички софтвер 4 12. април 2016. 1 / 25

Поступци коjима се применом статистичких метода утврђуjе да ли се, на основу узорка може, и са коjом вероватноћом прихватити претпоставка о конкретноj броjчаноj вредности неког параметра су тестирања статистичких хипотеза. Ови тестови могу бити параметарски и непараметарски. Свака претпоставка (хипотеза) о непознатом параметру расподеле назива се параметарска хипотеза, а поступак њеног потврђивања или одбиjања на основу узорка jе параметарски тест. Статистикакоjе се користи у том поступку jе тест статистика. Хипотезе о расподели обележjа коjе се не односе на параметре, већ на саму расподелу обележjа су непараметарски тестови или тестови сагласности (обележjа са расподелом). Боjана Тодић Статистички софтвер 4 12. април 2016. 2 / 25

Основни поjмови нулта и алтернативна хипотеза просте и сложене хипотезе критична област праг значаjности грешке првог и другог реда Боjана Тодић Статистички софтвер 4 12. април 2016. 3 / 25

Параметарски тестови Боjана Тодић Статистички софтвер 4 12. април 2016. 4 / 25

Тестирање хипотеза о математичком очекивању Тестирамо хипотезе: Тест статистика jе t = X µ 0 s n tn 1, при H 0. Услови коjи треба да буду испуњени да би се применио тест: зависна променљива jе непрекидна независност података зависна променљива треба да има нормалну расподелу Боjана Тодић Статистички софтвер 4 12. април 2016. 5 / 25

Тестирање хипотеза о математичком очекивању > daily.intake <- c(5260,5470,5640,6180,6390,6515,6805,7515,7515,8230,8770) > mean(daily.intake) [1] 6753.636 > sd(daily.intake) [1] 1142.123 > quantile(daily.intake) 0% 25% 50% 75% 100% 5260 5910 6515 7515 8770 > t.test(daily.intake,mu=7725) One Sample t-test data: daily.intake t = -2.8208, df = 10, p-value = 0.01814 alternative hypothesis: true mean is not equal to 7725 95 percent confidence interval: 5986.348 7520.925 sample estimates: mean of x 6753.636 Боjана Тодић Статистички софтвер 4 12. април 2016. 6 / 25

Тестирање хипотеза о дисперзиjи Тестирамо хипотезе: Тест статистика jе (n 1)Sx σ 2 χ 2 n 1, при H 0. Услови коjи треба да буду испуњени да би се применио тест: зависна променљива jе непрекидна независност података зависна променљива треба да има нормалну расподелу Боjана Тодић Статистички софтвер 4 12. април 2016. 7 / 25

Тестирање хипотеза о дисперзиjи > install.packages( EnvStats ) > library(envstats) > vartest(daily.intake,sigma.squared = 1500000) Results of Hypothesis Test -------------------------- Null Hypothesis: variance = 1500000 Alternative Hypothesis: True variance is not equal to 1500000 Test Name: Chi-Squared Test on Variance Estimated Parameter(s): variance = 1304445 Data: daily.intake Test Statistic: Chi-Squared = 8.696303 Test Statistic Parameter: df = 10 P-value: 0.8777049 95% Confidence Interval: LCL = 636837.5 UCL = 4017420.4 Боjана Тодић Статистички софтвер 4 12. април 2016. 8 / 25

Тестирање хипотеза о jеднакости математичких очекивања Тестирамо хипотезе: Тест статистика jе Услови коjи треба да буду испуњени да би се применио тест: зависна променљива jе непрекидна опсервациjе су међусобно независне узорци из популациjе са нормалном расподелом Боjана Тодић Статистички софтвер 4 12. април 2016. 9 / 25

Тестирање хипотеза о jеднакости математичких очекивања > a <- c(175, 168, 168, 190, 156, 181, 182, 175, 174, 179) > b <- c(185, 169, 173, 173, 188, 186, 175, 174, 179, 180) > t.test(a,b) Results of Hypothesis Test -------------------------- Null Hypothesis: difference in means = 0 Alternative Hypothesis: True difference in means is not equal to 0 Test Name: Welch Two Sample t-test Estimated Parameter(s): mean of x = 174.8 mean of y = 178.2 Data: a and b Test Statistic: t = -0.947373 Test Statistic Parameter: df = 15.98123 P-value: 0.3575549 95% Confidence Interval: LCL = -11.008795 UCL = 4.208795 Боjана Тодић Статистички софтвер 4 12. април 2016. 10 / 25

paired t test Користи се када су два мерења из исте експерименталне jединице. > attach(intake) > t.test(pre, post, paired=t) Results of Hypothesis Test -------------------------- Null Hypothesis: difference in means = 0 Alternative Hypothesis: True difference in means is not equal to 0 Test Name: Paired t-test Estimated Parameter(s): mean of the differences = 1320.455 Data: pre and post Test Statistic: t = 11.94139 Test Statistic Parameter: df = 10 P-value: 3.059021e-07 95% Confidence Interval: LCL = 1074.072 UCL = 1566.838 > t.test(pre, post) ПОГРЕШНО Results of Hypothesis Test -------------------------- Null Hypothesis: difference in means = 0 Alternative Hypothesis: True difference in means is not equal to 0 Test Name: Welch Two Sample t-test Estimated Parameter(s): mean of x = 6753.636 mean of y = 5433.182 Data: pre and post Test Statistic: t = 2.624202 Test Statistic Parameter: df = 19.92024 P-value: 0.01628603 95% Confidence Interval: LCL = 270.5633 UCL = 2370.3458 Боjана Тодић Статистички софтвер 4 12. април 2016. 11 / 25

Тестирање хипотеза о jеднакости дисперзиjа Тестирамо хипотезe: Тест статистика jе Услови коjи треба да буду испуњени да би се применио тест: зависна променљива jе непрекидна опсервациjе су међусобно независне узорци из популациjе са нормалном расподелом Боjана Тодић Статистички софтвер 4 12. април 2016. 12 / 25

Тестирање хипотеза о jеднакости дисперзиjа > var.test(a,b) Results of Hypothesis Test -------------------------- Null Hypothesis: ratio of variances = 1 Alternative Hypothesis: True ratio of variances is not equal to 1 Test Name: F test to compare two variances Estimated Parameter(s): ratio of variances = 2.102784 Data: a and b Test Statistic: F = 2.102784 Test Statistic Parameters: num df = 9 denom df = 9 P-value: 0.2834255 95% Confidence Interval: LCL = 0.5223017 UCL = 8.4657950 Боjана Тодић Статистички софтвер 4 12. април 2016. 13 / 25

Непараметарски тестови тестови независности тестови нормалности тестови случаjности Боjана Тодић Статистички софтвер 4 12. април 2016. 14 / 25

χ 2 тест независности Тест статистика jе: > library(mass) > tbl = table(survey$smoke, survey$exer) > tbl # tablica kontingencije Freq None Some Heavy 7 1 3 Never 87 18 84 Occas 12 3 4 Regul 9 1 7 > chisq.test(tbl) Pearson s Chi-squared test data: tbl X-squared = 5.4885, df = 6, p-value = 0.4828 Боjана Тодић Статистички софтвер 4 12. април 2016. 15 / 25

Mann-Whitney-Wilcoxon и Kruskal-Wallis тестови Тестови независности узорака коjи не користе претпоставку да су узорци из нормалне расподеле. > wilcox.test(mpg am, data=mtcars) Wilcoxon rank sum test with continuity correction data: mpg by am W = 42, p-value = 0.001871 alternative hypothesis: true location shift is not equal to 0 > attach(airquality) > kruskal.test(ozone Month, data = airquality) Kruskal-Wallis rank sum test data: Ozone by Month Kruskal-Wallis chi-squared = 29.2666, df = 4, p-value = 6.901e-06 Боjана Тодић Статистички софтвер 4 12. април 2016. 16 / 25

Шапиро-Вилк тест Тест статистика jе: где jе x (i) i- та статистика поретка, тj. i-ти по величини реализована вредност обележjа у узорку. Константе a i се добиjаjу помоћу jеднакости: при чему m 1, m 2,..., m n представљаjу oчекиване вредности независних и jеднако расподељених статистика поретка. Неопходно jе да ове случаjне променљивих имаjу стандардизовану нормалну расподелу. Параметар V представља ковариjациону матрицу ових статистика поретка. Нулта хипотеза се одбиjа ако jе тест статистика W мања од унапред одређеног прага значаjности. Боjана Тодић Статистички софтвер 4 12. април 2016. 17 / 25

Шапиро-Вилк тест > a<-rnorm(100,mean = 5,sd = 3) > shapiro.test(a) Shapiro-Wilk normality test data: a W = 0.9856, p-value = 0.3507 > b <- rt(n = 100,4) > shapiro.test(b) Shapiro-Wilk normality test data: b W = 0.6868, p-value = 2.683e-13 Боjана Тодић Статистички софтвер 4 12. април 2016. 18 / 25

Шапиро-Франциа тест Шапиро и Франциа су за апроксимациjу тест статитиске W претпостављали да су за велике узорке статитстике поретка независне. где jе a = m T / m t m. Дакле, W представља квадрат Пирсоновог коефициjента корелациjе између x и a. Видимо да Шапиро-Франциа тест за тестирање хипотезе о нормалности, изискуjе само познавање очекиваних вредности статистика поретка m i. > library(nortest) > sf.test(a) Shapiro-Francia normality test data: a W = 0.9838, p-value = 0.2227 Боjана Тодић Статистички софтвер 4 12. април 2016. 19 / 25

Тестирање случаjних низова Немогуће jе дефинитивно утврдити случаjност низова, али их можемо подвргнути неким статистичким тестовима. Ако прођу већину тих тестова, повећава се шанса случаjности датих низова, односно знамо да jе генератор коjи их jе генерисао бољи. Тo су тестови случаjности. Уколико низови не прођу тест случаjности (или више њих), онда се неки параметри могу променити или треба да користимо друге случаjне податке коjи ће задовољавати дате услове и проћи тест. Тестирање случаjности низа броjева обухвата: постављање хипотезе о некоj особини случаjне променљиве, утврђивање потребног и довољног интервала поверења и проверу хипотезе. Хипотезе дефинишемо на следећи начин: H 0 низ броjева jесте случаjан H 1 низ броjева ниjе случаjан У зависности од резултата и унапред задатог интервал поверења хипотеза се прихвата или одбацуjе. Боjана Тодић Статистички софтвер 4 12. април 2016. 20 / 25

Тест тачака заокрета Тест статистика jе: Y n = Y 1 + Y 2 +... + Y n 1, где jе Y j = 1 ако jе (X j 1 < X j X j > X j+1 ) или (X j 1 > X j X j < X j+1 ), иначе Y j = 0. За велики обим узорка (n > 50) тест статистика Z n има приближно стандардну нормалну расподелу, где jе Zn = Z n 2(n 2) 3. 16n 29 90 Боjана Тодић Статистички софтвер 4 12. април 2016. 21 / 25

Тест тачака раста Тест статистика jе: R n = Y 1 + Y 2 +... + Y n, где jе Y j = 1 ако jе (X j 1 < X j ), Y j = 0 ако jе (X j 1 X j ). R n jе статистика коjа представља броjач тачака раста. Погодност статистике R n jе брза конвергенциjа ка нормалноj расподели (n > 12). Боjана Тодић Статистички софтвер 4 12. април 2016. 22 / 25

Тест разлика рангова Тест статистика jе: Z n = Y 1 + Y 2 +... + Y n 1, где jе Y j = R j+1 R j, а(r 1,..., R n 1 ) jе низ рангова низа случаjних броjева (X 1,..., X n ). Z n има приближно стандардну нормалну расподелу, где jе Z n = Z n (n 1)(n+1) 3 (n 2)(n+1)(4n 7) 90. Боjана Тодић Статистички софтвер 4 12. април 2016. 23 / 25

Бартелсов тест Тест статистика jе: B n = 12Z n n(n 1), где jе Z n = Y 1 +Y 2 +...+Y n 1,а сада немамо више збир разлика рангова, већ збир квадрата разлика рангова: Y j = R j+1 R j 2, где jе (R 1, R 2,.., R n 1 ) низ рангова случаjних броjева (X 1, X 2,..., X n ). B n има приближно стандардну нормалну расподелу, где jе Bn = B n 2. 4 n Боjана Тодић Статистички софтвер 4 12. април 2016. 24 / 25

Тестови случаjности у R-у > library(randtests) > turning.point.test(a) Turning Point Test data: a statistic = 1.5957, n = 100, p-value = 0.1106 alternative hypothesis: non randomness > bartels.rank.test(a) Bartels Ratio Test data: a statistic = 1.2812, n = 100, p-value = 0.2001 alternative hypothesis: nonrandomness Боjана Тодић Статистички софтвер 4 12. април 2016. 25 / 25