Prilagodba modela podacima. Vjeºbe - Statistika Praktikum Statisti ki testovi (2)

Σχετικά έγγραφα
(Hi-kvadrat test) r (f i f ti ) 2 H = f ti. i=1

3 Populacija i uzorak

18. listopada listopada / 13

Apsolutno neprekidne raspodele Raspodele apsolutno neprekidnih sluqajnih promenljivih nazivaju se apsolutno neprekidnim raspodelama.

Matematička analiza 1 dodatni zadaci

Testiranje statističkih hipoteza Materijali za nastavu iz Statistike

3.1 Granična vrednost funkcije u tački

Funkcija gustoće neprekidne slučajne varijable ima dva bitna svojstva: 1. Nenegativnost: f(x) 0, x R, 2. Normiranost: f(x)dx = 1.

a M a A. Može se pokazati da je supremum (ako postoji) jedinstven pa uvodimo oznaku sup A.

PARCIJALNI IZVODI I DIFERENCIJALI. Sama definicija parcijalnog izvoda i diferencijala je malo teža, mi se njome ovde nećemo baviti a vi ćete je,

Riješeni zadaci: Nizovi realnih brojeva

PRAVA. Prava je u prostoru određena jednom svojom tačkom i vektorom paralelnim sa tom pravom ( vektor paralelnosti).

2 tg x ctg x 1 = =, cos 2x Zbog četvrtog kvadranta rješenje je: 2 ctg x

PISMENI ISPIT IZ STATISTIKE

ELEKTROTEHNIČKI ODJEL

(P.I.) PRETPOSTAVKA INDUKCIJE - pretpostavimo da tvrdnja vrijedi za n = k.

TRIGONOMETRIJSKE FUNKCIJE I I.1.

Iskazna logika 3. Matematička logika u računarstvu. novembar 2012

DISKRETNA MATEMATIKA - PREDAVANJE 7 - Jovanka Pantović

IspitivaƬe funkcija: 1. Oblast definisanosti funkcije (ili domen funkcije) D f

INTEGRALNI RAČUN. Teorije, metodike i povijest infinitezimalnih računa. Lucija Mijić 17. veljače 2011.

M086 LA 1 M106 GRP. Tema: Baza vektorskog prostora. Koordinatni sustav. Norma. CSB nejednakost

radni nerecenzirani materijal za predavanja R(f) = {f(x) x D}

Optimalnost u procjeni Nepristran procjenitelj minimalne varijance Cramer-Rao donja granica - ekasnost Konzistentnost. Vjeºbe - Statistika II.

Riješeni zadaci: Limes funkcije. Neprekidnost

Linearna algebra 2 prvi kolokvij,

VJEROJATNOST I STATISTIKA Popravni kolokvij - 1. rujna 2016.

4 Testiranje statističkih hipoteza

1.4 Tangenta i normala

Testiranje statisti kih hipoteza. Vjeºbe - Statistika Praktikum

IZVODI ZADACI ( IV deo) Rešenje: Najpre ćemo logaritmovati ovu jednakost sa ln ( to beše prirodni logaritam za osnovu e) a zatim ćemo

Slučajne varijable. Diskretna slučajna varijabla X je promjenjiva veličina koja poprima vrijednosti iz skupa

numeričkih deskriptivnih mera.

Teorijske osnove informatike 1

2.2 Srednje vrijednosti. aritmetička sredina, medijan, mod. Podaci (realizacije varijable X): x 1,x 2,...,x n (1)

π π ELEKTROTEHNIČKI ODJEL i) f (x) = x 3 x 2 x + 1, a = 1, b = 1;

Elementi spektralne teorije matrica

IZRAČUNAVANJE POKAZATELJA NAČINA RADA NAČINA RADA (ISKORIŠĆENOSTI KAPACITETA, STEPENA OTVORENOSTI RADNIH MESTA I NIVOA ORGANIZOVANOSTI)

Ispitivanje toka i skiciranje grafika funkcija

Strukture podataka i algoritmi 1. kolokvij 16. studenog Zadatak 1

Vjeºbe - Statistika Praktikum Statisti ki testovi (1)

Veleučilište u Rijeci Stručni studij sigurnosti na radu Akad. god. 2011/2012. Matematika. Monotonost i ekstremi. Katica Jurasić. Rijeka, 2011.

( , 2. kolokvij)

Mate Vijuga: Rijeseni zadaci iz matematike za srednju skolu

Uvod u teoriju brojeva

Numerička matematika 2. kolokvij (1. srpnja 2009.)

IZVODI ZADACI (I deo)

radni nerecenzirani materijal za predavanja

5. Karakteristične funkcije

Linearna algebra 2 prvi kolokvij,

Kontrolni zadatak (Tačka, prava, ravan, diedar, poliedar, ortogonalna projekcija), grupa A

Testiranje statistiqkih hipoteza

Osnovni primer. (Z, +,,, 0, 1) je komutativan prsten sa jedinicom: množenje je distributivno prema sabiranju

Funkcije dviju varjabli (zadaci za vježbu)

VJEROJATNOST I STATISTIKA 2. kolokvij lipnja 2016.

VJEŽBE IZ MATEMATIKE 1

Trigonometrija 2. Adicijske formule. Formule dvostrukog kuta Formule polovičnog kuta Pretvaranje sume(razlike u produkt i obrnuto

UNIVERZITET U NIŠU ELEKTRONSKI FAKULTET SIGNALI I SISTEMI. Zbirka zadataka

XI dvoqas veжbi dr Vladimir Balti. 4. Stabla

Sume kvadrata. mn = (ax + by) 2 + (ay bx) 2.

Neparametarski testovi za dva nezavisna uzorka. Boris Glišić 208/2010 Bojana Ružičić 21/2010

Cauchyjev teorem. Postoji više dokaza ovog teorema, a najjednostvniji je uz pomoć Greenove formule: dxdy. int C i Cauchy Riemannovih uvjeta.

Verovatnoća i Statistika I deo Teorija verovatnoće (zadaci) Beleške dr Bobana Marinkovića

Dvanaesti praktikum iz Analize 1

Pismeni ispit iz matematike Riješiti sistem jednačina i diskutovati rješenja sistema u zavisnosti od parametra: ( ) + 1.

9. GRANIČNA VRIJEDNOST I NEPREKIDNOST FUNKCIJE GRANIČNA VRIJEDNOST ILI LIMES FUNKCIJE

Počela biostatistike, Poslijediplomski interdisciplinarni doktorski studij Molekularne bioznanosti. Molekularne bioznanosti. Molekularne bioznanosti

Slučajne varijable Materijali za nastavu iz Statistike

Kaskadna kompenzacija SAU

Zadaci iz trigonometrije za seminar

1 Promjena baze vektora

10. domaća zadaća. 3. Neka je X neprekidna slučajna varijabla takva da je X N(0, 1). S točnošću od odredite:

Sortiranje prebrajanjem (Counting sort) i Radix Sort

Zavrxni ispit iz Matematiqke analize 1

Uvod u neparametarske testove

7 Algebarske jednadžbe

Metode procjene parametara

Više dokaza jedne poznate trigonometrijske nejednakosti u trokutu

TRIGONOMETRIJA TROKUTA

41. Jednačine koje se svode na kvadratne

Teorem 1.8 Svaki prirodan broj n > 1 moºe se prikazati kao umnoºak prostih brojeva (s jednim ili vi²e faktora).

Zadaci sa prethodnih prijemnih ispita iz matematike na Beogradskom univerzitetu

MATEMATIKA 1 8. domaća zadaća: RADIJVEKTORI. ALGEBARSKE OPERACIJE S RADIJVEKTORIMA. LINEARNA (NE)ZAVISNOST SKUPA RADIJVEKTORA.

Ĉetverokut - DOMAĆA ZADAĆA. Nakon odgledanih videa trebali biste biti u stanju samostalno riješiti sljedeće zadatke.

VJEROJATNOST popravni kolokvij veljače 2017.

APROKSIMACIJA FUNKCIJA

Matematika 1 - vježbe. 11. prosinca 2015.

VJEŽBE IZ MATEMATIKE 1

nepoznati parametar θ jednak broju θ 0, u oznaci H 0 (θ =θ 0 ), je primer proste hipoteze. Ako hipoteza nije prosta, onda je složena.

Matematika 4. t x(u)du + 4. e t u y(u)du, t e u t x(u)du + Pismeni ispit, 26. septembar e x2. 2 cos ax dx, a R.

2. Ako je funkcija f(x) parna onda se Fourierov red funkcije f(x) reducira na Fourierov kosinusni red. f(x) cos

Operacije s matricama

- pravac n je zadan s točkom T(2,0) i koeficijentom smjera k=2. (30 bodova)

ELEMENTARNA MATEMATIKA 1

Izbor statističkih testova Ana-Maria Šimundić

VJEŽBE IZ MATEMATIKE 1

RIJEŠENI ZADACI I TEORIJA IZ

SEMINAR IZ KOLEGIJA ANALITIČKA KEMIJA I. Studij Primijenjena kemija

4.7. Zadaci Formalizam diferenciranja (teorija na stranama ) 343. Znajući izvod funkcije x arctg x, odrediti izvod funkcije x arcctg x.

21. ŠKOLSKO/OPĆINSKO/GRADSKO NATJECANJE IZ GEOGRAFIJE GODINE 8. RAZRED TOČNI ODGOVORI

Transcript:

Vjeºbe - Statistika Praktikum Statisti ki testovi (2)

Prilagodba modela podacima U praksi naj e² e imamo sljede i problem: Raspolaºemo s realizacijom nekog slu ajnog uzorka i htjeli bi utvrditi iz kojeg statisti kog modela (distribucije) dolazi uzorak. Postupak se moºe podijeliti u nekoliko koraka: 1 Pretpostaviti model (distribuciju) - koriste se tehnike deskriptivne statistike (histogram, uzora ka funkcija gusto e, QQ-plot) 2 Za pretpostavljene distribucije napraviti procjenu parametara (prvi dio kolegija) 3 Analizirati kvalitetu prilagodbe - usporediti uzora ke i teorijske gusto e, histogram i teorijska gusto a... 4 Statisti kim testovima potvrditi model - testovi prilagodbe modela podacima (goodness of t tests)

χ 2 test Test prilagodbe modela podacima za diskretne i neprekidne distribucije Nulta hipoteza ( ) a1 a H 0 : X 2 a k p 1 p 2 p k Test statistika H = H 1 : ne H 0 k (N j np j ) 2 j=1 np j H0 A χ 2 (k d 1), gdje je d broj parametara koji su procjenjuju iz istog uzorka. Za neprekidne distribucije treba sliku slu ajne varijable podijeliti u disjunktne razrede Vaºno je da o ekivane frekvencije np j budu ve e ili jednake od 5 R sintaksa chisq.test(x, p=vjer)

Primjer 1. Kockar je optuºen da koristi namje²tenu kocku. Zabiljeºeni su podaci o njegovih prethodnih 60 bacanja. Utvrdite je li kockar nevin na nivou zna ajnosti 0.05. vrijednost 1 2 3 4 5 6 frekvencija 4 6 17 16 8 9

Kolmogorov-Smirnovljev test Sluºi testiranju hipoteze o distribuciji uzorka za neprekidne distribucije. Neka je (X 1,..., X n ) jednostavan slu ajan uzorak iz populacije s neprekidnom funkcijom distribucije F i neka je F 0 neka pretpostavljena neprekidna distribucija. Nedostatak KS testa je to ²to F 0 mora biti jednozna no odrežena, tj. moramo znati vrijednosti parametara. Uvr²tavanje procjenjenih vrijednosti moºe promijeniti distribuciju test statistike. Hipoteze testa H 0 : F = F 0 H 1 : F F 0 R sintaksa ks.test(podaci, "naziv funkcije distribucije", parametri)

Primjer 2. Testirajte dolaze li sljede i podaci iz uniformne razdiobe na intervalu [0, 1]. 0.07, 0, 30, 0.50, 0.54, 0.95

Testovi normalnosti Naj e² e ºelimo testirati dolaze li podaci iz normalne distribucije. Postoji veliki broj testova za testiranje normalnosti: Lillieforsova ina ica Kolmogorov-Smirnovljevog testa, Shapiro-Wilk test, JarqueBera test, D'Agostinov test, AndersonDarling test, Cramervon Mises test... Svaki ima svojih prednosti i nedostataka. Koristit emo Shapiro-Wilk test normalnosti R sintaksa shapiro.test(x)

Primjer 3. U R bazi podataka ChickWeight nalaze se podaci o teºinama pili a mjerenima po danima od njihova roženja. Promotrimo samo teºine pili a starih to no 18 dana. Testirajte je li teºina normalno distribuirana na razini zna ajnosti 0.05.

Zadaci Zadatak 1. Trºi²ni analiti ar ºeli istraºiti imaju li potro²a i neke posebne sklonosti prema jednom od okusa sokova koji su se pojavili na trºi²tu. Na uzorku od 100 ljudi prikupio je preferencije prema ponuženim okusima. Frekvencije su dane u sljede oj tablici: vi²nja jagoda naran a limun grejp 32 28 16 14 10 Ispitajte postoji li na nivou zna ajnosti α = 0.05 statisti ki zna ajna preferencija potro²a a prema nekom od okusa ili je sklonost potro²a a jednaka prema svim ponuženim okusima.

Zadatak 2. Jedna je studija na osnovu istraºivanja o razlozima povratka na posao ljudi koji su umirovljeni postavila sljede u distribuciju: 38% se ponovo zaposli u drugom poduze u 32% osnuje obrt 23% rade kao konzultanti 7% osnuje vlastito poduze e Poklapaju li se sljede i rezultati, dobiveni ponovnim istraºivanjem, s prethodno postavljenom tezom ili moºemo utvrditi postojanje statisti ki zna ajne razlike? (α = 0.05) 122 se ponovo zaposli u drugom poduze u 85 osnuje obrt 76 rade kao konzultanti 17 osnuje vlastito poduze e

Zadatak 3. Tri nov i a se bacaju 250 puta i broji se broj pisama koji su pali. Dobiveni su sljede i podaci: broj pisama 0 1 2 3 frekvencija 24 108 95 23 Provjerite jesu li nov i i simetri ni na razini zna ajnosti 0.05.

Zadatak 4. U datoteci zarulje.txt nalaze se podaci o ºivotnom vijeku 100 ºarulja. Gra ki pokaºite da bi duljina trajanja mogla biti eksponencijalno distribuirana a zatim testirajte hipotezu da podaci dolaze iz eksponencijalne distribucije s parametrom 0.005.

Zadatak 5. Promatramo prvu zna ajnu znamenku u nekim brojevima, tj. prvu znamenku razli itu od 0. Vjerojatnost slu ajno odabrane znamenke od 1 do 9 je 1/9. To vrijedi za podatke generirane random funkcijama. Mežutim, kod podataka koji se pojavljuju u prirodi distribucija nije uniformna ve vrijedi tzv. Benfordov zakon. Benfordov zakon kaºe da vjerojatnost da prva zna ajna znamenka nekog broja iz prirode bude jednaka d, d = 1,... 9, nije 1/9 ve je dana izrazom log 10 (d + 1) log 10 (d). Primjerice, iz neke 52 zikalne konstante dobivene su frekvencije prve zna ajne znamenke d 1 2 3 4 5 6 7 8 9 frekvencije 17 11 3 5 5 4 3 1 3 Testirajte Benfordov zakon na nivou zna ajnosti 0.05. Testirajte Benfordov zakon za prvih 1000 Fibonaccijevih brojeva na nivou zna ajnosti 0.05.

Zadatak 6. U datoteci cvrstoca.txt nalaze se mjerenja vrsto e eli ne ºice. Na razini zna ajnosti 0.05 testirajte hipotezu da su podaci normalno distribuirani. Na razini zna ajnosti 0.05 testirajte hipotezu da podaci dolaze iz N (300, 289) distribucije.

Vježbe 6. prilagodba modela podacima Chi^2 test Primjer Nulta hipoteza je da je kockar nevin, tj. kocka je simetrična 1 2 3 4 5 6 H0: X ~ ( ) 1/6 1/6 1/6 1/6 1/6 1/6 H1: ne H0 Očigledno je da dani uzorak favorizira neke vrijednosti kocke. Pitanje je, da li je to samo zbog slučajnosti, ili tu ima nešto više od same slučajnosti. Sintaksa chisq.test(x,p=vjer) x je vektor frekvencija koje su zadane u zadatku. vjer je vektor vjerojatnosti pretpostavljene distribucije x <- c(4,6,17,16,8,9) vjer <- rep(1/6,6) ili vjer <- c(1/6,1/6,1/6,1/6,1/6,1/6) x vjer chisq.test(x,p=vjer) p vrijednost< 0.05 => odbacujemo H0 na nivou značajnosti 0.05. Kockar koristi namještenu kocku. Kolmogorov- Smirnovljev test Primjer Hipoteze testa H0: X ima U([0,1]) razdiobu H1: ne H0 R funkcija ks.test prvi argument su podaci, drugi argument je string koji daje naziv odgovarajuće funkcije distribucije u R-u, zatim se navode parametri te distribucije kao kod primjerice računanja vrijednosti funkcije distribucije u nekoj točki, podaci <- c(0.07,0.3,0.51,0.54,0.95) ks.test(podaci, "punif", 0, 1) 1

p vrij > 0.05, pa ne odbacujemo H0. Nema razloga tvrditi da ne dolaze iz U[0,1], na nivou značajnosti 0.05 Testovi normalnosti Primjer Hipoteze testa H0: X ima normalnu razdiobu H1: X nema normalnu razdiobu jedini argument shapiro.test() funkcije je vektor podataka str(chickweight) x <- ChickWeight$weight[ChickWeight$Time==18] x shapiro.test(x) p vrijednost < 0.05 => ne odbacujemo H0. Nema dokaza da X nema normalnu distribuciju. ZADACI Zadatak 1. Označimo okuse redom s 1,2,3,4,5. Treba testirati ima li obilježje uniformnu distribuciju ili ne, tj. 1 2 3 4 5 H0: X ~ ( ) 1/5 1/5 1/5 1/5 1/5 H1: ne H0 x <- c(32,18,16,14,10) vjer <- rep(1/5,5) ili jednostavno vjer <- c(1/5,1/5,1/5,1/5,1/5) chisq.test(x,p=vjer) p<0.05, odbacujemo H0 na nivou značajnosti 0.05. Postoji sklonost prema nekim okusima. Zadatak 2. 2

Označimo sve moguće ishode redom s 1,2,3,4. Treba testirati ima li obilježje sljedeću distribuciju 1 2 3 4 H0: X ~ ( ) 0.38 0.32 0.23 0.07 H1: ne H0 x <- c(122,85,76,17) vjer <- c(0.38,0.32,0.23,0.07) chisq.test(x,p=vjer) p>0.05, ne odbacujemo H0 na nivou značajnosti 0.05. Nema razloga tvrditi da prva teza nije u skladu s novim istraživanjem. Zadatak 3. Svaki od 250 puta, bacamo novčić 3 puta. Sl. var. koja broji broj pisama imat će binomnu razdiobu. Ako su novčići simetrični tada će to biti binomna B(1/2,3) razdioba. P(X=0)=1*(1/2)^0*(1/2)^(3-0)=1/8 P(X=1)=3*(1/2)^1*(1/2)^(3-1)=3/8 Treba testirati ima li obilježje sljedeću distribuciju 0 1 2 3 H0: X ~ ( ) 1/8 3/8 3/8 1/8 H1: ne H0 x <- c(24,108,95,23) vjer <- c(1/8,3/8,3/8,1/8) chisq.test(x,p=vjer) p>0.05, ne odbacujemo H0 na nivou značajnosti 0.05. Nema razloga da su novčići neispravni. Zadatak 4. Prvo ćemo grafičkim metodama vidjeti kako izgleda distribucija zarulje <- read.table("zarulje.txt", header=true) str(zarulje) x <- zarulje$x plot(density(x),col="red",ylim=c(0,0.005)) curve(dexp(x,0.005),col="blue",add=t) hist(x,col="red",probability=true) curve(dexp(x,0.005),col="blue",add=t) Hipoteze testa H0: X ima E(0.005) razdiobu H1: ne H0 3

ks.test(x,"pexp",0.005) p>0.05 pa ne odbacujemo H0. Nema dokaza da nema E(0.005) razdiobu. Zadatak 5. Vjerojatnosti Benfordove distribucije dane su s vjer <- log10(1:9+1)-log10(1:9) vjer plot(vjer,type="b") Dakle, u prirodi najčešće je 1 prva značajna znamenka, i pada do 9 Hipoteze: H0: X ima Benfordovu distribuciju H1: X nema Benfordovu distribuciju x <- c(17,11,3,5,5,4,3,1,3) chisq.test(x,p=vjer) p>0.05 => ne odbacujemo H0. Nema razloga tvrditi da se razlikuje od Benfordove distribucije Warning koji dobijemo je zato jer su očekivane frekvencije manje od 5 chisq.test(x,p=vjer)$expected Trebalo bi grupirati razrede, npr. 8 i 9, onda 6 i 7, onda 4 i 5 Onda će frekvencije biti x <- c(17,11,3,10,7,4) Sad su vjerojatnosti vjer1 <- c(vjer[1:3], vjer[4]+vjer[5],vjer[6]+vjer[7],vjer[8]+vjer[9]) chisq.test(x,p=vjer1) Sad nema Warninga jer su očekivane frekvencije veće od 5 chisq.test(x,p=vjer1)$expected Za Fibonaccijeve brojeve fib <- function(n){ niz <- c(0,1) for(i in 3:n){ niz <- c(niz, niz[i-1]+niz[i-2]) } return(niz) } x <- fib(1000) x <- as.numeric(substring(formatc(x, format = 'e'), 1, 1)) frek <- tabulate(x, nbins = 9) frek chisq.test(frek, p=vjer) p>0.05 => sigurno ne odbacujemo H0, nema nikakvog dokaza da nema Benfordovu distribuciju 4

Zadatak 6. Prvo ćemo grafičkim metodama vidjeti kako izgleda distribucija cvrstoca <- read.table("cvrstoca.txt", header=true) str(cvrstoca) x <- cvrstoca$x Hipoteze testa H0: X ima normalnu razdiobu H1: X nema normalnu razdiobu Ovdje ništa ne govorimo o parametrima, samo je bitno da li je normalna ili ne, s bilo kojim parametrima To je Shapiro-Wilk test shapiro.test(x) p>0.05, ne odbacujemo H0,nema razloga tvrditi da nije normalno distribuirano Hipoteze testa H0: X ima N(300,289) razdiobu H1: X nema N(300,289) razdiobu Sad točno testiramo jednu distribuciju koja je jednoznačno određena svojim parametrima. U tom slučaju koristimo KS test. plot(density(x),col="red") curve(dnorm(x,300,sqrt(289)),col="blue",add=t) ks.test(x,"pnorm",300,sqrt(289)) p>0.05 pa ne odbacujemo H0. Nema dokaza da nema N(300,289) razdiobu. 5