Testiranje statističkih hipoteza Materijali za nastavu iz Statistike

Σχετικά έγγραφα
(Hi-kvadrat test) r (f i f ti ) 2 H = f ti. i=1

PISMENI ISPIT IZ STATISTIKE

4 Testiranje statističkih hipoteza

Testiranje statistiqkih hipoteza

3 Populacija i uzorak

(P.I.) PRETPOSTAVKA INDUKCIJE - pretpostavimo da tvrdnja vrijedi za n = k.

18. listopada listopada / 13

Slučajne varijable Materijali za nastavu iz Statistike

Operacije s matricama

ELEKTROTEHNIČKI ODJEL

VJEROJATNOST I STATISTIKA 2. kolokvij lipnja 2016.

9. TESTIRANJE HIPOTEZA O PARAMETRU. Josipa Perkov, prof., pred. 1

nepoznati parametar θ jednak broju θ 0, u oznaci H 0 (θ =θ 0 ), je primer proste hipoteze. Ako hipoteza nije prosta, onda je složena.

Iskazna logika 3. Matematička logika u računarstvu. novembar 2012

Slučajne varijable. Diskretna slučajna varijabla X je promjenjiva veličina koja poprima vrijednosti iz skupa

Verovatnoća i Statistika I deo Teorija verovatnoće (zadaci) Beleške dr Bobana Marinkovića

numeričkih deskriptivnih mera.

13. TESTIRANJE HIPOTEZE O NEPOZNATIM KARAKTERISTIKAMA POPULACIJE

M086 LA 1 M106 GRP. Tema: Baza vektorskog prostora. Koordinatni sustav. Norma. CSB nejednakost

radni nerecenzirani materijal za predavanja R(f) = {f(x) x D}

a M a A. Može se pokazati da je supremum (ako postoji) jedinstven pa uvodimo oznaku sup A.

Apsolutno neprekidne raspodele Raspodele apsolutno neprekidnih sluqajnih promenljivih nazivaju se apsolutno neprekidnim raspodelama.

INTEGRALNI RAČUN. Teorije, metodike i povijest infinitezimalnih računa. Lucija Mijić 17. veljače 2011.

Statistička obrada podataka

Počela biostatistike, Poslijediplomski interdisciplinarni doktorski studij Molekularne bioznanosti. Molekularne bioznanosti. Molekularne bioznanosti

Uvod u neparametarske testove

2.2 Srednje vrijednosti. aritmetička sredina, medijan, mod. Podaci (realizacije varijable X): x 1,x 2,...,x n (1)

1.4 Tangenta i normala

VJEROJATNOST I STATISTIKA Popravni kolokvij - 1. rujna 2016.

Definicija: Hipoteza predstavlja pretpostavku koja je zasnovana na određenim činjenicama (najčešće naučnim ili iskustvenim).

Neparametarski testovi za dva nezavisna uzorka. Boris Glišić 208/2010 Bojana Ružičić 21/2010

STATISTIKA S M E I M N I AR R 7 : METODE UZORKA

Linearna algebra 2 prvi kolokvij,

Osnovni primer. (Z, +,,, 0, 1) je komutativan prsten sa jedinicom: množenje je distributivno prema sabiranju

7 Algebarske jednadžbe

Funkcije dviju varjabli (zadaci za vježbu)

Izbor statističkih testova Ana-Maria Šimundić

DISKRETNA MATEMATIKA - PREDAVANJE 7 - Jovanka Pantović

SVEUČILIŠTE U RIJECI GRAĐEVINSKI FAKULTET U RIJECI. Specijalistički diplomski stručni studij

Osnove teorije uzoraka

Str

3.1 Granična vrednost funkcije u tački

Strukture podataka i algoritmi 1. kolokvij 16. studenog Zadatak 1

Funkcija gustoće neprekidne slučajne varijable ima dva bitna svojstva: 1. Nenegativnost: f(x) 0, x R, 2. Normiranost: f(x)dx = 1.

Teorijske osnove informatike 1

Riješeni zadaci: Nizovi realnih brojeva

Riješeni zadaci: Limes funkcije. Neprekidnost

2 tg x ctg x 1 = =, cos 2x Zbog četvrtog kvadranta rješenje je: 2 ctg x

Vjeºbe - Statistika Praktikum Statisti ki testovi (1)

Postoji nekoliko statidtičkih testova koji koriste t raspodelu, koji se jednim imenom zovu t-testovi.

Statističko zaključivanje jedna varijabla

10. domaća zadaća. 3. Neka je X neprekidna slučajna varijabla takva da je X N(0, 1). S točnošću od odredite:

Zaključivanje o jednakosti distribucija temeljeno na dva uzorka

UNIVERZITET U NIŠU ELEKTRONSKI FAKULTET SIGNALI I SISTEMI. Zbirka zadataka

5. Karakteristične funkcije

Matematička analiza 1 dodatni zadaci

PRAVA. Prava je u prostoru određena jednom svojom tačkom i vektorom paralelnim sa tom pravom ( vektor paralelnosti).

Numerička matematika 2. kolokvij (1. srpnja 2009.)

Prilagodba modela podacima. Vjeºbe - Statistika Praktikum Statisti ki testovi (2)

Elementi spektralne teorije matrica

VJEROJATNOST popravni kolokvij veljače 2017.

X. Testiranje hipoteza. Osnovni koncepti testiranja hipoteza TESTIRANJE HIPOTEZA OSNOVNI KONCEPTI I TESTOVI POVEZANOSTI 19/11/15

TRIGONOMETRIJSKE FUNKCIJE I I.1.

PRIMJER 3. MATLAB filtdemo

21. ŠKOLSKO/OPĆINSKO/GRADSKO NATJECANJE IZ GEOGRAFIJE GODINE 8. RAZRED TOČNI ODGOVORI

Analiza varijanse sa jednim Posmatra se samo jedna promenljiva

π π ELEKTROTEHNIČKI ODJEL i) f (x) = x 3 x 2 x + 1, a = 1, b = 1;

BILJEŠKE ZA PREDAVANJA (za internu uporabu)

Neka su A i B skupovi. Kažemo da je A podskup od B i pišemo A B ako je svaki element skupa A ujedno i element skupa B. Simbolima to zapisujemo:

Ĉetverokut - DOMAĆA ZADAĆA. Nakon odgledanih videa trebali biste biti u stanju samostalno riješiti sljedeće zadatke.

RIJEŠENI ZADACI I TEORIJA IZ

2. Ako je funkcija f(x) parna onda se Fourierov red funkcije f(x) reducira na Fourierov kosinusni red. f(x) cos

Linearna algebra 2 prvi kolokvij,

( , 2. kolokvij)

Mate Vijuga: Rijeseni zadaci iz matematike za srednju skolu

Klasifikacija blizu Kelerovih mnogostrukosti. konstantne holomorfne sekcione krivine. Kelerove. mnogostrukosti. blizu Kelerove.

IZRAČUNAVANJE POKAZATELJA NAČINA RADA NAČINA RADA (ISKORIŠĆENOSTI KAPACITETA, STEPENA OTVORENOSTI RADNIH MESTA I NIVOA ORGANIZOVANOSTI)

MATRICE I DETERMINANTE - formule i zadaci - (Matrice i determinante) 1 / 15

TESTIRANJE ZNAČAJNOSTI RAZLIKE

Veleučilište u Rijeci Stručni studij sigurnosti na radu Akad. god. 2011/2012. Matematika. Monotonost i ekstremi. Katica Jurasić. Rijeka, 2011.

Neka je a 3 x 3 + a 2 x 2 + a 1 x + a 0 = 0 algebarska jednadžba trećeg stupnja. Rješavanje ove jednadžbe sastoji se od nekoliko koraka.

Ispitivanje toka i skiciranje grafika funkcija

Testiranje statisti kih hipoteza. Vjeºbe - Statistika Praktikum

Kaskadna kompenzacija SAU

Slučajni procesi Prvi kolokvij travnja 2015.

Dijagonalizacija operatora

Uvod u neparametrijske testove. Usporedba. Neparametrijske inačice t-testa za dva nezavisna uzorka. dr. sc. Goran Kardum

Zadaci sa prethodnih prijemnih ispita iz matematike na Beogradskom univerzitetu

Zadaci iz Osnova matematike

Sume kvadrata. mn = (ax + by) 2 + (ay bx) 2.

radni nerecenzirani materijal za predavanja

STATISTIKA. KONCEPTI : POPULACIJA i UZORAK. Primjer: svi glasači, samo neki glasači

PARCIJALNI IZVODI I DIFERENCIJALI. Sama definicija parcijalnog izvoda i diferencijala je malo teža, mi se njome ovde nećemo baviti a vi ćete je,

XI dvoqas veжbi dr Vladimir Balti. 4. Stabla

IZVODI ZADACI ( IV deo) Rešenje: Najpre ćemo logaritmovati ovu jednakost sa ln ( to beše prirodni logaritam za osnovu e) a zatim ćemo

IspitivaƬe funkcija: 1. Oblast definisanosti funkcije (ili domen funkcije) D f

Pismeni ispit iz matematike GRUPA A 1. Napisati u trigonometrijskom i eksponencijalnom obliku kompleksni broj, zatim naći 4 z.

41. Jednačine koje se svode na kvadratne

SISTEMI NELINEARNIH JEDNAČINA

6 Polinomi Funkcija p : R R zadana formulom

Transcript:

Testiranje statističkih hipoteza Materijali za nastavu iz Statistike Kristina Krulić Himmelreich i Ksenija Smoljak 2012/13 1 / 39

Uvod Osnovna zadaća Statistike je na temelju uzorka ocijeniti kakvu razdiobu ima promatrano (populacijsko) statističko obilježje X. svaka pretpostavka koja se odnosi na tu razdiobu je (statistička) hipoteza provjera istinitosti te hipoteze je testiranje (statistički test) hipotezu koju testiramo zovemo nulta hipoteza ili nul-hipoteza i obilježavamo s H 0 alternativnu hipotezu obilježavamo s H 1 2 / 39

Uvod Vrste statističkih testova: parametarski - testiramo hipotezu koja se odnosi na parametar pretpostavljene razdiobe neparametarski - testiramo hipotezu koja se odnosi na tip pretpostavljene razdiobe Hipoteza je: jednostavna ako jednoznačno odreduje razdiobu statističkog obilježja X složena ako jednoznačno ne odreduje razdiobu statističkog obilježja X 3 / 39

Uvod Na temelju uzorka trebamo donijeti odluku o prihvaćanju ili odbacivanju nulte hipoteze. Niti jedan statistički zaključak o populaciji na bazi uzorka nije stopostotno siguran, tako i prihvaćnje neke hipoteze na temelju uzorka ne znači da je ta hipoteza točna. Umjesto hipotezu prihvaćamo ispravnije je reći na osnovi uzorka ne postoji razlog za odbacivanje hipoteze. 4 / 39

Uvod Prilikom donošenja odluke o istinitosti hipoteze postoje dvije vrste mogućih pogrešaka : pogreška 1. vrste: odbacili smo nultu hipotezu ako je ona istinita pogreška 2. vrste: prihvatili smo nultu hipotezu ako je ona neistinita. Moguće situacije su prikazane tablicom: prihvaćamo H 0 odbacujemo H 0 H 0 je točna pogreška 1. vrste H 0 je netočna pogreška 2. vrste 5 / 39

Uvod Vjerojatnosti tih pogrešaka označavamo s: α = P(pogreška 1. vrste)= P(odbacujemo H 0 H 0 točna) i β = P(pogreška 2. vrste)= P(prihvaćamo H 0 H 0 netočna). Sljedeća tablica prikazuje vjerojatnosti mogućih situacija H 0 je točna H 0 je netočna prihvaćamo H 0 1 α β odbacujemo H 0 α 1 β α je nivo signifikantnosti ili razina značajnosti, a 1-β=P(odbacujemo H 0 H 0 netočna) snaga testa. 6 / 39

Uvod Za testiranje hipoteze treba: (1) Definirati H 0 i H 1 ; (2) Definirati test-statistiku na osnovi čijih vrijednosti se donose odluke; (3) Za zadanu razinu značajnosti α odrediti kritično područje - skup svih mogućih vrijednosti test-statistike za koje se odbacuje nulta hipoteza u korist alternativne; (4) Ispitati da li se vrijednost test-statistike izračunate iz uzorka nalazi u kritičnom področju; (5) Zaključiti: Ako je izračunata vrijednost test-statistike u kritičnom podruǰu hipoteza H 0 se odbacuje u korist alternativne hipoteze H 1. U suprotnom se H 0 prihvaća, tj. na osnovi uzorka hipotezu ne možemo odbaciti. 7 / 39

Testovi o parametrima normalne razdiobe N (µ, σ 2 ) Neka je θ nepoznati parametar o kojemu ovisi pretpostavljena razdioba. Ako je nulta hipoteza H 0 : θ = θ 0 (U pravilu, za nul-hipoteze se uzimaju jednostavne hipoteze.), tada su moguće alternativne hipoteze : (i) H 1 : θ θ 0, (ii) H 1 : θ > θ 0, (iii) H 1 : θ < θ 0, Nulta hipoteza H 0 : µ = µ 0, σ 2 poznato: Test statistika Alternativna hipoteza Kritično područje H 1 : µ µ 0 C 0 =, z α ] [z α, 2 2 Z = X µ σ n Z N (0, 1) H 1 : µ > µ 0 C 0 = [z α, H 1 : µ < µ 0 C 0 =, z α ] 8 / 39

Parametarski testovi Nulta hipoteza H 0 : µ = µ 0, σ 2 nije poznato: Test statistika Alternativna hipoteza Kritično područje H 1 : µ µ 0 C 0 =, t α ] [t α, 2 2 T = X µ S n T t(n 1) H 1 : µ > µ 0 C 0 = [t α, H 1 : µ < µ 0 C 0 =, t α ] 9 / 39

Zadaci Zadatak Promatramo obilježje X koje ima normalnu razdiobu N(µ, 100). Na slučajan način odabran je uzorak od 105 elemenata. Uz razinu značajnosti α = 0.01 testirajte hipotezu H 0 : µ 0 = 30 prema hipotezi H 1 : µ 1 = 38. 10 / 39

Zadaci Zadatak Prema standardima prosječan broj nedostataka po 1m 2 tkanine ne smije biti veći od 5. Na slučajan način odabrano je 100m 2 tkanine i na njima izbrojan broj nedostataka. Dobiveni su rezultati: broj nedostataka 1 2 3 4 5 6 7 8 9 10 broj m 2 tkanine 15 12 15 22 15 8 5 3 3 2 Ako znamo da broj nedostataka na tkanini ima normalnu razdiobu s varijancom jednakom 4, uz razinu značajnosti α = 0.01 testirajte hipotezu da ova vrsta tkanine zadovoljava uvjete standarda. 11 / 39

Zadaci Zadatak Proizvodač tvrdi da je dimenzija serijski radenog proizvoda 35mm. Mjerenjem 20 slučajno odabranih proizvoda dobiveni su rezultati: dimenzija (mm) 34.8 34.9 35.0 35.1 35.3 broj proizvoda 2 3 4 6 5 Uz razinu značajnosti α = 0.05 testirajte hipotezu H 0 : µ = 35 uz alternativnu hipotezu H 1 : µ 35 (pretpostavljamo da promatrana dimenzija ima normalnu razdiobu te je varijanca nepoznata). 12 / 39

Zadaci Zadatak Tvornica tvrdi da je prosječan vijek trajanja proizvoda iz te tvornice 21.5 sati. Na slučajnom uzorku od 6 proizvoda iz te tvornice laboratorijskim mjerenjima vijeka trajanja dobivene su vrijednosti od 19, 18, 22, 20, 16, 25 sati. S razinom značajosti α = 0.05, testirajte da li dobiveni uzorak indicira kraći prosječan vijek trajanja proizvoda. 13 / 39

Test o proporciji Bez obzira kakvu razdiobu ima statističko obilježje, sredina X, za dovoljno velike uzorke, ima približno normalnu razdiobu. Promatramo statističko obilježje koje ima binomnu razdiobu : X B(n, p). Koristimo test- statistiku: Z = X p 0 p0 (1 p 0 ) n N (0, 1). Nulta hipoteza Alternativna hipoteza Kritično područje H 1 : p p 0 C 0 =, z α [z α 2 2 H 0 : p = p 0 H 1 : p > p 0 C 0 = [z α, H 1 : p < p 0 C 0 =, z α ] 14 / 39

Zadaci Zadatak Proizvodač tvrdi da njegove pošiljke sadrže najviše 5% neispravnih proizvoda. Uzet je slučajni uzorak od 300 komada iz jedne pošiljke i bilo je 16 neispravnih. Da li možemo prihvatiti tvrdnju proizvodača uz razinu značajnosti 0.05? 15 / 39

Usporedba očekivanja dviju normalno distribuiranih populacija (t-test) Promatramo statističko obilježje X na dvije različite populacije. Uz to pretpostavimo da u obje populacije promatrano obilježje ima normalnu razdiobu. Ako s X 1 i X 2 označimo obilježje na prvoj, odnosno drugoj populaciji, onda su pretpostavke: X 1 N (µ 1, σ 2 1) i X 2 N (µ 2, σ 2 2). Neka su realizirani uzorci uzeti iz prve, odnosno druge populacije opsega n 1 i n 2 redom. Testiramo hipotezu u odnosu na jednu od alternativnih: H 0 : µ 1 = µ 2 H 1 : µ 1 µ 2, H 1 : µ 1 > µ 2, H 1 : µ 1 < µ 2. 16 / 39

Usporedba očekivanja dviju normalno distribuiranih populacija (t-test) Nulta hipoteza H 0 : µ 1 = µ 2, σ 2 1 i σ2 2 poznato: Test statistika Alternativna Kritično područje hipoteza H 1 : µ 1 µ 2 C 0 =, z α 2 Z = X 1 X 2 [z σ 1 2 α + σ2 2 2 n 1 n 2 Z N (0, 1) H 1 : µ 1 > µ 2 C 0 = [z α, H 1 : µ 1 < µ 2 C 0 =, z α ] 17 / 39

Usporedba očekivanja dviju normalno distribuiranih populacija (t-test) Nulta hipoteza H 0 : µ 1 = µ 2, σ 2 1 = σ2 2 = σ2 nije poznato: Test statistika: T = X 1 X 2 S 1 n 1 + 1 n 2 S 2 = (n 1 1)S 2 1 +(n 2 1)S 2 2 n 1 +n 2 2 T t(n 1 + n 2 2) Alternativna Kritično područje hipoteza H 1 : µ 1 µ 2 C 0 =, t α 1 + n 2 2 2)] [t α 1 + n 2 2 2), H 1 : µ 1 > µ 2 C 0 = [t α (n 1 + n 2 2), H 1 : µ 1 < µ 2 C 0 =, t α (n 1 + n 2 2)] 18 / 39

Usporedba varijanci dviju normalno distribuiranih populacija (F-test) Promatramo statističko obilježje X na dvije različite populacije. Uz to pretpostavimo da u obje populacije promatrano obilježje ima normalnu razdiobu. Ako s X 1 i X 2 označimo obilježje na prvoj, odnosno drugoj populaciji, onda su pretpostavke: X 1 N (µ 1, σ 2 1) i X 2 N (µ 2, σ 2 2). Neka su realizirani uzorci uzeti iz prve, odnosno druge populacije opsega n 1 i n 2 redom. Testiramo hipotezu u odnosu na jednu od alternativnih: H 0 : σ 2 1 = σ 2 2 H 1 : σ 2 1 σ 2 2, H 1 : σ 2 1 > σ 2 2 19 / 39

Usporedba varijanci dviju normalno distribuiranih populacija (F-test) Test statistika je: F = S 2 1 S 2 2 koja ima F (Fisherovu) razdiobu s n 1 1, n 2 1 stupnjeva slobode. Nulta hipoteza H 0 : σ 2 1 = σ2 2 : Alternativna hipoteza Kritično područje H 1 : σ1 2 σ2 2 C 0 = 0, f 1 α (n 1 1, n 2 2 1)] [f α (n 1 1, n 2 2 1), H 1 : σ1 2 > σ2 2 C 0 = [f α (n 1 1, n 2 1), 20 / 39

Zadaci Zadatak Pomoću dvije različite metode mjerena je jedna te ista veličina. Rezultati mjerenja dani su u tablici: 1. metoda 9.4 10.0 9.8 10.2 2. metoda 10.4 9.7 10.0 10.3 Može li se uz α = 0.1 zaključiti da obje metode daju istu točnost? 21 / 39

Zadaci Zadatak Iz dva četvrta razreda neke škole izabrano je na slučajan način po 10 učenika i izmjerena je njihova masa (masa je normalno distribuirana), a podaci su dani u tablici. Uz razinu značajnosti 0.02 testirajte hipotezu da su varijance jednake 4.a 57 60 63 59 62 60 58 56 54 62 4.b 58 62 60 56 63 58 61 57 53 61 22 / 39

Zadaci Zadatak Psiholog je testirao dvije grupe učenika. Grupu A od 7 učenika i grupu B od 6 učenika. Broj bodova je: A grupa 70 75 80 80 85 90 85 B grupa 75 90 95 100 80 85 Da li se uz razinu značajnosti 0.1 može smatrati da je uspjeh u obje grupe isti? 23 / 39

χ 2 -test χ 2 -test jedan od prvih statističkih testova predložio ga je K. Pearson 1900. godine, pa je poznat i pod nazivom Pearsonov test neparametarski test pomoću χ 2 -testa testiramo nultu hipotezu da obilježje X ima odredenu (teorijsku) razdiobu protiv alternativne da nema tu razdiobu pomoću χ 2 -testa ispitujemo nezavisnost dva statistička obilježja, kao i homogenost populacija 24 / 39

χ 2 -test Za sve navedeno test-statistika je (općenito): H = k (f i f ti ) 2 f ti i=1 gdje su f i eksperimentalne, a f ti teorijske frekvencije. Ako je za neki i očekivana (teorijska) frekvencija f ti < 5 združimo taj razred sa susjednim(a) razredom(ima) tako da novodobiveni razred zadovoljava uvjet da mu je očekivana frekvencija barem 5. 25 / 39

χ 2 -test Uz pretpostavku da je H 0 točna hipoteza za velike n (n ) vrijedi H χ 2 (r l 1) gdje χ 2 (r l 1) označava χ 2 razdiobu s (r l 1) stupnjeva slobode čiju vrijednost čitamo iz tablica. r je (konačan) broj razreda u uzorku l broj nepoznatih parametara. 26 / 39

χ 2 -test Za zadanu pogrešku prve vrste α, kritično područje odredujemo iz uvjeta Dakle, kritično područje je: P(H > χ 2 (r l 1) H 0 ) = α. C 0 = [χ 2 α(r l 1), Ako s h označimo vrijednost test statistike izračunate iz uzorka, onda nultu hipotezu odbacujemo ako h C 0 tj. h χ 2 α(r l 1). 27 / 39

Zadaci Zadatak Proizvodač tvrdi da je 5% njegovih proizvoda prve klase, 92% druge i 3% treće klase. U slučajnom uzorku od 500 proizvoda nadeno je 40 proizvoda prve, 432 druge i 28 treće klase. Uz razinu značajnosti 0.05, testirajte hipotezu da je proizvodač u pravu. Zadatak Iz intervala [0, 1] generirano je 200 slučajnih brojeva koji su razvrstani u 5 podintervala: interval [0, 0.2) [0.2, 0.4) [0.4, 0.6) [0.6, 0.8) [0.8, 1] broj br. 32 44 38 42 44 Da li su frekvencije ravnomjerno rasporedene po intervalima uz razinu značajnosti α = 0.01 i α = 0.05? 28 / 39

Zadaci Zadatak Kocka se baca 90 puta. Rezultati su dani u tablici: Broj na kocki 1 2 3 4 5 6 Broj pojavljivanja 15 13 16 20 14 12 Da li je kocka ispravna uz razinu značajnosti α = 0.05? 29 / 39

Zadaci Zadatak U cilju ispitivanja nekog svojstva pamučnih vlakana mjerena je njihova duljina i dobiveni su sljedeći rezultati: duljina (u cm) 2-4 4-6 6-8 8-10 10-12 broj vlakana 10 47 63 30 20 Testirati hipotezu o normalnoj distribuciji uz razinu značajnosti 0.05. 30 / 39

Zadaci Zadatak Anketirano je 100 radnika neke tvornice o udaljenosti od kuće do posla. S razinom značajnosti 0.05, testirajte hipotezu da se radi o uzorku iz populacije s normalnom distribucijom. udalj [0, 2 [2, 4 [4, 6 [6, 8 [8, 10 [10, 12 [12, 14 br rad 5 10 20 33 18 10 4 31 / 39

Zadaci Zadatak U jednom trgovačkom centru 200 puta je registriran broj kupaca u 10 sekundi. Dobiveni su rezultati: broj kupaca 0 1 2 3 4 broj mjerenja 109 65 22 3 1 Testirajte hipotezu da se radi o Poissonovoj razdiobi s vjerojatnošću 0.9. 32 / 39

Zadaci Zadatak Provjerite da li se empirijska razdioba dana tablicom: x i 0 1 2 3 4 f i 116 56 22 14 2 podudara s Poissonovom razdiobom, s pouzdanošću 95%. 33 / 39

χ 2 - test nezavisnosti dviju varijabli Neka je (X 1, Y 1 ), (X 2, Y 2 ),... (X n, Y n ) slučajni uzorak za dvodimenzionalno diskretno statističko obilježje (X, Y ) i neka je pritom: Skup vrijednosti obilježja X : Skup vrijednosti obilježja Y : Skup vrijednosti obilježja (X, Y ) : R(X ) = {a 1,..., a r }; R(Y ) = {b 1,..., b s }; R[(X, Y )] = {(a i, b j ) : 1 i r, 1 j s}. 34 / 39

χ 2 - test nezavisnosti dviju varijabli f ij : frekvencija od (a i, b j ) u uzorku f i : (marginalna) frekvencija od a i u uzorku g j : (marginalna) frekvencija od b j u uzorku Vrijedi: s f i = f ij, r g j = j=1 i=1 Označimo: p ij = P(X = a i, Y = b j ) p i = P(X = a i ) q j = P(X = b j ) f ij 35 / 39

χ 2 - test nezavisnosti dviju varijabli Kontingencijska frekvencijska tablica: X Y b 1 b 2... b s Σ a 1 f 11 f 12... f 1s f 1 a 2 f 21 f 22... f 2s f 2...... a r f r1 f r2... f rs f r Σ g 1 g 2... g s n 36 / 39

χ 2 - test nezavisnosti dviju varijabli Hipoteze su: H 0 : X i Y su nezavisna obilježja i H 1 : X i Y su zavisna obilježja, tj. H 0 : p ij = p i q j za sve i i j, a H 1 : postoje i, j takvi da p ij p i q j Uz pretpostavku da je H 0 točna hipoteza, procjene za p i i q j su: ˆp i = f i n, Očekivane (teorijske) vrijednosti f tij ˆq j = g j n od f ij uz H 0 su: Test-statistika je: f tij = n ˆp i ˆq j = n fi n gj n = f i g j n H = r i=1 j=1 s (f ij f tij ) 2 f tij 37 / 39

χ 2 - test nezavisnosti dviju varijabli Ako je H 0 istinita, tada za n : H χ 2 ((r 1) (s 1)), gdje χ 2 ((r 1) (s 1)) označava χ 2 razdiobu s ((r 1) (s 1)) stupnjeva slobode. Za zadanu pogrešku prve vrste α, kritično područje odredujemo iz uvjeta Dakle, kritično područje je: P(H > χ 2 ((r 1) (s 1)) H 0 ) = α. C 0 = [χ 2 α((r 1) (s 1)),, pritome χ 2 α((r 1) (s 1)) čitamo iz tablica. Ako s h označiimo vrijednost test statistike izračunate iz uzorka, onda nultu hipotezu odbacujemo ako h C 0 tj. h χ 2 α((r 1) (s 1)). 38 / 39

Zadaci Zadatak U cilju ispitivanja uspješnosti na kolokvijima iz statistike interesira nas da li prolaznost na drugom kolokviju ovisi o prolaznosti na prvom kolokviju! Za slučajno odabranih 120 studenata dobiveni su podaci dani u tablici. Možete li na osnovu ovih podataka zaključiti da uspjeh na drugom kolokviju ovisi o uspjehu na prvom kolokviju, uz razinu značajnosti 0.01? Kolokvij Položili Pali 1. 45 25 70 2. 20 30 50 65 55 120 39 / 39