4 Testiranje statističkih hipoteza

Σχετικά έγγραφα
3 Populacija i uzorak

(Hi-kvadrat test) r (f i f ti ) 2 H = f ti. i=1

INTEGRALNI RAČUN. Teorije, metodike i povijest infinitezimalnih računa. Lucija Mijić 17. veljače 2011.

Testiranje statističkih hipoteza Materijali za nastavu iz Statistike

a M a A. Može se pokazati da je supremum (ako postoji) jedinstven pa uvodimo oznaku sup A.

3.1 Granična vrednost funkcije u tački

radni nerecenzirani materijal za predavanja R(f) = {f(x) x D}

Matematička analiza 1 dodatni zadaci

Operacije s matricama

ELEKTROTEHNIČKI ODJEL

18. listopada listopada / 13

M086 LA 1 M106 GRP. Tema: Baza vektorskog prostora. Koordinatni sustav. Norma. CSB nejednakost

(P.I.) PRETPOSTAVKA INDUKCIJE - pretpostavimo da tvrdnja vrijedi za n = k.

Testiranje statistiqkih hipoteza

Iskazna logika 3. Matematička logika u računarstvu. novembar 2012

2 tg x ctg x 1 = =, cos 2x Zbog četvrtog kvadranta rješenje je: 2 ctg x

1.4 Tangenta i normala

Riješeni zadaci: Limes funkcije. Neprekidnost

7 Algebarske jednadžbe

PISMENI ISPIT IZ STATISTIKE

Linearna algebra 2 prvi kolokvij,

Apsolutno neprekidne raspodele Raspodele apsolutno neprekidnih sluqajnih promenljivih nazivaju se apsolutno neprekidnim raspodelama.

Linearna algebra 2 prvi kolokvij,

IspitivaƬe funkcija: 1. Oblast definisanosti funkcije (ili domen funkcije) D f

Funkcija gustoće neprekidne slučajne varijable ima dva bitna svojstva: 1. Nenegativnost: f(x) 0, x R, 2. Normiranost: f(x)dx = 1.

DISKRETNA MATEMATIKA - PREDAVANJE 7 - Jovanka Pantović

Teorijske osnove informatike 1

1 Promjena baze vektora

2. Ako je funkcija f(x) parna onda se Fourierov red funkcije f(x) reducira na Fourierov kosinusni red. f(x) cos

Osnovni primer. (Z, +,,, 0, 1) je komutativan prsten sa jedinicom: množenje je distributivno prema sabiranju

numeričkih deskriptivnih mera.

Elementi spektralne teorije matrica

Funkcije dviju varjabli (zadaci za vježbu)

PRAVA. Prava je u prostoru određena jednom svojom tačkom i vektorom paralelnim sa tom pravom ( vektor paralelnosti).

SISTEMI NELINEARNIH JEDNAČINA

Riješeni zadaci: Nizovi realnih brojeva

Dijagonalizacija operatora

PARCIJALNI IZVODI I DIFERENCIJALI. Sama definicija parcijalnog izvoda i diferencijala je malo teža, mi se njome ovde nećemo baviti a vi ćete je,

9.1 Testovi hipoteza u statistici

Numerička matematika 2. kolokvij (1. srpnja 2009.)

6 Polinomi Funkcija p : R R zadana formulom

2.2 Srednje vrijednosti. aritmetička sredina, medijan, mod. Podaci (realizacije varijable X): x 1,x 2,...,x n (1)

5. Karakteristične funkcije

TRIGONOMETRIJSKE FUNKCIJE I I.1.

Definicija: Hipoteza predstavlja pretpostavku koja je zasnovana na određenim činjenicama (najčešće naučnim ili iskustvenim).

Neka je a 3 x 3 + a 2 x 2 + a 1 x + a 0 = 0 algebarska jednadžba trećeg stupnja. Rješavanje ove jednadžbe sastoji se od nekoliko koraka.

Kaskadna kompenzacija SAU

Strukture podataka i algoritmi 1. kolokvij 16. studenog Zadatak 1

IZVODI ZADACI ( IV deo) Rešenje: Najpre ćemo logaritmovati ovu jednakost sa ln ( to beše prirodni logaritam za osnovu e) a zatim ćemo

9. TESTIRANJE HIPOTEZA O PARAMETRU. Josipa Perkov, prof., pred. 1

MATEMATIKA 1 8. domaća zadaća: RADIJVEKTORI. ALGEBARSKE OPERACIJE S RADIJVEKTORIMA. LINEARNA (NE)ZAVISNOST SKUPA RADIJVEKTORA.

VJEROJATNOST I STATISTIKA 2. kolokvij lipnja 2016.

Testiranje statisti kih hipoteza. Vjeºbe - Statistika Praktikum

Uvod u teoriju brojeva

π π ELEKTROTEHNIČKI ODJEL i) f (x) = x 3 x 2 x + 1, a = 1, b = 1;

Dvanaesti praktikum iz Analize 1

APROKSIMACIJA FUNKCIJA

Ĉetverokut - DOMAĆA ZADAĆA. Nakon odgledanih videa trebali biste biti u stanju samostalno riješiti sljedeće zadatke.

Kontrolni zadatak (Tačka, prava, ravan, diedar, poliedar, ortogonalna projekcija), grupa A

RIJEŠENI ZADACI I TEORIJA IZ

Ispitivanje toka i skiciranje grafika funkcija

Veleučilište u Rijeci Stručni studij sigurnosti na radu Akad. god. 2011/2012. Matematika. Monotonost i ekstremi. Katica Jurasić. Rijeka, 2011.

Sume kvadrata. mn = (ax + by) 2 + (ay bx) 2.

radni nerecenzirani materijal za predavanja

Zadaci sa prethodnih prijemnih ispita iz matematike na Beogradskom univerzitetu

( x) ( ) ( ) ( x) ( ) ( x) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )

UNIVERZITET U NIŠU ELEKTRONSKI FAKULTET SIGNALI I SISTEMI. Zbirka zadataka

Str

MJERA I INTEGRAL 2. kolokvij 30. lipnja (Knjige, bilježnice, dodatni papiri i kalkulatori nisu dozvoljeni!)

Matematičke metode u marketingumultidimenzionalno skaliranje. Lavoslav ČaklovićPMF-MO

Klasifikacija blizu Kelerovih mnogostrukosti. konstantne holomorfne sekcione krivine. Kelerove. mnogostrukosti. blizu Kelerove.

4 Funkcije. 4.1 Pojam funkcije

MATEMATIKA 2. Grupa 1 Rexea zadataka. Prvi pismeni kolokvijum, Dragan ori

nepoznati parametar θ jednak broju θ 0, u oznaci H 0 (θ =θ 0 ), je primer proste hipoteze. Ako hipoteza nije prosta, onda je složena.

Neka su A i B skupovi. Kažemo da je A podskup od B i pišemo A B ako je svaki element skupa A ujedno i element skupa B. Simbolima to zapisujemo:

ELEMENTARNA MATEMATIKA 1

41. Jednačine koje se svode na kvadratne

- pravac n je zadan s točkom T(2,0) i koeficijentom smjera k=2. (30 bodova)

RADIJVEKTORI. ALGEBARSKE OPERACIJE S RADIJVEKTORIMA. LINEARNA (NE)ZAVISNOST SKUPA RADIJVEKTORA.

Slučajne varijable. Diskretna slučajna varijabla X je promjenjiva veličina koja poprima vrijednosti iz skupa

Neparametarski testovi za dva nezavisna uzorka. Boris Glišić 208/2010 Bojana Ružičić 21/2010

MATRICE I DETERMINANTE - formule i zadaci - (Matrice i determinante) 1 / 15

Zadaci iz Osnova matematike

Počela biostatistike, Poslijediplomski interdisciplinarni doktorski studij Molekularne bioznanosti. Molekularne bioznanosti. Molekularne bioznanosti

Četrnaesto predavanje iz Teorije skupova

PRIMJER 3. MATLAB filtdemo

Cauchyjev teorem. Postoji više dokaza ovog teorema, a najjednostvniji je uz pomoć Greenove formule: dxdy. int C i Cauchy Riemannovih uvjeta.

Pismeni ispit iz matematike Riješiti sistem jednačina i diskutovati rješenja sistema u zavisnosti od parametra: ( ) + 1.

16 Lokalni ekstremi. Definicija 16.1 Neka je A R n otvoren, f : A R i c A. Ako postoji okolina U(c) od c na kojoj je f(c) minimum

2.6 Nepravi integrali

9. GRANIČNA VRIJEDNOST I NEPREKIDNOST FUNKCIJE GRANIČNA VRIJEDNOST ILI LIMES FUNKCIJE

VJEROJATNOST I STATISTIKA Popravni kolokvij - 1. rujna 2016.

Trigonometrija 2. Adicijske formule. Formule dvostrukog kuta Formule polovičnog kuta Pretvaranje sume(razlike u produkt i obrnuto

Osnovne teoreme diferencijalnog računa

RAČUNSKE VEŽBE IZ PREDMETA POLUPROVODNIČKE KOMPONENTE (IV semestar modul EKM) IV deo. Miloš Marjanović

Više dokaza jedne poznate trigonometrijske nejednakosti u trokutu

KONVEKSNI SKUPOVI. Definicije: potprostor, afin skup, konveksan skup, konveksan konus. 1/5. Back FullScr

IZVODI ZADACI (I deo)

Osnove teorije uzoraka

1 Afina geometrija. 1.1 Afini prostor. Definicija 1.1. Pod afinim prostorom nad poljem K podrazumevamo. A - skup taqaka

Transcript:

4 Testiranje statističkih hipoteza 1

4.1. Statistička hipoteza Promatramo statističko obilježje X. Statistička hipoteza je (bilo koja) pretpostavka o (populacijskoj) razdiobi od X. Kažemo da je statistička hipoteza jednostavna ukoliko jednoznačno odreduje razdiobu od X. U suprotnom kažemo da je složena. 2

Primjeri. H 1 : X ima normalnu razdiobu složena hipoteza H 2 : X N(170, 64) jednostavna hipoteza 3

4.2. Statistički test Neka je µ = E[X]. Na primjer, pretpostavimo da nas zanima je li točna hipoteza: H 0 : µ 50. Preciznije, želimo na osnovi realizacije slučajnog u- zorka za X donijeti odluku hoćemo li odbaciti ili ne odbaciti tu hipotezu. 4

Postupak donošenja odluke o odbacivanju ili ne odbacivanju statističke hipoteze zove se testiranje statističkih hipoteza. Primijetimo da uz osnovnu ili nul - hipotezu, npr.: H 0 : µ 50, postoji njoj alternativna hipoteza: H 1 : µ > 50. 5

Budući da sve odluke bazirane na uzorcima iz populacije nisu 100% pouzdane, ni zaključak (odluka) statističkog testa nije 100% pouzdan. Dakle, može se dogoditi da je zaključak testa pogrešan. Prema tome, imamo sljedeću situaciju: 6

zaključak točno je ne odbaciti H 0 odbaciti H 0 H 0 pogrešno! (I) pogrešno! (II) H 1 Pogreška koju činimo kada odbacujemo H 0, a ona je istinita, je pogreška prve vrste. Pogreška koju činimo kada ne odbacujemo H 0, a istinita je H 1, je pogreška druge vrste. 7

Test će u potpunosti biti sproveden ako možemo procijeniti vjerojatnosti mogućih pogrešaka u zaključku testa. Razumno je zahtjevati test kojemu se mogu kontrolirati vjerojatnosti obiju pogrešaka. To nije moguće jer smanjivanjem vjerojatnosti pogreške prve vrste povećava se vjerojatnost pogreške druge vrste i o- bratno. 8

S druge strane, u velikoj većini slučajeva moguće je za zadanu razinu značajnosti testa α (α 0, 1 ) medu testovima kojima vjerojatnost pogreške prve vrste ne prelazi broj α naći (konstruirati) test s najmanjom vjerojatnosti pogreške druge vrste. 9

Neka je X 1, X 2,..., X n slučajni uzorak za X i X := (X 1, X 2,..., X n ). Tada su realizacije x = (x 1, x 2,..., x n ) tog uzorka elementi od R n. Definicija. Test (hipoteze H 0 u odnosu na alternativu H 1 ) je preslikavanje τ : R n {0, 1}. Interpretacija. Ako je za realizaciju x uzorka X τ(x) = 1, tada odbacujemo H 0 u korist H 1, a ako je τ(x) = 0, tada ne odbacujemo H 0 u korist H 1. 10

Tada je C := τ 1 (1) = {x R n : τ(x) = 1} područje realizacija uzoraka za koje se H 0 odbacuje u korist H 1. C se naziva kritično područje za test τ. 11

Populacijska razdioba: X f(x θ), θ Θ Vjerodostojnost od θ: L(θ x) = n i=1 f(x i θ) Preslikavanje γ : Θ [0, 1] def. sa: γ(θ) := E θ [τ(x)] = P θ (X C) = zove se jakost testa τ. C L(θ x) dx Interpretacija. Ukoliko je θ 1 vrijednost parametra za koju je H 1 istinito, jakost testa γ(θ 1 ) je sposobnost testa da odbaci H 0 ako je H 0 neistinita hipoteza. 12

Neka su: H 0 : θ Θ 0 H 1 : θ Θ 1. Preslikavanje α : Θ 0 [0, 1] def. sa: α(θ) := γ(θ) = P θ (X C) je vjerojatnost pogreške 1. vrste. α τ := sup θ Θ 0 α(θ) je značajnost testa τ. Kažemo da test ima razinu značajnost α ukoliko mu je značajnost manja ili jednaka α. 13

H 0 : θ Θ 0 H 1 : θ Θ 1. Preslikavanje β : Θ 1 [0, 1] def. sa: β(θ) := 1 γ(θ) = P θ (X / C) je vjerojatnost pogreške 2. vrste. 14

Definicija. Kažemo da je test τ uniformno najjači ako za svaki drugi test τ takav da je α τ α τ, vrijedi da je γ τ (θ) γ τ (θ) za sve θ. Ukoliko postoji, kako naći uniformno najjači test? 15

Pretpostavimo da želimo testirati: H 0 : θ = θ 0 H 1 : θ = θ 1 gdje su θ 0 θ 1 dvije vrijednosti parametra. Nadalje, neka su L(θ 0 x) = n i=1 f(x i θ 0 ), L(θ 1 x) = vjerodostojnosti od θ 0 i θ 1. n i=1 f(x i θ 1 ) 16

Lema. (Neyman, Pearson) Neka je k > 0 takav broj da za skup C = {x R n : L(θ 0 x) kl(θ 1 x)} vrijedi da je C L(θ 0 x) dx = α za zadani α 0, 1. Ako za neki drugi B R n vrijedi da je L(θ 0 x) dx α, B tada je nužno (Dokaz.) B L(θ 1 x) dx C L(θ 1 x) dx. 17

Interpretacija. Test τ(x) := 1 C (x) za C iz N-P leme je uniformno najjači test za testiranje jednostavne hipoteze H 0 u odnosu na jednostavnu alternativu H 1. 18

Primjer 4.1. Za varijablu X poznato je da je X N(µ, 9) i µ {13.8, 15.0}. Na osnovi uzorka za X duljine n = 70 treba testirati nul-hipotezu H 0 : µ = 15.0 u odnosu na alternativu H 1 : µ = 13.8 uz razinu značajnosti od α = 5%. 19

Konstrukcija testa sastoji se od odredivanja testne statistike na osnovi čijih vrijednosti se donose odluke, i (slike) kritičnog područja koji je skup onih mogućih vrijednosti testne statistike za koje se odbacuje H 0 u korist H 1. Takav skup takoder zovemo kritičnim područjem. (Izvod optimalnog (tj. uniformno najjačeg testa).) 20

Dakle, za ovaj primjer, testna statistika (optimalnog) testa je Z = X 15.0 70. 3 Kritično područje uz uvjet da vjerojatnost pogreške prve vrste bude jednaka α = 0.05: P(Z u H 0 ) = 0.05 Z H 0 N(0, 1) u = z 0.05 = (tablice) = 1.64 kritično područje je interval, 1.64] Dakle, H 0 odbacujemo ako je z 1.64. 21

Ako je z > 1.64 ne odbacujemo H 0. U tom slučaju je vjerojatnost pogreške druge vrste β = P(Z > 1.64 H 1 ) = = P( X 13.8 15.0 13.8 70 > 70 1.64 H1 ) = 3 3 = P(X > 1.71) = = 1 Φ(1.71) = = 0.5 Φ 0 (1.71) = = 0.0436. 22

Jakost testa je γ = P(Z 1.64 H 1 ) = = 1 P(Z > 1.64 H 1 ) = = 1 β = 1 0.0436 = = 0.9564. 23

Zadatak 1. (jednostrani z-test) Pokažite da je za X N(µ, σ 2 0 ), gdje je σ2 0 poznato, uniformno najjači test za testiranje hipoteza H 0 : µ = µ 0 H 1 : µ < µ 0, na razini značajnosti α, dan testnom statistikom Z = X µ 0 n σ 0 i kritičnim područjem z z α. (µ 0 je zadani broj, z je vrijednost od Z) 24

Zadatak 2. (jednostrani z-test, 2. put) Pokažite da je za X N(µ, σ 2 0 ), gdje je σ2 0 poznato, uniformno najjači test za testiranje hipoteza H 0 : µ = µ 0 H 1 : µ > µ 0, na razini značajnosti α, dan testnom statistikom Z = X µ 0 n σ 0 i kritičnim područjem z z α. (µ 0 je zadani broj, z je vrijednost od Z) 25

Zadatak 3. (dvostrani z-test) Neka je X N(µ, σ0 2), gdje je σ2 0 hipoteza poznato. Je li test dan testnom statistikom H 0 : µ = µ 0 H 1 : µ µ 0, Z = X µ 0 n σ 0 i kritičnim područjem z z α/2 (na razini značajnosti α), uniformno najjači? (µ 0 je zadani broj, z je vrijednost od Z) 26

Primijetimo da nam je u primjeru 4.1. račun bio olakšan jer su obje hipoteze (osnovna i alternativna) bile jednostavne. U praksi to nije slučaj. Na primjer, ako za X N(µ, 9) želimo testirati H 0 : µ 15 H 1 : µ < 15, onda su obje hipoteze složene. Pretpostavimo da je testna statistika ista kao u primjeru 4.1: Z = X 15 n. 3 27

I kritično područje je istoga oblika kao u primjeru 4.1:, u]. Odredimo u > 0 t.d. je za zadanu razinu značajnosti α P(Z u µ = 15 + δ) α za sve δ 0 P( X µ δ n u n) α za sve δ 0 3 3 Φ( u δ 3 n) α za sve δ 0. Budući da je za sve δ 0, Φ( u δ 3 n) Φ( u), u odredimo tako da je Φ( u) = 0.5 Φ 0 (u) = α. 28

Dakle, konstrukcija kritičnog područja je ista ako originalnu (složenu) hipotezu H 0 zamijenimo sa (jednostavnom) hipotezom H 0 : µ = 15, odnosno, ako testiramo H 0 : µ = 15 H 1 : µ < 15. Dakle, sada smo problem testiranja sveli na z-test opisan u zadatku 1. 29

U pravilu, za nul-hipotezu uvijek se uzimaju jednostavne hipoteze ili hipoteze koje jednoznačno odreduju razdiobu testne statistike. U interpretaciji, za nul-hipoteze uzimamo one hipoteze za koje želimo kontrolirati vjerojatnost da ćemo ih odbaciti ako su istinite, odn. vjerojatnost pogrešaka prve vrste. 30

Primjer 4.2. (Primjer 1.4.) Kockar je optužen da je koristio namještenu kocku. Koju osnovnu hipotezu koristi statističar kada sprovodi odgovarajući test za sud? 31

H 0 : Kocka je simetrična. Trebamo kontrolirati vjerojatnost da ćemo pogriješiti ako odbacimo H 0, tj. da se proglasi krivim nevini čovjek. 32

Primjer 4.3. Tvornica je proizvela novu seriju padobrana. Kontrolor kvalitete mora statističkim metodama (statistički test) odlučiti hoće li padobrane propustiti na tržište ili ne. Koju hipotezu treba uzeti za osnovnu? 33

H 0 : Padobran nije ispravan. 34

4.3 Testovi omjera vjerodostojnosti Neka je X 1, X 2,..., X n slučajni uzorak za X i neka je populacijska gustoća od X: f(x θ), θ Θ. Cilj: konstrirati test za testiranje H 0 : θ Θ 0 H 1 : θ Θ 1. 35

Neka je x = (x 1, x 2,..., x n ) opaženi uzorak. Vjerodostojnost: L(θ x) = n i=1 Pretpostavimo da postoje: f(x i θ), θ Θ t.d. da vrijedi ˆθ 0 = ˆθ 0 (x) Θ 0 i ˆθ = ˆθ(x) Θ L(ˆθ 0 x) = max θ Θ 0 L(θ x), L(ˆθ x) = max θ Θ L(θ x). 36

Definicija. Omjer vjerodostojnosti je funkcija: x λ(x) := L(ˆθ 0 x) L(ˆθ x). Test za testiranje nevedenih hipoteza kojemu je kritično područje oblika C = {x R n : λ(x) c}, za neku realnu konstanu c < 1, zovemo testom omjera vjerodostojnosti (engl. likelihood ratio test ili LR-test). 37

Zadatak 4. (dvostrani z-test) Neka je X 1, X 2,..., X n slučajni uzorak za X s normalnom populacijskom distribucijom N(µ, σ 2 0 ) (σ2 0 je poznato). Odredite test omjera vjerodostojnosti za testiranje nul-hipoteze H 0 : µ = µ 0 u odnosu na dvostranu alternativu H 1 : µ µ 0. 38

Zadatak 5. (t-test) Neka je X 1, X 2,..., X n slučajni uzorak za X s normalnom populacijskom distribucijom N(µ, σ 2 ) (oba parametra su nepoznata). Odredite test omjera vjerodostojnosti za testiranje nulhipoteze H 0 : µ = µ 0 u odnosu na (a) jednostranu alternativu H 1 : µ < µ 0 ; (b) jednostranu alternativu H 1 : µ > µ 0 ; (c) dvostranu alternativu H 1 : µ µ 0. 39

4.4 Test o očekivanju normalno distribuirane populacije (t-test) Neka je X 1,..., X n slučani uzorak za X N(µ, σ 2 ). Želimo testirati hipoteze o parametru µ (σ 2 je nepoznat). Od sada pa nadalje, neka µ 0 označava neki unaprijed zadani broj. 40

Razlikujemo tri slučaja: (1) : (2) : (3) : H 0 : µ = µ 0 H 0 : µ = µ 0 H 0 : µ = µ 0 H 1 : µ > µ 0 H 1 : µ < µ 0 H 1 : µ µ 0 Alternative u (1) i (2) su jednostrane jednostrani testovi dok je alternativa u (3) dvostrana dvostrani test. 41

U sva tri slučaja, testna statistika je jednaka: T = X µ 0 H n 0 t(n 1) S Kritična područja se razlikuju. Neka je α zadana razina značajnosti. 42

(1): kritično područje: H 0 : µ = µ 0 H 1 : µ > µ 0 P(T t α (n 1) H 0 ) = α [t α (n 1), + 43

(2): kritično područje: H 0 : µ = µ 0 H 1 : µ < µ 0 P(T t α (n 1) H 0 ) = α, t α (n 1)] 44

(3): kritično područje: H 0 : µ = µ 0 H 1 : µ µ 0 P( T t α/2 (n 1) H 0 ) = α, t α/2 (n 1)] [t α/2 (n 1), + 45

Primjer 4.4. (Primjer 3.13) U svrhu istraživanja toksičnosti jedne vrste plijesni na urod kukuruza, mjeri se količina toksične tvari u mg. Uzorak od 9 ekstrakata te plijesni: 1.2, 0.8, 0.6, 1.1, 1.2, 0.9, 1.5, 0.9, 1.0 Pretpostavka je da mjereno obilježje ima normalnu razdiobu. Iz uzorka je izračunano: x = 1.02 i s = 0.28. Uz 5% značajnosti testirajte H 0 : µ = 1.00 H 1 : µ > 1.00. 46

Jednostrani t-test: Testna statistika: T = X 1.00 S 3 Kritično područje: [t 0.05 (8), + = [1.86, + Vrijednost testne statistike: t = x 1.00 s 3 = 1.02 1.00 0.28 3 = 0.214 47

Budući da je t = 0.214 < 1.86, tj. t ne pripada kritičnom području, ne odbacujemo H 0 u korist alternative. Preciznije, uz značajnost od 5%, ne odbacujemo pretpostavku da je µ manje ili jednako od 1.00, odn. ne možemo tvrditi da je očekivana količina toksične tvari u ekstraktu plijesni veća od 1.00. 48