Str. 53;76; Testiranje statističkih hipoteza Predavač: Dr Mirko Savić savicmirko@eccf.su.ac.yu www.eccf.su.ac.yu Definicija: Hipoteza predstavlja pretpostavku koja je zasnovana na određenim činjenicama (najčešće naučnim ili iskustvenim). Jednom formirana hipoteza se koristi za izvođenje zaključaka o posmatranom problemu uz pomoć odgovarajućeg statističkog metoda. Podela testova: Parametarski testovi. Neparametarski testovi.
Postupak testiranja hipoteze se izvodi u nekoliko koraka:. Definišu se nulta i alternativna hipoteza.. Izbor modela teorijskog rasporeda. 3. Određuje se nivo značajnosti testa α odnosno verovatnoća (α). 4. Definisanje uzorka. 5. Izračunavanje statistike testa na osnovu uzorka. 6. Iz tablice teorijskog rasporeda očitava se tablična vrednost (kriterijum). 7. Upoređivanje statistike testa sa tabličnom vrednošću. 8. Odluka o prihvatanju ili odbacivanju formulisane hipoteze. Str. 533;76;3 Definisanje nulte i alternativne hipoteze Nulta hipoteza H 0 - tvrdnja o vrednosti nekog parametra osnovnog skupa koja se testira. Cilj je da se ta pretpostavka statistički potvrdi ili ospori. Nasuprot nulte hipoteze H 0, je alternativna hipoteza H, koja sadrži sve ostale vrednosti parametra osnovnog skupa koje nisu obuhvaćene nultom hipotezom H 0.
Hipoteza može da bude prosta ili složena:.prosta H 0 i složena H (dvosmerni test) H 0 : Prosečna plata u gradu je 000 evra. H 0 : µ µ 0 000 H : Prosečna plata u gradu nije 000 evra. H : µ µ 0 000. Složena H 0 i složena H (jednosmerni test sa gornjom granicom) H 0 : Prosečna plata u gradu nije veća od 00 evra. H 0 : µ µ 0 00 H : Prosečna plata u gradu je veća od 00 evra. H : µ > µ 0 00 3.Složena H 0 i složena H (jednosmerni test sa donjom granicom) H 0 : Prosečna plata u gradu nije manja od 500 evra. H 0 : µ µ 0 500 H : Prosečna plata u gradu je manja od 500 evra. H :µ < µ 0 500 Hipoteza mora da bude nedvosmislena! Raskrsnica na kojoj stoje dva čoveka Str. 540;8;7 Rizici greške kod testiranja hipoteza - Testiranjem H 0 se prihvata Testiranjem H 0 se odbacuje Dobra odluka, Greška prve vrste, H 0 je istinita u osnovnom skupu uz verovatnoću α uz verovatnoću α Dobra odluka, Greška druge vrste, uz verovatnoću β H 0 je neistinita u osnovnom skupu uz uslovnu verovatnoću β (verovatnoća β se zove ''jačina testa'' ili ''moć testa'') 3
Testiranje hipoteza primenom ''p'' vrednosti (ne radi se) Str. 554;;7 p vrednost- realizovani nivo rizika greške α. α p H 0 se odbacuje! α<p H 0 se prihvata! Uvod u parametarske testove Str. 558;76;8 Koriste se za proveru hipoteza o nepoznatoj vrednosti parametara osnovnog skupa. Primena zavisi od ispunjenja unapred određenih, strogih pretpostavki o osnovnom skupu. 4
Parametarski testovi se vrše na osnovu nekog od teorijskih rasporeda: normalnog rasporeda, Studentovog t-rasporeda, Snedekorovog F-rasporeda, binomnog rasporeda. Testiranje na osnovu normalnog rasporeda Str. 565;;8 Uslov: n 30 5
Testiranje aritmetičke sredine Str. 565;83;8 Izračunavanje statistike testa: Kada nije poznata varijansa osnovnog skupa: u µ 0 0, s gde je: µ 0 aritmetička sredina uzorka, hipotetička vrednost aritmetičke sredine osnovnog skupa, s ocena standardne devijacije osnovnog skupa. Dvosmerni test:. prosta H 0 i složena H (dvosmerni test): H 0 : µ µ 0 ; H : µ µ 0. α α uα > u 0 u α u0 uα α uα u u α < u0 6
Jednosmerni test:. složena H 0 i složena H (jednosmerni test): H 0 : µ µ 0 ; H : µ > µ 0. uα u0 uα u0 Jednosmerni test: 3. složena H 0 i složena H (jednosmerni test): H 0 : µ µ 0 ; H : µ < µ 0. α u > u0 α u u0 7
Primer 3 (strana 568) Testiranje razlike a.s. osnovnog skupa i a.s. uzorka SOT-06 K:4-7 Testiranje aritmetičke sredine, intervalna serija, veliki uzorak, bez ponavljanja Testiranje proporcije Str. 570;86; Uslov: n 50 u 0 p P0 s gde je: p' proporcija u uzorku, P 0 hipotetička vrednost proporcije u osnovnom skupu, s p' ocena srednje mere odstupanja proporcija u uzorcima od proporcije u osnovnom skupu. p SOT-057 K:4-8 Testiranje proporcije, bez ponavljanja 8
9 Testiranje razlike aritmetičkih sredina dva uzorka n 30; n 30 ( ) ( ) s( ) u 0 0 µ µ Primer 34 (strana 579) Testiranje razlike a.s. dva uzorka Uslov: Str. 575;89;4 SOT-07 K:4-9 Testiranje razlike a.s. dva uzorka, veliki uzorci ( ) + + + n n n n n f n f s m j j j m j i i Nema u knjizi: Testiranje razlike proporcija dva uzorka n 50; n 50 ( ) ( ) s( ) P P p p u p p 0 0 Primer 35 (strana 58) Testiranje razlike proporcija dva uzorka Uslov: Str. 58;93;6 SOT-065 K:4-0 Testiranje razlike proporcija dva uzorka ( ) n q p n q p s p p + Za jednosmerni test:
Testiranje na osnovu Studentovog t-rasporeda Str. 585;97;7 Uslov: n<30 t (α;r) Goset (Gosset) početkom XX veka Testiranje aritmetičke sredine t 0 s µ 0 Str. 585;97;8. prosta H 0 i složena H (dvosmerni test): H 0 : µ µ 0 ; H : µ µ 0. α α t < t( ; r ) t ( α ; r ) t0 t( α ; r ) t ( α t 0 > t( α ; r ) ; r ) t( α ; r ) 0 α 0
. složena H 0 i složena H (jednosmerni test): H 0 : µ µ 0 ; H : µ > µ 0. t t( ; r ) 0 α 3. složena H 0 i složena H (jednosmerni test): H 0 : µ µ 0 ; H : µ < µ 0. t < t( ; r ) t0 t( α ; r ) 0 α
Primer 36 (strana 588) Testiranje razlike a.s. osnovnog skupa i a.s. uzorka mali uzorak SOT-049 K:4- Testiranje aritmetičke sredine, negrupisani podaci, mali uzorak Testiranje razlike aritmetičkih sredina dva uzorka Str. 590;00;3 t 0 ( ) ( µ µ ) s( ) 0 Primer 37 (strana 59) Testiranje razlike a.s. dva uzorka mali uzorci SOT-063 K:4- Testiranje razlike a.s. dva uzorka, grupisani podaci, mali uzorci
Analiza varijanse (disperziona analiza; ANOVA) Str. 594;0;3 Definicija: Matematičko-statistički postupak pomoću kojeg se testira značajnost razlike između aritmetičkih sredina iz tri i više uzoraka. Može se ispitivati uticaj: jednog faktora varijabiliteta, dva faktora varijabiliteta, dva faktora varijabiliteta sa više opservacija (posmatranja). Analiza varijanse jednog faktora varijabiliteta Str. 595;03;33 Formulisanje hipoteza: H 0 : µ µ...µ i...µ m µ, H : Aritmetičke sredine bar dva podskupa se među sobom razlikuju. Tabela za analizu varijanse: Suma kvadrata odstupanja Broj stepeni slobode Ocena varijanse Odnos varijansi Tablična vrednost 3 4 5 S A r m V A F 0 S R r nm V R - S T rn V T - F ( α ; r ; r) ili F ( α ; ) r ; r 3
Grafički prikaz (Snedekorov F-raspored): F ( α r ; r) F 0 F ( ; r ) F F ( α ; ) ; r ; r α ; r < 0 Testiranje kod analize varijanse jednog faktora varijabiliteta Str. 60;05;35 Radi se samo ako je H 0 odbačena! Tri testa: t-test, testiranje najmanje značajne razlike (NZR), Takijev test (Tukey). 4
Test najmanje značajne razlike: NZR t ( α ) s( ) r i i, + i i+ <NZR; Razlika nije statistički značajna. i i+ NZR; Razlika je statistički značajna. Statistički značajna razlika α5% (*). Visoko statistički značajna razlika α% (**). Primer 39 (strana 60) ANOVA varijabiliteta jedan faktor SOT-03 K:4-3 ANOVA jednog faktora varijabiliteta (bez proizvoljne a.s.) Str. 67;08;39 Analiza varijanse dva faktora varijabiliteta Tabela za analizu varijanse: Suma kvadrata odstupanja Broj stepeni slobode Ocena varijanse Odnos varijansi Tablična vrednost 3 4 5 S A r m V A F 0(A) F ( α ; ) r; r S B r 3 s V B F 0(B) F ( α ; ) S R r (m) (s) V R - - S T rn V T - - r; r 5
Grafički prikaz za faktor A: F ( α r ; r3) F 0( A) F ( r F ; r3) F 0( A) ( α ; ) ; r ; r3 α ; < Grafički prikaz za faktor B: F ( r r ) α F 0( B) F ; ; ( 3 r r3) F 0( B) F ( α ; ) ; r ; r3 α ; < 6
Str. 6;09;4 Testiranje kod analize varijanse dva faktora varijabiliteta Radi se samo ako je H 0 odbačena za neki od faktora! Tri testa: t-test, testiranje najmanje značajne razlike (NZR), Takijev test (Tukey). Na isti način kao i za jedan faktor varijabiliteta! Izračunavanje relativnog uticaja faktora: Samo u slučaju ako je nulta hipoteza H 0 odbačena za oba faktora! R A S A S ( m ) T VR SB ( s ) V R B VR S T VR R Primer 40 (strana 6) ANOVA dva faktora varijabiliteta SOT-074 K:4-4 ANOVA dva faktora varijabiliteta 7
SOT-054; K(05)z 4-7 Test. n.o. normalnog rasporeda SOT-058; K(05)z 4-8 Testiranje proporcije SOT-09; K(05)z 4-9 Test. razlike a.s. veliki uzorci SOT-066; K(05)z 4-0 Test. razlike proporcija dva skupa SOT-050; K(05)z 4- Test. n.o. t-rasporeda SOT-03; K(05)z 4- Test. razlike a.s. mali uzorci SOT-069; K(05)z 4-3 ANOVA faktora var. SOT-07; K(05)z 4-4 ANOVA faktora var. 8