13. TESTIRANJE HIPOTEZE O NEPOZNATIM KARAKTERISTIKAMA POPULACIJE
χ - TEST χ -test je neparametrijski test kojim se vrlo uspješno rješavaju problemi masovnih pojava kao što su: testiranje hipoteze da distribucija skupa ima određeni oblik, testiranje hipoteze da postoji razlika proporcija triju i više osnovnih skupova, testiranje hipoteza da su dva obilježja elemenata nekog skupa međusobno neovisna kod χ testa postavlja se nulta hipoteza i alternativna hipoteza
13.1. TESTIRANJE HIPOTEZE DA DISTRIBUCIJA POPULACIJE IMA ODREĐENI ENI OBLIK polazi se od pretpostavke da empirijska distribucija ima određeni oblik (nulta hipoteza) hipoteza se testira izborom uzorka određenog opsega iz populacije distribucija frekvencija uzorka s opaženim frekvencijama (f i ) nastaje grupiranjem elemenata uzorka prema određenom obilježju očekivane frekvencije (e i ) su frekvencije koje se računaju za slučaj kada bi distribucija uzorka imala oblik pretpostavljene distribucije u populaciji na osnovi opaženih i očekivanih frekvencija izračunava se χ
empirijski χ : χ k i 1 ( f e ) i e i i k je broj grupa u kojima su dane opažene i očekivane frekvencije suma očekivanih frekvencija je jednaka sumi opaženih frekvencija teorijski χ : vrijednost se očitava za k-g-1 stupnjeva slobode, gdje je g broj procijenjenih parametara distribucije populacije i zadanu razinu signifikantnosti iz tablice Kritične vrijednosti χ distribucije
usporedbom empirijske χ vrijednosti s teorijskom vrijednošću χ za određeni broj stupnjeva slobode i zadanu razinu signifikantnosti nulta hipoteza se prihvaća ili odbacuje: ukoliko je empirijska vrijednost χ manja od teorijske vrijednosti prihvaća a se nulta hipoteza i kaže se da je moguće da se empirijska distribucija dobro prilagođava nekoj teorijskoj distribuciji s kojom je ona uspoređivana ukoliko je empirijska χ vrijednost, uz zadanu signifikantnost i broj stupnjeva slobode, veća od teorijske vrijednosti χ prihvaća a se alternativna hipoteza s tvrdnjom da empirijska distribucija nema oblik teorijske distribucije s kojom je ona uspoređivana
primjena testa je valjana ako vrijedi: uzorak dovoljno velik (više od 30 članova), sve očekivane frekvencije veće ili jednake od te ako ih je najmanje 50% veće ili jednako od 5 ponekad se primjenjuje i kriterij: sve očekivane frekvencije moraju biti veće od 5 ako je broj stupnjeva slobode jednak 1
PRIMJER 1. Ispituje se učestalost zastoja strojeva na jednoj proizvodnoj liniji po radnoj smjeni. Analizom 400 radnih smjena dobiveni su ovi rezultati: Broj zastoja 0 1 3 4 5 6 Broj smjena 35 115 130 75 30 10 5 Izvor: Šošić, I., Primijenjena statistika, Školska knjiga, Zagreb, 006., str. 356 Može li se prihvatiti pretpostavka da se učestalost zastoja po smjeni ravna po binomnoj distribuciji? Testira se na razini 5% signifikantnosti.
binomna distribucija: n p( x) p x q n x, x x prvo treba procijeniti parametar p 0,1,,...,6 očekivana vrijednost binomne distribucije je E(x)np, a ako očekivanu vrijednost zamijenimo aritmetičkom sredinom x uzorka tada je: x npˆ ˆ p n Broj zastoja (x i ) 0 1 3 4 5 6 Broj smjena (f i ) 35 115 130 75 30 10 5 Σ f i x i f i 0 115 60 5 10 50 30 Σ x i f i x 7 i 1 7 f i 1 i f x i i 800 400 x 1 ˆ p 0. 3333 qˆ n 6 3 0. 6667
pretpostavljena binomna distribucija s procijenjenim parametrom: 6 x 6 x p( x) 0. 3333 0. 6667, x x 0,1,,...,6 očekivane frekvencije, ako se broj zastoja ravna po navedenoj binomnoj distribuciji: e i 400p(x i )
broj zastoja x i broj smjena f i p(x i ) očekivane frekvencije e 400p(x i i ) f i -e i (f i -e i ) (f i -e i ) /e i 0 35 0.0878 35.1-0.1 0.0144 0.00041 1 115 0.634 105.36 9.64 9.996 0.880 130 0.39 131.68-1.68.84 0.0143 3 75 0.195 87.80-1.80 163.8400 1.86606 4 30 0.083 3.9 -.9 8.564 0.5900 5 10 0.0165 6.60 + 0.5 7.88 6.0944 8.711 6 5 0.0013 * * * * UKUPNO 400 1.0000 400.00 0-11.75004 * Očekivana frekvencija posljednje grupe je manja od (iznosi 0.5) pa je pribrojena prethodnoj očekivanoj frekvenciji. Razlika 7.88 u petom stupcu dobivena je: (10+5)-(6.60+0.5)7.88
Hipoteze: H 0 distribucija zastoja po smjeni u populaciji ravna se prema binomnoj distribuciji, H 1 distribucija zastoja po smjeni u populaciji ne ravna se prema binomnoj distribuciji. empirijska χ vrijednost: χ 11.75004 teorijska χ vrijednost uz razinu signifikantnosti od 5% i uz stupanj slobode ssk-g-16-1-14 jer je procijenjen jedan parametar, a posljednje dvije grupe su spojene u jednu iznosi: χ 0.05 (4)9.48773 Odluka: budući je empirijska hi-kvadrat vrijednost veća od teorijske odbacuje se nulta hipoteza. Na danoj razini signifikantnosti ne prihvaća se pretpostavka da uzorak potječe iz populacije koji se raspoređuje prema binomnoj distribuciji.
PRIMJER. Na temelju evidencije o dnevnoj prodaji televizora u boji u robnoj kući MA-RK dobivena je ova distribucija: Prodani televizori (u kom.) 0 1 3 4 5 6 7 8 Broj dana 5 17 5 3 15 8 4 1 Izvor: Šošić, I., Primijenjena statistika, Školska knjiga, Zagreb, 006., str. 36 Može li se prihvatiti pretpostavka da navedeni podaci potječu iz populacije koji se raspoređuje prema Poissonovoj distribuciji s parametrom 3 prodana televizora u boji? Testira se na razini 5% signifikantnosti.
3 e 3 x! Poissonova distribucija, λ 3 : p( x), x 01,,,..., 8 x Prodani TV aparati x i broj dana f i p(x i ) očekivane frekvencije e i 100p(x i ) f i -e i (f i -e i ) (f i -e i ) /e i 0 5 0.0498 4.98 0.0 0.0004 0.0001 1 17 0.1494 14.94.06 4.436 0.840 5 0.40.40.60 6.7600 0.3018 3 3 0.40.40 0.60 0.3600 0.0161 4 15 0.1680 16.80-1.80 3.400 0.199 5 8 0.1008 10.08 -.08 4.364 0.49 6 4 0.0504 5.04-1.04 1.0816 0.146 7 0.016.16+0.81.97 0.03 0.0009 0.0003 8 1 0.0081 * * * * UKUPNO 100 1.0000 100 0 1.4390
Hipoteze: H 0 distribucija dnevne prodaje televizora u boji u populaciji ravna se prema Poissonovoj distribuciji, H 1 distribucija dnevne prodaje televizora u boji u populaciji ne ravna se prema Poissonovoj distribuciji. empirijska χ vrijednost: χ 1.4390 teorijska χ vrijednost uz razinu signifikantnosti od 5% i uz stupanj slobode ssk-g-18-0-17 jer nije procijenjen nijedan parametar, a posljednje dvije grupe su spojene u jednu iznosi: χ 0.05 (7)14.0671 Odluka: budući je empirijska hi-kvadrat vrijednost manja od teorijske prihvaća se nulta hipoteza. Na danoj razini signifikantnosti prihvaća se pretpostavka da uzorak potječe iz populacije koja se raspoređuje prema Poissonovoj distribuciji s parametrom λ3.
13.. TESTIRANJE HIPOTEZE O JEDNAKOSTI PROPORCIJA TRIJU ILI VIŠE OSNOVNIH SKUPOVA polazi se od nulte i alternativne hipoteze: nulta hipoteza sadrži tvrdnju da svi osnovni skupovi imaju jednaku proporciju p, tj. H 0 p 1 p p 3 p k p alternativna hipoteza sadrži tvrdnju da postoje statistički značajne razlike između proporcija promatranih skupova: H 1 p 1 p p 3 p k ukoliko je izračunati hi-kvadrat veći od teorijskog (određenog razinom signifikantnosti i brojem stupnjeva slobode) odbacuje se nulta hipoteza i prihvaća alternativna hipoteza
postupak: iz promatranih osnovnih skupova izaberu se uzorci opsega n 1, n,,n k, ustanovi se koliko je elemenata u svakom uzorku promatranog obilježja, tj. ustanovi se M u1, M u,, M uk, izračuna se opća proporcija osnovnog skupa P izračunaju se očekivane frekvencije e i : izračunava χ : k i 1 k i 1 M χ n ui i k i 1 ( M e ) ui e i i ei nip, i 1,,..., k
PRIMJER 3. Jedna tekstilna tvornica proizvodi muška odijela u četiri stasa. Da se ispita odgovara li proizvodnja po stasovima prodaji, slučajnim izborom izabran je određeni broj prodavaonica u kojima je evidentirana prodaja po stasovima. Ispitivanja proizvodnje i prodaje pokazala su sljedeće: Stas A B C D Proizvodnja 16 406 40 50 Prodaja 58 186 40 1 Izvor: Kero, K., Bojanić-Glavica B., Statistika u primjerima, FOI Varaždin, Varaždin 003., str. 34 Može li se prihvatiti pretpostavka da proizvodnja odgovara zahtjevima tržišta? Testira se na razini 1% signifikantnosti.
Opća proporcija osnovnog skupa: P 4 i Mui 1 58 + 186 + 40 + 1 4 0. 3601 16 + 406 + 40 + 50 n i 1 i stas proizvodnja n i prodaja M ui očekivane frekvencije e i n i P M ui -e i (M ui -e i ) (M ui -e i ) /e i A 16 58 45.376 1.674 159.451 3.5143 B 406 186 146.006 39.7994 1583.99 10.8343 C 40 40 86.440-46.440 155.1878 4.9374 D 50 1 18.0050-6.0050 36.0600.008 UKUPNO 8 96 96 0 41.888
Hipoteze: H 0 p A p B p C p D, H 1 p A p B p C p D empirijska χ vrijednost: χ 41.888 teorijska χ vrijednost uz razinu signifikantnosti od 1% i uz stupanj slobode ssk-g-14-0-13 jer nije procijenjen nijedan parametar: χ 0.01 (3)11.3449 Odluka: budući je empirijska hi-kvadrat vrijednost veća od teorijske odbacuje se nulta hipoteza. Na danoj razini signifikantnosti odbacuje se pretpostavka da proizvodnja muških odijela po stasovima odgovara zahtjevima tržišta iz uzorka.
13.3. TESTIRANJE HIPOTEZE O NEOVISNOSTI DVAJU OBILJEŽJA JA ELEMENATA OSNOVNOG SKUPA ispituje se postoji li povezanost između dvaju nominalnih obilježja elemenata osnovnog skupa nulta hipoteza kaže da su dva obilježja elemenata osnovnog skupa međusobno neovisna, a alternativnom hipotezom postavlja se suprotna tvrdnja elementi uzorka se grupiraju prema dva promatrana obilježja, a dobivene frekvencije m ij, gdje i označava red (i1,,,r), a j stupac (j1,,c) su opažene frekvencije frekvencije koje se računaju za slučaj kad je nulta hipoteza istinita nazivaju se očekivane frekvencije e ij : e ij n. j n n i. n.j je suma opaženih frekvencija po stupcima n i. je suma opaženih frekvencija po redovima
Podaci iz uzorka klasificirani prema oblicima obilježja A i B predočeni tabelom kontigence Modaliteti obilježja ja A B 1 Modaliteti obilježja ja B B B i B r Ukupno A 1 n 11 n 1 n 1i n 1r n 1. A n 1 n n i n r n. A J n J1 n J n Ji n Jr n J. A c n c1 n c n ci n cr n c. Ukupno n.1 n. n.i n.r n
empirijski χ : χ i 1 j 1 ( m e ) teorijski χ čita se iz tablice za zadanu razinu signifikantnosti i izračunati broj stupnjeva slobode broj stupnjeva slobode: ss(r-1)(c-1) r c ij e ij ukoliko je empirijski hi-kvadrat manji od teorijskog (određenog razinom signifikantnosti i brojem stupnjeva slobode) prihvaća se nulta hipoteza i kaže se da je moguće da između promatranih dvaju obilježja elemenata nekog skupa nema statistički značajne veze ukoliko je empirijski hi-kvadrat veći od teorijskog prihvaća se alternativna hipoteza s tvrdnjom da postoji zavisnost između dvaju obilježja elemenata osnovnog skupa ij
kada se prihvati alternativna hipoteza koeficijentom kontigence može se mjeriti jakost zavisnosti obilježja: C χ χ + n ako se testira hipoteza o neovisnosti u tabeli dimenzije, kad je broj stupnjeva slobode jednak 1, a n>40, potrebno je koristiti Yatesovu korekciju test-veli veličine ine: od svake apsolutne razlike empirijskih i očekivanih vrijednosti oduzme se 0.5, a zatim se dobivena veličina kvadrira
PRIMJER 4. Rezultati dobiveni ispitivanjem na uzorku ovisnosti o sklonosti proizvodu i veličini prihoda: prosječna mjesečna plaća u posljednja tri mjeseca ( ) stalno kupuje sklonost potrošnji povremeno ne kupuje kupuje ukupno do 1000 70 17 1 108 1000 1500 165 56 8 49 1500 500 195 85 6 306 500 i više 170 4 5 37 ukupno 600 00 100 900 Izvor: Šošić, I., Primijenjena statistika, Školska knjiga, Zagreb, 006., str. 361 Do kakvog se zaključka dolazi na temelju navedenih podataka iz uzorka? Testira se na razini 5% signifikantnosti.
veličina uzorka: n900 frekvencije dane u tabeli su opažene frekvencije n ij izračunajmo potrebnih 1 očekivanih frekvencija: e ij n. j n1 1 108 600 e. 11 7. 00 n 900 n1 108 00 e. 1 4. 00 n 900 n1 3 108 100 e. 13 1. 00 n 900 n 1 49 600 e. 1 166. 00 n 900 n 49 00 e. 55. 33 n 900 n 3 49 100 e. 3 7. 67 n 900 n3 1 306 600 e. 31 04. 00 n 900 n3 306 00 e. 3 68. 00 n 900 n3 3 306 100 e. 33 34. 00 n 900 n4 1 37 600 e. 41 158. 00 n 900 n4 37 00 e. 4 5. 67 n 900 n4 3 37 100 e. 43 6. 33 n 900 n n i.
Na temelju opaženih frekvencija n ij i očekivanih frekvencija e ij izradi se tabela na osnovi koje se može izračunati χ -kvadrat: n ij 70,00 e ij 7,00 n ij ij m ij -,00 (n ij ij m ij 4,00 ij ) (n ij ij m ij ) / e ij 0,06 17,00 4,00-7,00 49,00,04 1,00 1,00 9,00 81,00 6,75 165,00 166,00-1,00 1,00 0,01 56,00 55,33 0,67 0,45 0,01 8,00 7,67 0,33 0,11 0,00 195,00 04,00-9,00 81,00 0,40 85,00 68,00 17,00 89,00 4,5 6,00 34,00-8,00 64,00 1,88 170,00 158,00 1,00 144,00 0,91 4,00 5,67-10,67 113,85,16 5,00 6,33-1,33 1,77 0,07 Σ900 900,00 Σ 900,00 Σ 0,00 Σ 89,18 Σ 18,53
Hipoteze: H 0 klasifikacije kupaca prema obilježju sklonost potrošnji i plaći u populaciji su neovisne H 1 klasifikacije kupaca prema obilježju sklonost potrošnji i plaći u populaciji nisu neovisne empirijska χ vrijednost: χ 18.53 teorijska χ vrijednost uz razinu signifikantnosti od 5% i uz stupanj slobode ss(r-1)(c-1) 36: χ 0.05 (6)1.5916 Odluka: budući je empirijska hi-kvadrat vrijednost veća od teorijske odbacuje se nulta hipoteza. Na danoj razini signifikantnosti odbacuje se pretpostavka da je sklonost potrošača proizvodu neovisna njihovoj plaći. χ χ + n 18. 53 18. 53+ 900 koeficijent kontigence: C 0. 140
PRIMJER 5. Jedno poduzeće koje u svojim pogonima, između ostaloga, proizvodi zubnu pastu XY organiziralo je ispitivanje o izgledu ambalaže u koju se pakira zubna pasta. Ispitivanja na jednom slučajno odabranom uzorku imala su ove rezultate: ocjena ne zadovoljava zadovoljava muški 416 108 spol ženski 51 156 Izvor: Kero, K., Bojanić-Glavica B., Statistika u primjerima, FOI Varaždin, Varaždin 003., str. 40 Do kakvog se zaključka dolazi na temelju navedenih podataka iz uzorka? Testira se na razini 1% signifikantnosti.
ocjena muški spol ženski ukupno ne zadovoljava 416 51 98 zadovoljava 108 156 64 ukupno 54 668 119 veličina uzorka: n119 frekvencije dane u tabeli su opažene frekvencije n ij izračunajmo potrebne 4 očekivane frekvencije: n1 1 98 54 e. 11 407. 95 n 119 n1 98 668 e. 1 50. 05 n 119 n 1 64 54 e. 1 116. 05 n 119 n 64 668 e. 147. 95 n 119
stupanj slobode je jednak 1, a veličina uzorka n119>40 što znači da treba primijeniti Yatesovu korekciju test-veličine n ij 416 e ij 407,95 n ij ij m ij - 0,5 7,55 ( n ij m ij - 0,5 ) 57,005 ( n ij m ij - 0,5 ) / e ij 0,14 51 50,05 7,55 57,005 0,11 108 116,05 7,55 57,005 0,49 156 147,95 7,55 57,005 0,39 Σ119,00 Σ 119,00 Σ 30, Σ 8,01 Σ 1,13 Hipoteze: u u H 0 H 1 klasifikacije kupaca prema spolu i ocjeni zubne paste populaciji su neovisne klasifikacije kupaca prema spolu i ocjeni zubne paste populaciji nisu neovisne
empirijska χ vrijednost: χ 1.13 teorijska χ vrijednost uz razinu signifikantnosti od 1% i uz stupanj slobode ss(r-1)(c-1)1: χ 0.01 (1)6.6349 Odluka: budući je empirijska hi-kvadrat vrijednost manja od teorijske prihvaća se nulta hipoteza. Na danoj razini signifikantnosti prihvaća se pretpostavka da je ocjena potrošača zubne paste neovisna njihovom spolu.