PROCJENE PARAMETARA POPULACIJE
Iferecijala statistika je skup postupaka kojima se a osovi rezultata iz uzorka doose zaključci o populaciji. INFERENCIJALNA STATISTIKA Procjee parametara Testiraje hipoteza o parametrima Parametri populacije: aritmetička sredia, total, proporcija, varijaca i dr.
Populacija (osovi skup) skup podataka o promotreom svojstvu svih jediica statističkog skupa za koji se doosi zaključak a temelju uzorka. Uzorak podskup populacije 3
Metode izbora uzorka Namjera i slučaja izbor uzorka: Namjeri izbor uzorka jediice iz populacije izabiru se prema ahođeju istraživača (amjero) Slučaji izbor uzorka objektiva izbor, osova u primjei metoda iferecijale statistike 4
Jedostavi slučaji izbor (jedostavi slučaji uzorak); egl. simple radom sample): sve jediice u koačoj populaciji imaju pozatu i jedaku vjerojatost izbora. U beskoačoj populaciji ačelo izbora slučajog uzorka satoji se u tome da je izbor jediica u uzorak ezavisa. Na rezultate slučajog uzorka može se primijeiti teorija vjerojatosti. Moguće je izmjeriti pogrešku astalu uslijed rada a dijelu podataka, a e a cijeloj populaciji. 5
Izbor slučajog uzorka po plau uzorka: Jedostavi slučaji uzorak svaka jediica u populaciji ima jedaku vjerojatost da bude izabraa u uzorak. Sistematski uzorak slučaji uzorak u kojem izbor jediica ovisi o koraku izbora k=n/. Iz populacije veličie N izabire se svaka k-ta jediica, uz uvjet da se redi broj prve jediice koja ulazi u uzorak određuje slučajim izborom brojeva od 1 do k. 6
Stratificirai uzorak ako osovi skup ije homoge. Osovi skup se podijeli u homogee grupe (stratume). Iz svakog stratuma se izabire jedostavi slučaji uzorak, sadrži izabrae jediice iz svih grupa (stratuma), Uzorak skupia (klasterski uzorak) kada je ispitivaje s pomoću stratificiraog uzorka vrlo skupo, ili e postoji okvir izbora ili su jediice skupa geografski rasprostrajee. Heteroge je uutar grupa, ali homoge između grupa, sadrži izabrae jediice samo iz izabraih skupia (klastera). 7
Jedostavi slučaji uzorak (egl. simple radom sample SRS) je slučaji vektor od kompoeata, odoso iz od slučajih varijabli X1, X,..., X koje su ezavise i jedako distribuirae, tj. imaju jedaku distribuciju vjerojatosti. Slučaja varijabla X 1 Slučaja varijabla X Slučaja varijabla X x 1, x,,..., x x, 1 x,,..., x x, 1 x,,..., x
Ako se pretpostavi da se iz beskoače populacije izabiru svi mogući uzorci veličie, tada je takvih uzoraka beskoačo mogo. Prilikom izbora kokretog uzorka svaka od slučajih varijabli poprima samo jedu vrijedost. Skup vrijedosti x1, x,..., x je opažei uzorak (egl. observed sample). 9
Vrijedosti koje su u svakom uzorku izabrae a prvo mjesto čie skup vrijedosti slučaje varijable X1, vrijedosti koje su u svakom uzorku izabrae a drugo mjesto čie skup vrijedosti slučaje varijable X, odoso vrijedosti koje su u svakom uzorku izabrae a zadje mjesto čie skup vrijedosti slučaje varijable X. x1, x, 1 x, 1 x x x,,,,...,,...,,..., x x x uzorak uzorak i td. 10
Sistematski izbor jedostavog slučajog uzorka veličie iz koače populacije veličie N Okvir izbora je popis svih umeriraih jediica skupa. N Korak izbora k Iz populacije veličie N izabire se svaka k -ta jediica, uz uvjet da se redi broj prve jediice koja ulazi u uzorak, određuje slučajim izborom brojeva od 1 do k. Frakcija izbora f N
Izbor slučajog uzorka: iz koače i beskoače populacije i izbor može biti s poavljajem i bez poavljaja Izbor s poavljajem: V N uzoraka N Izbor bez poavljaja: C uzoraka Ako je osovi skup N velik u odosu a uzorak, tada su rezultati izbora jediica bez poavljaja približo ezavisi i e razlikuju se začajo od rezultata izbora jediica s poavljajem. To će se dogoditi kada je frakcija izbora uzorka f maja od 5%. f N
Kod procjejivaja potrebo je defiirati procjeitelja epozatog parametra i odrediti kakvog je oblika jegova distribucija vjerojatosti. Na temelju podataka iz slučajo izabraog uzorka veličie i pozavaja distribucije vjerojatosti procjeitelja, tzv. samplig-distribucije procjeitelja, može se izračuati procjea parametra jedim brojem i itervala procjea tog parametra. Procjeitelj je slučaja varijabla (defiiraa formulom) kojom se procjejuje parametar populacije, dok se kokreta vrijedost procjeitelja, dobivea a uzorku podataka je procjea. 13
Kokrete vrijedosti procjeitelja određeog parametara razlikovat će se od uzorka do uzorka. Prosječo odstupaje kokretih vrijedosti procjeitelja od stvare vrijedosti parametra populacije kreće se u graicama slučajih varijacija. Te varijacije se azivaju samplig-varijacije, a distribucija vjerojatosti procjeitelja se aziva samplig-distribucija ili samo distribucija procjeitelja. Procjeitelj se aziva samplig-varijablom. Određivaje samplig-distribucije: eksperimetalo ili teorijski. 14
Procjejivaje parametara populacije a osovi jedostavog slučajog uzorka odoso pojediačih vrijedosti x x..., 1,, x Ako je epozati parametar populacije tada je slučaja varijabla procjeitelj parametra. ˆ f X, X,..., 1 X 15
Izborom kokretog uzorka, varijable iz uzorka X1, X,,X poprimaju određee umeričke vrijedosti x1, x,, x, a varijabla ˆ f X1, X,..., X poprima vrijedost ˆ. f x, x,..., Ta se vrijedost zove procjea parametra jedim brojem (egl. poit estimate). 1 x 16
Nepristraa procjea parametra f ˆ E ˆ ˆ ˆ - stadarda pogreška procjee parametra 17
Procjea parametra populacije Procjea jedim brojem Itervala procjea Itervala procjea je: procjea jedim brojem (koeficijet pouzdaosti) (stadarda pogreška) 18
Procjea aritmetičke sredie populacije Važo je pozavati oblik samplig distribucije aritmetičkih sredia, jeu očekivau vrijedost i jeu stadardu devijaciju. 19
Ako je populacija koača, samplig-distribucija se aproksimira distribucijom relativih frekvecija vrijedosti procjeitelja, dobiveom a koačom i velikom broju uzoraka. Pri tome svaki uzorak daje jedu vrijedost procjeitelja. Formira se distribucija relativih frekvecija (proporcija) koja je aproksimacija samplig-distribucije. 0
Određivaje distribucije vjerojatosti (sampligdistribucije) aritmetičkih sredia eksperimetalo (višestrukim poavljajem eksperimeta). Primjer: Osovi skup čie tri vrijedosti umeričke varijable X=,4,6. Iz koače populacije veličie N=3 izabiru se svi uzorci s poavljajem veličie =. N i i1 6 N x 4 3 4 1
x i x,,4,6 4, 4,4 4,6 6, 6,4 6,6 3 4 3 4 5 4 5 6 Aritmetičke sredie uzoraka, 3 4 5 6 f p x i ( x i ) ( x i ) 1 3 1 1/9 /9 3/9 /9 1/9
x i x i p ( x i ) p( x i ) x i p( x i ) 1/9 /9 4/9 3 /9 6/9 18/9 4 3/9 1/9 48/9 5 /9 10/9 50/9 6 1/9 6/9 36/9 Ukupo 1 36/9=4 156/9 E X 5 36 xi p xi 4 9 0 i1 E X 3
x i x i p ( x i ) p( x i ) x i p( x i ) X 1/9 /9 4/9 3 /9 6/9 18/9 4 3/9 1/9 48/9 5 /9 10/9 50/9 6 1/9 6/9 36/9 Ukupo 1 36/9=4 156/9 3 x 1,640 i1 5 i1 x i i p x i 156 9 x 4 1,1547 4
Stadarda pogreška procjee aritmetičke sredie X X 1,15 1,640 X 1,640 1,15 5
Kada se slučaji uzorak izabire bez poavljaja iz koače populacije, rezultati izbora jediica u uzorak isu ezavisi, tj. kovarijace između varijabli uzorka X1, X,..., X isu jedake uli. Tada je stadarda pogreška aritmetičke sredie X N N 1 6
Određivaje distribucije vjerojatosti (sampligdistribucije) aritmetičkih sredia teorijski. Matematički se izvodi distribucija procjeitelja za bilo koju populaciju ako se pozaju karakteristike populacije. Samplig-distribucija procjeitelja je distribucija vjerojatosti procjeitelja dobivea a temelju beskoačog broja slučajih uzoraka, jedakih veličia, izabraih iz iste populacije. 7
Samplig - distribucija aritmetičkih sredia Svojstva Ako je slučaji uzorak (bilo koje veličie) izabra iz ormalo distribuirae populacije X~N(µ;σ²), s očekivaom vrijedosti jedakom µ i pozatom varijacom, samplig - distribucija aritmetičkih sredia je također ormalog oblika (bez obzira a veličiu uzorka). Ako populacija ije ormalo distribuiraa, samplig - distribucija aritmetičkih sredia je približo ormalog oblika samo za velike uzorke, >30. 8 8
Samplig - distribucija aritmetičkih sredia Svojstva Ako je slučaji uzorak izabra iz ormalo distribuirae beskoače populacije s epozatom varijacom, samplig - distribucija aritmetičkih sredia je t-distribucija s -1 stupjem slobode. 9
Slika 7..; Šošić,I.(006). PRIMIJENJENA STATISTIKA. Zagreb, Školska kjiga, straica 194. 30
Očekivaa vrijedost samplig - distribucije aritmetičkih sredia E(X ) Stadarda devijacija samplig - distribucije aritmetičkih sredia (stadarda pogreška) X 31
f Samplig distribucija aritmetičkih sredia (Normala distribucija) (X ) 0.477 0.3413 0.3413 0.477 0.4987 0.4987 3 X EX X 3 X 33
S porastom veličie uzorka, a to zači i s porastom broja stupjeva slobode, Studetova distribucija se aproksimira ormalom distribucijom 33
Procjea aritmetičke sredie osovog skupa µ Procjea jedim brojem: ˆ x i1 x i x - aritmetička sredia uzorka 34
Itervala procjea aritmetičke sredie populacije x X 1 Varijaca populacije pozata P P x z x z 1 X X Varijaca populacije ije pozata x t x t 1 X X -aritmetička sredia uzorka -aritmetička sredia populacije -stadarda pogreška procjee aritmetičke sredie -razia pouzdaosti procjee z -koeficijet pouzdaosti jediiče ormale distribucije t -koeficijet pouzdaosti t-distribucije s (-1) stupjeva 35 slobode
Određivaje koeficijeta pouzdaosti: razia pouzdaosti procjee 95%, samplig-distribucija je oblika ormale distribucije Određivaje koeficijeta pouzdaosti: razia pouzdaosti procjee 90%, samplig-distribucija je oblika ormale distribucije 36
Stadarda pogreška procjee aritmetičke sredie Pozata stadarda devijacija populacije Oviso o frakciji izbora: f N 0,05 X f N 0,05 X N N 1 37
Stadarda pogreška procjee aritmetičke sredie Nije pozata stadarda devijacija populacije Oviso o frakciji odabiraja: f N 0,05 X ˆ f N 0,05 X ˆ N N 1 38
- procjea stadarde devijacije osovog skupa 1 ˆ 1 x x i i 39 - za egrupirae podatke u uzorku ˆ 1 ˆ 1 x x f i i i 1 ˆ s - za grupirae podatke u uzorku - pozata stadarda devijacija uzorka s
Zadatak 1: Baka a kraju 015. godie, aalizira staje devizih račua. Od ukupo 0 takvih račua izabra je uzorak od 3 račua i a jima evidetirao ukupo 803 tis. EUR-a. Kolika je procjea prosječog salda po račuima, ako je epristraa procjea stadarde devijacije osovog skupa pomoću uzorka 50, tis. EUR-a? Razia pouzdaosti 99%. Iterpretirajte rezultate. 40
41 51 3 803 1 x x i i 50, ˆ 803, 0,99 ) (1,58 0, 30), ( 3 3 1 i x i je jer z N 8,87 3 50, X X ˆ jer je f<0,05
P x z x z 1 X X P 51,588,87 51,588,87 0,99 P(8,1 73,88) 0,99 Uz 99% pouzdaosti procjejuje se da je prosječi saldo po račuima za sve račue u baci, a kraju 015. godie, između 8,1 i 73,88 tis. eura. 4
Procjea totala populacije Total T osovog skupa je zbroj vrijedosti umeričkog obilježja svih jediica statističkog skupa. N xi T i1 T N N N Tˆ Nx Procjea totala populacije jedim brojem T ili T ˆ ili X x 43
44 Itervala procjea totala populacije ) (1 ) ˆ ˆ ( ˆ / ˆ / T T t T T t T P ) (1 ) ˆ ˆ ( ˆ / ˆ / T T z T T z T P Stadarda pogreška procjee totala T N X ˆ
Itervala procjea totala populacije a temelju itervala procjee aritmetičke sredie uz istu raziu pouzdaosti Iterval procjee aritmetičke sredie P x z x z 1 X X P Iterval procjee totala sredie N x z Nx z 1 X X 45
Itervala procjea totala populacije a temelju itervala procjee aritmetičke sredie uz istu raziu pouzdaosti Iterval procjee aritmetičke sredie P x t x t 1 X X Iterval procjee totala sredie P N x t Nx t 1 X X 46
Zadatak : Provedeo je istraživaje o prosječoj mjesečoj prodaji šećera u lacu 3155 trgovia a malo, približo jedakih veličia i strukture prodaje. U uzorku od 35 trgovia utvrđea je prosječa mjeseča prodaja šećera od 50,4 kg. Procjea stadarde devijacije osovog skupa izosi 10,15. Odredite graice 90%-tog itervala procjee ukupe prodaje šećera u lacu 3155 prodavaoica. 47
N 3155, 35, x 50.4, ˆ 10.15 f N 35 0,0111 0,05 3155 X ˆ 10.15 35 1.716 48
ˆ z T Tˆ z 1 P T Tˆ Tˆ Tˆ Nx 315550.4 158507 T N ˆ X 31551,716 5413,98 P(158507 1,655413,98 158507 1,655413,98) T 0,90 P 1576138,933 T 1594 005,067 0,90 49
Određivaje veličie uzorka za procjeu aritmetičke sredie populacije Veličia uzorka određea je: -raziom pouzdaosti procjee, -varijacom populacije, -koačom ili beskoačom populacijom, -graicom pogreške; d (eg. margie of error (ME, SE), 50
d z z, X X X d d 51
5 d z d z z d z z d z d
Određivaje veličie uzorka za procjeu aritmetičke sredie populacije Pogreška zadaa apsoluto (u mjerim jediicama varijable), d z / 0 d f 0 0 N 1 0 0 f 0 f f 0 0 0,05 0,05 53
pri čemu je: 0 - početa veličia uzorka - koača veličia uzorka z / - koeficijet pouzdaosti - stadarda devijacija populacije d - pogreška procjee izražea apsoluto (u mjerim jediicama varijable) 54
Zadatak 3: Procjejuje se prosječo vrijeme trajaja bakarske usluge u odjelu osobog bakarstva jede bake. U procjei se tolerira pogreška od ± 0,5 miute. Procjejuje se s pouzdaosti 95%. Plaska veličia stadarde devijacije populacije je miute, frakcija izbora je maja od 0,05. Koliko je komiteata u odjelu osobog bakarstva potrebo izabrati u jedostavi slučaji uzorak da bi se proveo postupak procjee parametra? 55
d 0,5, 1 0,95 ( z 1,96), 0 z / d 1,96 0,5 61,4656 N, 0 61 56
Ako je pogreška procjee izražea relativo, d r z / 0 V d r f 0 0 N 1 0 0 f 0 f f 0 0 0,05 0,05 V - koeficijet varijacije populacije d r - pogreška procjee izražea relativo 57
Zadatak 4: Procjejuje se prosječa mjeseča potrošja plave ribe po staoviku a području X. Koliko staovika treba izabrati u jedostavi slučaji uzorak ako je pouzdaost procjee 90%? Tolerira se pogreška procjee od ajviše ±%. Plaska veličia koeficijeta varijacije populacije je 0%. Pretpostavlja se da je frakcija izbora maja od 5%. 58
d r %, 1 0,90 ( z f 0,05, V 0% 1,65), 0 z / V d r 1,65 0 1,650,0 0,0 7,5, 0 7 59
Procjea proporcije populacije Potrebo je utvrditi svojstva procjeitelja od p, te odrediti samplig-distribuciju stadardiziraog procjeitelja od p. 60
Pretpostavlja se da je varijabla X u populaciji Beroullijeva slučaja varijabla s epozatom očekivaom vrijedosti, tj. s epozatim parametrom p, koji se procjejuje a temelju izabraog jedostavog slučajog uzorka. Varijable uzorka X1, X,..., X su ezavise i jedako distribuirae, kao i varijabla X u populaciji. također su Beroullijeve slučaje varijable koje su ezavise, te mogu poprimiti vrijedosti 0 ili 1. 61
Berullijeva slučaja varijabla X X :0,1 Var X E X p q p q 1 p 6
Varijable X1, X,..., X međusobo su ezavise (jer su pojedii pokušaji izbora ezavisi) i imaju istu distribuciju vjerojatosti kao i slučaja varijabla X, tj. te su varijable Beroullijeve varijable. Slučaja varijabla X 1 Slučaja varijabla X Slučaja varijabla X x 1, x,,..., x x, 1 x,,..., x x, 1 x,,..., x
Vrijedosti koje su u svakom uzorku izabrae a prvo mjesto čie skup vrijedosti slučaje varijable X1, vrijedosti koje su u svakom uzorku izabrae a drugo mjesto čie skup vrijedosti slučaje varijable X, odoso vrijedosti koje su u svakom uzorku izabrae a zadje mjesto čie skup vrijedosti slučaje varijable X. x1, x, 1 x, 1 x x x,,,,...,,...,,..., x x x uzorak uzorak i td. 64
Procjeitelj parametra p defiira se kao aritmetička sredia varijabli uzorka: p Xi 1 X X 1... ˆ i X p zbroj Berullijevih ezavisih slučajih varijabli X i i1 je slučaja varijabla biome distribucije s očekivaom vrijedosti Var X i1 i pq E X i1 i p i varijacom
66 q p q p pq X Var X Var p Var p p X E X E p E p i i i i i i i i ˆ 1 1 1 1 1 1 ˆ 1 1 ˆ Očekivaa vrijedost i varijaca procjeitelja pˆ
Distribucija vjerojatosti procjeitelja je bioma distribucija, o za dovoljo veliki može se aproksimirati ormalom distribucijom. pˆ 67
Procjea proporcije osovog skupa, p Procjea jedim brojem: p ˆ m m broj jediica u uzorku s tražeim svojstvom veličia uzorka pˆ - procjea proporcije, proporcija uzorka 68
Samplig - distribucija proporcije je približo ormalog oblika ako je veličia uzorka dovoljo velika. E pˆ Var pˆ p p q Stadarda pogreška procjee proporcije(stadarda devijacija samplig distribucije) : pˆ pˆ pq ˆ ˆ, 1 pq ˆ ˆ 1 N N, 1 f 0,05 f 0,05 69 69
Procjea proporcije itervalom P pˆ z p pˆ z 1 pˆ pˆ z koeficijet pouzdaosti, povezao s raziom pouzdaosti (1-) pˆ - stadarda pogreška procjee proporcije 70
Zadatak 4: Od 7000 zaposleih jedog poduzeća izabra je jedostavi slučaji uzorak veličie 700 zaposleih. Tijekom ožujka 016. godie praćea je redovitost jihova dolažeja a posao. Ustaovljeo je da je od 700 jih, 665 redovito dolazilo a posao tijekom cijelog mjeseca. Ostali su kasili a posao u više od 10 radih daa. Na temelju rezultata tog uzorka izračuajte graice itervala procjee proporcije zaposleika poduzeća koji a posao kase u više od deset radih daa u mjesecu. Pouzdaost procjee 95% 71
700, N 7000, m (1 ) 0,95, z 1,96, p 0, 05 m 665, m 35 ˆ 35 700 f 700 7000 0,10 f 0,05 p ˆ pq ˆ ˆ 1 N N 1 7
73 0,00781 1 7000 700 7000 1 700 0,95 0,05 1 1 ˆ ˆ ˆ N N pq p 95 0, 0,1347 0,0347 0,95 0,00781 1,96 0,05 0,00781 1,96 0,05 p P p P 1 ˆ ˆ ˆ ˆ p p z p p z p P
Određivaje veličie uzorka za procjeu proporcije populacije, p 74 / 0 d z N f 0 0 0,05 1 0,05 0 0 0 0 0 f f f pogreška procjee izražea apsoluto, d
pri čemu je: 0 - početa veličia uzorka - koača veličia uzorka z / - koeficijet pouzdaosti - stadarda devijacija populacije d - pogreška procjee izražea apsoluto 75
pogreška procjee izražea relativo, d r z / 0 V d r 0 N 1 f 0 0 0 f 0 f f 0 0 0,05 0,05 V - koeficijet varijacije populacije d r - pogreška procjee izražea relativo 76
Ako pri određivaju veličie uzorka za procjeu proporcije isu pozati (zadai) stadarda devijacija ili koeficijet varijacije populacije, pretpostavlja se ajepovoljiji slučaj, tj. p q 0,5 pq 0,5 0,5 V pq p 100% 0,5 0,5 100 0,5 0,5 100 100% 77
Zadatak 5: Koliko je tvrtki u prerađivačkoj idustriji u jedoj regiji potrebo izabrati u jedostavi slučaji uzorak ako se procjejuje proporcija tvrtki koje u drugom tromjesečju 016. godie isu poslovale s gubitkom (uslijed recesije i smajeja proizvodje). U avedeoj regiji registrirao je 635 poslovih subjekata u području prerađivačke idustrije. Pouzdaost procjee je 95%, a pogreška koja se u procjei tolerira je ±3%. 78
N 635, 1 0,95, z 1,96, d 03 0, p q 0,5, pq 0,5 z / 0 d 1,960,5 0,03 1067,11 79
f 0 N 0 1067,11 635 0,17114 f 0 0,05 1 0 f 0 1067,11 1 0,17114 911,17 911 80
Zadatak 6: Procjejuje se proporcija osoba u jedom gradu koje amjeravaju kupiti automobil u sljedeća tri mjeseca. Koliko osoba treba izabrati u jedostavi slučaji uzorak ako je pouzdaost procjee 90%, a ajveća dozvoljea pogreška pri procjei izražea relativo izosi 4%. Pretpostavlja se da je frakcija izbora maja od 5%. 81
1 0,90, z 1,65, dr 0,05 4, f?????? 0 z V d r 1,65100 4 1,651 0,04 1701,56 8