Sadrˇzaj Sadrˇzaj 1 11 MATEMATIČKA STATISTIKA 3 11.1 DESKRIPTIVNA STATISTIKA..................... 5 11. Poovimo................................. 15 1
Radi materijal
Poglavlje 11 MATEMATIČKA STATISTIKA Matematička statistika je zastvea disciplia koja provjerava matematičke modele slučajog pokusa u realosti. Proučava svojstva slučajog uzoraka i doosi zaključke o populaciji iz koje je uzet slučaji uzorak. Statističke metode daju zaključke s ekom vjerojatošću pa se temelje a teoriji vjerojatosti. Deskriptiva statistika bavi se uredivajem prikupljeih, empirijskih podataka, jihovim grafičkim prikazivajem i opisivajem pomoću umeričkih vrijedosti: prosjek, stadarda devijacija, korelacijski koeficijet,... Iduktiva statistika (Iferecijala statistika )bavi se metodama koje se zasivaju a teoriji vjerojatosti i koje omogućavaju da se doose zaključci o populaciji pomoću uzoraka iz populacije. Tri pravca u matematčkoj statistici (iduktivoj statististici) su: teorija procjee, teorija testiraja statističkih hipoteza, teorija plairaja eksperimeata. U teoriji procjee osvut ćemo se a: točkaste procjeitelje, metodu max vjerojatosti za odredivaje procjeitelja,tko želi zati više itervale povjereja za procjeitelje za parametre ormale razdiobe. U teoriji testiraja osvut ćemo se a: test hipoteze o parametrima ormale razdiobe, 3
Teorija plairaja eksperimeta razvija metodu sekvecijale aalize, broj promatraja je slučaja, pa se provjera statstičkih hipoteza ovom metodom izvodi postepeo, u etapama. Hipoteza se može prihhvatiti, odbiti ili produžiti eksperimet. Radi materijal 4
11. MATEMATIČKA STATISTIKA 11.1 DESKRIPTIVNA STATISTIKA Defiicija 11.1 (POPULACIJA) Populacija (osovi skup, statistički skup) je skup svih elemeata od kojih bismo mogli uzeti podatke o odredeim veličiama. Populacija može biti koača ili beskoača. PRIMJER 11.1 Populacija - sve obitelji u jedoj zgradi. Veličie koje možemo razmatrati: broj djece, mjeseči dohodak.. Defiicija 11. (STATISTIČKA VARIJABLA-OBILJEŽJE) Statističko obilježje (vaijabla) je umeričko svojstvo elemeata statističkog skupa. Ako je skup vrijedosti R(X) statističkog obilježja diskreta oda za X kažemo da je diskreto obilježje, a ako je R(X) R kažemo da je kotiuirao obilježje. Uzorak je podskup populacije koji uzimamo a uaprijed odrede ači. Defiicija 11.3 (FREKVENCIJA, RELATIVNA FREKVENCIJA, KUMULATIVNA RELATIVNA FREKVENCIJA, ARITMETIČKA SREDINA, VARIJANCA, STANDARDNA DEVIJACIJA) Neka je X statističko obilježje i eka se mjereje poovi, koačo mogo puta (ezaviso) i dobije statističkih podataka x i, i = 1,..,. Slika R(X)={x, k = 1,.., r} k sadrži r različitih statističkih podataka. Ako se x k pojavi f k puta oda kažemo da x k pripada frekvecija f k i relativa frekvecija f k, za k = 1,.., r. f Vrijedi: f k =, k = 1. k=1 k=1 Za x R kažemo da ima kumulativu relativu frekveciju F (x)= Aritmetička redia statističkih podataka x i, i = 1,.., : x = 1 x i, x = 1 x k f k. Varijaca statističkih podataka x i, i = 1,.., : σ = 1 (x i x) = 1 σ = 1 Stadarda devijacija je σ. (x k x) f k = 1 k=1 k=1 x i x, (x k ) f k x. k=1 k, x k x f k. 5 Radi materijal
11.1. DESKRIPTIVNA STATISTIKA Statističke podatke koji se dobiju mjerejem statističkog obilježja X možemo prikazati: tabličo: tablicom frekvecija i tablicom relativih frekvecija, grafički: grafikoom frekvecija, relativih frekvecija, kumulativih frekvecija, histogramom (ad dobiveim podacima x acrtai su pravokutici visie jed- k ake frekveciji f k ili relativoj frekveciji f k ), poligoom (izlomljea liija koja spaja točke (x k, f k)). Ako je veliki i skup vrijedosti ima veliki broj elemeata (posebo kod kotiuirae slučaje varijable-statističkog obilježja) formiramo r razreda. Prilikom tabličog i grafičkog prikazivaja vrijedosti slučajog uzorka a apscisu aosimo r poditervala (razreda), sa srediama razreda x, a a ordiatu sumu frekvecija f k elemeata iz tog ksr razreda. Broj razreda r poekad se račua po formulama: r =, r = 3. U praksi se koristi slijedeća shema za izbor broja razreda: r 40-60 6-8 60-100 7-10 100-00 8-1 00-500 1-17 > 500 1 PRIMJER 11. Mjerejem kotiuirae slučaje varijable X= prosječe težie studeata jedog turusa a uzorku veličie 100 dobivea je vrijedost slučajog uzorka (x 1, x,..., x 100 ) daa u tablici: razred x ksr f k f k F (x) 60-6 61 5 0,05 0,05 63-65 64 18 0,18 0,3 66-68 67 4 0,4 0,65 69-71 70 7 0,7 0,9 7-74 73 8 0,08 1,00 ukupo =100 1,00 Relative frekvecije odgovaraju pojmu statističke vjerojatosti. P(66 < X < 68) 0, 4 Radi materijal 6
11. MATEMATIČKA STATISTIKA f_{i} f i ((f_{i})/) f i 45 0,45 40 0,4 35 0,35 30 0,3 5 0 f_{i} f i 0,5 0, f i/ ((f_{i})/) f i 15 0,15 10 5 0,1 0,05 0 60-6 63-65 66-68 69-71 7-74 0 60-6 63-65 66-68 69-71 7-74 Slika 11.1: Histogrami frekvecija i relativih frekvecija iz primjera 11.. 1, F (x) F_(x) 1 0,8 0,6 F(x) 0,4 0, 0 60-6 63-65 66-68 69-71 7-74 Slika 11.: Graf kumulativih relativih frekvecija iz primjera 11.. Defiicija 11.4 (STATISTIČKA RAZDIOBA) Statističko obilježje (slučaja varijabla) X sa skupom vrijedosti R(X) opisao grafom relativih frekvecija ili grafom kumulativih relativih frekvecija ima statističku fukciju distribucije F (x). Slučaja varijabla X ima i teorijsku fukciju distribucije F(x). 7 Radi materijal
11.1. DESKRIPTIVNA STATISTIKA TEOREM 11.1 (GLIVENKO) oda je Ako su vrijedosti u uzorku slučaje varijable X (statističkog obilježja) ezavisi, P( sup F (x) F(x) 0) = 1, kad. <x< Kad je uzorak dovoljo velik, oda se s vjerojatošću skoro 1 statistička razdioba malo razlikuje od teorijske razdiobe. Defiicija 11.5 (Kvatil, medija, prvi kvartil, treći kvartil) Ako je F fukcija distribucije slučaje varijable X oda se rješeje jedadžbe F(x p ) = p zove kvatil reda p. Medija Me = x 0.5 ; F(Me) = 0.5 tj. P(X Me) = 0.5 Prvi kvartil Q 1 = x 0.5 ; F(Q 1 ) = 0.5 tj. P(X Q 1 ) = 0.5 Drugi kvartil Q = x 0.5 = Me Treći kvartil Q 3 = x 0.75 ; F(Q 3 ) = 0.75 tj. P(X Q 3 ) = 0.75 PRIMJER 11.3 Račuaje medijaa statističkog obilježja X: (A) Ako je iz statističkih podataka, vrijedosti ekog statističkog obilježja X rastući x 1 x... x, oda je Me = x +1, za epara; x + x +1, za para. PRIMJER 11.4 Odredite medija za zadai iz statističkih podataka 3 4 4 5 6 8 8 8 10, =9, epara. Me = x +1 = x 5 = 6. PRIMJER 11.5 Račuaje medijaa statističkog obilježja X: (B) Ako su vrijedosti statističkog obilježja date u razredima s odgovarajućim frekvecijama f i oda je gdje je k izabra tako da je Me = L Me + d ( f 1 + f +... + f k ), F k = ( f 1 + f +... + f k ) f 1 + f +... + f k + = F k+1, L Me je lijevi rub k + 1 razreda, d je širia razreda. Radi materijal 8
11. MATEMATIČKA STATISTIKA PRIMJER 11.6 Račuaje prvog kvartila statističkog obilježja X: (A) Ako je iz statističkih podataka, vrijedosti ekog statističkog obilježja X rastući x 1 x... x, oda je x cijelo( 4 +1), za ije djeljiv s 4; Q 1 = x 4 + x 4 +1, za djeljiv s 4. PRIMJER 11.7 Odredite prvi kvartil za iz statističkih podataka 3 4 4 5 6 8 8 8 10, = 9, ije djeljiv s 4. Q 1 = x cijelo( 4 +1) = x 3 = 4. PRIMJER 11.8 Račuaje prvog kvartila statističkog obilježja X: (B) Ako su vrijedosti statističkog obilježja date u razredima s odgovarajućim frekvecijama f i oda je gdje je k izabra tako da je Q 1 = L Q1 + d 4 ( f 1 + f +... + f k ), F k = ( f 1 + f +... + f k ) 4 f 1 + f +... + f k + = F k+1, L Q1 je lijevi rub k + 1 razreda, d je širia razreda. PRIMJER 11.9 Račuaje trećeg kvartila: (A) Ako je iz statističkih podataka, vrijedosti ekog statističkog obilježja X rastući x 1 x... x, oda je x cijelo( 3 4 +1), za ije djeljiv s 4; Q 3 = x 3 + x 3 4 4 +1, za djeljiv s 4. PRIMJER 11.10 Odredite treći kvartil iz statističkih podataka 3 4 4 5 6 8 8 8 10, = 9, ije djeljiv s 4. Q 3 = x cijelo( 3 4 +1) = x 7 = 8. PRIMJER 11.11 Račuaje trećeg kvartila: (B) Ako su vrijedosti statističkog obilježja date u razredima s odgovarajućim frekvecijama f i oda je Q 3 = L Q3 + d 3 4 ( f 1 + f +... + f k ), 9 Radi materijal
11.1. DESKRIPTIVNA STATISTIKA gdje je k izabra tako da je F k = ( f 1 + f +... + f k ) 3 4 f 1 + f +... + f k + = F k+1, L Q3 je lijevi rub k + 1 razreda, d je širia razreda. Defiicija 11.6 (MOD) Mod je vrijedost statističkog obilježja koja ima ajveću frekveciju. Može se dogoditi da mod e postoji ili da postoji više modova. PRIMJER 11.1 Odredite mod iza statističkih podataka 3 4 4 5 6 8 8 8 10. x i f i 3 1 4 5 1 6 1 8 3 10 1 x i = 8 ima maksimalu frekveciju f i = 3, Mo = 8. PRIMJER 11.13 Račuaje moda: Ako su vrijedosti statističkog obilježja date u razredima s odgovarajućim frekvecijama f i oda je Mo = L Mo + d 1 1 +, gdje je k izabra tako da je f k maksimala, L Mo je lijevi rub k tog razreda, d je širia razreda, 1 = f k f k 1, = f k. Defiicija 11.7 (koeficijet varijacije) Koeficijet varijacije je relativa mjera stadarde devijacija i račua se a dva ačia K V = σ x 100 ili pomoću kvartila K V = Q 3 Q 1 Q 3 + Q 1. Defiicija 11.8 (koeficijet asimetrije-eg. skewess) Koeficijet asimetrije za slučaju varijablu X je broj K A koji karakterizira simetriju razdiobe i defiira se kao kvocijet trećeg cetralog mometa i kuba stadarde devijacije σ : K A = µ 3 σ 3. Radi materijal 10
11. MATEMATIČKA STATISTIKA Defiicija 11.9 Koeficijet asimetrije statističkog obilježja X, ako su vrijedosti statističkog obilježja date kao iz x i s frekvecijama f i, i = 1,..., r, defiira se kao gdje je µ 3 = 1 σ = 1 K A = µ 3 σ 3, (x isr x)3 f i, ( f i = ); (x isr x) f i, ( f i = ). NAPOMENA 11.1 Ako je K A = 0 oda je razdioba frekvecija simetriča u odosu a pravac x = x oda se poklapaju x = Me = Mo. (Normala razdioba ima K A = 0) i _ x=me=mo i Ako je K A > 0 oda je razdioba frekvecija asimetriča u odosu a pravac x = x, asimetrija je pozitiva i vrijedi x > Me > Mo. Ako je K A < 0 oda je razdioba frekvecija asimetriča u odosu a pravac x = x, asimetrija je egativa i vrijedi x < Me < Mo. Defiicija 11.10 (koeficijet spljošteosti (eksces)-egl. kurtosis) Koeficijet spljošteosti slučaje varijable X je broj K E koji karakterizira zaobljeost razdiobe i defiira se kao pomoću kvocijeta četvrtog cetralog mometa i četvrte potecije stadarde devijacije σ : K E = µ 4 σ 4 3. Defiicija 11.11 Koeficijet spljošteosti statističkog obilježja X, ako su vrijedosti statističkog obilježja date kao iz x i s frekvecijama f i, i = 1,..., r, defiira se kao K E = µ 4 σ 4 3, 11 Radi materijal
11.1. DESKRIPTIVNA STATISTIKA i i _ < Me< Mo _ > Me > Mo Mo Me _ i _ Me Mo i gdje je µ 4 = 1 σ = 1 (x isr x)4 f i, ( f i = ); (x isr x) f i, ( f i = ). NAPOMENA 11. Ako je K E = 0 oda je razdioba frekvecija ormala razdioba. (Normala razdioba ima K E = 0) Ako je K E > 0 oda je graf fukcije razdiobe frekvecija uži od grafa ormale razdiobe (spljošteost je maja). Ako je K E < 0 oda je graf fukcije razdioba frekvecija širi od ormale razdiobe (spljošteost je veća). K >0 E K =0 E K <0 E Slika 11.3: Spljošteost Radi materijal 1
11. MATEMATIČKA STATISTIKA PRIMJER 11.14 Mjerejem kotiuirae slučaje varijable X= prosječe težie studeata jedog turusa a uzorku veličie 100 dobivea je vrijedost slučajog uzorka (x 1, x,..., x 100 ) daa u tablici: razred x isr f i F i F (x) 60-6 61 5 5 0,05 0,05 63-65 64 18 3 0,18 0,3 66-68 67 4 65 0,4 0,65 69-71 70 7 9 0,7 0,9 7-74 73 8 100 0,08 1,00 f i ukupo =100 1,00 Odrediti očekivaje, varjacu, stadardu devijaciju, mod, medija, prvi kvartil, treći kvartil, koeficijet varijacije, koeficijet asimetrije, koeficijet spljošteosti. NAPOMENA: Razredi su u tablici dati smboličo pr. razred 60 6 je razred 59.5 6.5 tako da je širia razreda d = 3. Rješeje: očekivaje x = 1 5 x 100 isr f i = 67.45 varijaca σ = 1 (x isr x) f i = 8.57 medija Me = L Me + d ( f 1 + f +... + f k ), gdje je k + 1 = 3 izabra tako da je F k = f 1 + f = 3 = 50 f 1 + f + f 3 = 65 = F k+1, L Me = 65.5 je lijevi rub k + 1 = 3. razreda, d = 3 je širia razreda. Me = L Me + d ( f 1 + f +... + f k ) 50 3 = 65.5 + 3 = 67.4. 4 4 prvi kvartil Q 1 = L Q1 + d ( f 1 + f +... + f k ), gdje je k + 1 = 3 izabra tako da je F k = f 1 + f = 3 4 = 5 f 1 + f + f 3 = 65 = F k+1, L Q1 = 65.5 je lijevi rub k + 1 = 3. razreda, d = 3 je širia razreda. Q 1 = L Q1 + d 4 ( f 1 + f +... + f k ) 5 3 = 65.5 + 3 = 65.643 4 treći kvartil Q 3 = L Q3 + d 3 4 ( f 1 + f +... + f k ), gdje je k + 1 = 4 izabra tako da 13 Radi materijal
11.1. DESKRIPTIVNA STATISTIKA je F k = f 1 + f + f 3 = 65 3 4 = 75 f 1 + f + f + f 4 = 9 = F k+1, L Q3 = 68.5 je lijevi rub k + 1 = 4. razreda, d = 3 je širia razreda. Q 3 = L Q3 + d 3 4 ( f 1 + f +... + f k ) 75 65 = 68.5 + 3 = 69.611. 7 1 mod Mo = L Mo + d, gdje je k = 3 izabra tako da je f k = 4 maksimala, 1 + L Mo = 65.5 je lijevi rub k = 3. razreda, d = 3 je širia razreda, 1 = f k f k 1 = f 3 f = 4 18, = f k = f 3 f 4 = 4 7. Mo = L Mo + d 1 4 = 65.5 + 3 1 + 4 + 15 = 67.346. koeficijet varijacije K V = σ 8.57 x 100% = 100% = 4.3% 67.45 K V = Q 3 Q 1 69.611 65.643 = =.933 7 10 Q 3 + Q 1 69.611 + 65.643 koeficijet asimetrije i spljošteosti µ 3 = 1 (x isr x)3 f i =.93 µ 4 = 1 (x isr x)4 f i = 199.37 K A = µ 3 σ 3 = 0.14, K E = µ 4 σ 4 3 = 0.6 Radi materijal 14
11. MATEMATIČKA STATISTIKA 11. Poovimo STATISTIČKO OBILJEŽJE statističko obilježje vrijedosti stat. obilježja r različitih vrijedosti frkvecije relative frkvecije kumulative rel. frkvecije statistička razdioba za X st. obilj. teorijska razdioba za sl. var.x F (x) F(x) X x 1, x,..., x x 1, x,..., x r f 1, f,..., f r f 1, f,..., f r F (x) = f 1 + f +... + f j j takav da je x x j F (x) F(x) po vjerojatosti kad MJERE POLOŽAJA vrijedosti stat. obilj. ARITMETIČKA SREDINA x 1, x,..., x x = 1 (x 1 + x +... + x ) x 1, x,..., x r x = 1 r j=1 x j f j r razreda [L j, D j ], j = 1,...r; x jsr x = 1 r j=1 x jsr f j vrijedosti stat. obilj. MOD x 1, x,..., x x k ako je je f k max x 1, x,..., x r x k ako je je f k max x 1sr, x sr,..., x rsr x ksr ako je je f k max r razreda [L j, D j ], j = 1,...r Mo = L Mo + d k ako je f k max 1 1 +, L Mo lijevi rub k razreda L k, d širia razreda 1 f k f k 1 f k 15 Radi materijal
11.. Poovimo vrijedosti stat. obilj. MEDIJAN x 1, x,..., x uzlaza iz Me = x +1, za epara; x 1, x,..., x uzlaza iz Me = 1 (x + x +1 ), za para; 1 r razreda [L j, D j ], j = 1,...r Me = L Me + d ( ( f 1 + f +... + f k ) ) k f 1 + f +... + f k f 1 + f +... + f k + L Me lijevi rub k + 1 razreda L k+1, d širia razreda. KVANTILI kvatil reda p x p takav da je F(x p ) = p prvi kvartil Q 1 = x 1 4 drugi kvartil= MEDIJAN Me = x 1 treći kvartil Q 3 = x 3 4 vrijedosti stat. obilj. Q 1 x 1, x,..., x uzlaza iz Q 1 = x cijelo( 4 +1), za ije djeljiv s 4; x 1, x,..., x uzlaza iz Me = 1 (x + x 4 +1 ), za djeljiv s 4; 1 r razreda [L j, D j ], j = 1,...r Q 1 = L Q1 + d ( 4 ( f 1 + f +... + f k ) ) k f 1 + f +... + f k 4 f 1 + f +... + f k + L Q1 lijevi rub k + 1 razreda L k+1, d širia razreda. vrijedosti stat. obilj. Q 3 x 1, x,..., x uzlaza iz Q 3 = x cijelo( 3 4 +1), za ije djeljiv s 4; x 1, x,..., x uzlaza iz Me = 1 (x 3 + x 3 4 +1 ), za djeljiv s 4; 1 r razreda [L j, D j ], j = 1,...r Q 3 = L Q3 + d ( 3 4 ( f 1 + f +... + f k ) ) k f 1 + f +... + f k 3 4 f 1 + f +... + f k + L Q3 lijevi rub k + 1 razreda L k+1, d širia razreda. MJERE RASIPANJA vrijedosti stat. obilj. VARIJANCA x 1, x,..., x σ = 1 (x 1 + x +... + x ) x x 1, x,..., x r σ = 1 r j=1 (x j ) f x j r razreda [L j, D j ], j = 1,...r; x jsr σ = 1 r j=1 (x jsr ) f x j Radi materijal 16
11. MATEMATIČKA STATISTIKA vrijedosti stat. obilj. µ 3 x 1, x,..., x r µ 3 = 1 r j=1 (x j x ) 3 f j r razreda [L j, D j ], j = 1,...r; x jsr µ 3 = 1 r j=1 (x jsr x ) 3 f j vrijedosti stat. obilj. µ 4 x 1, x,..., x r µ 4 = 1 r j=1 (x j x ) 4 f j r razreda [L j, D j ], j = 1,...r; x jsr µ 4 = 1 r j=1 (x jsr x ) 4 f j MJERE OBLIKA koeficijet asimetrije K A = µ 3 σ 3 koeficijet spljošteosti K E = µ 4 σ 4 3 17 Radi materijal