PRIMENA STATISTIKE U KONSTRUISANJU
Osnovne saisičke veličine u konsruisanju Srednja vrednos Medijana Moda Mera rasipanja oko srednje vrednosi disperzija Granice poverenja
Osobine numeričkih podaaka- Numeričko opisivanje podaaka mere Cenralna endencija Kvarili Varijacija Asimerija arimeička srednja vrednos raspon inerkvarilini raspon zakrivljenos zašiljenos medijana varijansa modus sandardna devijacija geomerijska srednja vrednos koeficijen varijacije 3
Osobine numeričkih podaaka Cenralna endencija (lokacija cenra) Varijacija (Rasipanje) Asimerija 4
Mere cenralne endencije Cenralna endencija Arimeička srednja vrednos Medijana Modus Geomerijska srednja vrednos x N i1 N x i sredina rangiranih vrednosi najfrekvennija vrednos x 1/ n G (x1 x2 xn) 5
Srednja vrednos Slučajne veličine: diskrene (prekidne) i koninualne (neprekidne). f() f() a b Funkcija raspodele slučajne veličine: a) koninualne; b) diskrene
Srednja vrednos Srednja vrednos populacije (m), odnosno nezavisno promenljive čija je gusina raspodele daa funkcijom f() određena je izrazom: m i n i1 i p ( ) Za diskrene veličine i i m f ( ) d Za koninualne veličine i srednja vrednos diskrene slučajne veličine p( i ) verovanoća realizacije veličine i
Ako populacija ima ograničen broj uzoraka kao dela cele populacije, srednju vrednos posmarane slučajne promenljive predsavlja arimeička sredina: m i n i 1 n i n ukupan broj podaaka Ova srednja vrednos je uoliko bliža srednjoj vrednosi cele populacije ukoliko je broj posmaranih podaaka veći.
Arimeička srednja vrednos (average, mean) Najčešće korišćena mera Ponaša se kao ravnoežna ačka Na njenu vrednos uiču eksremne vrednosi ( ouliers ) Izražava se u isim jedinicama kao i osnovni podaci Izraz za izračunavanje: x x N x x 1 2 N x N broj podaaka dobijena vrednos 9
Arimeička srednja vrednos Uicaj eksremnih vrednosi 0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10 srednja vrednos = 3 srednja vrednos = 4 1 2 3 5 4 5 15 5 3 1 2 3 5 4 10 20 5 4 10
Prosa srednja vrednos vs. ponderisana ežinska srednja vrednos Ponderisana arimeička srednja vrednos izračunava se kada su podaci prikazani kao frekvence: x f f x i i Ako su podaci grupisani u klasne inervale, ponderisana srednja vrednos se izračunava: x f (x f i s ) i 11
Geomerijska srednja vrednos n-i koren proizvoda svih članova skupa Primer: 1,2,3,10 Gx = 4-i koren iz 60 = 2.78 II način izračunavanja Gx: 12 1. logarimovanje svakog broja u skupu 2. računanje arimeičke sredine ih logariama 3.dizanje osnove logarima (ln-2.718 ili log-10) na izračunau arimeičku sredinu logariama (korak 2)
Medijana (Me) Medijana je cenralna vrednos u nizu podaaka 50% vrednosi je iznad, 50% ispod medijane Pre određivanje medijane podaci se urede po veličini Na Me ne uiču eksremne vrednosi 0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10 medijana = 3 medijana = 3 13
Određivanje medijane Pozicija medijane (u uređenim podacima): N 1 pozicija medijane 2 Ako je broj podaaka neparan, medijana je vrednos u sredini niza Ako je broj podaaka paran, medijana je srednja vrednos dve vrednosi u sredini niza (između N/2 i (N+2)/2) Napomena: 14 N 1 2 izraz nije vrednos medijane, već redni broj vrednosi koja predsavlja medijanu
Medijana Označava vrednos nezavisno promenljive, čija je kumulaivna verovanoća realizacije 0.5 (jednaka verovanoći da će bilo koji rezula bii manji ili veći od 0.5 50%). 0.5 50 f ( ) d Za koninualne veličine f() 50% 50% Medijana 50
Moda - Modus (Mo) Vrednos koja se pojavljuje najčešće Na Mo ne uiču eksremne vrednosi U skupu može bii jedan ili više modusa Skup može bii bez modusa Mo može da se odredi i za numeričke i kaegoričke podake 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 modus = 9 0 1 2 3 4 5 6 nema modusa 16
17
Moda Vrednos slučajne veličine koja odgovara najvećoj verovanoći njene realizacije, bez obzira da li je diskrena ili koninualna. df ( ) d 0 Za koninualne veličine f() Moda
Skale merenja- mere cenralne endencije inervalna/skala odnosa - x, Me, Mo ordinalna Me, Mo nominalna samo Mo!!! 19
Kvarili Kvarili dele skup uređenih podaaka na čeiri jednaka dela Pozicione veličine 25% 25% 25% 25% 25% 25% Q 1 Q 2 Q 3 Prvi kvaril, Q 1 25% vrednosi su manje od Q 1 Drugi kvaril, Q 2 = medijana Treći kvaril, Q 3 = 25% vrednosi su veće od Q 1 Q 1 i Q 3 nisu mere cenralne endencije 20
Određivanje kvarila Pozicija (redni broj vrednosi) prvog kvarila: 21 Q1 = (N+1)/4 Pozicija (redni broj vrednosi) drugog kvarila: Q2 = (N+1)/2 Pozicija (redni broj vrednosi) rećeg kvarila: Q3 = 3(N+1)/4
22 Percenili Pozicija percenila: P N P (N 1) 100 Prvi percenil P 1 : odvaja 1% vrednosi Q 1 = P 25 Q 2 = Me = P 50 Q 3 = P 75
Mere varijacije varijacija raspon inerkvarilni raspon varijansa sandardna devijacija koeficijen varijacije Mere varijacije daju informaciju o rasipanju ili varijabilnosi podaaka 23 isi cenar, različia varijacija
Raspon Najjednosavnija mera varijacije Raspon razlika između najveže i najmanje vrednosi u skupu raspon = x max x min primer: 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 24 raspon = 14-1 = 13
Nedosaak raspona Ignoriše oblik raspodele podaaka 7 8 9 10 11 12 raspon = 12-7 = 5 7 8 9 10 11 12 raspon = 12-7 = 5 Oseljiv na eksremne vrednosi 1, 1, 1, 1, 1, 1, 1, 1, 1,1,1, 2, 2, 2, 2, 2, 2, 2, 2, 3, 3, 3, 3, 4, 5 raspon = 5-1 = 4 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 2, 3, 3, 3, 3, 4, 120 25 raspon = 120-1 = 119
26 Varijansa Prosečno (približno) kvadrano odsupanje vrednosi od srednje vrednosi Izraz za izračunavanje: V n i1 (x i N - 1 x) 2 N 1 broj sepena slobode
Disperzija Mera rasipanja promenljive oko ose srednje vrednosi. 2 i n i1 ( m) p( 2 i i ) Za diskrene veličine 2 2 ( m) f ( ) d Za koninualne veličine Sandardna devijacija: 2 Korisi se za informacije iz ograničenog skupa podaaka ako nije pozna zakon raspodele.
Procenjena sandardna devijacija: S i n i1 ( i m) n 1 2 Najčešće korišćena mera varijacije Pokazuje varijaciju oko srednje vrednosi Kvadrani koren iz varijanse Izražava se u isim jedinicama kao i osnovni podaci Sandardna devijacija normalnog zakona raspodele
Broj sepena slobode - df, θ, φ φ = N - 1 φ - broj nezavisnih poredjenja x 3x x 1 x 1 x 1 i x 2 nezavisne vrednosi, φ = 2 x 2 3 x 2 x 3 x 3 29
Sandardna devijacija - Sd Podaci: 4,9 6,3 7,7 8,9 10,3 11,7 Sd X 2 N(X) N 1 2 6,368 2,523 30
Značenje sandardne devijacije mala sandardna devijacija velika sandardna devijacija 31
Poređenje sandardnih devijacija grupa A 11 12 13 14 15 16 17 18 19 20 21 sr. vrednos = 15.5 SD = 3,338 grupa B 11 12 13 14 15 16 17 18 19 20 21 sr. vrednos = 15.5 Sd = 0,926 grupa C 11 12 13 14 15 16 17 18 19 20 21 sr. vrednos = 15.5 Sd = 4,567 32
Asimerija raspodele Pokazuju kako su podaci disribuirani zakrivljenos i zašiljenos x levosrana x simerična desnosrana Me Mo = Me = Mo Mo Me x 33
Numeričke mere za populaciju i uzorak Saisički parameri koji se izračunavaju iz populacije opisuju osobine populacije Saisički parameri koji se izračunavaju iz uzorka opisuju osobine uzorka Srednja vrednos populacije μ Srednja vrednos uzorka x Sandardna devijacija populacije σ Sandardna devijacija uzorka Sd 34
Osobine varijanse i sandardne devijacije Svaka vrednos se korisi u izračunavanju razlika u odnosu na raspon i inerkvarilni raspon Veliki uicaj eksremnih vrednosi izračunava se kvadra odsupanja od srednje vrednosi 35
Koeficijen varijacije - Kv Mera relaivne varijacije (u odnosu na srednju vrednos) Uvek se izražava u % Omogućava poredjenje više grupa podaaka, čak i kada su izraženi u različiim jedinicama Kv = Sd 100 x 36
Granice poverenja Inerval poverenja predsavlja dijapazon u kome se sa određenom zadaom verovanoćom nalazi svarna vrednos, koja odgovara svim mogućim realizacijama posmaane slučajne veličine dobjene kao rezula merenja. Isi smisao imaju i granice poverenja kod uvrđivanja zakona raspodele. Granice poverenja C α/2 granice poverenja odgovaraju verovanoći realizacije u %, odnosno kumulaivnoj verovanoći α. m - C α/2 m m + C α/2
Izračunavanje relaivnih i kumulaivnih učesanosi, prikazivanje u obliku hisograma i poligona. Hisogram i poligon a - Sepenasi dijagram; b - poligon Hisogram
Grafički prikaz: sepenasi dijagram i poligon. Za objekivno odlučivanje je neophodno ačnije procenjivanje svarnih zakona raspodele. Svi rezulai merenja reba da se grupišu u određene klase inervale promene posmarane veličine. f r n n i 100 % relaivna učesanos n i broj rezulaa merenja u svakoj pojedinačnoj klasi n ukupan broj rezulaa merenja f q n i1 ni n 100 % kumulaivna vrednos učesanosi
Teorijske raspodele verovanoće Pouzdanos je jednaka verovanoći rada bez okaza. R ( ) f ( ) d f() gusina inervala vremena rada do pojave okaza Nepouzdanos je: F( ) 1 R( ) 0 f ( ) d Inenzie okaza: ( ) f ( ) R( ) Korise se: Eksponencijalna Normalna i Vejbulova raspodela
Eksponencijalna raspodela Pripada grupi neprekidnih zakona raspodele. Funkcija gusine raspodele ima oblik: f ( ) e, 0 -paramear raspodele
Funkcija pouzdanosi R( ) e Inenzie okaza ( ) f ( ) R( ) e e
Normalna raspodela Pripada grupi neprekidnih zakona raspodele. Funkcija gusine raspodele ima oblik: f ( ) 1 2 2 ( ) e 2 2 mera rasipanja oko srednje vrednosi očekivana vrednos
Funkcija pouzdanosi Inenzie okaza d e R 2 2 2 ) ( 2 1 ) ( d e e R f 2 2 2 2 2 ) ( 2 ) ( ) ( ) ( ) (
Vejbulova raspodela Pripada grupi neprekidnih zakona raspodele. Funkcija gusine raspodele ima oblik: k paramear oblika paramear razmere k k e k f 1 ) (
Funkcija pouzdanosi Inenzie okaza k e R ) ( 1 1 ) ( ) ( ) ( k k k e e k R f k k
Verovanosni papiri se korise za proveru mogućnosi inerperacije empirijske raspodele pouzdanosi nekom eorijskom raspodelom. Ukoliko se podaci o kumulaivnim učesanosima okaza, koji su unei u verovanosni papir nalaze približno na pravoj liniji, hipoeza o valjanosi eorijskog zakona se prihvaa. Podaci unei u verovanosni papir daju mogućnos da se odrede i svi parameri eorijskog zakona za aj slučaj.
Verovanosni papir
Saisički esovi Korise se za proveru da li je prava provučena kroz ačke koje odgovaraju eksperimenu, j. empirijskoj raspodeli u verovanosnom papiru, zaisa odgovara oj raspodeli. Tes Kolmogorov-Smirnov d-es es Henrijeva prava...
Tes Kolmogorov-Smirnov: sepen saglasnosi se ocenjuje na bazi odsupanja pojedinih ačaka od preposavljene eorijske raspodele (prave linije), j. poređenjem ovih odsupanja sa zv. kriičnim vrednosima d (abela 5.2, udžbenik, sr. 74).