4. MJERE DISPERZIJE Josipa Perkov, prof., pred. 1
Kod mnogih mjerenja se može opaziti da se rezultati grupiraju i skupljaju oko jedne srednje vrijednosti Srednja vrijednost dobro reprezentira rezultate ako su vrijednosti gusto grupirane (malo se razlikuju) oko srednje vrijednosti Srednja vrijednost loše reprezentira rezultate ako su vrijednosti minimalno grupirane oko srednje vrijednosti srednju vrijednost prikupljenih podataka potrebno je nadopuniti pokazateljem njihove raspršenosti (disperzije) mala vrijednost pokazatelja disperzije znači da je izračunata srednja vrijednost bolji reprezentant skupa podataka i obrnuto Josipa Perkov, prof., pred. 2
najpoznatije mjere disperzije: (1) apsolutne mjere disperzije: raspon varijacije obilježja varijanca i standardna devijacija interkvartil (2) relativne mjere disperzije: koeficijent varijacije koeficijent kvartilne devijacije Josipa Perkov, prof., pred. 3
4.1. RASPON VARIJACIJE (RV) Najjednostavnija mjera disperzije (koriste se samo 2 vrijednosti) Za niz od N negrupiranih kvantitativnih podataka RV dan je izrazom: R = x x x max min RV jednak je nuli kad nema disperzije RV u distribuciji frekvencija diskretne numeričke varijable je razlika između posljednje i prve vrijednosti R = x x x k 1 Josipa Perkov, prof., pred. 4
RV distribucije frekvencija s razredima može se odrediti ako je poznata najveća i najmanja vrijednost varijable raspon se aproksimira kao razlika gornje granice posljednjeg i donje granice prvog razreda ili kao razlika razredne sredine posljednjeg i prvog razreda kod takvih distribucija frekvencija određivanje RV je nepouzdano Josipa Perkov, prof., pred. 5
PRIMJER 1. Prilikom dva puta po 10 mjerenja neke pojave, dobivena su 2 niza rezultata (rezultati su poredani po veličini) 1. mjerenje: 8 8.5 8.5 9 9 9 9 9.5 9.5 10 2. mjerenje: 1 2 3 5 9 9 13 15 16 17 Izračunajte aritmetičku sredinu i raspon varijacije za oba mjerenja. Interpretirajte rezultat. Josipa Perkov, prof., pred. 6
4.2. INTERKVARTIL I KOEFICIJENT KVARTILNE DEVIJACIJE Kvantili su vrijednosti numeričke varijable koji niz uređen po veličini dijele na q jednakih dijelova Broj kvantila p je za jedan manji od njegova reda q, pr. medijan je kvantil reda q = 2 p = 1 (dovoljna je jedna vrijednost da se niz podijeli u dva jednakobrojna dijela) Kvartili su kvantili koji dijele niz na 4 jednaka dijela, decili su kvantili reda 10, percentili su kvantili reda 100,... Josipa Perkov, prof., pred. 7
Postoje 3 kvartila: prvi (donji) kvartil, drugi kvartil (medijan) i treći (gornji) kvartil X min N/4 N/2 3N/4 X max Q 1 M e Q 3 25% 25% Josipa Perkov, prof., pred. 8
TUMAČENJE KVARTILA: Donji kvartil je vrijednost varijable koja članove niza dijeli u dvije skupine U 1. skupini se nalazi ¼ (25%) elemenata s vrijednostima varijable koja je jednaka ili manja od kvartila U 2. skupini su ¾ (75%) članova s većim vrijednostima od kvartila Treći kvartil je vrijednost varijable koja dijeli niz na 2 dijela U 1. skupini se nalazi ¾ (75%) elemenata s vrijednostima varijable koja je jednaka ili manja od kvartila U 2. skupini su ¼ (25%) članova s većim vrijednostima od kvartila Drugi kvartil jednak je medijanu Josipa Perkov, prof., pred. 9
ODREĐIVANJE KVARTILA: INT je oznaka za cijeli dio razlomka 1. Uređivanje niza po veličini, 2. Pronalaženje članova s određenim rednim brojevima donji kvartil: Q 1 N N xr, INT, r = INT + 1 4 4 = xr + xr+ 1 N N, = INT, r = 2 4 4 gornji kvartil: Q 3 3N 3N xr, INT, r = INT + 1 4 4 = xr + xr + 1 3N 3N, = INT, r = 2 4 4 Josipa Perkov, prof., pred. 10
PRIMJER 2. Promatramo dob zaposlenih u poduzeću X, stanje 31.12.2007. x i : 28 23 59 25 23 20 31 48 32 god. Odredite donji i gornji kvartil. Josipa Perkov, prof., pred. 11
Uredimo prvo zadani niz: 20 23 23 25 28 31 32 48 59 Donji kvartil: N = 9 9 / 4 INT Q 1 = x r, r = INT(9/4) + 1 = 2 + 1 = 3 Dakle, prvi kvartil je x 3, odnosno 23 godine (25% zaposlenih je mlađe ili jednako dobi od 23 godine, a 75% zaposlenih je starije ili jednako dobi od 23 godine) Gornji kvartil: N = 9 (3N / 4) INT Q 3 = x r, r = INT(27/4) + 1 = 6 + 1 = 7 Gornji kvartil je x 7, odnosno 32 godine (75% zaposlenih je mlađe ili jednako dobi od 32 godine, a 25% zaposlenih je starije ili jednako dobi od 32godine) Josipa Perkov, prof., pred. 12
Izraz za određivanje donjeg kvartila distribucije frekvencija Izraz za određivanje gornjeg kvartila distribucije frekvencija N Q 4 1 = L1 + i f f1 f1 k var 3N Q 4 3 = L1 + i f k var L 1 označava donju granicu razreda u kojemu se nalazi donji (gornji) kvartil, Σ f 1 označava zbroj frekvencija do kvartilnog razreda, f kvar je oznaka za frekvenciju kvartilnog razreda Josipa Perkov, prof., pred. 13
PRIMJER 3. Tabela. Gradovi prema broju izgrađenih stanova Broj izgrađenih stanova 50 150 150 250 250 350 350 450 450 550 550 650 Ukupno Broj gradova 5 8 6 4 2 1 26 Odredite donji i gornji kvartil. Interpretirajte rezultate. Josipa Perkov, prof., pred. 14
Donji kvartil: 26/4 INT r = INT(26/4) + 1 = 6 + 1 = 7 Gornji kvartil: r = INT (3 26 / 4) + 1 = 19 + 1 = 20 Broj izgrađenih stanova Broj gradova Razredna sredina Kumulativni niz manje od 50 150 5 100 5 150 250 8 200 13 250 350 6 300 19 350 450 4 400 23 450 550 2 500 25 550 650 1 600 26 Ukupno 26 - - Josipa Perkov, prof., pred. 15
Što je interkvartil brojčano manji disperzija će biti manja i obrnuto Interkvartil (oznaka: I q ) je apsolutna mjera disperzije koja pokazuje veličinu raspona varijacije središnjih 50% podataka uređenog numeričkog niza iz razmatranja se isključuje po 25% najmanjih i najvećih vrijednosti obilježja Računa se kao razlika između gornjeg i donjeg kvartila I q = Q 3 Q 1 Nije potpuna mjera disperzije jer se za njegovo računanje koriste samo dvije vrijednosti Josipa Perkov, prof., pred. 16
Može se izračunati i koeficijent kvartilne devijacije (oznaka V q ) V q Q Q 3 1 = Vq Q3 + Q1, 0 1 Disperzija je to manja što je V q bliže nuli, a relativno veća što se više približava jedinici Izračunajte interkvartil i koeficijent kvartilne devijacije u primjeru 3. Interpretirajte rezultat. Josipa Perkov, prof., pred. 17
4.3. VARIJANCA, STANDARDNA DEVIJACIJA I KOEFICIJENT VARIJACIJE Razlike između vrijednosti numeričke varijable i njezine AS pokazivat će stupanj varijacije (što su razlike veće veći je i stupanj varijabilnosti i obrnuto) Varijanca je aritmetička sredina kvadrata odstupanja vrijednosti numeričke varijable X od njezine aritmetičke sredine, a za negrupirane podatke računamo je po formuli: σ 1 1 = xi N N 2 2 xi N i= 1 N i= 1 2 2 ili N N 2 2 1 2 1 σ = b di di N i= 1 N i= 1 Napomena: Umjesto apsolutnih, pri računanju varijance dopuštena je upotreba i relativnih frekvencija Josipa Perkov, prof., pred. 18
kao brza kontrola nam može poslužiti odnos između raspona i standardne devijacije: taj odnos gotovo nikad nije manji od 2 ili veći od 6.5 Radi lakše prosudbe stupnja varijabilnosti obilježja definira se standardna devijacija kao pozitivni drugi korijen iz varijance: N N 1 2 1 σ = xi xi N i= 1 N ili i= 1 2 N N 1 2 1 σ = b di di N i= 1 N i= 1 2 Standardna devijacija je prosječno odstupanje vrijednosti numeričke varijable od njezine aritmetičke sredine smije se računati samo uz AS Josipa Perkov, prof., pred. 19
Simbol x i označava originalne vrijednosti obilježja (ako su formirane grupe) ili njihove procjene, tj. vrijednosti razrednih sredina Varijanca distribucije frekvencija diskretne numeričke varijable je vagani prosjek kvadrata odstupanja vrijednosti te varijable od njezine AS: σ 1 1 = ili N N 2 2 fixi fixi N i= 1 N i= 1 2 σ 1 1 N N 2 2 2 = b fidi fidi N i= 1 N i= 1 2 Varijanca i iz nje izvedena standardna devijacija je najvažnija mjera disperzije (potpuna mjera disperzije) kad su poznate AS i standardna devijacija nekih rezultata, onda su ti rezultati potpuno definirani Josipa Perkov, prof., pred. 20
Reprezentativnost AS je vrlo velika ako je koef. varijacije ispod 20% Kad su nam poznate aritmetička sredina i standardna devijacija nekih rezultata tada ih možemo uspoređivati s drugim rezultatima koeficijent varijacije Koeficijent varijacije je omjer standardne devijacije i aritmetičke sredine pomnožen sa sto, tj. pokazuje koliki postotak vrijednosti AS iznosi vrijednost standardne devijacije: V σ = 100 x Koeficijent varijacije je relativna mjera disperzije Josipa Perkov, prof., pred. 21
PRIMJER 4. Statistički skup čini 30 učenika jednog razreda, a promatrano obilježje je uspjeh učenika. Dobiveni su ovi podaci: 4 3 4 3 1 3 4 3 3 3 2 4 1 5 3 4 1 3 3 1 3 5 4 3 1 4 5 4 1 3 a) Sastavite tablicu distribucije frekvencija b) Nacrtajte histogram frekvencija c) Izračunajte aritmetičku sredinu, varijancu, standardnu devijaciju i koeficijent varijacije Josipa Perkov, prof., pred. 22
PRIMJER 5. Izračunajte prosječnu starost radnika poduzeća X, varijancu i standardnu devijaciju za podatke navedene u tabeli: godine starosti broj radnika x i f i 18-20 2 20-22 5 22-28 6 28-32 4 Josipa Perkov, prof., pred. 23
4.4. STANDARDIZIRANA VARIJABLA. PRAVILO ČEBIŠEVAEVA Da bi se utvrdio položaj numeričkog podatka u nizu primjenjuje se standardizirana vrijednost varijable ( z obilježje) Standardizirano obilježje je odstupanje vrijednosti numeričkog obilježja od aritmetičke sredine izraženo u jedinicama standardne devijacije: xi x zi =, i = 1,2,..., N σ Budući da standardizirano obilježje ne ovisi o mjernim jedinicama, može poslužiti za usporedbu položaja podataka u raznovrsnim nizovima Josipa Perkov, prof., pred. 24
PRIMJER 6. Prosječna plaća u poduzeću A iznosi 6.000,00 kn s prosječnim odstupanjem od 1.000,00 kn. U poduzeću B prosječna plaća iznosi 10.000,00 kn s prosječnim odstupanjem od 2.000,00 kn. Usporedite relativni položaj osobe s plaćom 8.000,00 kn u poduzeću A s položajem osobe s plaćom od 11.500,00 kn u poduzeću B Josipa Perkov, prof., pred. 25
Usporedimo relativni položaj osobe s plaćom od 8.000,00 kn u poduzeću A s položajem osobe s plaćom od 11.500,00 kn u poduzeću B z A xa x A 8000 6000 = = = σ 1000 2 z B = x B x σ B = 11500 10000 2000 = 0.75 Obje osobe imaju iznadprosječnu plaću. Osoba iz poduzeća A u relativno je povoljnijem položaju na platnoj listi od osobe B, jer njezina plaća odstupa od prosjeka za + 2 standardne devijacije Josipa Perkov, prof., pred. 26
PRIMJER 7. Prosječni ostvareni ukupni godišnji prihod iznosio je 200 milijuna kn s prosječnim odstupanjem od 10 milijuna kn. Prosječna stopa dobiti za skupinu iznosi 9.8 s prosječnim odstupanjem od 2.2. Prihod odabranog poduzeća iznosi 185 milijuna kn, a stopa dobiti 5.6. Kakav je položaj poduzeća u skupini s obzirom na: a) prihod, b) stopu dobiti? Josipa Perkov, prof., pred. 27
Standardizirana varijabla poprima različite vrijednosti, koje po predznaku mogu biti pozitivne i negativne Pravilo Čebiševa: pojas od x ± 2σ obuhvaća najmanje 75% svih podataka, pojas od x ± 3σ obuhvaća najmanje 88.89% svih podataka Josipa Perkov, prof., pred. 28
PRIMJER 8. Uzmimo osnovni skup od 20.000 žiro-računa komitenata jedne banke. Prosječno kvartalno stanje sredstava iznosi 500.000,00 kn s prosječnim odstupanjem od 100.000,00 kn Pomoću pravila Čebiševa procijenite broj računa s prosječnim stanjem kvartalnih stanja između 300.000,00 i 700.000,00 kn. Josipa Perkov, prof., pred. 29
PITANJA ZA USMENI DIO ISPITA 1. Objasnite pojam raspršenosti. Nabrojite najvažnije mjere disperzije. 2. Koje su relativne mjere disperzije? Navedite njihova svojstva. 3. Koje su apsolutne mjere disperzije? Navedite njihova svojstva. 4. Što je standardizirano obilježje? Navedite pravilo Čebiševa. Josipa Perkov, prof., pred. 30