RELATIVNI BROJEVI Relativni brojevi služe za poređenje pojava, istoimenih ili raznoimenih. Relativni broj se dobija kao količnik dva apsolutna broja: V R b = V r b gde je Vr računska vrednost vrednost koju poredimo sa baznom vrednošću, a Vb bazna vrednost osnova za poređenje. U zavisnosti od cilja poređenja razlikujemo tri vrste relativnih brojeva: indekse strukture (kvote, pokazatelji strukture) indekse dinamike (pokazatelji promena) i statitičke koeficijente (poređenje raznoimenih pojava) INDEKSI STRUKTURE (kvote, relativne frekvencije) Pokazuju odnos dela i celine. Indeks strukture se može prikazati kao proporcija (računska vrednost koja se dobija kao količnik dela i celine i čija se vrednost nalazi u intervalu od 0 do 1) ili kao procenat. Zbir procenata ili indeksa strukture svih delova jedne iste mase mora da bude jednak 100. Mogu se sabirati samo oni procenti koji su izračunati na osnovu iste bazne vrednosti. Primer izračunavanja indeksa strukture dat je u prethodnoj vežbi u tabeli 1 ( Raspodela ispitanika prema navici pušenja ). Radi se o prostoj tabeli, u kojoj raspodela zavisi samo od jedne varijable navike pušenja. Osim prostih, tabele mogu biti i kombinovane, u kojima je raspodela formirana na osnovu dve varijable. Tada postoje tri načina za izračnavanje procenata: Procenti po redovima bazna vrednost za poređenje je zbirna učestalost odgovorajućeg reda (horizontalna struktura) Procenti po kolonama bazna vrednost za poređenje je zbirna učestalost odgovarajuće kolone (vertikalna struktura) Totalni procenti bazna vrednost za poređenje je totalna učestalost (totalna struktura)
Primer 1: Dat je broj po odeljenjima jedne opšte bolnice: Interno 70; Ginekološko 40; Hirurško 80; Pedijatrijsko 50. Odrediti strukturu po odeljenjima. Tabela 1. i struktura po odeljenjima Odeljenje Interno 70 9 Ginekološko 40 17 Hirurško 80 33 Pedijatrijsko 50 1 Ukupno 40 100 Izračunavanje: U ovoj prostoj tabeli, osnova za poređenje je zbirna vrednost (40). Na primer, udeo na Internom odeljenju iznosi: V 70 = r R Interno = = 0,9 Vb 40 Odnosno 9. Primer : Dat je broj po odeljenjima dve bolnice: Bolnica A: Interno 70, Ginekološko 40, Hirurško 80, Pedijatrijsko 50 Bolnica B: Interno 80, Ginekološko 140, Hirurško 100, Pedijatrijsko 160 Odrediti: (a) Strukturu bolnica prema broju na odeljenjima (b) Strukturu odeljenja prema broju u bolnicama (c) Strukturu po odeljenjima i bolnicama (totalna struktura) Izračunavanje: U ovoj kombinovanoj tabeli mogu se izračunati procenti po redovima i kolonama, i totalni procenti.
Tabela. Izračunavanja procenata kod kombinovanih tabela procenti po redovima procenti po kolonama totalni procenti (a) Procenti po redovima za baznu vrednost uzima se ukupan broj jedinica po redovima (zbir iste vrste odeljenja obe bolnice). Na primer, udeo na Internom odeljenju bolnice A, u odnosu na ukupan broj internističkih iznosi: 70 R b ( InternoA ) = 100 = 47 150 Tabela sa procentima po redovima imaće izgled: Odeljenje Tabela 3. Struktura po odeljenjima i bolnicama Bolnica A Bolnica B Svega Interno 70 47 80 53 150 100 Ginekološko 40 140 78 180 100 Hirurško 80 44 100 56 180 100 Pedijatrijsko 50 31 160 69 10 100 Ukupno 40 33 480 67 70 100 (b) Procenti po kolonama za baznu vrednost uzima se ukupan broj jedinica po kolonama (zbir svih pojedinačne bolnice). Na primer, udeo na Internom odeljenju bolnice A, u odnosu na ukupan broj te bolnice iznosi: 70 R b ( InternoA) = 100 = 9 40
Tabela sa procentima po kolonama imaće izgled: Odeljenje Tabela 4. Struktura po odeljenjima i bolnicama Bolnica A Bolnica B Svega Interno 70 9 80 17 150 1 Ginekološko 40 17 140 9 180 5 Hirurško 80 33 100 1 180 5 Pedijatrijsko 50 1 160 33 10 9 Ukupno 40 100 480 100 70 100 (c) Totalni procenti za baznu vrednost uzima se ukupan broj jedinica (zbir svih obe bolnice). Na primer, udeo na Internom odeljenju bolnice A, u odnosu na ukupan broj obe bolnice iznosi: Vr 70 Rb( InternoA) = = 100 = 10 V 70 b Tabela sa totalnim procentima imaće izgled: Odeljenje Tabela 5. Struktura po odeljenjima i bolnicama Bolnica A Bolnica B Svega Interno 70 10 80 11 150 1 Ginekološko 40 6 140 19 180 5 Hirurško 80 11 100 14 180 5 Pedijatrijsko 50 7 160 10 9 Ukupno 40 34 480 66 70 100
INDEKSI DINAMIKE Pokazuju relativnu promenu obeležja u vremenu. Zavisno od toga šta služi kao osnova za poređenje mogu biti: 1. bazni indeksi dinamike članovi vremenske serije se porede sa istom osnovom. Ta osnova za poređenje može biti prva, poslednja, najmanja, najveća ili neka druga pogodna vrednost. lančani indeksi dinamike svaki član vremenske serije se poredi sa prethodnim članom Lančani indeks pokazuje promenu jedne pojave od prethodnog do narednog vremenskog perioda. Ukoliko je lančani indeks veći od 100 znači da je posmatrana pojava u porastu (u odnosu na prethodni period), a ukoliko je manji od 100 znači da je u opadanju. Primer 3: Date su prosečne vrednosti hemoglobina u krvi za grupu bolesnika tokom 7 meseci. Odrediti relativne promene hemoglobina u tom vremenskom periodu. mesec hemoglobin (g/l) bazni indeks dinamike () lančani indeks dinamike () maj 105 100 jun 115 110 110 jul 107 10 93 avgust 10 114 11 septembar 134 18 11 oktobar 145 138 108 novembar 138 131 95 Bazni indeks dinamike se izračunava kada se kao računska vrednost upiše stanje pojave u tekućem periodu (npr. vrednost Hgb u junu mesecu), a kao bazna vrednost stanje pojave u baznom periodu (vrednost Hgb u maju mesecu). Dobijena vrednost se pomnoži sa 100. Bazni indeksi dinamike 115 I B( jun) = 100 = 110 105 107 I B( jul ) = 100 = 10 105 10 I B avgust = 100 = 114 105 ( )
Lančani indeks dinamike se izračunava kada se kao računska vrednost upiše stanje pojave u tekućem vremenskom periodu (npr. vrednost Hgb u avgustu mesecu), a kao bazna vrednost stanje pojave u prethodnom vremenskom periodu (vrednost Hgb u julu mesecu). Dobijena vrednost se pomnoži sa 100. Lančani indeksi dinamike 115 I L ( jun ) = 100 = 110 105 107 I L ( jul ) = 100 = 93 115 10 I L( avgust ) = 100 = 11 107 Lančani indeks pokazuje promenu jedne pojave od prethodnog do narednog vremenskog perioda. Ukoliko je lančani indeks veći od 100 znači da je posmatrana pojava u porastu (u odnosu na prethodni vremenski period), a ukoliko je manji od 100 znači da je u opadanju.
MERE CENTRALNE TENDENCIJE (SREDNJE VREDNOSTI, MERE LOKACIJE) Mere centralne tendencije su statističke mere koje opisuju srednju ili centralnu tačku ili najtipičniju vrednost, oko koje postoji tendencija grupisanja podataka. Mere centralne tendencije su najbolji reprezenti skupa podataka omogućavaju da se svi podaci predstave jednim brojem. Prema načinu izračunavanja srednje vrednosti dele se u dve grupe: 1. Matematičke (računske) srednje vrednosti izračunavaju se na osnovu svih vrednosti: aritmetička sredina. Pozicione (lokacione) srednje vrednosti određuju se na osnovu položaja u nizu podataka i raspodeli učestalosti: medijana mod (modus, tipična vrednost) ARITMETIČKA SREDINA Aritmetička sredina je količnik zbira svih vrednosti i njihovog ukupnog broja: x = gde je x i pojedinačan podatak, a n broj podataka. PRIMER 1. Data je telesna visina 10 osoba (cm): 177, 17, 183, 190, 174, 165, 169, 181, 171, 175. Izračunati aritmetičku sredinu. Aritmetička sredina iznosi: xi 177+ 17+ 183+ 190+ 174+ 165+ 169+ 181+ 171+ 175 1757 x = = = = 175,7cm n 10 10 xi n PRIMER. Za pet vrednosti amilaze u serumu (U/L): 51, 79, 6, 37 i 4, aritmetička sredina iznosi 54 U/L. Dodavanjem nove vrednosti od 79 U/L, aritmetička sredina postaje 9 U/L. Dodavanje ekstremnog podatka učinilo je da nova aritmetička sredina nije više valjan reprezent skupa podataka, jer je znatno veća od svih prvih pet unetih podataka.
PONDERISANA ARITMETIČKA SREDINA Ponderisana aritmetička sredina izračunava se prema formuli: fx x = f U ovoj formuli, kada se ponderisana aritmetička sredina koristi za izračunavanje aritmetičke sredine grupisanih podataka, f predstavlja frekvenciju klasnog intervala, a x sredinu klasnog intervala. Kada se ponderisana aritmetička sredina koristi za izračunavanje objedinjene aritmetičke sredine dve ili više grupa, u toj formuli f predstavlja veličinu grupe, a x aritmetičku sredinu grupe. PRIMER 3. (izračunavanje aritmetičke sredine iz podataka grupisanih po klasnim intervalima). Za 50 ispitanika data je raspodela učestalosti vrednosti hemoglobina (g/l) po klasnim intervalima: Hemoglobin (g/l) f 106 110 3 111 115 7 116 10 11 11 15 16 16 130 9 131 135 4 Izračunati aritmetičku sredinu hemoglobina. Postupak izračunavanja: Formirati radnu tabelu. Dodati kolonu za sredinu klasnog intervala, koja se dobija tako što se saberu njegove granice i podeli sa. Na primer, za prvi klasni interval sredina iznosi (106+110)/=108. Dodati kolonu za proizvod fx. Aritmetička sredina hemoglobin iznosi: Hemoglobin (g/l) f x fx 106 110 3 108 34 111 115 7 113 791 116 10 11 118 198 11 15 16 13 1968 16 130 9 18 115 131 135 4 133 53 50 6065
fx 6065 x = = = 11,3 g/l f 50 PRIMER 4. (izračunavanje objedinjene aritmetičke sredine iz dve ili više grupa). Date su vrednosti aritmetičkih sredina BMI učenika tri škole u jednoj opštini: Škola učenika u školi BMI (aritmetička sredina) A 55,7 B 307 19,4 C 511 0,9 Kolika je aritmetičaka sredina BMI učenika u toj opštini? Rešenje: Objedinjena aritmetička sredina iznosi: 55,7 + 307 19,4 + 511 0,9 x = = 1,1 55 + 307 + 511 MEDIJANA Medijana ili centralna vrednost predstavlja srednju pozicionu vrednost. Na skupu sa neparnim brojem podataka medijana je uvek stvarna i postojeća vrednost. Na primer, ako je broj podataka 9, medijana će imati vrednost petog podatka kada su oni poređani po veličini. Na skupu sa parnim brojem podataka vrednost medijane se izračunava tako što se saberu dva centralna podatka, i dobijeni zbir podeli sa dva. Na primer, ako je broj podataka 10, vrednost medijane se dobija tako što se zbir petog i šestog podatka podeli sa dva. Određivanje medijane negrupisanih podataka: 1. Poređati statističke jedinice po veličini obeležja posmatranja.. Odrediti mesto (položaj) medijane prema formuli: mmed = n + 1 3. Pročitati ili izračunati vrednost obeležja koja odogovara mestu medijane. kod neparnog broja članova statističke serije medijana je vrednost srednjeg tj. centralnog člana; kod parnog broja članova statističke serije vrednost medijane se izračunava kao aritmetička sredina vrednosti poslednjeg člana prve polovine i prvog člana druge polovine serije podataka.
PRIMERR 5. Date su vrednosti Hgb (g/l) u krvi 5 bolesnika: 14, 131, 15, 137, 148. Odrediti medijanu. = n + 1 5 + 1 mmed = = 3 Med= 14g/L Medijana vrednosti hemoglobina kod 5 bolesnika je 14g/L. PRIMERR 6. Izračunati medijanu telesne visine 10 osoba iz Primera 1. mmed = n + 1 10 + 1 = = 5,5 Med 174 + 175 = = 174,5 Medijana telesne visine 10 osoba iznosi 174, 5cm. Postupak izračunavanja medijane grupisanih podataka: 1. Formirati radnu tabelu odgovarajućeg broja redova i kolona.. U prvoj koloni prema rastućim vrednostima uneti vrednosti intervalnih grupa. 3. U drugoj koloni odrediti prosek (aritmetičku sredinu) svake intervalne grupe ( x i ) 4. U trećoj koloni uneti odgovarajuće frekvencije intervalnih grupa ( f ) 5. U četvrtoj koloni izračunati kumulativne frekvencije ( f k ) Niz kumulativnih frekvencija se izračunava sukcesivnim zbirom vrednosti frekvencija intervalnih grupa od prve do poslednje u nizu (opširnije imate u lekciji Sređivanje podataka). f +1 6. Mesto medijane izračunati prema formuli: mmed = 7. Na osnovu niza kumulativnih frekvencija odrediti u kojo grupi se nalazi vrednost mesta medijane. 8. Medijana je približno jednaka vrednosti one grupe ili sredini onog grupnog intervala čija je kumulativna frekvencija prva u nizu koja je veća od mesta medijane ili je njoj jednaka. 9. Tumačenje dobijenog rezultata.
PRIMERR 7. Odrediti medijanu vrednosti amonijaka u krvi (μmol/l) 4 bolesnika na terapiji neomicinom. Amonijak u krvi (μmol/l) 13, 13,4 13,5 13,7 13,8 14,0 14,1 14,3 14,4 14,6 14,7 14,9 15,0 15, x i f 13,3 13,6 13,9 14, 14,5 14,8 15,1 1 3 8 11 10 7 (1+0)= 1 (1+3)= 4 (4+8)=1 (1+11)=3 (3+10)=33 (33+7)=40 (40+)=4 4 f k mesto medijane=1,5 4 mmed = = 1,5, Med=14, μmol/l Medijana vrednosti amonijakaa u krvi 4 bolesnika na terapiji neomicinom je 14, μmol/l. MOD Mod (tipična vrednost) je vrednost podatka sa najvećom učestalošću. Određivanje moda može biti olakšanoo ako su podaci sređeni po rastućem ili opadajućem nizu. Na primer, za sledeće podatke: vrednost moda iznosi 4 (to je vrednost koja se naučestalije javlja tri puta) ). Kod grupisanih podataka približna vrednost moda je vrednost grupe ili sredine grupnog intervala sa najvećom frekvencijom modalna grupa ili modalni interval. Ako dve grupe ili dva grupna intervala imaju jednake frekvencije onda je modalna grupa ili modalni inteval onaj koji ima veću susednu frekvenciju. PRIMERR 8. Dat je broj povreda na radu u radnom veku za 0 invalida rada:, 0, 5, 4, 4, 3, 1, 1, 3, 1,, 0,, 1, 3,,, 3,, 1. Odrediti mod za broj težih povreda u radnom veku 0 invalidaa rada. Mod = Modna vrednost broja težih povreda u radnom veku 0 invalida rada iznosi.
MERE VARIJABILITETA Mere varijabilitetaa možemo jedinicima mere obeležja, i brojevima: podeliti na apsolutne mere varijacije koje su iskazane u relativne mere varijacije koje su iskazane neimenovanim 1) Apsolutne mere varijacije a) Interval (raspon) varijacije b) Kvantili, percentili, decili, kvartili c) Varijansa d) Standardnaa devijacija ) Relativne meree varijacije a) Koeficijent varijacije b) Standardizovane (normalizovane) vrednosti INTERVAL VARIJACIJE Interval varijacije je razlika najveće i najmanje vrednosti u skupu podataka: I = x max x min gde je: podataka. x max najveća vrednost u skupu podataka, x min najmanja vrednost u skupu PRIMERR 1: Odrediti interval varijacije telesne visine 10 osoba (cm): 177, 17, 183, 190, 174, 165, 169, 181, 171 i 175. I = x x max min = 190 165 = 5 Interval varijacije telesne visine 10 osoba iznosi 5 cm.
VARIJANSA I STANDARDNA DEVIJACIJA Varijansa je srednje kvadratno odstupanje od aritmetičke sredine. Obeležava se sa sd ili s. Izračunava se po formuli: ( x x) = i sd n 1 gde je x i je vrednost pojedinačnog podatka, x je aritmetička sredina, a n je broj podataka. Standardna devijacija (obeležava se sa sd ili s) izračunava se kao kvadratni koren iz varijanse, odnosno kao kvadratni koren iz srednjeg kvadratnog odstupanja od aritmetičke sredine: sd = sd ( x x) i sd = n 1 PRIMER 3: Dati su podaci o visini (cm) 10 osoba: 177, 17, 183, 190, 174, 165, 169, 181, 171 i 175. Izračunati varijansu i standardnu devijaciju. Postupak izračunavanja varijanse i/ili standardne devijacije: 1. U prvu kolonu uneti podatke. Izračunati aritmetičku sredinu (x) 3. U drugoj koloni izračunati odstupanja pojedinačnih vrednosti od aritmetičke sredine ( x i x) 4. U trećoj koloni izračunati kvadrate odstupanja od aritmetičke sredine ( x i x) ( x x) 5. Izračunati varijansu = i sd n 1 6. Izračunati standardnu devijaciju sd = sd Ispitanik Visina (cm) ( x i x) ( x ) i x 1 177 1,3 1,69 17 3,7 13,69 3 183 7,3 53,9 4 190 14,3 04,49 5 174 1,7,89 6 165 10,7 114,49 7 169 6,7 44,89 8 181 5,3 8,09 9 171 4,7,09 10 175 0,7 0,49 Ukupno 1757 486,1
x 1757 x = = = 175,7 n 10 ( xi x) 486.1 sd = = n 1 9 sd = 54.01 = 7.35 cm = 54.01cm Varijansa telesne visine 10 osoba iznosi 54,01 cm a standardna devijacija 7,35 cm. KOEFICIJENT VARIJACIJE Koeficijent varijacije (CV) je relativna mera varijacije. Izračunava se kao količnik standardne devijacije i aritmetičke sredine, i obično je iskazan u procentima: sd CV = 100 x Pogodan je za poređenja varijabiliteta različitih skupova podataka, čak i kada su oni mereni potpuno različitim mernim jedinicima. Ako je CV mali, na primer manji od 30, za skup podataka se može reći da je homogen (manje varijabilan, konzistentan, uniforman). Ako je CV veliki, na primer veći od 30, za skup podataka se može reći da je heterogen (više varijabilan). PRIMER 4 (poređenje varijabiliteta dve grupe podataka): Za dve grupe bolesnika date su aritmetičke sredine i standardne devijacije Hgb (g/l): 1. grupa: x = 136g/L, sd = 17g/L. grupa: x = 148g/L, sd = 9g/L Uporediti varijabilitet hemoglobina dve grupe bolesnika. 17 CV 1 = 100 = 1.5 136 9 CV = 100 = 6.1 148 Podaci obe grupe su homogeni (CV ima male vrednosti). Podaci grupe su homogeniji (manje varijabilni). PRIMER 5 (poređenje varijacija različitih varijabli): Za jednu grupu bolesnika date su aritmetičke sredine i standardne devijacije holesterola, fibrinogena i natrijuma u plazmi: Holesterol: x = 3.0 mmol/l, sd = 1.9 mmol/l Fibrinogen: x =.1 g/l, sd = 1.3 g/l Natrijum: x = 14.9 mmol/l, sd = 4.16 mmol/l Uporediti relativnu varijaciju ove tri varijable. CV H = 43, CV F = 61.9, CV Na =.91
Najmanju relativnu varijaciju ima natrijum u plazmi (,91), a najveću fibrinogen (61,9). Podaci za holesterol i fibrinogen su heterogeni, dok su za natrijum homogeni. ZED VREDNOST Zed vrednost (zed skor, standardizovana vrednost) je odstupanje od aritmetičke sredine iskazano standardnim devijacijama. Izračunava se pomoću formule: xi x z = sd gde je x i aktuelna vrednost za koju se izračunava zed vrednost, x je aritmetička sredina, a sd standardna devijacija. Zed vrednost je pokazatelj relativne pozicije neke vrednosti u skupu podataka. Predznak zed vrednosti pokazuje da li je neka konkretna vrednost manja (negativna zed vrednost) ili veća (pozitivna zed vrednost) od aritmetičke sredine. PRIMER 6: Za grupu bolesnika nađeno je za Hgb (g/l): x =136 g/l, sd=17 g/l. Vrednost Hgb jednog bolesnika iznosila je 117 g/l. Odrediti relativnu poziciju ove vrednosti u odnosu na skup podataka. 117 136 z = = 1.1 17 Vrednost od 117 g/l je 1,1 standardnih devijacija ispod aritmetičke sredine.