Statistična analiza opisnih spremenljivk doc. dr. Mitja Kos, mag. arm. Katedra za socialno armacijo Univerza v Ljubljani- Fakulteta za armacijo
Statistični znaki Proučevane spremenljivke: statistični znaki ali statistične spremenljivke Vrste spremenljivk oz. statističnih znakov: Opisni oz. atributivni: Spremenljivke katerih vrednosti opisujemo z besedami Nominalni: npr. krvna skupina A, B, AB, 0 Ordinalni: npr. stanje pacienta: slabo, srednje dobro, odlično Kvantitativni, številčni oz. numerični: Spremenljivke katerih vrednosti izražamo s številkami, Zvezni: v glavnem merjenje, teoretično katerokoli vrednost znotraj določenega č razmika npr. koncentracija glukoze Nezvezni: vrednosti imajo podane samo s celimi števili npr. število opravljenih izpitov
Urejanje atributivnih spremenljivk Kategorije: grupiranje enot v skupine Spremenljivka: Le nekaj vrednosti npr. spol, zakonski ki stan Mnogo vrednosti + nejasne meje => klasiikacije npr. Mednarodna klasiikacija bolezni (MKB), anatomskoterpavtska-kemična klasiikacija (ATC) F k k t ij k lik t Frekvenca kategorije: koliko enot v kategoriji
Vsebina: Testiranje neodvisnosti/povezanosti Testiranje normalnosti porazdelitve Testiranje razlik v proporcih
Ivana Kobilca, Koetarica, 1888.
Testiranje neodvisnosti/povezanosti H0: med spremenljivkama ni povezave H1: med spremenljivkama je povezava Povezanost med budnostjo in pitjem kave?
Kontingenčna tabela x Ali ohranja kava iz avtomata študente budne? Opazovane rekvence: Placebo Kava brez koeina Kava s koeinom Budni 8 30 38 Nebudni 65 4 107 73 7 145
Kontingenčna tabela x Pričakovane rekvence, če ni učinka: Placebo Placebo Kava brez koeina Kava s koeinom Budni?? 38 Nebudni?? 107 73 7 145
Kontingenčna tabela x Pričakovane rekvence, če ni učinka: Placebo Placebo Kava brez koeina Budni 3873 19, 13 Nebudni 145 Kava s koeinom 387 145 18,86 10773 1077 53,87 53, 13 145 145 38 107 73 7 145
Opazovane / pričakovane rekvence OPAZOVANE FREKVENCE Budni Nebudni Placebo Kava brez koeina 8 65 Kava s koeinom 30 4 PRIČAKOVANE FREKVENCE Budni 38 73 Nebudni Placebo Placebo Kava brez Kava s koeina koeinom 38 38 7 19,13 145 145 18,86 10773 1077 53,87 53, 13 145 145
Hi kvadrat test: Kontingenčna tabela χ exp izračunamo exp k ( u p i1 p ) exp k i1 ( u p p 0,5) Yatesova korektura (pri *) u = ugotovljena rekvenca p = pričakovana rekvenca
Testiranje neodvisnosti/povezanosti H0: med spremenljivkama ni povezave H1: med spremenljivkama je povezava Povezanost med budnostjo in pitjem kave? exp exp k i1 ( 16,1 u p p 0,5)
Pogoji hi kvadrat testa Vse pričakovane rekvence morajo biti najmanj 1 80% celic kontingenčne tabele mora imeti pričakovano rekvenco vsaj 5 ali večč
Hi kvadrat tabela tab ( d 1; 0,05) 3,84 Stopinje prostosti: d= (s-1)(v-1) s: število stolpcev v: število vrstic Glej na zgornji meji d.995.95.05.05.01 1... 0.004004 3.841 5.04 6.635635 0.010 0.103 5.991 7.378 9.10
Hi kvadrat porazdelitev Stopinje prostosti: d= (s-1)(v-1) s: število stolpcev v: število vrstic
Testiranje hipotez H 0 : med spremenljivkama ni povezave H 1 : med spremenljivkama je povezava exp k i1 ( exp 16,1 exp u p p 0,5) Zavržemo Ho =0,05 0 tab d 3,84 ( 1; 0,05) exp tab p < α; α=0,05 H 0 zavržemo - spremenljivki sta povezani
Testiranje normalnosti H0: empirična porazdelitev je normalna H1: empirična porazdelitev ni H1: empirična porazdelitev ni normalna
Prilagajanje normalne porazdelitve empirični porazdelitvi Normalno porazdelitev (z vsemi karakteristikami) prilagoditi tako, da aritmetičina sredina in standardana deviacija enaka tistima, ki ju ima empirična porazdelitev
Prilagojena normalna porazdelitev empirični 16 14 1 Frek kvenca 10 8 6 4 0 0-44 45-89 90-134 135-179 180-4 5-69 70-314 nmol/l
Prilagajanje normalne porazdelitve 16 empirični porazdelitvi 14 x s k i1 k i1 i * n x i * x X i i n 1 x i x z s Frekvenca 1 10 8 6 4 0 0-44 45-89 90-134 135-179 180-4 5-69 70-314 nmol/l F 0 ( )=1/+F 0 (z) F (x) i =F (x1<x<x) =n*f 0 (x-x1) Zap. št. Razred Frekvenca i Sredina Standardizirani odklon zi Kumulatvna relativna rekvenca Fo(x) Relativna rekvenca F'(xi) Absolutna rekvenca i' 1 0-44 15 45-89 9 67 3 90-134 4 11 4 135-179 7 157 5 180-4 0 0 6 5-69 47 7 70-314 0 F (xi)=f 0 (x)-f 0 (x1)=1/+f 0 (z)-1/- ( ) ( ) ( ) ( ) F 0 (z1) F 0 (x)-f 0 (x1)=f 0 (z)-f 0 (z1)
Prilagajanje normalne porazdelitve 16 empirični porazdelitvi 14 x s k i1 k i1 i * n x i * x X i i n 1 z x i s Zap. št. Razred Frekvenca i Sredina Standardizirani odklon zi x F 0 ( )=1/+F 0 (z) F (x) Frekvenca Kumulatvna relativna rekvenca Fo(x) 1 10 8 6 4 0 0-44 45-89 90-134 135-179 180-4 5-69 70-314 nmol/l i =F (x1<x<x) =n*f 0 (x-x1) Relativna rekvenca F'(xi) Absolutna rekvenca i' 1 0-44 15-1,3 0,1093 0,1853 6,86 45-89 9 67-0,54 0,946 0,650 9,81 3 90-134 4 11 0,15 0,5596 0,399 8,88 4 135-179 7 157 0,84 0,7995 0,1375 5,09 5 180-4 0 0 1,53 0,9370 0,0494 1,83 6 5-69 47,1 0,9864 0,0117 0,43 7 70-314 0,90 0,9981 F (xi)=f 0 (x)-f 0 (x1)=1/+f 0 (z)-1/- ( ) ( ) ( ) ( ) F 0 (z1) F 0 (x)-f 0 (x1)=f 0 (z)-f 0 (z1)
Testiranje razlik v proporcih H0: p 1 = p = p 3 H0: p 1 = p = p 3 H1: Vsi p niso enaki
Testiranje razlik v proporcih za c proporcev Ali imajo moški, ženske in otroci enako radi jagodni sladoled? Ali je pri stopnji tveganja 0,05 proporc tistih, ki imajo radi sladoled, enak? Mnenje Moški Ženske Otroci Skupaj Radi 1 63 65 140 Nimajo radi 8 17 35 60 Skupaj 0 80 100 00
Testiranje razlik v proporcih za c proporcev H0: p 1 = p = p 3 H1: Vsi p niso enaki = 0,0505 exp:? tab:?
Pričakovane rekvence 0*140/00 80*140/00 100*140/00 140/00 p 5 v vseh celicah Mnenje Moški Ženske Otroci Skupaj Radi 1/14 63/56 65/70 140 Nimajo radi 8/6 17/4 35/30 60 Skupaj 0 80 100 00 0*60/00 80*60/00 100*60/00
Celica u p u - p ( u - p )² ( u - p )²/ p 11 1,1 1 14-4 0,857 1, 63 56 +7 49 0,8750 13 1,3 65 70-5 5 0,3571,1 8 6 + 4 0,6667, 17 4-7 49,0417,3 35 30 +5 5 0,8333 Skupaj 00 00 5,0595
za c proporcev H0: p 1 = p = p 3 H1: Vsi p niso enaki = 0,0505 χ exp vse celice o e e 5,0595 tab:? d = ( - 1)(3-1) =
Hi kvadrat tabela tab ( d ; 0,05) 5,99 Stopinje prostosti: d= (s-1)(v-1) s: število stolpcev v: število vrstic Glej na zgornji meji d.995.95.05.05.01 1... 0.004004 3.841 5.04 6.635635 0.010 0.103 5.991 7.378 9.10
za c proporcev H0: p 1 = p = p 3 H1: Vsi p niso enaki = 0,0505 χ exp vsecelice tab: : 5,99 o e e 5,0595 Ne zavržemo Ho! =0,05 d=(-1)(3 1)= 0 p> α exp χ χ tab