TABLICA KONTINGENCIJE tablica koja u retcima i stupcima sadrži frekvencije atributivnih obilježja ANALIZA TABLICA KONTINGENCIJE predstavlja empirijsku razdiobu frekvencija obilježja mjerenih nominalnom ordinalnom ljestvicom mjerenja TABLICA S "JEDNIM ULAZOM" (k) TABLICA S "DVA ULAZA" (rk) opažanja klasificirana po više atributa opažanja su klasificirana samo po jednom obilježju opažanja iz više uzoraka klasificirana po kategorijama jednog atributa PRIMJER. GODINA STUDIJA I II III IV V VI BROJ STUDENATA 64 48 3 8 8...najjednostavnija tablica s "dva ulaza" obilježje A DA NE DA n n n x obilježje B NE n n n x n y n y n xy može se promatrati kao: jedan uzorak (sa n xy ispitanika) 3 dva uzorka (sa n y, n y ispitanika) 4 TABLICA S "DVA ULAZA" (r x k) TEST Stručna sprema Nezavršena osnovna škola Osnovna škola Srednja škola Viša škola/bakalaureat Spol Muški Ženski 4 7 3 46 3 3 47 78 37 ocjena slaganja s poznatom razdiobom ocjena razlike razdiobe kategoričkog svojstva u nezavisnim uzorcima ocjena razlike dihotomnog svojstva u zavisnim uzorcima Visoka škola/magisterij 8 7 Doktorat 4 37 4 78 6
TEST ZA OCJENU SLAGANJA S POZNATOM RAZDIOBOM uz unaprijed poznatu razdiobu očekivanih frekvencija, test statistika k ( O i Ei) i Ei gdje je: O i...opažena frekvencija E i...očekivana frekvencija k...broj kategorija ima razdiobu s df=k m stupnjeva slobode za normalnu razdiobu: m = ; df = k - - = k - 3 za binomnu: m = df = k = k - ako je zadana razdioba (ništa ne moramo računati iz podataka): m = df = k = k - k... broj kategorija m... broj parametara u modelu koje treba procijeniti 7 8 uz H... nema razlike u razdiobi O i i E i,3 PODRUČJE PRIHVAĆANJA H PODRUČJE ODBACIVANJA H granični za dani i df za P( ) P( ) ODBACI H, P( ) P( ) PRIHVATI H, (df) 9,9,8,7,6,,4,3,, df= df= df=3 df=4 df= df= Križanjem dviju vrsta biljki dobivena je u sljedećoj generaciji ova razdioba opaženih genotipova: Genotip Aa AA aa Opažene frekvencije 3 3 4 Odgovara li ova razdioba očekivanoj razdiobi :: uz =,? 3 4 6 7 8 9
genotip Aa AA aa,38 O i 3 3 4 E i O (O i -E i ) i -E i 3 9-4 - df 3 ( Oi Ei) Ei,8,6,4,38 Kako dobiti točnu P vrijednost? kalkulator vjerojatnosti Excel WEB specijalizirani programi za analizu podataka za df = : ( ) (,) 9, P( ) P( ) PRIHVATI H (,) (,) 3 4 Excel http://vassarstats.net/ 6 Statistica MedCalc radni list 7 8 3
Izvještavanje rezultata "Nije uočena razlika između razdiobe opaženih genotipova i očekivane razdiobe :: ( test, P =,87)." "Nije uočena razlika između razdiobe opaženih genotipova i očekivane razdiobe :: ( =,38, stupnja slobode, P =,87)." postupak: TEST ZA NEZAVISNE UZORKE formirati tablicu kontingencije (r x k) na osnovu postavljene hipoteze izračunati očekivane frekvencije test statistika dana je sa: r k ( Oij Eij ) E i j gdje je: r...broj redaka k...broj stupaca ima razdiobu s df = (r - ) (k - ) stupnjeva slobode ij 9 VAŽNE NAPOMENE: a) u tablicu smijemo unijeti SAMO APSOLUTNE FREKVENCIJE b) uzorci moraju biti nezavisni c) u x tablici: - NITI JEDNA očekivana frekvencija ne smije biti < - Yatesova korekcija (umanjiti svaku razliku O - E prije kvadriranja za,) "N-" Hi-kvadrat test (modificirana kratka formula) d) ako je u r x k tablici E < u više od % polja, NE MOŽEMO KORISTITI χ TEST rješenje: - spajanje susjednih razreda (frekvencija susjednih polja) - Fisherov egzaktni test Pri istraživanju djelovanja nekog cjepiva, opažena je sljedeća učestalost oboljenja kod određene grupe ljudi: Oboljeli Nisu oboljeli Cijepljeni 9 64 Necijepljeni 7 7 76 9 Postoji li povezanost između učestalosti bolesti i cijepljenja (je li učestalost bolesti različita kod cijepljenih i necijepljenih) uz =,? H... učestalost je ista kod cijepljenih i necijepljenih E oboljelih: ukupno cijepljeni iz H => proporcije oboljelih trebaju biti jednake u obje skupine zajednička proporcija oboljelih: sveukupno ispitanika zpo ukupno oboljeli,46 9 ukupno zdravi 76 zajednička proporcija zdravih: zpz,94844 9 sveukupno ispitanika 3 u grupi cijepljenih... 64,46 = 8,4 u grupi necijepljenih.. 7,46 = 6, Ezdravih: ukupno necijepljeni ukupno cijepljeni u grupi cijepljenih... 64,94844 =, u grupi necijepljenih.. 7,94844 =,4 ukupno necijepljeni zajednička proporcija oboljelih zajednička proporcija zdravih 4 4
Oboljeli Nisu oboljeli = 9 64 Cijepljeni (8,4) (,) Necijepljeni 7 7 * (6,) (,4) 76 9 / Oi 9 7 Ei 8,4 6,,,4 Yates-ova korekcija: Oi 9 7 6,,,4 Oi - Ei -3,4 3,4 3,4-3,4 Ei (Oi - Ei) corr 8,4 -,9,9,9 -,9 (Oi-Ei),9,9,9,9 (Oi-Ei) corr 8,7 8,7 8,7 8,7 (Oi-Ei) /Ei,4,8,8, = 3,4 (Oi-Ei) corr /Ei,3,33,6,7 =,49 6 =,49 točna P vrijednost... za =, i df = : = 6,63 < P >, ne postoji povezanost između učestalosti bolesti i cijepljenja bez korekcije RAZDIOBA s korekcijom 7 8 x tablice kratka formula za test "N " test - za tablicu x sa sljedećim oznakama: Obilježje A a c r Obilježje B b d s m n N Obilježje A a c r Obilježje B b d s m n N N(ad bc) mnrs (N )(ad "N " mnrs bc) 9 3
test (kratka formula) i "N " test za podatke iz primjera točna P vrijednost... Oboljeli Nisu oboljeli Cijepljeni (a) 9 (c) 64 (r) Necijepljeni (b) 7 (d) 7 (s) (m) 76 (n) 9 (N) kratka formula N(ad bc) mnrs 9(7 9) 76647 93977 3,49 8679 (N )(ad bc) "N " mnrs 997 3,397 8679 9(7 9) 76647 "N " 3 3 MedCalc za tablice x koristi "N " test Izvještavanje rezultata "Nije uočena povezanost učestalosti bolesti i cijepljenja ( test, P =,6)." "Nije uočena razlika razdiobe obolijevanja u skupinama cijepljenih i necijepljenih ispitanika ( test, P =,6)." 33 34 Izvještavanje rezultata TEST ZA ZAVISNE UZORKE (McNemarov test) "Nije uočena povezanost učestalosti bolesti i cijepljenja ( = 3,397, stupanj slobode, P =,6)." "Nije uočena razlika razdiobe obolijevanja u skupinama cijepljenih i necijepljenih ispitanika ( = 3,397, stupanj slobode, P =,6)." 3 testiranje značajnosti razlike ( vjerojatnosti povezanosti) između podataka dobivenih na uzorcima parova ( b c ) b c b, c... frekvencije parova koji se ne slažu po prisutnosti obilježja UZORAK I OBILJEŽJE A DA NE UZORAK II DA NE Yatesova korekcija a c b d 36 6
Skupina od 7 bolesnika praćena je tijekom godina. Ispitanici su s obzirom na težinu svrstani u skupinu normalne i prekomjerne (overweight) težine. TEŽINA Na početku Normalna Prekomjerna Nakon godina Normalna 6 3 9 Prekomjerna 4 3 46 4 3 7 McNemarov test pomoću tablica df,, 3,84 4 3,88 4 3 7 Je li se težina ispitanika promijenila tijekom promatranog perioda uz =,? P, 37 38 točna P vrijednost... za =,88 i stupanj slobode: MedCalc McNemarov test (binomni egzaktni test) 39 4 Izvještavanje rezultata "Težina ispitanika se promijenila tijekom promatranog perioda (McNemarov test, P =,3)." OCJENA PROCJENE I ANALIZA TABLICA KONTINGENCIJE "Težina ispitanika se promijenila tijekom promatranog perioda (razlika proporcija 4,7 %, 9 % raspon pouzdanosti od 3, % do,9 %, McNemarov test, P =,3)." 4 4 7
s x s p s n pq n STANDARDNA POGREŠKA ARITMETIČKE SREDINE (SEM-standard error of the mean) STANDARDNA POGREŠKA PROPORCIJE ZADATAK : U studiji objavljenoj 4. godine izmjerena je težina 98 prijevremeno rođene djece i dobivena aritmetička sredina.3kg sa standardnom devijacijom od.4kg. Izračunajte pogrešku procjene aritmetičke sredine i raspon pouzdanosti uz pouzdanost od: a) 9% x z s p z s x z x s x POGREŠKA PROCJENE p z p s p RASPON POUZDANOSTI ARITMETIČKE SREDINE RASPON POUZDANOSTI PROPORCIJE b) 9% c) Kolika je pogreška procjene za standardnu devijaciju od. kg i.6kg, uz pouzdanost 9%? d) Kolika je pogreška procjene uz pouzdanost od 9% i standardnu devijaciju od.6 za uzorke veličine i 3 prijevremeno rođene djece? 43 44 ZADATAK : ZADATAK : n=98 x.3 s=.4 n=98 a) 9% c) Kolika je pogreška procjene za standardnu devijaciju od. kg i.6kg? s =. b) 9% s =.6 4 46 ZADATAK : ZADATAK : d) Kolika je pogreška procjene uz pouzdanost od 9% i standardnu devijaciju od.6 za uzorke veličine i 3 prijevremeno rođene djece? n = n =3 Farmaceutska tvrtka predlaže novi lijek za ublažavanje simptoma PMS-a. U prvim kliničkim istraživanjima lijek se pokazao učinkovit kod 7 od žena. a) izračunajte pogrešku procjene proporcije populacije uz pouzdanost od 9% b) konstruirajte 9% raspon pouzdanosti za proporciju populacije c) izračunajte pogrešku procjene i konstruirajte 9% raspon pouzdanosti proporcije populacije za istu proporciju dobivenu iz uzorka od ispitanica. 47 48 8
ZADATAK : n= p=7/=.7 q=-.7=.3 a) izračunajte pogrešku procjene proporcije populacije uz pouzdanost od 9% ZADATAK : c) izračunajte pogrešku procjene i konstruirajte 9% raspon pouzdanosti proporcije populacije za istu proporciju dobivenu iz uzorka od ispitanica. n= p=.7 q=-.7=.3 b) konstruirajte 9% raspon pouzdanosti za proporciju populacije 49 ZADATAK 3: Ispitivana je ćud (benignost/malignost) tumora mozga prema lokalizaciji. Od bolesnika s benignim tumorom, tumor je bio kod lociran na frontalnom, kod 8 na temporalnom, a kod ostalih na drugim režnjevima mozga. Od bolesnika s malignim tumorom kod 9 se radilo o tumoru frontalnog, kod temporalnog a kod 9 o tumoru ostalih režnjeva mozga. Ocijenite postoji li povezanost malignosti s lokalizacijom tumora na mozgu na razini značajnosti od.. OPAŽENE FREKVENCIJE Frontalni Temporalni Ostali Benigni Maligni OČEKIVANE FREKVENCIJE Frontalni Temporalni Ostali Benigni Maligni =A-B =C^ =POWER(C;) =D/B A B C D E Oi Ei Oi-Ei (Oi-Ei) (Oi-Ei) /Ei 6.67 -.67 3.489.4 3 9 3.33.67 3.489.48 4 8. 8. 64. 3.. -8. 64. 6.4 6 3.33 -.33.489.8 7 9 6.67.33.489.36 8 = 3.6 P=. MedCalc test za nezavisne uzorke test za nezavisne uzorke Tests-> Chi-squared test... =CHIDIST(E8;) 3 4 9
Izvještavanje rezultata "Ćud tumora povezana je s lokalizacijom ( test, P=,)." "Razdioba lokalizacija tumora u skupinama ispitanika s malignim i benignim tumorom se razlikuje ( test, P=,)." ZADATAK 4: Pri križanju dviju jedinki tipa Aa i tipa Bb teorijske vjerojatnosti pojavljivanja kombinacija jesu: p(ab)=9/6 p(ab)=3/6 p(ab)=3/6 p(ab)=/6. Ako su u 6 nezavisnih promatranja dobivene frekvencije 86, 3, 6, 3 testirati hipotezu da su podaci suglasni sa teorijskom raspodjelom uz nivo značajnosti.. 6 tip Oi pi Ei=pi*n Oi-Ei (Oi-Ei) (Oi-Ei) /Ei AB 86 9/6 Ab 3 3/6 ab 6 3/6 ab 3 /6 n= 6 6 H... nema razlike k = m = df = =. P= 7