ANALIZA TABLICA KONTINGENCIJE

Σχετικά έγγραφα
(Hi-kvadrat test) r (f i f ti ) 2 H = f ti. i=1

Izbor statističkih testova Ana-Maria Šimundić

PISMENI ISPIT IZ STATISTIKE

Počela biostatistike, Poslijediplomski interdisciplinarni doktorski studij Molekularne bioznanosti. Molekularne bioznanosti. Molekularne bioznanosti

numeričkih deskriptivnih mera.

Uvod u neparametarske testove

STATISTIKA S M E I M N I AR R 7 : METODE UZORKA

3 Populacija i uzorak

13. TESTIRANJE HIPOTEZE O NEPOZNATIM KARAKTERISTIKAMA POPULACIJE

2.2 Srednje vrijednosti. aritmetička sredina, medijan, mod. Podaci (realizacije varijable X): x 1,x 2,...,x n (1)

Operacije s matricama

Uvod u neparametrijske testove. Usporedba. Neparametrijske inačice t-testa za dva nezavisna uzorka. dr. sc. Goran Kardum

Testiranje statističkih hipoteza Materijali za nastavu iz Statistike

ELEKTROTEHNIČKI ODJEL

Apsolutno neprekidne raspodele Raspodele apsolutno neprekidnih sluqajnih promenljivih nazivaju se apsolutno neprekidnim raspodelama.

GLAZBENA UMJETNOST. Rezultati državne mature 2010.

5. Karakteristične funkcije

Uvod u neparametarske testove

Kontrolni zadatak (Tačka, prava, ravan, diedar, poliedar, ortogonalna projekcija), grupa A

Strukture podataka i algoritmi 1. kolokvij 16. studenog Zadatak 1

Osnovni primer. (Z, +,,, 0, 1) je komutativan prsten sa jedinicom: množenje je distributivno prema sabiranju

Mate Vijuga: Rijeseni zadaci iz matematike za srednju skolu

Numerička matematika 2. kolokvij (1. srpnja 2009.)

NEPARAMETRIJSKE TEHNIKE

Ĉetverokut - DOMAĆA ZADAĆA. Nakon odgledanih videa trebali biste biti u stanju samostalno riješiti sljedeće zadatke.

Trigonometrija 2. Adicijske formule. Formule dvostrukog kuta Formule polovičnog kuta Pretvaranje sume(razlike u produkt i obrnuto

(P.I.) PRETPOSTAVKA INDUKCIJE - pretpostavimo da tvrdnja vrijedi za n = k.

radni nerecenzirani materijal za predavanja R(f) = {f(x) x D}

Osnove teorije uzoraka

Statističko zaključivanje - testiranje hipoteza. Katedra za medicinsku statistiku i informatiku

Funkcije dviju varjabli (zadaci za vježbu)

7 Algebarske jednadžbe

18. listopada listopada / 13

UNIVERZITET U NIŠU ELEKTRONSKI FAKULTET SIGNALI I SISTEMI. Zbirka zadataka

10. domaća zadaća. 3. Neka je X neprekidna slučajna varijabla takva da je X N(0, 1). S točnošću od odredite:

DISKRETNA MATEMATIKA - PREDAVANJE 7 - Jovanka Pantović

21. ŠKOLSKO/OPĆINSKO/GRADSKO NATJECANJE IZ GEOGRAFIJE GODINE 8. RAZRED TOČNI ODGOVORI

Testiranje statistiqkih hipoteza

Iskazna logika 3. Matematička logika u računarstvu. novembar 2012

Chi-kvadrat test. Chi-kvadrat (χ2) test

Definicija: Hipoteza predstavlja pretpostavku koja je zasnovana na određenim činjenicama (najčešće naučnim ili iskustvenim).

IZRAČUNAVANJE POKAZATELJA NAČINA RADA NAČINA RADA (ISKORIŠĆENOSTI KAPACITETA, STEPENA OTVORENOSTI RADNIH MESTA I NIVOA ORGANIZOVANOSTI)

SEMINAR IZ KOLEGIJA ANALITIČKA KEMIJA I. Studij Primijenjena kemija

- pravac n je zadan s točkom T(2,0) i koeficijentom smjera k=2. (30 bodova)

9. TESTIRANJE HIPOTEZA O PARAMETRU. Josipa Perkov, prof., pred. 1

Str

M086 LA 1 M106 GRP. Tema: Baza vektorskog prostora. Koordinatni sustav. Norma. CSB nejednakost

TESTIRANJE ZNAČAJNOSTI RAZLIKE

MATRICE I DETERMINANTE - formule i zadaci - (Matrice i determinante) 1 / 15

XI dvoqas veжbi dr Vladimir Balti. 4. Stabla

RIJEŠENI ZADACI I TEORIJA IZ

Riješeni zadaci: Limes funkcije. Neprekidnost

Elementi spektralne teorije matrica

Računarska grafika. Rasterizacija linije

Edukacijsko-rehabilitacijski fakultet Sveučilišta u Zagreb S T A T I S T I K A. Skripta. Pripremio: Branko Nikolić. Zagreb 2015./2016.

Neparametarski testovi za dva nezavisna uzorka. Boris Glišić 208/2010 Bojana Ružičić 21/2010

2 tg x ctg x 1 = =, cos 2x Zbog četvrtog kvadranta rješenje je: 2 ctg x

3. OSNOVNI POKAZATELJI TLA

PRIMJER 3. MATLAB filtdemo

Slikovni prikaz podataka

Zadaci sa prethodnih prijemnih ispita iz matematike na Beogradskom univerzitetu

BIOSTATISTIKA za studente medicine

Eliminacijski zadatak iz Matematike 1 za kemičare

POTPUNO RIJEŠENIH ZADATAKA PRIRUČNIK ZA SAMOSTALNO UČENJE

Pismeni ispit iz matematike Riješiti sistem jednačina i diskutovati rješenja sistema u zavisnosti od parametra: ( ) + 1.

IspitivaƬe funkcija: 1. Oblast definisanosti funkcije (ili domen funkcije) D f

Pismeni ispit iz matematike GRUPA A 1. Napisati u trigonometrijskom i eksponencijalnom obliku kompleksni broj, zatim naći 4 z.

Statistika. 1. Uvodna razmatranja o statistici

VJEROJATNOST I STATISTIKA 2. kolokvij lipnja 2016.

INTEGRALNI RAČUN. Teorije, metodike i povijest infinitezimalnih računa. Lucija Mijić 17. veljače 2011.

Grafičko prikazivanje atributivnih i geografskih nizova

3.1 Granična vrednost funkcije u tački

Implementacija HE4 i ROMA indeksa u Klinici za tumore Centru za maligne bolesti KBCSM

IZVODI ZADACI (I deo)

Obrada signala

Matematika 1 - vježbe. 11. prosinca 2015.

( , 2. kolokvij)

Zaključivanje o jednakosti distribucija temeljeno na dva uzorka

IZVODI ZADACI ( IV deo) Rešenje: Najpre ćemo logaritmovati ovu jednakost sa ln ( to beše prirodni logaritam za osnovu e) a zatim ćemo

41. Jednačine koje se svode na kvadratne

TRIGONOMETRIJSKE FUNKCIJE I I.1.

Analitička statistika Testiranje hipoteze.

PRAVA. Prava je u prostoru određena jednom svojom tačkom i vektorom paralelnim sa tom pravom ( vektor paralelnosti).

Pošto pretvaramo iz veće u manju mjernu jedinicu broj 2.5 množimo s 1000,

BILJEŠKE ZA PREDAVANJA (za internu uporabu)

Aritmetička sredina Medijan Mod. Harmonijska sredina

( , treći kolokvij) 3. Na dite lokalne ekstreme funkcije z = x 4 + y 4 2x 2 + 2y 2 3. (20 bodova)

X. Testiranje hipoteza. Osnovni koncepti testiranja hipoteza TESTIRANJE HIPOTEZA OSNOVNI KONCEPTI I TESTOVI POVEZANOSTI 19/11/15

Riješeni zadaci: Nizovi realnih brojeva

Postoji nekoliko statidtičkih testova koji koriste t raspodelu, koji se jednim imenom zovu t-testovi.

4 Testiranje statističkih hipoteza

a M a A. Može se pokazati da je supremum (ako postoji) jedinstven pa uvodimo oznaku sup A.

I.13. Koliki je napon između neke tačke A čiji je potencijal 5 V i referentne tačke u odnosu na koju se taj potencijal računa?

Vjeºbe - Statistika Praktikum Statisti ki testovi (1)

Konstruisanje. Dobro došli na... SREDNJA MAŠINSKA ŠKOLA NOVI SAD DEPARTMAN ZA PROJEKTOVANJE I KONSTRUISANJE

Funkcija gustoće neprekidne slučajne varijable ima dva bitna svojstva: 1. Nenegativnost: f(x) 0, x R, 2. Normiranost: f(x)dx = 1.

Dijagonalizacija operatora

Cauchyjev teorem. Postoji više dokaza ovog teorema, a najjednostvniji je uz pomoć Greenove formule: dxdy. int C i Cauchy Riemannovih uvjeta.

Otpornost R u kolu naizmjenične struje

GRAĐEVINSKI FAKULTET SVEUČILIŠTE U RIJECI. Specijalistički diplomski stručni studij MANN-WHITNEY-WILCOXONOV TEST ZA NEZAVISNE UZORKE.

Transcript:

TABLICA KONTINGENCIJE tablica koja u retcima i stupcima sadrži frekvencije atributivnih obilježja ANALIZA TABLICA KONTINGENCIJE predstavlja empirijsku razdiobu frekvencija obilježja mjerenih nominalnom ordinalnom ljestvicom mjerenja TABLICA S "JEDNIM ULAZOM" (k) TABLICA S "DVA ULAZA" (rk) opažanja klasificirana po više atributa opažanja su klasificirana samo po jednom obilježju opažanja iz više uzoraka klasificirana po kategorijama jednog atributa PRIMJER. GODINA STUDIJA I II III IV V VI BROJ STUDENATA 64 48 3 8 8...najjednostavnija tablica s "dva ulaza" obilježje A DA NE DA n n n x obilježje B NE n n n x n y n y n xy može se promatrati kao: jedan uzorak (sa n xy ispitanika) 3 dva uzorka (sa n y, n y ispitanika) 4 TABLICA S "DVA ULAZA" (r x k) TEST Stručna sprema Nezavršena osnovna škola Osnovna škola Srednja škola Viša škola/bakalaureat Spol Muški Ženski 4 7 3 46 3 3 47 78 37 ocjena slaganja s poznatom razdiobom ocjena razlike razdiobe kategoričkog svojstva u nezavisnim uzorcima ocjena razlike dihotomnog svojstva u zavisnim uzorcima Visoka škola/magisterij 8 7 Doktorat 4 37 4 78 6

TEST ZA OCJENU SLAGANJA S POZNATOM RAZDIOBOM uz unaprijed poznatu razdiobu očekivanih frekvencija, test statistika k ( O i Ei) i Ei gdje je: O i...opažena frekvencija E i...očekivana frekvencija k...broj kategorija ima razdiobu s df=k m stupnjeva slobode za normalnu razdiobu: m = ; df = k - - = k - 3 za binomnu: m = df = k = k - ako je zadana razdioba (ništa ne moramo računati iz podataka): m = df = k = k - k... broj kategorija m... broj parametara u modelu koje treba procijeniti 7 8 uz H... nema razlike u razdiobi O i i E i,3 PODRUČJE PRIHVAĆANJA H PODRUČJE ODBACIVANJA H granični za dani i df za P( ) P( ) ODBACI H, P( ) P( ) PRIHVATI H, (df) 9,9,8,7,6,,4,3,, df= df= df=3 df=4 df= df= Križanjem dviju vrsta biljki dobivena je u sljedećoj generaciji ova razdioba opaženih genotipova: Genotip Aa AA aa Opažene frekvencije 3 3 4 Odgovara li ova razdioba očekivanoj razdiobi :: uz =,? 3 4 6 7 8 9

genotip Aa AA aa,38 O i 3 3 4 E i O (O i -E i ) i -E i 3 9-4 - df 3 ( Oi Ei) Ei,8,6,4,38 Kako dobiti točnu P vrijednost? kalkulator vjerojatnosti Excel WEB specijalizirani programi za analizu podataka za df = : ( ) (,) 9, P( ) P( ) PRIHVATI H (,) (,) 3 4 Excel http://vassarstats.net/ 6 Statistica MedCalc radni list 7 8 3

Izvještavanje rezultata "Nije uočena razlika između razdiobe opaženih genotipova i očekivane razdiobe :: ( test, P =,87)." "Nije uočena razlika između razdiobe opaženih genotipova i očekivane razdiobe :: ( =,38, stupnja slobode, P =,87)." postupak: TEST ZA NEZAVISNE UZORKE formirati tablicu kontingencije (r x k) na osnovu postavljene hipoteze izračunati očekivane frekvencije test statistika dana je sa: r k ( Oij Eij ) E i j gdje je: r...broj redaka k...broj stupaca ima razdiobu s df = (r - ) (k - ) stupnjeva slobode ij 9 VAŽNE NAPOMENE: a) u tablicu smijemo unijeti SAMO APSOLUTNE FREKVENCIJE b) uzorci moraju biti nezavisni c) u x tablici: - NITI JEDNA očekivana frekvencija ne smije biti < - Yatesova korekcija (umanjiti svaku razliku O - E prije kvadriranja za,) "N-" Hi-kvadrat test (modificirana kratka formula) d) ako je u r x k tablici E < u više od % polja, NE MOŽEMO KORISTITI χ TEST rješenje: - spajanje susjednih razreda (frekvencija susjednih polja) - Fisherov egzaktni test Pri istraživanju djelovanja nekog cjepiva, opažena je sljedeća učestalost oboljenja kod određene grupe ljudi: Oboljeli Nisu oboljeli Cijepljeni 9 64 Necijepljeni 7 7 76 9 Postoji li povezanost između učestalosti bolesti i cijepljenja (je li učestalost bolesti različita kod cijepljenih i necijepljenih) uz =,? H... učestalost je ista kod cijepljenih i necijepljenih E oboljelih: ukupno cijepljeni iz H => proporcije oboljelih trebaju biti jednake u obje skupine zajednička proporcija oboljelih: sveukupno ispitanika zpo ukupno oboljeli,46 9 ukupno zdravi 76 zajednička proporcija zdravih: zpz,94844 9 sveukupno ispitanika 3 u grupi cijepljenih... 64,46 = 8,4 u grupi necijepljenih.. 7,46 = 6, Ezdravih: ukupno necijepljeni ukupno cijepljeni u grupi cijepljenih... 64,94844 =, u grupi necijepljenih.. 7,94844 =,4 ukupno necijepljeni zajednička proporcija oboljelih zajednička proporcija zdravih 4 4

Oboljeli Nisu oboljeli = 9 64 Cijepljeni (8,4) (,) Necijepljeni 7 7 * (6,) (,4) 76 9 / Oi 9 7 Ei 8,4 6,,,4 Yates-ova korekcija: Oi 9 7 6,,,4 Oi - Ei -3,4 3,4 3,4-3,4 Ei (Oi - Ei) corr 8,4 -,9,9,9 -,9 (Oi-Ei),9,9,9,9 (Oi-Ei) corr 8,7 8,7 8,7 8,7 (Oi-Ei) /Ei,4,8,8, = 3,4 (Oi-Ei) corr /Ei,3,33,6,7 =,49 6 =,49 točna P vrijednost... za =, i df = : = 6,63 < P >, ne postoji povezanost između učestalosti bolesti i cijepljenja bez korekcije RAZDIOBA s korekcijom 7 8 x tablice kratka formula za test "N " test - za tablicu x sa sljedećim oznakama: Obilježje A a c r Obilježje B b d s m n N Obilježje A a c r Obilježje B b d s m n N N(ad bc) mnrs (N )(ad "N " mnrs bc) 9 3

test (kratka formula) i "N " test za podatke iz primjera točna P vrijednost... Oboljeli Nisu oboljeli Cijepljeni (a) 9 (c) 64 (r) Necijepljeni (b) 7 (d) 7 (s) (m) 76 (n) 9 (N) kratka formula N(ad bc) mnrs 9(7 9) 76647 93977 3,49 8679 (N )(ad bc) "N " mnrs 997 3,397 8679 9(7 9) 76647 "N " 3 3 MedCalc za tablice x koristi "N " test Izvještavanje rezultata "Nije uočena povezanost učestalosti bolesti i cijepljenja ( test, P =,6)." "Nije uočena razlika razdiobe obolijevanja u skupinama cijepljenih i necijepljenih ispitanika ( test, P =,6)." 33 34 Izvještavanje rezultata TEST ZA ZAVISNE UZORKE (McNemarov test) "Nije uočena povezanost učestalosti bolesti i cijepljenja ( = 3,397, stupanj slobode, P =,6)." "Nije uočena razlika razdiobe obolijevanja u skupinama cijepljenih i necijepljenih ispitanika ( = 3,397, stupanj slobode, P =,6)." 3 testiranje značajnosti razlike ( vjerojatnosti povezanosti) između podataka dobivenih na uzorcima parova ( b c ) b c b, c... frekvencije parova koji se ne slažu po prisutnosti obilježja UZORAK I OBILJEŽJE A DA NE UZORAK II DA NE Yatesova korekcija a c b d 36 6

Skupina od 7 bolesnika praćena je tijekom godina. Ispitanici su s obzirom na težinu svrstani u skupinu normalne i prekomjerne (overweight) težine. TEŽINA Na početku Normalna Prekomjerna Nakon godina Normalna 6 3 9 Prekomjerna 4 3 46 4 3 7 McNemarov test pomoću tablica df,, 3,84 4 3,88 4 3 7 Je li se težina ispitanika promijenila tijekom promatranog perioda uz =,? P, 37 38 točna P vrijednost... za =,88 i stupanj slobode: MedCalc McNemarov test (binomni egzaktni test) 39 4 Izvještavanje rezultata "Težina ispitanika se promijenila tijekom promatranog perioda (McNemarov test, P =,3)." OCJENA PROCJENE I ANALIZA TABLICA KONTINGENCIJE "Težina ispitanika se promijenila tijekom promatranog perioda (razlika proporcija 4,7 %, 9 % raspon pouzdanosti od 3, % do,9 %, McNemarov test, P =,3)." 4 4 7

s x s p s n pq n STANDARDNA POGREŠKA ARITMETIČKE SREDINE (SEM-standard error of the mean) STANDARDNA POGREŠKA PROPORCIJE ZADATAK : U studiji objavljenoj 4. godine izmjerena je težina 98 prijevremeno rođene djece i dobivena aritmetička sredina.3kg sa standardnom devijacijom od.4kg. Izračunajte pogrešku procjene aritmetičke sredine i raspon pouzdanosti uz pouzdanost od: a) 9% x z s p z s x z x s x POGREŠKA PROCJENE p z p s p RASPON POUZDANOSTI ARITMETIČKE SREDINE RASPON POUZDANOSTI PROPORCIJE b) 9% c) Kolika je pogreška procjene za standardnu devijaciju od. kg i.6kg, uz pouzdanost 9%? d) Kolika je pogreška procjene uz pouzdanost od 9% i standardnu devijaciju od.6 za uzorke veličine i 3 prijevremeno rođene djece? 43 44 ZADATAK : ZADATAK : n=98 x.3 s=.4 n=98 a) 9% c) Kolika je pogreška procjene za standardnu devijaciju od. kg i.6kg? s =. b) 9% s =.6 4 46 ZADATAK : ZADATAK : d) Kolika je pogreška procjene uz pouzdanost od 9% i standardnu devijaciju od.6 za uzorke veličine i 3 prijevremeno rođene djece? n = n =3 Farmaceutska tvrtka predlaže novi lijek za ublažavanje simptoma PMS-a. U prvim kliničkim istraživanjima lijek se pokazao učinkovit kod 7 od žena. a) izračunajte pogrešku procjene proporcije populacije uz pouzdanost od 9% b) konstruirajte 9% raspon pouzdanosti za proporciju populacije c) izračunajte pogrešku procjene i konstruirajte 9% raspon pouzdanosti proporcije populacije za istu proporciju dobivenu iz uzorka od ispitanica. 47 48 8

ZADATAK : n= p=7/=.7 q=-.7=.3 a) izračunajte pogrešku procjene proporcije populacije uz pouzdanost od 9% ZADATAK : c) izračunajte pogrešku procjene i konstruirajte 9% raspon pouzdanosti proporcije populacije za istu proporciju dobivenu iz uzorka od ispitanica. n= p=.7 q=-.7=.3 b) konstruirajte 9% raspon pouzdanosti za proporciju populacije 49 ZADATAK 3: Ispitivana je ćud (benignost/malignost) tumora mozga prema lokalizaciji. Od bolesnika s benignim tumorom, tumor je bio kod lociran na frontalnom, kod 8 na temporalnom, a kod ostalih na drugim režnjevima mozga. Od bolesnika s malignim tumorom kod 9 se radilo o tumoru frontalnog, kod temporalnog a kod 9 o tumoru ostalih režnjeva mozga. Ocijenite postoji li povezanost malignosti s lokalizacijom tumora na mozgu na razini značajnosti od.. OPAŽENE FREKVENCIJE Frontalni Temporalni Ostali Benigni Maligni OČEKIVANE FREKVENCIJE Frontalni Temporalni Ostali Benigni Maligni =A-B =C^ =POWER(C;) =D/B A B C D E Oi Ei Oi-Ei (Oi-Ei) (Oi-Ei) /Ei 6.67 -.67 3.489.4 3 9 3.33.67 3.489.48 4 8. 8. 64. 3.. -8. 64. 6.4 6 3.33 -.33.489.8 7 9 6.67.33.489.36 8 = 3.6 P=. MedCalc test za nezavisne uzorke test za nezavisne uzorke Tests-> Chi-squared test... =CHIDIST(E8;) 3 4 9

Izvještavanje rezultata "Ćud tumora povezana je s lokalizacijom ( test, P=,)." "Razdioba lokalizacija tumora u skupinama ispitanika s malignim i benignim tumorom se razlikuje ( test, P=,)." ZADATAK 4: Pri križanju dviju jedinki tipa Aa i tipa Bb teorijske vjerojatnosti pojavljivanja kombinacija jesu: p(ab)=9/6 p(ab)=3/6 p(ab)=3/6 p(ab)=/6. Ako su u 6 nezavisnih promatranja dobivene frekvencije 86, 3, 6, 3 testirati hipotezu da su podaci suglasni sa teorijskom raspodjelom uz nivo značajnosti.. 6 tip Oi pi Ei=pi*n Oi-Ei (Oi-Ei) (Oi-Ei) /Ei AB 86 9/6 Ab 3 3/6 ab 6 3/6 ab 3 /6 n= 6 6 H... nema razlike k = m = df = =. P= 7