Chi-kvadrat test. Chi-kvadrat (χ2) test

Σχετικά έγγραφα
Uvod u neparametarske testove

NEPARAMETRIJSKE TEHNIKE

Uvod u neparametarske testove

Počela biostatistike, Poslijediplomski interdisciplinarni doktorski studij Molekularne bioznanosti. Molekularne bioznanosti. Molekularne bioznanosti

Definicija: Hipoteza predstavlja pretpostavku koja je zasnovana na određenim činjenicama (najčešće naučnim ili iskustvenim).

numeričkih deskriptivnih mera.

Neparametarski testovi za dva nezavisna uzorka. Boris Glišić 208/2010 Bojana Ružičić 21/2010

Str

IZRAČUNAVANJE POKAZATELJA NAČINA RADA NAČINA RADA (ISKORIŠĆENOSTI KAPACITETA, STEPENA OTVORENOSTI RADNIH MESTA I NIVOA ORGANIZOVANOSTI)

Analiza varijanse sa jednim Posmatra se samo jedna promenljiva

Apsolutno neprekidne raspodele Raspodele apsolutno neprekidnih sluqajnih promenljivih nazivaju se apsolutno neprekidnim raspodelama.

UNIVERZITET U NIŠU ELEKTRONSKI FAKULTET SIGNALI I SISTEMI. Zbirka zadataka

X. Testiranje hipoteza. Osnovni koncepti testiranja hipoteza TESTIRANJE HIPOTEZA OSNOVNI KONCEPTI I TESTOVI POVEZANOSTI 19/11/15

Testiranje statistiqkih hipoteza

Postoji nekoliko statidtičkih testova koji koriste t raspodelu, koji se jednim imenom zovu t-testovi.

Izbor statističkih testova Ana-Maria Šimundić

MATRICE I DETERMINANTE - formule i zadaci - (Matrice i determinante) 1 / 15

Kontrolni zadatak (Tačka, prava, ravan, diedar, poliedar, ortogonalna projekcija), grupa A

DISKRETNA MATEMATIKA - PREDAVANJE 7 - Jovanka Pantović

Verovatnoća i Statistika I deo Teorija verovatnoće (zadaci) Beleške dr Bobana Marinkovića

Osnovni primer. (Z, +,,, 0, 1) je komutativan prsten sa jedinicom: množenje je distributivno prema sabiranju

Računarska grafika. Rasterizacija linije

Zavrxni ispit iz Matematiqke analize 1

Zadaci sa prethodnih prijemnih ispita iz matematike na Beogradskom univerzitetu

PRAVA. Prava je u prostoru određena jednom svojom tačkom i vektorom paralelnim sa tom pravom ( vektor paralelnosti).

IspitivaƬe funkcija: 1. Oblast definisanosti funkcije (ili domen funkcije) D f

Ispitivanje toka i skiciranje grafika funkcija

Uvod u neparametrijske testove. Usporedba. Neparametrijske inačice t-testa za dva nezavisna uzorka. dr. sc. Goran Kardum

(Hi-kvadrat test) r (f i f ti ) 2 H = f ti. i=1

Statističko zaključivanje - testiranje hipoteza. Katedra za medicinsku statistiku i informatiku

100g maslaca: 751kcal = 20g : E maslac E maslac = (751 x 20)/100 E maslac = 150,2kcal 100g med: 320kcal = 30g : E med E med = (320 x 30)/100 E med =

MATEMATIKA 2. Grupa 1 Rexea zadataka. Prvi pismeni kolokvijum, Dragan ori

Računarska grafika. Rasterizacija linije

TESTIRANJE ZNAČAJNOSTI RAZLIKE

Elementi spektralne teorije matrica

I Pismeni ispit iz matematike 1 I

Betonske konstrukcije 1 - vežbe 3 - Veliki ekscentricitet -Dodatni primeri

XI dvoqas veжbi dr Vladimir Balti. 4. Stabla

21. ŠKOLSKO/OPĆINSKO/GRADSKO NATJECANJE IZ GEOGRAFIJE GODINE 8. RAZRED TOČNI ODGOVORI

Pismeni ispit iz matematike Riješiti sistem jednačina i diskutovati rješenja sistema u zavisnosti od parametra: ( ) + 1.

RIJEŠENI ZADACI I TEORIJA IZ

Riješeni zadaci: Nizovi realnih brojeva

3.1 Granična vrednost funkcije u tački

Grafičko prikazivanje atributivnih i geografskih nizova

PARCIJALNI IZVODI I DIFERENCIJALI. Sama definicija parcijalnog izvoda i diferencijala je malo teža, mi se njome ovde nećemo baviti a vi ćete je,

13. TESTIRANJE HIPOTEZE O NEPOZNATIM KARAKTERISTIKAMA POPULACIJE

POSTAVLJANJE I TESTIRANJE HIPOTEZA

41. Jednačine koje se svode na kvadratne

Klasifikacija blizu Kelerovih mnogostrukosti. konstantne holomorfne sekcione krivine. Kelerove. mnogostrukosti. blizu Kelerove.

Analiza varijanse (ANOVA) Analiza varijanse sa jednim faktorom ANOVA 07/12/2017. Tehnike za analizu podataka. Multivarijacione tehnike

Testiranje hipoteza statistika zaključivanja

radni nerecenzirani materijal za predavanja R(f) = {f(x) x D}

Mašinsko učenje. Regresija.

3 Populacija i uzorak

ELEKTROTEHNIČKI ODJEL

( , 2. kolokvij)

Moguća i virtuelna pomjeranja

5. Karakteristične funkcije

Trigonometrija 2. Adicijske formule. Formule dvostrukog kuta Formule polovičnog kuta Pretvaranje sume(razlike u produkt i obrnuto

SEKUNDARNE VEZE međumolekulske veze

SISTEMI NELINEARNIH JEDNAČINA

Pismeni ispit iz matematike GRUPA A 1. Napisati u trigonometrijskom i eksponencijalnom obliku kompleksni broj, zatim naći 4 z.

Obrada signala

Sistemi veštačke inteligencije primer 1

OBRTNA TELA. Vladimir Marinkov OBRTNA TELA VALJAK

S t r a n a 1. 1.Povezati jonsku jačinu rastvora: a) MgCl 2 b) Al 2 (SO 4 ) 3 sa njihovim molalitetima, m. za so tipa: M p X q. pa je jonska jačina:

Studentov t-test. razlike. t = SG X

- pravac n je zadan s točkom T(2,0) i koeficijentom smjera k=2. (30 bodova)

Konstruisanje. Dobro došli na... SREDNJA MAŠINSKA ŠKOLA NOVI SAD DEPARTMAN ZA PROJEKTOVANJE I KONSTRUISANJE

Operacije s matricama

10. STABILNOST KOSINA

18. listopada listopada / 13

Program testirati pomoću podataka iz sledeće tabele:

ZBIRKA POTPUNO RIJEŠENIH ZADATAKA

Iskazna logika 3. Matematička logika u računarstvu. novembar 2012

TRIGONOMETRIJA TROKUTA

INTELIGENTNO UPRAVLJANJE

2 tg x ctg x 1 = =, cos 2x Zbog četvrtog kvadranta rješenje je: 2 ctg x

STATIČKE KARAKTERISTIKE DIODA I TRANZISTORA

(P.I.) PRETPOSTAVKA INDUKCIJE - pretpostavimo da tvrdnja vrijedi za n = k.

nepoznati parametar θ jednak broju θ 0, u oznaci H 0 (θ =θ 0 ), je primer proste hipoteze. Ako hipoteza nije prosta, onda je složena.

OSNOVI ELEKTRONIKE VEŽBA BROJ 1 OSNOVNA KOLA SA DIODAMA

Novi Sad god Broj 1 / 06 Veljko Milković Bulevar cara Lazara 56 Novi Sad. Izveštaj o merenju

SEMINAR IZ KOLEGIJA ANALITIČKA KEMIJA I. Studij Primijenjena kemija

VJEŽBE 3 BIPOLARNI TRANZISTORI. Slika 1. Postoje npn i pnp bipolarni tranziostori i njihovi simboli su dati na slici 2 i to npn lijevo i pnp desno.

2.2 Srednje vrijednosti. aritmetička sredina, medijan, mod. Podaci (realizacije varijable X): x 1,x 2,...,x n (1)

I.13. Koliki je napon između neke tačke A čiji je potencijal 5 V i referentne tačke u odnosu na koju se taj potencijal računa?

Regresija i korelacija

Uvod Teorija odlučivanja je analitički i sistematski pristup proučavanju procesa donošenja odluka Bez obzira o čemu donosimo odluku imamo 6 koraka za

Numerička matematika 2. kolokvij (1. srpnja 2009.)

Teorijske osnove informatike 1

Zadaci iz trigonometrije za seminar

Prvi pismeni zadatak iz Analize sa algebrom novembar Ispitati znak funkcije f(x) = tgx x x3. 2. Naći graničnu vrednost lim x a

HEMIJSKA VEZA TEORIJA VALENTNE VEZE

NOMENKLATURA ORGANSKIH SPOJEVA. Imenovanje aromatskih ugljikovodika

( ) ( ) 2 UNIVERZITET U ZENICI POLITEHNIČKI FAKULTET. Zadaci za pripremu polaganja kvalifikacionog ispita iz Matematike. 1. Riješiti jednačine: 4

4.7. Zadaci Formalizam diferenciranja (teorija na stranama ) 343. Znajući izvod funkcije x arctg x, odrediti izvod funkcije x arcctg x.

9. TESTIRANJE HIPOTEZA O PARAMETRU. Josipa Perkov, prof., pred. 1

Statistiqki softver 4 Sedmi qas

Funkcije dviju varjabli (zadaci za vježbu)

Transcript:

1 Chi-kvadrat test Chi-kvadrat (χ2) test Test za proporcije, porede se frekvence Neparametarski test Koriste se dihotomne varijable Proverava se veza između dva faktora Npr. tretmana i bolesti pola i smrtnosti 2

Koraci u testiranju hipoteze 1. Izabrati odgovarajući test 1. test homogenosti 2. test nezavisnosti 2. Odabrati nivo značajnosti: α 3. Formulisati statističku hipotezu 4. Izračunati statističku veličinu (χ 2 ) 5. Odrediti broj stepene slobode 6. Uporediti izračunatu statističku veličinu sa tebelarnom / kritičnom vrednošću 3 1. Odabiranje odgovarajućeg testa Chi-kvadrat test se koristi kada su obe varjable izražene u nominalnim skalama. Podaci koji su predstavljeni u vidu skale odnosa ili ordinalnoj skali mogu da se kategorišu u mali broj grupa. Podaci su po principu slučajnosti selektovani iz populacije Svi podaci su nezavisni (jedna osoba se pojavljuje samo jednom u tabeli i nema preklapanje kategorija) Nije bitna vrsta distribucije ni homogenost varjanse. 4

1. Odabiranje odgovarajućeg testa Testiranje nezavisnosti između dva kriterijuma klasifikacije kod jedne grupe podataka Koristi se kada istraživač želi da proceni da li su dva ishoda u vezi ili nezavisni jedan od drugog, a ispitivani su u populaciji Za testiranje nezavisnosti između dva kriterijuma klasfikacije koji su primenjeni kod jedne grupe podataka Testiranje homogenosti grupa Koristi se kada su uzorci selektovani iz različitih populacija, a istraživač ispituje da li je udeo nekog ishoda isti u obe populacije 5 2. Nivo značajnosti α predeterminisana vrednost Uobičajene vrednosti α =.05 α =.01 α =.001 6

3. Formulisanje hipoteze: Da li ima veze između podataka ili ne? Test nezavisnosti: H o : Dve varijabale su nezavisne H a : Dve varijable su u vezi Test homogenosti: H o : Dve varijabale su homogene u odnosu na nivo klasifikacije H a : Dve varijabale nisu homogene u odnosu na nivo klasifikacije 7 4. Izračunavanje statističke veličine Što su dobijene frekvence bliže očekivanim, to je veća verovatnoća da je H 0 ispravna Za testiranje H 0 koristi se Pearson Chi-kvadrat. Izračunavaju se kvadrati razlika dobijenih i očekivanih frekvenci u odnosu na očekivane frekvence Statistička veličina Pearson χ2 izračunava se prema izrazu: χ = 2 2 ( f d f o ) f o 8

9 5. Broj stepeni slobode df = (R-1)(K-1) Broj redova Broj kolona 6. Poređenje izračunate vrednosti sa tabelarnom / kritičnom vrednošću Izračunata vrednost Pearson chi- kvadrata poredi se sa kritičnom vrednošću kako bi se testirala hipoteza. Kritična vrednost se dobija iz tabele i zavisi od distribucije podataka Ukoliko je izračunati χ 2 veći od tabelarnog χ 2, odbacuje se H o 10

Primer (test nezavisnosti) Ispitivano je 90 osoba uživalaca droge i procenjivano je agresivno ponašanje u zavisnosti od stepena uživanja droge. Od 25 lakih i 25 srednjih uživalaca droge po 10 se ponašalo agresivno, a od 40 teških uživalaca droge 30 se ponašalo agresivno. Ispitati da li postoji veza između agresivnog ponašanju i stepena uživanja droge? 11 Tabela kontigencije Lako Srednje Teško f red Agresivno 10 10 30 50 ponašanje Ostali 15 15 10 40 f kolone 25 25 40 n = 90 12

Hipoteza Ho : Postoji nezavisnost između agresivnog ponašanja i stepena korišćenja droge Ha : Nema nezavisnosti (postoji veza) između agresivnog ponašanja i stepena korišćenja droge 13 Agresivno ponašanje 4. Izračunavanje statističke veličine Lako Srednje Teško f red f d =10 f o =13.9 Ostali f d =15 f o =11.1 f d =10 f o =13.9 f d =15 f o =11.1 = 50*25/90 f d =30 f o =22.2 f d =10 f o =17.8 f kolona 25 25 40 n = 90 50 40 14

Agresivno ponašanje 4. Izračunavanje statističke veličine Lako Srednje Teško f red f o =10 f e =13.9 Ostali f o =15 f e =11.1 f o =10 f e =13.9 = 40* 25/90 f o =15 f e =11.1 f o =30 f e =22.2 f o =10 f e =17.8 f kolona 25 25 40 n = 90 50 40 15 4. Izračunavanje statističke veličine 2 (10 13.89) χ = 13.89 2 (10 13.89) + 13.89 2 (30 22.2) + 22.2 2 + (15 11.11) 11.11 2 (15 11.11) + 11.11 2 (10 17.8) + 17.8 2 = 11.03 16

5. Izračunavanje stepena slobode df = (R-1)(K-1) = (2-1)(3-1) = 2 Upper Tail Area DF.995.95.05 1... 0.004 3.841 2 0.010 0.103 5.991 17 6. Poređenje izračunate i tabelarne vrednosti α = 0.05 df = 2 Kritična tabelarna vrednost = 5.991 Izračunata vrednost, 11.03 Odbacuje se 0 5,991 χ 2 18

6. Poređenje izračunate i tabelarne vrednosti Izračunata vrednost, 11,03 veća od kritične vrednosti 5,991 Odbacuje se nulta hipoteza Postoji veza između agresivnog ponašanja i stepena uživanja droge 19 Ograničenja Podaci su odabrani po principu slučajnosti. Neophodan je relativno veliki uzorak (najmanje 20 ispitanika) Apsolutne frekvence (ne procenti) Najmanje 5 podataka po ćeliji. U suprotnom treba primeniti Yates korekciju. Posmatranja moraju da budu nezavisna. 20

Kalkulatori http://faculty.vassar.edu/lowry/newcs.html? http://people.ku.edu/~preacher/chisq/chisq.h tm 21 Zadatak 1 Novi postoperativni postupak primenjuje se u jednoj velikoj bolnici. Cilj istraživanja je da se ispita postojanje zavisnost između stava prema novoj proceduri i stepena obrazovanja? U istraživanje je uključeno 400 zaposlenih zdravstvenih radnika. Grupe Nova Stara Neutralni Sestre 100 80 20 Doktori 50 120 30 22

TEST NEZAVISNOSTI H o : Dve varjabale su nezavisne H a : Dve varjable su u vezi χ 2 =26.67, p<0.001 Prihvata se alternativna hipoteza Postoji zavisnost između stepena obrazovanja i primene nove procedure 23 Zadatak 2 Od 25 žena sa kancerom materice, 20 se izjasnilo da je uzimalo estrogen. Od 30 žena iz kontrolne grupe 5 se izjasnilo da je uzimalo estrogen. Da li je udeo žena koje su uzimale estrogen isti u obe ispitivane grupe? 24

Test homogenosti Pacijenti Kontrole Da estrogen 20 5 Ne estrogen 5 25 H o : Dve varjabale su homogene u odnosu na nivo klasifikacije H a : Dve varjabale nisu homogene u odnosu na nivo klasifikacije χ 2 =19.58, p<0.001 Prihvata se alternativna hipoteza Udeo žena koje su koristile estrogen nije isti u dve ispitivane grupe. Veći je udeo u grupi pacijentkinja. 25 Zadatak 3 Istraživači su selektovali uzorak od 150 učenika srednjih škola iz tri različite opštine sa ciljem istraživanja: Da li deca dolaze u školu vozeći kola sama ili ih dovoze njihovi roditelji? Testira se da li je udeo učenika koji voze kola sama isti u sve tri škole? School 1 School 2 School 3 No 32 28 34 Yes 18 22 16 26

Test homogenosti H o : Dve varjabale su homogene u odnosu na nivo klasifikacije H a : Dve varjabale nisu homogene u odnosu na nivo klasifikacije χ 2 =1.6, p=0.4493 Prihvata se nulta hipoteza Udeo dece koja kola voze sama je isti u sve tri ispitivane škole. 27 Fisher's exact test, (za mali uzorak) McNemar testza poređenje dve proporcije. Svi podaci su zavisni(jedna osoba se pojavljuje u više kategorija) (repeated measurements). 28

McNemar test Ispitivanje je izvršeno na 300 osoba koje su korisnici kredita u nekoj banci. Pitanje je bilo koliko bi osoba pristalo na refinansiranje kredita. Nakon toga banke su promenile uslove refinansiranja kredita i opet je istoj grupi ispitanika postavljeno pitanje o refinansiranju kredita. Cilj banke je bio da utvrdi da li će promena u uslovima refinansiranja povećati broj osoba koje će koristiti tu uslugu. 29 McNemar Test Pre promene uslova Nakon promene uslova da ne ukupno da 118 2 120 ne 22 158 180 ukupno 140 160 300 H 0 : π 1 π 2 : Promena u uslovima je neefektivna H 1 : π 1 < π 2 : Promena u uslovima povećava refinansiranje 30

McNemar Test Pre promene uslova Nakon promene uslova da ne ukupno da 118 2 120 ne 22 158 180 ukupno 140 160 300 The test statistic is: B C Z = = B + C p= 2.23E-05 2 22 2 + 22 = 4.08 31