Zaključivanje o jednakosti distribucija temeljeno na dva uzorka

Σχετικά έγγραφα
3 Populacija i uzorak

(Hi-kvadrat test) r (f i f ti ) 2 H = f ti. i=1

PISMENI ISPIT IZ STATISTIKE

(P.I.) PRETPOSTAVKA INDUKCIJE - pretpostavimo da tvrdnja vrijedi za n = k.

3.1 Granična vrednost funkcije u tački

2 tg x ctg x 1 = =, cos 2x Zbog četvrtog kvadranta rješenje je: 2 ctg x

Linearna algebra 2 prvi kolokvij,

Izbor statističkih testova Ana-Maria Šimundić

M086 LA 1 M106 GRP. Tema: Baza vektorskog prostora. Koordinatni sustav. Norma. CSB nejednakost

ELEKTROTEHNIČKI ODJEL

7 Algebarske jednadžbe

Počela biostatistike, Poslijediplomski interdisciplinarni doktorski studij Molekularne bioznanosti. Molekularne bioznanosti. Molekularne bioznanosti

Testiranje statističkih hipoteza Materijali za nastavu iz Statistike

a M a A. Može se pokazati da je supremum (ako postoji) jedinstven pa uvodimo oznaku sup A.

INTEGRALNI RAČUN. Teorije, metodike i povijest infinitezimalnih računa. Lucija Mijić 17. veljače 2011.

numeričkih deskriptivnih mera.

PARCIJALNI IZVODI I DIFERENCIJALI. Sama definicija parcijalnog izvoda i diferencijala je malo teža, mi se njome ovde nećemo baviti a vi ćete je,

VJEROJATNOST I STATISTIKA Popravni kolokvij - 1. rujna 2016.

Operacije s matricama

Osnovni primer. (Z, +,,, 0, 1) je komutativan prsten sa jedinicom: množenje je distributivno prema sabiranju

Iskazna logika 3. Matematička logika u računarstvu. novembar 2012

UNIVERZITET U NIŠU ELEKTRONSKI FAKULTET SIGNALI I SISTEMI. Zbirka zadataka

Funkcija gustoće neprekidne slučajne varijable ima dva bitna svojstva: 1. Nenegativnost: f(x) 0, x R, 2. Normiranost: f(x)dx = 1.

18. listopada listopada / 13

1 Promjena baze vektora

2.2 Srednje vrijednosti. aritmetička sredina, medijan, mod. Podaci (realizacije varijable X): x 1,x 2,...,x n (1)

Riješeni zadaci: Nizovi realnih brojeva

VJEROJATNOST I STATISTIKA 2. kolokvij lipnja 2016.

Trigonometrija 2. Adicijske formule. Formule dvostrukog kuta Formule polovičnog kuta Pretvaranje sume(razlike u produkt i obrnuto

Matematička analiza 1 dodatni zadaci

Strukture podataka i algoritmi 1. kolokvij 16. studenog Zadatak 1

Definicija: Hipoteza predstavlja pretpostavku koja je zasnovana na određenim činjenicama (najčešće naučnim ili iskustvenim).

41. Jednačine koje se svode na kvadratne

Funkcije dviju varjabli (zadaci za vježbu)

Verovatnoća i Statistika I deo Teorija verovatnoće (zadaci) Beleške dr Bobana Marinkovića

Elementi spektralne teorije matrica

IZRAČUNAVANJE POKAZATELJA NAČINA RADA NAČINA RADA (ISKORIŠĆENOSTI KAPACITETA, STEPENA OTVORENOSTI RADNIH MESTA I NIVOA ORGANIZOVANOSTI)

PRAVA. Prava je u prostoru određena jednom svojom tačkom i vektorom paralelnim sa tom pravom ( vektor paralelnosti).

Linearna algebra 2 prvi kolokvij,

( , 2. kolokvij)

TRIGONOMETRIJSKE FUNKCIJE I I.1.

DISKRETNA MATEMATIKA - PREDAVANJE 7 - Jovanka Pantović

IZVODI ZADACI ( IV deo) Rešenje: Najpre ćemo logaritmovati ovu jednakost sa ln ( to beše prirodni logaritam za osnovu e) a zatim ćemo

Statističko zaključivanje jedna varijabla

PRIMJER 3. MATLAB filtdemo

Sume kvadrata. mn = (ax + by) 2 + (ay bx) 2.

Slučajne varijable. Diskretna slučajna varijabla X je promjenjiva veličina koja poprima vrijednosti iz skupa

Apsolutno neprekidne raspodele Raspodele apsolutno neprekidnih sluqajnih promenljivih nazivaju se apsolutno neprekidnim raspodelama.

Testiranje statistiqkih hipoteza

Uvod u neparametrijske testove. Usporedba. Neparametrijske inačice t-testa za dva nezavisna uzorka. dr. sc. Goran Kardum

Str

radni nerecenzirani materijal za predavanja R(f) = {f(x) x D}

Riješeni zadaci: Limes funkcije. Neprekidnost

Neka je a 3 x 3 + a 2 x 2 + a 1 x + a 0 = 0 algebarska jednadžba trećeg stupnja. Rješavanje ove jednadžbe sastoji se od nekoliko koraka.

RIJEŠENI ZADACI I TEORIJA IZ

Dijagonalizacija operatora

4 Testiranje statističkih hipoteza

21. ŠKOLSKO/OPĆINSKO/GRADSKO NATJECANJE IZ GEOGRAFIJE GODINE 8. RAZRED TOČNI ODGOVORI

IZVODI ZADACI (I deo)

STATISTIKA S M E I M N I AR R 7 : METODE UZORKA

STATISTIKA. KONCEPTI : POPULACIJA i UZORAK. Primjer: svi glasači, samo neki glasači

Uvod u neparametarske testove

9. TESTIRANJE HIPOTEZA O PARAMETRU. Josipa Perkov, prof., pred. 1

Betonske konstrukcije 1 - vežbe 3 - Veliki ekscentricitet -Dodatni primeri

Kontrolni zadatak (Tačka, prava, ravan, diedar, poliedar, ortogonalna projekcija), grupa A

Eliminacijski zadatak iz Matematike 1 za kemičare

Teorijske osnove informatike 1

π π ELEKTROTEHNIČKI ODJEL i) f (x) = x 3 x 2 x + 1, a = 1, b = 1;

1.4 Tangenta i normala

5. Karakteristične funkcije

SVEUČILIŠTE U RIJECI GRAĐEVINSKI FAKULTET U RIJECI. Specijalistički diplomski stručni studij

Slučajne varijable Materijali za nastavu iz Statistike

VJEŽBE 3 BIPOLARNI TRANZISTORI. Slika 1. Postoje npn i pnp bipolarni tranziostori i njihovi simboli su dati na slici 2 i to npn lijevo i pnp desno.

SEMINAR IZ KOLEGIJA ANALITIČKA KEMIJA I. Studij Primijenjena kemija

10. domaća zadaća. 3. Neka je X neprekidna slučajna varijabla takva da je X N(0, 1). S točnošću od odredite:

BILJEŠKE ZA PREDAVANJA (za internu uporabu)

Više dokaza jedne poznate trigonometrijske nejednakosti u trokutu

Sortiranje prebrajanjem (Counting sort) i Radix Sort

Neparametarski testovi za dva nezavisna uzorka. Boris Glišić 208/2010 Bojana Ružičić 21/2010

ZBIRKA POTPUNO RIJEŠENIH ZADATAKA

Statističko zaključivanje - testiranje hipoteza. Katedra za medicinsku statistiku i informatiku

Otpornost R u kolu naizmjenične struje

Računarska grafika. Rasterizacija linije

Zavrxni ispit iz Matematiqke analize 1

XI dvoqas veжbi dr Vladimir Balti. 4. Stabla

Matematika 1 - vježbe. 11. prosinca 2015.

Populacija Ciljna/uzoračka populacija

MODEL JEDNOSTAVNE LINEARNE REGRESIJE

Ispitivanje toka i skiciranje grafika funkcija

MJERA I INTEGRAL 2. kolokvij 30. lipnja (Knjige, bilježnice, dodatni papiri i kalkulatori nisu dozvoljeni!)

13. TESTIRANJE HIPOTEZE O NEPOZNATIM KARAKTERISTIKAMA POPULACIJE

Pošto pretvaramo iz veće u manju mjernu jedinicu broj 2.5 množimo s 1000,

GLAZBENA UMJETNOST. Rezultati državne mature 2010.

Uvod u teoriju brojeva

Ĉetverokut - DOMAĆA ZADAĆA. Nakon odgledanih videa trebali biste biti u stanju samostalno riješiti sljedeće zadatke.

Cauchyjev teorem. Postoji više dokaza ovog teorema, a najjednostvniji je uz pomoć Greenove formule: dxdy. int C i Cauchy Riemannovih uvjeta.

POVRŠINA TANGENCIJALNO-TETIVNOG ČETVEROKUTA

- pravac n je zadan s točkom T(2,0) i koeficijentom smjera k=2. (30 bodova)

Vjeºbe - Statistika Praktikum Statisti ki testovi (1)

Sadrˇzaj. Sadrˇzaj 1 9 DVODIMENZIONALNI SLUČAJNI VEKTOR DISKRETNI DVODIMENZIONALNI

Transcript:

Zaključivanje o jednakosti distribucija 1 Zaključivanje o jednakosti distribucija temeljeno na dva uzorka Odgovorom na ovako postavljeno pitanje u praksi možemo zaključiti dolazi li do promjene obilježja koje proučavamo uslijed provodenja nekog postupka nad njim, u nekom drugom trenutku ili općenito u nekim drugim uvjetima. Primjer 1: student.sta Dekan jednog sveučilišta želi vidjeti postoji li razlika u dobi izmedu studenata koji stanuju u gradu u kojemu je sveučilište i onih koji studiraju putem Interneta. Prikupljeni podaci o dobi nalaze se u bazi student.sta. Analizirajte svaku varijablu posebno: odredite empirijsku distribuciju, deskriptivnu statistiku i kutijasti dijagram za svaku varijablu. Možemo li reći da su ovo nevezani 1 uzorci? (Rješenje: Empirijska distribucija, deskriptivna statistika i kutijasti dijagram odreduju se na standardan način u programskom paketu Statistica 8. Možemo reći da se radi o nevezanim uzorcima jer smo uzorak studenata koji stanuju u gradu u kojem je Sveučilište i uzorak studenata koji studiraju putem Interneta odabrali iz dvije različite populacije (populacije studenata koji stanuju u gradu i populacije studenata koji studiraju putem Interneta).) Primjer 2: djeca.sta U jednoj je školi napravljeno istraživanje o tome što djeca misle i osjećaju prema sebi. Test se sastojao u tome da na početku testiranja djeca ocjenom od 1 (ne slažem se) do 5 (slažem se) ocijene tvrdnju Imam puno dobrih osobina. Nakon toga u razdoblju od 6 tjedana djeca su igrala četiri igrice koje potiču pozitivan stav prema samom sebi. Poslije tih igara ponovno im je postavljeno isto pitanje koje su oni ocijenili. U bazi podataka djeca.sta nalaze se ocjene prije i nakon provodenja igrica. Analizirajte svaku varijablu 1 nevezani uzorci uvijek su nezavisni.

Zaključivanje o jednakosti distribucija 2 posebno: odredite empirijsku distribuciju, deskriptivnu statistiku i kutijasti dijagram za svaku varijablu. Možemo li reći da su ovo nevezani uzorci? (Rješenje: Empirijska distribucija, deskriptivna statistika i kutijasti dijagram odreduju se na standardan način u programskom paketu Statistica 8. Uzorci su vezani, jer smo oba uzorka izabrali iz iste populacije djece.) Prvi korak u ovakvim analizama je uvijek analiza svake varijable. Varijable koje usporedujemo u ovakvim analizama zapravo opisuju isto obilježje ali u drugim uvjetima pa kažemo da analiziramo jedno obilježje u dva tretmana. Činjenica je da će se u empirijskim distribucijama kao i u procijenjenim vrijednostima za parametre koji nas zanimaju pojaviti razlike medu tretmanima. Pitanje na koje odgovaramo u ovom poglavlju je: Jesu li uočene razlike posljedica različitih tretmana? Da bismo bili u stanju odgovoriti na ovako postavljeno pitanje pokus mora biti vrlo pažljivo pripremljen tako da se osiguraju dva slučajna uzorka koja se bitno razlikuju samo po tretmanu.

Zaključivanje o jednakosti distribucija 3 Testiranje hipoteze o jednakosti varijanci: F-test Promotrimo sljedeće nizove mjerenja: x 1, x 2,..., x m iz X N (µ 1, σ1), 2 y 1, y 2,..., y m iz Y N (µ 2, σ2), 2 X i Y su nezavisne slučajne varijable. Želimo kreirati statistički test za testiranje hipoteze u odnosu na alternativnu hipotezu H 0 : σ 2 1 = σ 2 2 H A : σ 2 1 σ 2 2. Znamo da su korigirane uzoračke varijance S 2 x i S 2 y dobri procjenitelji nepoznatih parametara σ 2 1 i σ 2 2 = statistika S2 x kreiranje željenog testa. S 2 y je dobra osnova za poznato je: U 1 = m 1 σ 2 1 S 2 x χ 2 (m 1), U 2 = n 1 σ 2 2 gdje su U 1 i U 2 nezavisne slučajne varijable. Tada slučajna varijabla S 2 y χ 2 (n 1), V = (n 1)U 1 (m 1)U 2 = σ2 2 σ 2 1 S2 x S 2 y ima F -distribuciju s (m 1, n 1) stupnjeva slobode. U uvjetima istinitosti nulte hipoteze, H 0 : σ 2 1 = σ 2 2, promatramo test statistiku V = S2 x S 2 y F (m 1, n 1).

Zaključivanje o jednakosti distribucija 4 vrijednost v = s2 x nenegativna: s 2 y test statistike V na danim mjerenjima uvijek je ako je v 0 σ1 2 < σ2; 2 ako je v 1 σ1 2 > σ2; 2 ako je v 1 σ1 2 = σ2. 2 Na temelju ove analize lako dolazimo do kritičnog područja (područja odbacivanje nulte hipoteze) za F -test: C r =, c 1 ] [c 2, +, pri čemu su c 1 i c 2 realni brojevi za koje u uvjetima istinitosti nulte hipoteze vrijedi: P (V < c 1 ) = P (V > c 2 ) = α 2, gdje je α nivo značajnosti testa. Vrijednosti c 1 i c 2 odredujemo pomoću statističkog kalkulatora u programskom paketu Statistica. Primjer 3: F -test Možemo li za sljedeće parove uzoračkih standardnih devijacija prihvatiti nultu hipotezu o jednakosti varijanci na nivou značajnosti α: a) s 1 = 3.2, m = 30, s 2 = 3, n = 30, α = 0.01. b) s 1 = 1989, m = 50, s 2 = 1843, n = 30, α = 0.05. c) s 1 = 250, m = 20, s 2 = 300, n = 16, α = 0.05. (Rješenje: U sva tri slučaja na danom nivou značajnosti možemo prihvatiti hipotezu o jednakosti varijanci.)

Zaključivanje o jednakosti distribucija 5 Usporedba očekivanja - nevezani (nezavisni) uzorci Zanima nas postoji li razlika u očekivanju medu različito tretiranim populacijama. Iz svake od njih nezavisno sakupimo uzorak. To znači da mjerene vrijednosti varijable iz jednog tretmana nisu u nikakvoj vezi s mjerenim vrijednostima varijable iz drugog tretmana. Neka je n 1 dimenzija uzorka iz prvog tretmana (prve slučajne varijable), a n 2 dimenzija uzorka iz drugog tretmana (druge slučajne varijable). Osim toga, neka su µ 1 i σ 1 očekivanje i standardna devijacija prve slučajne varijable, a µ 2 i σ 2 druge. Veliki uzorci U uvjetima kada imamo velike uzorke možemo testirati hipotezu o jednakosti očekivanja izmedu varijabli u dva tretmana neovisno o distribuciji tih varijabli. Pod pojmom veliki uzorci obično se podrazumijeva n 1 30 i n 2 30. Test statistika: H 0 : µ 1 µ 2 = 0 H A : µ 1 µ 2 0 z = ( x 1 x 2 ) σ 2 1 n 1 + σ2 2 n 2 H 0 odbacujemo kada je z > z α/2. x 1 i x 2 su aritmetičke sredine uzoraka. Distribucija ove statistike, pri velikim uzorcima i u uvjetima istinitosti navedene hipoteze, je približno standardna normalna.

Zaključivanje o jednakosti distribucija 6 Za primjenu ovog testa potrebno je poznavati varijancu obilježja, što najčešće nije slučaj. Medutim, pri velikim uzorcima možemo iskoristiti procjenu varijance. Mali uzorci Ukoliko su varijable u tretmanima normalno distribuirane i varijance su im jednake bolje rezultate dobivamo primjenom, tzv. t-testa. Dakle, ako vrijede sljedeće pretpostavke: Varijable u oba tretmana su normalno distribuirane; Varijance σ1 2 i σ2 2 u tretmanima su jednake; možemo dobiti odgovor na ovakvo pitanje i kod malih uzoraka na osnovu sljedećeg testa: H 0 : µ 1 µ 2 = 0 H A : µ 1 µ 2 0 Test statistika: t = ( x 1 x 2 ) 1 s p n 1 + 1 n 2 s 2 p = (n 1 1)s 2 1 + (n 2 1)s 2 2 n 1 + n 2 2 H 0 odbacujemo kada je t > t α/2. s 1 i s 2 su uzoračke standardne devijacije. x 1 i x 2 su aritmetičke sredine uzoraka. Distribucija ove statistike, u uvjetima istinitosti navedene hipoteze, je Studentova t-distribucija s (n 1 + n 2 2) stupnja slobode.

Zaključivanje o jednakosti distribucija 7 Primjer 4: Jedno poduzeće koje se bavi nakladništvom želi testirati tvrdnju da postoji razlika u prosječnoj brzini dostavljanja materijala izmedu dva transportna poduzeća. Deskriptivna statistika nizova prikupljenih podataka je sljedeća: prvo poduzeće: drugo poduzeće: n 1 =30, x 1 =16 sati, s 1 =3.2 sata n 2 =30, x 2 =18 sati, s 2 =3 sata Može li se tvrditi, na na nivou značajnosti α = 0.01, da postoji statistički značajna razlika u prosječnoj brzini dostavljanja materijala izmedu ta dva transportna poduzeća? (Rješenje: Na nivou značajnosti α = 0.01 prihvaćamo H 0.) Primjer 5: Američki ekonomisti odlučili su testirati hipotezu da su cijene japanskih automobila prosječno veće u Japanu nego u Sjedinjenim Američkim Državama. Prikupljen je uzorak od 50 cijena u Sjedinjenim Američkim Državama i 30 u Japanu za isti period i isti model automobila. Dobivena je sljedeća deskriptivna statistika nizova podataka: SAD: Japan: n 1 =50, x 1 =16 545 USD, s 1 =1 989 USD n 2 =30, x 2 =17 243 USD, s 2 =1 843 USD Je li razlika statistički značajna ili ne na razini značajnosti α = 0.05? (Rješenje: Na nivou značajnosti α = 0.05 prihvaćamo H 0.) Primjer 6: student.sta Dekan jednog sveučilišta želi vidjeti postoji li razlika u prosječnoj dobi izmedu studenata koji stanuju u gradu u kojemu je sveučilište i onih koji studiraju putem Interneta. Prikupljeni podaci o dobi nalaze se u bazi student.sta. Možemo li prihvatiti hipotezu o nepostojanju razlika na nivou značajnosti α = 0.05? (Rješenje: Na nivou značajnosti α = 0.05 prihvaćamo H 0.)

Zaključivanje o jednakosti distribucija 8 Primjer 7: student-grupe.sta Dekan jednog sveučilišta želi vidjeti postoji li razlika u prosječnoj dobi izmedu studenata koji stanuju u gradu u kojemu je sveučilište i onih koji studiraju putem Interneta. Prikupljeni podaci o dobi nalaze se u bazi student-grupe.sta. U varijabli dob nalaze se godine studenata, a u varijabli grad-internet podaci o tome stanuje li pojedini student u gradu u kojem se nalazi sveučilište (1) ili studira putem Interneta (0). Možemo li prihvatiti hipotezu o nepostojanju razlika na nivou značajnosti α = 0.05? (Rješenje: Na nivou značajnosti α = 0.05 prihvaćamo H 0.) Primjer 8: burza.sta Raspolažete cijenama nekih dionica na dvije burze: New York Stock Exchange i American Stock Exchange. U Financial Times ste pročitali da je očekivana cijena po dionici veća na burzi New York Stock Exchange u odnosu na očekivanu cijenu na burzi American Stock Exchange. Testirajte ovu hipotezu na temelju podataka u bazi podataka burza.sta. Neka je nivo značajnosti α = 0.01. (Rješenje: Na nivou značajnosti α = 0.01 prihvaćamo H 0.) Primjer 9: Management jednog velikog medicinskog centra želi provjeriti tvrdnju da postoji razlika u prosječnoj godišnjoj neto plaći izmedu bolničarki i bolničara. Napravite testiranje na razini značajnosti α = 0.05 na temelju slijedećih informacija o uzorcima: bolničarke: bolničari: n 1 =20, x 1 =23750 kn, s 1 =250 kn n 2 =16, x 2 =23800 kn, s 2 =300 kn pod uvjetima da su zadovoljene pretpostavke o jednakosti varijanci i o normalnoj distribuiranosti plaća. Postoji li dovoljno dokaza da se podupre tvrdnja da su bolničari bolje plaćeni od bolničarki? (Rješenje: Na nivou značajnosti α = 0.05 prihvaćamo H 0.)

Zaključivanje o jednakosti distribucija 9 Primjer 10: indeks.sta Jedna je grupa istraživača razvila indeks koji mjeri uspjeh managera. Veći indeks sugerira veću uspješnost managera. Neki istraživač želi usporediti taj indeks za dvije grupe managera. Jedna grupa managera ima puno interakcija s ljudima izvan svog radnog okruženja (telefoniranja, razgovori, sastanci i sl.) dok druga grupa ima vrlo rijetke kontakte izvan svog okruženja. Postoji li statistički značajna razlika u prosječnom indeksu uspješnosti izmedu navedene dvije grupe managera? Podaci se nalaze u bazi podataka indeks.sta. (Zadovoljene su pretpostavke o jednakosti varijanci i o normalnoj distribuiranosti slučajnih varijabli.) (Rješenje: Na nivou značajnosti α = 0.05 ne prihvaćamo H 0.) Primjer 11: consumer.sta Marketinški stratezi bi željeli predvidjeti odgovor potrošača prema novom proizvodu i njegovoj promociji. Studija koju su izradili Shushman i Riesz (1975.) ispituje razlike izmedu kupaca i onih koji nisu kupci za odredeni proizvod. Oni su pokazali da su prosječna veličina i prihod domaćinstva značajno veći kod kupaca. Mi imamo podatke o dobi za 20 kupaca jedne paste za zube i za 20 ne-kupaca te iste paste u bazi podataka consumer.sta. Provjerimo postoji li značajna razlika u prosječnoj dobi kupaca i ne-kupaca te paste ako je distribucija normalna. Neka je nivo značajnosti α = 0.1? (Rješenje: Na nivou značajnosti α = 0.1 ne prihvaćamo H 0.)

Zaključivanje o jednakosti distribucija 10 Usporedba očekivanja - uzorci u paru Često u praksi imamo potrebu usporedivanja varijabli u vezanim tretmanima. Npr. ako želimo usporedivati rezultate testa za iste bolesnike prije i nakon liječenja. Prethodni test ovdje nije adekvatan jer nemamo nezavisne pojave tj. mjerena vrijednost varijable u svakom pojedinom slučaju u drugom tretmanu ovisi o tome kolika je bila vrijednost varijable istog tog slučaja u prvom tretmanu. U ovakvim primjerima slučajevi se moraju pratiti u paru, a zaključci o postojanju razlika medu tretmanima donose se na osnovu praćenja razlika vrijednosti varijabli od interesa u pojedinim slučajevima kao što je prikazano u sljedećoj strukturi podataka: par tretman 1 tretman 2 razlike 1 X 1 Y 1 D 1 = X 1 Y 1 2 X 2 Y 2 D 2 = X 2 Y 2......... n X n Y n D n = X n Y n Uz sumarne statistike za svaki pojedini tretman, ovdje su takoder bitne i sumarne statistike za stupac razlika, tj. D = X Ȳ = 1 n n i=1 D i, s 2 D = 1 n 1 n (D i D) 2. i=1 Pretpostavka o nezavisnosti varijabli X i Y svakog tretmana nije ispunjena u ovakvim primjerima. Dakle, slučajan uzorak koji se ovdje promatra sastoji se od n nezavisnih uredenih parova slučajnih varijabli (X 1, Y 1 ),..., (X n, Y n ) (uočimo da su varijable u paru medusobno zavisne).

Zaključivanje o jednakosti distribucija 11 Uočimo takoder da se očekivanje slučajne varijable razlika D i = X i Y i može dobiti kao razlika očekivanja varijabli pojedinih tretmana, tj. µ Di = µ Xi µ Yi. Prema tome, D 1,..., D n možemo smatrati slučajnim uzorkom iz populacije sa očekivanjem E[D i ] = µ Di i varijancom V ar(d i ) = V ar(x i Y i ) = σd 2. Na osnovu toga, testiranje hipoteze H 0 : µ X µ Y = 0 ovdje se provodi postupkom testiranja ekvivalentne hipoteze H 0 : µ D = 0 koja se odnosi samo na jednu, novu, varijablu razlika D. U programskom paketu Statistica imamo ugradenu proceduru za testiranje ovakve hipoteze - T-test za zavisne uzorke uz pretpostavku o normalnoj distribuiranosti varijabli razlika D i. Primjer 1: djeca.sta U jednoj je školi napravljeno istraživanje o tome što djeca misle i osjećaju prema sebi. Test se sastojao u tome da na početku testiranja djeca ocjenom od 1 (ne slažem se) do 5 (slažem se) ocjene tvrdnju Imam puno dobrih osobina. Nakon toga u razdoblju od 6 tjedana djeca su igrala četiri igrice koje potiču pozitivan stav prema sebi. Poslije tih igara ponovno im je postavljeno isto pitanje koje su oni ocijenili. U bazi djeca.sta nalaze se ocjene. Jesu li igre statistički značajno podigle prosječnu ocjenu djece o sebi? Napravite testiranje na razini α = 0.05 uz pretpostavku da je distribucija razlika normalna. (Rješenje: p = 0.009146, dakle na razini značajnosti 0.05 ne prihvaćamo nultu hipotezu.)

Zaključivanje o jednakosti distribucija 12 Primjer 2: restoran.sta Pretpostavimo da želite usporediti očekivanu dnevnu zaradu restorana u sklopu neke tvrtke (u kojem svaki dan ručaju svi zaposlenici) prije i nakon povećanja količine začina koji se dodaju u hranu. U bazi podataka restoran.sta dani su podaci o mjesečnoj potrošnji za svakog od 22 zaposlenika prije i nakon tretmana. Daju li podaci dovoljno dokaza o tvrdnji da razlika izmedu očekivane mjesečne zarade restorana prije i nakon povećanja količine začina zaista postoji pod pretpostavkom da je distribucija razlika normalna? (Rješenje: p = 0.005845, dakle na razini značajnosti 0.05 ne prihvaćamo nultu hipotezu.) Primjer 3: Jedan liječnik tvrdi da se uzimanjem specijalnog vitamina može povečati snaga dizača utega. Kako bi provjerili njegovu tvrdnju odabrano je 8 dizača kojima je izmjerena snaga. Nakon dva tjedna treninga uz upotrebu specijalnog vitamina ti isti dizači utega su opet testirani. Upišite slijedeće podatke u tablicu i testirajte hipotezu kojom možete provjeriti ima li vitamin značajan učinak pod pretpostavkom da je distribucija razlika normalna. Prije: 210, 230, 182, 205, 262, 253, 219, 216 Poslije: 219, 236, 179, 204, 270, 250, 222, 216 Što ste zaključili? (Rješenje: p = 0.207605, dakle na razini značajnosti 0.05 prihvaćamo nultu hipotezu.) Primjer 4: U sklopu studije organizacije rada poduzeća ispituje se efikasnost zaposlenih u proizvodnom procesu. Ispitivanje se provodi mjerenjem produktivnosti rada na uzorku radnika. Radi mogućeg povećanja produktivnosti, na radnim mjestima radnika u uzorku izmijenjen je red radnih operacija i prostorni razmještaj sredstava rada. Imamo rezultate mjerenja produktivnosti rada

Zaključivanje o jednakosti distribucija 13 prije i poslije izmjena: Prije: 45, 34, 42, 28, 35, 39, 50, 41, 27, 29 Poslije: 49, 40, 43, 32, 40, 39, 51, 42, 30, 24 Što se može zaključiti na temelju navednih mjerenja pod pretpostavkom da je distribucija razlika normalna? (Rješenje: p = 0.076553, dakle na razini značajnosti 0.05 prihvaćamo nultu hipotezu.)

Zaključivanje o jednakosti distribucija 14 Usporedba proporcija u velikim uzorcima Ovdje promatramo dva slučajna pokusa koja možemo modelirati Bernoullijevim slučajnim varijablama, tj. X 1 = ( 0 1 q 1 p 1 ) X 2 = ( 0 1 q 2 p 2 ) Nezavisnim ponavljanjem naših pokusa (n 1 puta ponavljamo prvi pokus, a n 2 puta drugi pokus) prikupljamo uzorak i tako dobivamo dva niza nula i jedinica. Trebamo odgovoriti na sljedeće pitanje: Postoji li razlika u vjerojatnosti uspjeha u navedena dva slučaja. (Npr. postoji li razlika u vjerojatnosti pobjede neke stranke na izborima u Osijeku i Zagrebu?) Test statistika: H 0 : p 1 p 2 = 0 H A : p 1 p 2 0 z = ˆp 1 ˆp 2. p 1 (1 p 1 ) n 1 + p 2(1 p 2 ) n 2 Nultu hipotezu H 0 odbacujemo ako je: z > z α/2 z α/2 je broj za kojega vrijedi da je P ( Z z α/2 ) = α; Z je standardna normalna slučajna varijabla p Izraz 1 (1 p 1 ) n 1 + p 2(1 p 2 ) n 2 može se dobro aproksimirati (u uvjetima istinitosti H 0 ) izrazom ˆp(1 ˆp)( 1 n 1 + 1 n 2 ), gdje je ˆp relativna frekvencija uspjeha u oba uzorka zajedno. Primjer 5: Na osnovu 1000 dimenzionalnog reprezentativnog uzorka u jednom gradu

Zaključivanje o jednakosti distribucija 15 procijenjen je postotak pušača na ˆp 1 = 25%, a u nekom drugom gradu, na osnovu 2000 dimenzionalnog uzorka postotak pušača je procijenjen na ˆp 1 = 28%. Možemo li, na razini značajnosti α = 0.05, tvrditi da je u drugom gradu stopa pušača statistički značajno različita nego stopa pušača u prvom gradu? (Rješenje: p = 0.0811, dakle na razini značajnosti 0.05 prihvaćamo nultu hipotezu.) Primjer 6: U uzorku od 100 potrošača jedne trgovine, 43 potrošača kupuje Master karticom. U drugom uzorku koji broji takoder 100 potrošača, 58 kupuje Visa karticom. Testirajte postoji li, na razini značajnosti α = 0.05, statistički značajna razlika u proporcijama potrošača koji kupuju različitim karticama. (Rješenje: p = 0.0351, dakle na razini značajnosti 0.05 ne prihvaćamo nultu hipotezu.) Primjer 7: Grupa potrošača želi odrediti postoji li razlika izmedu proporcija novih automobila koji trebaju popravke u prvih godinu dana za dva tipa automobila. Za prvi model je uzorak iznosio 400 automobila od kojih je 53 trebalo popravak, a za drugi model je u uzorak odabrano 500 automobila od kojih je 78 trebalo popravak. Testirajte postoji li, na razini značajnosti α = 0.05, statistički značajna razlika u navedenim proporcijama. (Rješenje: p = 0.3208, dakle na razini značajnosti 0.05 prihvaćamo nultu hipotezu.) Primjer 9: Ispituje se proporcija tekućih računa s negativnim saldom većim od dozvoljenog u dvije poslovnice jedne banke. Analitička služba pretpostavlja da je proporcija takvih računa u poslovnici-2 različita od proporcije u poslovnici-1.

Zaključivanje o jednakosti distribucija 16 U uzorku koji broji 562 računa poslovnice-1, 75 je s nedozvoljenim prekoračenjem, a u uzorku veličine 462 poslovnice-2, 44 je s nedozvoljenim prekoračenjem. Što se može zaključiti o pretpostavci analitičke službe? Testiranje provedite na razini značajnosti α = 0.01. (Rješenje: p = 0.0573, dakle na razini značajnosti 0.01 prihvaćamo nultu hipotezu.)