Analiza varijanse sa jednim Posmatra se samo jedna promenljiva

Σχετικά έγγραφα
Analiza varijanse (ANOVA) Analiza varijanse sa jednim faktorom ANOVA 07/12/2017. Tehnike za analizu podataka. Multivarijacione tehnike

Uvod u neparametarske testove

Definicija: Hipoteza predstavlja pretpostavku koja je zasnovana na određenim činjenicama (najčešće naučnim ili iskustvenim).

Str

Uvod u neparametarske testove

numeričkih deskriptivnih mera.

Oblasti izučavanja. IX.1. Osnove analize podataka. IX. Analiza podataka UVOD U ANALIZU PODATAKA 13/11/15

Izbor statističkih testova Ana-Maria Šimundić

Postoji nekoliko statidtičkih testova koji koriste t raspodelu, koji se jednim imenom zovu t-testovi.

Neparametarski testovi za dva nezavisna uzorka. Boris Glišić 208/2010 Bojana Ružičić 21/2010

X. Testiranje hipoteza. Osnovni koncepti testiranja hipoteza TESTIRANJE HIPOTEZA OSNOVNI KONCEPTI I TESTOVI POVEZANOSTI 19/11/15

Počela biostatistike, Poslijediplomski interdisciplinarni doktorski studij Molekularne bioznanosti. Molekularne bioznanosti. Molekularne bioznanosti

Regresija i korelacija

IX. Analiza podataka (2) IX.1. Diskriminaciona analiza MARKETINŠKO ISTRAŽIVANJE. Tehnike za analizu podataka. Multivarijacione tehnike

NEPARAMETRIJSKE TEHNIKE

Testiranje statistiqkih hipoteza

3.1 Granična vrednost funkcije u tački

5. Karakteristične funkcije

Chi-kvadrat test. Chi-kvadrat (χ2) test

Elementi spektralne teorije matrica

Apsolutno neprekidne raspodele Raspodele apsolutno neprekidnih sluqajnih promenljivih nazivaju se apsolutno neprekidnim raspodelama.

PRAVA. Prava je u prostoru određena jednom svojom tačkom i vektorom paralelnim sa tom pravom ( vektor paralelnosti).

IZRAČUNAVANJE POKAZATELJA NAČINA RADA NAČINA RADA (ISKORIŠĆENOSTI KAPACITETA, STEPENA OTVORENOSTI RADNIH MESTA I NIVOA ORGANIZOVANOSTI)

DISKRETNA MATEMATIKA - PREDAVANJE 7 - Jovanka Pantović

(Hi-kvadrat test) r (f i f ti ) 2 H = f ti. i=1

Osnovni primer. (Z, +,,, 0, 1) je komutativan prsten sa jedinicom: množenje je distributivno prema sabiranju

UNIVERZITET U NIŠU ELEKTRONSKI FAKULTET SIGNALI I SISTEMI. Zbirka zadataka

ELEKTROTEHNIČKI ODJEL

Obrada signala

Testiranje hipoteza statistika zaključivanja

TESTIRANJE ZNAČAJNOSTI RAZLIKE

Mašinsko učenje. Regresija.

Verovatnoća i Statistika I deo Teorija verovatnoće (zadaci) Beleške dr Bobana Marinkovića

SVEUČILIŠTE U RIJECI GRAĐEVINSKI FAKULTET U RIJECI. Specijalistički diplomski stručni studij

9.1 Testovi hipoteza u statistici

Ispitivanje toka i skiciranje grafika funkcija

MODEL JEDNOSTAVNE LINEARNE REGRESIJE

Operacije s matricama

Zadaci sa prethodnih prijemnih ispita iz matematike na Beogradskom univerzitetu

XI dvoqas veжbi dr Vladimir Balti. 4. Stabla

Iskazna logika 3. Matematička logika u računarstvu. novembar 2012

Prosta linearna regresija (primer)

41. Jednačine koje se svode na kvadratne

Zavrxni ispit iz Matematiqke analize 1

PARCIJALNI IZVODI I DIFERENCIJALI. Sama definicija parcijalnog izvoda i diferencijala je malo teža, mi se njome ovde nećemo baviti a vi ćete je,

Računarska grafika. Rasterizacija linije

M086 LA 1 M106 GRP. Tema: Baza vektorskog prostora. Koordinatni sustav. Norma. CSB nejednakost

Uvod u neparametrijske testove. Usporedba. Neparametrijske inačice t-testa za dva nezavisna uzorka. dr. sc. Goran Kardum

Dijagonalizacija operatora

2 tg x ctg x 1 = =, cos 2x Zbog četvrtog kvadranta rješenje je: 2 ctg x

18. listopada listopada / 13

Kaskadna kompenzacija SAU

Statističko zaključivanje - testiranje hipoteza. Katedra za medicinsku statistiku i informatiku

IZVODI ZADACI ( IV deo) Rešenje: Najpre ćemo logaritmovati ovu jednakost sa ln ( to beše prirodni logaritam za osnovu e) a zatim ćemo

IspitivaƬe funkcija: 1. Oblast definisanosti funkcije (ili domen funkcije) D f

Dvanaesti praktikum iz Analize 1

3 Populacija i uzorak

nepoznati parametar θ jednak broju θ 0, u oznaci H 0 (θ =θ 0 ), je primer proste hipoteze. Ako hipoteza nije prosta, onda je složena.

INTELIGENTNO UPRAVLJANJE

Riješeni zadaci: Nizovi realnih brojeva

POSTAVLJANJE I TESTIRANJE HIPOTEZA

Teorijske osnove informatike 1

, i = 1, 2, n. Tabela 1 Koeficijent proste korelacije. Standardizovani regresioni koeficijent. Regresioni koeficijent b

Kontrolni zadatak (Tačka, prava, ravan, diedar, poliedar, ortogonalna projekcija), grupa A

Funkcije dviju varjabli (zadaci za vježbu)

radni nerecenzirani materijal za predavanja R(f) = {f(x) x D}

( , 2. kolokvij)

(P.I.) PRETPOSTAVKA INDUKCIJE - pretpostavimo da tvrdnja vrijedi za n = k.

Pošto pretvaramo iz veće u manju mjernu jedinicu broj 2.5 množimo s 1000,

III VEŽBA: FURIJEOVI REDOVI

Statistiqki softver 4 Sedmi qas

IZVODI ZADACI (I deo)

7 Algebarske jednadžbe

Skup svih mogućih ishoda datog opita, odnosno skup svih elementarnih događaja se najčešće obeležava sa E. = {,,,... }

Studentov t-test. razlike. t = SG X

Računarska grafika. Rasterizacija linije

Trigonometrija 2. Adicijske formule. Formule dvostrukog kuta Formule polovičnog kuta Pretvaranje sume(razlike u produkt i obrnuto

Sortiranje prebrajanjem (Counting sort) i Radix Sort

a M a A. Može se pokazati da je supremum (ako postoji) jedinstven pa uvodimo oznaku sup A.

Cauchyjev teorem. Postoji više dokaza ovog teorema, a najjednostvniji je uz pomoć Greenove formule: dxdy. int C i Cauchy Riemannovih uvjeta.

Elektrotehnički fakultet univerziteta u Beogradu 17.maj Odsek za Softversko inžinjerstvo

Sume kvadrata. mn = (ax + by) 2 + (ay bx) 2.

Testiranje statističkih hipoteza Materijali za nastavu iz Statistike

radni nerecenzirani materijal za predavanja

Zadaci iz trigonometrije za seminar

2. Ako je funkcija f(x) parna onda se Fourierov red funkcije f(x) reducira na Fourierov kosinusni red. f(x) cos

100g maslaca: 751kcal = 20g : E maslac E maslac = (751 x 20)/100 E maslac = 150,2kcal 100g med: 320kcal = 30g : E med E med = (320 x 30)/100 E med =

S t r a n a 1. 1.Povezati jonsku jačinu rastvora: a) MgCl 2 b) Al 2 (SO 4 ) 3 sa njihovim molalitetima, m. za so tipa: M p X q. pa je jonska jačina:

SEKUNDARNE VEZE međumolekulske veze

Trigonometrijske nejednačine

PISMENI ISPIT IZ STATISTIKE

Osnove teorije uzoraka

Elektrotehnički fakultet univerziteta u Beogradu 16.maj Odsek za Softversko inžinjerstvo

TRIGONOMETRIJA TROKUTA

4 Testiranje statističkih hipoteza

VEROVATNO A I STATISTIKA A - TEST 1 9. NOVEMBAR 2013.

INTEGRALNI RAČUN. Teorije, metodike i povijest infinitezimalnih računa. Lucija Mijić 17. veljače 2011.

Klasifikacija blizu Kelerovih mnogostrukosti. konstantne holomorfne sekcione krivine. Kelerove. mnogostrukosti. blizu Kelerove.

Zaključivanje o jednakosti distribucija temeljeno na dva uzorka

Matematička analiza 1 dodatni zadaci

Transcript:

ANOVA Analiza varijanse (ANOVA) Analiza varijanse sa jednim faktorom Proširena ANOVA tabela 2 Tehnike za analizu podataka Analiza varijanse sa jednim faktorom Posmatra se samo jedna promenljiva Posmatra se više promenljivih istovremeno Univarijacione Multivarijacione 3 Decembar 2012 4 1

Univarijacione za analizu podataka Podaci su nemetrički (nominalna i ordinalna skala) Neparametarske statističke Podaci su metrički (intervalna i skala odnosa) Parametarske statističke - t-test - z-test Parametarske statističke Postoji samo jedan uzorak Postoje dva ili više uzoraka - t-test - z-test - ANOVA Nezavisni uzorci Zavisni uzorci - Upareni t- test 5 6 U istraživanjima kad kažemo faktorčešće mislimo na faktor u faktorskoj analizi Koncepti eksperimentalne analize na koje se pozivamo Varijabla ishoda zavisna varijabla Faktori nezavisne varijable Tretmani različiti nivoi nezavisnih varijabli, t.j. faktora Svrha većine statističkih eksperimenata je: 1. Da se utvrdi da li različiti tretmani imaju različite efekte na varijablu ishoda, i 2. Ako imaju različite efekte, onda se želi oceniti (izmeriti) ta razlika. 7 Analiza varijanse sa jednim faktorom Naziva se i jednosmerna analiza varijanse; Mere se efekti r tretmana jednog faktora na (jednu) varijablu ishoda Zatim se proverava da li postoje značajne razlike između srednjih vrednosti različitih tretmana: H 0 : µ 1 = µ 2 = µ 3 =... = µ r H a : najmanje 2 od µ 1, µ 2, µ 3,..., µ r su različiti Računa se odnos između varijanse između-tretmana i varijanse unutar-tretmana Ako je varijansa između značajno veća nego varijansa unutar, odbacuje se nulta hipoteza 8 2

Pretpostavke modela Pre početka analize se uvek formalno proverava ispunjenost pretpostavki modela: 1. Reziduali po grupama imaju normalnu raspodelu - proveravamo Kolmogorov-Smirnovljevim testom normalnosti; 2. Varijanse reziduala različitih grupa su jednake (homoskedastičnost) - proveravamo Levinovim testom homogenosti varijanse; 3. U pitanju su nezavisni slučajni uzorci. Ukupna i srednje vrednosti grupa, kao i njihova odstupanja 9 10 Varijansa između tretmana Varijansa unutar tretmana Ocena varijanse između tretmana se zasniva na varijaciji između srednjih vrednosti dobijenih za svaki nivo tretmana: SS b = n p X p X r p =1 ( ) 2, t.j.: SS b suma kvadrata između nivoa tretmana X p srednja vrednost za tretman p X ukupna srednja vrednost n p broj opservacija za tretman p r ukupan broj tretmana MSS b = SS b r 1 11 Ocena varijanse unutar tretmana se zasniva na varijaciji u okviru svakog nivoa tretmana ( neobjašnjena ): n p r SS w = ( x ip X p ) 2, t.j.: MSS w = SS w N r SS w suma kvadrata unutar tretmana X p srednja vrednost za tretman p X ip realizacija i za nivo tretmana p n p ukupan broj opservacija za tretman p r ukupan broj tretmana N ukupna veličina uzorka i=1 p =1 12 3

Ukupna, objašnjena i neobjašnjena varijansa Varijansa između tretmana se naziva i varijansom objašnjenom nivoom tretmana Varijansa unutar tretmana se naziva i varijansom neobjašnjenom nivoom tretmana Ukupna (totalna) varijacija ili totalna suma kvadrata je: SS = SS + SS t b w Izvor varijacije Objašnjena varijacija Neobjašnjena varijacija Varijacija, suma kvadrata (SS) r ANOVA tabela ( ) 2 SS b = n p X p X SS w = p =1 k r i=1 p =1 k ( x ip X p ) 2 ( ) 2 Ukupno SS t = x ip X N 1 r i=1 p =1 St. slobode Ocena (df) varijanse (MSS) F-odnos r 1 N r MSS b = SS b r 1 MSS w = SS w N r MSS b MSS w 13 14 F-statistika F = MSS b MSS w Ako bi nulta hipoteza bila istinita (nivoi tretmana nemaju značajan efekat) onda bi F-odnos trebalo da bude blizu 1; u suprotnom F-odnos ima veće vrednosti Čita se vrednost iz tablica F-rasporeda za (r-1) i (N-r) stepeni slobode Na osnovu toga se zaključuje da li postoji razlika uslovljena nivoom tretmana i za koji nivo značajnosti ova razlika postoji 15 Jačina povezanosti ρ - deskriptivni statistički pokazatelj, mera jačine povezanosti, koji predstavlja meru proporcije varijanse koja je objašnjena podacima iz uzorka : SSb ρ = SSt Vrednost ρ na bazi uzorka teži da bude pristrasna naviše, pa je bolje koristiti : ˆ ω 2 = SS b (r 1)MSS w SS t + MSS w 16 4

Primer: Koliko sati učiš nedeljno? Provera pretpostavki modela Pre početka analize se uvek formalno proverava ispunjenost pretpostavki modela: 1. Varijanse reziduala različitih grupa su jednake (homoskedastičnost) - proveravamo Levinovim testom homogenosti varijanse; 2. Reziduali po grupama imaju normalnu raspodelu - proveravamo Kolmogorov-Smirnovljevim testom normalnosti; 3. U pitanju su nezavisni slučajni uzorci. 17 18 1. Test homogenosti varijanse Nulta hipoteza je da su varijanse reziduala različitih grupa jednake, t.j. da postoji homoskedastičnost, ili homogenost varijansi, putem Levinovog testa: Logaritmovani podaci p=0,027 < α=0,05 è odbacujemo nultu hipotezu Respecifikacija varijabli putem logaritamske transformacije! 19 20 5

Ponovljeni test homogenosti varijanse 2. Kolmogorov-Smirnovljev test normalnosti Ne odbacujemo nultu hipotezu - na logaritmovanim podacima varijanse se statistički ne razlikuju; Možemo nastaviti analizu proverom ispunjenosti uslova normalnosti. Koristi se za testiranje hipoteze o normalnosti raspodele Nulta hipoteza je da varijabla prati normalan raspored, a alternativna je da ne prati Dakle, nastavićemo sa daljom analizom samo ako test pokaže da se ne odbacuje nulta hipoteza. 21 22 Ukupna i srednje vrednosti grupa, kao i njihova odstupanja Sve tri p-vrednosti su veće od 0,05, pa ne odbacujemo nultu hipotezu o normalnosti rasporele! 23 24 6

ANOVA izlazna tabela Analiza varijanse sa više faktora Na nivou značajnosti od 5% ne bismo odbacili Ho; Na nivou značajnosti od 10% bismo odbacili Ho i zaključili bismo da postoje razlike po godinama u odnosu na vreme provedeno u učenju tokom semestra. 25 26 Tehnike za analizu podataka Multivarijacione Univarijacione Decembar 2012 Posmatra se samo jedna promenljiva Posmatra se više promenljivih istovremeno Multivarijacione 27 Jedna zavisna varijabla Tehni ke z avi snosti - ANOVA i ANCOVA - Višestruka regresija - Diskriminaciona anal. - Analiza združenih efekata Više zavisnih varijabli - MANOVA i MANCOVA - Kanonička korelacija Tehni ke međuz avi snosti Fokus na varijablama - Faktorska analiza Fokus na predmetima posmatranja - Analiza skupina - Višedimenzionalno skaliranje 28 7

Proširena ANOVA tabela Primer dvofaktorske analize: Koliko sati učiš nedeljno? U ovom modelu postoji više varijabli tretmana (faktora) Dodavanjem nove varijable tretmana tipično se povećava objašnjeni varijabilitet Druga varijabla tretmana se naziva blok-varijabla, jer se formira jedan ili više blokova Takođe je moguće da se uključi više varijabli tretmana Interakcija Efekat interakcije znači da uticaj jednog tretmana neće biti isti za svaki nivo onog drugog tretmana Hipoteza o tome da nema interakcije se može testirati korišćenjem ANOVA tabele 29 30 Putem dvofaktorske analize varijanse u ovom primeru možemo testirati sledeće hipoteze: ne postoji razlika među polovima u odnosu na broj časova provedenih u učenju, postoji razlika među polovima u odnosu na broj časova provedenih u učenju; korišćenje Fejsbuka ne utiče na broj časova provedenih u učenju, korišćenje Fejsbuka utiče na broj časova provedenih u učenju; nema interakcije između pola i korišćenja Fejsbuka u odnosu na broj časova provedenih u učenju, postoje interakcije između pola i korišćenja Fejsbuka u odnosu na broj časova provedenih u učenju. Levinov test jednakosti varijansi reziduala p=0,021 < α=0,05 è odbacujemo nultu hipotezu Respecifikacija varijabli putem logaritamske transformacije! 31 32 8

Respecifikovane varijable (logaritmovanje) Ponovljeni test homogenosti varijanse Ne odbacujemo nultu hipotezu - na logaritmovanim podacima varijanse se statistilčki ne razlikuju. 33 34 Hipoteze koje testiramo: ne postoji razlika među polovima u odnosu na broj časova provedenih u učenju, postoji razlika među polovima u odnosu na broj časova provedenih u učenju; korišćenje Fejsbuka ne utiče na broj časova provedenih u učenju, korišćenje Fejsbuka utiče na broj časova provedenih u učenju; nema interakcije između pola i korišćenja Fejsbuka u odnosu na broj časova provedenih u učenju, postoji interakcije između pola i korišćenja Fejsbuka u odnosu na broj časova provedenih u učenju. Koje od navedenih hipoteza ćemo odbaciti, a koje nećemo? 35 36 9