Metodologija političkih i društvenih istraživanja II Pavle Pavlović pavlovic.pavle@outlook.com Testiranje hipoteza statistika zaključivanja Testiranje hipoteza zajedno sa statistikom ocjenjivanja čine dio statistike zaključivanja. Cilj zaključivanja je generalizacija našeg nalaza iz uzorka na populaciju. Na taj način, sa manjim resursima, uspjevamo da indukujemo naš zaključak koji smo utvrdili unutar uzorka na samu populaciju (tj. nalaz koji smo utvrdili unutar uzorka vjerovatno je prisutan i u populaciji). Statistika ocjenjivanja podrazumijeva deskriptivnu (univarijantnu) statistiku gdje mjerama centralne tendencije, mjerama varijabilnosti i mjerama oblika distribucije utvrđujemo osobine jedne varijable. Deskriptivna statistika je početni korak našeg statističkog ispitivanja jer nakon što smo (deskriptivnom statistikom) utvrdili pojedinačna svojstva varijabli pristupamo utvrđivanju veza i odnosa unutar uzorka (tj između varijabli). U odnosu na broj varijabli koje čine naš model odlučujemo se za bivarijantnu ili multivarijantnu statistiku. Bivarijantnom statistikom ispitujemo odnos (vezu) između dvije varijable, tj ispitujemo da li je naš nalaz iz uzorka prisutan (sa kojom vjerovatnoćom) u populaciji. Tu vjerovatnoću ispitujemo pomoću testa statističke značajnosti. Međutim prije nego što objasnimo primjenu datog testa moramo se osvrnuti na pravila prilikom testiranja hipoteza. Faze hipotetičkog procesa 1. Istraživačko pitanje predstavlja početak našeg hipotetičkog procesa. Pitanje treba da sadrži predmet našeg istraživanja. Precizno formulisano istraživačko pitanje će nam biti vodilja u postavljanju (utvrđivanju) hipoteza našeg rada. Poželjno je da pitanje bude što preciznije jer se time oslobađamo od viška tj. varijabli koje bi negativno uticale na naš model. Primjer 1: Istraživačko pitanje Želimo da ispitamo razlike između različitih kategorija starosti u odnosu na osjećanje optimizma. Naše istraživačko pitanje bi glasilo: Da li se razlikuju rezultati mjerenja optimizma mladih, sredovječnih ili starijih osoba? U odnosu na istraživačko pitanje moguće je utvdili zavisnu varijablu, a ako je pitanje dobro formulisano i nezavisnu/e varijablu/e. U odnosu na primjer 1 primjećujemo da je naš predmet istraživanja nivo optimizma kod različitih kategorija ispitanika. U odnosu na to pitanje zaključujemo da je naša zavisna varijabla optimizam a da je nezavisna varijabla kategorije godina iskazane na ordinalnoj skali. 2. Definisanje hipoteza je druga faza hipotetičkog procesa koja je prirodni nastavak naše prve faze. Nakon što smo postavili istraživačko pitanje utvrđujemo nultu i alternativnu hipotezu. Ovakav način utvrđivanja hipotetičkog okvira je statistički jer se većina statističkih tehnika bazira na rezonovanju koje proizilazi iz postojanja nulte i alternativne hipoteze. Nulta hipoteza (H 0) je definisana negativno. Ona uvijek govori da između dvije grupe ispitika ne postoje razlike i da naš nalaz (npr. vezu između dvije varijable) koji smo pronašli u uzorku ne postoji u populaciji. 1
Alternativna hipoteza(h 1) je suprotna nultoj, tj. veza između dvije varijable koju smo negirali u nultoj hipotezi u alternativnoj hipotezi tvrdimo da postoji. Drugim riječima alternativna hipoteza je nulta hipoteza ali u potvrdnom obliku. Osim ovog dominantnog načina definisanja hipoteza u statistici postoji još jedna način koji podrazumijeva utvrđivanje potvrđujuće hipoteze, tj. postavljanje hipoteze u pozitivnoj formi koja govori o vezi dvije varijable (kao što je u prethodnom dijelu o tome govorila alternativna hipoteza). Cilj je isti kao i kod prethodnog načina testiranja dokazati vezu. Primjer 2: Nulta i alternativna hipoteza U odnosu na istraživačko pitanje iz primjera 1 postavlajmo nultu i alternativnu hipotazu: H 0: Ne postoji statistički značajna razlika između rezultata mjerenja optimizma mladih, sredovječnih i starijih osoba. H 1: Razlika između rezultata mjerenja optimizma mladih, sredovječnih i starijih osoba je statistički značajna. Primjer 3: Potvrđujuća hipoteza U ovom slučaju glasila bi kao i alternativna: Razlika između mjerenja optimizma mladih, sredovječnih i starijih osoba je statistički značajna. 3. Pretpostavka homogenosti varijansi je jedna od osnovnih pretpostavki svih parametrijskih testova. Grupe unutar uzorka moraju da imaju približno jednaku varijansu, to znači da unutar tabela deskriptivne statistike vrijednosti veličine uzorka (N) i standardne devijacije ne smiju da pokazuju veća odstupanja ili razlike između kategorija (razlike ne smije da imaju veće proporcije od 1:1.5). Nezadovoljenje ove pretpostavke može direktno uticati na vrijednost testa statističke značajnosti i time navesti na pogrešan zaključak prilikom testiranja hipoteza. Međutim tehnike bivarijantne statistike pokazuju otpornost na narušavanje ove pretpostavke jer SPSS izračunava i vrijednosti koje ne pretpostavljaju homogenu varijansu. U tim slučajevima važno je naglasiti da radimo test pod pretpostavkom nehomogenih (heterogenih) varijansi. Pretpostavku homogenosti varijanse ispitujemo Levenovim testom koji utvrđuje homogenost varijanse za dvije ili više grupa. Kada je vrijednost testa statističke značajnosti (sig.) Levenovog testa veća od 0.05 varijanse grupa su homogene i mi smo time zadovolji datu pretpostavku. To svojstvo varijansi se zove homoscedastičnost. Kada je ta vrijednost manja od 0.05 naša pretpostavka o homogenosti varijanse nije zadovoljena. Vrijednost statističke značajnosti Levenovog testa i vrijednost testa statističke značajnosti testnog statistika su dva različita pokazatelja i interpretiraju se ponaosob. 4. Utvrđivanje uzoračke distribucije je faza u kojoj se porede vrijednosti određene neprekidne promjenljive mjerene u dvije ili više grupa (za t Test i F Test). To podrazumijeva ispitivanje razlika aritmetičkih sredina i standardnih devijacija za svaku grupu pojedinačno. U ovoj fazi se ispituje i da li je distribucija naše zavisne (neprekidne) varijable normalna ili približno normalno raspoređena, što je jedna od ključnih pretpostavki primjene parametrijskih tehnika pa time i t Testa i F testa. 2
5. Statistička značajnost. Nakon što smo utvrdili grupne razlike između njihovih prosječnih vrijednosti 1 i standardnih odstupanja pristupamo utvrđivanju statističke značajnosti. Statististička značajnost se označava malim slovom p (u SPSS-u je njena vrijednost data u koloni sig.). Kada utvrđujemo da li je naš nalaz (npr. razlika između aritmetičkih sredina) statistički značajan mi zapravo ispitujemo njegovu grešku. Greške su u statistici definisane kao greška I tipa i greška II tipa. Tabela 1: greške u hipotetičkom zaključivanu Odluka Stanje u populaciji Nema razlike Ima razlike Odbacujemo nultu hipotezu Greška I tipa Nema greške Prihvatamo nultu hipotezu Nema greške Greška II tipa Grešku I tipa je kada nultu hipotezu odbacimo a ona je tačna. Greška II tipa je kada nultu hipotezu prihvatimo a ona je netačna. Nameće se logično pravilo da su greške (I ili II tipa) međusobno uslovljene, tj. kako jednu smanjujemo drugu povećamo. Najčešće se u društvenim istraživanjima istraživači srijeću sa Greškom I tipa. Nivo te greške ispitujemo sa već navedenim testom statističke značajnosti (p). To znači da naša vrijednost testa statističke značajnosti pokazuje nivo greške naše nulte hipoteze. Sa pragmatičnog stanovišta ako je nivo 0.45 (vrijednosti se kreću od 0-1) sa vjerovatnoćom od 0.45 smo sigurni da je naša nulta hipoteza tačna (tj. sa vjerovatnoćom od 45%), ili objašnjeno logikom greške I tipa bili bi 45% u krivu ako bi odbacili nultu hipotezu, što je priličano veliki procenat što znači da ćemo nultu hipotezu zadržati. U statistici postoje dva standarda za testiranje statističke značajnosti: 0.01 i 0.05 (odnosno 1% i 5%). To pravilo se bazira na logici da razlike između aritmetičkih sredina moraju biti dva ili tri puta veće od svoje greške. Ovo pravilo je mnogo jasnije kada se posmatra iz ugla alternativne hipoteze je smo već kazali da su nulta i alternativna hipoteza međusobno uslovljene kada je nivo greške I tipa (naša p vrijednost) 0.05 (5%), nivo greške II tipa će biti 0.95 (95%). Nivo od 0.95 (1-p) bi mjerio grešku ( netačnost ) nulte hipoteze, sto je direktno proizvoljno nivou tačnosti alternativne hipoteze. Nivo značajnosti (0.05 i 0.01) je naš kritični nivo za prihvatanje ili odbacivanje nulte hipoteze. Kada je vrijednost testa statističke značajnosti iznad 0.05 naša alternativna hipoteza je netačna, tj. prihvatamo nultu hipotezu i utvrđujemo da razlika koju smo pronašli unutar uzorka ne postoji u populaciji 2. Kada je vrijednost testa statističke značajnosti manja od 0.05 odbacijemo nultu hipotezu i prihvatamo alternativnu (na nivou značajnosti većem 1 Razlike će uvijek biti prisutne, bez obzira bile one velike ili male (pa bile one izražene samo na drugoj decimali). 2 Normalna raspodjela je najčešće prirodno stanje svih podataka u prirodi koja se bazira na centralnoj graničnoj teoremi, tj. tendenciji da se svi podaci u prirodi sakupljaju oko određene prosječne vrijednosti. Naravno određeni podaci imaju prirodnu asimetričnost i time odstupaju od ovog pravila (takvih slučajeva je malo). Normalna raspodjela i statističko zaključivanje se baziraju na teoriji vjerovatnoće tj. na principu da ako bi određeno mjerenje (uzorak) u kojem smo utvrdili određenu raspodjelu koja je normalna, ponovili bezbroj puta dobili bi približno istu raspodjelu. U kontekstu naše teme to bi podrazumijevalo da ako bi iz populacije izvukli uzorak iste veličine kao i prethodni dobili bi vrijednost testa statističke iste ili približno iste vrijednosti. To nam pomaže da indukujemo naš zaključak na cijelu populaciju. 3
od 95%). Kada je nivo testa statističke značajnosti manji od 0.01 odbacujemo nultu hipotezu i prihvatamo alternativnu (na nivou značajnosti većem od 99%). U zavisnosti od naše nulte hipoteze biramo naš testni statistik (t Test, F test, x 2 test). Svi testovi počivaju na određenoj teorijskoj distribuciji podataka. Ta teorijska distribucija zavisi od varijabiliteta podataka, koji određuju zonu prihvatanja nulte hipoteze. U zavisnosti od odnosa našeg raspona dobijenog mjerenjem uzorka i vrijednosti teorijskog raspona za istu veličinu uzorka utvrđujemo vrijednost testa statističke značajnosti. Vrijednost od 0.05 podrazumijeva da razlika između aritmetičkih sredina koja je dobijena u našem uzorku pada izvan teorijskog raspona za dvije standardne greške aritmetičkih sredina 3. Kada je vrijednost testa statističke značajnosti 0.01 ili manja razlika aritmetičkih sredina pada izvan teorijskog raspona za tri standardne greške aritmetičkih sredina. 6. Veličina efekta. Utvrđivanje da je neka razlika statistički značajna je važan dio svakog istraživanja. Međutim vrijednosti koje su dobijene na velikim uzorcima često imaju tendenciju da budu statistički značajne. Iz tog razloga da bi poboljšali naše istraživanje koristimo pokazatelj veličine efekta koji ispituje povezanost dvije ili više varijabli, tj. procenat njihove zajedničke varijanse 4. Kada su u pitanju t Test i F test veličinu efekta ćemo računati pomoću pokazatelja eta kvadrata (η 2 ). Formula za izračunavanje eta kvadrata za t Test je η 2 = t² t²+(n1+n2 2) gdje je t vrijednost t testa, N1 je veličina uzorka prve kategorije a N2 veličina uzorka druge kategorije. Kada je u pitanju F test formula za eta kvadrat iznosi η 2 = Vrijednost testa. U tabeli 2 se nalaze vrijednosti ovoga testa. Tabela 2: Vrijednosti veličine efekta zbir kvadrata odstupanja različitih grupa ukupan zbir kvadrata Veličina uticaja Eta kvadrat (% objašnjene varijanse) Mali 0.01 ili 1% Srednji 0.06 ili 6% Veliki 0.138 ili 13.8%. 3 Standardna greška aritmetičke sredine je ekvivalent standardnoj devijaciji, i njena upotreba i interpretacija je ista kao i standardne devijacije. U pitanju su standardizovanja odstupanja od prave aritmetičke sredine populacije (za razliku od standardne devijacije koja je standardizovano odstupanje od aritmetičke sredine uzorka). To znači da je ona preciznija od standardne devijacije. Izačunava se kao količnik standardne devijacije i korijenovane veličine uzorka s x= s n. 4 Postoje dvije porodice veličine efekta: ona koju ćemo raditi u okviru t Testa i F testa koja ispituje povezanost varijabli kroz procenat zajedničke varijanse, i sa druge strane porodica čiji statistici ispituju udaljenost varijabli izraženu standardnim devijacijama (npr. Koenov d). 4
Testiranje razlika između aritmetičkih sredina t Test T test primjenjujemo kada želimo da ispitamo da li su razlike koje smo pronašli u uzorku statistički značajne. Dva glavna preduslova za primjenu ove tehnike su: utvđivanje nivoa mjernih skala i pretpostavka normalnosti zavisne varijable. Iz navedenog se može zaključiti da je naša zavisna varijabla kontinuiranog tipa (npr. intervalna). Sa druge strane nezavisna varijabla je kategorijalna (npr. nominalna) i ima dvije kategorije. Pogledaćemo jedan izlaz SPSS-a za t Test. U gornjoj tabeli se nalaze vrijednosti deskriptivne statistike dok se u donjoj tabeli nalaze vrijednosti Levenovog testa i našeg t Testa. U ovom primjeru smo ispitivali da li postoje polne razlike kada je u pitanju depresija. Interpretaciji podataka ćemo se vratiti kasnije ali važno je prethodno objasniti statističku pozadinu vrijednosti iz tabela. T test ispituje koliko je neka razlika između aritmetičkih sredina veća od svoje greške. Kriterijum je da ona mora biti makar dva ili tri puta veća što je ekvivalento sadržaju dvije ili tri standardne devijacije 5 (95% i 99%). Taj odnos predstavlja našu t vrijednost. On se dobija kao količnik razlike aritmetičkih sredina i standardne greške te razlike. Te vrijednosti se nalaze drugoj tabeli u kolonama t, mean difference i std. error of difference. Za velike uzorke (veće od 400 ispitanika) granična vrijednost t Testa je 1.96 za vjerovatnoću od 0.05. Vrijednost t Testa za vjerovatnoću od 0.01 je 2.56. To bi praktično značilo da ako je vrijednost t Testa veča od 1.96 onda je naš test značajan na nivou manjem od 0.05. ako je ta vrijednost veće od 2.56 test je značajan na nivou manjem od 0.01. Međutim granične vrijednosti se mijenjaju u odnosu na veličinu uzorka jer logično je da mjerenje pokazuje veći varijabilitet što je broj mjerenja (veličina našeg uzorka) manji. To znači i da će naš interval 5 Već smo istakli da kod t Testa umjesto standardnih devijacija koristimo standardne greške aritimetičkih sredina, što znači da će naše odstupanje biti izraženo u standardnim greškama aritmetičkih sredina. 5
povjerenja (granična vrijednost) sa manjim uzorkom biti veći (jer je veči i varijabilitet). Time naša granična vrijednost t Testa raste kako opada veličina uzorka. Da bi olakšali mjerenje mnogo praktičnija, preciznija i jednostavnije upotreba vrijednosti testa statističke značajnosti (u trugoj tabeli u koloni sig.). Upotrebu ove vrijednosti već smo objasnili u dijelu testiranje hipoteza. U nastavku ćemo proći kroz osnovne korake upotrebe t Testa. 1. Istraživačka pitanja i hipoteze Rekli smo da t Testom ispitujemo da li su razlike između aritmetičkih sredina statistički značajne, tj. da li nalaz koji smo pronašli u uzorku možemo generalizovati na populaciju. Da bi utvrdili razlike između kategorija (u gornjem primjeru muškaraca i žena) obraćamo pažnju na kolonu gdje se nalaze vrijednosti njihovih aritmetičkih sredina (Mean). Aritmetičke sredine su reprezenti prosječne vrijednosti za svaku kategoriju naše nezavisne varijable. U odnosu na te vrijednosti procjenjujemo da li postoje razlike između muškaraca i žena kada je u pitanju depresija. Na osnovu vrijednosti (3.59 i 3.26) vidimo da postoje razlike unutar našeg uzorka. Bez obzira kolike razlike bile (bila ta razlika samo na drugoj decimali) one su prisutne. Nulta hipoteza neće govoriti o statistički značajnoj razlici dok će sa druge strane alternativna hipoteza potvrđivati datu razliku. 2. Komande koje zadajete SPSS-u podrazumijevaju sledeće: Do našeg t Testa, tj polja u kojem ćemo da zadamo komande SPSS da utvrdi statistički značajne razlike između dvije aritmetičke sredine je preko polja Analyse Compare Means Indipendent samples T Test. Otvoriće nam se polje koje se nalazi lijevo. U dijelu Test Variable(s) unosimo našu zavisnu varijablu a u dijelu Grouping Variable našu nezavisnu. Kada je u pitanju nezavisna varijabla t Test zahtijeva da definišete kategorije između kojih ćete utvrđivati razlike 6. Pokrenete polje Define Groups i otvoriće vam se dodatni prozor u kojem morate da upišete kodove kategorija nezavisne varijable koje ćete analizirati. U navedenom primjeru to su kodovi 0 i 1. Zatim potvrdite zadatu komandu na Continue. I na kraju u osnovnm prozoru Ok. 6 Prethodno smo utvrdili da t Test koristimo kada imamo kategorijalnu nezavisnu varijablu koja ima dvije kategorije. Možete koristiti i nezavisnu varijablu koja ima i više od dvije kategorije ali t Test dozvoljava da se porede razlike između samo dvije kategorije. 6
3. Pretpostavka homogenosti varijanse podrazumijeva utvrđivanje pokazatelja iz Levenovog testa. Kada su varijanse homogene pokazatelj statističke značajnosti t Testa je pouzdaniji. Dobra osobina t Testa je da pokazuje veliku otpornost na kršenje ove pretpostavke, i računa dodatnu vrijednost za rad u testu pod pretpostavkom nejednakih varijansi. Kršenje ove pretpostavke možemo nagovijestiti već u prvoj tabeli gdje se uočavaju odstupanja između dvije kategorije nezavisne varijable female i male. Kolone N (veličina uzorka) i Std. Deviation pokazuju neznatna odstupanja. Pravilo je da proporcija odstupanja ne smije biti veća od 1:1.5. Tačnu vrijednost ovog testa utvrđujumo iz druge tabele gdje u dijelu Leven s Test for Equality of Variances očitavamo vrijednost njegovog testa statističke značajnosti (kolona sig.). Kada je vrijednost veća od 0.05 radimo test pod pretpostavkom jednakih varijansi u uzimamo kao referentne vrijednosti iz gornjeg reda (kao što je slučaj sa našim primjerom), u suprotnom kada je vrijednost manja od 0.05 radimo test pod pretpostavkom nejednakih varijansi očitavamo vrijednosti iz donjeg reda. 4. Utvrđivanje statističke značajnosti. Nakon što šmo ispitali pretpostavku homogenosti varijansi u utvrdili koja kolona daje referentne vrijednosti za naš t Test, ispitujemo tačnost naših hipoteza. Vrijednost testa statističke značajnosti (Sig.) u dijelu t-test for Equality of Means. Već smo objasnili značenje i primjenu ovog testa u konkretnom slučaju ta vrijednost iznosi 0.00 (p>0.01) što je pokazatelj tačnosti alternativne hipoteze. 5. Veličina efekta. Primjenom formule eta kvadrata za t Test nezavisnih uzoraka određujemo da je veličina efekta za dato mjerenje η 2 =0.06, što bi značilo da procenat zajedničke varijanse dvije varijable iznosi 6% što predstavlja srednju veličinu uticaja. 6. Izvještaj: T Testom nezavisnih uzoraka smo ispitivali značajnost polnih razlika pronađenih između prosječnih vrijednosti anksioznosti (7.12 za žene i 5.39 za muškarce). U odnosu na istraživačko pitanje (Da li postoje značajne razlike između srednjih vrijednosti anksioznosti kod muškaraca i žena?) kreirano naše hipoteze: Ho: Ne postoje statistički značajne razlike između srednjih vrijednosti anksioznosti kod muškaraca i žena. H1: Razlike između srednjih vrijednosti anksioznoszi između muškaraca i žena su statistički značajne. 7
Na osnovu vrijednsoti Levenovog testa (p=0.932) radimo test pod pretpostavkom jednakih varijansi.vrijednost t Testa (t [268] 7 =4.15) i testa statističke značajnosti (p=0.000) pokazuju da je razlika između grupa statistički značajna na nivou većem od 99% (p<0.01), tj. odbacijemo našu nultu i prihvatamo alternativnu hipotezu. Razlika između srednjih vrijednosti obilježja po grupama (prosječna razlika=1.727) bila je srednje jačine (eta kvadrat=0.06). F test uvod u analizu varijanse Upotreba i pretpostavke na kojima se bazira F test slične su kao i kod t Testa. Pretpostavka normalnosti zavisne varijable (ili približne normalnosti), zatim homogenost varijansi su neke od najvažnjih pretpostavki ovog testa koje smo već objasnili kod t Testa. Međutim F test je statistički potpuno drugačiji od t Testa jer se bazira na analizi varijanse. Analiza varijanse, a time i F Test se koriste kada želimo uporediti tri ili više aritmetičkih sredina i ispitati da li su razlike statistički značajne. Npr. želimo ispitati statističku značajnost između četri grupe ispitanika u odnosu na nivo depresije. Svakako da bismo mogli ispitati ovu značajnost pomoću nekoliko t Testova (u ovom slučaju tri testa 8 ) međutim izlažemo se opasnosti od greške I vrste čime bi morali zadati stroži nivo značajnosti. Sa druge strane umjesto nekoliko testova radićemo samo jedan ćime pojednostavljujemo cijeli proces. Cilj testa je da dokažemo da je varijabilitet među grupama veći od varijabiliteta unutar grupa. Ako je on statistički značajno veći onda su razlike među aritmetičkim sredinama prisutne i u populaciji. Da bi ispitali razliku među varijabilitetima moramo razdvojiti ukupnu varijaciju na varijaciju između grupa i varijaciju unutar grupa. Ako su varijansa između grupa i varijansa unutar grupa približno jednake nulta hipoteza se prihvata. U suprotnom prihvata se alternativna hipoteza. Test koji izražava odnos između ove dvije varijanse je F test. 7 Ukupna veličina uzorka. 8 Između prve i druge grupe, između druge i treće grupe, i između prve i treće grupe. 8
Jednofaktorska analiza varijanse različitih grupa Jednofaktorskom analizom varijanse (ANOVA) ispitujemo statističku značajnost između dvije varijable. Zavisna varijabla je kontinuirane a nezavisna kategorijalne prirode (sa tri ili više kategorija). Nezavisnu varijablu kod ANOVE nazivamo faktorom. U slučajevima kada imamo dvije nezavisne varijable primjenjujemo dvofaktorsku analizu varijanse. U ovome dijelu fokusiraćemo se na primjeni jednofaktorske analize varijanse. Proceduru jednofaktorske analize varijanse pokrećemo preko opcije Analyse Compare Means One-Way ANOVA. Otvoriće se prozor u kojem u polju Dependent List prenosite zavisnu varijablu a u polju Factor nezavisnu. Nakon toga odaberete opciju Options (u istom prozoru). U dijelu Statistics odabraćete Descriptive, Homogeneity of variance test, Brown-Forsithe test. Na taj način zadali ste SPSSu da vam podatke statističke značajnosti dopuni sa podacima deskriptivne statistike, Levenovim testom homogenosti varijansi kao i statističku značajnost za nehomogene varijanse koja se nalazi u tabeli Brown- Forsith testa. Na kraju pritisnete Continue i OK. Dobijate sledeći izlaz. 9
F test prati iste faze analize kao i t Test. Krećemo od istraživačkog pitanja i hipoteza. 1. Istraživačko pitanje bi glasilo: da li se razlikuju rezultati mjerenja depresije kod ispitanika različitog bračnog statusa? U odnosu na istraživačko pitanje postavljamo hipoteze. Ho: ne postoje razlike mjerenja depresije kod ispitanika različitog bračnog statusa. H1: razlike između mjerenja depresije kod ispitanika različitog bračnog statusa su statistički značajne. 2. Levenov test homogenosti varijanse. U drugoj tabeli (Test of Homogeneity of Variances) u koloni sig. imamo vrijednost Levenovog testa statističke značajnosti. Prethodno smo uočili vrijednosti u prvoj tabeli i vidjeli da se veličine uzoraka različitih kategorija (N) razlikuju dok su vrijednosti standardnih devijacija približne. Varijacije unutar kategorija uzoraka mogu biti pokazatelj nehomogenih varijansi. Kao i kod t Testa kada je vrijednost Levenovog testa veća od 0.05 smatramo da su varijanse homogene i radimo test pod pretpostavkom homogenih varijansi. U suprotnom, kada je vrijednost manja od 0.05 radimo test pod pretpostavkom heterogenih varijansi. Vrijednost našeg Levenovog testa za jednakost varijanse je p=.909. što je pokazatelj da su varijanse homogene. 3. Kada radimo test pod pretpostavkom homogenih varijansi u nastavku naše analize se fokusiramo na treću tabelu. U suprotnom, da su varijanse bile heterogene (da je vrijednost Levenovog testa bila manja od 0.05) zanemarili bi rezultate iz treće tabele i očitali vrijednost Brown-Forsithovog testa 9, tj. njegove statističke značajnosti. U našem slučaju relevantni pokazatelj značajnosti se nalazi u tabeli ANOVA u koloni sig. Njegova vrijednost od p=.625 pokazatelj je statistički neznačajnog rezultata jer je kao i kod t testa granica je 0.05. 4. Na kraju izračunavamo veličinu efekta po formuli: η 2 = zbir kvadrata odstupanja različitih grupa ukupan zbir kvadrata = 15.812 2401.249 = 0.006 Vrijednost veličine efekta je 0.006 ili 6% što je mala veličina efekta. 5. Interpretacija: Jednofaktorskom analizom varijanse (ANOVA) smo ispitivali statističku značajnost koju smo otkrili u merenju depresije u odnosu na bračni status (prosječne vrijednosti su pokazivale da su prisutne manje razlike). Kako su veličine uzoraka u kategorijama različite (N1=54, N2=187, N3=20, N4=8) pristupićemo Levenovom testu u utvrditi da li je narušena pretpostavka homogenosti varijansi. Vrijednost Levenovog testa pokazuje da pretpostavka nije narušena (p=0.909) što je pokazatelj da radimo test pod pretpostavkom homogenih varijansi. Vrijednost F testa (F=0.586) i testa statističke značajnost (p=0.625) su pokazatelji da imamo statistički neznačajan rezultat čime prihvatamo našu nultu hipotezu i zaključujemo da ne postoje statistički značajne razlike po nivou depresije u odnosu na bračno stanje. Takođe pokazatelj veličine efekta je pokazivao malu razliku između grupa (η 2= 0.006) što ide u prilog pronađenom rezultatu statističke neznačajnosti. 9 Kršenje pretpostavke homogenosti varijansi je uglavnom uzrokovano velikim razlikama između kategorija uzorka. To se negativno odražava na vrijednost F testa. U tim situacijama primjenjuje se Brown-Forsithov test jer je on otporan na kršenje pretpostavke homogenosti varijansi pa se koristi kao alternativni test. 10