8.4 χ 2 -preizkus Preizkušanje hipoteze enake verjetnosti

8.4 χ 2 -preizkus V pedagoških raziskavah imamo veliko pogosteje opravka z opisnimi spremenljivkami kot pa s številskimi spremenljivkami. Do sedaj opisani preizkusi o aritmetičnih sredinah, o standardnih odklonih in Pearsonovih korelacijskih koeficientih se nanašajo na številske spremenljivke. Izjema je le preizkus ničelne hipoteze o strukturnih odstotkih, ki ga lahko uporabimo tudi za opisne spremenljivke. Vendar je to premalo in na mnoga vprašanja ne moremo odgovoriti z dosedanjimi postopki. Preizkusi razlik med množicami pravzaprav odgovarjajo na vprašanja o povezanosti spremenljivk, saj so razlike posledica vpliva enih pojavov na druge. Zato raziskovanje razlik v resnici pomeni raziskovanje vplivov in povezanosti. Za številske spremenljivke imamo na voljo korelacijske koeficiente, indeks korelacije, vzorčne postopke, vezane na Pearsonov korelacijski koeficient in z-preizkuse. Statistične metode, ki smo jih doslej spoznali, niso niti zadostne niti povsem ustrezne za ugotavljanje povezanosti med opisnimi spremenljivkami. Opisali in spoznali bomo najbolj vsestransko statistično metodo, kar jih sploh je. Preizkus, ki ga bomo spoznali v nadaljevanju odgovarja na mnoga vprašanja pri raziskovanju vzgojnih pojavov. In predvsem uporaben je za vse vrste opisnih spremenljivk. To je χ 2 -preizkus. Med vsemi možnostmi njegove uporabe, nas bo najbolj zanimalo dvoje: preizkušanje hipoteze enake verjetnosti in preizkušanje hipoteze neodvisnosti. 8.4.1 Preizkušanje hipoteze enake verjetnosti Ta postopek odgovarja na raziskovalno vprašanje ali so v osnovni množici kategorije spremenljivke enako zastopane. Npr. anketiranci so odgovarjali na neko anketno vprašanje. Zanima nas, ali v osnovni množici prevladuje kateri od odgovorov na to vprašanje. Podatki za vzorec so običajno takšni, da so frekvence odgovorov različne. Za neke odgovore se je odločilo več anketirancev kot za druge. Skoraj vedno je tako; le izjemoma imajo vsi odgovori enako frekvenco. Če bi nas zanimal vzorec, bi že na pogled iz tabele frekvenc lahko odgovorili na naše vprašanje. Če so frekvence vseh kategorij enake, takrat noben odgovor ne prevladuje in so torej vsi enako pogosti. Če so frekvence odgovorov različne, pomeni, da se več ljudi strinja z enimi odgovori kot pa z drugimi. Te sklepe bi oprli neposredno na različne frekvence in jih ne bi dodatno dokazovali. Ilustrirajmo to z dvema primeroma. Tabela 80. Empirične frekvence Študente drugega letnika smo vprašali, kam bi radi šli na študijsko prakso. Predloženi so bili trije odgovori. Imamo frekvence za vzorec: A. v vrtec 8 B. v osnovno šolo 23 C. v srednjo šolo 11 Vidimo, da največ študentov želi iti na prakso v osnovno šolo, najmanj pa v vrtec. To dejstvo je neizpodbitno. Ni ga potrebno nikakor dokazovati.

Če bi v vzorcu dobili takšne odgovore: D. v vrtec 14 E. v osnovno šolo 14 F. v srednjo šolo 14 bi to neizpodbitno pomenilo, da so odgovori v vzorcu enakomerno porazdeljeni. Tudi tega ne bi dodatno dokazovali. Vendar nas vzorec pravzaprav ne zanima. Zanima nas osnovna množica, iz katere je ta vzorec izbran. Zato zgolj na pogled iz vzorčnih frekvenc ne moremo dovolj zanesljivo sklepati, kakšno je stanje v osnovni množici. Uporabili bomo χ 2 -preizkus. Za izvedbo preizkusa moramo postaviti ničelno hipotezo. V tem primeru je to hipoteza enake verjetnosti: Vsi odgovori v osnovni množici so enako verjetni. To je posebna oblika ničelne hipoteze, saj v bistvu trdi, da se pogostost odgovorov ne razlikuje (razlika je enaka nič). Postavimo tudi nasprotno hipotezo, da vsi odgovori v osnovni množici niso enako verjetni (in da torej nimajo vsi enake frekvence). Ta hipoteza se v bistvu sklada z našo raziskovalno hipotezo. Postavljeno hipotezo enake verjetnosti bomo preizkusili s χ 2 -preizkusom. V preizkusu jo bomo, ali zavrnili ali pa ne (le prvi izid je ugoden). Opišimo potek preizkusa. Imamo podatke za vzorec o odgovorih na neko anketno vprašanje. Te podatke vnesemo v frekvenčno tabelo. Za prikaz preizkusa smo izbrali preprost primer spremenljivke s tremi kategorijami. Študente drugega letnika smo vprašali, kam bi radi šli na študijsko prakso. Predloženi so bili trije odgovori. Imamo frekvence za vzorec: Tabela 81. Odgovori študentov odgovori f vrtec 8 osnovna šola 23 srednja šola 11 skupaj 42 Največ anketirancev je izbralo osnovno šolo, precej manj srednjo šolo in najmanj vrtec. Vendar so to podatki za vzorec. Kakšni so odgovori v osnovni množici? Frekvence, ki so v tabeli, smo pridobili na empirični način (npr. z anketnim vprašalnikom). Imenujemo jih empirične ali stvarne frekvence in označimo z f E. Te frekvence odražajo stvarno stanje med anketiranci. Zamislili si bomo frekvence, ki bi jih pričakovali v tabeli, če bi veljala hipoteza enake verjetnosti. Če bi hipoteza enake verjetnosti držala, bi pričakovali, da bodo v tabeli frekvence vseh odgovorov enake da se ne bodo razlikovale. Te frekvence bomo imenovali pričakovane ali teoretične (f T ). Dobimo jih tako, da delimo numerus s številom kategorij (42:3=14). Prikažimo jih v frekvenčni tabeli.

Tabela 82. Pričakovane frekvence odgovori f vrtec 14 osnovna šola 14 srednja šola 14 skupaj 42 Zaradi nazornosti bomo v isti tabeli prikazali stvarne in pričakovane frekvence. Za sam preizkus to ni nujno potrebno. Tabela 83. Stvarne in pričakovane frekvence odgovori f E f T vrtec 8 14 osnovna šola 23 14 srednja šola 11 14 Imamo torej na eni strani stvarne frekvence in na drugi strani pričakovane frekvence. Stvarne in pričakovane frekvence se ne ujemajo. Zakaj se stvarno in zamišljeno stanje razlikujeta? Prvi vzrok je lahko slučajnostni izbor enot v vzorec. Zaradi slučajnih vplivov bo stanje v vzorcu vedno nekoliko drugačno kot v osnovni množici. Te razlike so majhne in kar je še pomembneje so matematično predvidljive. Drugi vir razlik je lahko v tem, da stanje v osnovni množici ni takšno, kot trdi hipoteza enake verjetnosti. Enostavno rečeno: frekvence odgovorov v vzorcu se razlikujejo zaradi tega, ker se razlikujejo že v osnovni množici. To pomeni, da je stvarnost drugačna od ničelne hipoteze. χ 2 -preizkus temelji na velikosti razhajanja med stvarnimi in pričakovanimi frekvencami. Če bodo razlike med stvarnimi in pričakovanimi frekvencami majhne, bomo sklepali, da verjetno temeljijo na slučaju. Če bodo razlike med temi frekvencami velike, bomo sklepali, da bolj verjetno temeljijo na razliki v osnovni množici. Pri zadosti velikem razhajanju med frekvencami bomo zavrnili hipotezo enake verjetnosti kot nepravilno. To bomo šteli kot dokaz, da velja nasprotna hipoteza. Končna trditev bo: vsi odgovori v osnovni množici niso enako pogosti (neki odgovori prevladujejo). Za izvedbo preizkusa moramo izmeriti razhajanje med stvarnimi in pričakovanimi frekvencami. Skupna stopnja razhajanja vseh frekvenc v tabeli je vrednost χ 2. Za vsako okence v tabeli izračunamo razhajanje stvarnih in pričakovanih frekvenc in seštejemo za vsa okenca: Ta vrednost se porazdeljuje v χ 2 porazdelitvi. Dobljeno vrednost χ 2 primerjamo s kritično vrednostjo iz tabele. Poglejmo, kakšni so možni izidi χ 2 -preizkusa.

1. χ 2 < χ 2 (α = 0,05) Vrednost χ 2 ni statistično pomembna. Hipoteze enake verjetnosti ne zavrnemo. O odgovorih v osnovni množici ne moremo trditi ničesar. To bi lahko v vsakdanjem govoru opisali tako: razhajanje med stvarnimi in pričakovanimi frekvencami je premajhno in ne moremo ničesar trditi o osnovni množici (ne upamo zavrniti hipoteze enake verjetnosti). 2. χ 2 χ 2 (α = 0,05) Vrednost χ 2 je statistično pomembna na ravni α=0,05. Hipotezo enake verjetnosti zavrnemo s tveganjem 5%. Sprejmemo nasprotno hipotezo. Dokazali smo, da vsi odgovori v osnovni množici niso enako pogosti. To bi lahko v vsakdanjem govoru opisali tako: razhajanje med stvarnimi in pričakovanimi frekvencami je zadosti veliko in lahko trdimo, da stanje v osnovni množici ni takšno kot trdi hipoteza enake verjetnosti. 3. χ 2 χ 2 (α = 0,01) Vrednost χ 2 je statistično pomembna na ravni α=0,01. Hipotezo enake verjetnosti zavrnemo s tveganjem 1%. Sprejmemo nasprotno hipotezo. Dokazali smo, da vsi odgovori v osnovni množici niso enako pogosti. 4. χ 2 χ 2 (α = 0,001) Vrednost χ 2 je statistično pomembna na ravni α=0,001. Hipotezo enake verjetnosti zavrnemo s tveganjem 0,1%. Sprejmemo nasprotno hipotezo. Dokazali smo, da vsi odgovori v osnovni množici niso enako pogosti. Ob iskanju kritičnih vrednosti χ 2 iz tabele se srečamo z novim pojavom. Krivulja normalne porazdelitve je ena sama in je npr. kritična vrednost za 5% tveganja tudi ena sama (1,96). Krivulj χ 2 je več in ne ena sama, zato tudi ni»stalnih«kritičnih vrednosti. Oblika krivulje se od primera do primera razlikuje; odvisna je od števila prostostnih stopinj. Ker se bomo v vzorčni statistiki pogosto srečevali s prostostnimi stopinjami, bomo ta pojem razložili podrobneje in splošneje. Pozneje se vrnemo k tabeli χ 2 -porazdelitve in k iskanju kritičnih vrednosti. 8.4.1.1 Prostostne stopinje Vzorčne vrednosti pojmujemo kot vrednosti slučajne spremenljivke (ker so enote v vzorec izbrane z žrebanjem). V vzorcu imamo toliko vrednosti spremenljivke, kolikor je numerus vzorca. To je prava velikost vzorca. Dokler o podatkih ničesar ne vemo, so vrednosti v vzorcu lahko kakršnekoli. Pravimo, da vrednosti svobodno variirajo ali, da so vsi podatki»prosti«. Če poznamo vsoto vrednosti v vzorcu, potem vse vrednosti niso več»proste«. Vse razen ene lahko prosto variirajo, le ena je vezana na to vsoto. Poglejmo preprost primer. Imamo vrednosti številske spremenljivke za vzorec z numerusom šest. x 5 3 5 6 2 7 Če o vzorcu nič ne vemo, vsaka od vrednosti prosto (slučajno) variira. Namesto petke v prvem oknu bi lahko bila štirica ali kaka druga vrednost, namesto trojke v drugem oknu bi

lahko bila katerakoli druga vrednost itd. Če nam je znana vsota, pa vse vrednosti ne variirajo več prosto. x 5 3 5 6 2? Σ= 24 V tem primeru lahko pet vrednosti še vedno prosto variira (pri vzorčenju to pomeni, da so lahko izžrebane enote s katerimikoli vrednostmi). Ena izmed vrednosti pa ne more biti kakršnakoli, saj vsota mora biti 26. V navedenem primeru zadnja vrednost mora biti tri. Kakor da slučajnostni vzorec nima več numerusa šest, temveč le pet. Velikost vzorca se je navidezno zmanjšala. Število vrednosti, ki lahko prosto variirajo, imenujemo število prostostnih stopinj (g). Zamislimo si ga lahko kot navidezno velikost vzorca. Ko poznamo aritmetično sredino vzorca, je število prostostnih stopinj g = n-1. Če bi nam bila znana tudi varianca, bi bilo število prostostnih stopinj g = n-2. Če nam je znan še korelacijski koeficent, je g = n-3 itd. Nasploh lahko rečemo, da je število prostostnih stopinj nekega številskega sistema enako številu podatkov, zmanjšanem za število zvez med podatki. Pri nekaterih statističnih postopkih pa izhodišče ni numerus vzorca. Pri χ 2 -preizkusu ne primerjamo posameznikov, temveč frekvence v okencih dveh tabel. Zato je izhodišče število primerjanih frekvenc (ali še preprosteje: število okenc v tabeli). Število prostostnih stopinj je enako številu okenc s prostimi frekvencami zmanjšanemu za število okenc z»neprostimi«frekvencami. Število okenc v tabeli je odvisno od števila kategorij spremenljivke. Pri preizkusu hipoteze enake verjetnosti imamo samo eno spremenljivko. Število prostostnih stopinj določimo po obrazcu: g = (a-1) a-število kategorij spremenljivke Pri preizkusu hipoteze neodvisnosti imamo dve spremenljivki in število prostostnih stopinj določimo iz števila vrstic in stolpcev v tabeli. Pri štetju vrstic in stolpcev upoštevamo le tisti del tabele, v katerem so osnovni podatki. Vrstic in stolpcev z vsotami ne štejemo (spodaj skupaj in desno skupaj). Število prostostnih stopinj izračunamo po podobnem obrazcu: g = (a-1) (b-1) a-število kategorij prve spremenljivke (npr.število vrstic) b-število kategorij druge spremenljivke (npr.število stolpcev) S tem številom iščemo kritične vrednosti v χ 2 -tabeli. Izračunano vrednost χ 2 primerjamo s kritičnimi vrednostmi, kot smo že prej pokazali. Zakaj prostostnih stopenj nismo upoštevali pri prejšnjih preizkusih ničelnih hipotez? Kadar raziskujemo z velikimi vzorci se navidezno zmanjšanje vzorca ne pozna veliko. Zato smo lahko ta pojav zanemarili. Pri velikih vzorcih smo se opirali na zakonitosti normalne porazdelitve, čeprav smo vedeli, da stvarne porazdelitve odstopajo od normalne. Odstopanje je bilo zanemarljivo, koristi od poenostavljenih postopkov pa velike. Če bi želeli uporabljati povsem natančne metode, bi morali to upoštevati že pri velikih vzorcih. Čim manjši so numerusi vzorcev, tem večje so te napake in pod neko mejo niso več zanemarljive. To je praktična meja med malimi in velikimi vzorci. Sedaj pokažimo potek preizkusa na primeru anketnega vprašanja o študijski praksi.

Tabela 84. Odgovori študentov odgovori f vrtec 8 osnovna šola 23 srednja šola 11 skupaj 42 Raziskovalno vprašanje je: ali se v osnovni množici frekvence odgovorov razlikujejo (ali kateri od odgovorov prevladuje)? Če bi držala hipoteza enake verjetnosti, bi bile pričakovane frekvence naslednje (v tabeli je hkrati ves postopek računanja vrednosti χ 2 ): Tabela 85. Pričakovane frekvence odgovori f T vrtec 14 osnovna šola 14 srednja šola 14 skupaj 42 Primerjava stvarnih in pričakovanih frekvenc že na pogled kaže precejšnje razhajanje. Ali je to dovolj za zavrnitev ničelne hipoteze bo pokazal preizkus: Tabela 86. Preizkušanje hipoteze enake verjetnosti odgovori f E f T f E f T (f E f T ) 2 (f E f T ) 2 / f T vrtec 8 14-6 36 2,57 osnovna šola 23 14 9 81 5,79 srednja šola 11 14-3 9 0,64 skupaj 42 42 9,00 χ 2 = 9,00 > χ 2 (α = 0,05; g = 2) = 5,991 Vrednost χ 2 je statistično pomembna na ravni α=0,05. Hipotezo enake verjetnosti zavrnemo s tveganjem 5%. Sprejmemo nasprotno hipotezo. Dokazali smo, da vsi odgovori v osnovni množici niso enako pogosti. Tudi v osnovni množici prevladuje želja po opravljanju študijske prakse v osnovni šoli. 8.4.2 Preizkušanje hipoteze neodvisnosti Tukaj je predmet raziskovanja povezanost med dvema opisnima spremenljivkama. Konkretno raziskovalno vprašanje zveni tako: ali sta spremenljivki v osnovni množici povezani. Nimamo podatkov za celotno osnovno množico; imamo le vzorčne podatke. Podatki o dveh spremenljivkah, urejeni v ustrezno tabelo, veliko povedo o povezanosti med njima. Če bi nas zanimal samo vzorec, bi deloma lahko shajali s samimi strukturnimi odstotki. Vendar je v središču našega raziskovanja cela osnovna množica. Zato nam tabela z vzorčnimi podatki ne zadostuje. Potreben bo statistični preizkus.

O stanju v osnovni množici postavimo hipotezo neodvisnosti: Spremenljivki sta v osnovni množici neodvisni. Tudi to je posebna oblika ničelne hipoteze, saj pravi, da ni povezanosti med spremenljivkama. Nasprotna tej hipotezi je hipoteza, da sta spremenljivki v osnovni množici odvisni. Najpogosteje nasprotne hipoteze izrecno niti ne postavimo, saj je praktično vedno enaka raziskovalni hipotezi. Videli smo pri vseh dosedanjih preizkusih, da z ničelnimi hipotezami ne mislimo povsem resno; potrebujemo jih le zaradi izvedbe preizkusa. Postavljeno hipotezo neodvisnosti bomo tudi tokrat preizkusili s χ 2 -preizkusom. V preizkusu jo bomo, ali zavrnili ali pa obdržali (le prvi izid je ugoden). Opišimo potek preizkusa. Imamo vzorčne podatke o dveh spremenljivkah. Te podatke vnesemo v frekvenčno tabelo. Za prikaz preizkusamo smo izbrali preprost in pogost primer s pedagoškega področja: povezanost med spolom in stališčem. Njegova preprostost je v tem, da imata obe spremenljivki majhno število kategorij. Spol je neodvisna spremenljivka in ima le dve kategoriji. Odvisna spremenljivka je stališče in v našem primeru ima samo tri kategorije. Seveda bi tudi spremenljivka stališče lahko imela samo dve kategoriji (npr. za in proti). Tabela bi bila še preprostejša (dve vrstici in dva stolpca), za razumevanje bistva preizkusa pa bi to bila prevelika poenostavitev. Tabela 87. Frekvenčna tabela po spolu in stališču sem za vseeno sem proti skupaj ženske 18 12 32 62 moški 42 19 29 90 skupaj 60 31 61 152 Lahko na kratko interpretiramo podatke. Vidi se, da moški bolj soglašajo s tistim, kar je bilo v anketnem vprašanju. Ženske so bolj proti, pri sredinskem odgovoru pa so moški in ženske približno izenačeni. Vendar so to podatki za vzorec. Kakšne so razlike med stališči v osnovni množici? Frekvence, ki so v tabeli, so empirične ali stvarne frekvence (f E ). Te frekvence odražajo stvarno stanje med anketiranci. Zaradi lažjega razumevanja razlage jih preračunamo v strukturne odstotke. Za samo izvedbo preizkusa to ni potrebno; tabelo z odstotki bomo potrebovali šele na koncu za interpretacijo. Ker iz tabele ne bomo ničesar več izračunavali, smo odstotke zaokrožili na prvem mestu za decimalno vejico (to za interpretacijo povsem zadostuje). Tabela 88. Odstotne frekvence sem za vseeno sem proti skupaj ženske 29,0 19,3 51,6 100,0 moški 46,7 21,1 32,2 100,0 skupaj 39,5 20,4 40,1 100,0 Kakšne frekvence bi pričakovali v tabeli, če bi veljala hipoteza neodvisnosti? Te frekvence bomo imenovali pričakovane ali teoretične (f T ). Če sta spol in stališče neodvisna, potem se odgovori žensk in moških v splošnem ne razlikujejo. Kakšne frekvence torej pričakujemo? Poglejmo v prejšnji tabeli, npr. frekvenco v levem spodnjem vogalu. To je odstotek tistih, ki so odgovorili»sem za«v celem vzorcu (39,5%). Če se odgovori moških in žensk ne razlikujejo, potem mora biti odstotek tistih, ki sogašajo pri ženskah in pri moških enak (in

sicer 39,5%). Tistih, ki jim je vseeno, mora biti pri obojih 20,4% in tistih, ki so proti pri obojih 40,1%. Pričakovane frekvence bodo torej takšne: Tabela 89. Pričakovane frekvence sem za vseeno sem proti skupaj ženske 39,5 20,4 40,1 100,0 moški 39,5 20,4 40,1 100,0 skupaj 39,5 20,4 40,1 100,0 Pogled na obe tabeli nam pokaže, da se stvarne in pričakovane frekvence ne ujemajo. To pomeni, da je stvarnost drugačna kot predvideva hipoteza. Zakaj se stvarno in zamišljeno stanje razlikujeta? Prvi vzrok je lahko slučajnostni izbor enot v vzorec. Zaradi slučajnih vplivov bo stanje v vzorcu vedno nekoliko drugačno kot v osnovni množici. Te razlike so majhne in kar je še pomembneje so matematično predvidljive. Drugi vir razlik je lahko v tem, da stanje v osnovni množici ni takšno, kot trdi hipoteza neodvisnosti. Enostavno rečeno: stališča žensk in moških se v vzorcu razlikujejo zaradi tega, ker se razlikujejo že v osnovni množici. Na velikosti teh razlik (razhajanja) temelji χ 2 -preizkus. Pri zadosti velikem razhajanju med frekvencami bomo zavrnili hipotezo neodvisnosti kot nepravilno. To dokazuje pravilnost nasprotne hipoteze in lahko postavimo končno trditev, da je v osnovni množici stališče odvisno od spola. Za izvedbo preizkusa moramo izmeriti razhajanje med stvarnimi in pričakovanimi frekvencami. Skupna stopnja razhajanja vseh frekvenc v tabelah je vrednost χ 2. Za vsako okence v tabeli izračunamo razhajanje stvarnih in pričakovanih frekvenc in seštejemo za vsa okenca: Ta vrednost se porazdeljuje v χ 2 porazdelitvi. Dobljeno vrednost χ 2 primerjamo s kritično vrednostjo iz tabele. Poglejmo, kakšni so možni izidi χ 2 -preizkusa. 1. χ 2 < χ 2 (α = 0,05) Vrednost χ 2 ni statistično pomembna. Hipoteze neodvisnosti ne zavrnemo. O povezanosti med spolom in stališčem v osnovni množici ne moremo trditi ničesar. To bi lahko v vsakdanjem govoru opisali tako: razhajanje med stvarnimi in pričakovanimi frekvencami je premajhno in ne moremo ničesar trditi o osnovni množici (ne upamo zavrniti hipoteze neodvisnosti). 2. χ 2 χ 2 (α = 0,05) Vrednost χ 2 je statistično pomembna na ravni α=0,05. Hipotezo neodvisnosti zavrnemo s tveganjem 5%. Sprejmemo nasprotno hipotezo. Dokazali smo, da sta spol in stališče v osnovni množici odvisna. To bi lahko v vsakdanjem govoru opisali tako: razhajanje med stvarnimi in pričakovanimi frekvencami je zadosti veliko in lahko trdimo, da stvarnost ni takšna kot trdi hipoteza neodvisnosti.

3. χ 2 χ 2 (α = 0,01) Vrednost χ 2 je statistično pomembna na ravni α=0,01. Hipotezo neodvisnosti zavrnemo s tveganjem 1%. Sprejmemo nasprotno hipotezo. Dokazali smo, da sta spol in stališče v osnovni množici odvisna. 4. χ 2 χ 2 (α = 0,001) Vrednost χ 2 je statistično pomembna na ravni α=0,001. Hipotezo neodvisnosti zavrnemo s tveganjem 0,1%. Sprejmemo nasprotno hipotezo. Dokazali smo, da sta spol in stališče v osnovni množici odvisna. Število prostostnih stopinj določimo iz števila vrstic in stolpcev v tabeli. Pri štetju vrstic in stolpcev upoštevamo le tisti del tabele, v katerem so osnovni podatki. Vrstic in stolpcev z vsotami ne štejemo (spodaj skupaj in desno skupaj). Število prostostnih stopinj izračunamo po obrazcu: g = (a-1) (b-1) a-število kategorij prve spremenljivke (npr.število vrstic) b-število kategorij druge spremenljivke (npr.število stolpcev) S tem številom iščemo kritične vrednosti v χ 2 -tabeli. Izračunano vrednost χ 2 primerjamo s kritičnimi vrednostmi, kot smo že prej pokazali. 8.4.2.1 Pričakovane frekvence V opisu postopka smo pokazali, kako določimo pričakovane frekvence v obliki odstotkov. Računanje odstotnih frekvenc je nepotrebno delo, zato bomo pri izračunavanju vrednosti χ 2 določili in uporabili običajne pričakovane frekvence (absolutne). Pričakovano frekvenco za neko okence izračunamo tako, da zmnožek vsote na desnem koncu vrstice in vsote na dnu stolpca delimo z numerusom. Tako dobljena vrednost je pričakovana frekvenca za to okence. To naredimo za vsa okenca. Pokažimo postopek za vseh šest okenc tabele. Tabela 90. Računanje pričakovanih frekvenc izračun prva vrstica, prvi stolpec 62x60:152 = 24,47 prva vrstica, drugi stolpec 62x31:152 = 12,64 prva vrstica, tretji stolpec 62x61:152 = 24,88 druga vrstica, prvi stolpec 90x60:152 = 35,53 druga vrstica, drugi stolpec 90x31:152 = 18,36 druga vrstica, tretji stolpec 90x61:152 = 36,12 Sedaj pričakovane frekvence vnesemo v tabelo in izračunamo vrednost χ 2.

Tabela 91. Pričakovane frekvence sem za vseeno sem proti skupaj ženske 24,47 12,64 24,88 62 moški 35,53 18,36 36,12 90 skupaj 60 31 61 152 število prostostnih stopinj je g = (3-1) (2-1) = 2 χ 2 = 6,39 > χ 2 (α = 0,05; g = 2) = 5,99 Dobljeni χ 2 je statistično pomemben na ravni 0,05 in s tveganjem 5% zavrnemo hipotezo neodvisnosti. Spremenljivki sta v osnovni množici odvisni. 8.4.2.2 Kratek način računanja vrednosti χ 2 Izračunavanje vrednosti χ 2 s pomočjo vseh pričakovanih frekvenc je nepotreben ovinek. Potreben je pri spoznavanju postopka, saj kaže na kakšen način vrednost χ 2 meri razhajanje med pričakovanimi in stvarnimi frekvencami. Postopek izračunavanja lahko skrajšamo in takoj dobimo vrednost χ 2. Potrebujemo le tabelo s stvarnimi frekvencami. V vsakem okencu kvadriramo stvarno frekvenco ter kvadrat delimo z vsoto vrstice in z vsoto stolpca. Dobljeno vrednost shranimo v spomin (takšen spomin ima vsak kalkulator - seštevalni spomin, M+). To naredimo za vsa okenca, prikličemo vsoto vseh shranjenih členov, od te vsote odštejemo vrednost 1 in ostanek pomnožimo z numerusom. Dobljena vrednost je χ 2. Pokažimo za našo tabelo: Tabela 92. Računanje vrednosti χ 2 izračun 18 2 :62:60= M+ 12 2 :62:31= M+ 32 2 :62:61= M+ 42 2 :90:60= M+ 19 2 :90:31= M+ 29 2 :90:61= M+ RM 1 x 152 = 6,39 = χ 2 χ 2 = 6,39 > χ 2 (α = 0,05; g = 2) = 5,99 Dobljeni χ 2 je statistično pomemben na ravni 0,05 in s tveganjem 5% zavrnemo hipotezo neodvisnosti. Spremenljivki sta v osnovni množici odvisni.

8.4.2.3 Poročanje o preizkusu pri računalniški obdelavi Poročilo o izidu preizkusa mora vsebovati vse, kar bralec potrebuje za pravilno razumevanje interpretacije. V novejšem času raziskovalci skoraj brez izjeme uporabljajo za obdelavo podatkov računalniške programe. Ti programi prikazujejo izide nekoliko drugače, kot smo videli pri razlagi preizkusa. Računalnik za preizkus ničelne hipoteze ne potrebuje tabele, ampak uporablja kar enačbo χ 2 porazdelitve. Namesto primerjave s kritičnimi vrednostmi dobimo natančno izračunano raven statistične pomembnosti. Prikazali bomo nekaj primerov računalniških zapisov (iz obdelave narejene s SPSS programom): Tabela 93. Računalniški izpisi χ 2 -preizkusa vrednost χ 2 prostostne stopinje g raven statistične pomembnosti ali P 1 26,35 9 0,0020 2 25,73 12 0,0120 3 7,44 10 0,6832 4 32,00 4 0,0000 5 17,24 10 0,0691 6 2,67 2 0,2641 7 4,00 1 0,0462 8 7,67 5 0,1761 Prvi χ 2 je statistično pomemben na ravni =0,0020 in s tveganjem 0,20% zavrnemo hipotezo neodvisnosti. Drugi χ 2 je statistično pomemben na ravni =0,0120 in s tveganjem 1,20% zavrnemo hipotezo neodvisnosti. Tretji χ 2 ni statistično pomemben; tveganje za zavrnitev hipoteze bi znašalo več kot 68%, kar je seveda veliko preveč. Četrti χ 2 je statistično pomemben vsaj na ravni =0,0000 in je tveganje za zavrnitev hipoteze neodvisnosti manjše celo od 0,00%. Peti χ 2 ni statistično pomemben; tveganje za zavrnitev hipoteze neodvisnosti bi znašalo 6,91%. Šesti χ 2 tudi ni statistično pomemben; tveganje za zavrnitev hipoteze bi znašalo 26,41%. Sedmi χ 2 je statistično pomemben na ravni 0,0462 in s tveganjem 4,62% zavrnemo hipotezo neodvisnosti. Osmi χ 2 ni statistično pomemben; tveganje za zavrnitev hipoteze bi znašalo več kot 17%. Običajno pri izpisih z večjim številom preizkusov v rubriki»raven statistične pomembnosti«z rdečim svinčnikom zaokrožimo vse vrednosti 0,05 ali manj. Tam, kjer je raven statistične pomembnosti 0,05 ali manj, zavrnemo hipotezo neodvisnosti; tam, kjer je vrednost večja od 0,05, pa hipoteze neodvisnosti ne zavrnemo. V končnem poročilu navedemo vse tri vrednosti: vrednost χ 2, število prostostnih stopinj in raven statistične pomembnosti. Tako poročamo tudi, kadar ne zavrnemo ničelne hipoteze. Ker χ 2 - preizkus vedno spremlja tudi tabela s stvarnimi frekvencami, nam ni treba posebej navajati numerusa vzorca. Če objavljamo rezultate raziskave v reviji in imamo na voljo omejeno število strani, se pogosto odpovemo tabeli takrat k naštetim rezultatom dodamo še numerus vzorca. To še zlasti pride v poštev, ko so tabele res obsežne (npr. šest-sedem vrstic in tudi toliko stolpcev). Za raven statistične pomembnosti se uporabljata dva simbola: in P. V knjigi smo povsod dali prednost simbolu. Pri nas označujemo število prostostnih stopinj s simbolom g, pri

uporabi računalniških programov pa se v izpisih pojavlja angleška kratica df (degrees of freedom). 8.4.3 Pogoj za uporabo χ 2 -preizkusa Ta preizkus je eno najbolj univerzalnih statističnih orodij. Da bi ga lahko uporabili, ni nobenih zahtev glede vrste spremenljivk. Ker v preizkusu lahko nastopajo same nominalne spremenljivke, je uporaben tudi za vse ostale vrste spremenljivk. Res je, da ga redko uporabljamo za številske spremenljivke, saj imamo zanje boljše metode. Pri opisnih spremenljivkah pa je mnogokrat edina izbira. Skoraj bi lahko rekli, da je ta preizkus najbolj vsestransko uporabna statistična metoda. Za njegovo uporabo mora biti izpolnjen samo en pogoj. Pričakovane frekvence morajo biti pet ali več (ne smejo biti manjše od pet). Pogoj je zelo zahteven in nam pogosto zapre pot v raziskovanju. Zato se v praksi uporablja milejši pogoj: pričakovane frekvence so lahko manjše od pet, vendar takšnih frekvenc ne sme biti več kot 20% in nobena med njimi ne sme biti manjša od ena. Pozor: pogoj se nanaša na pričakovane frekvence in ne na stvarne. Stvarne v celicah tabele so lahko celo nič! 8.4.3.1 Ukrepi pri neizpolnjenih pogojih Poglejmo najprej teoretično, kdaj pogoj sploh ne more biti izpolnjen. Če naj bo v vsakem okencu pričakovana frekvenca pet, potem mora biti numerus vzorca pri tabeli 2x2 vsaj 20 (štiri okenca po najmanj pet), pri tabeli 2x3 mora biti vsaj 30 itd. Seveda to ne bo dovolj, saj se frekvence ne razporedijo enakomerno po okencih tabele (glej tabelo št. XX). Lahko se celo zgodi, da je numerus vzorca celo nekajkrat večji od teoretično minimalnega, pa so kljub temu nekatere pričakovane frekvence premajhne. Zato v praksi pogosto moramo ukrepati in uporabiti različne načine reševanja problema premajhnih frekvenc. Prva dva ukrepa sta preventivne narave. Uporabimo ju še pred zbiranjem podatkov. Toda, ne eden ne drugi, ne delujeta povsem zanesljivo. V večini primerov pa vendarle zaležeta. Že pri načrtovanju zbiranja podatkov moramo razmisliti o poznejši obdelavi podatkov. Če na vsak način želimo uporabiti χ 2 -preizkus, in vemo, da bomo imeli, npr. le petdeset anketirancev, moramo skrbno načrtovati velikost tabel. Če bo imela neodvisna spremenljivka tri kategorije (npr. stopnje izobrazbe), odvisna pa pet kategorij (npr. stališče), bo tabela imela 3x5=15 okenc. Petdeset ljudi se v petnajstih okencih ne more niti teoretično porazdeliti tako, da bi bile pričakovane frekvence večje od pet. Povrhu se odgovori ne porazdeljujejo enakomerno po okencih. Pri takšnem vzorcu bi oblikovali anketno vprašanje o stališču tako, da bi imeli le tri kategorije. Namesto npr. željenih odgovorov: zelo se strinjam, strinjam se, vseeno mi je, ne strinjam se ter nikakor se ne strinjam, bi dali le tri: strinjam se, mi je vseeno in ne strinjam se. Bolje bi bilo imeti več kategorij, toda če ostanemo pri večjem številu kategorij, na koncu ne bo možno uporabiti preizkusa. In včasih se moramo nečemu odpovedati. Drugi ukrep je boljši od prvega, a je bolj zahteven. Pred anketiranjem si zagotovimo zadosti velik vzorec in s tem zmanjšamo možnosti nastopa premajhnih pričakovanih frekvenc. Običajno računamo tako: število okenc, krat pet anketirancev in krat faktor tri do pet. Če vemo, da bo tabela imela petnajst okenc, bi si poskušali zagotoviti 15x5x3=225 ali celo 15x5x5=375 anketirancev. Vendar niti to ne zaleže prav vedno. Nič nam ne pomaga velik numerus vzorca (število anketirancev), če je neka kategorija zelo maloštevilna. Takrat bodo v

celi kategoriji premajhne pričakovane frekvence. Pokažimo na preprostem primeru. Raziskujemo obolevanje za otroškimi boleznimi (norice itd.). Lahko imamo tudi nekaj tisoč anketirancev v vzorcu, a npr. odgovor norice sem prebolel v starosti nad 40 let obkroži samo nekaj oseb (ker je to zares redkost). V vseh ostalih kategorijah lahko imamo veliko»preveč«anketirancev, a to nič ne pomaga. Cela ta kategorija v tabeli bo imela premajhne frekvence. Naslednji ukrepi pridejo v poštev, ko smo podatke že zbrali in sestavili tabelo. So vsebinsko slabši od prejšnjih, a večinoma bolj učinkoviti. Tretji ukrep pri premajhnih pričakovanih frekvencah je združevanje sorodnih kategorij. Če imamo v tabeli šolske ucene učencev in v kategoriji odličnjakov nastopajo prenizke frekvence, združimo kategoriji prav dobri in odlični. S tem se vse frekvence (stvarne in pričakovane) povečajo. Ta ukrep zmanjšuje tabelo; manjša tabela pa pomeni manj informacij in slabše izkoriščene podatke. Kategorij ne združujemo brez temeljitega premisleka: združujemo najmanj kolikor je potrebno, da dosežemo zahtevane pogoje. Na tako zmanjšani tabeli opravimo preizkus in interpretiramo rezultate. Pri nominalnih spremenljivkah kategorije večinoma niso sorodne in jih ne moremo združevati. Kadar je cela kategorija v tabeli (vrstica ali stolpec) maloštevilna, jo lahko v celoti izpustimo iz tabele in opravimo preizkus na zmanjšani tabeli. Vendar to ni dober ukrep in ga lahko uporabimo le v sili. Črtanje kategorije pomeni popolno izgubo tistih informacij, ki jih je vsebovala črtana kategorija). Pri združevanju kategorij (ali tudi pri črtanju) se lahko zgodi da dobimo najmanjšo možno tabelo 2x2 a pogoji še vedno niso izpolnjeni. Takrat uporabimo preizkus z Yatesovim popravkom (seveda tudi, če smo že od začetka imeli tabelo 2x2). Popravljeno vrednost χ 2 izračunamo tako, da vsako razliko f E - f T pred kvadriranjem zmanjšamo v absolutnem znesku za 0,5. Ves ostali del χ 2 -preizkusa ostane enak. S tem sicer ne odpravimo premajhnih pričakovanih frekvenc. S tem se zmanjša končna vrednost χ 2, kar poveča previdnost v preizkusu. To hkrati pomeni manjšo možnost napačnih sklepov. To je edini ukrep pri katerem χ 2 -preizkus uporabimo, čeprav pogoji niso izpolnjeni. Če nobeden od opisanih ukrepov ne zaleže, lahko uporabimo kakšen nadomestni preizkus. Vendar nadomestni preizkusi nimajo takšne statistične moči kot χ 2 -preizkus. Zato tudi ta ukrep uporabljamo le, kadar ni druge možnosti. Eden od nadomestnih preizkusov je Kullbackov preizkus (glej Sagadin 1987, str. 358-360). 8.5 Koeficienti kontingence χ 2 -preizkusa hipoteze neodvisnosti ne moremo primerjati z korelacijskimi koeficienti, saj ima drugačno funkcijo. Funkcija je resda podobna, ni pa enaka. Obakrat gre za ugotavljanje povezanosti. Vendar nam χ 2 -preizkus pokaže samo ali sta spremenljivki v osnovni množici odvisni. Iz preizkusa se ne vidi kako močna je njuna odvisnost. Potrebujemo mero, ki bo kazala stopnjo povezanosti. Dobimo jo iz vrednosti χ 2. Vrednost χ 2 temelji na stopnji razhajanja med stvarnimi in pričakovanimi frekvencami. Čim bolj se te razhajajo, tem večja je povezanost med spremenljivkama v vzorcu. Na posreden način je že vrednost χ 2 kazala stopnjo povezanosti. Koeficiente povezanosti med opisnimi spremenljivkami bomo imenovali kontingenčni koeficienti. Preizkus χ 2 bo kazal ali obstaja povezanost med spremenljivkama, koeficienti kontingence pa kako močna je ta povezanost. Vendar je med kontingenčnimi koeficienti in χ 2 preizkusom še ena velika razlika. Preizkus χ 2 se nanaša na povezanost spremenljivk v osnovni množici. Čeprav je izpeljan iz podatkov vzorca, odgovarja samo na vprašanje o osnovni množici (kot sicer vsi preizkusi ničelnih

hipotez). V raziskavi, ki ni vzorčna, uporaba χ 2 preizkusa nima nobenega smisla. Toda tudi v takšni raziskavi lahko izračunamo vrednost χ 2, iz nje pa koeficient kontingence. Kontingenčni koeficient se, namreč, nanaša na skupino, ki je v tabeli. To pomeni, da kontingenčne koeficiente lahko uporabimo v vsaki raziskavi, χ 2 preizkus pa le v vzorčnih raziskavah. Če raziskava ni vzorčna in imamo v tabeli celo množico, bo kontingenčni koeficient veljal zanjo. Če pa raziskavo opravljamo na vzorcu in so v tabeli vzorčni podatki, se bo kontingenčni koeficient nanašal na ta vzorec! Če bi hoteli dobiti kontingenčni koeficient za osnovno množico, bi ga morali oceniti na podlagi dobljenega (vzorčnega) iz tabele. Izračunati bi morali interval zaupanja in šele ta bi se nanašal na osnovno množico. Prav tak postopek smo videli v poglavju o ocenjevanju Pearsonovega korelacijskega koeficienta. Vendar pa postopke ocenjevanja kontingenčnih koeficientov zares redko uporabljamo. Zadovoljimo se kar z vrednostjo koeficienta za vzorec. Vrednost χ 2 lahko izračunamo kadarkoli, celoten χ 2 preizkus pa je smiseln le, kadar posplošujemo na osnovno množico. V raziskavi, ki ni vzorčna, uporaba χ 2 preizkusa nima nikakršnega smisla. 8.5.1 Pearsonov kontingenčni koeficient Iz vrednosti χ 2 lahko izračunamo kontingenčni koeficiente, ki kažejo stopnjo povezanosti podobno kot korelacijski keficienti. Koeficientov kontingence je več, najpogosteje uporabljamo Pearsonov kontingenčni koeficient. Vrednosti koeficienta so med 0 in 1 in jih interpretiramo podobno kot korelacijske koeficiente. Pri opisnih spremenljivkah dobimo nasploh nižje stopnje povezanosti kot pri številskih. Zato običajno že nižje vrednosti kontingenčnih koeficientov interpretiramo kot opazno stopnjo povezanosti. Še zlasti to velja za Pearsonov kontingenčni koeficient. Drugo razliko v interpretaciji povzroča dejstvo, da kontingenčni koeficienti nimajo predznaka. Pri nominalnih spremenljivkah to ni težava, saj sploh ne obstaja pojem negativne ali pozitivne smeri. Pri ordinalnih spremenljivkah pozitivna in negativna smer obstajata, a koeficient smeri ne pokaže. Zato je treba pazljivo pregledati frekvence v tabeli in iz njih presoditi o smeri. Za primer iz tabele št. XY (kjer smo preizkušali hipotezo o neodvisnosti med spolom in stališčem), je vrednost Pearsonovega koeficienta C = 0,20. Pri korelacijskem koeficientu bi takšno vrednost interpretirali kot zanemarljivo, pri kontingenčnem pa štejemo, da vendarle kaže na opazno povezanost. Za interpretacijo smeri potrebujemo tabelo s strukturnimi odstotki. Tabela 94. Strukturni odstotki po stališču (posebej za vsak spol) sem za vseeno sem proti skupaj ženske 29,0 19,3 51,6 100,0 moški 46,7 21,1 32,2 100,0 skupaj 39,5 20,4 40,1 100,0

Pri manjših tabelah že kratek pogled na tabelo zadosti dobro kaže smer. Moški veliko bolj soglašajo kot ženske; hkrati je pri moških malo več takšnih, ki niso izrazito ne za ne proti. Seveda potem zadnji stolpec kaže, da so ženske veliko bolj proti kot moški. Pri večjih tabelah moramo pogosto primerjati cele stolpce (drugega za drugim). Tako bi najprej primerjali vse odstotke v prvem stolpcu. V naši tabeli sta v prvem stolpcu samo dva: 29,0% in 46,7%. Skoraj polovica moških je izbrala odgovor»sem za«, pri ženskah pa komaj nekaj več kot četrtina. Enako naredimo še za ostale stolpce; iz vseh stolpcev na koncu ustvarimo celovito sliko smeri povezanosti. Tabele absolutnih frekvenc ne omogočajo dobre interpretacije; interpretiramo predvsem odstotne frekvence. Največjo težavo pri interpretaciji Pearsonovega kontingenčnega koeficienta predstavlja njegova odvisnost od velikosti tabele. Tudi pri popolni povezanosti med spremenljivkama koeficient ne doseže vrednosti ena. To doseže šele na neskončno veliki tabeli; to pomeni takrat, ko je število kategorij spremenljivke neskončno. Poglejmo to podrobneje. Za naš primer s spremenljivkama spol in stališče si zamislimo, da so vse ženske izbrale odgovor sem proti, vsi moški pa odgovor sem za. Povezanost med spremenljivkama je popolna (samo od spola je odvisno, kakšni so odgovori!). V tem primeru bi imeli takšno tabelo stvarnih frekvenc: Tabela 95. Frekvence po spolu in stališču sem za vseeno sem proti skupaj ženske 0 0 62 62 moški 90 0 0 90 skupaj 90 0 62 152 C=0,71 Čeprav je povezanost popolna, je kontingenčni koeficient»zgolj«c = 0,71. Če ne bi vedeli za ta pojav, bi koeficient napačno interpretirali, češ:»povezanost je precej visoka«. V resnici je povezanost najmočnejša možna (popolna). O maksimalni vrednosti kontingenčnega koeficienta odloča manjše število kategorij v tabeli. V vseh tabelah, kjer ima ena spremenljivka dve kategoriji, je maksimalna vrednost 0,707 (ne glede na to, koliko kategorij ima druga spremenljivka). Težave nastanejo takrat, ko primerjamo koeficiente iz različno velikih tabel. Najpogosteje se tem primerjavam nikakor ne moremo odpovedati. Ko raziskujemo, npr. s čem so povezana stališča, bomo imeli v eni tabeli neodvisno spremenljivko spol (dve kategoriji), v drugi izkušnje (npr. tri kategorije), v tretji izobrazbo (npr. pet kategorij) in tako dalje. V interpretaciji želimo primerjati dobljene kontingenčne koeficiente. Še večje težave bomo imeli, kadar primerjamo svoje rezultate z rezultati iz neke druge raziskave. Podobni ali celo isti pojavi so v različnih raziskavah merjeni z drugačnimi instrumenti, število kategorij pa je lahko zelo različno. Potrebujemo koeficient povezanosti, ki ne bo imel te pomanjkljivosti. Dobimo ga tako, da delimo dobljeni Pearsonov kontingenčni koeficient z njegovo maksimalno vrednostjo.

Tako dobimo korigirani Pearsonov kontingenčni koeficient C C. Korigirani koeficienti so med seboj primerljivi. Vendar jih ne moremo primerjati z nekorigiranimi. Torej v praksi uporabljamo ali prve, ali pa druge; obojih hkrati ne. 8.5.2 Cramérjev koeficient Kadar so nam pomembne primerjave med različnimi tabelami, lahko izberemo Cramérjev koeficient. Postopek izračunavanja zagotavlja neodvisnost od velikosti tabele in s tem primerljivost koeficientov iz različnih tabel. Kljub temu, da Cramérjevi koeficienti lahko dosežejo vrednost 1, so večinoma njihove vrednosti manjše od vrednosti C. Zato koeficienta nista primerljiva in ju ne moremo hkrati uporabljati in interpretirati. Če se odločimo za uporabo Cramérjevih koeficientov, potem uporabljamo samo te. 8.5.3 Koeficient Za tabelo 2x2 dobi obrazec za Cramérjev koeficient enostavnejšo končno obliko. Ta koeficient ima posebno ime: -koeficient. Ker je to v resnici Cramérjev koeficient, ga podobno tudi interpretiramo. Primerjave so veljavne predvsem, če uporabljamo te dvoje koeficiente hkrati. S Pearsonovimi je tudi koeficient slabo primerljiv. 8.6 Napake pri ocenjevanju parametrov in preizkušanju hipotez Vsi statistični postopki posploševanja z vzorcev na osnovne množice so povezani s tveganjem. Brez tveganja ne gre. Zaradi tega lahko pride do napačnih sklepov. Vir teh napak je tveganje. Čeprav so viri enaki, so napake in njihove posledice pri ocenjevanju parametrov drugačne kot pri preizkušanju hipotez. 8.6.1 Ocenjevanje parametrov Pri ocenjevanju parametrov postavimo trditev, da je parameter osnovne množice v intervalu zaupanja. Pri tem tvegamo, da to morda ne drži. Napaka, ki se nam lahko zgodi je, da parameter osnovne množice res ni v intervalu zaupanja. Torej, naša ocena ne drži. Zakaj se to lahko zgodi? Interval zaupanja smo oprli na verjetnost, da je izbrani vzorec eden od tistih

(npr. 95%), katerih parameter odstopa od populacijskega za največ tp SE (pri velikih vzorcih je na tem mestu namesto vrednosti tp vrednost z=1,96). Vendar vemo, da je med vsemi vzorci tudi 5% takšnih, za katere to ne velja. Če smo naleteli pri izbiri vzorca na enega takšnih, bo naša ocena nepravilna: parameter osnovne množice ne bo v intervalu zaupanja. Verjetnost takšnega dogodka je torej majhna, toda zgodi se lahko! In če stalno ocenjujemo s petimi odstotki tveganja, se nam bo to zares dogajalo v približno petih odstotkih primerov. Če nismo pripravljeni sprejeti tega tveganja, se moramo odpovedati vzorcem in pojave raziskovati na celih množicah. 8.6.2 Preizkusi ničelnih hipotez Pri preizkušanju hipotez se lahko zgodita dve napaki. Imenujemo jih napake I. vrste in napake II. vrste (tudi alfa napake in beta napake). Pojasnili jih bomo na primeru hi-kvadrat preizkusa hipoteze o neodvisnosti. Napaka prve vrste se lahko zgodi pri zavrnitvi hipoteze neodvisnosti. Če ničelno hipotezo zavrnemo, v resnici pa je pravilna, je to napaka I. vrste ali alfa napaka. Pravilnost hipoteze neodvisnosti pomeni, da sta v osnovni množici spremenljivki neodvisni. Toda, tudi iz takšnih množic lahko dobimo vzorec, pri katerem vrednost χ 2 presega kritično vrednost za 5% tveganja. Takšnih vzorcev je največ 5%, zato se napaka prve vrste ne zgodi pogosto; občasno se pa vendarle zgodi. Te napake imenujemo alfa napake, ker je njihova verjetnost enaka vrednosti α. Napake I. vrste imajo lahko zelo hude posledice, saj je v primeru, ko se nam to zgodi, naša trditev popolnoma napačna. Zato je največje dopustno tveganje pri zavrnitvi ničelne hipoteze 5% (to je tudi največja verjetnost, da pride do napake I. vrste). Napaka druge vrste se lahko zgodi, ko hipoteze neodvisnosti ne zavrnemo. Če je ne zavrnemo, a je v resnici nepravilna, je to napaka II. vrste ali beta napaka. Torej sta v osnovni množici spremenljivki odvisni, mi pa nismo zavrnili hipoteze neodvisnosti. Verjetnost te napake je 95% ali še več. Tako velika verjetnost za napake II. vrste je možna, ker te napake nimajo skoraj nobenih praktičnih posledic. Ko hipoteze neodvisnosti ne zavrnemo, ne trdimo o osnovni množici nič. In če nič ne trdimo, tudi kakšne vsebinske napake ne moremo zagrešiti. Če se že zgodi napaka II. vrste, nam je lahko žal, da nismo zavrnili hipoteze neodvisnosti (saj bi jo lahko v resnici zavrnili) in da o osnovni množici nismo ničesar ugotovili. To je škoda, ni pa to stvarna napaka. Povezanost alfa in beta napak Zmanjševanje verjetnosti za napake I. vrste povečuje verjetnost nastopa napak II. vrste in obratno. Poglejmo podrobneje: Običajno zavračamo hipoteze pri kritičnem pragu 0,05. Verjetnost nastopa napake I. vrste je 5% in verjetnost nastopa napake II. vrste je 95%. Če bi se odločili, da bomo zavračali hipoteze šele ko vrednost χ 2 preseže kritično vrednost za =0,01, bi zmanjšali možnost napak I. vrste na 1%, a hkrati povečali možnost napak II. vrste na 99%. Če bi se odločili, da bomo zavračali ničelne hipoteze šele ko vrednost χ 2 preseže kritično vrednost za =0,001, bi zmanjšali možnost napak I. vrste na 0,1%, a hkrati povečali možnost napak II. vrste na 99,9%. Zato večinoma ostajamo pri kritični vrednosti α=0,05. To je kompromis med verjetnostjo nastopanja obojih napak.

Premislek o povezanosti verjetnosti za alfa in beta napake morebiti vsiljuje naslednji sklep: Torej vedno naredimo napako: če ne naredimo alfa napake, naredimo beta napako in obratno!??? Vendar je ta sklep popolnoma napačen! Zakaj je napačen? Saj se zdi, da seštete verjetnosti za napake vedno dajo 100%. Napaka v premisleku je v tem, da razmišljamo o verjetnosti napak abstraktno, ko še nismo naredili preizkusa (in sta še možna oba izida!). Vsak konkretni preizkus se na koncu konča samo z enim izidom: ali ničelno hipotezo zavrnemo ali je ne zavrnemo. Zato verjetnosti ne smemo seštevati. Pojasnimo to preprosto: Če ničelno hipotezo zavrnemo, se lahko zgodi le alfa napaka (ali pa se NE zgodi). Če ničelne hipoteze ne zavrnemo, se lahko zgodi le beta napaka (ali pa se NE zgodi). Vidimo torej, da je možno tudi NE.