Bomeetra Enam ku kahe populatsoon keskväärtuste võrdlemne dspersoonanalüüs Enam ku kahe grup keskmste võrdlus H 0 : 1 = 2 = = k H 1 : leduvad sellsed grupd,j, et Eeldustel, et j uurtav (sõltuv) tunnus on normaaljaotusega ja uurtava tunnuse vareeruvus võrreldavas gruppdes on ühesugune, on rakendatavaks analüüsmeetodks dspersoonanalüüs. Dspersoonanalüüsl jagatakse tunnused vastavalt nende rollle kaheks: tunnus, mlle keskms võrrelda soovtakse, on uurtav tunnus e funktsoontunnus (lehma pmatoodang, forell kasvukrus, talle mass, sea pekpaksus, jne); (dskreetne võ mttearvulne) tunnus, mlle väärtuste alusel võrreldavad grupd moodustatakse, on faktortunnus (tõug, lüpsseade, laudatüüp jne). Dspersoonanalüüs tulemuste tõlgendamsel räägtakseg enamast faktortunnuse mõjust uurtavale tunnusele. Näteks, tõu võ lüpsseadme võ laudatüüb vm mõju pmatoodangule, kasvanduse mõju forellde kasvukrusele, omanku mõju talle massle, genotüüb (teatud geenkombnatsoonde) mõju sgade pekpaksusele jne. Tanel Kaart, Mrjam Vallas 1
Dspersoonanalüüs mudel Igat grupp (kus =1,,k) seloomustab keskmne uurtava tunnuse väärtus, mstõttu mõõtmstulemused saab estada mudelga yj j, kus y j on uurtava tunnuse väärtus. grupp kuuluval j. objektl ja ε j on juhuslk mõju (objekt omapära). Näteks EPK-tõugu lehm Meel 1. laktatsoon pmatoodang 6715 kg on väljendatav ku uurtud EPK-tõugu lehmade 1. laktatsoon keskmse toodangu μ EPK =7850 kg ja Meel tõussese ernevuse ε EPK,Meel = 1135 kg summa. EPK Meel μ EPK = 7850 kg ε EPK,Meel = 1135 kg 5000 6000 7000 8000 9000 10000 Dspersoonanalüüs tööpõhmõte Dspersoonanalüüs tööpõhmõte sesneb uurtava tunnuse grupssese (nn k n 2 juhuslku) vareeruvuse SSE ( y ) 1 j 1 j y ja gruppde vahelse (faktor mõjust tngtud) vareeruvuse k SSA n ( ) 1 y y võrdlemses ku gruppde vahelne ernevus on suurem ku grupssene ernevus, on tegu lmse tõendga faktortunnuse mõju olemasolu kohta. St ka analüüs nmetus dspersoonanalüüs [analyss of varance, ANOVA]. y EK y EPK y RHF EHF EPK RHF EK 2 Näde. EK, EPK, RHF, EHF y y EHF 5000 6000 7000 8000 9000 10000 11000 12000 Tanel Kaart, Mrjam Vallas 2
Dspersoonanalüüs tabel Dspersoonanalüüsga seotud arvutused koondatakse tavalselt alljärgnevasse nn. dspersoonanalüüs tabelsse. Vareeruvuse allkas summa astmed tõenäosus Hälvete ruutude Vabadus- Keskruut F-suhe Olulsus- Faktor SSA MSA k 2 n k 1 F p 1 ( yy) MSA SSA k 1 MSE SSE Vga k n ( ) 2 y n k 1 j 1 j y MSE SSE n k SS SSASSE Kokku k n ( ) 2 y n 1 1 1 j y j Juhul, ku faktortunnuse mõjule vastav keskmne gruppde vahelne vareeruvus MSA on suurem, ku uurtavate objektde omapärale vastav keskmne gruppde ssene vareeruvus MSE, on F-statstku väärtus ühest suurem. Psavalt suure F-suhte väärtuse korral võb lugeda tõestatuks ssuka hüpotees leduvad vähemalt 2 tenetesest selgelt erstuvat grupp. Dspersoonanalüüs Näde. Uurtakse ühes katsefarms peetava 121 lehma 1. laktatsoon pmatoodangu sõltuvust tõust. y EK y EPK y RHF EHF EPK RHF EK y EHF y 5000 6000 7000 8000 9000 10000 11000 12000 Vareeruvuse allkas ruutude summa astmete arv p Hälvete Vabadus- Keskruut F-suhe Tõug 47330434 3 15776811 9,053 0,000019 Vga 203894493 117 1742688 Kokku 251224927 120 < 0,05 => H 1 : tõul on mõju Tanel Kaart, Mrjam Vallas 3
Dspersoonanalüüs Juhul, ku võrreldavad gruppe on vad kaks, on dspersoonanalüüs tulemused dentsed võrdsete dspersoonde eeldusel läb vdud t-testga. Näde. Võrreldakse kahest ernevast tõust sgade ööpäevast juurdekasvu. Andmed: Ööpäevane juurdekasv (g) Tõug 1 520 550 560 530 Tõug 2 630 690 700 680 MS Excel protseduurde t-test: Equal Varances ja Anova: Sngle Factor väljatrükd. p < 0,05 => ernevat tõugu sead kasvavad erneva krusega Keskväärtuste võrdlemne Keskväärtuste võrdlemne 1 grup keskmse võrdlus konstandga H 0 : = c H 1 : c Usaldusprd; normaaljaotuse eeldusel t-test; suurte valmte (n>60) võ teadaoleva dspersoon σ 2 korral z-test 2 grup keskmste võrdlus H 0 : 1 = 2 H 1 : 1 2 t-test (kolm ernevat!), eeldused: uurtav tunnus normaaljaotusega (võ suur valm); teadaolevate dspersoonde σ 12 ja σ 22 korral z-test 3 võ enama (k) grup keskmste võrdlus H 0 : 1 = 2 = = k H 1 : leduvad,j: j Dspersoonanalüüs, eeldused: uurtav tunnus normaaljaotusega, uurtava tunnuse vareeruvus võrreldavas gruppdes ühesugune Tanel Kaart, Mrjam Vallas 4
Mtmene võrdlus Võrdleme näteks 4 grupp, lubades ga ükskvõrdluse puhul eksmst 5% tõenäosusega. α=0,05 α=0,05 α=0,05 α=0,05 I II III IV Tõenäosus, et ükskvõrdlusel vga e tehta, on 1 α =0,95. α=0,05 α=0,05 Tõenäosus, et kuuel ükskvõrdlusel kokku e eksta, on (1 α) 6 =0,95 6 0,735. Mstõttu tõenäosus teha üks (võ mtu) vale otsus(t) 4 grup paarkaupa võrdlemsel on 1 0,735=0,265 (eksmse tõenäosus on üle 25%!). Bonferron meetod: pramaks k ükskvõrdluse puhul ühe võ enama vea tegemse tõenäosust olulsuse nvooga α, tuleb kõgl ükskvõrdlustel võtta olulsuse nvooks α/k. Näteks 4 grup võrdlemsel, garanteermaks kuue võrdluse peale kokku eksmst mtte üle 5%-lse tõenäosusega, tuleb ükskvõrdlustel võtta olulsuse nvooks α * =α/k=0,05/6 0,0083. Dspersoonanalüüs mudel Faktortunnuse mõju uurmseks estatakse mudel kujul yj j, kus μ tähstab üldkeskmst ja α on faktor. taseme poolt põhjustatud kõrvalekalle üldkeskmsest (. taseme mõju),. H 0 : 1 = 2 = = k H 0 : α 1 = α 2 = = α k = 0 H 1 : leduvad grupd,j, et j H 1 : ledub grupp, et α 0 Näteks EPK-tõugu lehm Meel 1. laktatsoon pmatoodang 6715 kg on väljendatav ku kõg uurtud lehmade keskmse 1. laktatsoon pmatoodangu μ =8468 kg, EPK-tõu mõju EHF (EPK-tõugu lehmade ε EPK,Meel α EPK EPK 1. laktatsoon keskmse RHF toodangu ernevus üldkeskmsest) α EPK = 618 Meel μ EPK EK kg ja Meel tõussese ernevuse ε EPK,Meel μ = 8468 kg = 1135 kg summa. 5000 6000 7000 8000 9000 10000 11000 12000 Tanel Kaart, Mrjam Vallas 5
Dspersoonanalüüs Näde. Uurtakse ühes katsefarms peetava 121 lehma 1. laktatsoon pmatoodangu sõltuvust tõust (EHF, RHF, EPK, EK). Kontrolltav hüpoteesde paar on kujul: H 0 : EHF = RHF = μ EPK = EK H 1 : leduvad tõugrupd,j, et j 2 2 Tõug n y ˆ s ˆ EHF 68 8929,9 1776652 RHF 20 8311,5 2265768 EPK 27 7850,1 1335053 EK 6 6549,3 1419571 Kokku 121 8468,1 2093541 H 0 : tõul e ole mõju H 1 : tõul on mõju Dspersoonanalüüs mudel on kujul yj j, kus μ on kõg farm lehmade keskmne 1. laktatsoon pmatoodang, α on. tõu keskmne ernevus sellest (. tõu mõju, = EHF, RHF, EPK, EK) nng y j ja ε j on vastavalt. tõugu j. lehma mõõdetud pmatoodang ja selle ernevus tõu keskmsest (lehma omapära, j=1,, n, n on lehmade arv. tõus). Tõugude mõjud on kõrvaloleva keskmste toodangute tabel alusel letavad kujul α EHF = 461,8 kg; α RHF = 156,6 kg; α EPK = 618,0 kg ja α EK = 1918,8 kg. Nende mõjude ernevuse kontrollmseks tuleb läb va dspersoonanalüüs [vmase eeldused dspersoonde võrdsuse ja normaaljaotuse (vt ka järgmne lk) osas on enamvähem tädetud]. Mtmefaktorlne dspersoonanalüüs Ku vaatlusobjekte saab rühmtada mtme tunnuse (faktortunnuse) järg, võb osutuda mõttekaks analüüsdag korraga mtme faktortunnuse mõju (näteks gal lehmal võb olla fkseertud tema tõug ja farm, gal kalal tema sugu ja püügkoht). Dspersoonanalüüs mudel, ms hõlmab kahe faktortunnuse mõjusd, on kujul: yjk j jk, kus μ tähstab üldkeskmst, α -d ja β j -d märgvad uurtava tunnuse keskmse muutust vastavalt esmese ja tese faktor väärtuste muutumsele (α on esmese faktor. taseme mõju ja β j on tese faktor j. taseme mõju), y jk nng ε jk on vastavalt esmese faktor. tasemel ja tese faktor j. tasemel soortatud k. mõõtmse väärtus nng selle ernevus sama väärtuste kombnatsoon keskmsest (vaatluse omapära, mudel vga). Tanel Kaart, Mrjam Vallas 6
Mtmefaktorlne dspersoonanalüüs Mks seda vaja on? 1) Hnnangute ja otsustuste täpsus võb paraneda. Illustratsoonks kaks samu andmed llustreervat hajuvusdagramm. (joonsed M. Möls konspektst) Osutub, et vaadeldes uurtava tunnuse väärtus homogeensete gruppde kaupa (faktor B järg), võb huvpakkuva faktor (A) mõju selgemalt esle tõusta. Mtmefaktorlne dspersoonanalüüs Mks seda vaja on? 2) Võmalk selgemalt väljendada uurtava tunnuse ja faktorte vahels seosed. 3) Interaktsoond e koosmõjud uurtava tunnuse väärtused muutuvad ühe faktor tasemete vahel ernevalt, sõltuvalt tese faktor väärtustest. 4) Ilma e pruug mudel olla korrektne (jääklge e puug olla normaaljaotusega). Seljepek paksus 1 (õla kohal) 19 18 17 16 15 14 13 12 Sgade seljapek paksus 1 sõltuvalt söödast ja lauda tüübst Kahefaktorlne faktortevahelst nteraktsoon arvestav mudel estatakse kujul yjk j j jk, kus γ j märgb esmese faktor. taseme ja tese faktor j. taseme koosmõju. Eest Sööt Tavalne Külmlaut Välsmane Tanel Kaart, Mrjam Vallas 7
Mtmefaktorlne dspersoonanalüüs Näde. 80-st seast 40 peet tavalstes ja 40 vältngmustes. Mõlemast grupst pooled tapet kohalkus tapamajas (LP) ja pooltel eelnes parematele jahmaadele srdamsele stressrohke üle 200 klomeetrne transport auto ja praam abl (SLT). Seljapek paksus 3 50 40 30 20 10 0 Conventonal Out-door Tavalne Külmlaut LP Tapamaja SLT H 0 : mudel e ole parem võrreldes konstantse mudelga H 1 : mudel on parem võrreldes konstantse mudelga Hüpoteesde kontroll mudel ga faktor (ja nende kombnatsoon) kohta H 0 : a 1 = α 2 = = 0, H 1 : ledub, et a 0; H 0 : β 1 = β 2 = = 0, H 1 : ledub j, et β j 0; H 0 : γ 11 = γ 12 = = 0, H 1 : leduvad,j, et γ j 0. Tanel Kaart, Mrjam Vallas 8