Biometrija 1 Poglavje 1 MATRIČNI ZAPIS MODELA IN OSNOVE MATRIČNE OPERACIJE 11 Skalar Skalar je matrika reda 1 x 1 Skalarji so označeni z malimi ali velikimi navadnimi (neodebeljene) črkami kot npr y i j (odvisna slučajna spremenljivka), a i jk (vpliv živali kot naključni vpliv), β i (eden od nivojev pri sistematskemu vplivu), b (regresijski koeficient), x i jk (neodvisna spremenljivka), x i j (element v matriki X) ali c (konstanta) V oklepaju je omenjena ena od možnosti, ki jih bomo srečali pri biometriji Oznaka skalarja ni dovolj, da bi vedno prepoznali njegovo vlogo Pomembno je, da so uporabljene oznake obrazložene v vsakem primeru posebej, čeprav lahko pri običajnih, pogostih primerih o pomenu skoraj zanesljivo sklepamo 1 Vektor Definicija: Vektor je polje števil ali simbolov urejenih samo v eno vrstico in en stolpec Vektorji so matrike, ki imajo eno samo vrstico (vrstični vektorji) oziroma en stolpec (stolpični vektor) Pisali jih bomo z malimi odebeljenimi črkami npr y, u, a, x ali β Tako bomo označili stolpične vektorje Vrstični vektorji so pravzaprav transponirani stolpični vektorji (glej tudi 131) in jih bomo označili y, u, a, x ali β ali y T, u T, a T, x T ali β T Tam, kjer ne moremo uporabiti odebeljenih črk, uporabljamo lahko navadno pisavo, vektor pa podčrtamo z znakom ~, npr y 13 Matrika Definicija: Matrika je polje števil ali simbolov urejenih v vrstice in stolpce Označevali jih bomo z velikimi, odebeljenimi črkami kot npr X (matrika dogodkov za sistematske vplive), Q (matrika kvadratne oblike), A (matrika sorodstva), V fenotipskih matrika varianc in kovarianc To je le nekaj matrik, ki bodo imele pri biometriji poseben pomen Z oznakami A, B ali X pa lahko enostavno mislimo samo na matrike brey posebnega pomena Tako kot pri vektorjih je tudi pri matrikah pomemben opis, kaj matrika predstavlja Tam, kjer ne moremo uporabiti odebeljenih črk, uporabljamo lahko navadno pisavo, oznako za matriko pa podčrtamo z znakom ~ Matrika A na sliki 11 ima dve vrstici in štiri stolpce Vsebuje torej osem elementov Matrika ima svoje elemente razvrščene v stolpce in vrstice c 11 c 1 c 1c c 1 c c c C c r1 c r c rc [ b11 b B 1 b 13 b 14 b 1 b b 3 b 4 Matrika C ima r vrstic in c stolpcev (primer 11) Število vrstic in stolpcev določata red matrike Red matrike C je r x c Red matrike B je x 4 Če želimo red matrike, ga navedemo v indeksu matrike (1) A x4, C rxc, B x4 [1 [11
Biometrija A é 3 5 1ù ê ë 1 1 9 7 ú û vrstici stolpci element matrike
Biometrija 3 Pri kvadratnih matrikah (glej 131) lahko navedemo samo eno vrednost Matrika V (13) je matrika fenotipskih varianc in kovarianc, zato je kvadratna Ima 10 vrstic in 10 stolpcev V 10 [13 Posamezna števila ali simboli so elementi matrike Elemente matrike bomo poimenovali z malimi črkami ( bi j ) Indeksa i in j določata vrstico in stolpec, katerima element pripada Prvi indeks označuje vrstico, drugi stolpec brez ozira na črko Pri matrikah določamo tudi rang matrike: število neodvisnih vrstic in stolpcev 131 Posebne matrike a) Kvadratne matrike (primer 14) imajo toliko vrstic kot stolpcev 5 1 3 8 4 0 7 [14 b) Simetrične matrike (primer ) so kvadratne matrike, za katere velja a i j a ji 5 1 1 8 4 4 7 [ c) Diagonalne matrike (primer 16) so simetrične matrike, ki imajo od 0 različne elemente samo na diagonali Vsi nediagonalni elementi enake 0 D 5 0 0 0 8 0 0 0 7 [16 Diagonalno matriko lahko zapišemo tudi v obliki iz enačbe 17 D {d ii } [17 č) Identična matrika (primer 18) je diagonalna matrika, pri kateri so vsi diagonalni elementi enaki 1 Označimo jo z I, praviloma moramo omeniti oziroma določiti tudi red matrike I 1 0 0 0 1 0 0 0 1 [18 d) Ničelna matrika ima vse elemente enake 0 Označimo jo z 0, praviloma moramo določiti tudi red matrike 0 [ 0 0 0 0 0 0 0 0 [19 3
4 Biometrija e) Blok-diagonalna matrika je matrika, ki imajo vzdolž diagonale nanizane matrike Poglejmo si matriko R iz enačbe 110 Na diagonali imamo varianci za dve lastnosti, ki se izmenično izmenjujeta Večina nediagonalnih elementov je enaka 0, samo med dvema zaporednima vrsticama je nakazana kovarianca za ostanek med obema lastnostima (σ e1 e ) V nadaljevanju bomo nekoliko poenostavili poimenovanje za kovarianco (σ e1 ) Obe oznaki jo zadostno opišeta R σ e 1 σ e1 e σ e1 e σ e σ e 1 σ e1 e σ e1 e σ e σ e 1 σ e1 e σ e1 e σ e [110 Zamenjajmo torej zaradi enostavnosti oznako in poudarimo diagonalne matrike Mala diagonalna matrika ima dve vrstici in dva stolpca Je kvadratna in simetrična Vsebuje 3 komponente kovariance Matriko bomo poimenovali R 0 Vsebuje varianco za prv0 in drugo lastnost ter kovarianco, če sta meritvi opravljeni na isti živali [ σ e1 σ e1 σ e1 σ e R 0 [ σ e1 σ e1 σ e1 σ e [ σ e 1 R 0 σ e1 [111 σ e1 σ e Zaradi preglednosti lahko matriko 11 prepišemo tako, da namesto diagonalnih blokov navedemo kar matriko R 0 R 0 R 0 R0 [11 f) Transponirana matrika A (113) ima za stolpce vrstice iz matrike A Za oznako transponirano uporabljamo tudi črko T v eksponentu (A T ) [ 3 5 1 1 1 9 7 T 1 3 1 5 9 1 7 [113 g) Idempotentna matrika M je kvadratna in za njo velja M M Idepotentne matrike bomo omenjali pri kvadratnih oblikah, ki nam predstavlljajo vsote kvadratov 4
Biometrija 5 h) Delne matrike (ang submatrix) Matriko razcepimo na manjše matrike Običajno to naredimo glede na strukturo matrik Kasneje bomo spoznali zanimive matrike, kamor urejujemo informacije iz podatkov in porekla Delitev matrik lahko nakažemo s pikčastimi črtami [ A B C D [114 Kot primer navajamo matriko koeficientov (1) iz enačb mešanega modela V zgornjem levem kotu so zbrane informacije o sistematskem delu modela (X X), v spodnjem desnem kotu bom našli naključni del (Z Z + Iσ eσa ), nediagonalna dela (X Z in Z X) pa povezujeta sistematski in naključni del Pri našem delu bomo razčlenitev opravili predvsem zaradi preglednosti, čeprav je bolj pomembna pri izpeljavi posameznih enačb ali pri dokazih [ X X X Z Z X Z Z + Iσ eσ a [1 i) Trikotna matrika je kvadratna in ima od nič različne nediagonalne elemente samo nad ali pod diagonalo Tako ločimo spodnjo trikotno matriko (ang lower triangular matrix, 116) in zgornjo trikotno matriko (ang upper triangular matrix, 117) 1 1 1 3 [116 1 1 1 3 [117 j) Pozitivno definitne matrike so kvadratne, simetrične in imajo dominantno diagonalo S Cholesky razčlevitvijo (ang Cholesky decomposition) najdemo tako spodnjo trikotno matriko L, da je njen produkt s transponirano mariko L pozitivno definitna matrika A (ang positive definit matrix) Diagonalni elementi v matriki L so pozitivni in večji od nič A LL 4 1 1 14 1 1 1 3 1 1 1 3 [118 [119 Vse matrike varianc in kovarianc morajo biti pozitivno definitne Na diagonali so variance, na nediagonalnih elementih pa kovariance Vzemimo, da je matrika A reda 1 x 1, torej je le skalar V tem primeru je edini element v matriki A varianca σ, element v matriki L pa standardni odklon σ k) Semi-pozitivno definitne matrike so zelo podobne pozitivno definitnim matrikam, le v matriki L je na diagonali dovoljena tudi vrednost 0 4 1 1 5 1 1 1 0 1 1 1 0 [10 5
6 Biometrija 14 Seštevanje matrik in vektorjev Definicija: A pxq + B pxq C pxq c i j a i j + b i j [11 [1 Matrike, ki jih seštevamo, morajo imeti isto število vrstic in isto število stolpcev Vsoto matrik dobimo tako, da seštevamo istoležne elemente Rezultat je istega reda kot matrike, ki jih seštevamo 1 0 1 3 4 + 4 0 1 1 1 + 4 0 + 0 1 + + 1 3 4 1 5 0 1 3 1 3 [13 Osnovna pravila MNOŽENJE MATRIK Definicija: A pxq B qxr C pxr [14 Matriki A in B iz enačbe pomnožimo tako, da pomnožimo i-to vrstico matrike A z j-ti stolpcem matrike B ter produkte posameznih parov seštejemo Tako dobimo vrednost elementa na presečišču i-te vrstice in j-tega stolpca matrike C c ik q a i j b jk j1 [ Prva matrika mora zato imeti toliko v stolpcev kot druga matrika vrstic 1 0 1 3 4 3x [ 0 1 1 3 0 x4 0 1 4 6 1 1 3 14 3x4 [16 Osnovna pravila 16 OPIS MODELA V MATRIČNI OBLIKI Modele v matrični obliki bomo srečali v literaturi, ki opisuje obdelavo podatkov pri selekciji živali in uravnavanju reje Kot bomo kasneje videli, so zeli splošni in povedo sami zase brez dobrega dodatnega opisa zelo malo o strukturi podatkov Lahko so dodatno opremljeni z modelom v skalarni obliki Ker pa so splošni, so zelo primerni za prikaz metod, uporabljenih za reševanje sistemov enačb Model v matrični obliki si oglejmo najprej kar na primeru PRIMER: Vzemimo podatke iz tabele?? in uporabimo naslednja modela v skalarni obliki in sicer za dnevni prirast (17) in debelino hrbtne slanine (18): y i jkl µ + P i + M j + F k + a i jkl + e i jkl [17 y i jklm µ + P i + M j + F k + b i ( xi jkl x ) + a i jkl + e i jklm [18 6
Biometrija 7 Model za dnevni prirast smo predstavili v enačbah19 in 130 Če bi obravnavali le eno lastnost, potem je lahko enačba povsem brez indeksov Ker pa sta si modela za dnevni prirast in debelino tako zelo podobna, pa jih moramo ločiti z dodatnimi indeksi Za indeks lahko uporabimo številko ali črko y 1 X 1 β 1 + Z 1 u 1 + e 1 [19 y D X D β D + Z D u D + e D [130 kjer pomeni: y 1, y D X 1, X D Z 1, Z D β 1, β D u 1, u D e 1, e D - - vektor opazovanj ali meritev (ang observations) za dnevni prirast - matrike dogodkov (ang incidence matrix) za sistematske vplive (ang fixed effects) - matrika dogodkov za naključne vplive (ang random effects) - vektor parametrov za sistematske vplive (ang vector of parameters) - vektor naključnih vplivov vektor ostankov (residual) Sedaj ne bo težko napisati model še za debelino hrbtne slanine V enačbi 131 smo za indeks uporabili številko, ki bo opozoril, da gre za drugo lastnost Da bi se spomnili, da delamo s slanino, pa smo v enačbi 13 raje uporabili črko S y X β + Z u + e [131 y S X S β S + Z S u S + e S [13 kjer pomeni: y, y S X, X S Z, Z S β, β S u, u S e, e S - - vektor opazovanj ali meritev za debelino hrbtne slanine - matrike dogodkov za sistematske vplive - matrika dogodkov za naključne vplive - vektor parametrov za sistematskih vplivov - vektor naključnih vplivov vektor ostankov Do sedaj smo obdelali posebej dnevni prirast in nato še debelino hrbtne slanine Uporabili smo enolastnostno analizo Kot vir informacij smo uporabili samo moreritve za lastnost in poreklo Nismo pa upoštevali, da sta lastnosti sicer povezani Z večlastnostnimi analizami se ne bomo preveč ukvarjali Omenili jih bomo le toliko, da bomo vedeli, da obstajajo in se predstavljali, kaj se pri njih dogaja Proces pri reševanju sistemov enačb je povsem enak procesu, ko delamo z eno lastnostjo Oba modela lahko sestavimo na način prikazan v (133) in zapišemo poenostavljeno kar v obliki prikazani v (134) Slednja oblika je praktična za izpeljavo metode, ne pove pa dosti o poizkusu Tudi, ko 7
8 Biometrija se odločimo za matrično obliko zapisa modela, moramo navajati skalarno obliko enačb Pričakovane vrednosti, strukturo varianc in kovarianc ter morebitne predpostavke pa prikažemo kar z matrikami y [ y1 y [ X1 β 1 0 0 X β [ Z1 u + 1 0 0 Z u [ e1 + e [133 y Xβ + Zu + e [134 kjer pomeni: y - vektor opazovanj ali meritev za obe lastnosti X - matrike dogodkov (ang incidence matrix) za sistematske vplive (ang fixed effects) Z - matrika dogodkov za naključne vplive (ang random effects) β - vektor parametrov za sistematskih vplivov u - vektor naključnih vplivov (žival) e - vektor ostankov (residual) Seznanimo se najprej z vsebino matrik in vektorjev v modelih 161 Vektorji opazovanj in vektorji parametrov Vektor opazovanj je stolpični vektor, ki ima toliko vrstic, kot smo opravili meritev za opazovano lastnost Kot primer bomo obdelali podatke o preizkusu mladic v pogojih reje iz tabele?? V našem primeru smo za dnevni prirast opravili 11 meritev in jih uvrstili v vektor y 1 (ali y D ), pri debelini hrbtne slanine pa Vrstni red navajanja podatkov je poljuben, vendar pa, ko ga enkrat izberemo, je sistem definiran in ga ne smemo v naslednjih postopkih menjati Vektorja y in y (oziroma y S in y S ) za debelino hrbtne slanine vsebujeta iste meritve razporejene različno Kljub temu, da vektorja nista enaka, pričakujemo 8
Biometrija 9 iste rešitve Razporeditev rešitev pa bo odvisna od vrstnega reda parametrov 506 550 53 577 51 1 1 499 13 466 545 14 14 549 19 600 506 3 16 610 550 6 14 1 53 5 1 577 1 19 17 14 51 3 y 1 499 y y 3 19 y 13 4 3 y 466 14 6 6 545 16 4 5 549 1 5 1 600 610 17 7 4 1 3 4 19 13 7 14 19 3 16 3 3 1 17 4 4 7 19 3 506 1 13 550 14 53 16 577 14 1 51 19 17 499 3 4 466 6 4 545 5 7 549 1 19 600 3 610 3 [135 Zadnja dva vektorja y in y vključujeta vse meritve za obe lastnosti Oba vektorja imata natanko 33 opazovanj, razlikujeta pa se le v vrstnem redu opazovanj Vektorji β 1, β, β D, β S in β vključujejo vse sistematske vplive Ker sta modela za dnevni prirast in debelino hrbtne slanine podobna, je seznam parametrov podoben, le pri slanini je dodana neodvisna spremenljivka masa in odgovarjajoči regresijski koeficient b i kot parameter Vektor parametrov za sistematske vplive pri dnevnem prirastu lahko predstavljata bodisi enačba 136 bodisi enačba 137 [ β 1 µ 1 P 11 P 1 P 13 M 11 M 1 F 11 F 1 F 13 [136 [ β D µ D P D1 P D P D3 M D1 M D F D1 F D F D3 [137 Sedaj pa sestavimo še vektor parametrov za debelino hrbtne slanine Tudi tu lahko izberemo varianto, ko lastnost označimo s številko (enačba 138) ali črko (enačba 139) Praviloma se odločimo samo za eno varianto in se je vseskozi tudi držimo [ β µ P 1 P P 3 M 1 M F 1 F F 3 b 1 b b 3 [138 9
10 Biometrija [ β S µ S P S 1 P S P S 3 M S 1 M S F S 1 F S F S 3 b S 1 b S b S 3 [139 Parametri niso isti pri različnih lastnostih, saj pričakujemo pri vsaki lastnosti drugačne rešitve (ocene oz napovedi) Ne glede na to, ali sta modela enaka ali različna, potrebujemo za vsako lastnost druge parametre Vzemimo za primer samo srednjo vrednost µ Izračunati moramo dve srednji vrednosti: eno za srednjo vrednost za dnevni prirast µ D in eno za debelino hrbtne slanine µ S Skupen rezultat ne bi imel nobenega pomena, sicer pa tako in tako ne moramo šestevati vrednosti za dnevni prirast (v g/dan) in vrednosti za debelino hrbtne slanine (v mm) Ponovitve pri debelini slanine smo opravljali le z namenom, da izboljšamo zanesljivost meritev, saj meritev slanine z ultrazvokom ni dovolj zanesljiva Ponovitve tako ne vplivajo na število parametrov, ki jih želimo oceniti Seveda pa to velja za ponovitve, ki jih lahko razglasimo kot paralelke Drugače je v primeru, ko so meritve na isti živali (ali drugi opazovani enoti) opravljene v različnih časovnih razmikih, včasih tudi v različnem okolju Kot primer naj navedemo analizo vzorcev mleka pri posameznih kontrolah, v različnih laktacijah, velikost gnezda pri posameznih kotitvah, tehtanja odraslih živali v različnih časovnih razmikih, lahko pa so to tudi rezultati kemičnih analiz, ko proučujemo zanesljivost metode Tudi meritve debeline hrbtne slanine, merjene pri različnih masah, bi sodile v ta sklop Meritve niso paralelke in enakovredne Pri takih meritvah nas zanima ponovljivost, zato v model vključimo dodatni vpliv, ki ocenjuje skupno okolje, ki je meritvam na eni živali oz kaki drugi opazovani enoti skupen Število nivojev pri takem vplivu je običajno veliko, za vsako žival vsaj eno V primeru meritev lastnosti mleka pa ločimo dve skupni okolji Najprej je eno okolje, ki je skupno vsem meritvam pri samici (kravi, ovci, kozi), in ga imenujemo kar permanentno okolje, saj traja vse življenje Drugi del skupnega okolja pa je vezan na eno laktacijo: meritve znotraj laktacije so bolj primerljive, podobne, kot meritve med laktacijami Imenujemo ga kar skupno okolje (v laktaciji) Nivojev pri tem vplivu pa je celo več: pri vsaki živali za vsako laktacijo eden Torej jih je za eno žival toliko, kot ima žival laktacij Pri speciesih z več mladiči v gnezdu (drobnica, prašiči, kunci) predstavlja skupno okolje za velikost gnezda pri samici okolje, ki ga samica nudi vsem svojim potomcem Lastnosti, ki bi podrobno opisovale to okolje, praviloma ne moremo zmeriti Predstavljajo pa tako imenovane materinske lastnosti, kot npr mlečnost pri samicah, obnašanje matere (agresivnost, nerodnost, požrtvovalnost), pa tudi nekatere železne navade rejca, ki povzročajo razlike med samicami Trajne posledice za plodnost pa imajo le tisti vplivi, ki so kreirali razvoj samice, torej okolje iz njene mladosti Če so bili pogoji v mladosti optimalni, bodo tudi proizvodni rezultati lahko optimalni Na te, materinske lastnosti vpliva lahko tako genotip (maternalni genetski vplivi) kot okolje (permanentno okolje) V vektorjih naključnih vplivov u 1 (140), u D (141), u (14), u S (143) in u(144) so nanizani naključni vplivi, kot npr aditivni genetski vpliv, pogosto imenovan kar preprosto žival Tako smo posamene elemente vektorjev označili kar s črkami a, ki nas spominjajo na aditivni genetski vpliv Meritve smo opravili na enajstih živalih, sorodstva pa pri njih nismo poznali u 1 [ a 11 a 1 a 13 a 14 a a 16 a 17 a 18 a 19 a 110 a 111 u D [ a D1 a D a D3 a D4 a D5 a D6 a D7 a D8 a D9 a D10 a D11 u [ a 1 a a 3 a 4 a 5 a 6 a 7 a 8 a 9 a 10 a 11 u B [ a B1 a B a B3 a B4 a B5 a B6 a B7 a B8 a B9 a B10 a B11 u [ u 1 u [140 [141 [14 [143 [144 V primeru, da imamo še dodatne živali iz porekla, za katere bi tudi radi napovedali plemensko vrednost (aditivni genetski vpliv), živali vstavimo v vektor V našem primeru bomo 4 prednike živali v poskusu dodali na konec vektorja Prikazali bomo le vektor u 1 (145), ostali se prav tako ustrezno podaljšajo u 1 [ a 11 a 1 a 13 a 14 a a 16 a 17 a 18 a 19 a 110 a 111 a 11 a 113 a 114 a 1 [145 10
Biometrija 11 16 Matrike dogodkov Z matrikami dogodkov poskus natanko opišemo Vse živali pripadajo celotnemu vzorcu in bodo pri oceni enakopravno sodelovale Za sistematske vplive Matriko dogodkov za sistematske vplive X 1 za dnevni prirast nastavimo tako, da pred matriko nastavimo vektor opazovanj y 1, da si s tem pomagamo pri nastavljanju vrstic Nad stolpce pa si lahko napišemo vektor parametrov β 1 Če parameter, ki označuje stolpec, prisostvuje pri meritvi, ki jo v dani vrstici opisujemo, napišemo vrednost 1, v obratnem primeru pa 0 y 1 β 1 [ µ 1 P 11 P 1 P 13 M 11 M 1 F 11 F 1 F 13 506 1 1 0 0 1 0 1 0 0 550 1 1 0 0 1 0 0 1 0 53 1 1 0 0 0 1 0 0 1 577 1 1 0 0 0 1 1 0 0 51 1 0 1 0 1 0 0 1 0 499 1 0 1 0 0 1 0 1 0 466 1 0 1 0 0 1 0 0 1 545 1 0 0 1 1 0 1 0 0 549 1 0 0 1 1 0 0 0 1 600 1 0 0 1 0 1 0 0 1 610 1 0 0 1 0 1 0 1 0 X 1 [146 Tudi pri debelini hrbtne slanine ravnamo enako Le pri regresijskih koeficientih vpišemo vrednost neodvisne spremenljivke x Če model tako zahteva, jo korigiramo na konstantno vrednost ali povprečje β [ µ P 1 P P 3 M 1 M F 1 F F 3 b 1 b b 3 1 1 1 0 0 1 0 1 0 0 0 0 1 1 0 0 1 0 0 1 0 0 0 1 1 0 0 0 1 0 0 1 5 0 0 14 1 1 0 0 0 1 1 0 0 3 0 0 19 1 0 1 0 1 0 0 1 0 0 4 0 3 1 0 1 0 0 1 0 1 0 0 1 0 6 1 0 1 0 0 1 0 0 1 0 3 0 5 1 0 0 1 1 0 1 0 0 0 0 1 1 1 0 0 1 1 0 0 0 1 0 0 0 1 0 0 1 0 1 0 0 1 0 0 3 3 1 0 0 1 0 1 0 1 0 0 0 [147 y X 13 1 1 0 0 1 0 1 0 0 0 0 14 1 1 0 0 1 0 0 1 0 0 0 16 1 1 0 0 0 1 0 0 1 5 0 0 1 1 1 0 0 0 1 1 0 0 3 0 0 17 1 0 1 0 1 0 0 1 0 0 4 0 4 1 0 1 0 0 1 0 1 0 0 1 0 4 1 0 1 0 0 1 0 0 1 0 3 0 7 1 0 0 1 1 0 1 0 0 0 0 1 19 1 0 0 1 1 0 0 0 1 0 0 0 3 1 0 0 1 0 1 0 0 1 0 0 3 1 0 0 1 0 1 0 1 0 0 0 11
1 Biometrija y [ y1 y 33x1 β [ [ β 1 X1 β 0 0 X X [148 Za naključne vplive y 1 u 1 [ a 11 a 1 a 13 a 14 a a 16 a 17 a 18 a 19 a 110 a 111 506 1 0 0 0 0 0 0 0 0 0 0 550 0 1 0 0 0 0 0 0 0 0 0 53 0 0 1 0 0 0 0 0 0 0 0 577 0 0 0 1 0 0 0 0 0 0 0 51 0 0 0 0 1 0 0 0 0 0 0 499 0 0 0 0 0 1 0 0 0 0 0 466 0 0 0 0 0 0 1 0 0 0 0 545 0 0 0 0 0 0 0 1 0 0 0 549 0 0 0 0 0 0 0 0 1 0 0 600 0 0 0 0 0 0 0 0 0 1 0 610 0 0 0 0 0 0 0 0 0 0 1 Z 1 [149 y u [ a1 a a 3 a 4 a 5 a 6 a 7 a 8 a 9 a 10 a 11 1 1 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 14 0 0 0 1 0 0 0 0 0 0 0 19 0 0 0 0 1 0 0 0 0 0 0 3 0 0 0 0 0 1 0 0 0 0 0 6 0 0 0 0 0 0 1 0 0 0 0 5 0 0 0 0 0 0 0 1 0 0 0 1 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 1 0 3 0 0 0 0 0 0 0 0 0 0 1 13 1 0 0 0 0 0 0 0 0 0 0 14 0 1 0 0 0 0 0 0 0 0 0 16 0 0 1 0 0 0 0 0 0 0 0 1 0 0 0 1 0 0 0 0 0 0 0 17 0 0 0 0 1 0 0 0 0 0 0 4 0 0 0 0 0 1 0 0 0 0 0 4 0 0 0 0 0 0 1 0 0 0 0 7 0 0 0 0 0 0 0 1 0 0 0 19 0 0 0 0 0 0 0 0 1 0 0 3 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 1 Z [0 y [ y1 y 33x1 u [ [ u 1 u Z1 0 0 Z Z [1 1
Biometrija 13 163 Matrike varianc in kovarianc Izpeljimo strukturo varianc in kovarianc za dnevni prirast y 1 (fenotipske variance in kovariance) V 1 var (y 1 ) var ( ) X 1 β 1 + Z 1 u 1 + e 1 cov ( X 1 β 1, β 1X ) 1 + cov ( Z 1 u 1, β } {{ } 1X ) 1 } {{ } + cov ( e 1, β 1X ) 1 } {{ } + cov ( X 1 β 1, u 1Z ) 1 } {{ } + 0 0 0 0 +cov ( Z 1 u 1, u ) 1 Z 1 +cov ( e 1, u 1Z ) 1 } {{ } + cov ( X 1 β 1, e ) 1 } {{ } + cov ( Z 1 u 1, e ) 1 } {{ } 0 0 0 +cov ( e 1, e ) 1 Z 1 var (u 1 ) Z 1 + var (e 1) Z 1 G 1 Z 1 + R 1 [ Matrika varianc in kovarianc za ostanek (R) je pogosto enostavna (3) na diagonali so variance za ostanek, nediagonalni elementi, ki predstavljajo kovariance med dvema meritvama, pa so enake nič e 1 e 1 [ e11 e 1 e 13 e 14 e e 16 e 17 e 18 e 19 e 110 e 111 e 11 σ e 1 0 0 0 0 0 0 0 0 0 0 e 1 0 σ e e 1 0 0 0 0 0 0 0 0 0 13 0 0 σ e e 1 0 0 0 0 0 0 0 0 14 0 0 0 σ e 1 0 0 0 0 0 0 0 e 0 0 0 0 σ e 1 0 0 0 0 0 0 e 16 0 0 0 0 0 σ e 1 0 0 0 0 0 e 17 0 0 0 0 0 0 σ e 1 0 0 0 0 e 18 0 0 0 0 0 0 0 σ e 1 0 0 0 e 19 0 0 0 0 0 0 0 0 σ e 1 0 0 e 110 0 0 0 0 0 0 0 0 0 σ e 1 0 e 111 0 0 0 0 0 0 0 0 0 0 σ e 1 R 1 Iσ e 1 [3 V izjemnem primeru, ko merimo na isti živali samo eno meritev in živali med seboj niso sorodne, je tudi matrika varianc in kovarianc za naključne vplive (G 1 ) enostavna (4) Vedeti pa moramo, da je to prej izjema kot pravilo! u 1 u 1 [ a11 a 1 a 13 a 14 a a 16 a 17 a 18 a 19 a 110 a 111 a 11 σ a 1 0 0 0 0 0 0 0 0 0 0 a 1 0 σ a a 1 0 0 0 0 0 0 0 0 0 13 0 0 σ a a 1 0 0 0 0 0 0 0 0 14 0 0 0 σ a 1 0 0 0 0 0 0 0 a 0 0 0 0 σ a 1 0 0 0 0 0 0 a 16 0 0 0 0 0 σ a 1 0 0 0 0 0 a 17 0 0 0 0 0 0 σ a 1 0 0 0 0 a 18 0 0 0 0 0 0 0 σ a 1 0 0 0 a 19 0 0 0 0 0 0 0 0 σ a 1 0 0 a 110 0 0 0 0 0 0 0 0 0 σ a 1 0 a 111 0 0 0 0 0 0 0 0 0 0 σ a 1 G 1 Iσ a 1 [4 V tem izjemnem primeru je tudi matrika fenotipskih varianc in kovarianc V diagonalna matrika, posamezni diagonalni elementi pa so vsota okoliške (σ e 1 ) in genetske (σ a 1 ) komponente variance V 1 Z 1 G 1 Z 1 + R 1 I ( σ a 1 + σ e 1 ) diag { σ a1 + σ e 1 } [5 Za debelino hrbtne slanine imamo dvakrat toliko opazovanj: na vsaki živali po dve Ker smo merili z istim aparatom, delo je opravljal isti delavec, so meritve identično porazdeljene (imamo samo eno 13
14 Biometrija varianco za ostanek) Vendar pa meritvi na isti živali praviloma nista neodvisni - žival smo pitali pod istimi pogoji, zato je tudi okolje v enaki meri ponagajalo Če se je žival zaradi tega bolj zredila, kot bi se pod strogimi pogoji testa, bomo namerili tudi debelejšo slanino pri obeh ponovitvah Med ponovitvama na isti živali torej obstaja podobnost - kovarianca Oblika matrike varianc in kovarianc za ostanek je odvisna od razporedive meritev v vekorju y Če razvrstimo meritve tako, da najprej nanizamo prve meritve na vseh živalih in nato dodamo še druge meritve (prvi vektor za debelino hrbtne slanine v enačbah (131), dobimo matriko iz enačbe (14) Ko pa razvrstimo ponovitvi po parih - znotraj živali (drugi vektor za debelino hrbtne slanine v enačbah (131)), pa dobimo matriko iz enačbe (143) in (144) [ Iσ R e Iσ e Iσ e Iσ e [ σ e σ e σ e σ e x x I 11 R 0 I 11 [6 14
Biometrija e e [ e1 1 e 1 e3 1 e9 1 e101 e111 e1 e e3 e9 e10 e11 e1 1 e 1 e3 1 e9 1 e101 e111 σ e σe σ e σe σ e e1 e e3 e9 e10 e11 σe σ e σe σ e σe σ e σe σ e σe σ e σe σ e σe σ e σe σ e σe σe σ e R [7
16 Biometrija e e [ e11 e1 e 1 e e3 1 e3 e9 1 e9 e101 e10 e111 e11 e11 e1 σ e1 σe σe σ e1 e 1 e σ e1 σe σe σ e1 e3 1 e3 σ e1 σe σe σ e1 e9 1 e9 e101 e10 e111 e11 σ e1 σe σe σ e1 σ e1 σe σe σ e1 σ e1 σe σe σ e1 R [8 16
Biometrija 17 R I 11 [ σ e σ e σ e σ e x I 11 R 0 [9 Ker so živali nesorodne, za debelino hrbtne slanine pa želimo samo eno plemensko vrednost, je matrika varianc in kovarianc za direktni aditivni vpliv enostavna, kot jo prikazujemo v (160) G I 11 σ a [160 Sedaj pa izračunajmo še matriko fenotipskih varianc in kovarianc V Vzemimo primer, ko so nanizane najprej prve meritve in nato še ponovitve Rezultat (161) je izjemoma, zaradi že omenjenih predpostavk, blokdiagonalna matrika [ [ V Z G Z + R I11 I I 11 σ [ I11 I a I11 I 11 + R0 I 11 11 [ 11 I 11 I 11 σ a σ [ [ a σ σ a σ I 11 + e σ e σ a σ e σ I 11 a + σ e σ a + σ e e σ a + σ e σ a + σ e σ a + R 0 I 11 [161 I 11 V 0 I 11 Sedaj pa za vajo ponovimo še izračun kovariance med meritvami za dnevni prirast y 1 in ostanki e 1 ter med meritvami y 1 in slučajnim vplivom u 1 cov ( y 1, e 1) cov ( X1 β 1 + Z 1 u 1 + e 1, e 1) Z1 cov ( u 1, e 1) + var (e1 ) R 1 [16 cov ( y 1, u ( 1) cov X1 β 1 + Z 1 u 1 + e 1, u ( 1) cov X1 β 1, u ( 1) + cov Z1 u 1, u ( 1) + cov e1, u ) 1 Z 1 cov ( u 1, u ) [163 1 Z1 var (u 1 ) Z 1 G 1 C 1 Pričakovane vrednosti ter variance in kovariance za slučajne vplive so pogosto predstavljene v združeni obliki V nasednjih enačbah smo prikazali model (134) z obema lastnostima E u 1 e 1 y 1 0 0 X 1 β 1 [164 var u 1 e 1 y 1 G 1 0 G 1 0 R 1 R 1 G 1 Z 1 R 1 Z 1 G 1 Z 1 + R 1 [165 Vajo ponovite še za debelino hrbtne slanine in za model z obema lastnostima skupaj! Potrebovali bomo še rezultate iz naslednje razpredelnice Pripišite rezultate, da jih ne bomo kasneje iskali! Nato pa sestavite enačbo za pričakovane vrednosti po zgledu (16) in prikažite strukturo varianc in kovarianc po zgledu (163) cov ( y, e ) cov ( y, u ) cov (y, e ) cov (y, u ) cov ( y, e ) cov ( y 1, u ) cov ( y, e 1) cov ( y, u 1) cov ( y 1, y ) cov ( y, y 1) 17
18 Biometrija Pri dvolastnostnem modelu splošno obliko enačb še razčlenite, da bodo vidne povezave med lastnostima Izpopolnite naslednji dve enačbi! u 1 u E e 1 e y 1 y u 1 u var e 1 e y 1 y 17 Determinanta 18 Inverzna matrika 19 Splošna inverza Vzemimo, da imamo sistem enačb Ax r Rešitev za vektor neznanih parametrov x dobimo tako, da od spredaj množimo z A 1, kar lahko storimo ob pogoju, da ima matrika A poln rang Vendar pa obstajajo številni primeri, ko to ne drži: rang matrike A je manjši od reda matrike, determinanta matrike je enaka nič Sistem enačb v tem primeru nima ene same rešitve Če ima rešitev, jih ima neskončno mnogo Eno, izbrano rešitev pa lahko dobimo tako, da uporabimo splošno inverzo Označili jo bomo z A Izbrali pa bomo tisto, pri kateri velja: AA A A Praviloma pa niti AA niti A A nista enaka identični matriki I Matrika A ima neskončno mnogo splošnih inverz, če ima vsaj eno Pri vsaki možni rešitvi sistema uporabimo drugo splošno inverzo Poglejmo pa si enostaven postopek, da najdemo prvo splošno inverzo 3 1 0 1 1 x 1 x x 3 1 3 [166 v matriki A poiščite vse odvisne vrstice, jih napolnite z ničlami Z ničlami napolnimo tudi stolpec Pri simetričnih matrikah izberemo isto vrstico in isti stolpec 3 0 0 0 0 0 0 ali 3 0 1 0 0 0 1 0 ali 0 0 0 0 0 1 0 ali 0 1 0 0 1 0 0 0 ostane vam samo toliko neodvisnih vrstic in stolpcev, kot je rang sistema 18 ali 3 0 1 0 1 0 0 0 [167
Biometrija 19 iz neodvisnih vrstic in stolpcev nastavite podmatriko in poiščite njeno inverzo [ 3 3 1 4 [ 0 3 [ 3 1 1 3 [ 1 1 5 1 3 [ 0 1 [ 1 0 1 [ 1 1 0 [ 3 1 1 1 [ 1 1 0 [168 [ 1 1 1 5 3 [169 inverzi dodajte izpuščene vrstice in stolpce, ki so polni samih ničel 1 4 0 0 3 0 0 0 0 1 5 0 1 0 0 0 1 0 3 1 0 0 0 0 1 0 3 1 0 1 1 0 0 0 0 0 1 5 1 0 1 0 3 0 0 0 [170 Tako pripravljene inverze lahko uporabimo pri reševanju sistema enačb Rešitev lahko dobimo neskončno mnogo, objavili pa bomo le tisto, kar je enako pri vseh rešitvah - ocenljive funkcije 110 Direktna vsota [ A 0 A B 0 B [171 Možni so različni zapisi Σ i X i Σ + i X i k i X i X i X i X i X i 0 0 0 X i 0 0 0 X i [17 Za vključene matrike sploh ni potrebno, da bi bile istega ranga x X z x 0 0 0 X 0 0 0 z Za matrike odgovarjajočega ranga drži (A B) + (C D) [ A 0 0 B [173 [ C 0 + 0 D Če je A i polnega ranga, velja naslednje: [ A + C 0 0 B + D A + C B + D [174 [ Σ 1 i A i A i 0 0 0 A i 0 0 0 A i 1 A 1 i 0 0 0 A 1 i 0 0 0 A 1 i Σ i A 1 i [175 Za determinanto pa velja: k Σ i A i A i i1 [176 19
0 Biometrija 111 Kronecker produkt Vzemimo primer, kjer imamo dve lastnosti (y in z) za vsako od dveh živali Če lahko zapise opišemo z linearnim modelom, imamo y 1 z y 3 z 4 var u y1 u z1 u y u z µ y µ z µ y µ z + u y1 u z1 u y u z + e y1 e z1 e y e z σ a1 σ a1 a 1 σ a1 a 1 σ a1 σ a1 σ a a 1 σ a1 a 1 σ a a 1 σ a1 a 1 σ a1 σ a1 σ a1 a 1 σ a1 a 1 σ a σ a1 σ a [177 [178 1 [ σ a1 σ a1 σ a1 a 1 [ σ a1 σ a1 σ a σ a1 σ a [ σ a a1 σ a1 1 σ a1 σ [ [ a σ 1 a1 σ a1 1G0 a 1 G 0 A G a 1 G 0 1G 0 [179 0 σ a1 σ a Matrika A predstavlja matriko sorodstva Element a 1 je koeficient sorodstva med obema živalima Matrika G 0 vsebuje genetske variance in kovariance med lastnostima, merjenima na isti živali Poglejmo sedaj še varianco za ostanek (180)! Lastnosti merjene na isti živali so med se var e y1 e z1 e y e z σ e1 σ e1 0 0 σ e1 σ e 0 0 0 0 σ e1 σ e1 0 0 σ e1 σ e [180 [ σ 1 e1 σ e1 [ σ e1 σ e σ 0 e1 σ e1 σ e1 σ e [ σ 0 e1 σ e1 [ σ e1 σ e σ 1 e1 σ e1 σ e1 σ e [ 1R0 0R 0 0R 0 1R 0 I R 0 R [181 Navedimo še nekaj lastnosti Kronecker produkta Vzemimo matriki A pxq in B mxn A B C pm qn (A B) A B x y yx x x k A ka A k [18 [183 [184 [185 [ A1 A B [ A1 B A B [186 A [ B 1 B [ A B1 A B [187 Če obstajajo produkti, velja: (A B) (X Y) AX BY [188 0
Biometrija 1 (A B) 1 A 1 B 1 [189 rang (A B) rang (A) rang (B) [190 tr (A B) tr (A) tr (B) [191 M m m N n n M m N n [19 Lastna_vrednost (A B) Lastna_vrednost (A) Lastna_vrednost (B) [193 (A B) C A (B C) [194 ka B A kb k (A B) [195 (A + B) C (A C) + (B C) [196 11 Odvajanje matrik Pri odvajanju uporabimo splošni model (197), poljubno vrstico i pa bomo prikazovali na dva načina, kot (198) ali (199) y Xβ + Zu + e y 1 x iβ + z iu + e i [197 [198 y i p x i j β j + j1 q z i j u j + e i [199 j1 111 Odvod matrike po skalarju Vzemimo matriko Y reda m n, katere elementi so funkcije skalarja z Potem je: { / Y z yi j z } A red (Y) m n red (z) 1 1 red (A) m n [1100 11 Odvod skalarja po matriki Naj bo skalar h (X) funkcija matrike X h (X) / x 11 h (X) / x 1n h (X) X h (X) / x m1 h (X) / x mn A [1101 red (X) m n red (h (X)) 1 1 red (A) m n [110 1
Biometrija 113 Odvod vektorja po vektorju y [ / / z y y z 1 z y / / y 1 y 1 / z 1 / y y z 1 y k / z 1 y k / / zn z y 1 / z n y z / z n z y k / z n [1103 k n [1104 red (z ) 1 n red (y) k 1 red (A) k n [1105 Vzemimo sedaj model (197) in odvajajmo y najprej na β in nato še na β [ / / y β y y y [1106 β 1 β / βp / / y 1 y 1 / β 1 / y y β 1 y n / β 1 y n / y 1 β / β p y x 11 x 1 x 1p β / β p x 1 x x p X [1107 x n1 x n x np β y n / β p red (y) n 1 red ( β ) 1 p red (X) n p [1108 Poglejmo si tipični element matrike odvodov (1109) in nato še primer za prvo opazovanje in drugi parameter v modelu (1110) ( p y i j1 x i jβ j + ) q j1 z i ju j + e i x ik [1109 β k β k ( p y i j1 x 1 jβ j + ) q j1 z 1 ju j + e 1 x 1 [1110 β β y β / y y y / / β 1 β β p / / y 1 y / β 1 / y 1 y β y 1 / β p y / y n β 1 / β 1 y n x 11 x 1 x 1n β / β x 1 x x n X [1111 x p1 x p x pn β p y n / β p red (y) n 1 red (β) p 1 red (X ) n p Zu u Z [111 [1113
Biometrija 3 114 Odvajanje produkta matrik V skalarni algebri velja uv x ( ) u v + u x ( ) v x [1114 V skalarni algebri velja isto pravilo najdemo tudi v matrični algebri (11) Matrika U je reda m n ter matrika V reda n q Elementi matrik so funkcije skalarne spremenljivke x UV x ( ) U V + U x ( ) V x [11 PRIMER: V sistemu normalnih enačb pri metodi najmanjših kvadratov (1116) dobimo vsoto kvadratov za model z izrazom (1117) X X β X y β X X β [1116 [1117 Odvajajmo vsoto kvadratov za model na eno izmed ocen (npr β i ): β X X β ˆβ i β X X β + β X X β [1118 ˆβ i ˆβ i Poskusimo sedaj rešiti samo košček problema: x 1i x i X β ˆβ i x 4i t i red (t i ) n i 1,,, p [1119 Sedaj bo pa že šlo: β XXβ β i t } ix β {{ } skalar + β X t } {{ } i skalar t i X β [110 Še malo posplošimo: β X X β β t 1 X β t px β t 1 t p X β X X β [111 3
4 Biometrija PRIMER: Skupno vsota kvadratov (total sum of square, TSS) za opazovanja lahko odvajamo na dva načina TSS je skalar, vektor opazovanj y pa stolpični vektor reda n 1, zato bo rezultat tudi stolpični vektor istega reda Ker vemo, da je TSS vsota kvadratov za opazovanja, lahko uberemo naslednjo pot / y y y P y 1 P y P y n / / y 1 y y n y 1 y y n y [11 Po postopku za odvajanje produkta matrik po sklarju, moramo odvod najprej razbiti tako, da dobimo v imenovalcu skalarje (113) Nato vsako vrstico odvajamo, kot to prikazuje (114) Pri tem si pomagamo še z enačbo (1) Dobljene vrednosti za posamezne vrstice vstavljamo nazaj v enačbo (113) Rezultat je podoben kot pri skalarni algebri y y y y y y 1 y y y y y y i y y y n y 1 y y i y n y [113 y y y i y y i y + y y y i t iy + y t i y i + y i y i [114 y y i [ 0 0 1 i 0 t i [1 1 Odvajanje inverze Vzemimo matriko M s polnim rangom in inverzno matriko M 1 Hitro lahko ugotovimo, da velja (116), saj identična matrika ni funkcija skalarne spremenljivke z MM 1 z I z 0 [116 Če bi zadevo poskusili rešiti na način, ki smo ga obdelali v prejšnjem poglavju (117), nam ostane neznanka prav odvod inverzne matrike M 1 po skalarni spremenljivki z Rezultat pa itak že poznamo MM 1 z M z M 1 + M M 1 z 0 [117 Sedaj pa nam ostane samo, da uganemo neznani odvod Pravzaprav bomo (118) samo preoblikovali: poznani prvi člen bomo prenesli na drugo stran enačbe (pridobimo negativen predznak) in obe strani od spredaj množili z inverzno matriko M 1 M 1 z M 1 M z M 1 [118 4
Biometrija 5 116 Odvajanje splošne inverze Splošna inverza je vsaka matrika G, ki zadovolji: AGA A [119 Matrika A je lahko katerakoli matrika, lahko je torej tudi vrstični ali stolpični vektor Naj bosta matriki A in G funkciji skalarja x Sedaj pa poiščimo odvod matrike A po x-u A x AGA x A GA + A GA x x A GA + A G x x A + AG A x [1130 Poskusimo sedaj množiti od spredaj z AG in od zadaj z GA AG A x GA AG A GA A G x x A + AG A GA [1131 x 0 A G x A + AG A x GA A G x A AG A x GA [113 [1133 Rezultat je podoben kot (118), če je G A 1 117 Odvajanje funkcije determinante Za matriko A s polnim rangom velja (Searle,198) A A A ( A ) 1 ln A A 1 A A A A (A ) 1 A ( A ) 1 [1134 [1135 ln V } x {{ } skalar tr ( ) ( ln V x tr ln V V ) V x tr ( V 1 V x ) [1136 118 Chain-ovo pravilo 113 Sled matrike Definicija: Sled matrike (ang trace) je vsota diagonalnih elementov matrike A { a i j } tr (A) ai j [1137 Zakon ciklične komutativnosti tr ( A pxn B nxm C mxp ) tr ( Cmxp A pxn B nxm ) tr ( Bnxm C mxp A pxn ) [1138 5
6 Biometrija Sled skalarja je skalar tr ( σ e) σ e [1139 Sled vsote matrik tr (A + B) tr (A) + tr (B) [1140 Sled produkta matrike s skalarjem tr (R) tr ( I 4 σ e) σ e tr (I 4 ) 4σ e [1141 Matematično upanje in sled matrike E (tr (A)) tr (E (A)) [114 tr (B) V sota lastnih vrednosti (eigenvalues) matrike B [1143 tr (B) B n i1 b ii B I [1144 tr (AB) B tr (BA) B A, [1145 tr (ABC) B tr (BCA) B A, C, [1146 tr (B, AB) B BA + A, B [1147 A A, tr (B, AB) B AB [1148 ( n ) Etr (X) E x ii i1 n E (x ii ) tre (X) [1149 i1 6
Biometrija 7 PRIMER: Opravili smo dve meritvi na dveh nesorodnih živalih Rezultati so v naslednji tabeli Nastavimo matriko varianc in kovarianc za aditivni genetski vpliv (G), ostanek (R) in opazovanja (V)! Pri tem predpostavimo naslednji model Izračunajmo tudi sledi matrik G, R in V! a 1 a y 11 y 1 y 1 y y i j µ + a i + e i j a i IID ( 0; σ a) ; ei j IID ( 0; σ ) e e 11 σ e R Var e 1 e 1 σ e σ e e ( a1 G Var a ) [ σ a σ a σ e V R + ZGZ, Var (y) Var y 11 y 1 y 1 y σ e + σ a σ a σ a σ e + σ a σ e + σ a σ a σ a σ e + σ a tr (R) tr ( I 4 σ e) σ e tr (I 4 ) 4σ e tr (G) σ a σ a tr (V) ( σ e + σ ( a) 4 σ e + σ ) a Slednje lahko izračunamo tudi po naslednjem postopku tr (V) tr (R + ZGZ, ) tr (R) + tr (ZGZ, ) 4σ e + tr ( Z, ZI σ a) 4σ e + 4σ a 7
8 Biometrija PRIMER: y Xβ + Zu + e E (y i ) x i β Var (y i ) σ e + σ u Po definiciji je V E (yy, ) E (y) E (y, ) E (yy, ) V + E (y) E (y, ) E (yy, ) E (tr (yy, )) E [ tr (yy, ) tr [ E (yy, ) ( β, X, ) Xβ tr (V + Xββ, X, ) tr (V) + tr } {{ } skalar ( n σ e + σ u) + β, X, Xβ n ( σ e + σ u) + β, X, Xβ E (yy, ) E [ (Xβ+Zu + e) (Xβ+Zu + e), E [ (Xβ+Zu + e) (β, X, + u, Z, + e, ) E (Xββ, X, ) + E (Zuβ, X, ) + E (eβ, X) + E (Xβu, Z, ) + E (Zuu, Z, ) + +E (eu, Z, ) + E (Xβe, ) + E (Zue, ) + E (ee, ) ZGZ, +R + Xββ, X, V + Xββ, X, 114 KVADRATNE OBLIKE (QUADRATIC FORM) Splošna oblika kvadratne oblike (quadratic form) je y, Qy Matriko Q imenujemo matriko kvadratne oblike Predpostavimo lahko, da je simetrična V primeru, da Q ni simetrična, lahko poiščemo drugo matriko kvadratne oblike po enačbi (10) ( Q + Q, ) [10 Za odvisne spremenljivke (opazovanja) v vektorju y naj velja, da so porazdeljene po naslednjem porazdelitvenem zakonu: y (Xβ, V) [11 Pripravimo si še nekaj enačb V var (y) var (y Xβ) E (y Xβ) (y Xβ), E (yy, yβ, X, Xβy, + Xββ, X, ) yy, (Ey) β, X, Xβ (Ey, ) + Xββ, X, yy, Xββ, X, Xββ, X, +Xββ, X, yy, Xββ, X, [1 yy, V + Xββ, X, [13 E (yy, ) E (V + Xββ, X, ) E (V) + E (Xββ, X, ) V + Xββ, X, [14 V statistiki kvadratne oblike predstavljajo matrični zapis za vsote kvadratov Da ocenimo posamezne komponente variance, vsoto kvadratov izenačimo s pričakovano vrednostjo za vsoto kvadratov, zato si 8
Biometrija 9 oglejmo, kako dobimo pričakovane vrednosti E (y, Qy) } {{ } skalar E [ tr (y, Qy) E [ tr (Qyy, ) tr [ E (Qyy, ) tr [ QE (yy, ) tr [ Q (V + Xββ, X, ) tr (QV) + tr (QXββ, X, ) (β, X, QXβ) tr (QV) + tr } {{ } tr (QV) + β, X, QXβ skalar [15 To velja ne glede na to, ali je porazdelitev normalna naslednje Če pa je porazdelitev normalna, pa velja tudi 1 var (y, Qy) } {{ } skalar PRIMER: y i µ + e i Vsota kvadratov opazovanj y i yy, Q I; rank(q) n Vsota kvadratov za model nȳ n ( yi n ) ( yi ) n 1 n y, 1 1, y 1 n y, J n y Q J n n ; rank(q) 1 Nepristranska ocena variance: (yi ȳ) n 1 y i (P y i) / n n 1 y, y 1 n y, J n y n 1 Q 1 ( I J ) ; rank(q) n 1 n 1 n 1 ( n 1 y, I J ) y n 9
30 Biometrija PRIMER: y i j µ + A i + e i j ; y, [ y, 1 y, y, A i 1, A; j 1, N; n NA Vir variabilnosti Stopinje prostosti (df) Vsota kvadratov (SS) Povprečni kvadrat (SS/df) µ 1 CF - za povprečje CF/1 Vpliv A A-1 CBSS - med skupinami CBSS/(A-1) Ostanek A(N-1) ESS - za ostanek ESS/(A(n-1)) Skupaj AN TSS - skupna Skupna vsota kvadratov TS S i y ji y, y j Q I; rank(q) AN Vsota kvadratov za povprečje CF 1 AN y, J NA y Q J AN AN ; rank(q) 1 Vsota kvadratov UBSS: UBS S 1 ( A N ) [ ( N ) ( N i j y i j 1 N ) ( N ) N j y 1 j + j y j + + j y A j 1 [ N y, 1 1 N 1, N y 1 + y, 1 N 1, N y + + y, A 1 N 1, N y A 1 N 1, N y 1 1 [ N y, 1 y, y, 1 N 1, N y A 1N ( 1, N y A ) y, J NN i y ( ) J N Q ; rank(q) A N i Vsota kvadratov CBSS: CBS S UBS S CF y, ( i ( 1 Q N i J N N ) ( y 1 AN y, J AN y y, 1 N ) J N 1 AN J AN ; rank(q) A 1 i ) J N 1 AN J AN y Vsota kvadratov za ostanek ES S TS S MS S 30
Biometrija 31 1 CHOLESKY DEKOMPOZICIJA (KVADRATNI KOREN) 31