2.2.1 Geomeetriline interpretatsioon

Σχετικά έγγραφα
Lokaalsed ekstreemumid

Funktsiooni diferentsiaal

Kompleksarvu algebraline kuju

MATEMAATIKA TÄIENDUSÕPE MÕISTED, VALEMID, NÄITED, ÜLESANDED LEA PALLAS VII OSA

Geomeetrilised vektorid

MATEMAATIKA TÄIENDUSÕPE MÕISTED, VALEMID, NÄITED LEA PALLAS XII OSA

T~oestatavalt korrektne transleerimine

Vektorid II. Analüütiline geomeetria 3D Modelleerimise ja visualiseerimise erialale

4.1 Funktsiooni lähendamine. Taylori polünoom.

Ruumilise jõusüsteemi taandamine lihtsaimale kujule

HAPE-ALUS TASAKAAL. Teema nr 2

1 Entroopia ja informatsioon

Arvuteooria. Diskreetse matemaatika elemendid. Sügis 2008

9. AM ja FM detektorid

Kirjeldab kuidas toimub programmide täitmine Tähendus spetsifitseeritakse olekuteisendussüsteemi abil Loomulik semantika

Eesti koolinoorte XLVIII täppisteaduste olümpiaadi

Planeedi Maa kaardistamine G O R. Planeedi Maa kõige lihtsamaks mudeliks on kera. Joon 1

Kontekstivabad keeled

4 T~oenäosuse piirteoreemid Tsentraalne piirteoreem Suurte arvude seadus (Law of Large Numbers)... 32

Sisukord. 4 Tõenäosuse piirteoreemid 36

7.7 Hii-ruut test 7.7. HII-RUUT TEST 85

KORDAMINE RIIGIEKSAMIKS V teema Vektor. Joone võrrandid.

ITI 0041 Loogika arvutiteaduses Sügis 2005 / Tarmo Uustalu Loeng 4 PREDIKAATLOOGIKA

PLASTSED DEFORMATSIOONID

Sisukord. 3 T~oenäosuse piirteoreemid Suurte arvude seadus (Law of Large Numbers)... 32

Ehitusmehaanika harjutus

Wilcoxoni astakmärgitest (Wilcoxon Signed-Rank Test)

Algebraliste võrrandite lahenduvus radikaalides. Raido Paas Juhendaja: Mart Abel

KORDAMINE RIIGIEKSAMIKS VII teema Vektor. Joone võrrandid.

,millest avaldub 21) 23)

Graafiteooria üldmõisteid. Graaf G ( X, A ) Tippude hulk: X={ x 1, x 2,.., x n } Servade (kaarte) hulk: A={ a 1, a 2,.., a m } Orienteeritud graafid

KOMBINATSIOONID, PERMUTATSIOOND JA BINOOMKORDAJAD

Skalaar, vektor, tensor

Koduseid ülesandeid IMO 2017 Eesti võistkonna kandidaatidele vol 4 lahendused

HULGATEOORIA ELEMENTE

KATEGOORIATEOORIA. Kevad 2010

Skalaar, vektor, tensor

6 Mitme muutuja funktsioonid

ALGEBRA I. Kevad Lektor: Valdis Laan

Annegrete Peek. Üldistatud aditiivne mudel. Bakalaureusetöö (6 EAP)

20. SIRGE VÕRRANDID. Joonis 20.1

Aritmeetilised ja loogilised operaatorid. Vektor- ja maatriksoperaatorid

sin 2 α + cos 2 sin cos cos 2α = cos² - sin² tan 2α =

; y ) vektori lõpppunkt, siis

KATEGOORIATEOORIA. Kevad 2016

Juhuslik faktor ja mitmetasandilised mudelid

1 Funktsioon, piirväärtus, pidevus

Formaalsete keelte teooria. Mati Pentus

Analüütilise geomeetria praktikum II. L. Tuulmets

Matemaatiline analüüs I iseseisvad ülesanded

Mitmest lülist koosneva mehhanismi punktide kiiruste ja kiirenduste leidmine

siis on tegemist sümmeetrilise usaldusvahemikuga. Vasakpoolne usaldusvahemik x i, E x = EX, D x = σ2

Kontekstivabad keeled

Vektorid. A=( A x, A y, A z ) Vektor analüütilises geomeetrias

TARTU ÜLIKOOL Teaduskool. STAATIKA TASAKAALUSTAMISTINGIMUSED Koostanud J. Lellep, L. Roots

Matemaatiline analüüs I iseseisvad ülesanded

6.6 Ühtlaselt koormatud plaatide lihtsamad

Tuletis ja diferentsiaal

Krüptoloogia II: Sissejuhatus teoreetilisse krüptograafiasse. Ahto Buldas

3. LOENDAMISE JA KOMBINATOORIKA ELEMENTE

5. OPTIMEERIMISÜLESANDED MAJANDUSES

Eesti koolinoorte XLI täppisteaduste olümpiaad

2. HULGATEOORIA ELEMENTE

Excel Statistilised funktsioonid

Mudeliteooria. Kursust luges: Kalle Kaarli september a. 1 Käesoleva konspekti on L A TEX-kujule viinud Indrek Zolk.

Eesti koolinoorte 51. täppisteaduste olümpiaad

Punktide jaotus: kodutööd 15, nädalatestid 5, kontrolltööd 20+20, eksam 40, lisapunktid Kontrolltööd sisaldavad ka testile vastamist

Vektoralgebra seisukohalt võib ka selle võrduse kirja panna skalaarkorrutise

Andmeanalüüs molekulaarbioloogias

Suhteline salajasus. Peeter Laud. Tartu Ülikool. peeter TTÜ, p.1/27

X t m X t Y t Z t Y t l Z t k X t h x Z t h z Z t Y t h y z X t Y t Z t E. G γ. F θ. z Θ Γ. γ F θ

Matemaatiline statistika ja modelleerimine

Deformatsioon ja olekuvõrrandid

2017/2018. õa keemiaolümpiaadi piirkonnavooru lahendused klass

YMM3740 Matemaatilne analüüs II

Segmenteerimine peidetud Markovi mudelite segude korral

1 MTMM Kõrgem matemaatika, eksamiteemad 2014

(Raud)betoonkonstruktsioonide üldkursus 33

Elastsusteooria põhivõrrandid,

Avaliku võtmega krüptograafia

Mathematica kasutamine

Sirgete varraste vääne

MATEMAATILISEST LOOGIKAST (Lausearvutus)

Eesti koolinoorte 26. füüsika lahtine võistlus

1.1. NATURAAL-, TÄIS- JA RATSIONAALARVUD

8. KEEVISLIITED. Sele 8.1. Kattekeevisliide. Arvutada kahepoolne otsõmblus terasplaatide (S235J2G3) ühendamiseks. F = 40 kn; δ = 5 mm.

Keerukusteooria elemente

Ecophon Square 43 LED

Jätkusuutlikud isolatsioonilahendused. U-arvude koondtabel. VÄLISSEIN - COLUMBIA TÄISVALATUD ÕÕNESPLOKK 190 mm + SOOJUSTUS + KROHV

Browni liikumine magnet- ja elektriväljas anisotroopse keskkonna juhul

Eesti koolinoorte 65. füüsikaolumpiaad

ΔΗΜΟΤΙΚΕΣ ΕΚΛΟΓΕΣ 18/5/2014 ΑΚΥΡΑ

Sissejuhatus mehhatroonikasse MHK0120

1 Kompleksarvud Imaginaararvud Praktiline väärtus Kõige ilusam valem? Kompleksarvu erinevad kujud...

Matemaatiline statistika ja modelleerimine

Krüptoräsid (Hash- funktsioonid) ja autentimine. Kasutatavaimad algoritmid. MD5, SHA-1, SHA-2. Erika Matsak, PhD

PEATÜKK 5 LUMEKOORMUS KATUSEL. 5.1 Koormuse iseloom. 5.2 Koormuse paiknemine

Ehitusmehaanika. EST meetod

5. TUGEVUSARVUTUSED PAINDELE

REAALAINETE KESKUS JAAK SÄRAK

Transcript:

2.2. MAATRIKSI P X OMADUSED 19 2.2.1 Geomeetriline interpretatsioon Maatriksi X (dimensioonidega n k) veergude poolt moodustatav vektorruum (inglise k. column space) C(X) on defineeritud järgmiselt: Defineerides vektori normi valemiga C(X) = {θ : θ = Xβ, β R k }. x = (x T x) 1/2, langeb kahe vektori y 1 ja y 2 vaheline kaugus y 1 y 2 kokku tavalise eukleidilise kaugusega. Sellisel juhul langeb vähimruutude meetodi ülesanne kokku ülesandega leida vektor θ C(X) selliselt, et kaugus y θ oleks minimaalne. Teoreem 2.5 1. Minimaalne kaugus vektorite y ja θ C(X) vahel saavutatakse sellise vektori ˆθ C(X) korral, mille puhul (y ˆθ) C(X). (2.11) Selgitus: Väide 2.11 tähendab, et y ˆθ on risti (ortogonaalne) k~oigi vektoritega x C(X) ehk ˆθ on vektori y ortogonaalne (rist-) projektsioon vektorruumi C(X). 2. Leidub selline vektor ˆθ C(X), mis rahuldab n~ouet 2.11, ta on ühene ja avaldub kujul: ˆθ = P X y = X(X T X) X T y, kus P X = X(X T X) X T on ortogonaalne projektor alamruumi C(X). T~oestus. 1. Olgu ˆθ C(X) selline, et (y ˆθ) C(X), st x T (y ˆθ) = 0 iga x C(X) korral. Siis θ C(X) korral y θ 2 = (y ˆθ + ˆθ θ) T (y ˆθ + ˆθ θ) = (y ˆθ) T (y ˆθ) + (ˆθ θ) T (ˆθ θ) y ˆθ 2,

20 PEATÜKK 2. MUDELI PARAMEETRITE HINDAMINE kuna (y ˆθ) T (ˆθ θ) = 0 ortogonaalsuse n~oudest tulenevalt. On selge, et y θ 2 saavutab miinimumi kui valime θ = ˆθ. 2. Kuna ˆθ C(X), siis v~oime esitada ta maatriksi X veergude lineaarkombinatsioonina: ˆθ = Xβ. Lisan~oudest X T (y ˆθ) = 0 saame, et X T (y Xβ) = 0 ehk X T Xβ = X T y. Saadud v~orrandisüsteem on lahenduv, lahendiks sobib ˆβ = (X T X) X T y, ja seega ˆθ = X ˆβ = X(X T X) X T y = P X y. Seega vähimruutude meetodi puhul minimiseeritakse vaadeldud väärtuste vektori y ja tema prognoosi ŷ = Xβ vaheline eukleidiline kaugus, ˆθ := X ˆβ = arg min β Y Xβ, vaata ka joonist 2.1. Märkus. Olles projektor alamruumi C(X) jätab P X muutmata mistahes vektori x C(X), st P X x = x. Veendume selles. Väide x C(X) tähendab, et vektor x on esitatav kujul x = Xv. Seega P X x = P X Xv = Xv = x. Lemma 2.3 C(X) = C(P X ) T~oestus: x C(X) v,x = Xv. Seega x C(X) kehtib: x = Xv = P X Xv C(P X ). x C(P X ) kehtib: x = P X v = X (X T X) X T v C(X). Järeldus: rank(x) = rank(p X ). (2.12) Näide 2.1 Vaatame erakordselt lihtsat mudelit ja andmestikku. Olgu tehtud kaks vaatlust, y 1 = 4 ja y 2 = 2. Mudeliks, mida soovime hinnata, on y i = µ+ε i. Mudeli poolt määratud vektorruum C(X) on antud juhul kirja pandav järgmisel kujul: {v v = c (1, 1) T,c R}. Olukorda illustreerib alljärgnev joonis.

2.2. MAATRIKSI P X OMADUSED 21 Joonis 2.1: Vaatlusvektori Y projektsioon maatriksi X veergude ruumile on lineaarse mudeli prognoos, Ŷ = P Y (= X ˆβ)

22 PEATÜKK 2. MUDELI PARAMEETRITE HINDAMINE 2.3 Suurima t~oepära hinnang Sageli on v~oimalik teha eelduseid ka uuritava tunnuse jaotuse kohta. Teades uuritava tunnuse jaotust v~oime otsitavad parameetrid leida suurima t~oepära meetodil. Üks praktikas k~oige sagedamini esinev jaotus on normaaljaotus. Antud peatükis vaatamegi, millise hinnangu parameetritele saame, kui uuritava tunnuse Y jaotuseks oleks normaaljaotus. Vaatame lineaarset mudelit kus mudeli jääkide jaotuseks on normaaljaotus: Antud mudelit v~oime kirja panna ka kujul: Y = Xβ + ε, (2.13) ε N(0;σ 2 I). (2.14) Y N(Xβ;σ 2 I). (2.15) Kui juhusliku suuruse Y jaotuseks on mitmem~o~otmelise normaaljaotus, Y N(µ;Σ), siis Y tihedusfunktsioon on kirja pandav kujul f Y = 2πΣ 1/2 exp( (Y µ) T Σ 1 (Y µ)/2). (2.16) Seega on valimi t~oepärafunktsiooniks ( L(β, σ) = 2πσ 2 I 1/2 exp (y Xβ)T (σ 2 I) 1 ) (y Xβ) 2 ( = (2πσ 2 ) n/2 exp (y ) Xβ)T (y Xβ) 2σ 2 ja log-t~oepära (2.17) (2.18) l(β, σ) = n 2 log(2πσ2 ) (y Xβ)T (y Xβ) 2σ 2. (2.19) Maksimiseerime log-t~oepära saamaks suurima t~oepära hinnangut. Leiame esmalt tuletise β järgi = 1 (y Xβ) T (y Xβ) 2σ 2 = 1 (y Xβ) 2σ 2 2(y Xβ) = 1 2σ 2( XT )2(y Xβ)

2.3. SUURIMA T~OEPÄRA HINNANG 23 ja v~ordsustame saadud tuletise seejärel nulliga = 0 1 2σ 2( XT )2(y Xβ) = 0 X T Xβ = X T Y. Saadud v~orrandisüsteemi lahendiks sobib aga ju hinnang ˆβ ML = (X T X) X T y: X T X ˆβ ML = X T X(X T X) X T y = X T P X y = X T y Seega langeb suurima t~oepära meetodil saadud hinnang (mis ei pruugi olla ühene!) parameetervektorile β kokku vähimruutude meetodil saadud hinnanguga, ˆβ ML = ˆβ. Kui vähimruutude meetod ei pakkunud meile v~oimalust hinnata jääkide dispersiooni σ 2, siis suurima t~oepära meetodil v~oime saada hinnangu ka sellele parameetrile. Leiame log-t~oepärafunktsiooni tuletise σ 2 järgi, asendame β leitud suurima t~oepära hinnanguga ning saamegi kätte lahendi. σ 2 = n 2 (2πσ2 ) 1 (2π) (y Xβ)T (y Xβ) ( 1σ 4 ) 2 = n 1 2 σ 2 + ((I P X)y) T ((I P X )y) 1 2 (σ 2 ) 2 Paneme tähele, et (I P X ) T (I P X ) = (I P X )(I P X ) = (I P X ). Seega saame tuletise v~ordsustamisel nulliga tulemuseks σ 2 = 0 n 1 2 σ 2 + ((I P X)y) T ((I P X )y) 1 2 (σ 2 ) 2 = 0 n 2 σ2 = y T (I P X )y/2 σ 2 = yt (I P X )y n Märkus: Nagu hiljem näeme, on saadud suurima t~oepära hinnang dispersioonile nihkega hinnang. Saadud hinnangut kasutatakse praktikas harva, pigem eelistatakse nihketa hinnangut.