Regresá aalýza
Základé pojmy Regresá aalýza skúma fukčý vzťah (priebeh závislosti), podľa ktorého sa meí závisle premeá Y pri zmeách ezávislých veličí x, x,..., x k. x = ( x, x,..., x ) i i i i T Y = (Y, Y,..., Y ) T
Regresá fukcia Priebeh závislosti odhadujeme vhodými fukciami (tzv. vyrovávajúcimi): kde β, β,..., β p ( ),,, k,,,, p, Y = f x x K x β β K β ε sú ezáme odhadovaé parametre regresej fukcie ε = ( ε, ε,..., ε ) T je áhodá odchýlka (áhodá premeá) Odhadovaé fukcie musia byť lieáre z hľadiska parametrov.
Ozačeia b, b,..., b p sú odhadmi,,..., β β β p Y ˆ = f ( x, x,..., x, b, b,..., b ) k p e = Y Yˆ i i i je odhad ε i
Metóda ajmeších štvorcov Pricíp MNŠ: miimalizujeme výraz ( β ) ( ) ( ( )), β, K, β = ˆ = f,, K,,,, K p i i i i i ik β β, β p S Y Y Y x x x i= i=
Podmieky MNŠ parametreβ j, j =,,..., p, sú eáhodé a ezáme E(ε i ) = 0, D(ε i ) = E(ε i ) = σ ε i sú ekorelovaé, t.j. Cov(ε i, ε j ) = 0 pre i j, x i sú lieáre ezávislé, avyše predpokladajme, že ε i majú ormále rozdeleie.
Vlastosti regresej fukcie získaej MNŠ e = 0 i t.j. súčet reziduálych i= odchýlok je rový ule, i= e i je miimály, regresá fukcia prechádza bodom ( y, x,, x k ) odhad regresej fukcie je ajlepším lieárym evychýleým odhadom
Podľa počtu premeých, ktorých závislosť skúmame, hovoríme o jedoduchej (párovej) regresii viacásobej regresii
Regresá priamka regresý model má tvar: α β ε Y = + x +, i =,, K, i i i + x odhadom regresej fukcie α β je ŷ = a + bx odhady parametrov α,β regresej fukcie a, b vypočítame metódou ajmeších štvorcov: ( ) = ( α β ) = ( ) i α + β i ( α β ) ( α β ),, i= ( ) a, b arg mi S, arg mi Y x
Vypočítame prvé parciále derivácie podľa ezámych parametrov, položíme ich rové ule a dostaeme asledujúcu sústavu dvoch rovíc o dvoch ezámych: y = a + b x i i i i i= i= y x = a x + b x i i i i i i i i= i= i=
Riešeím tejto sústavy získame asledujúcu realizáciu odhadu jedotlivých parametrov: b cov( x, y) = a = - s x y bx Iterpretácie: a lokujúca koštata, emá ekoomickú iterpretáciu b regresý koeficiet, ekoomická iterpretácia - udáva, o koľko merých jedotiek sa v priemere zmeí závisle premeá Y, ak sa ezávisle premeá x zmeí o jedu merú jedotku.
Príklad: Predajňa spoločosti XXX robí zimý výpredaj. O deej tržbe v tis. Sk (zak Y) a výške zľavy v percetách (zak X) máte asledujúce iformácie: Deá tržba - 00-50 - 30-380 - 470-550 Výška zľavy 0 0 30 40 50 60
Úloha: Za predpokladu lieárej závislosti medzi výškou tržieb a výškou zliav, odhadite výšku tržby, ak by v predaji bola zľava a tovar 45 %.
Regresá parabola Model je: Y = α + β X + γ X + ε, i =,, i i i i odhadom vyrovávajúcej fukcie je ŷ = a + bx + cx koeficiety a, b, c eiterpretujeme
Pomocou MNŠ dostávame sústavu troch rovíc o troch ezámych, ktorej riešeím získame hľadaé parametre: y = a + b x + c x i i i i i i i= i= i= x y = a x + b x + c x 3 i i i i i i i i i i= i= i= i= x y = a x + b x 3 + c x 4 i i i i i i i i i i= i= i= i=
Expoeciála model: x i Y =, i =,, K, i i β β ε fukcia ie je v parametroch lieára, musíme ju ajskôr zlogaritmovať, aby sme mohli použiť a odhad parametrov MNŠ: l yˆ = l a + l bx ozačeia: A = l a, B = l b
sústava rovíc z MNŠ: l y = l a + l b x i i i i i= i= x l y = l a x + l b x i i i i i i i i= i= i= riešeím sústavy získame A = l a a B = l b parametre a, b potom vypočítame asledove: b = e B, a = e A Iterpretácia: a emá ekoomickú iterpretáciu b koľkokrát sa zmeí v priemere závisle premeá, ak sa ezávisle premeá zmeí o jedu merú jedotku
Združeá regresia Združeé regresé fukcie dostaeme, ak avzájom zameíme závislú a ezávislú premeú. Uhol, ktorý zvierajú grafy lieárych združeých regresých fukcií (priamky) Y = α + β x + ε yx yx yx a xy xy xy je riešeím koeficietu korelácie (čím je uhol meší, tým je závislosť silejšia) a zároveň platí X r = b b yx yx xy = α + β y + ε
Viacásobá lieára regresia (Y, x, x,...,x k ) Skúma vplyv dvoch alebo viacerých ezávisle premeých a jedu závisle premeú Y. Regresý model môžeme zapísať v maticovom tvare: Y = Xβ +ε jeho odhad: Y ˆ = Xb
Ozačeie v maticovom tvare: Y je vektor závisle premeej s rozmerom β je vektor regresých koeficietov s rozmerom (k+) β Y Y = M Y β 0 = M βk X je matica ezávisle premeých rozmeru (k+) x L x k x L x X= k M M M x L x k
Na odhad parametrov sa používa metóda ajmeších štvorcov. Maticový zápis rovíc pre odhad parametrov je asledujúci: b = (X T X) - X T Y Iterpretácia: yˆ i = b0 + b x i + b xi +... + bk xki, i =,,..., b i o koľko merých jedotiek sa v priemere zmeí závisle premeá, ak sa ezávisle premeá x i zmeí o jedu merú jedotku, za predpokladu, že ostaté ezávislé premeé zostaú koštaté
Normále rovice pre odhad parametrov modelu s dvomi vysvetľujúcimi veličiami yˆ = b + b x + b x i 0 i i y = b + b x + b x i i 0 i i i i i= i= i= x y = b x + b x + b x x i i i 0 i i i i i i i i= i= i= i= x y = b x + b x x + b x i i i 0 i i i i i i i i= i= i= i=
Iterval spoľahlivosti pre regresý koeficiet β je odvodeý z áhodej premeej, ktorá ma Studetovo rozdeleie s - stupňami voľosti kde b je výberový regresý koeficiet, S b = i= S ( X - X ) a T iterval spoľahlivosti e i = b S b β S = ( Y Yˆ ) e i i i= ( b t. S ; b + t. S ) α /, b α /, b
Test hypotézy o regresom koeficiete β test, či je regresý koeficiet štatisticky výzamý: 0 H 0 : β = 0 H : β 0 0 α 3 0 testovacia štatistika 0 4 0 kritická oblasť je daá kvatilmi Studetovho rozdeleia, t.j. ak T T = b S b > t α /,