Regresná a korelačná analýza

Σχετικά έγγραφα
Rozdiely vo vnútornej štruktúre údajov = tvarové charakteristiky

Start. Vstup r. O = 2*π*r S = π*r*r. Vystup O, S. Stop. Start. Vstup P, C V = P*C*1,19. Vystup V. Stop

Matematika Funkcia viac premenných, Parciálne derivácie

Obvod a obsah štvoruholníka

Regresná analýza x, x,..., x

u R Pasívne prvky R, L, C v obvode striedavého prúdu Činný odpor R Napätie zdroja sa rovná úbytku napätia na činnom odpore.

Matematika prednáška 4 Postupnosti a rady 4.5 Funkcionálne rady - mocninové rady - Taylorov rad, MacLaurinov rad

Metódy vol nej optimalizácie

Ekvačná a kvantifikačná logika

Jednotkový koreň (unit root), diferencovanie časového radu, unit root testy

Cvičenie č. 4,5 Limita funkcie

Moderné vzdelávanie pre vedomostnú spoločnosť Projekt je spolufinancovaný zo zdrojov EÚ M A T E M A T I K A

1. písomná práca z matematiky Skupina A

6 APLIKÁCIE FUNKCIE DVOCH PREMENNÝCH

ARMA modely čast 2: moving average modely (MA)

Kreditné riziko (2. časť)

Goniometrické rovnice a nerovnice. Základné goniometrické rovnice

1. Limita, spojitost a diferenciálny počet funkcie jednej premennej

7. FUNKCIE POJEM FUNKCIE

Chí kvadrát test dobrej zhody. Metódy riešenia úloh z pravdepodobnosti a štatistiky

M6: Model Hydraulický systém dvoch zásobníkov kvapaliny s interakciou

Motivácia Denícia determinantu Výpo et determinantov Determinant sú inu matíc Vyuºitie determinantov. Determinanty. 14. decembra 2010.

Matematika 2. časť: Analytická geometria

CHÉMIA Ing. Iveta Bruončová

3. Striedavé prúdy. Sínusoida

Základy matematickej štatistiky

Motivácia pojmu derivácia

ARMA modely čast 2: moving average modely (MA)

KATEDRA DOPRAVNEJ A MANIPULAČNEJ TECHNIKY Strojnícka fakulta, Žilinská Univerzita

Testy dobrej zhody. H 0 : f(x) = g(x) ; H 1 : f(x) g(x)

Harmonizované technické špecifikácie Trieda GP - CS lv EN Pevnosť v tlaku 6 N/mm² EN Prídržnosť

Definícia parciálna derivácia funkcie podľa premennej x. Definícia parciálna derivácia funkcie podľa premennej y. Ak existuje limita.

Komplexné čísla, Diskrétna Fourierova transformácia 1

,Zohrievanie vody indukčným varičom bez pokrievky,

HASLIM112V, HASLIM123V, HASLIM136V HASLIM112Z, HASLIM123Z, HASLIM136Z HASLIM112S, HASLIM123S, HASLIM136S

UCL LCL X R. X, σ, Cpk SPÔSOBILOSŤ PROCESU TS ISO

Odporníky. 1. Príklad1. TESLA TR

Jednotkový koreň (unit root), diferencovanie časového radu, unit root testy

Hľadanie, skúmanie a hodnotenie súvislosti medzi znakmi

Základy práce s ekonometrickým programom GRETL

Spojité rozdelenia pravdepodobnosti. Pomôcka k predmetu PaŠ. RNDr. Aleš Kozubík, PhD. 26. marca Domovská stránka. Titulná strana.

1 Merania, neistoty a korelácie Popis dát Typy dát Zobrazovanie dát Priemery

Kontrolné otázky na kvíz z jednotiek fyzikálnych veličín. Upozornenie: Umiestnenie správnej a nesprávnych odpovedí sa môže v teste meniť.

PRIEMER DROTU d = 0,4-6,3 mm

Úvod do lineárnej algebry. Monika Molnárová Prednášky

Podnikateľ 90 Mobilný telefón Cena 95 % 50 % 25 %

Panelové dáta v programe EViews

Numerické metódy matematiky I

Priamkové plochy. Ak každým bodom plochy Φ prechádza aspoň jedna priamka, ktorá (celá) na nej leží potom plocha Φ je priamková. Santiago Calatrava

REZISTORY. Rezistory (súčiastky) sú pasívne prvky. Používajú sa vo všetkých elektrických

Riadenie zásobníkov kvapaliny

Základy metodológie vedy I. 9. prednáška

Rozsah hodnotenia a spôsob výpočtu energetickej účinnosti rozvodu tepla

Metodicko pedagogické centrum. Národný projekt VZDELÁVANÍM PEDAGOGICKÝCH ZAMESTNANCOV K INKLÚZII MARGINALIZOVANÝCH RÓMSKYCH KOMUNÍT

2 Chyby a neistoty merania, zápis výsledku merania

x x x2 n

Analýza poruchových stavov s využitím rôznych modelov transformátorov v programe EMTP-ATP

24. Základné spôsoby zobrazovania priestoru do roviny

III. časť PRÍKLADY ÚČTOVANIA

Tomáš Madaras Prvočísla

Modelovanie dynamickej podmienenej korelácie kurzov V4

Integrovaná optika a. Zimný semester 2017

Numerické metódy Učebný text pre bakalárske štúdium

Makroekonomické agregáty. Prednáška 8

Reprezentácia dát. Ing. Martin Mariš, Katedra regionalistiky a rozvoja vidieka, SPU, NITRA

3. prednáška. Komplexné čísla

Cieľom cvičenia je zvládnuť riešenie diferenciálnych rovníc pomocou Laplaceovej transformácie,

Funkcie - základné pojmy

Prechod z 2D do 3D. Martin Florek 3. marca 2009

Kontrolné otázky z jednotiek fyzikálnych veličín

Návrh vzduchotesnosti pre detaily napojení

HANA LAURINCOVÁ KLASICKÝ VS. NEPARAMETRICKÝ PRÍSTUP Štatistika Poistná matematika

Numerické metódy Zbierka úloh

Vyhlásenie o parametroch stavebného výrobku StoPox GH 205 S

ZADANIE 1_ ÚLOHA 3_Všeobecná rovinná silová sústava ZADANIE 1 _ ÚLOHA 3

Vlastnosti regulátorov pri spätnoväzbovom riadení procesov

Elektrotechnická fakulta, Žilinská univerzita v Žiline Katedra Telekomunikácií

Pevné ložiská. Voľné ložiská

1. písomná práca z matematiky Skupina A. 1. písomná práca z matematiky Skupina B

KATALÓG KRUHOVÉ POTRUBIE

FINANČNÁ ANALÝZA PROJEKTU pre investičné projekty

Obsah. 1.1 Reálne čísla a ich základné vlastnosti Komplexné čísla... 8

Matematika 2. časť: Funkcia viac premenných Letný semester 2013/2014

Využitie programu Microsoft Excel pri ekonometrickom modelovaní

Integrovanie racionálnych funkcií

Cvičenia zo ŠTATISTIKY v Exceli Kurz IPA-Slovakia, september 2008, VYHNE

r r t r r t t r t P s r t r P s r s r r rs tr t r r t s ss r P s s t r t t tr r r t t r t r r t t s r t rr t Ü rs t 3 r r r 3 rträ 3 röÿ r t

Život vedca krajší od vysnívaného... s prírodou na hladine α R-P-R

Meno: Teória Tabuľka Výpočet Zaokrúhľovanie Záver Graf Meranie

Obsah. 1.1 Základné pojmy a vzťahy Základné neurčité integrály Cvičenia Výsledky... 11

Gramatická indukcia a jej využitie

Goniometrické substitúcie

METODICKÁ SMERNICA NA AKREDITÁCIU METHODICAL GUIDELINE FOR ACCREDITATION VYJADROVANIE NEISTÔT MERANIA PRI KALIBRÁCII (EA-4/02)

C. Kontaktný fasádny zatepľovací systém

AerobTec Altis Micro

Ján Buša Štefan Schrötter

Obyčajné diferenciálne rovnice

Vektorové a skalárne polia

6 Limita funkcie. 6.1 Myšlienka limity, interval bez bodu

PREHĽAD ZÁKLADNÝCH VZORCOV A VZŤAHOV ZO STREDOŠKOLSKEJ MATEMATIKY. Pomôcka pre prípravný kurz

Transcript:

zahrančná vysoká škola B A N S K Á B Y S T R I C A Štatstka Regresná a korelačná analýza Pracovné lsty pre kombnovanú formu štúda Autor: doc. Ing. Vladmír Úradníček, Ph.D. Tento učebný text, an žadnu jeho časť nemožno reprodukovať bez súhlasu autora. Text neprešel jazykovou úpravou. Aktualzované vydane december 01

Základné pojmy Regresná analýza skúma prebeh závslost medz sledovaným znakm. Korelačná analýza skúma tesnosť závslost medz sledovaným znakm. Jednoduchá lneárna regresa Základnou metódou, ktorá sa používa pre odhad vektora neznámych regresných koefcentov a parametrov rozdelena náhodných chýb (za predpokladu splnena všetkých klasckých predpokladov) v lneárnom regresnom model je tzv. jednoduchá metóda najmenších štvorcov - JMNŠ (presnejše metóda najmenšeho súčtu štvorcov - v angl. tzv. Ordnary Least Squares OLS), ktorú navrhol vynkajúc nemecký matematk a fyzk Carl Fredrch Gauss (1777-1855). Lneárny regresný model má analytcký záps: Y = β0 + β1 X + ε, = 1,,, n (1) ktorého odhadom je regresná funkca yˆ( x ) = y = b0 + b1 x, = 1,,, n. () MNŠ spočíva v mnmalzác súčtu štvorca odchýlek emprckých hodnôt y od regresnej funkce. 1 ( b0, b 1) = n y 0 1x ( β0, β1 ) = 1 arg mn ( β β ). (3) Dá sa ukázať, že rešením (3) sú vzťahy pre výpočet odhadov a a b: b = b = y b x, (4) b 0zx 0 1zx cov xy = b =. (5) 1zx 1 sx n kde a yx sa nazýva lokujúca konštanta vo všeobecnost nemá ekonomckú nterpretácu; b yx sa nazýva regresný koefcent udáva, o koľko merných jednotek môžeme očakávať, že sa v premere zmení závslá náhodná premenná y, ak sa nezávsle premenná x zmení o jednu mernú jednotku; cov xy sa nazýva (výberová) kovaranca medz x a y a je defnovaná ako artmetcký premer _ súčnu odchýlek x x a _ y y, tj. de o spoločnú meru varablty (ko-varancu) pre dva znaky (x a y). V prípade netredených údajov, môžeme predchádzajúcu defnícu analytcky zapísať vzťahom: n x x. y y = 1 cov xy =. (6) n Ak je cov xy > 0, potom medz x a y je prama lneárna závslosť. Ak je cov xy < 0, potom medz x a y je neprama lneárna závslosť. 1 Pre použte JMNŠ je potrebné aby vyrovnávaca funkca (regresná funkca) bola lneárna alebo lnearzovateľná vo svojch parametroch.

Ak sú x a y nezávslé, potom sa cov xy = 0, resp. ak sa cov xy = 0, potom sú x a y lneárne nezávslé, tzv. nekorelované. Príklad 1: V desatch vybratých prevádzkach stej frmy sa skúmal vzťah medz objemom produkce (v ts. ks) a celkovým nákladm (v ts. ). Bol zstené údaje uvedené v tabuľke 1 : Tabuľka 1 Vstupné dáta Prevádzka 1.. 3. 4. 5. 6. 7. 8. 9. 10. Produkca 4 6 5 3 1 8 10 1 9 Celkové náklady 11 1 15 14 10 6 18 5 17 Prameň: Vlastné spracovane. Úloha: Za predpokladu nezmeneného lneárneho vývoja odhadnte, aké celkové náklady môže očakávať prevádzka, ktorej objem produkce je 7 ts. ks výrobkov. Rešene: Úvodom rešena úloh podobného typu je konštrukca tzv. bodového dagramu, ktorý je grafckým znázornením závslost dvoch javov. Pre náš príklad bol pomocou softvérového produktu MS Excel skonštruovaný nasledovný bodový dagram obrázok 1. Jeho vzuálnou analýzou sa potvrdl náš počatočný predpoklad o lneárnom vývoj závslost medz celkovým nákladm a objemom produkce. Vývoj závslost celkových nákladov od q 30 5 0 15 10 5 0 0 4 6 8 10 1 14 Objem produkce - q (v ts. ks) Obrázok 1 Bodový dagram Prameň: Vlastné spracovane, 011. V našom príklade použjeme na rešene úlohu MS Excel: Údaje Analýza dát Regresa. Výstupná zostava má potom tvar: Neznamená to, že sú automatcky aj úplne nezávslé. Môže tam byť ný typ závslost ako lneárna závslosť. Napr. kvadratcká závslosť a p. 3

VÝSLEDEK Regresní statstka Násobné R 0.97487 Hodnota spolehlvost R 0.94935 Nastavená hodnota spolehlvost R 0.94889 Chyba stř. hodnoty 1.365879 Pozorování 10 ANOVA Rozdíl SS MS F Významnost F Regrese 1 79.075 79.08 149.5879 1.85413E-06 Rezdua 8 14.95 1.8656 Celkem 9 94 Koefcenty Chyba stř. hodnoty t Stat Hodnota P Dolní 95% Hrance 5.85 0.86385767 6.7719 0.00014 3.858 7.84 Produkca 1.55 0.14687108 1.31 1.85E-06 1.37 1.813 Obrázok Výstup z MS Excel Prameň: Vlastné spracovane, 011. Hľadaná regresná pramka má tvar: y = 5,85 + 1,55 x. Lokujúca konštanta a yx = 5,85 má v našom prípade ekonomckú nterpretácu. Predstavuje výšku fxných nákladov. Regresný koefcent b yx = 1,55 nás nformuje, že pr zvýšení objemu výroby o jednu mernú jednotku (o 1 ts. ks) môžeme očakávať, že celkové náklady vzrastú v premere o 1,55 ts.. V tomto type nákladového modelu de zároveň o tzv. margnálne náklady. Za predpokladu nezmeneného lneárneho vývoja závslost celkových nákladov od objemu produkce môžeme potom očakávať, že prevádzka, ktorá má vo svojom pláne vyrobť 7 ts. ks výrobkov, bude mať celkové náklady vo výške ŷ 7 = 5,85 + 1,55. 7 = 16,55 ts.. Koefcent (párovej) koreláce ˆ Koefcent koreláce je merou tesnost lneárnej závslost. Párový koefcent koreláce je defnovaný ako podel kovarance medz x a y k podelu súčnu ch smerodajných odchýlek, tj. cov xy ryx =. (7) s. s x y ( ) Horní 95% 4

Koefcent párovej koreláce (tzv. Pearsonov koefcent koreláce) nadobúda svoje hodnoty z ntervalu 1, + 1, prčom čím blžše je jeho hodnota k 1, resp. k +1, tým je závslosť tesnejša, čím blžše je k nule, tým je závslosť slabša. Koefcent koreláce mera obojstranne tesnosť závslost medz x a y. Štvorec koefcenta koreláce R sa nazýva koefcent determnáce a po vynásobení 100 udáva, koľko percent varablty závslej premennej Y sa dá vyjadrť (je podmenená, je vyvolaná) varabltou nezávsle premennej x v danom model. Prípadne ho môžeme nterpretovať: Koľko percent zmen v závslej premennej Y sa dá vysvetlť daným modelom. Koefcent determnáce (pred vynásobením 100) nadobúda hodnoty z ntervalu 0, + 1. V príklade 1 je hodnota koefcenta koreláce vo výstupnej zostave MS Excel v prvom radku (Násobné R). POZOR!!! : V prípade jednoduchej regresnej pramky je potrebné ešte prradť tomuto koefcentu znamenko podľa toho, aké znamenko má regresný koefcent. V našom prípade r yx = 0,974, čže medz oboma sledovaným znakm je veľm slná prama lneárna závslosť. Koefcent determnáce (vo výstupnej zostave MS Excel tzv. Hodnota spoľahlvost R) dosahol v príklade 1 hodnotu R = 0,949, t.j. môžeme povedať, že 94,9 % zmen v celkových nákladoch sa dá vysvetlť zmenam v objeme produkce v danom model. (a len 5,1 % zmen celkových nákladov je spôsobených ným čnteľm, ktoré sme daným modelom neuvažoval tvora súčasť tzv. náhodnej zložky modelu). Združená regresa Ak zameníme závslú a nezávslú premennú, potom hovoríme o tzv. združenej regres. Združená regresná pramka k modelu () bude potom tvaru: x = axy + bxy y, = 1,,, n. (8) Nelneárna regresa Príkladom nelneárnych regresných modelov, ktoré sú vo svojch parametroch lneárne alebo lnearzovateľné, sú kvadratcká parabola exponencála typu ˆ 0. x y = b b1, = 1,,..., n., = 1,,..., n a Kvadratcký (parabolcký) regresný model Y = β + β x + β x + ε, = 1,,..., n. 0 1 Odhad kvadratckého (parabolckého) modelu yˆ = b0 + b1 x + b x, = 1,,..., n je lneárny vo svojch parametroch, a preto môžeme pramo použť metódu najmenších štvorcov. Dané typy úloh môžeme v MS Excel rešť tak, že do vstupného poľa pre nezávslú premennú zadáme súčasne vedľa seba sa nachádzajúce vstupné dáta nezávslej premennej X a vytvorenej premennej X. Príklad : yˆ = b0 + b1 x + b x Výsledky skúšok nového praceho prášku vo veľkokapactnej automatckej práčke sú uvedené v tabuľke : 5

Tabuľka Vstupné dáta Dávka praceho prostredku (v 100g) 1 3 4 5 6 7 8 Účnnosť praceho prostredku (v %) 3 56 51 8 7 100 59 54 Prameň: Vlastné spracovane. Úloha: Vypočítajte, s akou účnnosťou praceho prostredku môžeme počítať pr dávke 550 gramov, ak vete, že vývoj závslost účnnost praceho prostredku od jeho dávky je modelovaný konkávnou parabolou druhého stupňa. Rešene: Vzťah medz dávkou a účnnosťou 10 100 80 60 40 0 0 0 5 10 účnnosť dávka Obrázok 3 Vzťah medz dávkou a účnnosťou Prameň: Vlastné spracovane. Tabuľka 3 Zadane vstupných dát do MS Excel-u y x x 3 1 1 56 4 51 3 9 8 4 16 7 5 5 100 6 36 59 7 49 54 8 64 Prameň: Vlastné spracovane, 011. 6

Výstupná zostava z MS Excel má tvar: VÝSLEDEK Regresní statstka Násobné R 0.860771 Hodnota spolehlvost R 0.74097 Nastavená hodnota spolehlvost R 0.63797 Chyba stř. hodnoty 13.8365 Pozorování 8 ANOVA Rozdíl SS MS F Významnost F Regrese 737.631 1368.815 7.149773 0.034163 Rezdua 5 957.44 191.4488 Celkem 7 3694.875 Koefcenty Chyba stř. hodnoty t Stat Hodnota P Dolní 95% Hrance -8.44643 19.3039-0.43755 0.679967-58.0687 41.17588 x 34.875 9.84195 3.543505 0.016501 9.57546 60.17454 x -3.3869 1.067509-3.177 0.04739-6.1310-0.6478 Obrázok 4 Výstup z MS Excel-u Prameň:Vlastné spracovane, 011. Dostávame, že b 0 = - 8,446 ; b 1 = 34,875 ; b = - 3,387. Interpretáca: Odhad regresného modelu má tvar: y = 8, 446 + 34,875x 3,387x a ak použjeme dávku vo výške 550 g, potom môžeme očakávať, že účnnosť praceho prostredku bude ŷ(5,5) = 80,91 %. V danom príklade má zmysel nterpretovať koefcent determnáce R = 0,74, t.j. 74 % zmen v účnnost praceho prostredku sa dá vysvetlť daným modelom. Horní 95% Exponencálna regresa x Y = β β + ε, = 1,,..., n. 0 1 Odhad ˆ 0. x y = b b1, = 1,,..., n exponencálneho regresného modelu ne je lneárny vo svojch parametroch. Jednoduchou úpravou sa dá lnearzovať. Po zlogartmovaní: ˆ x 0 1 x ln y = ln(b, b ) = ln b + ln b = ln b + x ln b. 0 1 0 1 Po substtúc: Y = ln y regresného modelu, B 0 = ln b 0 a B 1 = ln b 1, dostaneme formálne odhad lneárneho 7

Y = B + B x 0 1. (9) Následne môžeme aplkovať metódu najmenších štvorcov. Jej rešením získame odhady B 0 a B 1. V MS Excel zadávame do poľa pre dáta závslej premennej Y transformovanú premennú lny. Na záver musíme spätne odtransformovať: b0 B = e 0 1 1 B a b = e. (10) Príklad 3: V stej tlačarn ste na 1 zaradenach sledoval dva znaky: X vek zaradena, Y ročné náklady na opravu a údržbu príslušného zaradena (v 1000 ). Zstené výsledky sú uvedené v Tabuľke 4: Tabuľka 4 Vstupné dáta Stroj číslo 1 3 4 5 6 7 8 9 10 11 1 x 1 4 8 7 10 3 9 4 5 5 y 1 1 3 1 8 3 5 8 6 11 4 Prameň: Vlastné spracovane. Úloha: Pomocou exponencálnej regresnej funkce odhadnte, s akým ročným nákladm na opravu a údržbu môžeme počítať pr stroj, ktorý bol vyrobený pred a) 6 rokm, b) 1 rokm. Rešene: Rešením bude odhad = y b.b x 0 1 Tabuľka 5 Vstupné dáta v MS Excel- lny x 0,00 1 0,69 4,48 8 1,10 0,00,08 7 3,14 10 1,61 3,08 9 1,79 4,40 5 1,39 5 Prameň: Vlastné spracovane. VÝSLEDEK 8

Regresní statstka Násobné R 0.846958 Hodnota spolehlvost R 0.717338 Nastavená hodnota spolehlvost R 0.68907 Chyba stř. hodnoty 0.54504 Pozorování 1 ANOVA Rozdíl SS MS F Významnost F Regrese 1 7.538557 7.538557 5.378 0.000508 Rezdua 10.970509 0.97051 Celkem 11 10.50907 Koefcenty Chyba stř. hodnoty t Stat Hodnota P Dolní 95% Hrance 0.147376 0.3114 0.45758 0.657071-0.57034 0.86509 X 0.83191 0.05615 5.037658 0.000508 0.157937 0.408446 Obrázok 5 Výstup z MS Excel-u Prameň: Vlastné spracovane, 011. Rešením sme získal odhady B 0 = 0,148 a B 1 = 0,83. B Po odtransformovaní = e 0,148 0 B1 b0 = e = 1,159 a b1 = e = 1,37. Interpretáca: Pr stroj, ktorý bol vyrobený pred šestm rokm, môžeme očakávať, za predpokladu nezmenených podmenok, ročné náklady na opravu a údržbu vo výške 6 y(6) 1,159.1,37 6,33 = = tsíc a pr stroj, ktorý bol vyrobený pred 1 rokm, 1 y(1) = 1,159.1,37 = 34, 6 (v 1000 ). Koefcent determnáce R = 0,717 udáva, že daný model vysvetľuje prblžne 71,7 % zmen v ročných nákladoch na opravu a údržbu rokm, ktoré uplynul od jeho výroby. Poznámka: Ak by sme chcel rozhodnúť ktorý z trojce modelov pramka, parabola, exponencála lepše modeluje realtu (ktorý model vyšším percentom vysvetľuje zmeny v sledovanej závslej premennej), potom môžeme na to využť tzv. korgovaný koefcent determnáce R kor. ( tzv. Nastavená hodnota spoľahlvost v R vo výstupe MS Excelu). Tento koefcent má rovnakú nterpretácu ako koefcent determnáce. Horní 95% Spearmanov koefcent koreláce Neparametrcký koefcent koreláce Spearmanov koefcent koreláce je defnovaný ako 9

6 = = 1 n (n 1 RS n d 1), (11) kde d = rozdel medz poradím znakov x a y, n = rozsah náhodného výberu. Tento koefcent môže nadobúdať hodnoty z ntervalu < -1, +1 >, prčom nterpretáca výsledkov je rovnaká ako pr Pearsonových koefcentoch párovej koreláce. Zvykne sa využívať najmä v prípadoch, ak aspoň jeden z dvojce X a Y je kvaltatívnym znakom (osobtne ordnálnym kvaltatívnym znakom). Vacnásobná regresa Vo fnančno-ekonomckej prax sa najčastejše stretávame so stuácou, keď závslá náhodná premenná y závsí od celého komplexu k nezávslých premenných 3 (x 1, x,,x k ). Napr. mesačné výdavky domácnost na potravny môžu závseť od príjmu domácnost, od ch úspor, od počtu členov domácnost, od cenovej hladny atď. Vacnásobný regresný model môžeme potom vo všeobecnost zapísať: Y = β 1x1 + β x + β 3x 3 +... + β kxk + ε, = 1,,, n, (1) kde β = (β 1, β,, β k ) je vektor neznámych parametrov a ε je náhodná zložka modelu. Vzťah (1) by sme mohl rozpísať do systému rovníc: y1 = β 1x11 + β x1 + β 3x 13 +... +β kx1k + ε1 y = β x + β x +β x +... + β x + ε y = β x + β x +β x +... +β x + ε 1 1 3 3 k k n 1 n1 n 3 n3 k nk n ktorému zodpovedá matcový záps, Y = X β + ε, (13) kde y = (y 1, y,, y n ), β = (β 1, β,, β k ), ε = (ε 1, ε,, ε n ) a x11 x1 K x1 k X = M O M. xn1 xn L xnk Po aplkovaní metódy najmenších štvorcov dostaneme odhad: Y = b +b x +b x +...+b x, = 1,,..., n, (14) ˆ 1 3 3 k k 3 Z hľadska dodržana jedného z predpokladov modelu sa odporúča, aby počet pozorovaní bol mnmálne trojaž štvornásobne väčší, ako je počet odhadovaných parametrov modelu. 10

tzv. vyrovnanú alebo predkovanú hodnotu Y, v ktorej b = ( b 1, b,..., b k ) je bodovým odhadom (neznámeho) vektora β. Z praktckých dôvodov sa zvyčajne zavádza ako x 1 umelá premenná, ktorá má všetky realzáce (hodnoty) rovnajúce sa jednej. Potom ak ďalše nezávslé premenné prendexujeme, dostaneme vzťah: y = β 1 + β x1 + β 3x +... + β kxk 1 + ε, = 1,,, n, (15) ktorého odhadom je: y = b + b x + b x +... + b x 1 1 3 k k 1, = 1,,, n. (16) Korelačná matca Matca korelačných koefcentov korelačná matca: Ak máme vac nezávsle premenných X 1, X,, X K, potom zapsujeme koefcenty koreláce v tvare matce korelačných koefcentov, ktorá má na hlavnej dagonále jednotky a ďalše jej prvky tvora párové koefcenty koreláce medz X a X j, j. V programe MS Excel ju môžeme v dolnom trojuholníkovom tvare dostať ako výstup procedúry Údaje Analýza dát Koreláca. Príklady na samoštúdum Príklad 1: V patch vybratých prevádzkach stej frmy sa skúmal vzťah medz objemom produkce (v ks) a celkovým nákladm (v ts. ) prpadajúcch na jeden deň. Bol zstené nasledovné údaje: Tabuľka 1 Vstupné dáta Prevádzka Produkca Celkové náklady 1 9 4 1 3 6 15 4 5 14 5 3 10 a) Za predpokladu nezmeneného lneárneho vývoja, odhadnte, aké celkové náklady môže očakávať prevádzka, ktorej objem produkce je 7 m.j. ( ˆ y = 5,6 + 1,6 x ; y ˆ (7) = 16,8 ) b) Vypočítajte a nterpretujte koefcent koreláce a ndex determnáce medz sledovaným znakm. (r =0,99; R = 0,985 ) 11

Príklad : V podnku počas sledovaného obdoba získal údaje o dennom objeme výroby jedného druhu výrobku v ts. kusov a nákladoch na jeho výrobu v tsícoch. Zstené údaje sú uvedené v súbore Regresa_data.xls (lst Pr ). a) Bodovým grafom znázornte vzťah medz celkovým nákladm a objemom výroby. b) Lneárnou nákladovou funkcou odhadnte vzťah medz celkovým nákladm a objemom výroby a nterpretujte regresné parametre. ( y ˆ =6,464+0,968x ) c) Odhadnte výšku celkových nákladov pr objeme výroby 6 00 ks. ( y ˆ (6,)= 3,47 ts. ) d) Vypočítajte a nterpretujte korelačný koefcent. (r =0,98) e) Koľko percent varablty celkových nákladov sa dá vysvetlť varabltou objemu výroby? (Koľko % zmen v celkových nákladoch sa dá vysvetlť zmenam v objeme výroby). (R = 0,95) Príklad 3: Majteľ sete predajní s počítačovou technkou pravdelne sleduje svoje týždenné tržby v tsícoch a vynaložené náklady na reklamu v stovkách. Keďže predpokladá závslosť medz týmto ukazovateľm, chce odhadnúť funkcu, modelujúcu túto závslosť s využtím pre extrapolácu. V súbore Regresa_data.xls (lst Pr 3) sú zstené hodnoty výšky tržeb a nákladov na reklamu za nekoľko mesacov prevádzky sete predajní. a) Modelujte prebeh závslost tržeb od nákladov pramkou, parabolou a exponencálou. Pramka: y ˆ = 0,787+0,188x Parabola: y ˆ = -1,054+0,63x -0,0x Exponencála: y ˆ = 0,87.1,107 x b) Rozhodnte, ktorý z troch modelov pramka, parabola, exponencála najlepše charakterzuje prebeh závslost tržby od nákladov na reklamu a svoje tvrdene zdôvodnte. Príklad 4: Výrobca nového modelu automoblu sledoval pr rovnakých prevádzkových podmenkach závslosť spotreby benzínu v ltroch od rýchlost v klometroch za hodnu. Výsledky merana sú obsahom lstu Pr 4 v súbore Regresa_data.xls. a) Vzťah medz spotrebou benzínu a rýchlosťou auta odhadnte parabolou. ( y ˆ = 7,6-0,055x +0,0004x ) b) Zstte a nterpretujte koefcent determnáce. (R = 0,978) Príklad 5: Na základe údajov zo súboru Regresa_data.xls (lst Pr 5) pomocou exponencálnej funkce charakterzujte prebeh závslost výdavkov za služby (Y) v od výšky príjmu domácnost (X) v za mesac v 10 náhodne vybraných domácnostach. Ďalej odhadnte, akú sumu vydá za služby domácnosť, ktorá mala v danom mesac príjem 850. ( y ˆ = 50,5-1,00 x ; y ˆ (850)=40,34) 1

Príklad 6: V realtnej kancelár sa sledovala súvslosť ceny bytu (v ts. ) s jeho rozlohou (v m ) a merou nezamestnanost (v %) v okrese, kde sa byt predáva. Zstené údaje o 0 náhodne vybraných bytoch sú uvedené v súbore Regresa_data.xls (lst Pr 6). a) Za predpokladu lneárnej závslost ceny predávaného bytu od jeho rozlohy a mery nezamestnanost v danom okrese odhadnte regresnú funkcu. Interpretujte jeho parametre. ( y ˆ = -0,43+1,7x 1-3,98x ) b) Odhadnte, na koľko percent sa dá varablta ceny bytu vysvetlť varabltou ostatných uvažovaných čnteľov. (R =0,8) c) Odhadnte premernú cenu bytu s rozlohou 65 m v okrese s 15 %-nou nezamestnanosťou. y (65;15)=30,45) Príklad 7: Istá letecká spoločnosť, ktorá zabezpečuje lety na trase Ostrava-Praha, sleduje pr plánovaní letov tež hmotnosť užtočného zaťažena letadla, ktorého významnú časť tvora pasažer a ch batožna. Zstlo sa, že hmotnosť batožny cestujúcch súvsí s dobou, na ktorú odcestoval. Výsledky preskumu sú v nasledovnej tabuľke: Dn 13 1 9 16 10 5 3 8 14 19 3 5 Hmotnosť 46 43 9 5 31 18 11 1 5 10 48 60 15 0 1 a) Nájdte rovncu regresnej pramky popsujúcu vývoj danej závslost. ( ŷ = 4,67 +,99. x ) b) S akou celkovou hmotnosťou batožny cestujúcch môže spoločnosť počítať, ak bude na palube 15 cestujúcch vracajúcch sa o 5 dní, 5 cestujúcch vracajúcch sa o 6 dní a 1 cestujúc vracajúc sa o 14 dní? (445,655) c) Vhodnou merou charakterzujte ntenztu závslost medz sledovaným znakm (r yx =0,993) Príklad 8: V nasledujúcej tabuľke sú uvedené hodnoty troch ndexov BCPP: ndex PX 50, ndex BI 0 potravnárstvo a ndex BI 13 komunkáce (doprava a spoje). PX 50 BI 0 BI 13 489 471 1735 484 471 1705 487 471 176 485 471 173 484 471 179 483 471 174 483 47 17 485 47 1739 485 471 1736 483 473 176 Pomocou programu Excel vypočítajte a nterpretujte korelačnú matcu. PX 50 BI 0 BI 13 PX 50 1 BI 0-0.4767 1 BI 13 0.40053 0.116078 1 ( ˆ 13

Príklad 9: V nasledujúcej tabuľke máte k dspozíc: Y je tržba za predaj potreb a zaradení pre domácnosť v mld. Sk v stálych cenách k 1. 1. 1994 x 1 sú reálne dsponblné peňažné príjmy obyvateľstva v mld. Sk x je ndex cen potreb a zaradení pre domácnosť (v porovnaní s rokom 1994 v %) Rok 1994 1995 1996 1997 1998 1999 000 001 y 7,8 8,3 10,0 10,6 10,4 11, 1,1 13,6 x 1 140 146 16 171 176 187 197 09 x 99 100 101 101 11 114 114 113 a) Skonštruujte jednoduchý lneárny regresný model, ktorý modeluje vývoj tržeb v závslost od dsponblných peňažných príjmov obyvateľstva. ( y = -3,03+0,08x 1 ) b) Vhodnou merou zmerajte ntenztu závslost medz tržbam a reálnym dsponblným príjmam. (r yx = 0,987) c) Vypočítajte, koľkým percentam sa podeľala zmena v dsponblných príjmoch na zmene tržeb, ak medz nm predpokladáme lneárny vzťah. (R = 0,974) d) Ak v roku 00 očakávame výšku ndexu cen potreb a zaradení pre domácnosť vo výške 117 %, vypočítajte očakávanú výšku tržeb za predpokladu nezmeneného vývoja závslost. ( y = -1,4 + 0,14x, t.j. y (117) = 1,64) e) Na základe dát skonštruujte vacnásobný lneárny regresný model a odhadnte jeho parametre. ( y =,14 + 0,099x 1 0,083x ) f) Odhadnte výšku tržeb v roku 00, ak očakávame v tomto roku výšku reálnych dsponblných príjmov obyvateľstva vo výške 1 mld. Sk a hodnotu ndexu cen vo výške 117 %. ( tržby v roku 00: 13,4 mld Sk.) Zoznam použtej lteratúry: 1. KANDEROVÁ, M. ÚRADNÍČEK, V. 007. Štatstka a pravdepodobnosť pre ekonómov. časť. Banská Bystrca: OZ Fnanc, 007. 190 s. ISBN 978-80-969535-1-6.. RAMÍK, J. ČEMERKOVÁ, Š. 001. Statstka pro ekonomy. Hypertextová učebnce. Karvná : Obchodně-podnkatelská fakulta, 001. 3. STUCHLÝ, J. 1999. Statstka I. Cvčení ze statstckých metod pro managery. Praha: VŠE, 1999. 156 s. ISBN 80-7079-754-1. 14