Panelové dáta v programe EViews

Σχετικά έγγραφα
Jednotkový koreň (unit root), diferencovanie časového radu, unit root testy

Chí kvadrát test dobrej zhody. Metódy riešenia úloh z pravdepodobnosti a štatistiky

Jednotkový koreň (unit root), diferencovanie časového radu, unit root testy

Matematika Funkcia viac premenných, Parciálne derivácie

Základy práce s ekonometrickým programom GRETL

Start. Vstup r. O = 2*π*r S = π*r*r. Vystup O, S. Stop. Start. Vstup P, C V = P*C*1,19. Vystup V. Stop

Ekvačná a kvantifikačná logika

Využitie programu Microsoft Excel pri ekonometrickom modelovaní

M6: Model Hydraulický systém dvoch zásobníkov kvapaliny s interakciou

Obvod a obsah štvoruholníka

Modelovanie dynamickej podmienenej korelácie kurzov V4

ARMA modely čast 2: moving average modely (MA)

ARMA modely čast 2: moving average modely (MA)

Prechod z 2D do 3D. Martin Florek 3. marca 2009

Motivácia Denícia determinantu Výpo et determinantov Determinant sú inu matíc Vyuºitie determinantov. Determinanty. 14. decembra 2010.

7. FUNKCIE POJEM FUNKCIE

Moderné vzdelávanie pre vedomostnú spoločnosť Projekt je spolufinancovaný zo zdrojov EÚ M A T E M A T I K A

Matematika prednáška 4 Postupnosti a rady 4.5 Funkcionálne rady - mocninové rady - Taylorov rad, MacLaurinov rad

Goniometrické rovnice a nerovnice. Základné goniometrické rovnice

3. Striedavé prúdy. Sínusoida

Metódy vol nej optimalizácie

,Zohrievanie vody indukčným varičom bez pokrievky,

Cvičenie č. 4,5 Limita funkcie

1. Limita, spojitost a diferenciálny počet funkcie jednej premennej

Úvod do lineárnej algebry. Monika Molnárová Prednášky

2 Chyby a neistoty merania, zápis výsledku merania

Pevné ložiská. Voľné ložiská

Návrh vzduchotesnosti pre detaily napojení

ΑΝΑΛΥΣΗ ΧΡΗΜΑΤΟΟΙΚΟΝΟΜΙΚΩΝ ΚΑΤΑΣΤΑΣΕΩΝ

PRIEMER DROTU d = 0,4-6,3 mm

Spojité rozdelenia pravdepodobnosti. Pomôcka k predmetu PaŠ. RNDr. Aleš Kozubík, PhD. 26. marca Domovská stránka. Titulná strana.

KATEDRA DOPRAVNEJ A MANIPULAČNEJ TECHNIKY Strojnícka fakulta, Žilinská Univerzita

Komplexné čísla, Diskrétna Fourierova transformácia 1

1. písomná práca z matematiky Skupina A

6 Limita funkcie. 6.1 Myšlienka limity, interval bez bodu

Základy metodológie vedy I. 9. prednáška

KATALÓG KRUHOVÉ POTRUBIE

6 APLIKÁCIE FUNKCIE DVOCH PREMENNÝCH

Kontrolné otázky na kvíz z jednotiek fyzikálnych veličín. Upozornenie: Umiestnenie správnej a nesprávnych odpovedí sa môže v teste meniť.

ZADANIE 1_ ÚLOHA 3_Všeobecná rovinná silová sústava ZADANIE 1 _ ÚLOHA 3

HANA LAURINCOVÁ KLASICKÝ VS. NEPARAMETRICKÝ PRÍSTUP Štatistika Poistná matematika

Priamkové plochy. Ak každým bodom plochy Φ prechádza aspoň jedna priamka, ktorá (celá) na nej leží potom plocha Φ je priamková. Santiago Calatrava

Základy matematickej štatistiky

Hľadanie, skúmanie a hodnotenie súvislosti medzi znakmi

Harmonizované technické špecifikácie Trieda GP - CS lv EN Pevnosť v tlaku 6 N/mm² EN Prídržnosť

Štatistické riadenie procesov Regulačné diagramy 3-1

Život vedca krajší od vysnívaného... s prírodou na hladine α R-P-R

Odporníky. 1. Príklad1. TESLA TR

Analýza údajov. W bozóny.

Motivácia pojmu derivácia

Matematika 2. časť: Analytická geometria

MIDTERM (A) riešenia a bodovanie

Definícia parciálna derivácia funkcie podľa premennej x. Definícia parciálna derivácia funkcie podľa premennej y. Ak existuje limita.

Vyhlásenie o parametroch stavebného výrobku StoPox GH 205 S

SECTION II: PROBABILITY MODELS

Παρασκευή 1 Νοεμβρίου 2013 Ασκηση 1. Λύση. Παρατήρηση. Ασκηση 2. Λύση.

HASLIM112V, HASLIM123V, HASLIM136V HASLIM112Z, HASLIM123Z, HASLIM136Z HASLIM112S, HASLIM123S, HASLIM136S

Analýza hlavných komponentov

AerobTec Altis Micro

Podnikateľ 90 Mobilný telefón Cena 95 % 50 % 25 %

x x x2 n

Rozdiely vo vnútornej štruktúre údajov = tvarové charakteristiky

Cvičenia zo ŠTATISTIKY v Exceli Kurz IPA-Slovakia, september 2008, VYHNE

Analýza poruchových stavov s využitím rôznych modelov transformátorov v programe EMTP-ATP

Vektorový priestor V : Množina prvkov (vektory), na ktorej je definované ich sčítanie a ich

VLASTNÉ ČÍSLA A JORDANOV KANONICKÝ TVAR. Michal Zajac. 3 T b 1 = T b 2 = = = 2b

DOMÁCE ZADANIE 1 - PRÍKLAD č. 2

ŠTATISTICKÉ METÓDY VPRAXI

Metoda hlavních komponent a její aplikace

C. Kontaktný fasádny zatepľovací systém

Obsah. Motivácia a definícia. Metódy výpočtu. Problémy a kritika. Spätné testovanie. Prípadová štúdia využitie v NBS. pre 1 aktívum pre portfólio

TESTOVANIE ŠTATISTICKÝCH HYPOTÉZ. Zdroje: Kompendium statistického zpracování dat, VPS s r. o.

Pilota600mmrez1. N Rd = N Rd = M Rd = V Ed = N Rd = M y M Rd = M y. M Rd = N 0.

REZISTORY. Rezistory (súčiastky) sú pasívne prvky. Používajú sa vo všetkých elektrických

24. Základné spôsoby zobrazovania priestoru do roviny

1 Prevod miestneho stredného slnečného času LMT 1 na iný miestny stredný slnečný čas LMT 2

Numerické metódy matematiky I

difúzne otvorené drevovláknité izolačné dosky - ochrana nie len pred chladom...

Úvod do lineárnej algebry

Integrovanie racionálnych funkcií

Úprava textu. Použitie schránky: Hlavička a Päta: Poznámka pod čiarou: Modul č.3 WORD pre pokročilých

SLOVENSKO maloobchodný cenník (bez DPH)

Obsah. 1.1 Reálne čísla a ich základné vlastnosti Komplexné čísla... 8

Table 1: Military Service: Models. Model 1 Model 2 Model 3 Model 4 Model 5 Model 6 Model 7 Model 8 Model 9 num unemployed mili mili num unemployed

7 Derivácia funkcie. 7.1 Motivácia k derivácii

Zrýchľovanie vesmíru. Zrýchľovanie vesmíru. o výprave na kraj vesmíru a čo tam astronómovia objavili

Gramatická indukcia a jej využitie

Manažment v teórii a praxi 2/2005

Teória pravdepodobnosti

KLP-100 / KLP-104 / KLP-108 / KLP-112 KLP-P100 / KLP-P104 / KLP-P108 / KLP-P112 KHU-102P / KVM-520 / KIP-603 / KVS-104P

Univerzita Karlova v Praze Matematicko-fyzikální fakulta

Rozsah hodnotenia a spôsob výpočtu energetickej účinnosti rozvodu tepla

Regresná analýza x, x,..., x

Zadaci sa prethodnih prijemnih ispita iz matematike na Beogradskom univerzitetu

Zadanie pre vypracovanie technickej a cenovej ponuky pre modul technológie úpravy zemného plynu

Rozsah akreditácie 1/5. Príloha zo dňa k osvedčeniu o akreditácii č. K-003

PREHĽAD ÚDAJOV. 1. Početnosť

Cieľom cvičenia je zvládnuť riešenie diferenciálnych rovníc pomocou Laplaceovej transformácie,

METODICKÁ SMERNICA NA AKREDITÁCIU METHODICAL GUIDELINE FOR ACCREDITATION VYJADROVANIE NEISTÔT MERANIA PRI KALIBRÁCII (EA-4/02)

PORTMANTEAU TESTY LINEARITY STACIONÁRNYCH RADOV MARIÁN VÁVRA ZACHARIAS PSARADAKIS NETECHNICKÉ

Transcript:

Panelové dáta v programe EViews Martin Lukáčik, Adriana Lukáčiková, Karol Szomolányi Panelové dáta sú kombinované prierezové a časové údaje. Pri panelových údajoch existuje časový rad pre každú entitu použitú v rámci prierezového výberu. Najčastejšie sa panelové dáta využívajú na skúmanie časového vývoja rôznych jednotiek z toho istého sektora, trhu alebo geografického celku, pričom typické sú rozsiahla prierezová štruktúra a len niekoľko časových období. Panelové dáta sú z hľadiska zvládnutia štatistických metód náročnejšou oblasťou ako samostatné prierezové dáta a časové rady, preto nebudeme prezentovať všetky možnosti ich analýzy, ale zameriame sa iba na základy. Sem rátame najmä pochopenie postupu vloženia panelových údajov do programu EViews a pochopenie postupu ako sa odhadujú modely s fixnými a náhodnými efektmi. Vysvetlíme tiež jednoduchý Hausmanov test, pomocou ktorého vyberáme z týchto dvoch alternatív. Náročnejšie postupy by následne už nemali byť pre čitateľa problémom práce so softvérom, ale iba problémom zvládnutia metodológie. Úvod Za základný regresný model panelových dát považuje Greene (2003) model: y = β x + β x + + β x + α z + α z + + α z + u, it 1 it1 2 it 2 k itk 1 i1 2 i2 q iq it kde index i označuje prierezový rozmer i = 1,, n, index t časový rozmer t = 1,, T, premenné X 1 až X k sú vysvetľujúce premenné nezahŕňajúce vektor jednotiek a premenné Z 1 až Z q predstavujú individuálne efekty rôznorodosť, ktorou sa môže odlišovať jednotlivec alebo celá skupina od ostatných entít sem sa zaraďuje prípadný vektor jednotiek. Individuálne efekty sa nemenia sa s časom. Na základe uvedeného rámca rozlíšime a ukážeme ako sa odhadujú tri prípady: spojený regresný model (Pooled Regression) ak individuálnym efektom je iba vektor jednotiek, čo znamená, že jediný parameter α je spoločnou konštantou: y x x x u it = α + β1 it1 + β2 it 2 + + βk itk + it, model s fixnými efektmi (Fixed Effects Model FEM) ak individuálne efekty Z 1 až Z q sú nepozorovateľné, ale korelované s vysvetľujúcimi premennými, tak riešením je zahrnúť všetky efekty do odhadnuteľného podmieneného priemeru pomocou vzťahu α = α z + α z + + α z a model FEM má tvar: i 1 i1 2 i2 q iq y x x x u it = αi + β1 it1 + β2 it 2 + + βk itk + it, fixný efekt α i znamená špecifickú konštantu pre každú prierezovú jednotku,

model s náhodnými efektmi (Random Effects Model REM) ak individuálne efekty Z 1 až Z q sú nepozorovateľné, ale nekorelované s vysvetľujúcimi premennými, tak riešením je zložená náhodná zložka ε i + uit zložku pre každú prierezovú jednotku a model REM má tvar:, ktorá okrem pôvodnej predpokladá aj špecifickú náhodnú ( ) y = β x + β x + + β x + α + ε + u. it 1 it1 2 it 2 k itk i it Načítanie panelových dát do programu EViews Najrýchlejším spôsobom zavádzania údajov tvoriacich panelové dáta do programu EViews je ich vhodná príprava v tabuľkovom procesore (napríklad Microsoft Excel). Za vhodnú prípravu môžeme považovať tabuľky údajov naskladaných za sebou, pričom údaje môžu byť naskladané prierezovo alebo časovo. Ako príklad údajov naskladaných časovo môžeme uviesť tabuľku s údajmi o leteckých spoločnostiach, ktorú uvádzajú Lukáčiková a Lukáčik (2008) obrázok 1, pričom pokračovanie pôvodných stĺpcov ako ďalšie stĺpce (ako to bolo zobrazené v učebnici) samozrejme nie je dovolené. Údaje obsahujú celkové náklady TC, produkciu Q, cenu benzínu P a koeficient vyťaženia lietadiel KV 6 firiem za 15 rokov. Obrázok 1: Usporiadanie dát naskladané časové rady V programe EViews pomocou File/Open/Foreign_Data_as_Workfile spustíme sprievodcu načítaním údajov a načítame pripravené údaje z tabuľkového procesora.

Obrázok 2: Sprievodca načítaním údajov v programe EViews a jeho výsledok Po načítaní zmeníme štruktúru pomocou ponuky Proc/Structure/Resize_current_page, pričom v komunikačnom okne Workfile structure zmeníme typ na Dated Panel a zadáme názvy radov, ktoré sú identifikátormi panelových údajov. Obrázok 3: Zmena typu štruktúry pracovného zošita v programe EViews Podľa príkladu uvedeného na obrázku 1 to budú rady i a t, ktoré použijeme ako identifikátory pre Cross-section ID series a Date series. Výsledkom je pracovný zošit programu EViews obsahujúci panelové dáta. Obrázok 4: Pracovný zošit programu EViews s panelovými dátami

Analýza panelových dát v programe EViews Najjednoduchší prípad, ktorým je spojený regresný model (pool), predstavuje naivný prístup, v ktorom sa predpokladá, že absolútny člen aj všetky parametre pri vysvetľujúcich premenných sú pre všetky prierezové jednotky rovnaké. Spojený model má všeobecný tvar: y1 X1 u1 y X u yn Xn un 2 2 2 y = = α + β + = α + Xβ + u Odhad spojeného regresného modelu v programe EViews je v prípade štruktúry pracovného zošitu typu panelové dáta analógiou odhadu lineárneho modelu v iných typoch údajov pomocou objektu rovnica. Špecifikáciu zadáme vymenovaním premenných na záložke Specification v okne, ktoré spustíme voľbou Object/New_object/Equation. Obrázok 5: Odhad parametrov spojeného regresného modelu. Výsledkom je odhadnutý spojený regresný model na obrázku 6. Obrázok 6: Výsledný spojený regresný model

Model s fixnými efektmi (FEM) na rozdiel od spojeného regresného modelu predpokladá rôznorodosť prierezových jednotiek v absolútnych členoch. Model FEM má tvar: y1 i 0 0 α1 X1 u1 2 α y 0 i 0 2 X2 u2 y = = + β + = Dα + Xβ + u. yn 0 0 i α n Xn un Vidíme, že v modeli predstavujú stĺpce matice D umelé premenné D 1 až D n, ktoré nadobúdajú hodnotu d it = 1 pre i-tú prierezovú jednotku, a hodnotu d it = 0 pre všetky ostatné prierezové jednotky. Pri odhade v programe EViews sa oproti spojenému regresnému modelu zmení iba Cross-section špecifikácia na záložke Panel Options na typ Fixed (obrázok 7). Obrázok 7: Odhad parametrov modelu FEM Výsledkom je odhadnutý model FEM na obrázku 8. Efekty jednotlivých prierezových jednotiek sa dajú zobraziť cez ponuku View/Fixed/Random_Effects/Cross-section_Effects. Obrázok 8: Výsledný model FEM s výpisom fixných efektov

Kvôli umelým premenným sa model zvykne nazývať aj LSDV (Least Squares Dummy Variable) a takýmto spôsobom ho môžeme po vytvorení umelých premenných pre každú prierezovú jednotku odhadnúť. Model môžeme odhadnúť ako regresný model bez konštanty, alebo sa zvolí jedna prierezová jednotka za základnú skupinu, ktorej hodnotu v modeli LSDV bude predstavovať absolútny člen a využijeme len n 1 umelých premenných: y1 0 0 α 2 α1 X1 u1 y 2 i 0 α3 α 1 X2 u2 * y = = α 1 + + β + = α1 + Dα 1 + Xβ + u. y α α 0 i X u n n 1 n n V modeli matica D 1 predstavuje maticu D bez prvého stĺpca a vektor α * je n 1 prvkový vektor diferencujúcich absolútnych členov vzťahujúcich sa na absolútny člen základnej skupiny. Výsledky oboch odhadov vidíme na obrázku 9. Obrázok 9: Výsledný model LSDV s n a n 1 umelými premennými Na testovanie významnosti parametrov α i sa dajú využiť ich t-štatistiky, ale hypotéza o jednej špecifickej prierezovej jednotke obyčajne nemá veľký význam. Preto program EViews túto hodnotu ani neposkytuje. Rozdielnosť medzi jednotlivými prierezovými jednotkami je vhodnejšie testovať pomocou F-testu porovnávajúceho model bez ohraničení, model FEM a model s ohraničeniami, ktorým je model pool. Testovacia štatistika má tvar: ( RSS pool RSSFEM ) ( n 1) FEM ( ) ( 1, ) F = F n nt k n RSS nt k n Ak je štatistika väčšia ako tabuľková hodnota, zamietame nulovú hypotézu, že prierezové jednotky majú rovnaké absolútne členy. V programe EViews sa test spustí v okne FEM cez ponuku View/Fixed/Random_Effects_Testing/Redundant_Fixed_Effects Likelihood_Ratio obrázok 10.

Obrázok 10: Testovanie hypotézy, či prierezové jednotky majú rovnaké konštanty Model s náhodnými efektmi REM V modeli FEM sa odlišnosť medzi prierezovými jednotkami uvažovala ako posun regresnej funkcie. Ak individuálne vplyvy pôsobiace na prierezové jednotky nie sú korelované s vysvetľujúcimi premennými celého panelu, tak je vhodnejšie uvažovať jednotlivé absolútne členy pre prierezové údaje ako náhodne rozdelené. Model REM má tvar: y = α + β x + + β x + ε + u = α + β x + + β x + v, it 1 it1 k itk i it 1 it1 k itk it kde spojením náhodnej zložky pozorovania prierezovej jednotky u it a náhodnej zložky špecifickej pre prierezovú jednotku ε i dostávame náhodnú zložku v it. Absolútny člen α značí v modeli priemer prierezových absolútnych členov a náhodná zložka špecifická pre prierezovú jednotku je náhodnou odchýlkou od tohto priemeru. Pri odhade v programe EViews sa zmení Cross-section špecifikácia na záložke Panel Options na typ Random (obrázok 11). Obrázok 11: Odhad parametrov modelu FEM

Výsledkom je odhadnutý model REM na obrázku 12. Efekty jednotlivých prierezových jednotiek sa dajú zobraziť cez ponuku View/Fixed/Random_Effects/Cross-section_Effects. Obrázok 12: Výsledný model REM s výpisom náhodných efektov Voľba medzi modelmi FEM a REM Pri rozhodovaní, ktorý z dvojice modelov s fixnými alebo s náhodnými efektmi použiť, odporúča Gujarati (2003) tieto dve pravidlá: ak hodnota T je veľká a hodnota n malá, tak bude pravdepodobne malý rozdiel medzi hodnotami parametrov FEM a REM v takom prípade sa preferuje jednoduchší FEM; ak hodnota n je veľká a hodnota T malá, tak bude pravdepodobne veľký rozdiel medzi hodnotami parametrov FEM a REM v takom prípade, ak považujeme prierezové jednotky za úplne náhodne zvolené, tak sa preferuje model REM, inak opäť FEM. Tieto pravidlá nemožno považovať za jednoznačný návod. Okrem nich existuje Hausmanov test špecifikácie. Testovacia štatistika Hausmanovho testu má tvar: ( ˆ ˆ T 1 ) ( ˆ ˆ ) ( ˆ ˆ LS GLS LS GLS LS GLS ) H = β β V V β β, kde V ˆ LS je odhad asymptotickej variančno-kovariančnej matice parametrov modelu FEM a V ˆ GLS je odhad asymptotickej variančno-kovariančnej matice parametrov modelu REM bez absolútneho člena. V programe EViews sa Hausmanov test spustí v okne REM cez ponuku View/Fixed/Random_Effects_Testing/Correlated_Random_Effects Hausman_Test obrázok 13.

Obrázok 13: Hausmanov test rozhodujúci medzi modelmi FEM a REM Testovacia štatistika H má asymptotické χ 2 -rozdelenie s počtom stupňov voľnosti rovnajúcim sa počtu parametrov tvoriacich vektor ˆβ mínus 1. Pri testovaní sa vypočítaná hodnota porovná s kritickou hodnotou χ 2 -rozdelenia pri zvolenej hladine významnosti a zodpovedajúcom stupni voľnosti. Ak je hodnota štatistiky H > χ 2 c, tak môžeme zamietnuť nulovú hypotézu o konzistentnosti oboch estimátorov a vhodnejší je model FEM. Ak je hodnota štatistiky H < χ 2 c, tak nemôžeme zamietnuť nulovú hypotézu a odporúčaným bude model REM. Literatúra: [1] GREENE, W. H.: Econometric Analysis, 4. vyd. New Jersey: Prentice-Hall, 2003. [2] GUJARATI, D. N.: Basic Econometrics, 4 vyd. New York: McGraw-Hill, 2003. [3] LUKÁČIKOVÁ, A. LUKÁČIK, M.: Ekonometrické modelovanie s aplikáciami. Bratislava: EKONÓM, 2008. [4] Pomocník programu EViews a internetové stránky ku programu EViews.