Pravdepodobnostné modelovanie inverznými distribučnými funkciami: Úvod do kvantilového modelovania

Σχετικά έγγραφα
Pravdepodobnostné modelovanie inverznými distribučnými funkciami : Kvantilová deskriptívna analýza ako východisko ku kvantilovému modelovaniu

Pravdepodobnostné modelovanie inverznými distribučnými funkciami : Identifikácia kvantilového modelu

Pravdepodobnostné modelovanie inverznými distribučnými funkciami: Charakteristiky kvantilových rozdelení

Spojité rozdelenia pravdepodobnosti. Pomôcka k predmetu PaŠ. RNDr. Aleš Kozubík, PhD. 26. marca Domovská stránka. Titulná strana.

Základy metodológie vedy I. 9. prednáška

Základy matematickej štatistiky

Matematika Funkcia viac premenných, Parciálne derivácie

Reprezentácia dát. Ing. Martin Mariš, Katedra regionalistiky a rozvoja vidieka, SPU, NITRA

Hľadanie, skúmanie a hodnotenie súvislosti medzi znakmi

Matematika prednáška 4 Postupnosti a rady 4.5 Funkcionálne rady - mocninové rady - Taylorov rad, MacLaurinov rad

1. Limita, spojitost a diferenciálny počet funkcie jednej premennej

Ekvačná a kvantifikačná logika

Metódy vol nej optimalizácie

M6: Model Hydraulický systém dvoch zásobníkov kvapaliny s interakciou

Štatistické spracovanie experimentálnych dát

7. FUNKCIE POJEM FUNKCIE

An Inventory of Continuous Distributions

Úvod do modelovania a simulácie, metóda Monte Carlo

Prechod z 2D do 3D. Martin Florek 3. marca 2009

Chí kvadrát test dobrej zhody. Metódy riešenia úloh z pravdepodobnosti a štatistiky

Obvod a obsah štvoruholníka

4. domáca úloha. distribučnú funkciu náhodnej premennej X.

Modelovanie dynamickej podmienenej korelácie kurzov V4

ARMA modely čast 2: moving average modely (MA)

Jednotkový koreň (unit root), diferencovanie časového radu, unit root testy

C. Kontaktný fasádny zatepľovací systém

Jednotkový koreň (unit root), diferencovanie časového radu, unit root testy

Ing. Andrej Trnka, PhD. Základné štatistické metódy marketingového výskumu

Odporníky. 1. Príklad1. TESLA TR

Michal Páleník. Fiškálna politika v kontexte regionalizácie a globalizácie:

Cvičenia zo ŠTATISTIKY v Exceli Kurz IPA-Slovakia, september 2008, VYHNE

APPENDICES APPENDIX A. STATISTICAL TABLES AND CHARTS 651 APPENDIX B. BIBLIOGRAPHY 677 APPENDIX C. ANSWERS TO SELECTED EXERCISES 679

Moderné vzdelávanie pre vedomostnú spoločnosť Projekt je spolufinancovaný zo zdrojov EÚ M A T E M A T I K A

Určite vybrané antropometrické parametre vašej skupiny so základným (*úplným) štatistickým vyhodnotením.

PREHĽAD ÚDAJOV. 1. Početnosť

Štatistické riadenie procesov Regulačné diagramy 3-1

Komplexné čísla, Diskrétna Fourierova transformácia 1

HASLIM112V, HASLIM123V, HASLIM136V HASLIM112Z, HASLIM123Z, HASLIM136Z HASLIM112S, HASLIM123S, HASLIM136S

Start. Vstup r. O = 2*π*r S = π*r*r. Vystup O, S. Stop. Start. Vstup P, C V = P*C*1,19. Vystup V. Stop

Goniometrické rovnice a nerovnice. Základné goniometrické rovnice

Biostatistics for Health Sciences Review Sheet

Rozsah akreditácie 1/5. Príloha zo dňa k osvedčeniu o akreditácii č. K-003

ŠTATISTICKÉ METÓDY VPRAXI

Web-based supplementary materials for Bayesian Quantile Regression for Ordinal Longitudinal Data

ŠTATISTIKA. Obsah. Predmet štatistiky Popisná štatistika Štatistické charakteristiky jednorozmerných rozdelení.. 17

Motivácia Denícia determinantu Výpo et determinantov Determinant sú inu matíc Vyuºitie determinantov. Determinanty. 14. decembra 2010.

Harmonizované technické špecifikácie Trieda GP - CS lv EN Pevnosť v tlaku 6 N/mm² EN Prídržnosť

TESTOVANIE ŠTATISTICKÝCH HYPOTÉZ. Zdroje: Kompendium statistického zpracování dat, VPS s r. o.

KATALÓG KRUHOVÉ POTRUBIE

ARMA modely čast 2: moving average modely (MA)

PREHĽAD ZÁKLADNÝCH VZORCOV A VZŤAHOV ZO STREDOŠKOLSKEJ MATEMATIKY. Pomôcka pre prípravný kurz

Στατιστικές Κατανομές και Πιθανότητες. Θεωρία και παραδείγματα.

Άσκηση 10, σελ Για τη μεταβλητή x (άτυπος όγκος) έχουμε: x censored_x 1 F 3 F 3 F 4 F 10 F 13 F 13 F 16 F 16 F 24 F 26 F 27 F 28 F

Pevné ložiská. Voľné ložiská

Základy matematickej štatistiky a jej aplikácie použitím programovacích jazykov R a S

vantum s.r.o. VŠETKO PRE ELEKTROERÓZIU V3 Kap.11 / str. 1

SLOVENSKO maloobchodný cenník (bez DPH)

Rozdiely vo vnútornej štruktúre údajov = tvarové charakteristiky

AerobTec Altis Micro

Testy dobrej zhody. H 0 : f(x) = g(x) ; H 1 : f(x) g(x)

KATEDRA DOPRAVNEJ A MANIPULAČNEJ TECHNIKY Strojnícka fakulta, Žilinská Univerzita

ST5224: Advanced Statistical Theory II

Priamkové plochy. Ak každým bodom plochy Φ prechádza aspoň jedna priamka, ktorá (celá) na nej leží potom plocha Φ je priamková. Santiago Calatrava

M8 Model "Valcová a kužeľová nádrž v sérií bez interakcie"

Cvičenie č. 4,5 Limita funkcie

Aquinas College. Edexcel Mathematical formulae and statistics tables DO NOT WRITE ON THIS BOOKLET

Definícia parciálna derivácia funkcie podľa premennej x. Definícia parciálna derivácia funkcie podľa premennej y. Ak existuje limita.

Kompilátory. Cvičenie 6: LLVM. Peter Kostolányi. 21. novembra 2017

Obsah. Motivácia a definícia. Metódy výpočtu. Problémy a kritika. Spätné testovanie. Prípadová štúdia využitie v NBS. pre 1 aktívum pre portfólio

2 Chyby a neistoty merania, zápis výsledku merania

Návrh vzduchotesnosti pre detaily napojení

PRIEMER DROTU d = 0,4-6,3 mm

Základy práce s ekonometrickým programom GRETL

Požiadavky k štátnej skúške pre magisterský študijný program

Stanovení ekonomického

Vyhlásenie o parametroch stavebného výrobku StoPox GH 205 S

Statistical Inference I Locally most powerful tests

DIPLOMOVÁ PRÁCA. Analýza modelu pre oceňovanie rizika pri upisovaní poistných zmlúv v oblasti veľkých rizík

HOMEWORK#1. t E(x) = 1 λ = (b) Find the median lifetime of a randomly selected light bulb. Answer:

3. Striedavé prúdy. Sínusoida

255 (log-normal distribution) 83, 106, 239 (malus) 26 - (Belgian BMS, Markovian presentation) 32 (median premium calculation principle) 186 À / Á (goo

519.22(07.07) 78 : ( ) /.. ; c (07.07) , , 2008

ANALÝZA VÝKONNOSTI CALL CENTRA POMOCÍ STATISTICKÝCH METOD

6 APLIKÁCIE FUNKCIE DVOCH PREMENNÝCH

Využitie programu Microsoft Excel pri ekonometrickom modelovaní

24. Základné spôsoby zobrazovania priestoru do roviny

Exercises to Statistics of Material Fatigue No. 5

Strana 1/5 Príloha k rozhodnutiu č. 544/2011/039/5 a k osvedčeniu o akreditácii č. K-052 zo dňa Rozsah akreditácie

794 Appendix A:Tables

Príručka ku kurzu SPÔSOBILOSŤ PROCESU

1. písomná práca z matematiky Skupina A

Κεφάλαιο 5. Βασικές έννοιες ελέγχων υποθέσεων και έλεγχοι κανονικότητας

JMAK の式の一般化と粒子サイズ分布の計算 by T.Koyama

SOLUTIONS TO MATH38181 EXTREME VALUES AND FINANCIAL RISK EXAM

KAGEDA AUTORIZOVANÝ DISTRIBÚTOR PRE SLOVENSKÚ REPUBLIKU

Rozsah hodnotenia a spôsob výpočtu energetickej účinnosti rozvodu tepla

množiny F G = {t1, t2,, tn} T a pre ľubovoľný valec C so základňou B1, B2,, Bn v bodoch t1, t2,, tn, takou, že pre t G - F je Bt = E, platí PF(C) = PG

Einsteinove rovnice. obrázkový úvod do Všeobecnej teórie relativity. Pavol Ševera. Katedra teoretickej fyziky a didaktiky fyziky

ZADANIE 1_ ÚLOHA 3_Všeobecná rovinná silová sústava ZADANIE 1 _ ÚLOHA 3

,Zohrievanie vody indukčným varičom bez pokrievky,

Transcript:

Katedra štatistiky, Fakulta hospodárskej informatiky, Ekonomická univerzita v Bratislave Pravdepodobnostné modelovanie inverznými distribučnými funkciami: Úvod do kvantilového modelovania Ľubica SIPKOVÁ 1. z cyklu prezentácií november 2008

Všeobecné požiadavky na pravdepodobnostný model dobrá zhoda jednoduchosť môže byť viacparametrický vhodnosť pre vyjadrenie charakteristík rozdelenia viacnásobný prístup v analýzach - smerujúci k systému viacparametrických funkcií (modelovanie v podsúboroch) možnosť aktualizácie - umožňujúci transformácie prehlbujúce elasticitu aplikovateľnosť simulačných metód

Štatistické prístupy k pravdepodobnostnému modelovaniu DF, f Klasický prístup (aplikuje sa ako prvá alternatíva): náhodný výber X= (X 1, X 2,... X n ) spojité náhoné premenné X 1, X 2,... X n X i štatisticky nezávislé a s identickým rozdelením náhodné pozorovania, realizácia náhodného výberu x 1, x 2,... x n definovanie rozdelenia: distribučnou funkciou funkciou hustoty pravdepodobnosti

Štatistické prístupy k pravdepodobnostnému modelovaniu QF, q Kvantilový prístup (aplikuje sa len ak prvá alternatíva zlyhá komplikovanejší): n usporiadaných štatistík X 1: n, X 2: n,..., X n: n (vzostupné usporiadanie n spojitých náhodných premenných X 1, X 2,... X n ) X i : n štatisticky závislé a s neidentickým rozdelením hodnota i-tej usporiadanej štatistiky vo výbere o rozsahu n X i: n, i = 1,2,...r,...n n usporiadaných pozorovaní x 1: n, x 2: n,..., x n: n definovanie rozdelenia: kvantilovou funkciou inverznou DF kvantilovou funkciou hustoty

Kvantilový prístup Parametrické metódy pravdepodobnostného modelovania spojitej náhodnej premennej na kvantilovom základe vo všetkých fázach štatistického modelovania (identifikácie, estimácie a verifikácie) Metódy indukcie z výberových údajov na populáciu vychádzajú z teórie poriadkových štatistík Východiskom teórie poriadkových štatistík je náhodný výber : n rozmerný vektor vzostupne usporiadaných, teda vzájomne závislých náhodných premenných.. Každá náhodná premenná je kvantilom rozdelenia náhodnej premennej X - je poriadkovou štatistikou a má rozdelenie prevdepodobností závislé od rozdelenia náhodnej premennej X. Rozdelenia poriadkových štatistík nie sú identické. Rad n vzostupne usporiadaných pozorovaní náhodnej premennej X predstavuje jednu realizáciu n poriadkových štatistík, čiže výberové hodnoty poriadkových štatististík náhodného výberu o rozsahu n

Klasický Definovanie tvaru podľa dvoch prístupov distribučnou funkciou funkciou hustoty pravdepodobnosti Kvantilový kvantilovou funkciou kvantilovou funkciou hustoty F ( x) = P( X x) = p f ( x) = = 1 d F d ( x) x Q( p) = F ( p) = x, 0 p ( p) dq q( p) =, 0 p d p Rozdelenie akéhokoľvek druhu, vyjadrené vo forme kvantilovej funkcie QF alebo kvantilovej funkcie hustoty, sa nazýva skrátene kvantilovým rozdelením, presne kvantilovým pravdepodobnostným rozdelením kvantitatívnej spojitej náhodnej premennej. 1 1

Kvantilová funkcia Q( p) 1 = F ( p) = x, 0 p 1 V literatúre je nazývaná aj ako percentilová (pravdepodobnostná) funkcia Je inverziou k distribučnej funkcii pravdepodobnostného rozdelenia (DF: vstupom hodnoty a výstupom pravdepodobnosti) Vstupom do nej sú pravdepodobnosti a výstupom hodnoty náhodnej premennej

Klasický distribučnou funkciou F EXP Napr.: Štyri spôsoby definovania exponenciálneho rozdelenia γx ( x) = 1 e, 0 x, γ funkciou hustoty pravdepodobnosti Kvantilový f EXP 0, kvantilovou funkciou Q EXP γ γ e x kvantilovou funkciou hustoty q EXP ( x) =, 0 x < < 1 ( p) = η ln(1 p), η =,0 p < γ ( p) = η /(1 p ), η 0,0 p < - x < 0 0 1 1

X~Q[p; Θ] Definovanie kvantilového modelu Q( p) 1 = F ( p), 0 p 1 Jednoduchý kvantilový model v tvare : Q ( p ) = λ + η S ( p ) 0 p 1 môže byť lineárnym, alebo semilineárnym dvoj a viacparametrickým kvantilovým distribučným modelom v závislosti od jeho základného kvantilového tvaru : S(p)

Porovnanie grafov DF a QF zošikmeného logistického rozdelenia QF - Kvantilová (distribučná) funkcia DF - Kumulatívna distribučná funkcia

Východiská kvantilového modelovania teória kvantilového pravdepodobnostného modelovania (fázy identifikácie, estimácie, verifikácie) teória štatistickej indukcie Order statistics poriadkové (usporiadané) štatistiky vstupné empirické dáta výberové hodnoty NP: vzostupne usporiadaný empirický súbor výberové podiely p charakteristické črty empirického rozdelenia NP odhalené metódami deskriptívnej štatistiky na rôznych základoch

Nevýhody kvantilového modelovania matematicky náročná rozpracovanosť metód nedostupnosť jednoducho spracovanej komplexnej literatúry (ani zahraničnej) zriedkavejšia aplikácia (s rôznym označením a pojmovým aparátom, zameranie na riešenie konkrétnych oblastí problémov z praxe) chýbajúci softvér Potrebná hlbšia znalosť matematicko-štatistických metód (náročnejší prístup z hľadiska teoretického aj technického)

Výhody kvantilového modelovania v prípadoch, keď klasické prístupy neprinášajú uspokojivé výsledky umožňuje nájsť vhodný tvar modelu aktualizácia modelu v budúcnosti novou estimáciou parametrov veľká flexibilita tvarov možnosť spoločného modelovania deterministickej a náhodnej zložky v štatistických modeloch pri estimácii parametrov toho istého tvaru modelu možnosť modelovať v podsúboroch, v štruktúrach nový pohľad na riešený problém, niekedy jednoduchší, jasnejší prostredníctvom kvantilových mier smerovanie k modelovaniu zmesí jednoduché simulácie

História kvantilového prístupu v štatistickej analýze článok Francisa Galtona uverejnený v roku 1875, potom sa na kvantilový prístup takmer na 100 rokov zabudlo a rozvíjal sa Pearsonov prístup na báza momentov empirická kvantilová funkcia v súvislosti s normálnym rozdelením nazvaná ogivou (nie empirická funkcia hustoty - ako v súčasnosti) medián a kvartil boli prvýkrát popísané v roku 1882 pojem kvantil bol zavedený M. G. Kendalom až v roku 1940

História kvantilového modelovania Použitie kvantilovej funkcie pre definovanie tvaru pravdepodobnostného rozdelenia Emanuel Parzen 1979 Handbook of Statistics, časť 16 a 17 editovaná Balakrishnan a Rao (Arnold, Balakrishnan, Balanda, David, MacGilivray, Moors, Nagaraja a hlavne Parzen) A First Course in Order statistics - Arnold, Balakrishnan, Nagaraja r. 2000 Modelovanie kvantilovými funkciami (Statistical modelling with quantile function) Gilchrist, W.G.

Rozdelenie r-tej poriadkovej štatistiky N poriadkových štatistík X 1: n, X 2: n,..., X n: n hodnota i-tej poriadkovej štatistiky vo výbere o rozsahu n X i : n, i = 1,2,...r,...n Rozdelenie r-tej poriadkovej štatistiky X r: n možno vyjadriť kvantilovou funkciou: X r:n ~ Q( r )[p( r );Θ( r )] = Q[BETAINV(p( r ), r, n-r+1);θ] Z nej možno vyjadriť rozdelenie prvej, či n-tej poriadkovej štatistiky

Rankit X~Q[p;Θ] - stredné hodnoty poriadkových štatistík: E ( k X ) = n ( r 1 )! ( n r) E(X i:n ) = µ i:n, i = 1,2,...r,...n 1 r: n 1 0 { [ ]} k ( ) ( r 1 ) [ ] ( n r! Q p p p )! dp Pre rovnomerné rozdelenie (Uniform distribution ozn. U): X~Q ROVN (p) potom µ r:n = r/(n+1) Odhady µ r:n ľubovolného rozdelenia pomocou U-transf.pravidla: µ r:n = E(Q(U r: n )) Q(E(U r: n ) )= Q(r/(n+1) Q( (r-0,5)/n )

Mediánový rankit X~Q[p;Θ] - mediány poriadkových štatistík: M r:n = Q[p r:n * ;Θ], kde: p r:n * = BETAINV(0,5 ; r, n-r+1) p r:n * - mediánová p r hodnota Rozdelenia X r:n charakterizované kvantilovými štatistikami: dolný percentil X r:n (0,01) = Q[BETAINV(0,01 ; r, n-r+1);θ] horný percentil X r:n (0,99) = Q[BETAINV(0,99 ; r, n-r+1);θ]

Graf mediánového rankitu a kvantilov poriadkových štatistík Kvantily (dolné percentily, mediánový rankit a horné percentily) poriadkových štatistík logistického rozdelenia

1,200,000 Weibullov-Paretov tvar Q-modelu príjmov (Odhad metódou minimalizácie absolútnych distribučných rezíduí) Graf kvantilov CP s 99% hranicami teoretického rozdelenia CP Q(BETAINV(0.995)) Q(BETAINV(0.005)) 1,000,000 800,000 príjmy 600,000 400,000 200,000 0 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 p

Vystihnutie tvaru empirického rozdelenia - identifikácia Grafická analýza empirického rozdelenia príjmov Kvantitatívna analýza empirického rozdelenia príjmov: na momentovom základe na kvantilovom základe Identifikácia rozdelenia jednoduchými tvarmi Celého rozdelenia Zvlášť pre dolný a horný koniec, prípadne iné časti rozdelenia Voľba tvaru váh pre konce rozdelenia Ako funkcia p Ako parametre modelu

Grafická analýza empirického rozdelenia Príjmy domácností SR v roku 2003 (F emp (CP)= p) Proporcionálne postavenie v závislosti od výšky príjmov v ich vzostupnom usporiadaní Empirická distribučná funkcia 1.00 0.80 p 0.60 0.40 0.20 0.00 0 200 400 600 800 1000 v 1000 Sk CP

Grafická analýza empirického rozdelenia Príjmy domácností SR v roku 2003 (Q emp (p)=cp) Hodnota príjmov v závislosti od ich proporcionálneho postavenia vo vzostupnom usporiadaní 1,200 Empirická kvantilová funkcia 1,000 800 CP 600 400 200 0 0.00 0.20 0.40 0.60 0.80 1.00 p v tis.sk

Grafická analýza empirického rozdelenia Príjmy domácností SR v 2003 Polygón 16 Polygón rozdelenia pocetností pre CP % domácn ností 12 8 4 0 0 2 4 6 8 10 12 v 100 tis. Sk CP

Grafická analýza empirického rozdelenia Príjmy domácností SR v 2003 (Box-Plot) Box-and-Whisker graf pre CP 0 1 2 3 4 5 6 7 8 9 10 11 12 v 100 000 Sk CP

Comparison of Alternative Distributions procedúra na porovnanie známych tvarov v STATGRAPHICS CENTURION Distribution Est. Parameters Log Likelihood KS D Lognormal (3-Parameter) 3-67677.7 0.0362935 Lognormal 2-67704.9 0.0397763 Loglogistic 2-67730.3 0.0496562 Gamma (3-Parameter) 3-67743.3 0.0244112 Birnbaum-Saunders 2-67763.8 0.0479773 Gamma 2-67775.9 0.0292224 Inverse Gaussian 2-67789.4 0.0550491 Largest Extreme Value 2-67873.8 0.0483855 Weibull 2-68026.0 0.0646936 Logistic 2-68477.7 0.0910885 Laplace 2-68514.9 0.108414 Exponential 1-68795.9 0.199527 Normal 2-69321.9 0.120725

Histogram for CDPD data 1600 frequ uency 1200 800 Distribution Gamma (3-Parameter) Loglogistic (3-Parameter) Lognormal (3-Parameter) 400 0 0 0.4 0.8 1.2 1.6 2 (X 1.E6) CDPD data

KS a CHi-kvadrát testy potvrdili nevhodnosť aplikácie jednoduchých tvarov modelu CP KS Test Erlang Gamma (3-Parameter) Loglogistic (3-Parameter) Weibull (3-Parameter) Lognormal (3-Parameter) DPLUS 0.0 0.0244112 0.0494693 0.0399911 0.0362935 DMINUS 1.0 0.0227598 0.0365427 0.0527996 0.0303411 DN 1.0 0.0244112 0.0494693 0.0527996 0.0362935 P-Value 0.0 0.00437615 0.0 0.0 0.00000264 Chi kv. Test Gamma Gamma (3-Parameter) Lognormal Lognormal (3-Parameter) Chi-Squared 399.179 379.992 394.717 354.507 D.f. 97 96 97 96 P-Value 0.0 0.0 0.0 0.0

Identifikácia rozdelenia jednoduchými tvarmi Useknutý Weibullov tvar - len pre dolnú a strednú časť rozdelenia CP Histogram pre CP s funkciou hustoty Weibullovho rozdelenia 240 200 frequency 160 120 80 40 0 0 2 4 6 8 10 12 v 100 tis. Sk CP

Identifikácia rozdelenia jednoduchými tvarmi Paretov tvar je vhodný len pre horný koniec rozdelenia Identifikačný graf pre Paretovo rozdelenie 9 8 7 6 - ln (1-p) 5 4 3 2 1 0 11 12 13 14 ln CP

Kvantitatívna analýza empirického rozdelenia Príjmy domácností SR v 2003 Výberové charakteristiky na momentovom základe Priemer = 244 284 Sk Rozptyl = 1.2012E10 Štandardná odchýlka = 109 598 Sk Koeficient šikmosti = 1.0498 Štand. šikmosť = 16.959 Pearsonova špicatosť = 2.997 Variačný koeficient = 44.87 % Štand. špicatosť = 24.209 na kvantilovom základe Medián = 237 407 Sk Kvartilové rozpätie = 139 770 Sk Galtonov koeficient šikmosti g=qd/iqr = -0.0123 Kvartilová diferencia qd=lq+uq-2 = -1718.50 Moorsova špicatosť k=[(e7-e5)+(e3-e1)]/iqr = 1.174

Ako može vyzerať kvantilový model? Jednoduchý kvantilový model v tvare : Q( p) = λ + η S( p) 0 p 1 parameter polohy parameter stupnice, variability vlastné parametre základného tvaru kvantilovej funkcie Poskladaný (zložený) kvantilový model napr. v tvare : β 1 Q CP ( p) = λ + η ( 1 p) [ ln( 1 p) ] + p, 0 < p < 1, β > 0, γ > 0 γ ( 1 p) váhy jednotlivým rozdeleniam kvantilový základný tvar rozdelenia pre dolný koniec s jeho parametrami kvantilový základný tvar rozdelenia pre horný koniec s jeho parametrami

Možné tvary váh pre dva konce rozdelenia Ako funkcia p ( 1 p ) a p [ ( )] 2 1 p 3 2 p a 2 p ( 3 2 p) [ ( )] 3 2 3( 2 1 p 10 15p + 6 p a p 10 15 p + 6 p ) 1 ω Ako parametre modelu ω 1 ( p) a ω( p) ( 1 ω ) a ω ( 1+ω ) ( 1 ω ) 2 a ( 1- ) a ω p 2 p 2

Zošikmené logistické rozdelenie Logistické rozdelenie (Logistic): S(p) = S 1 (p) + S 2 (p) S(p) = - ln (1 p) + ln (p), 0 p 1 S(p) = ln [p/(1 p)] Q 1 (p) Q(p) Q 2 (p) Zošikmené logistické rozdelenie: S(p) = ω S 1 (p) + (1-ω) S 2 (p), kde 0 ω 1 S(p) = [(1 + δ)/2] [-ln (1-p)] + [(1 -δ)/2] [ln (p)] kde -1 δ 1, 0 < p < 1

Funkcia hustoty Zošikmeného logistického rozdelenia

Súčin mocninového a Paretovho rozdelenia Mocninové rozdelenie Power rozdelenie (Po(α)): S 1 (p) = p α, kde α > 0, 0 p 1 Paretovo rozdelenie (Pa(β)): S 2 (p) = 1/(1 p) β, kdeβ > 0, Mocninovo-Paretovo rozdelenie ( Po(α)Pa(β) ): S(p) = S 1 (p) x S 2 (p) S(p) = p α /(1 p) β, kde β > 0, α > 0,

Graf mocninovo-paretovho rozdelenia (Po x Pa) Funkcia hustoty Mocninovo-Paretovho rozdelenia (Po x Pa) Kvantilová funkcia Mocninového (Power) a Paretovho (Pareto) rozdelenia

Zovšeobecnené lambda rozdelenie Komplexný známy elastický tvar len odhadnúť jeho parametre Ramberg-Schmeiserov tvar: RSGLD( λ, λ, λ, λ ) 1 2 3 4 ( 1 p) λ3 4 p = λ1 +, 0 p λ Dôvody výberu RS GLD: historický aspekt teoretický aspekt komplexnosť, elasticita a univerzálnosť jeho tvaru konvergencia k Paretovmu tvaru vhodnosť pre simulačné štúdiá 2 λ 1

Semilineárny päťparametrický Gamma-Paretov tvar (skladanie použitím pravidiel modifikácie kvantilových funkcií) S ( p) = p R[ S( p) ] = 1 S 1 ( p) pravidlo o reciprocite ( S ( p ) ) [ S ( p ) ] β P = pravidlo o Q-transformácii GAMMAINV S PAR ( p) = 1 1 ( p) γ pravidlo o súčte dvoch kvantilových funkcií PARETOINV ( ) ( 1 ) GAMAINV( ;. ) p Q p = α + ω p p β γ + κ, 0 < p < 1 ( 1 p) δ

Metódy estimácie kvantilových modelov Metódou maximálnej vierohodnosti Metódou momentov Metódou kvantilov Öztürk a Dale aproximatívnou metódou Metódou minimalizácie absolútnych distribučných rezíduí Špeciálne metódy u zovšeobecnených tvarov (Starship)

Odhad parametrov QF Zovšeobecnenou Öztürk a Dale aproximatívnou metódou S ( Θ) = n r= 1 x r Q r ( n + 1), Θ Metódou minimalizácie absolútnych distribučných rezíduí S n ( Θ ) = x ( Θ ) r Q p * r, r = 1 2 kde p r * = BETAINV(0,5; r, n-r+1)

Odhadnutý Weibullov Paretov tvar Q-Q graf pre Weibull-Pareto rozdelenie suma štvorca distr. rezíduí 45 st. priamka suma abs. distr. rezíduí 1400000 1200000 teoreticke CP 1000000 800000 600000 400000 200000 0 0 200000 400000 600000 800000 1000000 1200000 1400000 empiricke CP

Grafické posúdenie kvality kvantilových modelov rozdelenia príjmov domácností SR - verifikácia Krabickový graf tvarov rozdelení CP GLD MM GLD MQ1 GLD MQ2 GLD ODM GLD ODQ1 GLD ODQ2 GLD AM GLD AQ1 GLD AQ2 GLD SQ WP OD WP A -2 1 4 7 10 13 v 100 000 Sk príjmy

Grafické posúdenie kvality Weibullových- Paretových tvarov modelov rozdelenia CP v SR Graf rezíduí ewpd OD ewpd A 30000 10000-10000 e -30000-50000 -70000 0.00 0.10 0.20 0.30 0.40 0.50 0.60 0.70 0.80 0.90 1.00 p

Kvantitatívne posúdenie kvality kvantilových modelov rozdelenia CP - verifikácia Vybrané tvary WPD OD WPD A RSGLD AQ1 RSGLD AQ2 χ 2 (19) 28,64 28,99 35,40 114,08 χ 2 (19) do 0.1 0,07 4,03 0,55 86,28 χ 2 (19) nad 0.95 2,76 0,28 0,36 0,04 Koef.korelácie 0,9982 0,9963 0,9795 0,9867 Dolný percentil 62 tis.sk 65 tis.sk 68 tis.sk (-12 tis.sk) Medián 240 tis.sk 237 tis.sk 237 tis.sk 234 tis.sk Horný percentil 570 tis.sk 601 tis.sk 490 tis.sk 546 tis.sk výb.dol.perc. CP = 65 tis.sk výb.medián CP = 237 tis.sk výb.hor.perc. CP = 584 tis.sk χ 2 0,95 (19)= 30,14 χ 2 0,99 (19)= 36,19

Pravdepodobnostné modelovanie inverznými distribučnými funkciami: Úvod do kvantilového modelovania Spracovanie prvej z cyklu prezentácií o kvantilovom modelovaní. Podrobnejšie možno nájsť v monografii: Sipková, Ľ; Sodomová, E.: Modelovanie kvantilovými funkciami, Vydavateľstvo EKONÓM, Bratislava, 2007; 175 s. ISBN 978-80-225-2346-2 Ľubica SIPKOVÁ november 2008