Pravdepodobnostné modelovanie inverznými distribučnými funkciami : Kvantilová deskriptívna analýza ako východisko ku kvantilovému modelovaniu

Σχετικά έγγραφα
Pravdepodobnostné modelovanie inverznými distribučnými funkciami: Charakteristiky kvantilových rozdelení

Pravdepodobnostné modelovanie inverznými distribučnými funkciami: Úvod do kvantilového modelovania

Pravdepodobnostné modelovanie inverznými distribučnými funkciami : Identifikácia kvantilového modelu

Reprezentácia dát. Ing. Martin Mariš, Katedra regionalistiky a rozvoja vidieka, SPU, NITRA

Základy metodológie vedy I. 9. prednáška

Matematika Funkcia viac premenných, Parciálne derivácie

Ing. Andrej Trnka, PhD. Základné štatistické metódy marketingového výskumu

Základy matematickej štatistiky

Spojité rozdelenia pravdepodobnosti. Pomôcka k predmetu PaŠ. RNDr. Aleš Kozubík, PhD. 26. marca Domovská stránka. Titulná strana.

Matematika prednáška 4 Postupnosti a rady 4.5 Funkcionálne rady - mocninové rady - Taylorov rad, MacLaurinov rad

7. FUNKCIE POJEM FUNKCIE

Jednotkový koreň (unit root), diferencovanie časového radu, unit root testy

1. Limita, spojitost a diferenciálny počet funkcie jednej premennej

Obvod a obsah štvoruholníka

Štatistické spracovanie experimentálnych dát

Jednotkový koreň (unit root), diferencovanie časového radu, unit root testy

Michal Páleník. Fiškálna politika v kontexte regionalizácie a globalizácie:

Goniometrické rovnice a nerovnice. Základné goniometrické rovnice

Rozdiely vo vnútornej štruktúre údajov = tvarové charakteristiky

M6: Model Hydraulický systém dvoch zásobníkov kvapaliny s interakciou

Určite vybrané antropometrické parametre vašej skupiny so základným (*úplným) štatistickým vyhodnotením.

KATEDRA DOPRAVNEJ A MANIPULAČNEJ TECHNIKY Strojnícka fakulta, Žilinská Univerzita

PRIEMER DROTU d = 0,4-6,3 mm

ARMA modely čast 2: moving average modely (MA)

Start. Vstup r. O = 2*π*r S = π*r*r. Vystup O, S. Stop. Start. Vstup P, C V = P*C*1,19. Vystup V. Stop

ÚLOHA Č.8 ODCHÝLKY TVARU A POLOHY MERANIE PRIAMOSTI A KOLMOSTI

Moderné vzdelávanie pre vedomostnú spoločnosť Projekt je spolufinancovaný zo zdrojov EÚ M A T E M A T I K A

2 Chyby a neistoty merania, zápis výsledku merania

Testy dobrej zhody. H 0 : f(x) = g(x) ; H 1 : f(x) g(x)

PREHĽAD ZÁKLADNÝCH VZORCOV A VZŤAHOV ZO STREDOŠKOLSKEJ MATEMATIKY. Pomôcka pre prípravný kurz

Modelovanie dynamickej podmienenej korelácie kurzov V4

Chí kvadrát test dobrej zhody. Metódy riešenia úloh z pravdepodobnosti a štatistiky

Štatistické riadenie procesov Regulačné diagramy 3-1

Prechod z 2D do 3D. Martin Florek 3. marca 2009

Metódy vol nej optimalizácie

Základy matematickej štatistiky a jej aplikácie použitím programovacích jazykov R a S

PREHĽAD ÚDAJOV. 1. Početnosť

Odporníky. 1. Príklad1. TESLA TR

Harmonizované technické špecifikácie Trieda GP - CS lv EN Pevnosť v tlaku 6 N/mm² EN Prídržnosť

Hľadanie, skúmanie a hodnotenie súvislosti medzi znakmi

ŠTATISTICKÉ METÓDY VPRAXI

4. domáca úloha. distribučnú funkciu náhodnej premennej X.

Pevné ložiská. Voľné ložiská

MPV PO 16/2013 Stanovenie kovov v rastlinnom materiáli ZÁVEREČNÁ SPRÁVA

Návrh vzduchotesnosti pre detaily napojení

ARMA modely čast 2: moving average modely (MA)

1. písomná práca z matematiky Skupina A

Ekvačná a kvantifikačná logika

2.1 Charakteristiky polohy

Komplexné čísla, Diskrétna Fourierova transformácia 1

REZISTORY. Rezistory (súčiastky) sú pasívne prvky. Používajú sa vo všetkých elektrických

C. Kontaktný fasádny zatepľovací systém

YQ U PROFIL, U PROFIL

4 Regulačné diagramy na reguláciu meraním

TESTOVANIE ŠTATISTICKÝCH HYPOTÉZ. Zdroje: Kompendium statistického zpracování dat, VPS s r. o.

3. Striedavé prúdy. Sínusoida

UČEBNÉ TEXTY. Pracovný zošit č.2. Moderné vzdelávanie pre vedomostnú spoločnosť Elektrotechnické merania. Ing. Alžbeta Kršňáková

KATALÓG KRUHOVÉ POTRUBIE

Meranie na jednofázovom transformátore

ŠTATISTIKA. Obsah. Predmet štatistiky Popisná štatistika Štatistické charakteristiky jednorozmerných rozdelení.. 17

vantum s.r.o. VŠETKO PRE ELEKTROERÓZIU V3 Kap.11 / str. 1

Modely sieťovej analýzy

Kompilátory. Cvičenie 6: LLVM. Peter Kostolányi. 21. novembra 2017

Funkcie - základné pojmy

UČEBNÉ TEXTY. Pracovný zošit č.5. Moderné vzdelávanie pre vedomostnú spoločnosť Elektrotechnické merania. Ing. Alžbeta Kršňáková

AerobTec Altis Micro

,Zohrievanie vody indukčným varičom bez pokrievky,

Cvičenia zo ŠTATISTIKY v Exceli Kurz IPA-Slovakia, september 2008, VYHNE

η = 1,0-(f ck -50)/200 pre 50 < f ck 90 MPa

Využitie programu Microsoft Excel pri ekonometrickom modelovaní

Úvod do modelovania a simulácie, metóda Monte Carlo

Príručka ku kurzu SPÔSOBILOSŤ PROCESU

Vyhlásenie o parametroch stavebného výrobku StoPox GH 205 S

Motivácia Denícia determinantu Výpo et determinantov Determinant sú inu matíc Vyuºitie determinantov. Determinanty. 14. decembra 2010.

ANALÝZA VÝKONNOSTI CALL CENTRA POMOCÍ STATISTICKÝCH METOD

Definícia parciálna derivácia funkcie podľa premennej x. Definícia parciálna derivácia funkcie podľa premennej y. Ak existuje limita.

RIEŠENIE WHEATSONOVHO MOSTÍKA

Rozsah hodnotenia a spôsob výpočtu energetickej účinnosti rozvodu tepla

HASLIM112V, HASLIM123V, HASLIM136V HASLIM112Z, HASLIM123Z, HASLIM136Z HASLIM112S, HASLIM123S, HASLIM136S

3. prednáška. Komplexné čísla

6 Limita funkcie. 6.1 Myšlienka limity, interval bez bodu

8 Regulačné diagramy. 8.1 Štatistický základ regulačných diagramov ZABEZPEČOVANIE KVALITY PROCESOV

Univerzita Pardubice

Integrovanie racionálnych funkcií

Rozsah akreditácie 1/5. Príloha zo dňa k osvedčeniu o akreditácii č. K-003

Pilota600mmrez1. N Rd = N Rd = M Rd = V Ed = N Rd = M y M Rd = M y. M Rd = N 0.

24. Základné spôsoby zobrazovania priestoru do roviny

Gramatická indukcia a jej využitie

Cvičenie č. 4,5 Limita funkcie

Priamkové plochy. Ak každým bodom plochy Φ prechádza aspoň jedna priamka, ktorá (celá) na nej leží potom plocha Φ je priamková. Santiago Calatrava

Základy práce s ekonometrickým programom GRETL

KAGEDA AUTORIZOVANÝ DISTRIBÚTOR PRE SLOVENSKÚ REPUBLIKU

DIPLOMOVÁ PRÁCA. Analýza modelu pre oceňovanie rizika pri upisovaní poistných zmlúv v oblasti veľkých rizík

Modul pružnosti betónu

MOSTÍKOVÁ METÓDA 1.ÚLOHA: 2.OPIS MERANÉHO PREDMETU: 3.TEORETICKÝ ROZBOR: 4.SCHÉMA ZAPOJENIA:

Analýza hlavných komponentov

4. Výrokové funkcie (formy), ich definičný obor a obor pravdivosti

6 APLIKÁCIE FUNKCIE DVOCH PREMENNÝCH

Analýza poruchových stavov s využitím rôznych modelov transformátorov v programe EMTP-ATP

Biostatistics for Health Sciences Review Sheet

Transcript:

Katedra štatistiky, Fakulta hospodárskej informatiky, Ekonomická univerzita v Bratislave Pravdepodobnostné modelovanie inverznými distribučnými funkciami : Kvantilová deskriptívna analýza ako východisko ku kvantilovému modelovaniu Ľubica SIPKOVÁ 2. z cyklu prezentácií Marec 2009

Východiská kvantilového modelovania teória kvantilového pravdepodobnostného modelovania ( identifikácie, estimácie, verifikácie) teória Order statistics poriadkových (usporiadaných) štatistík vstupné empirické dáta výberové hodnoty NP: vzostupne usporiadaný empirický súbor údajov spojitej kvantitatívnej náhodnej premennej výberové podiely p charakteristické črty empirického rozdelenia NP odhalené metódami deskriptívnej štatistiky na rôznych základoch Ľubica Sipková

Vystihnutie tvaru empirického rozdelenia - identifikácia Grafická analýza empirického rozdelenia príjmov Kvantitatívna analýza empirického rozdelenia príjmov: na momentovom základe na kvantilovom základe Identifikácia rozdelenia jednoduchými tvarmi Celého rozdelenia Zvlášť pre dolný a horný koniec Voľba tvaru váh pre konce rozdelenia Ako funkcia p Ako parametre modelu

Východiská grafickej analýzy empirického rozdelenia: vstupné empirické dáta výberové hodnoty NP: (vzostupne usporiadaný empirický súbor X i : n, i = 1,2,...r,...n) teória Order statistics poriadkových (usporiadaných) štatistík pre určenie výberových podielov p r p r r-tá p-hodnota zodpovedá r-tému poradiu zistenej hodnoty x r Ľubica Sipková

Ako získať pravdepodobnosti p r?

Rozdelenie r-tej poriadkovej štatistiky, X 2: n,..., X n: n n poriadkových štatistík X 1: n hodnota i-tej poriadkovej štatistiky vo výbere o rozsahu n X i : n, i = 1,2,...r,...n Rozdelenie r-tej poriadkovej štatistiky X r : n možno vyjadriť kvantilovou funkciou: X r:n ~ Q r [p r ; Θ r ] = Q [ BETAINV (p r, r, n-r+1); Θ ] v jednoduchšom tvare zápisu bez parametrov Q- funkcie: X r:n ~ Q r (p r ) = Q ( BETAINV ( p r, r, n-r+1) ) Ľubica Sipková

Dvojaký prístup k určeniu p r X r:n ~ Q r (p r ) Kvantilový pomocou mediánového rankitu Momentový M r:n = Q [ p r:n * ; Θ ] p r:n * - mediánová p r hodnota pomocou aproximácie rankitu cez rovnomerné rozdelenie µ r:n Q [ E (U r: n ) ; Θ ]

Mediánový rankit X~Q [ p;θ ] budeme písať v tvare X~Q(p) - medián r-tej usporiadanej štatistiky: M r:n = Q[p r:n * ;Θ] v tvare M r:n = Q (p r:n * ) kde: p r:n * = BETAINV(0,5 ; r, n-r+1) p r:n * - mediánová p r hodnota

Rankit - stredné hodnoty usporiadaných štatistík: E ( X i:n ) = µ i:n, i = 1,2,...r,...n Pre rovnomerné rozdelenie (Uniform distribution ozn. U): X~Q U (p) je r-tá hodnota rankitu definovaná: E(U r: n ) = µ U;r:n = r/(n+1) jeho apriximácia: µ U;r:n (r-0,5)/n Odhady µ r:n ľubovolného rozdelenia pomocou U-transf.pravidla: µ r:n = E [ Q(U r: n ) ] Q [ E(U r: n ) ] = Q [ r/(n+1) ] µ r:n Q [ (r-0,5)/n ]

Usporiadané dvojice hodnôt (x r, p r ) - hodnota x je výberovým p-kvantilom výpočet p momentovou metódou µ U;r:n (r-0,5)/n v EXCEL-i napr.:

Usporiadané dvojice hodnôt (x r, p r ) - hodnota x je výberovým p-kvantilom výpočet p kvantilovou metódou p r:n * = BETAINV(0,5 ; r, n-r+1) v EXCEL-i napr.:

Klasický Štatistické prístupy k pravdepodobnostnému modelovaniu distribučnou funkciou funkciou hustoty pravdepodobnosti Kvantilový kvantilovou funkciou kvantilovou funkciou hustoty F ( x) = P( X x) = p f ( x) = d F d ( x) x Q p F p x p dq( p) q( p) =, 0 p 1 d p 1 ( ) = ( ) =, 0 1 Rozdelenie akéhokoľvek druhu, vyjadrené vo forme kvantilovej funkcie QF alebo kvantilovej funkcie hustoty, sa nazýva skrátene kvantilovým rozdelením, presne kvantilovým pravdepodobnostným rozdelením kvantitatívnej spojitej náhodnej premennej. Ľubica Sipková

Druhy kvantilových deskriptívnych grafov Usporiadané dvojice hodnôt (x r, p r ) možno znázorniť graficky ( v súlade s definovaním funkcií): 1. p v závislosti od x (DF) 2. x v závislosti od p (QF) 3. Dp/Dx vzhľadom na stred príslušnej diferencie Dx (f) 4. Dx/Dp vzhľadom na stred Dp (q) 5. Dp/Dx nie vzhľadom na x, ale vzhľadom na p

1. p v závislosti od x Príjmy domácností SR v roku 2003 F emp (x)= p Proporcionálne postavenie v závislosti od výšky príjmov v ich vzostupnom usporiadaní grafická deskriptívna štatistika 1.00 0.80 p 0.60 0.40 0.20 0.00 0 200 400 600 800 1000 v 1000 Sk CP Ľubica Sipková

2. x v závislosti od p Príjmy domácností SR v roku 2003 Q emp (p)=x v tis. v tis. Sk Sk v tis.sk 120 1,200 1100 100 1,000 v tis.sk 300 275 250 900 800 CP CP 80 CP 600 700 60 400 500 200 225 200 175 150 CP Hodnota CP v v závislosti príjmov od v závislosti p ( ( pre CP od menšie v väčšie kvartilovom ich proporcionálneho ako ako horný dolný rozpätí decil) decil) ) postavenia vo vzostupnom usporiadaní CP = 272198p + 99913 R 2 = 0,9994 CP = 425697p + 65536 R2 = 0,986 40 300 0 0.25 0.35 0.45 0.55 0.65 0.75 00.00 0.02 0.20 0.04 0.40 0.06 0.60 0.08 0.80 0.1 0.90 0.92 0.94 p 0.96 0.98 1.00 pp Ľubica Sipková

Diferencie Dx a Dp a z nich vychádzajúce výpočty Napr. v EXCEL-i:

3. Dp/Dx vzhľadom na stred príslušnej diferencie Dx Príjmy domácností SR v roku 2003 f emp (x) Zmena p v jednotkách zmeny CP, v závislosti od CP (vyrovnané kĺzavými priemermi pre 250 hodnôt) 0.00006 0.00005 Dp/Dx 0.00004 0.00003 0.00002 0.00001 0.00000 0 200 400 600 800 1000 v tis. Sk Mid-x Ľubica Sipková

4. Dx/Dp vzhľadom na stred príslušnej diferencie Dp Príjmy domácností SR v roku 2003 q emp (p) 20000000 Prírastky príjmov v jednotkách zmeny proporcionálneho postavenia v závislosti od proporcionálneho postavenia (bez hodnôt nad 20 000 000) 15000000 Dx/Dp 10000000 5000000 0 0 0.2 0.4 0.6 0.8 1 Mid-p Ľubica Sipková

5. Dp/Dx nie vzhľadom na x, ale vzhľadom na p f p ;emp (p) Prírastky proporcionálneho postavenia, vyjadrené v jednotkách prírastkov príjmov, v závislosti od proporcionálneho postavenia 0.0020 0.0015 Dp/Dx 0.0010 0.0005 0.0000 0.00 0.20 0.40 0.60 0.80 1.00 p Ľubica Sipková

Vystihnutie tvaru empirického rozdelenia - identifikácia Grafická analýza empirického rozdelenia príjmov Kvantitatívna analýza empirického rozdelenia na momentovom základe na kvantilovom základe Identifikácia rozdelenia jednoduchými tvarmi Celého rozdelenia Zvlášť pre dolný a horný koniec Voľba tvaru váh pre konce rozdelenia Ako funkcia p Ako parametre modelu

Najznámejšie kvantilové charakteristiky výberového súboru polohy (kvartily dolný lq, horný uq, decily, percentily, t.j. aj medián - m) variability (variačné rozpätie - vr, kvartilové rozpätie - iqr, kvart. odchýlka qo) šikmosti (kvartil. diferencia qd, kvartilová miera šikmosti Galtonov koef. šikmosti g=qd/iqr) špicatosti (? nie je bežne používaná)

Päť výberových charakteristík polohy: minimálna hodnota (s), dolný kvartil (lq), medián (m), horný kvartil (uq), maximálna hodnota (l) výberové p-kvantily pre p = 0; 0,25; 0,5; 0,75; 1 sú východiskom výberových charakteristík variability a Box-Plot-u

Výberové charakteristiky variability: horná kvartilová diferencia dolná kvartilová diferencia dolná p-diferencia uqd = uq m lqd = m lq ld(p) = m Q (p), kde Q (p) je p-ty výberový kvantil a 0 p 0,5 horná p-diferencia ud(p) = Q (1 p) m, kde Q (1 p) je (1 p) -ty kvantil a 0 p 0,5 kvantilové rozpätie ipr(p) = ud(p) + ld(p) = Q (1 p) Q (p) kvantilová odchýlka qo(p) = ipr(p)/2 mediánová absolútna odchýlka d = med x i - alebo x d = med x i - m

Výberové charakteristiky šikmosti: kvartilová diferencia Galtonov koeficient šikmosti qd = lq + uq 2m g = qd/iqr kvantilová diferencia, p-diferencia pd(p) = ud(p) ld(p) Galtonova šikmosť g(p) = pd(p)/iqr t. j. normovaná kvantilová diferencia pomocou kvartilového rozpätia Galtonov p-index šikmosti g*(p) = pd(p)/ipr(p) t. j. štandardizovaná kvantilová diferencia pomocou kvantilového rozpätia kvantilový podiel, kvantilová proporcia sr(p) = ud(p)/ld(p)

Výberové charakteristiky špicatosti: index špicatosti t(p) = ipr(p)/iqr, pre 0 p 0,5 horný a dolný index špicatosti ut(p) = ud(p)/uqd lt(p )= ld(p)/lqd Moorsova špicatosť k vychádza z oktilov e1, e2,, e7 t. j. kvantilov deliacich súbor na osem častí k = [(e7 e5) + (e3 e1)]/iqr horná a dolná špicatosť uk(t) = [Q (1 t)+ Q (0,5 + t) 2Q (0,75)]/[Q (1 t) Q (t)] kde 0 < t < 0,25 lk(t) = [Q (0,5 t) + Q (t) 2Q (0,25)]/[Q (1 t) Q (t)] kde 0 < t < 0,25

Moorsova sumarizácia o tvare rozdelenia Štyri miery (m, iqr, g, k) : 1. medián 2. kvartilové rozpätie 3. Galtonov koeficient šikmosti 4. Moorsova špicatosť poskytujú podľa Moorsa jednoduchú sumarizáciu o tvare rozdelenia na kvantilovom základe Zodpovedá Pearsonovej štvorčíselnej sumarizácii priemer, rozptyl, koeficient šikmosti a Pearsonova špicatosť na báze momentov.

Kvantilové deskriptívne štatistiky a grafické znázornenie kvantilov Ich aplikácia vo všetkých fázach modelovania: identifikácie estimácie verifikácie Štatistické modelovanie je proces interaktívny, takže postup a výber metód v určitej fáze vychádza zo záverov predchádzajúcej. Je to nevyhnutné aj preto, že výber metód, napr. estimácie, priamo závisí od predchádzajúcich výsledkov, t.j. vybraného tvaru vo fáze identifikácie. Ľubica Sipková

Pravdepodobnostné modelovanie inverznými distribučnými funkciami: Kvantilová deskriptívna analýza ako východisko ku kvantilovému modelovaniu Spracovanie druhej z cyklu prezentácií o kvantilovom modelovaní. Podrobnejšie možno nájsť v monografii: Sipková, Ľ; Sodomová, E.: Modelovanie kvantilovými funkciami, Vydavateľstvo EKONÓM, Bratislava, 2007; 175 s. ISBN 978-80-225-2346-2 Ľubica SIPKOVÁ marec 2009