Analýza hlavných komponentov
Motivácia Úloha: Navrhnite scenáre zmien výnosovej krivky pre účely stresového testovania v dlhopisovom portfóliu Problém: Výnosová krivka sa skladá z väčšieho počtu bodov, v ktorých je vývoj čiastočne korelovaný
Motivácia Čo hovoria údaje: 6 5 4 3 2 1 rok 3 roky 5 rokov 7 rokov 1 0Zdroj: http://www.ecb.int/stats/money/yc/html/index.en.html 1.1.2005 1.1.2006 1.1.2007 1.1.2008 1.1.2009 1.1.2010 1.1.2011
Motivácia Čo hovorí regulácia: Zákon o bankách ( 33f): Ekonomická hodnota banky nesmie klesnúť o viac než 20 % z hodnoty vlastných zdrojov banky následkom náhlej a neočakávanej zmeny úrokových mier na trhu. Opatrenie NBS o rizikách a systéme riadenia rizík ( 5): Náhlou a neočakávanou zmenou úrokových mier na trhu sa rozumie paralelný posun výnosovej krivky smerom nahor o 200 bázických bodov.
Základná myšlienka Ak by boli úrokové sadzby iba dve: elipsu možno reprezentovať jej hlavnou osou 0.25 0.2 0.15 0.1 0.05 0-0.25-0.2-0.15-0.1-0.05 0 0.05 0.1 0.15 0.2 0.25-0.05-0.1-0.15-0.2 Scatter plot 3R (zvislá os) os 1R, Prvé diferencie (abs) (r. 2005 6/2011)
Základná myšlienka Ak by boli úrokové sadzby tri: Elipsoid možno stlačiť do elipsy 3D scatter: 1R, 3R, 7R
PCA: hrubý náčrt PCA = analýza hlavných komponentov (principal component analysis) V manažmente rizík máme často problém s veľkým počtom rizikových faktorov akciové portfólio s veľkým počtom akcií výnosová krivka daná veľkým počtom bodov pozície v rôznych menách Cieľom je identifikovať najvýznamnejšie typické pohyby rizikových faktorov systémový pohľad na riziko využitie pri návrhu stresových scenárov Základná myšlienka: Znížiť dimenziu! Cieľom je nájsť malý počet lineárnych kombinácií pôvodných časových radov mali by vysvetľovať čo najväčšiu časť variability pôvodných údajov mali by byť navzájom nekorelované
Teoretické východiská Predpoklad: X je N T matica zmien rizikových faktorov (časové rady sú v riadkoch) Východisko: Spektrálna dekompozícia matice: Každú symetrickú maticu A možno zapísať v tvare A = P Λ P T, kde Λ je diagonálna matica vlastných hodnôt matice A a P je ortonormálna matica štandardizovaných vlastných vektorov matice A (stĺpce matice P). Aplikácia dekompozície na kovariančnú maticu Σ pôvodných údajov: Σ = P Λ P T Výpočet N T matice hlavných komponentov: Y = P T (X - μ)
Vlastnosti HK Platí E(Y) = 0 cov(y) = P T Σ P = P T P Λ P T P = Λ Dôsledok: HK sú nekorelované a ich variancie sú rovné vlastným číslam Transformácia na HK predstavuje centrovanie a rotáciu Keďže celková variabilita pôvodných premenných je n i 1 var( X i ) trace( ) i 1 tak časť celkovej variancie vysvetlená j-tym HK je n i n i 1 j i
Vlastnosti HK Prvý HK je štandardizovaná lineárna kombinácia X, ktorá má maximálnu varianciu spomedzi všetkých takýchto kombinácií Smer najväčšej variancie N-rozmerného oblaku pôvodných údajov Výberové hlavné komponenty: Ak X má normálne rozdelenie a cov(x) má všetky vlastné čísla rôzne, tak výberové HK sú odhadmi skutočných HK náhodného vektora X, ak sa na odhad cov(x) použije ML. Získané HK nie sú invariantné na zmenu škálovania premenných PCA sa aplikuje na štandardizované premenné, resp. na korelačnú maticu Výpočet kovariancie X a Y: Cov(X i,y j ) = p ij λ j. Odvodenie? Ako vypočítať koreláciu?
Určenie počtu HK Vlastné hodnoty vyššie ako priemer (Kaiser) Stanoviť limit na percento vysvetlenej variancie Zlom v grafe vlastných čísiel (scree plot)
Interpretácia PCA Komponentové váhy (component loadings): Ide o štandardizované vlastné vektory Koeficienty predstavujú váhu pôvodných premenných pri tvorbe HK Možno ich získať aj pomocou OLS Komponentové skóre (component scores) Súradnice objektov v priestore HK Biplot = zobrazenie objektov v priestore HK Čo by sa stalo, ak by sme pôvodné premenné necentrovali?
Výsledky Časové rady: denné absolútne zmeny (prvé diferencie) úrokových sadzieb Component loadings prvé 3 HK (97,7%) 0.3 0.25 0.2 1. HK (81,7%) - shift 2. HK (12,4%) - twist 3. HK (3,5%) - butterfly 0.15 0.1 0.05 0-0.05-0.1-0.15 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
Výsledky Component scores 6 5 4 3 2 1 rok 3 roky 5 rokov 7 rokov 1 0 1.1.05 1.1.06 1.1.07 1.1.08 1.1.09 1.1.10 1.1.11 300 200 100 0-100 -200 PC1 (integrated) PC2 (integrated) PC3 (integrated) -300-400 -500-600 1.1.05 1.1.06 1.1.07 1.1.08 1.1.09 1.1.10 1.1.11
Výsledky Ako identifikovať, ktorý typ posunu prevažoval v jednotlivé dni? 20 15 10 5 0-40 -30-20 -10 0 10 20 30 40-5 -10-15 -20 Scatter plot zobrazenie v priestore (PC1, PC2)
Veľkosť scenárov Poznáme kvalitatívny opis najreprezentatívnejších pohybov úrokovej krivky Ako určíme veľkosť príslušných scenárov?
Veľkosť scenárov Príklad pre 1. HK Podmienené normálne rozdelenie k danému dňu: N(μ HK, σ 2 HK) Zvolíme y = (μ HK u α σ HK, 0,..., 0) T Prenesenie zmeny spätnou transformáciou: x = Py + μ Využívame, že P T = P -1, kde stĺpce P tvoria vlastné vektory matice Σ HK sú navzájom lineárne nezávislé Po zjednodušení: x = P 1 (μ HK u α σ HK ) + μ, kde P 1 je vlastný vektor prislúchajúci najvyššej vlastnej hodnote.
Veľkosť scenárov Výsledok pre najtypickejší scenár s pravdepodobnosťou 99%: 2.5 2 1.5 1 0.5 0 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Prípad kovariančnej matice Component loadings prvé 3 HK (98,3%) 0.3 0.25 0.2 0.15 1. HK (83,2%) - shift 2. HK (12,3%) - twist 3. HK (2,7%) - butterfly 1. HK 2. HK 3. HK 0.1 0.05 0-0.05-0.1-0.15 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Slabými čiarami sú zobrazené predchádzajúce výsledky získané z korelačnej matice
Kritika Hlavné komponenty často nie sú dobre interpretovateľné Pokrytá je iba lineárna závislosť (t.j. korelácia) Nezachytáva fakt, že závislosť môže byť v čase trhových turbulencií vyššia Neumožňuje časovo premenlivé váhy pri konštrukcii HK
Kritika Ilustrácia, že faktory sú nekorelované, ale istý typ závislosti existuje 25 20 15 10 5 0 1.1.2005 1.1.2006 1.1.2007 1.1.2008 1.1.2009 1.1.2010 1.1.2011 ST_DEV(PC1) (EWMA) - shift ST_DEV(PC3) (EWMA) - butterfly ST_DEV(PC2) (EWMA) - twist
Možné rozšírenia 1. Využitie podmienenej kovariančnej / korelačnej matice 2. Orthogonal GARCH 3. PCA ako medzivýpočet v riadení rizík 4. Faktorová analýza rotácia faktorov s cieľom zvýšiť interpretáciu