МАТЕМАТИЧКИ ФАКУЛТЕТ, УНИВЕРЗИТЕТ У БЕОГРАДУ Неки нелинеарни модели временских серија и њихова примена Мастер рад Ментор: др Весна Јевремовић Студент: Александра Блазнавац 035/200 Београд, септембар 202.
Садржај Предгпвпр... i. Увпдни деп..... Случајни прпцес....2. Линеарна регресија... 4.3. Мпдели ппкретних прпсека... 5.4. Аутпрегресипни мпдели временских серија... 6.5. Аутпрегресипни мпдели ппкретних прпсека... 6.6. Лаплас-Стилтјеспва трансфпрмација... 7 2. Нелинеарни мпдели временских серија... 8 2.. Билинеарни мпдел... 0 2.2. Класа мпдела са прагпвима... 2.2. TAR (eng. treshold AR models) мпдел... 2.2.2 SETAR ( eng. Self-exciting ) мпдел... 2 2.2.3 Мултиваријантни SETAR мпдел... 20 2.2.4 STAR мпдел... 23 2.3. Аутпрегресипни мпдели са експпненцијалнпм расппделпм... 24 2.3. Мпдел EAR()... 24 2.3.2 Мпдел ТEAR()... 27 2.3.3 Мпдел NEAR()... 29 2.3.4 Мпдел AREX()... 3 3 Примена... 35 ЗАКЉУЧАК... 53 ЛИТЕРАТУРА... 54
i Предговор Многи процеси, посебно они који се јављају у природним наукама и инжењерству, испољавају неки облик нелинеарног понашања. Ово понашање укључује неке особине које нису могуће код Гаусовских линеарних процеса, као на пример, псеудо циклични образац код којег вредности узорка расту до њиховог максимума а затим опадају, или се појављују као аутлајери посматране серије. Овакво понашање је довело до развоја и интересовања за поједине типове нелинеарних модела временских серија, као што су билинеарни, модели са праговима (TAR) и модели са случајним коефицијентима. У уводном делу овог рада упознаћемо се са појмовима који су неопходни за разумевање нелинеарних модела временских серија који се разматрају. Нелинеарни модели временских серија су дати у другој глави, и то тако што су подењени на три поглавља. У првом поглављу 2. је описан билинеарни модел временских серија. Друго поглавље 2.2 говори о моделима са праговима, где су и навадени неки од њих, TAR, SETAR, мултиваријантни SETAR и STAR модел. У трећем поглављу 2.3 разматрају се модели који припадају класи нелинеарних модела са случајним коефицијентима. Утврђују се услови при којима модели имају одређену маргиналну расподелу, у овом случају су разматрани модели који имају експоненцијалну маргиналну расподелу. У трећој глави дат је познати пример о канадским рисовима. На крају рада је списак коришћене литературе.
Неки нелинеарни мпдели временских серија и оихпва примена. Уводни део У овој глави биће наведени основни појмови који су коришћени у даљем раду и који омогућавају боље разумевање модела о којима ће касније бити речи... Случајни процес Дефиниција. Ω је скуп свих исхода једног експеримента. Елементи овог скупа се означавају са ω i, i =,2, и називају се елементарни догађаји. Дефиниција 2. (Аксиома ς-поља) Подскуп F партитивног скупа Ω је ςпоље (ς-алгебра) над Ω ако важе услови: Ω F A F A F A i i N F i= A i F. Дефиниција 3. (Аксиома вероватноће) Нека је Ω је скуп свих елементарних догађаја и F ς-поље над Ω. Функција P: F 0, се зове вероватноћа на простору Ω, F ако задовољава услове: P Ω = Ако A i i N F, A i A j =, i j, i =,2, онда P A i = P A i. i= i= Простор вероватноћа је уређена тројка Ω, F, P. Дефиниција 4. Нека је Ω, F, P простор вероватноћа. Пресликавање X: Ω R се зове случајна променљива ако B B важи да је X B F где је B Борелова ς-алгебра. За X кажемо да је F-мерљиво. Дефиниција 5. Фамилија случајних променљивих X t ω : t T, ω Ω дефинисан над истим простором вероватноће Ω, F, P се зове случајни (стохастички) процес са индексним скупом T. Променљива ω се често изоставља у запису, па се уместо тога случајни процес означава са X t, t T. За свако фиксирано t о T, X tо је једна одређена случајна променљива коју зовемо засек. За фиксирано ω 0 Ω,
2 Александра Блазнавац X t је функција дефинисана на скупу T која се назива реализација или трајекторија случајног процеса. За фиксиране t о T и ω 0 Ω, X tо је реалан број или једна реализација случајног процеса. Свака случајна променљива има свој закон расподеле, који је одређен одговарајућом функцијом расподеле F Xt x = P ω Ω X t ω < x = P X t < x. У општем случају, неопходно је знати и расподеле вишедимензионалних засека. Нека је фиксирано n временских тренутака t, t 2,, t n. Сваком од тих тренутака одговара по једна случајна променљива. Тако добијамо n случајних променљивих X t, X t2,, X tn, које можемо посматрати као координате n-димензионалног случајног вектора X t, X t2,, X tn. То је један n-димензионални засек случајног процеса X. Расподела n-димензионалног засека одређена је n-димензионалном функцијом расподеле: F n t, t 2,, t n ; x, x 2,, x n = P X t < x, X t2 < x 2, X tn < x n. Коначнодимензионалне расподеле случајног процеса задовољавају следећа два услова: Услов симетрије - функција F n је инваријантна у односу на пермутације свих n парова, тј. за сваку пермутацију j, j 2,, j n скупа,, n F n t j, t j2, t jn ; x j, x j2,, x jn = F n t, t 2,, t n ; x, x 2,, x n. Услов сагласности F n t, t 2,, t n, t n ; x, x 2,, x n, = F n t, t 2,, t n ; x, x 2,, x n. Нека је X t, t T случајни процес. Тада је: средња вредност случајног процеса варијанса случајног процеса E X t = μ t, t T var X t = ς t 2, t T коваријанса случајног процеса γ X r, s = cov X r, X s = E X r E X r X s E X s, r, s T
Неки нелинеарни мпдели временских серија и оихпва примена 3 коефицијент корелације случајног процеса ρ X r, s = cov X r, X s var X r var X s Дефиниција 6. Случајни процес X t, t T је строго стационаран ако су његове коначнодимензионалне расподеле инваријантне у односу на транслацију времена, односно ако за t i, t i + T, i =,2, важи F n t, t 2,, t n ; x, x 2,, x n = F n t +, t 2 +,, t n + ; x, x 2,, x n. Ако је случајни процес строго стационаран, функција расподеле случајне променљиве X t је иста у свакој тачки из индексног скупа. Ако је X t, t T строго стационаран случајни процес са E X t <, тада очекивана вредност од X t је константна за свако t T, пошто је функција 2 расподеле иста за свако t T. Слично, ако је E X t < тада је дисперзија од X t је константна за свако t T. Дефиниција 7. Случајни процес X t, t T је слабо стационаран ако је :. E X t = const за свако t T, 2. E X t 2 < за свако t T, 3. коваријанса од X t i X t+ зависи само од разлике : cov X t, X t+ = E X t E X t X t+ E X t+ = E X t X t+ E X t E X t+ = γ. Очигледно је да увек из строге стационарности следи слаба стационарност случајног процеса. Услови строге и слабе стационарности су еквивалентни ако је заједничка расподела разматраног случајног низа нормална. Такав случајан низ се назива Гаусовски случајан процес. Процес бели шум ћемо означити са ε t, t =,2,. Дати случајан процес поседује следећа својства:. E ε t = 0, t =,2, 2. var ε t = E ε t 2 = ς ε 2 = const, t =,2, 3. cov ε t, ε s = E ε t ε s = 0, за све s t. Процес бели шум представља низ некорелисаних случајних променљивих са нултом средњом вредношћу и константном дисперзијом. Уколико наведеним условима додамо и услов да су чланови низа бели шум
4 Александра Блазнавац независне случајне променљиве, чија је заједничка расподела нормална, тада је разматрани случајни процес Гаусовски бели шум. Дефиниција 8. Случајни процес X t, t T са пребројивим индексним скупом T зове се временска серија. Обично се за индексни скуп T узима скуп целих бројева Z. Временска серија се може схватити и као једна реализација случајног процеса..2. Линеарна регресија Линеарна регресија показује да ли између две променљиве постоји линеарна (праволинијска) веза и ако постоји која је њена јачина при чему је битно која је зависна променљива Y, а која је независна променљива X. Најједноставнији облик функционалне зависности је линеарна зависност: Y = α + βx + ε, α, β R где се зависна променљива Y изражава преко независне променљиве X, док је ε грешка коју правимо приликом линеарне регресије. Ово је модел просте линеарне регресије. Такав приступ је у пракси оправдан јер смо најчешће у немогућности да сагледамо све утицаје на величину Y, па узимамо у обзир само најбитније. Могуће је да смо анализом закључили да је Y у значајној линеарној зависности од више променљивих, па би тада одређивали модел облика Y = α + k i= β i X i + ε, α, β i R, i =,2, k а ово је модел вишеструке линеарне регресије. На Слици. приказана је права линеарне регресије и аритметичка средина y променљиве y, једна тачка из узорка x i, y i и тачка x i, y i оцењена регресионим моделом. Одступање вредности y i од аритметичке средине y означили смо као total. То одступање може да се подели на два дела, део који представља одступање оцењене вредности y i од y (модел) и одступање вредности из узорка y i од оцењене вредности y i (грешка, резидуали). Ако бисмо посматрали квадрате одступања свих тачака из узорка и свих оцењених вредности, на основу модела, од y и сумирали их, после одређених трансформација добили бисмо: n j = y j y 2 n = y j y 2 j = n + y j y j 2 j =
Неки нелинеарни мпдели временских серија и оихпва примена 5 где је прва сума TSS (eng. total sum of square) укупна грешка коју правимо регресионим моделом, друга сума ESS (eng. explained sum of square) се односи на део података y који се може објаснити моделом и трећа сума RSS (eng. reziduals sum of square) се односи на део података y које приписујемо грешки модела..3. Модели покретних просека Слика. Дефиниција 9. Процес покретних просека реда q, у ознаци MA(q) дефинише се на следећи начин: X t = μ + ε t + θ ε t + θ 2 ε t 2 + θ q ε t q где је ε t бели шум, μ = E X t бројеви. и θ, θ 2,, θ q могу бити било који реални Очекивање процеса X t је дато са: E X t = μ + E ε t + θ E ε t + θ 2 E ε t 2 + θ q E ε t q = μ. Дисперзија MA(q) процеса је: var X t = ς 2 + θ 2 2 + + θ q. Коваријациона функција и коефицијент корелације су γ k = 0 k > q q k ς 2 j =0 θ j θ j +k, k q
6 Александра Блазнавац ρ k = γ k γ 0 = 0 k > q q k j =0 q 2 j =0 θ j θ j θ j +k, k q Како је E X t <, var X t < и γ k = f(k) процес покретних просека је увек слабо стационаран..4. Ауторегресиони модели временских серија Дефиниција 0. Случајни низ X t, t T, T = 0, ±, ±2, за који важи X t = φ X t + φ 2 X t 2 + + φ p X t p + ε t, t T () где су φ, φ 2,, φ p R, φ p 0, а ε t бели шум, назива се ауторегресиони преоцес реда p, у ознаци AR(p). Коваријациона функција је : γ k = φ γ k + φ 2 γ k 2 + + φ p γ k p, k > 0. Коефицијент корелације је : ρ k = φ ρ k + φ 2 ρ k 2 + + φ p ρ k p, k > 0. Парцијални аутокорелациони коефицијент, φ kk, дефинише се као k -ти ауторегресиони параметар модела (). Овај коефицијент показује реакцију зависне променљиве X t на јединичну промену објашњавајуће променљиве X t k, уз услов да је утицај осталих објашњавајућих променљивих X t, X t 2,, X t k+ константан..5. Ауторегресиони модели покретних просека Општи облик ауторегресионих модела покретних просека је X t = φ X t + φ 2 X t 2 + + φ p X t p + ε t θ ε t θ 2 ε t 2 θ q ε t q (2) За ове моделе користи се ознака ARMA(p, q), где је p ред ауторегресионе компоненте и q ред компоненте покретних просека и ε t је бели шум. Стационарност овако дефинисане временске серије одређена је стационарношћу одговарајуће ауторегресионе компоненте. Коваријациона функција ове временске серије је дата са:
Неки нелинеарни мпдели временских серија и оихпва примена 7 γ k = φ γ k + φ 2 γ k 2 + + φ p γ k p, док је коефицијент корелације дат са: ρ k = φ ρ k + φ 2 ρ k 2 + + φ p ρ k p за k > q..6. Лаплас-Стилтјесова трансформација Дефиниција. Нека је F функција расподеле вероватноћа случајне променљиве X са вредностима на 0,. Лаплас-Стилтјесова трансформација случајне променљиве X, односно њене функције расподеле F је функција φ X s одређена са φ X s = E e sx, при чему је φ X s = φ x. e sx φ x dx у случају постојања густине расподеле 0 Особине Лаплас-Стилтјесове трансформације неопходне за даљи рад су: ) ако је c константа, онда је φ cx s = E e scx = φ X cs 2) ако су X и Y независне случајне променљиве, онда је s X+Y φ X+Y s = E e = E e sx e sy = E e sx E e sy = φ X s φ Y s 3) разним случајним променљивима одговарају разне Лаплас- Стилтјесове трансформације.
8 Александра Блазнавац 2. Нелинеарни модели временских серија Посматрајмо временску серију са једнако расподељеним временским интервалима Z t, t =,2,, N, где је N обим узорка. Чиста стохастичка временска серија Z t је линеарна ако се може представити у следећем облику Z t = μ + ψ i a t i, i=0 (3) где је μ константа, ψ i су реални бројеви, при чему је ψ 0 =, и a t је низ независних и једнако расподељених случајних величина са датом функцијом расподеле. Претпоставимо да је расподела од a t непрекидна и да је Е a t = 0. У многим случајевима, даље претпостављамо да је var a t = ς 2 2 2 a, или чак да је a t Гаусовски процес. Ако је ς a i=0 ψ i <, онда је Z t слабо стационарна временска серија. Било који стохастички процес који не задовољава услов 3 је нелинеаран. Ова дефиниција нелинеарности важи за чисто стохастичке временске серије. Математички, модел чисто стохастичке временске серије Z t је функција низа независних и једнако расподељених случајних величина Z t = f a t, a t,. (4) Из линеарности модела у једнакости 3, следи да је f линеарна функција својих аргумената. Било каква нелинеарност функције f резултује нелинеарни модел. Нелинеарни модел у 4 није директно применљив јер садржи превише параметара. Да би нелинеарни модел био доступан, записујемо га преко условних момената. Нека је Y t ς -поље генерисано доступним информацијама у тренутку t. Y t означава колекцију линеарних кобинација елемената из Z t, Z t 2, и a t, a t 2,. Условно очекивање и дисперзија од Z t под условом Y t су μ t = E z t Y t g Y t, ς t 2 = var z t Y t Y t, (5) при чему су g i > 0 добро дефинисане функције. Тако имамо модел Z t = g Y t + Y t ε t,
Неки нелинеарни мпдели временских серија и оихпва примена 9 где је ε t, = a t ς t. Ако је g нелинеарна функција, за Z t се каже да је нелинеарна у очекивању. Ако функција варира у времену, за Z t се каже да је нелинеарна у дисперзији. На основу Волдове декомпозиције, слабо стационарне и чисто стохастичке временске серије, могу бити представљене као линеарне функције некорелисаних величина. За стационарне нестабилне серије, ове величине су некорелисане, али су зависне. Модели објашњени у поглављима 2. и 2.2 представљају облик нелинеарности, који произилази из модификације једначине условног очекивања 5. Основна идеја ових нелинеарних модела је допуштање условном очекивању μ t да се развија током времена опонашајући неку једноставну нелинеарну функцију. Многи нелинеарни ARMA модели могу се представити као специјални случајеви следеће уопштене формуле : где је Z t φ Y t Z t φ p Y t Z t p = θ 0 Y t + a t θ Y t a t θ q Y t a t q Y t = Z t,, Z t p, a t,, a t q i φ i Y t i θ i Y t су функције вектора стања (eng. state vector) Y t у тренутку t. За конкретне случајеве представићемо билинеарни, TAR, SETAR, мултиваријантни SETAR i STAR модел. Други типови нелинеарних модела су модели са случајним коефицијентима међу којима постоји зависност. У поглављу 2.3 ће се разматрати модели временских серија ауторегресионог типа првог реда. За постављени модел временске серије и претпостављену маргиналну расподелу посматраног процеса потребно је одредити услове при којима ће иновациони процес имати неку расподелу и уједно се та расподела одређује. Прпцес X t, t T мпже се представити кап збир где су: V t детерминистичка кпмппнента ε t, t T је прпцес белпг шума 2 j = χ j <, χ 0 = E ε t, V t = 0. X t = V t + j = χ j ε t j
0 Александра Блазнавац 2.. Билинеарни модел Линеарни модел дат једначином (3) представља Тејлоров развој првог реда функције (4). Основна идеја билинеарних модела јесте да се у проширењу до нелинеарности искористе вишедимензионалне случајне величине. Нека k су φ i константе, и нека је θ j Y t = b j + b ij z t i. Тада имамо модел реда (p, q, k, s) Z t φ Z t φ p Z t p = θ 0 + a t i= q j = b j a t j k s i= j = b ij Z t i a t j. Еквивалентно, са ознакама p = max p, k, φ i = 0, i > p, b ij = 0, i > k i α i t = q j = b ij a t j претходну једнакост можемо записати на следећи начин Z t p i= φ i α i t Z t i = θ 0 + a t q b j a t j j = i тада је представљена u obliku ARMA модела са случајним коефицијентима за AR параметре, који су линеарне функције претходних (прошлих) вредности процеса иновација a t. Овај модел су увели Granger и Andersen (978). Услове стационарности као и друга својства уопштеног билинеарног модела изучавали су Лиу 2 и Броквел 3. На пример, посматрајмо билинеарни модел првог реда Z t φ Z t = a t b Z t a t. Утврђено је да је услов стационарности другог реда оваквог процеса дат са φ 2 + ς 2 a b 2 <, и коваријанса од Z t под условом стационарности, задовољиће γ j = φ γ j za j >. Према томе, ови процеси ће, у суштини, имати исту структуру коваријансе као и ARMA(,) процес, и овај пример указује на чињеницу да су углавном потребни моменти већи од другог реда да би се направила разлика између линеарних и нелинеарних модела. 2 Chen, R. Liu 3 P. J. Brockwell
Неки нелинеарни мпдели временских серија и оихпва примена 2.2. Класа модела са праговима 2.2. TAR (eng. treshold AR models) модел Овај модел је настао због неколико нелинеарних карактеристика које се често појављују у пракси, као што су асиметрија у обрасцу пада и раста процеса. Модел користи по деловима линеарне моделе да би се добила боља апроксимација једначине условног очекивања. Међутим, за разлику од традиционалног по деловима линеарног модела који допушта да се измене модела дешавају у временском простору, TAR модел користи простор прагова да би побољшао линеарну апроксимацију. Овај модел је предложио Тонг 4 (978), а детаљно су га описали Тонг и Лим 5 (980). Основни TAR модел може се посматрати као по деловима линеарни AR модел, са донекле, наглим променама из једне једначине или режима на други у зависности од тога да ли је или не вредност прага r j премашила Z t d. Нека је θ i = 0, i 0, и за целобројно временско кашњење (временску доцњу) d i неку threshold константу r φ i Y t = φ i ako je Z t d r 2 φ i ako je Z t d > r θ 0 Y t = θ 0 ako je Z t d r 2 θ 0 ako je Z t d > r Тада имамо модел Z t = p θ 0 + φ i Z t i + a t ako je Z t d r θ 0 2 + i= p i= 2 2 φ i Z t i + a t ako je Z t d > r (6) где су a t i a t 2 бели шумови са дисперзијама ς 2 i ς 2 2, редом. Константа r се назива праг, a d параметар кашњења. Овај модел се лако проширује на l-праг модел који је дат следећом једначином Z t = θ 0 j + p i= j j φ i Z t i + a t ako je c j < Z t d < c j j =,, l 4 Howell Tong (рпђен 944 у Хпнг Кпнгу) 5 K. S. LIm
2 Александра Блазнавац sa праговима r < r 2 < < r l ( i r 0 =, r l = + ), који дефинишу поделу на реалној правој на l подинтервала. Ауторегресиони модел са праговима првог реда, Z t = θ 0 j + φ j Z t + a t j ako je r j < Z t < r j на пример, може се сматрати по деловима линеарном апроксимацијом општег нелинеарног модела првог реда Z t = g Z t + a t, где је g нека општа нелинеарна функција. 2.2.2 SETAR ( eng. Self-exciting ) модел Класа SETAR модела (Тонг 978,983) је широко коришћена у литератури да објасни различите емпиријске проблеме у посматраним временским серијама. На пример, користили су је Тонг и Yeung за загађеност воде на плажама, Watier и Richardson за епидемиолошки приказ, Lewis и Ray за температуру морске површине, Montgomery за U.S. незапосленост, Fuecht за медицинска истраживања, Clements и Smith за промену курса. Популарност ових модела је због њихове једноставности да се одреде, процене и интерпретирају у односу на друге нелинеарне моделе временских серија. Форма SETAR(d; p, p 2,, p k ) модела са k режима je Z t = p φ () 0 + φ () j Z t j + a () t, ako Z t d r φ 0 (2) + φ 0 (k) + j = p 2 j = p k j = φ (2) j Z t j + a (2) t, ako r < Z t d r 2 φ (k) j Z t j + a (k) t, ako r k < Z t d (7) при чему је d параметар кашњења (eng. delay parameter) и p i је ред ауторегресионог модела у i-том режиму. Јасно је да се AR модели разликују у зависности од режима, иначе, број режима би се смањио. Прагови r,, r k задовољавају ограничење = r 0 < r < < r k < r k =. Низ случајних величина a t (i), i =,2,, k има нормалну расподелу са параметрима (0, ς i 2 < ). Ако се претпостави једнакост дисперзија, тзв. хомоскедастичност у режимима ς 2 = ς 2 2 = = ς k 2 = ς ε 2, заједничка дисперзија се може израчунати из обједињеног узорка. У оквиру сваког режима претпоставља се да понашање променљиве у временској серији опонаша линеарни ауторегресиони процес. Режим који се примењује, у сваком тренутку t, зависи од посматране историје самог модела Z t,
Неки нелинеарни мпдели временских серија и оихпва примена 3 посебно од вредности Z t d. Из тог разлога Тонг i Лим (980) су процес (7) назвали самопобуђујући (eng. self-exciting) TAR модел. Моделирање 8 Постоји много начина за моделирање SETAR модела, али су поступци које је дао Цај 6 (989) далеко једноставнији од осталих. То укључује фазе спецификације модела, процену и дијагностичку проверу. Тестирање на нелинеарност и спецификација модела Веома је важно имати тест који је валидан при доношењу одлуке да ли је бољи линеарни ARMA или нелинеарни SETAR модел за описивање динамике серије која се проучава. За тестирање нелинеарности користи се тест који је повезан са портманто тестом, који је заснован на уређеној ауторегресији и предвиђеним резидуалима. Ипак, два теста се разликују у начину на који се нека својства предвиђених резидуала користе. Посматрајмо 2-режимни SETAR модел Z t = p θ 0 + φ i Z t i + a t ako je Z t d r θ 0 2 + i= p i= 2 2 φ i Z t i + a t ako je Z t d > r где је t p +,, n, n је број опсервација. Сада поређајмо опсервације у растућем поретку. Нека је π i индекс i-те најмање опсервације, тада модел можемо записати у следећем облику p θ 0 + φ i Z πi +d + a πi +d ako je i s Z πi +d = θ 0 2 + i= p φ i 2 Z πi +d 2 + a πi +d ako je i > s (8) i= при чему је i p + d,, n d и s задовољава Z πs < r Z πs+.ово је уређена ауторегресија где се првих s случајева налази у првом режиму, а остали у другом. Уређена ауторегресија групише податке у два режима, тако да све опсервације у једној групи представљају исти AR процес. Приметимо да раздвајање података не захтева прецизну вредност r. Само број опсервација у свакој групи зависи од r. 6 Ruey S. Tsay
4 Александра Блазнавац За уређену ауторегресију (8), нека је β m вектор оцена добијених методом најмањих квадрата добијених на основу првих m случајева, P m је придружена X X инверзна матрица, и x m+ вектор регресора следеће опсервације за улазак у ауторегресију, односно Z πm + +d. Тада, рекурзивне оцене добијене методом најмањих квадрата могу бити ефикасно израчунате помоћу β m + = β m + K m+ Z πm + +d x m+ β m, D m+ =.0 + x m+ P m x m+, и K m + = P m x m+ D m+, x m+ x m+ P m+ = I P m D m + P m и предвиђени и стандардизовани предвиђени резидулаи помоћу a πm + +d = Z πm + +d x m+ β m (9) e π m + +d = a πm + +d / D m+ (0) Сада посматрајмо SETAR модел дат једначином (7). Када је p = p 2 = = p k = p и φ i () = φ i (2) = = φ i (k) за i = 0,,, p, SETAR модел постаје линеарни ауторегерсиони процес реда p. Нека је p = max p, p 2,, p k и d p, за посматрану временску серију Z,, Z n. Нека је π i индекс i-те најмање опсервације из Z p+ d,, Z n d. Форма уређене ауторегресије Z π +d Z π2 +d Z πj +d = Z π +d Z π Z π +d p Z π2 +d Z π2 Z π2 +d p Z πj +d Z πj Z πj +d p φ 0 φ φ p + a π +d a π2 +d a πj +d () се успешно фитује, односно, прилагођује подацима, при чему је j = m, m +,, n p, и m је број опсервација са којима се започиње уређена ауторегерсија. Tsay (989) је предложио коришћење m n 0 + p. Следећи пример се користи да покаже кључне кораке у добијању уређене ауторегресије. Табела представља временску серију са n = 24.
Неки нелинеарни мпдели временских серија и оихпва примена 5 Претпоставимо да је p = 3 и d =. Симбол π i представља индекс i -те најмање опсервације из Z 3,, Z 23. Вредности π i су израчунате у Табели. Табела Хипотетички подаци временске серије t Z t π i t Z t π i t Z t π i 2 3 4 5 6 7 8 0 82 66 35 3 7 20 92 (0)=3 (7)=4 (6)=5 ()=6 (3)=7 (6)=8 9 0 2 3 4 5 6 54 25 85 68 38 23 0 24 (2)=9 (8)=0 (4)= (2)=2 (8)=3 (4)=4 (2)=5 (5)=6 7 8 9 20 2 22 23 24 83 32 3 8 90 67 60 47 (3)=7 (20)=8 (9)=9 (7)=20 (5)=2 ()=22 (9)=23 У Табели 2 су приказани подаци уређене ауторегресије дужине j = n p = 2. Променљиве Z t у Табели 2 су уређене према t = π i + d, за d = и i =, 2. Регресори (eng. regressors), Z t, Z t 2, Z t 3 су уређени према, Z πi +d, Z πi +d 2, Z πi +d 3 =, Z πi, Z πi, Z πi 2 za d = i i =, 2. И на крају је матрица уређена према регресору Z t ( погледати шесту колону Табеле 2 ).
6 Александра Блазнавац Табела 2 Матрица података уређене ауторегресије (p = 3 i d = ) Временски индекси Независна Регресори променљива i π i π i + d Z πi +d Z πi +d 2 Z πi +d 3 2 3 4 5 6 7 8 9 0 2 3 4 5 6 7 8 9 20 2 6 5 7 4 6 5 4 3 23 3 22 2 7 2 8 20 0 9 8 9 7 6 8 5 7 6 5 4 24 4 23 3 8 2 22 9 2 20 9 0 Z πi +d 20 24 92 0 83 7 3 23 47 35 60 38 32 68 67 54 90 85 8 3 25 7 0 20 23 24 3 35 38 47 60 67 68 83 85 90 92 8 25 3 32 54 3 23 7 38 0 35 66 68 67 82 90 85 24 25 8 20 3 54 32 83 92 35 38 3 68 23 66 82 85 90 0 8 25 0 54 3 7 32 92 83 24 20 Уопште, ауторегресија дата једначином (8) се сортира на основу променљиве Z t d, која је индикатор режима SETAR модела. За свако j из једначине (8), можемо израчунати, за један корак унапред, стандардизовану предвиђену грешку e π j + +d. Ако би разматрани модел био линеарни AR(p) процес, стандардизоване грешке не би биле само независне и идентично расподељене, већ би постојала и ортогоналност са регресорима Z πj + +d,, Z πj + +d p. Ако би модел био нелинеарни SETAR процес, онда би ортогоналност била нарушена. Tsay (989) разматра ово својство и посматра регресију e = Zβ + η (2) где је e = e π m + +d,, e π n p +d, Z је матрица регресора Z πj + +d,, Z πj + +d p за j = m,, n p, β је p -димензиони вектор параметара и η је вектор грешака. За тестирање ортогоналности, па тако и SETAR нелинеарности, користи се F-статистика
Неки нелинеарни мпдели временских серија и оихпва примена 7 F p, d = n t=p+ e t 2 n t=p+ η t 2 / p + η t 2 n t=p+ / n 2p m (3) са претпоставком H 0 : β = 0. Теорема. Претпоставимо да је Z t линеарни стационарни AR процес реда p.тада Z t представља SETAR модел са k = ( k-број режима ). За велико n тест статистика F p, d апроксимативно одговара F-расподели са p + и n 2p m степени слободе. Главни проблем моделирања TAR модела јесте спецификација прага, који игра главну улогу у нелинеарности модела. За модел (7) спецификација подразумева и одређивање параметра кашњења d. Тонг и Лим користе Akaike информациони критеријум (AIC; 974) за одређивање овог параметра након одабира свих осталих. Постоји и друга процедура која одређује d пре проналажења прагова. Ова процедура је заснована на перформансама Ф- статистике. Претпоставља се да је AR ред p дат. За дат TAR процес и AR ред p, бира се оцена параметра кашњења d p таква да важи F p, d p = max δ S F p, δ (4) где је F p, δ тест статистика дефинисана са (3), индекс p означава да оцена параметра d може зависити од p, и S је скуп позитивних вредности, тј. колекција могућих вредности за d. Због једноставности претпоставимо да све тест статистике F p, δ из (4) имају исти број степени слободе. То може бити постигнуто одговарајућим избором почетне вредности m рекурзије. Када су степени слободе различити, може се израчунати p вредност F - статистике и одабрати d p на основу минимума резултујућих p вредности. Приметимо да је избор параметра d p у (4) заснован на идеји да ако су TAR модели потребни, онда би се могло почети са параметром кашњења који даје најзначајнији резултат при тестирању нелинеарности прага. Опрезнији аналитичари могу желети да испробају неколико вредности параметра d, као што су максимум и други максимум од F p, d. Код TAR модела потребно је посебну пажњу посветити оцењивању прагова. Да бисмо ово објаснили, претпоставимо да је k = 2 и права вредност r задовољава Z πs < r Z πs+. Тада је било која вредност из интервала Z πs, Z πs+ довољно добра у обезбеђивању оцене r, јер све дају исти резултат код фитовања одређеног TAR модела. Дакле, како одабрати оцену r са добрим особинама од бесконачно много могућности, остаје као велики проблем. Уопште, може се обезбедити интервал оцена за сваку вредност
8 Александра Блазнавац прага или користити узорачке перцентиле као вредности оцена. Користићемо ово друго, тј. користићемо адаптиран приступ Tong и Lim (980) који користи емпиријске перцентиле као кандидате за вредности прагова. Али, уместо да се унапред одређује скуп коначних бројева од узорачких перцентила са којима би се радило, претраживаћемо међу перцентилима како би лоцирали вредности прагова. Једино ограничење јесте то да праг није превише близу 0ог или 00ог перцентила. За ове екстремне вредности нема довољно опсервација које би дале ефикасну оцену. Метода којом би се пронашли прагови је дијаграм распршења разних статистика у односу на одређени праг. Иако график није формално испитивање и оцењивање статистика, ипак пружа корисне информације о проналажењу прагова. Графици који се користе су а) дијаграм распршења стандардизованих предвиђених резидуала (0) или обичних предвиђених резидуала (9) у односу на Z t dp, и б) дијаграм распршења t односа рекурзивних оцена AR коефицијента у односу на Z t dp. У оквиру уређене ауторегресије, TAR модел се састоји од различитих промена модела које се дешавају на свакој вредности прага r j. Дакле, предвиђени резидуали су засновани на праговима. Дијаграм распршења стандардизованих предвиђених резидуала у односу на променљиву прага на тај начин може открити позицију вредности прага TAR модела. С' друге стране, за линеарне временске серије дијаграм распршења је случајан, осим на почетку рекурзије. У случају дијаграма распршења t односа рекурзивних оцена AR коефицијента у односу на променљиву прага Z t dp, t односи имају две функције: а) они показују значајност посебног AR коефицијента, и б) када је коефицијент значајан, t односи постепено и глатко конвергирају ка фиксној вредности како се рекурзија наставља. Посматрајмо обични TAR модел где су φ Z t = φ Z t + a t ako je Z t d r (5) 2 2 φ Z t + a t ako je Z t d > r и φ 2 различити. Нека је φ рекурзивна оцена лаг- AR коефицијента у уређеној ауторегресији (8). t односи од φ се понашају тачно као они из линеарне временске серије пре него што рекурзија достигне вредност прага r. Када се r једном достигне, оцена φ почиње да се мења и t односи почињу да одступају. Образац постепене конвергенције t односа је уништен. У ствари, t однос почиње да се окреће, и можда мења правац на грничној вредности (вредности прага). За модел (5), φ почиње да се мења када Z t d достигне r и коначно је то компромис између φ и φ 2. Ово
Неки нелинеарни мпдели временских серија и оихпва примена 9 понашање се такође појављује и код удружених t односа показујући вредности r. Уопште, промена t односа је значајна када се два AR коефицијента значајно разликују. Након одређивања AR реда p и параметра кашњења d p, можемо прецизирати ред за сваки режим и вредност прага на основу AIC. AIC се рачуна за различите вредности p и за сваку потенцијалну вредност прага. Овај критеријум је дефинисан са AIC p = N log RSS/N + p + log N RSS је сума квадрата резидуала, N ефективан број опсервација и p је број независних параметара у моделу. Сада је потребно одрадити процедуру моделовања TAR модела коју је предложио Цај у 8. Процедура се састоји из неколико корака, али је сваки корак релативно лак у поређењу са оним које су Тонг и Лим представили. Корак. Одредити AR ред p и скуп могућих заостатака (лагова) прага S. Корак 2. Фитовати уређену ауторегресију за дато p и сваки члан d скупа S, а затим применити тест нелинеарности F p, d. Ако је откривена нелинеарност процеса, одредити параметар d p, као што је претходно описано. Корак 3. За дато p и d p распршења., пронаћи прагове користећи дијаграм Корак 4. Прецизирати AR ред и прагове, ако је неопходно, за сваки режим користећи технике линеарне ауторегресије. У Кораку. AR ред p може бити одређен разматрањем парцијалне аутокорелационе функције PACF Y t или неким критеријумом, као што је Akaike информациони критеријум (AIC; 974).
20 Александра Блазнавац 2.2.3 Мултиваријантни SETAR модел Посматрајмо s -димензиону временску серију Y t = y t, y 2t,, y st. S - димензиони SETAR d; p,, p k модел са k режима је дефинисан са Y t = p C () 0 + φ () j Y t j + ε () t, ako z t d r j = p 2 C (2) 0 + φ (2) j Y t j + ε (2) t, ako r < z t d r 2 C 0 (k) + j = p k j = φ (k) j Y t j + ε (k) t, ako r k < z t d (6) где су C 0 (i) s -димензиони константни вектори и φ j (i) s s -димензиона матрица параметара за i =,, k. Иновациони вектори i -тог режима 2 i задовољавају ε (i) t = a t, при чему су i симетричне позитивно дефинисане матрице и a t низ серијских некорелисаних нормалних случајних вектора са очекивањем 0 и матрицом коваријације I. Претпоставља се да је праг променљива z t d стационарна; зависи од прошлости Y t d. На пример, можемо да поставимо z t d = ω Y t d, при чему је ω дефинисан као s -димензиони вектор. Када је ω =,0,,0, праг променљива је z t d = y,t d. Када је ω =,,, s s s променљива је средња вредност свих елемената у Y t d. Моделирање 2, праг Аналогно, Цај (989) процедури за моделирање униваријантног SETAR модела, Цај (998) даје и метод за мултиваријантну ситуацију. Нека је дато p = max p,, p k и d p, и посматрајмо вектор временских серија Y, Y 2,, Y n. Цај (998) је разматрао мултиваријантну генерализацију уређене регресије одређене једначином (). Треба напоменути да праг променљива z t d у једначини (6) може узети вредности само из Z = z p+ d,, z n d. Нека је i индекс i-те најмање опсервације у Z. Форма уређене мултиваријантне ауторегресије Y +d Y 2 +d Y j +d = Y +d Y +d p Y 2 +d Y 2 +d p Y j +d Y j +d p c 0 φ φ p + ε +d ε 2 +d ε j +d (7)
Неки нелинеарни мпдели временских серија и оихпва примена 2 успешно фитована, где је j = m, m +,, n p, и m је број почетних опсервација у уређеној ауторегресији. Цај предлаже за m опсег (3 n, 5 n). Различите вредности m могу бити коришћене за испитивање осетљивости резултата моделирања у односу на избор.треба напоменути уређена ауторегресија (7) је сортирана у односу на променљиву z t d, која представља индикатор режима у мултиваријантном SETAR моделу. Нека e m+ +d означава један корак напред стандардизовани предвиђени резидуал мултиваријантне регресије (7) за j = m. Цај 998. обезбеђује директну рачунску формулу за e m+ +d. Уколико је основни модел линеарни вектор ауторегресионог процеса, онда предвиђени резидуали чине бели шум, и они су некорелисани са регресором X t =, Y t, Y t 2,, Y t p. Међутим, ако Y t прати процес прага, онда су предвиђени резидуали корелисани са регресором. Tsay (998) користи ово својство поново, и посматра мултиваријантну регресију e l +d = X l +dβ + w l +d (8) за l = m +, n p. Проблем тестирања нелинеарности је трансформисан у тестирање хипотезе H 0 : β = 0 у регресији изнад. Цај користи тест статистику C d = n p m kp ln S 0 ln S, (9) при чему A означава детерминанту матрице A и S 0 = n p m S = n p m n p l=m + n p l=m + e l +d w l +d e l +d, w l +d, где је w t најмањи квадратни резидуал регресије (8). Под нултом претпоставком, да је Y t линеарно, Цај показује да је C d асимптотски χ 2 случајна променљива са (pk 2 + k) степени слободе. Спецификација модела, оцењивање и дијагностичка провера Да би се извршио C d тест нелинеарности у једначини (9), вредности p и d морају бити дате. У пракси, можемо одабрати p из PAM (eng. partial
22 Александра Блазнавац autoregression matrix) од Y t. Тиао 7 и Бокс 8 (98) су дефинисали PAM са лагом l, што се означава са Π(l), да буде последња матрица коефицијената који су фитовани вектору ауторегресивног процеса реда l. Матрица Π(l) линеарног вектора AR(p) је једнака нули за l > p. Ово својство пружа веома корисне информације за идентификацију реда p. Када је p једном изабрано, d се бира тако да добијемо најзначајнију C d статистику. Код униваријантног SETAR модела, број режима и прагове смо одређивали помоћу дијаграма распршивања. Нажалост, код мултиваријантног SETAR модела ови графици нису погодни за добијање тих вредности. Из тог разлога, користимо AIC за проналажење тих вредности. Нека су дати p, k, d i R k = r,, r k, уређена мултиваријантна ауторегресија у једначини (7) може бити подељена на режиме. За j-ти режим података, имамо општи линеарни модел облика при чему је Y j = A j Φ j + ε j, Y j = Y π j + +d,, Y π j +d, Φ j = c 0, Φ j,, Φ p j, ε j = ε π j + +d,, ε π j +d, Y π j + +d Y π j + Y π j + +d p A j = Y π j +2 +d Y π j +2 Y π j +2 +d p Y π j +d Y π j Y π j +d p где је π j највећа вредност од j за коју важи r j < z (j ) r j, за j =,, k. Дефинишимо π 0 = 0 и π k = n p. Број опсервација у j-том ежиму је n j = π j π j. Оцена најмањих квадрата од Φ j може се израчунати мултиваријантним методом најмањих квадрата: Φ j = A j A j A j Y j и матрица резидуала варијансе-коваријансе за j -ти режим може се израчунати на следећи начин 7 George S. Tiao 8 G. E. P. Box
Неки нелинеарни мпдели временских серија и оихпва примена 23 n j Σ j = n t= ε π j +t +d ε π j +t +d. AIC мултиваријантног фитованог SETAR модела из једначине (6) је дефинисан са k AIC p, d, k, R k = n j ln Σ j + 2k kp + j =. С обзиром на p и d, можемо одредити параметре k и R k минимизирањем AIC. Због сложености израчунавања и могућности тумачења крајњег модела, обично се k ограничава на мале бројеве, као што су 2 и 3. За прагове R k, делимо податке у подгрупе на основу емпиријских перцентила z t d, и користимо AIC за одређивање r вредности. Коначно, AIC се користи да прецизира AR ред p k p за сваки режим. Да би се спречило погрешно одређивање модела, препоручује се детаљна дијагностичка анализа резидуала. То обухвата испитивање графика стандардизованих резидуала и узорачку матрицу корелације резидуала. 2.2.4 STAR модел Генерализација која омогућава мање нагли прелазак из једне једначине (режима) модела у другу развијена је у класи ауторегресионих модела глатке транзиције, познатих као STAR (eng. smooth transition AR) модели. У случају када је l =, основни облик STAR модела дат је са p p 2 2 z t = θ 0 + φ i z t i + θ 0 + φ i z t i i= i= F z t d Δ s + a t где је d параметар кашњења, Δ и s параметри који представљају локацију и скалу модела транзиције, F функција глатке промене, при чему је F z = / + exp γ z c у случају логистичког STAR модела и у случају нормалног STAR модела F z = Φ γ z c, при чему је Φ једнака кумулативној функцији стандардне нормалне расподеле. Пуштајући да γ, функција F z тежи функцији индикатор, и уобичајени TAR модел (6) може се добити као специјални случај. Условно очекивање STAR модела је једнако линеарној комбинацији следеће две једначине: μ t = θ 0 + φ i z t i p i=
24 Александра Блазнавац μ 2t = θ 0 + θ 0 2 p 2 + φ i + φ i z t i. i= Предност STAR модела у односу на TAR модел је то што је функција условног очекивања диференцијабилна. Међутим, искуство показује да се параметри транзиције Δ и s STAR модела тешко процењују. 2.3. Ауторегресиони модели са експоненцијалном расподелом У овом поглављу разматрају се модели временских серија ауторегресионог типа првог реда. Циљ је да се да што детаљнија слика посматране класе процеса и тиме омогући њихова примена. За постављени модел временске серије и претпостављену маргиналну расподелу посматраног процеса одређују се услови при којима ће иновациони процес имати неку расподелу и уједно се та расподела одређује. Основна особина нелинеарних модела је експоненцијална маргинална расподела за свако X t. Значи, X t има експоненцијалну расподелу са параметром λ λ > 0, тј. има густину φ x = λe λx, x > 0 0, x 0 Математичко очекивање и дисперзија за случајну променљиву X t која има експоненцијалну расподелу су (20) E X t = λ, D X t = λ 2. Лаплас-Стилтјесова трансформација за експоненцијалну расподелу је φ X s = E e sx = 0 e sx λe λx dx = λ e s+λ x dx = = λ λ + s e s+λ x 0 = λ λ + s 0 = λ λ + s 0 (2) 2.3. Модел EAR() Нека је низ X t, t T дефинисан са X t = βx t + ε t, (22)
Неки нелинеарни мпдели временских серија и оихпва примена 25 где је β 0, (Gaver and Lewis, 980). Иновациони низ ε t, t T је строги бели шум, тако изабран да X t има експоненцијалну ε(λ) расподелу. Такође, претпостављамо да су X t и ε t независне ако је t < s. Модел (22) је EAR() модел (Exponential AutoRegressive Model). Према томе, користећи чињеницу да је очекивање производа две независне случајне променљиве једнако производу очекивања тих случајних променљивих, у овом случају X t и ε t, добијамо да је Лаплас-Стилтјесова трансформација φ Xt за расподелу X t (за s > 0) φ Xt s = E e sx t = E e s βx t +ε t = E e sβx t E e sε t = φ Xt βs φ εt s. Претпостављајући да је низ X t стационаран, следи да је φ X s = φ X βs φ ε s. Одавде следи φ ε s = φ X s φ X βs. (23) Ако захтевамо да X t буду позитивне случајне променљиве, тада ако је β негативно то је и βx t негативно. То значи да нам треба такав иновациони низ ε t који је независан од X t и који ће случајну променљиву X t учинити позитивном. Дакле, за позитивне случајне променљиве очигледно неће постојати решење једначине (23) за β < 0. Замењујући (23) у (2), добијамо да је φ ε s = φ X s φ X βs = λ λ + s λ λ + βs = λ + βs λ + s = λ + βs + βλ βλ λ + s = = β λ + s + λ β λ + s = β + β λ λ + s. Дакле, ε t је увек мешавина дискретне компоненте 0 са вероватноћом β и експоненцијалне ξ t са вероватноћом β. То изражавамо на следећи начин ε t = 0 са вероватноћом β ξ t са вероватноћом β, (24)
26 Александра Блазнавац где је ξ t низ независних и идентички расподељених случајних променљивих са експоненцијалном ε(λ) расподелом. Тада можемо писати да за процес X t важи X t = βx t са вероватноћом β βx t + ξ t са вероватноћом β, (25) где је 0 < β <. Такође, то је модел са случајним коефицијентима и може бити представљен у следећем облику: X t = βx t + I t ε t, (26) где је расподела случајне променљиве I t дата са: I t : 0 β β и I t је независно од X m и ε m за свако t и m. Ако би дозволили да је β = 0 тада би низ X t, t T био дефинисан са X t = ε t, а иновациони низ ε t, t T са ε t = ξ t. Напомена: У даљем тексту, у формулама типа (24) којима се дефинишу процеси које проучавамо, изостављамо речи са вероватноћом јер су сви процеси формирани на сличан начин и из контекста је јасно да су одговарајући параметри вероватноће. Из модела (22) добијамо да је E ε t = β, D ε λ t = β2 λ 2, јер знамо да X t има експоненцијалну расподелу и E X t = λ, D X t = λ 2. Коваријациона функција EAR() процеса је γ = E X t X t E X t E X t = Е βx t X t + ε t X t E X t E X t =
Неки нелинеарни мпдели временских серија и оихпва примена 27 = βe X t X t h + E ε t E X t E X t E X t βe X t E X t h +βe X t E X t = = βγ. Даље се лако закључује да је γ = β γ 0, > 0. Корелациона функција EAR() процеса је ρ = γ γ 0 = β, > 0. Напомена: Модел EAR() је један од првих проучаваних нелинеарних модела уопште и многи каснији модели су користили идеје из овог модела. 2.3.2 Модел ТEAR() Други експоненцијални ауторегресиони модел првог реда ТEAR() (Lawrence and Lewis, 98) је добијен:. заменом места независних и идентички расподељених променљивих X t и ε t у моделу EAR(), 2. заменом α уместо β. Сад имамо модел X t = где је t T. α ε t, α α ε t + X t, α (27) Овде су X s и ε t независне случајне променљиве за s < t. Нека су φ Xt s и φ εt s Лаплас-Стилтјесове трансформације маргиналних расподела од X t и ε t. Примењујући Лаплас-Стилтјесову трансформацију на обе стране модела ТEAR(), уз претпоставку да је низ X t стационаран, имамо: Одавде је: φ X s = α φ ε α s + α φ ε α s φ X s
28 Александра Блазнавац φ ε α s = φ X s α + α φ X s Ако претпоставимо да X t : ε λ, имамо φ ε α s = λ λ + s α + αλ λ + s = λ λ + α s. (28) Значи ε t има експоненцијалну расподелу са параметром λ. Такође, то је модел са случајним коефицијентима и може бити представљен у следећем облику: X t = α ε t + I t X t, (29) где је расподела случајне променљиве I t дата са: I t : 0 α α и I t је независно од X m и ε m за свако t и m. Пошто X t и ε t имају експоненцијалну расподелу, биће E X t = λ, D X t = λ 2, E ε t = λ, D ε t = λ 2. Коваријациона функција ТEAR() процеса је: γ = E X t X t E X t E X t = = E α α ε t X t + α α ε t X t + X t X t E X t E X t = = E α ε t X t + αx t X t h E X t E X t αe X t E X t h + +αe X t E X t = = αγ + α λ λ λ λ + α λ λ = αγ. Даље се лако закључује да је γ = α γ 0, > 0. Корелациона функција ТEAR() процеса је
Неки нелинеарни мпдели временских серија и оихпва примена 29 ρ = γ γ 0 = α, > 0. 2.3.3 Модел NEAR() Основна особина модела NEAR() (New Exponential AutoRegressive model- Lawrance and Lewis, 98) је да је то двопараметарски модел ауторегресионе временске серије првог реда са експоненцијалном маргиналном расподелом за X t. X t = ε t, α βx t + ε t, α (30) где је t T, 0 < α, β < и низ ε t, t T је низ независних и идентички расподељених случајних променљивих. такође, претпостављамо да су X s и ε t независне случајне променљиве за s < t. Нека су φ Xt s и φ εt s Лаплас-Стилтјесове трансформације маргиналних расподела од X t и ε t. Примењујући Лаплас-Стилтјесову трансформацију на обе стране модела NEAR(), уз претпоставку да је низ X t стационаран, имамо: Одавде је: φ X s = α φ ε s + α φ ε s φ X βs φ ε s = φ X s α + α φ X βs. Ако претпоставимо да X t : ε λ, имамо φ ε s = λ λ + s α + αλ λ + βs = λ λ + βs λ + s λ + α βs. (3) Рационална функција (3) има следећи развој по елементарним рационалним функцијама φ ε s = A λ λ + s + B λ λ + α βs, где је
30 Александра Блазнавац A = β α β, B = αβ α β. Дакле, рационалну функцију φ ε s можемо написати у облику φ ε s = β α β λ λ + s + αβ α β λ λ + α βs, одакле се види да је ε t мешавина две експоненцијалне расподеле. ε t = ξ t, β A = α β α βξ t, αβ B = α β где је ξ t низ независних и идентички расподељених случајних променљивих са експоненцијалном ε λ расподелом. Такође, NEAR() је модел са случајним коефицијентима и може бити представљен у следећем облику: X t = U t X t + ε t, где је расподела случајне променљиве U t дата са: U t 0 β α α. Узимајући очекивање обе стране једнакости (30) имамо: односно E X t = αβe X t + αe ε t + α E ε t = αβe X t + E ε t, E ε t = αβ. λ Узимајући дисперзију обе стране једнакости (30) имамо: односно D X t = αβ 2 D X t + αd ε t + α D ε t = αβ 2 D X t + D ε t, D ε t = αβ2 λ 2. Коваријациона функција NEAR() процеса је: γ = E X t X t E X t E X t =
Неки нелинеарни мпдели временских серија и оихпва примена 3 = E βx t + ε t X t E X t E X t = = E α ε t X t + α ε t X t + βx t X t E X t E X t = = E ε t X t + αβx t X t h E X t E X t αβe X t E X t h + +αβe X t E X t = = αβγ + αβ λ λ λ λ + αβ λ λ = αβγ. Даље се лако закључује да је γ = αβ γ 0, > 0. Корелациона функција NEAR() процеса је ρ = γ γ 0 = αβ, > 0. Као специјални случајеви модела NEAR() могу се добити следећи модели: α = -EAR() модел, β = -TEAR() модел. 2.3.4 Модел AREX() Нека је низ X t, t T дефинисан на следећи начин: X t = ε t p 0 αx t + ε t p βx t q (32) где је 0 p 0, p, q, p 0 + p + q =, 0 < α, β <. Низ ε t, t T је низ независних и идентички расподељених случајних променљивих. Такође, претпостављамо да су X t и ε t независне ако је t < s. Потребно је утврдити да ли постоји расподела за иновациони низ ε t за коју је маргинална расподела низа X t експоненцијална. Нека су φ Xt s и φ εt s Лаплас-Стилтјесове трансформације маргиналних расподела од X t и ε t. φ Xt s = E e sx t, φ εt s = E e sε t (33) Примењујући Лаплас-Стилтјесову трансформацију на обе стране модела АREX(), уз претпоставку да је низ X t стационаран, имамо:
32 Александра Блазнавац φ X s = p 0 φ ε s + p φ ε s φ X αs + q φ X βs. Одавде је: φ ε s = φ X s q φ X βs p 0 + p φ X αs. Замењујући Лаплас-Стилтјесове трансформације за експоненцијалну расподелу добијамо: φ ε s = λ λ + s q p 0 + p λ λ + βs λ λ + αs = λ λ + αs λ p 0 + p + s β q λ + s λ + βs λ p 0 + p + p 0 αs. (34) Рационална функција (34) има следећи развој по елементарним рационалним функцијама φ ε s = B 0 Одатле се добија: λ λ + s + B λ λ + βs + B 2 λ λ p 0 + p + p 0 αs. B 0 = α p 0 + p p 0 α, B = q α β p 0 + p β p 0 α, што даје B 2 = p 0 + p αp β q p 0 α p 0 + p p 0 α p 0 β + p β p 0 α B 0 + B + B 2 p 0 + p =. B Закључује се да су B 0, B и 2 вероватноће ако и само ако је p p 0 +p α < β α > p 0 β + p. Тада је расподела за ε t мешавина експоненцијалне расподеле
Неки нелинеарни мпдели временских серија и оихпва примена 33 ε t = ξ t B 0 βξ t B p 0 α B 2 ξ p 0 + p t p 0 + p са ξ t : ε λ, λ > 0. Узимајући очекивање са обе стране (32) имамо: E X t = p 0 E ε t + p αe X t + p E ε t + q βe X t. Следи да је: E ε t = p α + q β p 0 + p λ. Узимајући дисперзију обе стране (32) имамо: D X t = p 0 D ε t + p α 2 D X t + p D ε t + q β 2 D X t. Следи да је: D ε t = p α 2 + q β 2 p 0 + p λ 2. Коваријациона функција АREX () процеса је: γ = E X t X t E X t E X t = = E p 0 ε t X t + p αx t X t + ε t X t + q βx t X t E X t E X t = p α + q β γ Даље се лако закључује да је γ = p α + q β γ 0, > 0. Корелациона функција АREX () процеса је ρ = γ γ 0 = p α + q β, > 0.
34 Александра Блазнавац Као специјални случајеви модела АREX () могу се добити следећи модели: p 0 = q = 0, α = β -EAR() модел, q = 0, α = -TEAR() модел, q = 0, α = β -TEAR() модел.
Неки нелинеарни мпдели временских серија и оихпва примена 35 3 Примена Примена неких од претходно описаних модела биће приказана кроз наредни пример о канадским рисовима. Подаци су узети са сајта www.encyclopediaofmath.org/index.php/canadian_lynx_data#references. Обрађиваће се подаци који садрже годишњи број канадских рисова ухваћених у области Мекензи реке у периоду од 82. до 934. године. Први пут модел ове временске серије је поставио Моран 9 953 у The statistical analysis of the Canadian lynx cycle. I: structure and prediction. Он је приметио да је циклус веома асиметричан са оштрим и великим врховима и релативно глатким и малим дном. Логаритамска трансформација даје серију која је симетрична око очекивања. Како стварни број рисова није тачно пропорционалан са бројем ухваћених, боља репрезентација се може добити укључивањем додатне грешке посматрања, која резултује знатно компликованији модел. Логаритамска трансформација знатно умањује ефекат настао игнорисањенем ове грешке, па стога, и након Морана, скоро све анализе ове временске серије користе огаритамску трансформацију. Моран је за ову серију предложио AR(2) модел. Касније, 977 Тонг је у раду Some comments on the Canadian lynx data with discussion посатвио AR() модел на основу Akaike информационог критеријума. Користећи податке о канадским рисовима као студију, Тонг и Лим су у раду Threshold autoregression, limit cycles and cyclical data (with discussion) поставили класу нелинеарних модела SETAR за логаритаски трансформисане податке о рисовима. Они су показали да овај модел има занимљиве карактеристике у нелинеарним осцилацијама. У дискусији њиховог рада, Рао 0 и Габр предложили су подскуп билинеарног модела SBL() за првих 00 лог трансформисаних података и SBL(9) за првих 00 оригиналних података о рисовима. Користећи оцену максималне веродостојности комбиновану са Akaike информационим критеријумом, они су 98. године, предложили SBL(2) модел за првих 00 лог трансформисаних података. Њихов модел је био у могућности да произведе мале вредности варијансе шума и средње квадратне грешке у предвиђањима један корак унапред, али није могао да открије наслеђено понашања података. Хаген 2 и Озаки 3 су у раду Modelling non-linear random vibrations using an amplitude-dependent autoregressive time series model предложили 9 P.A.P. Moran 0 T. Subba Rao M.M. Gabr 2 V. Haggan
36 Александра Блазнавац експоненцијални ауторегресиони модел EXPAR(). Озаки је сматрао да скоро симетрична серија генерисана овим моделом није задовољавајућа. Након тога, 982. године, предложио је још два експоненцијална ауторегресиона модела за цео скуп лог трансформисаних података са обрисаним очекивањем. Један од њих, EXPAR(2), је могао да представи асиметричну структуру циклуса података, док је за други, EXPAR(9), са мањим варијансама фитованих резидуала, веровао да је погоднији за предвиђање. У раду Threshold models in non-linear time series analysis, Тонг је одредио SETAR(2;5,2) модел за првих 00 логаритамски трансформисаних података и SETAR(2;7,2) модел за скуп свих логаритамски трансформисаних података на следећи начин : X t = 0.546 +.032X t 0.73X t 2 + 0.7X t 3 = 0.43X t 4 + 0.332X t 5 0.284X t 6 + = 0.20X t 7 + a t ако је X t 2 3.6 X t = 2.632 +.492X t.324x t 2 + a t 2 ако је X t 2 > 3.6 При чему је var(a t ) = 0.0258, var(a t 2 ) = 0.0505 (заједничка варијанса је 0.0360). Овај модел је био у могућности да опише биолошке карактеристике канадских рисова као што су: Циклично понашање на 9-0 година Дуже периоде успона неко пада у циклусима Параметар кашњења 2 је повезан са биолошким циклусом канадских рисова, односно, они су потпуно одрасли у јесен у њиховој другој години и рађањем младунчади (-4 по леглу) на пролеће. Цај је 989. године поставио SETAR(3;,7,2) модел са два прага када је и предложио нову процедуру за тестирање и изградњу TAR модела. Лаи 4 је 996. Године у раду Comparison study of AR models on the Canadian lynx data: A close look at BDS statistic утврдио да је најпогоднији модел заправо SETAR(2;7,2) модел, који је предложио Тонг. Временска серија, названа lynx, доступна је у R-у: 3 T. Ozaki 4 D. Lai
Неки нелинеарни мпдели временских серија и оихпва примена 37 Str(lynx) R-kod Излаз Time-Series [:4] from 82 to 934: 269 32 585 87 475... summary(lynx) R-kod Излаз Min. st Qu. Median Mean 3rd Qu. Max. 39.0 348.2 77.0 538.0 2567.0 699.0 plot(lynx) R-kod
38 Александра Блазнавац Користићемо log 0 трансформацију, означену са X t, t =,2,, n (n = 4). x<-log0(lynx) plot(x, type="o") R-kod Приказ временске серије X t на слици показује веома изражено циклично понашање, са периодом од око 0 година. Такође, може се приметити да вредности у узорку расту до својих највиших вредности много спорије него што опадају до минималних вредности (шестогодишњи периоди раста и четворогодишњи периоди пада вредности). Ова карактеристика је изражена код многих нелинеарних процеса. Постоје многа разматрања која би подржала нелинеарни процес, поготово механизам са прагом. Узорачки ACF серије X t такође показује циклично својство.
Неки нелинеарни мпдели временских серија и оихпва примена 39 acf(x,plot=t) R-kod acf(x,plot=f) R-kod 0 2 3 4 5 6 7 8 9 0.000 0.785 0.340-0.32-0.494-0.62-0.488-0.58 0.235 0.537 0.606 2 3 4 5 6 7 8 9 20 0.383-0.02-0.385-0.607-0.60-0.407-0.073 0.253 0.455 0.446 pacf(x,plot=t) R-kod
40 Александра Блазнавац pacf(x,plot=f) R-kod 2 3 4 5 6 7 8 9 0 0.785-0.720-0.43-0.206 0.5 0.085 0.208 0.8 0.03-0.87-0.3 2 3 4 5 6 7 8 9 20-0.096 0.097-0.036-0.022-0.2 0.006-0.33 0.062-0.074 Одабир модела Први модел који се у литератури предлаже за ове податке, јесте AR(2) модел: mod.ar<-linear(x,m=2) R-kod
Неки нелинеарни мпдели временских серија и оихпва примена 4 summary(mod.ar) Non linear autoregressive model Излаз AR model Coefficients: const phi. phi.2.0576005.3842377-0.7477757 Residuals: Min Q Median 3Q Max -0.584489-0.3409850 0.0279282 0.4675526 0.5480330 Fit: residuals variance = 0.05072, AIC = -334, MAPE = 6.802% Coefficient(s): Estimate Std. Error t value Pr(> t ) const.057600 0.20837 8.7523 2.957e-4 *** phi..384238 0.063332 2.8569 < 2.2e-6 *** phi.2-0.747776 0.063385 -.7973 < 2.2e-6 *** --- Signif. codes: 0 *** 0.00 ** 0.0 * 0.05. 0. Дакле, модел ће имати облик X t =.05 +.4X t 0.75X t 2 + a t. Сада ћемо посматрати AR() модел: mod.ar<-linear(x,m=) summary(mod.ar) R-kod Non linear autoregressive model Излаз AR model Coefficients: const phi. phi.2 phi.3 phi.4 phi.5.48209.4925299-0.53635299 0.28005506-0.33059375 0.725674 phi.6 phi.7 phi.8 phi.9 phi.0 phi. -0.6475276 0.0797207-0.02907267 0.480528 0.9607974-0.3422330
42 Александра Блазнавац Residuals: Min Q Median 3Q Max -0.46458065-0.3700043 0.0252775 0.2260095 0.49670209 Fit: residuals variance = 0.03293, AIC = -365, MAPE = 5.592% Coefficient(s): Estimate Std. Error t value Pr(> t ) const.4820 0.294382 3.7870 0.0002733 *** phi..49253 0.09237 2.4733 < 2.2e-6 *** phi.2-0.536353 0.43287-3.7432 0.000379 *** phi.3 0.280055 0.52025.8422 0.0687082. phi.4-0.330594 0.5398-2.470 0.0344538 * phi.5 0.7257 0.56722.0927 0.2773900 phi.6-0.64753 0.56632 -.058 0.2956552 phi.7 0.07972 0.57305 0.4575 0.6483795 phi.8-0.029073 0.54838-0.878 0.8548 phi.9 0.4805 0.52523 0.9707 0.3342790 phi.0 0.96080 0.4389.3627 0.763405 phi. -0.34223 0.0933-3.7553 0.0003049 *** --- Signif. codes: 0 *** 0.00 ** 0.0 * 0.05. 0. Предвиђање вредности ове серије за следећих 90 периода, уколико она задовољава овај модел може се видети на наредном графику : ar(x) R-kod Call: ar(x = x) Излаз Coefficients: 2 3 4 5 6 7 8.387-0.5080 0.227-0.2702 0.27-0.240 0.0677-0.0400 9 0 0.337 0.853-0.30 Order selected sigma^2 estimated as 0.0477 plot(forecast(ar(x),90)) R-kod
Неки нелинеарни мпдели временских серија и оихпва примена 43 Као побољшање ових модела, можемо размотрити SETAR модел. Како серија X t има само 4 опсервација, Цај у 8 предлаже да се почне са p = 3 и S =,2,3 у кораку предложене процедуре моделовања, која је раније наведена у поглављу 2.2.2. F-статистике теста нелинеарности су редом 4.7, 6.3 и 4.46. Тако да је p = 3 и d= 2 за сада довољно добро. На наредној фигури представљен је дијаграм распршења t односа лаг AR коефицијената, са којег се добија праг r = 2.4, који се јасно види. Дијаграм, такође, показује велики скок око X t 2 = 2.6. Међутим, ова тачка се не третира као праг из два разлога. Први, скок је у основи због три тачке. Други, ту је само неколико опсервација X t 2 између 2.4 и 2.6 што чини раздвајање тешко за процену.