ČASOVNE VRSTE. UVOD Številsko spremenljivko Y opazujemo v času. Podatki se nanašajo na zaporedna časovna obdobja t, t,..., t T. Statistično vrsto y, y,..., y T imenujemo časovna vrsta. T dolžina časovne vrste Časovne vrste so: trenutne: vrednosti se nanašajo na trenutek Primer: temperatura zraka ob 7h vsak dan intervalne: vrednosti se nanašajo na časovni interval Primer: število rojstev, smrti, prometnih nesreč, itd. na leto izvedene: vrednosti so izračunane Primer: letna stopnja inflacije, povprečna dnevna temperatura Osnovni namen analize časovnih vrst je proučevanje dinamike pojava, ki ga časovna vrsta opisuje; napovedovanje tega pojava.
Analiza časovnih vrst se začne s tem, da časovno vrsto najprej narišemo!!!!!!!!!!!! Grafični prikaz časovne vrste: LINIJSKI GRAFIKON: na abscisni osi je časovna skala. Pri grafičnem prikazu moramo ustrezno prikazati časovno zaporedje vrednosti. Če časovna vrsta ni ekvidistantna, torej med vrednostmi ni enak časovni razmik, moramo na sliki to upoštevati. 6 5 Št. članov/gosp. 4 3 9 93 948 96 953 Leto popisa 97 98 99 Slika: Število članov na gospodinjstvo po popisih prebivalstva v Sloveniji v obdobju 93 do 99 Slika: Število štipendistov po letih v obdobju 986/87 do 3/4 v Sloveniji glede vrsto štipendije
3 3 5 Število 5 Živorojeni Umrli 98 983 985 987 989 99 993 98 984 986 988 99 99 Slika: Število umrlih in število živorojenih po letih v obdobju 98-993 Osnovno orodje za analizo časovnih vrst so indeksi. INDEKSI S STALNO OSNOVO INDEKSI S PREMIČNO OSNOVO: VERIŽNI INDEKSI, STOPNJA RASTI Ponovite, kaj pomeni in kako se izračuna povprečna stopnja rasti!!!!
. KOMPONENTE ČASOVNE VRSTE 4 Pri časovni vrsti skušamo identificirati naslednje komponente: TREND:T predstavlja dolgoročno gibanje pojava, podaja pa osnovno smer razvoja. Trend je lahko naraščajoč, padajoč ali stacionaren. Dolgoročne spremembe nastanejo npr. zaradi gospodarskih sprememb, sprememb v okolju, bioloških dejavnikov SEZONSKA KOMPONENTA:S se nanaša na periodične spremembe. Sezonske variacije nastanejo npr. zaradi letnih časov, praznikov, vremena itd. Sezonska komponenta ima svojo dolžino, dolžina sezonske komponente je konstantna. Zato lahko sezonsko komponento predvidimo. Ponavadi se veže na eno koledarsko leto. CIKLIČNA KOMPONENTA:C se nanaša na neperiodične spremembe. Predstavlja nihanje okoli trenda in je očitna v zelo dolgih obdobjih. Ciklične spremembe nastanejo npr. zaradi sprememb v gospodarstvu, okolju. Dolžina cikla ni določena. SLUČAJNA KOMPONENTA (IREGULARNI VPLIVI, ŠUM): I se nanaša na ostale nam neznane dejavnike, ki jih ne moremo razložiti z trendom, sezonsko in ciklično komponento.
Časovna vrsta ni nujno rezultat delovanja vseh teh komponent. V časovni vrsti vedno obstoja slučajna komponenta. 5 Teorija časovnih vrst skuša identificirati te komponente, jih razumeti in uporabiti pri napovedovanju. Za vsako časovno vrsto skušamo identificirati njen model. Modelov je veliko vrst. Najsplošnejša sta dva: ADITIVNI MODEL Y = T + S + C + I Časovna vrsta je vsota komponent, ki sestavljajo časovno vrsto. MULTIPLIKATIVNI MODEL Y = T S C I drugače zapisano: log Y = logt + log S + logc + log I Logaritem časovne vrste je vsota logaritmiranih komponent.
Primer: 6 8 7 6 5 4 3-6 8 4 3 36 - Slika : Linearni trend, sezonska komponenta in slučajni vplivi 8 6 4 6 8 4 3 36 - Slika: Aditivni model za časovno vrsto
Primer Slučajna komponenta ima večjo variabilnost: 7 8 6 4 6 8 4 3 36 - -4 Slika : Linearni trend, sezonska komponenta in slučajni vplivi 8 6 4 6 8 4 3 36 - -4 Slika: Aditivni model za časovno vrsto Slučajna komponenta zabriše vpliv trenda in sezonske komponente.
TEHNIKE GLAJENJA so postopki, s katerimi poskušamo izločiti vpliv slučajne komponente, da bi odkrili trend, sezonsko in ciklično komponento. Najbolj uporabljeni metodi glajenja sta: metoda drsečih sredin eksponentno glajenje (ne bomo obravnavali) 8 METODA DRSEČIH SREDIN Originalni časovni vrsti Y = y, y,..., y T priredimo časovno vrsto drsečih sredin. Odločimo se za red drsečih sredin r. Vsaka drseča sredina je na sredini intervala dolžine r. Oznake: r red drsečih sredin Y r, npr. drseče sredine reda 3 označimo Y 3 Način izračunavanja drsečih sredin r je liho število, r = i + r yk = ( r y k i+ y k i+ +... + y k+... + y k+ i + y k+ i) b) r je sodo število, r = i r yk = ( yk i+ yk i+ +... + yk+... + yk+ i + yk+ i) r r r r r Y = y y,..., y i+, i+ T i Časovna vrsta drsečih sredin je krajša od originalne časovne vrste, manjka ji i- členov na začetku in i-na koncu. Y r = y,..., r r i+, yi+ y r T i
Primer: prirast smreke po letih, dolžina časovne vrste =5 Leto Prirast (mm ) Drseče sredine r=3 Drseče sredine r=4 Drseče sredine r=6 83 6 93, 3 853 843,3 84,4 4 65 683, 74,8 88,8 5 545 67,3 746,3 85,6 6 88 87,3 8,5 8,4 7 89 98,7 878, 794, 8 849 968,7 87, 79, 9 968 78,7 777,8 84,3 339 79,3 755,8 844,3 8 7,3 797, 857,3 94 989,7 895,4 894,8 3 7,3 33,8 4 886 58, 5 38 r = 3 = + (i=) 3 y 83 6 853 93 3 3 y 3 6 853 65 843 3 3... r = 4 = (i=) 4 y 3 = ( 83 + 6 + 853+ 65+ 545) = 84,375 4 4 y 4 = ( 6 + 853+ 65+ 545 + 88) = 74,75 4... r = 6 = 3 (i=3) 6 y4 = ( 83 + 6 + 853 + 65+ 545 + 88 + 89) = 88,75 6 6 y 5 = ( 6 + 853+ 65+ 545 + 88 + 89 + 849) = 85,583 6 9
4 prirast (mm) 8 6 4 3 4 5 6 7 8 9 3 4 5 leto Slika : Prirast lesa 4 8 6 Prirast DS_3 4 3 4 5 6 7 8 9 3 4 5 leto Slika : Prirast in drseče sredine reda 3 4 8 6 Prirast DS_6 4 3 4 5 6 7 8 9 3 4 5 leto Slika 3: Prirast in drseče sredine reda 6
Efekt drsečih sredin je glajenje podatkov.večji red r povzroči večje glajenje osnovne časovne vrste. Slabost časovne vrste drsečih sredin je, da je krajša od osnovne časovne vrste. Prednosti časovne vrste drsečih sredin: odkrivanje trenda odkrivanje trenda: če je trend osnovne časovne vrste linearen, časovna vrsta drsečih sredin prikazuje trend. če ima časovna vrsta periodično oz. ciklično komponento, časovna vrsta drsečih sredin prikazuje trend, če je njen red r enak dolžini periode. Primer: 8 6 4 Cas_vrsta DS_ 4 36 - Slika: Časovna vrsta s periodo in drseče sredine reda
METODE ZA DOLOČANJE TRENDA prostoročno določanje trenda na grafičnem prikazu: OK za začetek analize metoda drsečih sredin (v določenih primerih) analitične metode. Najenostavnejša metoda: regresija po metodi najmanjših kvadratov Za lažje računanje ocen parametrov regresijskega modela transformiramo časovno skalo tako, da uvedemo t.i. tehnični čas t. Postopek: Ordinatno os premaknemo v sredino časovnega intervala. S tem dosežemo, da je vsota vrednosti na abscisi enaka. a) dolžina časovne vrste T je liho število: T = k + Tehnični čas: t = k, k +,...,,..., k, k Primer: T = tehnični čas: t = 5, 4, 3,, 345,,,,,, b) dolžina časovne vrste T je sodo število: T = k tehnični čas: k + 3 3, k +,..., k, k Primer: T = tehnični čas: 4, 3, 4,,,,,,3,
LINEARNI REGRESIJKI MODEL ZA DOLOČANJE TRENDA 3 Predpostavka: iz slike ugotovimo, da je linearni trend sprejemljiv. Model: Y = α + βt + ε Izračun ocen parametrov linearnega regresijskega modela: b n i = = n i= yt t i i i a = y Pomen parametrov: parameter a je povprečje pojava v opazovanem obdobju; parameter b pove, za koliko se spremeni pojav v povprečju, če se čas spremeni za eno enoto.
Primer: 4 Tabela: število smrtno ponesrečenih oseb v cestnem prometu po letih v obdobju 989-996 (Vir: SL-95 in SL-97) Leto Število smrtnih žrtev 989 554 99 57 99 46 99 49 993 493 994 55 995 45 996 389 6 5 št. smrtnih žrtev 4 3 989 99 99 99 993 994 995 996 leto Slika : Število smrtnih žrtev v prometnih nesrečah po letih v obdobju 989-996 Časovna vrsta kaže trendno komponento in slučajno komponento. Privzeli bomo model: Y = T + I Slika kaže, da je linearni trend sprejemljiv. Y = α + β t + ε
Pomožni računi: 5 Leto t t y t y 989-3,5,5 554-939, 99 -,5 6,5 57-9,5 99 -,5,5 46-693, 99 -,5,5 49-46, 993,5,5 493 46,5 994,5,5 55 757,5 995,5 6,5 45 37,5 996 3,5,5 389 36,5 Vsota 4 387-767,5 387 a = = 8 478, 375 b = 767, 5 = 8, 369 4 Linearni regresijski model: Y$ = 478, 375 8, 369 t Obrazložitev: povprečno letno število smrtnih žrtev v obravnavanem obdobju je 478. v povprečju se je v obravnavanem obdobju število smrtih žrtev vsako leto zmanjšalo za 8.
6 št. prometnih nesreč 6 4 y = -8,74x + 478,38-3,5 -,5 -,5 -,5,5,5,5 3,5 tehnični čas Napoved za leto 997: y$( t = 45, ) = 396, Dodatni podatek: število smrtno ponesrečenih nesreč v letu 997 je bilo 355. Napoved je za,6% večja od dejanske vrednosti.