Χρονικές σειρές 3 Ο μάθημα: Βασικές στοχαστικές διαδικασίες Μη στάσιμες χρονοσειρές Εαρινό εξάμηνο 2018-2019 Τμήμα Μαθηματικών ΑΠΘ Διδάσκουσα: Αγγελική Παπάνα Μεταδιδακτορική Ερευνήτρια Πολυτεχνική σχολή, Α.Π.Θ. & Οικονομικό Τμήμα, Πανεπιστήμιο Μακεδονίας http://users.auth.gr/~agpapana/ 1
Άσκηση 1 α) Έστω η στοχαστική διαδικασία Υ t = ε t, t = 1,, T, όπου για το ε t ισχύει: ε t = +1 με πιθανοτητα 1 2 1 με πιθανοτητα 1. 2 Να βρεθούν ο μέσος, η διακύμανση και οι αυτοσυνδιακυμάνσεις. Είναι η διαδικασία στάσιμη; Λύση 2
Είναι: T E Υ t = t=1 Υ t f(υ t ) = 1 1 + 1 1 = 0 2 2 T 2 Var Υ t = t=1 Υ t Ε Υ t f Υt = 1 0 2 1 + 1 0 2 1 = 1 2 2 Cov Y t, Y t+s = E Υ t Ε Υ t Υ t+s Ε Υ t+s = Ε Υ t Υ t+s = = ΕΥ t EΥ t+s = 0 διότι Υ t, Υ t+s είναι ανεξάρτητες μεταβλητές Άρα η Υ t είναι στάσιμη, αφού ισχύουν οι τρεις συνθήκες στασιμότητας για την Υ t, δηλαδή η μέση τιμή, η διασπορά και οι αυτοσυνδιακυμάνσεις είναι ανεξάρτητες του t. 3
β) Έστω ότι Υ t = ε t + ε t 1, t = 1,, T, για το ε t όπως ορίστηκε στο α). Να βρεθούν ο μέσος και οι αυτοσυνδιακυμάνσεις γ 0, γ 1. Λύση 4
Είναι: E Υ t = E ε t + ε t 1 = E ε t + Ε(ε t 1 ) = 0 + 0 = 0 γ 0 = Cov Υ t, Υ t = Var Υ t = Var ε t + ε t 1 = = Var ε t + Var ε t 1 + 2Cov ε t, ε t 1 = 1 + 1 + 0 = 2 γ 1 = Cov Υ t, Υ t 1 = E Υ t E(Υ t ) Υ t 1 E(Υ t 1 ) = = E Y t Y t 1 = E ε t + ε t 1 ε t 1 + ε t 2 = 2 = E ε t ε t 1 + ε t ε t 2 + ε t 1 + ε t 1 ε t 2 = = E ε t ε t 1 ) + Ε(ε t ε t 2 ) + Ε(ε 2 t 1 ) + Ε(ε t 1 ε t 2 = 2 2 = 0 + 0 + Ε ε t 1 + 0 = Ε ε t 1 = 1 5
Άσκηση 2 Δίνεται η στάσιμη χρονοσειρά z t. α) Να δείξετε ότι και η χρονοσειρά Υ t = cz t, όπου c σταθερά, είναι στάσιμη. Λύση Η χρονοσειρά z t είναι στάσιμη. Αυτό σημαίνει: E z t = μ (σταθερό) Var(z t ) = σ 2 (σταθερό) (ανεξάρτητα του χρόνου t) Cov(z t, z t+s )= γ s (σταθερό) Για να δείξουμε ότι Υ t στάσιμη, θα πρέπει να δείξουμε ότι ισχύουν οι τρεις συνθήκες στασιμότητας και για την Υ t. 6
Είναι: Ιδιότητα μέσης τιμής Ε αχ + β E Υ t = E c z t = ce z t = c μ άρα σταθερό Ιδιότητα διασπορών Var αχ + β = αε Χ + β = a 2 Var Χ Var Υ t = Var c z t = c 2 Var z t = c 2 σ 2 άρα σταθερό Ιδιότητα συνδιασπορών Cov αχ + β, γυ + δ = αβcov Χ, Υ Cov Y t, Y t+s = Cov cz t, cz t+s = c 2 Cov z t, z t+s = c 2 γ s άρα σταθερό Άρα η Υ t είναι στάσιμη. 7
β) Να δείξετε ότι και η χρονοσειρά Υ t = c 1 z t + c 2 z t 1, όπου c 1, c 2 σταθερές, είναι στάσιμη. Γενικεύστε επαγωγικά. Λύση Η χρονοσειρά z t είναι στάσιμη. Αυτό σημαίνει: E z t σταθερό Var z t σταθερό (ανεξάρτητα του χρόνου t) Cov z t, z t+s = γ s σταθερό Επιπλέον, αφού η χρονοσειρά z t είναι στάσιμη, άρα και η z t 1 είναι στάσιμη (και άρα ισχύουν τα παραπάνω). 8
Για να δείξουμε ότι Υ t στάσιμη, θα πρέπει να δείξουμε ότι ισχύουν οι τρεις συνθήκες στασιμότητας για την Υ t. Είναι: E Υ t = E c 1 z t + c 2 z t 1 = c 1 E z t + c 2 E z t 1 άρα σταθερό Var Υ t = Var c 1 z t + c 2 z t 1 = Εφόσον z t, z t 1 στάσιμες χρονοσειρές, δεν είναι ανεξάρτητες, οπότε χρησιμοποιούμε την ιδιότητα των διασπορών για μη ανεξάρτητες μεταβλητές = Var c 1 z t + Var c 2 z t + 2Cov c 1 z t, c 2 z t 1 = = c 1 2 Var z t + c 2 2 Var z t + 2c 1 c 2 Cov z t, z t 1 = c 1 2 Var z t + c 2 2 Var z t + 2c 1 c 2 γ (t 1) t = c 1 2 Var z t + c 2 2 Var z t + 2c 1 c 2 γ 1 άρα σταθερό 9
Cov Y t, Y s = Cov c 1 z t + c 2 z t 1, c 1 z s + c 2 z s 1 = Ιδιότητα Cov Χ, Υ = Ε ΧΥ Ε Χ Ε(Υ) = E c 1 z t + c 2 z t 1 c 1 z s + c 2 z s 1 E c 1 z t + c 2 z t 1 Ε(c 1 z s + c 2 z s 1 ) σταθερό σταθερό Άρα αρκεί να δείξουμε ότι E c 1 z t + c 2 z t 1 c 1 z s + c 2 z s 1 σταθερό. E c 1 z t + c 2 z t 1 c 1 z s + c 2 z s 1 = = E(c 2 1 z t z s + c 1 c 2 z t z s 1 + c 2 c 1 z t 1 z s + c 2 2 z t 1 z s 1 ) = = c 2 1 E(z t z s ) + c 1 c 2 E(z t z s 1 ) + c 2 c 1 E(z t 1 z s ) + c 2 2 E(z t 1 z s 1 ) Αρκεί να δείξουμε ότι E(z t z s ) σταθερό 10
Είναι: Cov z t, z s = Ε z t, z s Ε z t Ε(z s ) Ε z t, z s = Cov z t, z s + Ε z t Ε(z s ) άρα σταθερό σταθερό σταθερά Ιδιότητα Cov Χ, Υ = Ε ΧΥ Ε Χ Ε(Υ) Οπότε Cov Y t, Y s σταθερό. Άρα η Υ t είναι στάσιμη. 11
Επαγωγική γενίκευση Οι Υ t = cz t και Υ t = c 1 z t + c 2 z t 1 αποδείξαμε ότι είναι στάσιμες χρονικές σειρές (θεωρώ k = 0, 1). Έστω ότι η Ζ t = c 1 z t + c 2 z t 1 + +c κ z t κ είναι στάσιμη χρονική σειρά (για k = κ). Θέλω να δείξω ότι είναι στάσιμη και για κ = k + 1, δηλ. η Ζ t = c 1 z t + c 2 z t 1 + +c k z t k +c k+1 z t k+1 είναι στάσιμη χρονική σειρά. Όπως προηγουμένως, αποδεικνύουμε ότι ισχύουν οι 3 συνθήκες στασιμότητας. 12
Άσκηση 3 Να ελέγξετε αν η χρονοσειρά Χ t = Ucos θt + Vsin(θt), θ ( π, π] είναι στάσιμη, όπου U, V είναι δύο ασυσχέτιστες τυχαίες μεταβλητές με μηδενικούς μέσους και μοναδιαίες διασπορές. Λύση Η χρονοσειρά Χ t θα είναι στάσιμη αν: E Χ t σταθερό Cov(X t, Χ t+s ) σταθερό 13
Είναι : E Χ t = Ε[Ucos θt + Vsin θt ] = Ε[U] cos θt + Ε V sin θt = = 0 cos θt + 0 sin θt = 0 (σταθερό) Cov X t, Χ t+s = E X t, Χ t+s E X t E Χ t+s = E X t, Χ t+s = = Ε( Ucos θt + Vsin θt Ucos θ t + s + Vsin θ t + s ) = Ε(U 2 cos θt cos θt + θs + UV cos θt sin θt + θs 14
= cos θt cos θt + θs + sin θt sin θt + θs = = cos θt θt θs = cos θs = cos θs σταθερό Άρα η Χ t στάσιμη. Var U = Ε U 2 (ΕU) 2 1 =Ε U 2 0 Ε U 2 = 1 U, V ασυσχέτιστες ρ U, V = 0 Cov U, V = 0 Ε UV E U E V = 0 Ε UV = 0 cosα cos β + sinasinβ = cos(a β) 15
Άσκηση 4 Να ελέγξετε αν η χρονοσειρά Χ t = cos(λt + z) είναι στάσιμη, όπου λ σταθερά και z~u( π, π). Λύση Η χρονοσειρά Χ t θα είναι στάσιμη αν: E Χ t = μ (σταθερό) Var(Χ t ) = σ 2 (σταθερό) (ανεξάρτητα του χρόνου t) Cov(X t, Χ t+s )= γ s (σταθερό) 16
Η ΟΜΟΙΟΜΟΡΦΗ ΚΑΤΑΝΟΜΗ Έστω Χ μια συνεχής τυχαία μεταβλητή ορισμένη στο διάστημα [α, β] με συνάρτηση πυκνότητας πιθανότητας f x = 1 β a, αν α x β 0, διαφορετικa H Χ ακολουθεί την συνεχή ομοιόμορφη κατανομή με παραμέτρους α, β και συμβολίζουμε Χ U( α, β). Γνωρίζουμε επίσης ότι και Ε Χ = 1 α + β 2 Ε Χ = α β xf(x) Var Χ = 1 (β a)2 12 17
Είναι: E Χ t = Ε cos λt + z = Ε cos λt cos z sin λt sinz = = Ε cos λt) cos z E(sin λt sinz = = cos λt Ε cosz sin λt E sinz = π 1 π 1 Αν Χ U(α, β) με σ.π.π. f x : = cos λt coszdz sin λt sinzdz β π 2π π 2π Eg Χ = g X f x dx 1 π 1 π = cos λt 2π π coszdz sin λt 2π π sinzdz α 1 = cos λt (sinz) π 2π π sin λt 1 ( cosz) π 2π π 1 = cos λt [sinπ sin π ] sin λt 1 [ (cosπ cos π )] 2π 2π 1 = cos λt 0 + 0 sin λt 1 1 1 = 0 άρα σταθερό 2π 2π 18
Var Χ t = Ε X t 2 E Χ t 2 = Ε X t 2 0 = Ε X t 2 = Ε Χ t Χ t = E cos λt + z cos λt + z = = Ε (cos λt cosz sin λt sinz) (cos λt cosz sin λt sinz) = = Ε( cos λt 2 cos z 2 2 cos λt cosz sin λt sinz + sin λt 2 sin z 2 ) = = cos λt 2 Ε( cos z 2 ) 2 cos λt sin λt E cosz E(sinz) + = cos λt 2 Ε( cos z 2 ) + sin λt 2 E( sin z 2 ) = sin λt 2 E( sin z 2 ) = = cos λt 2 1 2 + sin λt 2 1 2 = 1 2 cos λt 2 + sin λt 2 = 1 2 σταθερό [Ν.δ.ο. Ε cos z 2 = Ε sin z 2 = 1 2 ] 19
Cov Χ t, Χ t+s = Ε Χ t Χ t+s Ε Χ t Ε Χ t+s = Ε Χ t Χ t+s 0 = = E cos λt + z cos λ(t + s) + z = = E cos λt + z cos λt + λs + z = = 1 2 cos α cosβ = 1 [cos α + β + cos α β ] 2 Ε cos λt + z λt λs z + cos λt + z + λt + λs + z = = 1 2 Ε cos λs + cos( 2λt + 2z) + λs ) = = 1 2 Ε cos λs + 1 2 Ε cos 2λt + 2z cos λs sin 2λt + 2z sin(λs) = = 1 Ε cos λs + 1 Ε[(cos 2λt)cos(2z sin 2λt sin(2z)) cos λs 2 2 (sin 2λt)cos(2z + cos 2λt sin 2z )sin(λs)] = = 1 2 Ε cos λs άρα σταθερό. Άρα η χρονοσειρά Χ t είναι στάσιμη. [Ν.δ.ο. Ε(cos 2z) = Ε(sin 2z) = 0] 20
ΒΑΣΙΚΕΣ ΣΤΟΧΑΣΤΙΚΕΣ ΔΙΑΔΙΚΑΣΙΕΣ Ανεξάρτητες και ισόνομες τυχαίες μεταβλητές Λευκός θόρυβος Γκαουσιανή στοχαστική διαδικασία Τυχαίος περίπατος 21
Ανεξάρτητες και ισόνομες τυχαίες μεταβλητές Μια απλή υπόθεση για τη χρονοσειρά x t, t = 1,.. είναι ότι αποτελείται από ανεξάρτητες τυχαίες μεταβλητές αλλά που όλες ακολουθούν την ίδια κατανομή, και λέγεται χρονοσειρά ανεξάρτητων και ισόνομων τυχαίων μεταβλητών (independent and identically distributed, iid). Μαθηματικά η iid ορίζεται από την ανεξαρτησία για οποιοδήποτε σύνολο T μεταβλητών X 1, X 2,, X T της x t, t = 1,.., δηλ. ισχύει P X 1 x 1, X 2 x 2,, X T x T = P(X 1 x 1 )P(X 2 x 2 ) P(X T x T ) όπου P X 1 x 1, X 2 x 2,, X T x T είναι η κοινή αθροιστική συνάρτηση πιθανότητας και P(X i x i ) οι αντίστοιχες περιθώριες συναρτήσεις πιθανότητας. 22
Μια iid χρονοσειρά είναι εντελώς τυχαία και δεν περιέχει αυτοσυσχετίσεις (γραμμικές ή μη-γραμμικές), δηλαδή συσχετίσεις μεταξύ στοιχείων της χρονοσειράς. Η ανεξαρτησία σε μια χρονοσειρά δηλώνει πως δεν υπάρχει καμιά πληροφορία να αντλήσουμε από τη μελέτη της και η πραγματοποίηση της αποτελείται από τυχαίες τιμές και η μόνη περιγραφή που μπορούμε είναι στατική και περιορίζεται στην περιθώρια κατανομή της. 23
Λευκός θόρυβος Μια iid χρονοσειρά είναι εντελώς τυχαία και δεν περιέχει αυτοσυσχετίσεις (γραμμικές ή µη-γραμμικές), δηλαδή συσχετίσεις μεταξύ στοιχείων της χρονοσειράς. Μια iid χρονοσειρά λέγεται και λευκός θόρυβος (white noise) και θα συμβολίζουμε την κατανομή της ως WN(0, σ ε 2 ), µε μέση τιμή 0 και (σταθερή) διασπορά σ ε 2. Αν επιπλέον τα στοιχεία της χρονοσειράς λευκού θορύβου ακολουθούν κανονική (Γκαουσιανή) κατανομή, τότε η χρονοσειρά λέγεται Γκαουσιανός λευκός θόρυβος (Gaussian white noise). 24
Παρατήρηση Σημειώνεται πως στη βιβλιογραφία δεν υπάρχει συμφωνία στην έννοια του όρου "λευκός θόρυβος". Σε κάποια συγγράμματα, ο όρος "λευκός θόρυβος" χρησιμοποιείται για χρονοσειρές ασυσχέτιστες αλλά όχι ανεξάρτητες, ενώ σε άλλα συγγράμματα ταυτίζεται με τον όρο iid, δηλ για χρονοσειρές ασυσχέτιστες και ανεξάρτητες. 25
Γκαουσιανή στοχαστική διαδικασία Η πιο απλή στοχαστική διαδικασία με συσχετίσεις είναι η Γκαουσιανή στοχαστική διαδικασία ή χρονοσειρά. Για κάθε τάξη Τ, δηλ. για Τ τυχαίες μεταβλητές, η κοινή κατανομή της Γκαουσιανής χρονοσειράς είναι η Τ-διάστατη Γκαουσιανή κατανομή, Χ~Ν(μ, Σ): f X1,,X T x 1,, x T = 1 (2π) T/2 Σ 1/2 exp( (x μ)t Σ 1 (x μ)) όπου μ = (μ 1,, μ T ): μέση τιμή Σ: πίνακας συνδιασπορών (συμμετρικός και θετικά ημι-ορισμένος) 26
Τα διαγώνια στοιχεία του Σ: η διασπορά σ i 2 της τυχαίας μεταβλητής X i Τα μη διαγώνια στοιχεία του Σ: η συνδιασπορά των τυχαίας μεταβλητών X i, X j (E(x i μ i )(x j μ j )) Παρατήρηση Για μια Γκαουσιανή χρονοσειρά η έννοια της ασθενής και αυστηρής στασιμότητας ταυτίζονται αφού η Γκαουσιανή κατανομή ορίζεται μόνο από τις δύο πρώτες ροπές. 27
Παρατήρηση Στην περίπτωση κανονικών τυχαίων μεταβλητών, όταν αυτές είναι ασυσχέτιστες είναι και ανεξάρτητες, το οποίο δεν ισχύει γενικά για οποιεσδήποτε τυχαίες μεταβλητές. Αν έχουμε ανεξάρτητες τυχαίες μεταβλητές, τότε ο πίνακας συνδιασπορών Σ είναι διαγώνιος: Σ = 2 σ 1.. 0...... 0.. σ 2 Ν 28
Τυχαίος περίπατος Ο τυχαίος περίπατος (random walk) είναι μια μη-στάσιμη χρονοσειρά Υ t +, όπου η κάθε τυχαία μεταβλητή Υ t για χρόνο t προκύπτει όταν στην προηγούμενη τυχαία μεταβλητή Υ t 1 προστεθεί ένα τυχαίο βήμα, δηλαδή μια iid τυχαία μεταβλητή Χ t : Υ t = Υ t 1 + Χ t Το όνομα υποδηλώνει ακριβώς ότι η χρονοσειρά παράγεται από την τυχαία κίνηση πάνω σε μια ευθεία γραμμή (στο ), όπου σε κάθε χρονική στιγμή t κάνει ένα τυχαίο βήμα μπρος ή πίσω (Χ t ) από το σημείο που βρίσκεται (Υ t 1 ) στο επόμενο (Υ t ). 29
Αρχίζοντας από κάποια τιμή Χ 0 (δηλ. για t = 0, Υ 0 = Χ 0 ) και αντικαθιστώντας επαναληπτικά στον ορισμό του τυχαίου περιπάτου Υ t = Υ t 1 + Χ t για χρόνους ως t, ο ορισμός του τυχαίου περιπάτου μπορεί να γραφεί ως Υ t = t k=0 Χ k δηλαδή ως άθροισμα όλων των τυχαίων βημάτων ως τη στιγμή t. Είναι: Ε(Υ t ) = 0 Var(Υ t ) = E Y t 2 = tσ X 2 Επειδή η διασπορά του τυχαίου περιπάτου είναι ανάλογη του χρόνου t, άρα η χρονοσειρά του τυχαίου περιπάτου είναι μη-στάσιμη. 30
Βιβλιογραφία 1. Ε. Μπόρα Σέντα, Χ. Μωυσιάδης. Εφαρμοσμένη στατιστική, Β έκδοση, Εκδόσεις Ζήτη, 1995. 2. Γ. Κ. Χρήστου. Εισαγωγή στην Οικονομετρία, Β τόμος (Γ έκδοση), Εκδόσεις Gutenberg, 2007. 3. Δ. Κουγιουμτζής. Σημειώσεις μαθήματος Χρονοσειρών. Τμήμα Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών, ΑΠΘ. 4. Γ.Ε. Κοκολάκης. Σημειώσεις ανάλυσης Χρονοσειρών. Σχολή Εφαρμοσμένων Μαθηματικών & Φυσικών Επιστημών, Αθήνα. 31