ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικών Χρηματοοικονομικών Μαθηματικών ΧΡΟΝΟΣΕΙΡΕΣ Σημειώσεις Πανεπιστημιακών Παραδόσεων ΑΛΕΞΑΝΔΡΟΣ ΜΗΛΙΏΝΗΣ ΟΚΤΩΒΡΙΟΣ 205
ΚΕΦΑΛΑΙΟ ΕΙΣΑΓΩΓΗ. Κατηγοριοποίηση στατιστικών δεδομένων..2 Ορισμός και είδη χρονικών σειρών..3 Σύντομη ιστορική ανασκόπηση..4 Στοχαστικές διαδικασίες και δειγματοληπτικές διαδρομές (πραγματοποιήσεις)..5 Στασιμότητα και εργοδικότητα..6 Ανάλυση μιας χρονικής σειράς σε συνιστώσες..7 Ασκήσεις. 2
ΚΕΦΑΛΑΙΟ ΕΙΣΑΓΩΓΗ. Κατηγοριοποίηση στατιστικών δεδομένων α) Χρονικά δεδομένα (ime series daa) Συγκεντρώνονται σε τακτά χρονικά διαστήματα, όπως: ωριαία (επιφανειακές συγκεντρώσεις ατμοσφαιρικών ρύπων), ημερήσια (π.χ. τιμές κλεισίματος μετοχών), εβδομαδιαία (π.χ. προσφορά χρήματος), μηνιαία (π.χ. ανεργία, ρυθμός πληθωρισμού), τριμηνιαία (π.χ. ΑΕΠ), ετήσια (π.χ. SST (see surface emperaure) δηλ. η μέση ετήσια θερμοκρασία στην επιφάνεια της θάλασσας για ένα γεωγραφικό σημείο, ή και για όλη τη γη) κλπ. Δυνατόν να είναι ποσοτικά ή και κατηγορικά (βροχή-όχι βροχή, παγετός, όχι παγετός κλπ.). β) Διαστρωματικά δεδομένα (cross-secional daa) Συλλέγονται για μία συγκεκριμένη χρονική στιγμή για μία ή περισσότερες μεταβλητές, π.χ. απογραφή πληθυσμού, δημοσκοπήσεις κλπ. γ) Μεικτά δεδομένα (pooled daa) Συνδυασμός των (α) και (β). Ως παράδειγμα αναφέρεται ο ρυθμός πληθωρισμού στις χώρες του ΟΟΣΑ για τη μεταπολεμική περίοδο. Ειδική περίπτωση αποτελούν τα λεγόμενα panel daa για τα οποία οι «μονάδες» για τις οποίες συλλέγονται τα δεδομένα είναι πάντα οι ίδιες. Τα δεδομένα κάθε κατηγορίας διακρίνονται σε πειραματικά και μη πειραματικά. Στα πρώτα ο ερευνητής μπορεί να έχει κάποιο έλεγχο στις συνθήκες κάτω από τις οποίες αυτά συλλέγονται, ενώ στα μη πειραματικά δεδομένα οι συνθήκες κάτω από τις οποίες αυτά συλλέγονται είναι πέρα από τον έλεγχο του ερευνητή..2 Ορισμός και είδη χρονικών σειρών Χρονική σειρά, ή χρονοσειρά : ένα σύνολο δεδομένων με καθορισμένη διάταξη ως προς το χρόνο. Αν το σύνολο αυτό είναι συνεχές η χρονική σειρά ονομάζεται συνεχής, ενώ αν το σύνολο είναι διακριτό η χρονοσειρά ονομάζεται διακριτή. 3
Αν οι τιμές μιας χρονοσειράς μπορούν να καθορισθούν ακριβώς, π.χ. μέσω μιας συναρτήσεως, όπως για παράδειγμα η θέση ενός κινητού που εκτελεί ευθύγραμμη ομαλή κίνηση που δίνεται από τη σχέση: Χ = Χ 0 + U* όπου Χ 0 η θέση του κινητού τη χρονική στιγμή μηδέν, U η ταχύτητα του κινητού και ο χρόνος, τότε η χρονοσειρά ονομάζεται αιτιοκρατική. Αν όμως οι μελλοντικές τιμές είναι δυνατό να καθορισθούν μόνο ως προς μια κατανομή πιθανότητας, τότε η χρονοσειρά ονομάζεται στατιστική ή στοχαστική. Στο παρόν θα ασχοληθούμε με διακριτές στοχαστικές χρονοσειρές στις οποίες οι διαδοχικοί όροι ισαπέχουν..3 Σύντομη ιστορική ανασκόπηση Οι βάσεις για τη θεωρία των χρονοσειρών τέθηκαν κυρίως κατά τη διάρκεια του μεσοπολέμου (εργασίες των Yule, Wald, κλπ.). Κατά τη δεκαετία του 950, κυρίως από τους ερευνητές του Cowles Foundaion Group, αναπτύχθηκαν τα οικονομετρικά υποδείγματα ταυτόχρονων (αλληλοεξαρτημένων) εξισώσεων για την εκτίμηση των οποίων χρησιμοποιήθηκαν μέθοδοι μέγιστης πιθανοφάνειας. Εφαρμογές κυρίως στη μακροοικονομία (μεγάλης κλίμακας μακροοικονομικά υποδείγματα). Τη δεκαετία του 960: ανάπτυξη τεχνικών εκθετικής εξομάλυνσης χρονοσειρών από επιχειρησιακούς ερευνητές (Hol, Winers) με σκοπό κυρίως την πρόβλεψη. Τη δεκαετία του 970 μεγάλη ώθηση σε εφαρμογές από τους Box και Jenkins με την ανάπτυξη της μεθοδολογίας για τη δημιουργία εμπειρικών υποδειγμάτων χρονοσειρών. Σύμφωνα με τη μεθοδολογία αυτή η αναζήτηση των πληροφοριών για τη δημιουργία των υποδειγμάτων κατευθύνεται στα ίδια τα διαθέσιμα δεδομένα, δηλαδή για τη δημιουργία των υποδειγμάτων δεν είναι απαραίτητο να στηριχθούμε σε κάποια προϋπάρχουσα θεωρία. Οι προγνώσεις με υποδείγματα Box-Jenkins ήταν τις περισσότερες φορές καλύτερες από αυτές των μεγάλης κλίμακας μακροοικονομικών υποδειγμάτων. Όμως οι μακροοικονομέτρες τα χαρακτήρισαν ακατάλληλα για οικονομική πολιτική (a-heoreical), επειδή ήταν εμπειρικά και κατά συνέπεια στερούνταν θεωρητικής βάσης. 4
Μέχρι και τις αρχές της δεκαετίας του 980 υπήρχε αντιπαλότητα (βλ. π.χ. Johnson, Economeric Mehods, McGraw Hill, 986). Από εκεί και μετά υπάρχει σύγκλιση..4 Στοχαστικές διαδικασίες και δειγματοληπτικές διαδρομές (πραγματοποιήσεις). Υποθέτουμε ότι η υπό εξέταση χρονοσειρά με τιμές y, y 2,..,y T δημιουργήθηκε από μία οικογένεια τυχαίων μεταβλητών Y, Y 2,,Y T με από κοινού κατανομή πιθανότητας P(Y, Y 2,.,Y T ). Η οικογένεια αυτή των τυχαίων μεταβλητών ονομάζεται στοχαστική διαδικασία (ανέλιξη). Έτσι η παρατηρούμενη χρονοσειρά δεν είναι παρά ένα από τα πιθανά ενδεχόμενα της κοινής κατανομής πιθανότητας P(Y,Y 2,.,Y T ) και ονομάζεται πραγματοποίηση (realizaion) ή δειγματοληπτική διαδρομή (sample pah) της στοχαστικής διαδικασίας. Σύμφωνα με τα παραπάνω για κάθε χρονική στιγμή,2,...,τ υπάρχει μία κατανομή πιθανότητας από την οποία προέρχονται οι τιμές y, y 2,..,y T. Κατά συνέπεια από την ίδια στοχαστική διαδικασία μπορούν να προέλθουν άπειρες το πλήθος πραγματοποιήσεις σαν την y, y 2,..,y T. Έστω ότι είναι δυνατό να έχουμε στη διάθεσή μας R το πλήθος πραγματοποιήσεις μιας στοχαστικής διαδικασίας, τις: () () () y, y,..., y 2 Τ (2) (2) (2) y, y,..., y 2 Τ... y, y,..., y ( R) (R) 2 ( R) Τ Αν η συνάρτηση πυκνότητας πιθανότητας που αντιστοιχεί στη χρονική στιγμή είναι f Y, τότε η αναμενόμενη τιμή του όρου της χρονοσειράς με τάξη θα είναι: µ + = Ε( Y ) y f ( y ) dy Y Το σύνολο των τιμών της Υ που αντιστοιχούν στη χρονική στιγμή είναι γνωστό και ως στατιστική συλλογή (ensemble average). 5
H E(Y ) μπορεί να εκφρασθεί και σαν το όριο πιθανότητας (plim) του μέσου της στατιστικής συλλογής (ensemble average) Ε( Y ) = plim R y i= R R ( i) () y, (2) y,..., (R) y : Σύμφωνα με την παραπάνω σχέση, η αναμενόμενη τιμή της στατιστικής συλλογής που αντιστοιχεί στη χρονική στιγμή είναι γενικά συνάρτηση της χρονικής αυτής στιγμής. H διακύμανση της Y θα δίνεται από τη σχέση: γ + 2 E(Y µ ) 0 2 = ( y µ ) f ( y ) dy Y Θεωρούμε τώρα τις χρονικές στιγμές, -,..-. H -τάξεως αυτοσυνδιακύμανση ορίζεται ως εξής: γ f + + =... (y μ E{(Y µ )( Y + (y, y )(y µ,..., y μ )} ) - )f Y,Y-,...Y (y, y -,..., y )dy dy -...dy η από κοινού συνάρτηση πιθανότητας των Y, Y-,...Y - Y, Y -,,Y -. όπου,.5 Στασιμότητα και εργοδικότητα Αν η μέση τιμή μ, η διακύμανση γ 0 και οι αυτοσυνδιακυμάνσεις γ, =,2,..δεν εξαρτώνται από τη χρονική στιγμή τότε η στοχαστική ανέλιξη ονομάζεται ασθενώς στάσιμη, ή στάσιμη κατά τη συνδιακύμανση. Δηλαδή για ασθενώς στάσιμη στοχαστική ανέλιξη θα ισχύουν: Ε ( Y ) = μ, E{(Y µ )( Y µ )} = E{(Y µ )( Y µ )} =γ, Άρα η αυτοσυνδιακύμανση θα εξαρτάται μόνο από τη (χρονική) απόσταση. Τότε θα έχουμε: γ = E{(Y + µ )( Y + µ )} = E{(Y (-) µ )( Y µ )} = γ δηλαδή η γ είναι συμμετρική. -, 6
Για να χαρακτηρισθεί η στοχαστική διαδικασία ως αυστηρά στάσιμη οι απαιτήσεις είναι μεγαλύτερες: θα πρέπει ολόκληρη η κατανομή πιθανότητας των Y, Y +,,Y +s να είναι ανεξάρτητη του χρόνου, δηλαδή να παραμένει ανεξάρτητη σε οποιαδήποτε χρονική μετατόπιση: f (y, y,..., y ) = f (y, y,..., y ), k, s + Y+ k,y+ k+,...y+ k+ s + k + + + + Y, Y,...Y+ s + + s k k s Βέβαια, οι ορισμοί που δόθηκαν ως τώρα έχουν περισσότερο θεωρητική αξία καθώς στην πράξη τις περισσότερες φορές είναι αδύνατο να έχουμε πάνω από μία πραγματοποίηση της στοχαστικής διαδικασίας. Διαθέτοντας μόνο μια πραγματοποίηση της στοχαστικής διαδικασίας, δηλαδή τη χρονοσειρά που αποτελούν τα δεδομένα μας y, y 2,..,y T, η μέση τιμή μπορεί να υπολογισθεί μόνο σε σχέση με το χρόνο : y = T T y = Ομοίως η αυτοσυνδιακύμανση τάξεως υπολογίζεται από τη σχέση: c Αν: = T T = + plim y =μ plim c =γ ( y y)( y y) τότε η χρονολογική σειρά καλείται εργοδική ως προς το μέσο και τις δεύτερες ροπές αντίστοιχα. Αποδεικνύεται ότι για να είναι η Υ εργοδική ως προς το μέσο θα πρέπει: = 0 γ < Αν η Υ είναι στάσιμη και έχει κανονική κατανομή πιθανότητας, η συνθήκη αυτή είναι αρκετή για να είναι η σειρά εργοδική σε όλες τις ροπές. Από τα παραπάνω προκύπτει ότι για μια στάσιμη και εργοδική σειρά το ιστόγραμμα των παρατηρήσεων μπορεί να μας δώσει πληροφορίες σχετικά με την περιθώρια κατανομή πιθανότητας f(y ). 7
.6 Ανάλυση μιας χρονικής σειράς σε συνιστώσες Είναι χρήσιμο ιδιαίτερα σε εφαρμογές να υποθέσουμε ότι μια παρατηρούμενη χρονοσειρά μπορεί να αναλυθεί σε μη παρατηρήσιμες συνιστώσες σύμφωνα με τη σχέση: Υ = S +P +C + U Όπου: Υ = η παρατηρούμενη χρονοσειρά, ή κάποιος (συνήθως ο λογαριθμικός) μετασχηματισμός της P = η μακροχρόνια τάση C = η κυκλική συνιστώσα S = η εποχική συνιστώσα U = η άρρυθμη συνιστώσα Η μακροχρόνια τάση εκφράζει τη μεταβολή στο επίπεδο της χρονοσειράς. Υφίσταται σε μη στάσιμες χρονοσειρές και μπορεί να είναι σταθερή ή χρονικά μεταβαλλόμενη. Όταν η τάση είναι χρονικά μεταβαλλόμενη, προγνώσεις που στηρίζονται σε γραμμικά υποδείγματα παλινδρόμησης σε πολλές περιπτώσεις αποδείχθηκαν δραματικά αποτυχημένες. Η κυκλική συνιστώσα εκφράζει κυκλικές κυμάνσεις με περίοδο μεγαλύτερη του έτους (π.χ. επιχειρηματικοί κύκλοι στην οικονομία, ετήσιος αριθμός ηλιακών κηλίδων κλπ.). Η εποχική συνιστώσα εκφράζει την κυκλική κύμανση μιας χρονοσειράς με περίοδο ένα έτος ακριβώς. Είναι παρούσα σε μεγάλο αριθμό κοινωνικοοικονομικών αλλά και περιβαλλοντικών χρονικών σειρών (π.χ. εισπράξεις από τουριστικές υπηρεσίες, συγκεντρώσεις CO 2 στην ατμόσφαιρα κλπ.). Η άρρυθμη ή μη συστηματική συνιστώσα (θόρυβος) εκφράζει το συνολικό αποτέλεσμα μη συστηματικών παραγόντων. Τονίζεται με έμφαση ότι ανάλυση σε μη παρατηρήσιμες συνιστώσες είναι μία καθαρά μαθηματική κατασκευή και δεν μπορεί να γίνει με μονοσήμαντο τρόπο. Για λόγους πληρότητας θα πρέπει να αναφερθεί ότι ένα ιδιαίτερα χρήσιμο εργαλείο στην ανάλυση χρονικών σειρών σε μη παρατηρήσιμες συνιστώσες είναι η λεγόμενη φασματική ανάλυση. Μία χρονική σειρά μπορεί να παρασταθεί γραφικά ως προς το χρόνο. Θα μπορούσε όμως στον οριζόντιο άξονα να 8
χρησιμοποιηθεί αντί του χρόνου η συχνότητα οπότε στον κατακόρυφο άξονα παριστάνεται η φασματική ισχύς. Έτσι προκύπτει το φάσμα (specrum) της χρονικής σειράς. Κάθε περιοδική κύμανση περιόδου Τ αντιστοιχεί σε συχνότητα ν=/τ, ή κυκλική συχνότητα ω=2π/τ. Μία μη στάσιμη χρονοσειρά θα έχει φασματική ισχύ για ν 0. Στα πλαίσια του μαθήματος αυτού θα δοθεί μόνο μια πολύ γενική περιγραφή της μεθόδου μέσω και των σχημάτων που ακολουθούν (περαιτέρω επεξηγήσεις θα δοθούν στην παράδοση). 9
0
2
3
. 7 Ασκήσεις ) Αν Υ =μ + ε όπου μ σταθερά και ε κανονική τυχαία μεταβλητή με μέση τιμή 0 και διακύμανση σ 2 να βρεθεί η αναμενόμενη τιμή και η διακύμανση της Υ, και να εξετασθεί ως προς τη στασιμότητα. 2) Αν η Υ ισούται με το άθροισμα μίας χρονικής τάσης β με β σταθερά και μίας κανονικής τυχαίας μεταβλητής ε με μέση τιμή 0 και διακύμανση σ 2 να βρεθεί η αναμενόμενη τιμή και η διακύμανση της Υ και να εξετασθεί ως προς τη στασιμότητα. 3) Έστω ότι η μέση τιμή της δειγματοληπτικής διαδρομής με τάξη (i), μ (i) προέρχεται από την κατανομή Ν(0,λ 2 ) και και ε ανεξάρτητο του εργοδικότητα. y ( i) ( i) = µ + ε 2, με ε N(0, σ ) (i) µ. Να εξετασθεί η Υ ως προς στασιμότητα και 4