ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ Τμήμα Μαθηματικών ΧΡΟΝΟΣΕΙΡΕΣ Σημειώσεις Πανεπιστημιακών Παραδόσεων ΑΛΕΞΑΝΔΡΟΣ ΜΗΛΙΏΝΗΣ ΟΚΤΩΒΡΙΟΣ 07
ΚΕΦΑΛΑΙΟ ΧΡΟΝΟΣΕΙΡΕΣ- ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ. ΚΑΤΗΓΟΡΙΟΠΟΙΗΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ. ΟΡΙΣΜΟΣ ΚΑΙ ΕΙΔΗ ΧΡΟΝΙΚΩΝ ΣΕΙΡΩΝ.3 ΣΤΟΧΑΣΤΙΚΕΣ ΔΙΑΔΙΚΑΣΙΕΣ ΚΑΙ ΔΕΙΓΜΑΤΟΛΗΠΤΙΚΕΣ ΔΙΑΔΡΟΜΕΣ (ΠΡΑΓΜΑΤΟΠΟΙΗΣΕΙΣ).4 ΣΤΑΣΙΜΟΤΗΤΑ ΚΑΙ ΕΡΓΟΔΙΚΟΤΗΤΑ.5 ΑΣΚΗΣΕΙΣ
. ΚΑΤΗΓΟΡΙΟΠΟΙΗΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ α) Χρονικά δεδομένα (ime series daa) Συγκεντρώνονται σε τακτά χρονικά διαστήματα, όπως: ωριαία (π.χ επιφανειακές συγκεντρώσεις ατμοσφαιρικών ρύπων), ημερήσια (π.χ. τιμές κλεισίματος μετοχών), εβδομαδιαία (π.χ. προσφορά χρήματος), μηνιαία (π.χ. ανεργία, ρυθμός πληθωρισμού), τριμηνιαία (π.χ. ΑΕΠ), ετήσια (π.χ. SST (see surface emperaure) δηλ. η μέση ετήσια θερμοκρασία στην επιφάνεια της θάλασσας για ένα γεωγραφικό σημείο, ή και για όλη τη γη) κλπ. Δυνατόν να είναι ποσοτικά ή και κατηγορικά (βροχή-όχι βροχή, παγετός, όχι παγετός κλπ.). β) Διαστρωματικά δεδομένα (cross-secional daa) Συλλέγονται για μία συγκεκριμένη χρονική στιγμή για μία ή περισσότερες μεταβλητές (π.χ. απογραφή πληθυσμού, δημοσκοπήσεις κλπ). γ) Μεικτά δεδομένα (pooled daa) Συνδυασμός των (α) και (β). Ως παράδειγμα αναφέρεται ο ρυθμός πληθωρισμού στις χώρες του ΟΟΣΑ για τη μεταπολεμική περίοδο. Ειδική περίπτωση αποτελούν τα λεγόμενα panel daa για τα οποία οι «μονάδες» για τις οποίες συλλέγονται τα δεδομένα είναι πάντα οι ίδιες. Τα δεδομένα κάθε κατηγορίας διακρίνονται σε πειραματικά και μη πειραματικά. Στα πρώτα ο ερευνητής μπορεί να έχει κάποιο έλεγχο στις συνθήκες κάτω από τις οποίες αυτά συλλέγονται, ενώ στα μη πειραματικά δεδομένα οι συνθήκες κάτω από τις οποίες αυτά συλλέγονται είναι πέρα από τον έλεγχο του ερευνητή. 3
. ΟΡΙΣΜΟΣ ΚΑΙ ΕΙΔΗ ΧΡΟΝΙΚΩΝ ΣΕΙΡΩΝ Χρονική σειρά, ή χρονοσειρά: ένα σύνολο δεδομένων με καθορισμένη διάταξη ως προς το χρόνο. Αν το σύνολο αυτό είναι συνεχές η χρονική σειρά ονομάζεται συνεχής, ενώ αν το σύνολο είναι διακριτό η χρονοσειρά ονομάζεται διακριτή. Αν οι τιμές μιας χρονοσειράς μπορούν να καθορισθούν ακριβώς, π.χ. μέσω μιας συναρτήσεως, όπως για παράδειγμα η θέση ενός κινητού που εκτελεί ευθύγραμμη ομαλή κίνηση που δίνεται από τη σχέση: Χ = Χ 0 + U* όπου Χ 0 η θέση του κινητού τη χρονική στιγμή μηδέν, U η ταχύτητα του κινητού και ο χρόνος, τότε η χρονοσειρά ονομάζεται αιτιοκρατική. Αν όμως οι μελλοντικές τιμές είναι δυνατό να καθορισθούν μόνο ως προς μια κατανομή πιθανότητας, τότε η χρονοσειρά ονομάζεται στατιστική ή στοχαστική. Στο παρόν θα ασχοληθούμε με διακριτές στοχαστικές χρονοσειρές στις οποίες οι διαδοχικοί όροι ισαπέχουν..3 ΣΤΟΧΑΣΤΙΚΕΣ ΔΙΑΔΙΚΑΣΙΕΣ ΚΑΙ ΔΕΙΓΜΑΤΟΛΗΠΤΙΚΕΣ ΔΙΑΔΡΟΜΕΣ (ΠΡΑΓΜΑΤΟΠΟΙΗΣΕΙΣ) Υποθέτουμε ότι η υπό εξέταση χρονοσειρά με τιμές,,.., T δημιουργήθηκε από μία οικογένεια τυχαίων μεταβλητών Y, Y,,Y T με από κοινού κατανομή πιθανότητας P(Y, Y,.,Y T ). Η οικογένεια αυτή των τυχαίων μεταβλητών ονομάζεται στοχαστική διαδικασία (ανέλιξη). Έτσι η παρατηρούμενη χρονοσειρά δεν είναι παρά ένα από τα πιθανά ενδεχόμενα της κοινής κατανομής πιθανότητας P(Y,Y,.,Y T ) 4
και ονομάζεται πραγματοποίηση (realizaion) ή δειγματοληπτική διαδρομή (sample pah) της στοχαστικής διαδικασίας. Σύμφωνα με τα παραπάνω για κάθε χρονική στιγμή,,...,τ υπάρχει μία κατανομή πιθανότητας από την οποία προέρχονται οι τιμές,,.., T. Κατά συνέπεια από την ίδια στοχαστική διαδικασία μπορούν να προέλθουν άπειρες το πλήθος πραγματοποιήσεις σαν την,,.., T. Έστω ότι είναι δυνατό να έχουμε στη διάθεσή μας R το πλήθος πραγματοποιήσεις μιας στοχαστικής διαδικασίας, τις: () () ( R), (), (), (R),......,,......, (),......, ()...... ( R) Αν η συνάρτηση πυκνότητας πιθανότητας που αντιστοιχεί στη χρονική στιγμή είναι f Y, τότε η αναμενόμενη τιμή του όρου της χρονοσειράς με τάξη θα είναι: ( Y ) f ( ) d Y Το σύνολο των τιμών της Υ που αντιστοιχούν στη χρονική στιγμή είναι γνωστό και ως στατιστική συλλογή (ensemble). H E(Y ) μπορεί να εκφρασθεί και σαν το όριο πιθανότητας (plim) του () μέσου της στατιστικής συλλογής (ensemble average) ( Y ) plim R i R R ( i) (), ( R),..., : Σύμφωνα με την παραπάνω σχέση, η αναμενόμενη τιμή της στατιστικής συλλογής που αντιστοιχεί στη χρονική στιγμή είναι γενικά συνάρτηση της χρονικής αυτής στιγμής. H διακύμανση της Y θα δίνεται από τη σχέση: 5
E(Y ) 0 ( ) f ( ) d Y Θεωρούμε τώρα τις χρονικές στιγμές, -,..-. H -τάξεως αυτοσυνδιακύμανση ορίζεται ως εξής: f... ( μ )( E{(Y )( Y Y, Y-,...Y μ )} - )f Y,Y-,...Y (, -,..., )d d -...d όπου, (,,..., ) η από κοινού συνάρτηση πιθανότητας των - Y, Y -,,Y -..4 ΣΤΑΣΙΜΟΤΗΤΑ ΚΑΙ ΕΡΓΟΔΙΚΟΤΗΤΑ Αν η μέση τιμή μ, η διακύμανση γ 0 και οι αυτοσυνδιακυμάνσεις γ, =,,..δεν εξαρτώνται από τη χρονική στιγμή τότε η στοχαστική ανέλιξη ονομάζεται ασθενώς στάσιμη, ή στάσιμη κατά τη συνδιακύμανση. Δηλαδή για ασθενώς στάσιμη στοχαστική ανέλιξη θα ισχύουν: ( Y ) = μ, E{(Y )( Y )} E{(Y )( Y )} =γ, Άρα η αυτοσυνδιακύμανση θα εξαρτάται μόνο από τη (χρονική) απόσταση. Τότε θα έχουμε: E{(Y )( Y )} E{(Y δηλαδή η γ είναι συμμετρική. -(-) )( Y )}, Για να χαρακτηρισθεί η στοχαστική διαδικασία ως αυστηρά στάσιμη οι απαιτήσεις είναι μεγαλύτερες: θα πρέπει ολόκληρη η κατανομή πιθανότητας των Y, Y +,,Y +s να είναι ανεξάρτητη του χρόνου, δηλαδή να παραμένει ανεξάρτητη σε οποιαδήποτε χρονική μετατόπιση: 6
f Y, Y (,,..., ) = f (,,..., ),k, s,...ys s Y k, Yk,...Y ks k k ks Βέβαια, οι ορισμοί που δόθηκαν ως τώρα έχουν περισσότερο θεωρητική αξία καθώς στην πράξη τις περισσότερες φορές είναι αδύνατο να έχουμε πάνω από μία πραγματοποίηση της στοχαστικής διαδικασίας. Διαθέτοντας μόνο μια πραγματοποίηση της στοχαστικής διαδικασίας, δηλαδή τη χρονοσειρά που αποτελούν τα δεδομένα μας,,.., T, η μέση τιμή μπορεί να υπολογισθεί μόνο σε σχέση με το χρόνο : T T Ομοίως η αυτοσυνδιακύμανση τάξεως υπολογίζεται από τη σχέση: c T T ( )( ) Αν: plim =μ τότε η χρονοσειρά καλείται εργοδική ως προς το μέσο. Αν επιπλέον: plim c =γ τότε η χρονοσειρά καλείται εργοδική ως προς το μέσο και τις δεύτερες ροπές. Αποδεικνύεται ότι για να είναι η Υ εργοδική ως προς το μέσο θα πρέπει: 0 Αν η Υ είναι στάσιμη και έχει κανονική κατανομή πιθανότητας, η συνθήκη αυτή είναι αρκετή για να είναι η σειρά εργοδική σε όλες τις ροπές. 7
Από τα παραπάνω προκύπτει ότι για μια στάσιμη και εργοδική σειρά το ιστόγραμμα των παρατηρήσεων μπορεί να μας δώσει πληροφορίες σχετικά με την περιθώρια κατανομή πιθανότητας f(y )..5 ΑΣΚΗΣΕΙΣ ) Έστω Υ =μ + ε, όπου μ σταθερά και ε κανονική τυχαία μεταβλητή με μέση τιμή 0 και διακύμανση σ. (α) Να βρεθεί η αναμενόμενη τιμή, η διακύμανση, καθώς και οι αυτοσυνδιακυμάνσεις της Υ. (β) Τι συμπέρασμα προκύπτει από το (α) ως προς τη στασιμότητα της Υ ; ) Έστω ότι η Υ ισούται με το άθροισμα μίας χρονικής τάσης β με β σταθερά και μίας κανονικής τυχαίας μεταβλητής ε με μέση τιμή 0 και διακύμανση σ. (α) Να βρεθεί η αναμενόμενη τιμή, η διακύμανση, καθώς και οι αυτοσυνδιακυμάνσεις της Υ. (β) Τι συμπέρασμα προκύπτει από το (α) ως προς τη στασιμότητα της Υ ; 3) Έστω ότι η μέση τιμή της δειγματοληπτικής διαδρομής με τάξη (i), μ (i) προέρχεται από την κατανομή Ν(0,λ ( i) ) και, με (i) N(0, ) και ανεξάρτητο του. Να εξετασθεί η Υ ως προς στασιμότητα και εργοδικότητα. ( i) 8