Χρονοσειρές, Μέρος Β 1 Πρόβλεψη Χρονικών Σειρών

Σχετικά έγγραφα
Χρονοσειρές Μάθημα 6

Μάθημα 4: Πρόβλεψη χρονοσειρών Απλές τεχνικές πρόβλεψης Πρόβλεψη στάσιμων χρονοσειρών με γραμμικά μοντέλα Πρόβλεψη μη-στάσιμων χρονοσειρών Ασκήσεις

min Προσαρμογή AR μοντέλου τάξη p, εκτίμηση παραμέτρων Προσδιορισμός τάξης AR μοντέλου συσχέτιση των χωρίς τη συσχέτιση με

Χρονοσειρές, Μέρος Β 1 Πρόβλεψη Χρονικών Σειρών

ΤΜΗΜΑ ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥ ΣΧΕΔΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ

Χρονοσειρές Μάθημα 3. Γραμμικές στάσιμες διαδικασίες. Γραμμική χρονοσειρά (στοχαστική διαδικασία) Z Z ~ WN(0, ) είναι στάσιμη. Θεωρούμε μ=0 E[ X ] 0

Χρονοσειρές Μάθημα 1

Χρονοσειρές - Μάθημα 5

Χρονοσειρές - Μάθημα 5

Μάθημα 2: Mη-στάσιμη χρονοσειρά, έλεγχος μοναδιαίας ρίζας και έλεγχος ανεξαρτησίας

Εφαρμοσμένη Στατιστική: Συντελεστής συσχέτισης. Παλινδρόμηση απλή γραμμική, πολλαπλή γραμμική

Χρονοσειρές Μάθημα 1

1. Ποιες είναι οι διαφορές μεταξύ αυτοπαλίνδρομων υποδειγμάτων (AR) και υποδειγμάτων κινητού μέσου (MA);

ΚΕΦΑΛΑΙΟ 6 ΠΡΟΒΛΕΨΕΙΣ ΜΕ ΥΠΟΔΕΙΓΜΑΤΑ ΧΡΟΝΟΣΕΙΡΩΝ

Χρονικές σειρές 5 Ο μάθημα: Γραμμικά στοχαστικά μοντέλα (1) Αυτοπαλίνδρομα μοντέλα Εαρινό εξάμηνο Τμήμα Μαθηματικών ΑΠΘ

Χρονοσειρές - Μάθημα 9 Aνάλυση χρονοσειρών και δυναμικά συστήματα

Χρονικές σειρές 8 Ο μάθημα: Μοντέλα κινητού μέσου

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ Ι Συμπληρωματικές Σημειώσεις Δημήτριος Παντελής

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Στασιμότητα χρονοσειρών Νόθα αποτελέσματα-spurious regression Ο έλεγχος στασιμότητας είναι απαραίτητος ώστε η στοχαστική ανάλυση να οδηγεί σε ασφαλή

Μάθημα 1: Εισαγωγή στην ανα λυση χρονοσειρω ν, στασιμο τητα και αυτοσυσχε τιση

1.2 Απλός Κινητός Μέσος (Simple -equally-weighted- Moving Average)

Χρονικές σειρές 2 Ο μάθημα: Εισαγωγή στις χρονοσειρές

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Αριθμητική Ανάλυση και Εφαρμογές

Τεχνικές Προβλέψεων Αυτοπαλινδρομικά Μοντέλα Κινητού Μέσου Όρου (ARIMA)

Χρονικές σειρές 10 Ο μάθημα: Μη στάσιμα μοντέλα ARIMA Μεθοδολογία Box-Jenkins Εαρινό εξάμηνο Τμήμα Μαθηματικών ΑΠΘ

ΤΜΗΜΑΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥΣΧΕΔΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝΣΥΣΤΗΜΑΤΩΝ

9. Παλινδρόμηση και Συσχέτιση

Εκτίμηση μη-γραμμικών χαρακτηριστικών

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium iv

Χρονικές σειρές 6 Ο μάθημα: Αυτοπαλίνδρομα μοντέλα (2)

ΚΕΦΑΛΑΙΟ 2 ΑΝΑΣΚΟΠΗΣΗ ΑΠΑΡΑΙΤΗΤΩΝ ΓΝΩΣΕΩΝ: ΕΚΤΙΜΗΤΕΣ

ΚΕΦΑΛΑΙΟ 5 ΣΤΟΧΑΣΤΙΚΕΣ ΔΙΑΔΙΚΑΣΙΕΣ ΔΙΑΚΡΙΤΟΥ ΧΡΟΝΟΥ, ΥΠΟΔΕΙΓΜΑΤΑ ARIMA ΚΑΙ SARIMA, ΜΕΘΟΔΟΛΟΓΙΑ BOX-JENKINS

Χρονοσειρές Μάθημα 2. Μη-στασιμότητα. Τάση? Εποχικότητα / περιοδικότητα? Ασταθή διασπορά? Αυτοσυσχέτιση?

Χρονικές σειρές 11 Ο μάθημα: Προβλέψεις

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Συσχέτιση μεταξύ δύο συνόλων δεδομένων

ΑΝΑΛΥΣΗ ΧΡΟΝΟΣΕΙΡΩΝ Κουγιουμτζής Δημήτρης

Χρονικές σειρές 9 Ο μάθημα: Μεικτά μοντέλα ARMA

Βασικές Έννοιες Στατιστικής & Μέθοδοι Πρόβλεψης

7.1.1 Η Μέθοδος των Ελαχίστων Τετραγώνων

ΚΕΦΑΛΑΙΟ 0. Απλή Γραμμική Παλινδρόμηση. Ένα Πρόβλημα. Η επιδιωκόμενη ιδιότητα. Ένα χρήσιμο γράφημα. Οι υπολογισμοί. Η μέθοδος ελαχίστων τετραγώνων ...

Χρονοσειρές - Μάθημα 8. Μη-γραμμική ανάλυση χρονοσειρών

Έλεγχος Υποθέσεων. Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς

ΕΦΑΡΜΟΣΜΕΝΗ ΑΝΑΛΥΣΗ ΠΑΛΙΝΔΡΟΜΗΣΗΣ ΚΑΙ ΔΙΑΣΠΟΡΑΣ (ΝΠΣ) & ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ (ΠΠΣ) (6o Εξάμηνο Μαθηματικών) Ιανουάριος 2008

Εισόδημα Κατανάλωση

ΤΜΗΜΑΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥΣΧΕΔΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝΣΥΣΤΗΜΑΤΩΝ

ΕΛΕΓΧΟΣ ΠΑΡΑΓΩΓΙΚΩΝ ΔΙΕΡΓΑΣΙΩΝ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Μάθημα 5-6: Στάσιμες πολυμεταβλητές χρονοσειρές και μοντέλα Διασυσχέτιση Διανυσματικά αυτοπαλίνδρομα μοντέλα Δίκτυα από πολυμεταβλητές χρονοσειρές

TMHMA OIKONOMIKΩN ΕΠΙΣΤΗΜΩΝ Διαγώνισμα Προόδου Στατιστικής III

Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 19/5/2017

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 14 Μαρτίου /34

Προσδιοριστικοί όροι και μοναδιαία ρίζα (από κοινού υποθέσεις)

Χρονοσειρές - Μάθημα 7. Μη-γραμμική ανάλυση χρονοσειρών

HMY 799 1: Αναγνώριση Συστημάτων

Χ. Εμμανουηλίδης, 1

Χρονολογικές Σειρές (Time Series) Lecture notes Φ.Κουντούρη 2008

5. Έλεγχοι Υποθέσεων

2 Ανάλυση Χρονοσειρών στο Πεδίο των Συχνοτήτων

Χρονοσειρές Μάθημα 3

Πραγματικές χρονοσειρές

Ογενικός(πλήρης) έλεγχος των Dickey Fuller

Διάστημα εμπιστοσύνης της μέσης τιμής

Εισαγωγή στην Στατιστική (ΔΕ200Α-210Α)

Αντικείμενο του κεφαλαίου είναι: Ανάλυση συσχέτισης μεταξύ δύο μεταβλητών. Εξίσωση παλινδρόμησης. Πρόβλεψη εξέλιξης

Πολλαπλή παλινδρόμηση (Multivariate regression)

ΒΑΣΙΚΑ ΧΑΡΑΚΤΗΡΙΣΤΙΚΑ ΧΡΟΝΟΣΕΙΡΑΣ

Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης

Διαστήματα Εμπιστοσύνης

ΤΕΛΕΣΤΕΣ ΚΑΙ ΣΤΑΤΙΣΤΙΚΑ ΕΡΓΑΛΕΙΑ ΑΝΑΛΥΣΗΣ ΧΡΟΝΟΣΕΙΡΩΝ

4 o Μάθημα Διάστημα Εμπιστοσύνης του Μέσου

Εισαγωγή στην Στατιστική (ΔΕ200Α-210Α)

Αστάθεια (volatility)

4 o Μάθημα Διάστημα Εμπιστοσύνης του Μέσου

Κεφάλαιο 10 Εισαγωγή στην Εκτίμηση

1 Αριθμητική κινητής υποδιαστολής και σφάλματα στρογγύλευσης

ΑΝΑΛΥΣΗ ΔΙΑΚΥΜΑΝΣΗΣ. Επικ. Καθ. Στέλιος Ζήμερας. Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικά Χρηματοοικονομικά Μαθηματικά

Stochastic Signals Class Estimation Theory. Andreas Polydoros University of Athens Dept. of Physics Electronics Laboratory

Κεφάλαιο 9. Έλεγχοι υποθέσεων

Αριθμητική Ανάλυση και Εφαρμογές

X = = 81 9 = 9

5. ΤΟ ΓΕΝΙΚΟ ΓΡΑΜΜΙΚΟ ΜΟΝΤΕΛΟ (GENERAL LINEAR MODEL) 5.1 Εναλλακτικά μοντέλα του απλού γραμμικού μοντέλου: Το εκθετικό μοντέλο

Κεφάλαιο 9. Έλεγχοι υποθέσεων

ΑΠΟ ΤΟ ΔΕΙΓΜΑ ΣΤΟΝ ΠΛΗΘΥΣΜΟ

Τεχνικές Προβλέψεων Αυτοπαλινδρομικά Μοντέλα Κινητού Μέσου Όρου (ARIMA)

Συνολοκλήρωση και VAR υποδείγματα

Διαχείριση Υδατικών Πόρων

Ανάλυση και Πρόβλεψη Χρονοσειρών

Ανάλυση Διασποράς Ανάλυση Διασποράς διακύμανση κατά παράγοντες διακύμανση σφάλματος Παράδειγμα 1: Ισομεγέθη δείγματα

Τίτλος Εργασίας: Η χρήση της μεθοδολογίας Box Jenkins στην ανάλυση χρονοσειρών

ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ. Παπάνα Αγγελική

ΔΙΑΣΤΗΜΑΤΑ ΕΜΠΙΣΤΟΣΥΝΗΣ

ΕΛΕΓΧΟΣ ΒΙΟΜΗΧΑΝΙΚΩΝ ΔΙΕΡΓΑΣΙΩΝ ΚΕΦΑΛΑΙΟ 4 ΚΕΦΑΛΑΙΟ 5. ΑΝΑΓΝΩΡΙΣΗ ΔΙΕΡΓΑΣΙΑΣ ΠΡΟΣΑΡΜΟΣΤΙΚΟΣ ΕΛΕΓΧΟΣ (Process Identifications)

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 2 Μαΐου /23

x y max(x))

Transcript:

Χρονοσειρές, Μέρος Β Πρόβλεψη Χρονικών Σειρών Ο βασικός σκοπός της μελέτης των μοντέλων για χρονικές σειρές (όπως AR, MA, ARMA, ARIMA, SARIMA) είναι η πρόβλεψη (predicio, forecasig) Η πρόβλεψη των μελλοντικών τιμών μιας παρατηρούμενης χρονοσειράς είναι σημαντικό πρόβλημα για πολλές εφαρμογές Ενδεικτικά αναφέρονται δύο παραδείγματα: Δείκτης κι όγκος συναλλαγών Χρηματιστηρίου Αξιών Αθηνών (ΧΑΑ) Για ευνόητους λόγους η πρόβλεψη χρηματιστηριακών δεικτών, όπως ο δείκτης κι ο όγκος συναλλαγών ΧΑΑ, έχει μεγάλο ενδιαφέρον 7 ASE idex, period 985 7 ASE idex, period close idex 6 5 4 3 85 87 9 9 95 97 years close idex 6 5 4 3 3 4 5 6 mohs 5 x 6 ASE volume, period 985 x 5 ASE volume, period 8 volume 5 volume 6 4 5 8 6 85 87 9 9 95 97 years 4 3 4 5 6 mohs Ηλιακές κηλίδες Ο αριθμός των ηλιακών κηλίδων επηρεάζει το κλίμα της γης γι αυτό κι έχει μεγάλη σημασία η πρόβλεψη του αριθμού των ηλιακών κηλίδων για τα επόμενα έτη Aual suspos, period 7 Aual suspos, period 96 umber of suspos 5 5 umber of suspos 5 5 7 75 8 85 9 95 years 96 97 98 99 years

Για να κάνουμε την πρόβλεψη χρησιμοποιούμε τις παρατηρήσεις μέχρι τη παρούσα χρονική στιγμή Θεωρώντας την παρατηρούμενη χρονοσειρά { x, x, x } από μια στοχαστική διαδικασία { X }, το πρόβλημα που μελετάμε είναι η πρόβλεψη της χρονοσειράς για χρονικά βήματα μπροστά από τη χρονική στιγμή, που συμβολίζεται x (), ενώ η πραγματική αλλά άγνωστη σε εμάς τιμή στη χρονική στιγμή + είναι x + Το σφάλμα πρόβλεψης (predicio error) είναι e( ) = x+ x( ) () Με αναφορά στη στοχαστική διαδικασία { X }, η πρόβλεψη X () είναι η εκτίμηση του στοιχείου X + της { X } με βάση τα προηγούμενα στοιχεία της { X }, δηλαδή η βέλτιστη πρόβλεψη είναι X ( ) = E( X + X, X, ) Επιθυμητές ιδιότητες καλής εκτίμησης, δηλαδή καλής πρόβλεψης εδώ, είναι: η αμεροληψία (ubiasedess) ( X ( ) ) = X + E, η αποτελεσματικότητα (efficiecy), δηλαδή η μικρή διασπορά λάθους Var ε ( ) Var X X ( ) = + πρόβλεψης ( ) ( ) Συνδυάζοντας τις δύο παραπάνω ιδιότητες, ενδιαφερόμαστε για την πρόβλεψη εκείνη που ελαχιστοποιεί το μέσο τετραγωνικό σφάλμα πρόβλεψης E( X X ( ) ) ) + για κάθε βήμα πρόβλεψης [Ποια είναι η σχέση των τριών ιδιοτήτων;] Για να αξιολογήσουμε την απόδοση ενός μοντέλου πρόβλεψης σε μια χρονοσειρά για χρονικά βήματα μπροστά υπολογίζουμε κάποιο μέτρο που συγκεντρώνει τα σφάλματα πρόβλεψης για έναν ικανοποιητικό αριθμό χρονικών στιγμών Κάνουμε λοιπόν προβλέψεις για χρονικά βήματα μπροστά σε έναν αριθμό γνωστών παρατηρήσεων για χρόνους +,+,+l, δηλαδή υπολογίζουμε τα x ( ), x ( ), x ( ) Έχοντας τις αντίστοιχες πραγματικές τιμές + + l x, x, x υπολογίζουμε τα σφάλματα πρόβλεψης για χρονικά βήματα + + + + l μπροστά e( ), e+ ( ), e+ l ( ) Υπάρχουν διάφορα στατιστικά μέτρα που συγκεντρώνουν τα σφάλματα πρόβλεψης, όπως η εκτίμηση του μέσου τετραγωνικού σφάλματος (mea square error, mse) [Πως;] l mse( ) = e ( ) = x x ( ) l + l + + + l ( ) j j+ j Συχνά χρησιμοποιείται η ρίζα του μέσου τετραγωνικού σφάλματος (roo mea square error, rmse) l rmse( ) = e ( ) = x x ( ) l + l + + + l ( ) j j+ j () Ένα χρήσιμο μέτρο σφάλματος πρόβλεψης όταν θέλουμε να συγκρίνουμε μοντέλα πρόβλεψης σε διαφορετικές χρονοσειρές είναι η κανονοικοποίηση του rmse (ormalied roo mea square error, rmse) διαιρώντας το rmse με τη δειγματική τυπική απόκλιση των παρατηρήσεων της χρονοσειράς (ή πιο σωστά των παρατηρήσεων που χρησιμοποιούνται στο σχηματισμό των σφαλμάτων)

rmse( ) = l + l + + ( x j+ xj( ) ) l l + ( xj+ x) όπου x είναι η δειγματική μέση τιμή των x+, x++, x+ l Τιμές του rmse κοντά στο δηλώνουν πολύ καλή πρόβλεψη ενώ τιμές του rmse κοντά γύτω από το δηλώνουν ότι η πρόβλεψη είναι τόσο καλή όσο αν προβλέπαμε με τη μέση τιμή [Γιατί;] Στη συνέχεια, θα κάνουμε μια σύντομη ανασκόπηση κάποιων απλών τεχνικών πρόβλεψης και θα μελετήσουμε την πρόβλεψη με ARIMA μοντέλα (συμπεριλαμβάνοντας φυσικά τα μοντέλα AR, MA και ARMA) Για ευκολία, θα χρησιμοποιήσουμε καταχρηστικά συμβολισμούς που αναφέρονται στο δείγμα, όπως x, για να συμβολίσουμε επίσης τις μεταβλητές, πχ X, όταν θέλουμε να δώσουμε γενικές σχέσεις για τις προβλέψεις και τα σφάλματα πρόβλεψης Απλές τεχνικές πρόβλεψης Αιτιοκρατική τάση (deermiisic red) Ξεκινώντας με την πιο απλή περίπτωση, υποθέτουμε πως η πληροφορία στη χρονοσειρά δίνεται μόνο από χρονικές τάσεις (reds), που είτε τις γνωρίζουμε ή τις εκτιμούμε, δηλαδή x = μ +, (3) όπου μ είναι μια αιτιοκρατική συνάρτηση του χρόνου (τάση) και είναι ο λευκός θόρυβος Η πρόβλεψη γίνεται με την επέκταση (exrapolaio) του αιτιοκρατικού όρου σε μελλοντικούς χρόνους, δηλαδή η πρόβλεψη του x + είναι x ( ) = E μ + x, x, x = μ [Γιατί;] (4) Το σφάλμα πρόβλεψης είναι διασπορά σ ( ) + + + e ) = + ( [Γιατί;] Άρα e () είναι λευκός θόρυβος με Επέκταση καθολικών τάσεων (exrapolaio of global reds) Μια εύκολη προσαρμογή της συνάρτησης αιτιοκρατικής τάσης καθολικά (σε όλη τη χρονοσειρά) μπορεί να γίνει με πολυώνυμο κάποιας τάξης m, m p () = c + c+ + c (5) m Πολλών ειδών καμπύλες μπορεί να προσαρμόζουν καλά στα δεδομένα, όπως οι πολυωνυμικές καμπύλες όταν το m είναι μεγάλο, αλλά δίνουν πολύ διαφορετικές προβλέψεις όταν επεκτείνονται σε μελλοντικά χρονικά βήματα Στην πράξη, τέτοιες προβλέψεις είναι γενικά φτωχές Ειδικά, τα πολυώνυμα υψηλής τάξης, ξεφεύγουν γρήγορα προς το συν ή πλην άπειρο όταν επεκτείνονται έξω από το διάστημα παρατήρησης για το οποίο έγινε η εκτίμηση των παραμέτρων τους Επέκταση τοπικών τάσεων (exrapolaio of local reds) Ένας τρόπος για να βελτιώσουμε την απόδοση της επέκτασης τάσης είναι να κάνουμε την προσαρμογή του μοντέλου, όπως αυτό της (3), χρησιμοποιώντας μόνο m 3

τις σχετικά πρόσφατες παρατηρήσεις Με αυτόν τον τρόπο αποφεύγουμε την επίδραση των παλαιών παρατηρήσεων στην εκτίμηση του μοντέλου πρόβλεψης Αυτό βελτιώνει τα μοντέλα πρόβλεψης που δίνονται ως συναρτήσεις του χρόνου Για χρονικές σειρές με αιτιοκρατικό εποχικό όρο, x = s +, ή με αιτιοκρατικό εποχικό όρο και αιτιοκρατική τάση, x = μ + s +, η πρόβλεψη γίνεται κατά τον ίδιο τρόπο, δηλαδή επεκτείνοντας σε μελλοντικούς χρόνους τους αιτιοκρατικούς όρους που εκτιμούμε με κάποια συνάρτηση του χρόνου Εκθετική ομαλοποίηση Ένας άλλος απλός τρόπος πρόβλεψης είναι να εκτιμήσουμε το x + από το σταθμισμένο άθροισμα των προηγούμενων παρατηρήσεων της χρονοσειράς x ( ) = c x + c x + + c x = c x, (6) j j όπου οι συντελεστές c j είναι τα βάρη με c = j Είναι φυσικό να θέλουμε να δώσουμε περισσότερο βάρος στις πρόσφατες παρατηρήσεις και να διαλέξουμε να φθίνουν τα βάρη πηγαίνοντας πίσω στο χρόνο, c c c Μια τέτοια επιλογή των βαρών είναι j c = α( α), j =,,, < α <, (7) j όπου δε χρειάζεται να ορίσουμε το κάθε c j ξεχωριστά παρά μόνο το α Τα βάρη αυτά φθίνουν εκθετικά κι η επιλογή του α ορίζει πόσο γρήγορα φθίνουν (αν α ουσιαστικά μόνο οι πολύ πρόσφατες παρατηρήσεις χρησιμοποιούνται για την πρόβλεψη) Για να ενημερώσουμε την πρόβλεψη χρονικών βημάτων κάθε φορά που μια νέα παρατήρηση είναι διαθέσιμη μπορούμε να χρησιμοποιήσουμε την αναδρομική σχέση x ( ) = α x + ( α) x ( ) [Πως προκύπτει;] (8) + + Πρόβλεψη στάσιμων χρονικών σειρών με γραμμικά μοντέλα Πρώτα θα θεωρήσουμε ότι η χρονοσειρά για την οποία θέλουμε να κάνουμε προβλέψεις είναι στάσιμη, ή την έχουμε κάνει στάσιμη με κάποια από τις μεθόδους που μελετήσαμε σε προηγούμενο κεφάλαιο Τα γραμμικά μοντέλα που στάσιμων χρονικών σειρών που μελετήσαμε είναι τα μοντέλα AR, MA και ARMA Θα χρησιμοποιήσουμε αυτά τα μοντέλα για να κάνουμε προβλέψεις Παρακάτω θα θεωρήσουμε επίσης πως η χρονοσειρά έχει μέση τιμή (ώστε να αποφύγουμε την ύπαρξη σταθερού όρου στα μοντέλα πρόβλεψης) Πρακτικά αυτό γίνεται αφαιρώντας τη δειγματική μέση τιμή των παρατηρήσεων της χρονοσειράς από την κάθε παρατήρηση Για να σχηματίσουμε την πραγματική πρόβλεψη που αφορά την παρατηρούμενη μεταβλητή, προσθέτουμε τη δειγματική μέση τιμή στην προβλεπόμενη τιμή από το μοντέλο Πρόβλεψη με αυτοπαλινδρομούμενα μοντέλα (AR) AR() μοντέλο Ας αρχίσουμε με το πιο απλό γραμμικό αυτοπαλινδρομούμενο μοντέλο, το AR() x = φ x + (9) 4

Για την πρόβλεψη της επόμενης χρονικής στιγμής όταν γνωρίζουμε τη χρονοσειρά ως τη χρονική στιγμή, έχουμε από την υπόθεση του AR() μοντέλου x = φ x + () + + Η βέλτιστη πρόβλεψη ενός χρονικού βήματος όταν δίνεται { x, x, x είναι x () = φ x [Γιατί;] () Για δύο χρονικά βήματα εμπρός έχουμε x+ = φ x+ + + Αντικαθιστώντας το x + με την πρόβλεψη x () και χρησιμοποιώντας την () παίρνουμε x ( ) = φ x () = φ x Επαναλαμβάνοντας αυτή τη διαδικασία βρίσκουμε ότι η πρόβλεψη για χρονικά βήματα είναι x ( ) = φ x () Το σφάλμα πρόβλεψης για ένα χρονικό βήμα είναι e ( ) = +, δηλαδή το e () είναι λευκός θόρυβος με μηδενική μέση τιμή και διασπορά σ Για χρονικά βήματα η διασπορά του σφάλματος γίνεται φ Var ( e( ) ) = σ [Γιατί;] (3) φ AR(p) μοντέλο Υποθέτουμε πως η παρατηρούμενη χρονοσειρά { x, x, είναι η πραγματοποίηση μιας διαδικασίας AR(p), ή πιο ρεαλιστικά, πιστεύουμε πως το μοντέλο AR(p) εξηγεί ικανοποιητικά τη χρονοσειρά Το μοντέλο AR(p) για το x + είναι + p p+ + x = φ x + + φ x + (4) Η βέλτιστη πρόβλεψη ενός χρονικού βήματος, x (), με βάση τη σειρά { x, x, είναι x x() = φx + + φpx p+ (5) και το αντίστοιχο σφάλμα πρόβλεψης είναι e ( ) = + [Γιατί;] Παρατηρούμε ότι η πρόβλεψη του x + είναι το αιτιοκρατικό μέρος του AR μοντέλου Γενικά για χρονικά βήματα η πρόβλεψη είναι x ( ) = φ x ( ) + + φ x ( p), (6) p όπου κάθε τιμή x ( j) είναι γνωστή είτε από προηγούμενη πρόβλεψη ή απευθείας από τη χρονοσειρά, δηλαδή για j > το x ( j) είναι μια από τις προβλέψεις x ( ), x (), x ( ) που έχουν προηγηθεί και για j είναι x j) = x + { x, x, x } Η πρόβλεψη συνίσταται και πάλι στο αιτιοκρατικό ( j μέρος του AR μοντέλου για το x +, όπου οι άγνωστες παρατηρήσεις (ή θεωρητικά μεταβλητές) x +, x+, x+ έχουν αντικατασταθεί από τις αντίστοιχες προβλέψεις Το σφάλμα πρόβλεψης για χρονικά βήματα δίνεται ως γραμμικός συνδυασμός των στοιχείων του λευκού θορύβου στους χρόνους +, + e ( ) = b, (7) j + j x 5

όπου κάθε b j ορίζεται από τις παραμέτρους του μοντέλου (b =) [Πως;] Έτσι λοιπόν το e () έχει μηδενική μέση τιμή [Γιατί;] και διασπορά σ bj ( e ) Var ( ) = (8) Από την παραπάνω διασπορά πρόβλεψης μπορούν να σχηματιστούν όρια πρόβλεψης (predicio bouds, olerace iervals) για δεδομένο επίπεδο σημαντικότητας α x ( ) ± c Var e ( ), (9) α / ( ) όπου c α / είναι κατάλληλη κρίσιμη τιμή Για παράδειγμα, αν ~ Ν (, σ ) τότε το c α / είναι η κρίσιμη τιμή της τυπικής κανονικής κατανομής, δηλαδή για το 95% διάστημα πρόβλεψης θα χρησιμοποιήσουμε το c5 = 975 = 96 Πρόβλεψη με μοντέλα μέσου όρου (MA) ΜΑ() μοντέλο Το μοντέλο MA() για χρόνο + είναι + + x = + θ () Για να βρούμε την πρόβλεψη για ένα ή περισσότερα χρονικά βήματα χρησιμοποιούμε ότι η τυχαία μεταβλητή είναι ανεξάρτητη του x για χρόνους μικρότερους του και έτσι έχουμε αν j E ( j x, x, > + ) = + j αν j () και η πρόβλεψη είναι θ για = x ( ) = για > [Γιατί;] () Το σφάλμα πρόβλεψης είναι + για = e ( ) = x+ για > (3) Παρατηρούμε πως όλες οι προβλέψεις για χρόνους μεγαλύτερους του είναι Γενικά οι προβλέψεις για χρόνους μεγαλύτερους από την τάξη του ΜΑ μοντέλου είναι, όπως δίνεται παρακάτω ΜΑ(q) μοντέλο Θεωρώντας το MA(q) μοντέλο για τη χρονοσειρά { x, x, παρατήρηση δίνεται ως + + q q+ x, η επόμενη x = + θ + + θ (4) Η βέλτιστη πρόβλεψη ενός βήματος x ( ) είναι x() = θ + + θq q+ (5) και το αντίστοιχο σφάλμα πρόβλεψης είναι e ( ) = + [Γιατί;] Γενικά για χρονικά βήματα η πρόβλεψη είναι 6

θ + θ+ + + θq q+ αν q x( ) = (6) αν > q Το σφάλμα της πρόβλεψης των βημάτων είναι όπως και για το AR μοντέλο για p αν αντικαταστήσουμε τα b j με τα θ j (δες (7) και (8)) Τα σφάλματα,,, μπορούν να υπολογιστούν από τις παρατηρήσεις x, x, x όπου οι αρχικές τιμές,,, q είναι Ειδικότερα για να βρούμε τα q+, q+,, λύνουμε την εξίσωση του MA(q) για =q ως προς q+ (δηλαδή εδώ είναι q+ = xq+ [Γιατί;] ) και συνεχίζουμε με τον ίδιο τρόπο για χρόνους = q+, 3 Πρόβλεψη με αυτοπαλινδρομούμενα μοντέλα μέσου όρου (ARMA) Θεωρώντας το ARMA(p,q) μοντέλο για τη χρονοσειρά { x, x, παρατήρηση δίνεται ως + p p+ + q q+ x, η επόμενη x = φ x + + φ x + + θ + + θ (7) Η βέλτιστη πρόβλεψη για ένα χρονικό βήμα όταν δίνονται τα { x, x, είναι x () = φ x + + φ x + θ + + θ (8) p p+ q q+ και το σφάλμα της πρόβλεψης είναι e ( ) = + Γενικά για χρονικά βήματα η βέλτιστη πρόβλεψη είναι φ x( ) + + φpx( p) + θ + + θq q+ αν q x( ) = (9) φ x( ) + + φpx( p) αν > q Η πρόβλεψη με ARMA μοντέλο είναι η σύνθεση των προβλέψεων με το AR μέρος και το MA μέρος (δες (6) και (6)) 3 Πρόβλεψη μη-στάσιμων χρονικών σειρών με γραμμικά μοντέλα Οι προβλέψεις στη χρονοσειρά που κάναμε στάσιμη από μια μη-στάσιμη χρονοσειρά θα πρέπει να μετασχηματιστούν κατάλληλα για να αναφέρονται στην αρχική χρονοσειρά Όταν λοιπόν η χρονοσειρά δεν είναι στάσιμη για να εφαρμόσουμε την πρόβλεψη με τα μοντέλα της προηγούμενης παραγράφου πρέπει να κάνουμε τα εξής βήματα: να μετασχηματίσουμε τη χρονοσειρά σε στάσιμη : μη-στάσιμη x } { y } στάσιμη, { να κάνουμε την πρόβλεψη του y + με κάποιο μοντέλο, πχ AR, έστω y (), 3 να μετασχηματίσουμε την πρόβλεψη y () για την στάσιμη χρονοσειρά στην πρόβλεψη x () για την αρχική μη-στάσιμη χρονοσειρά Στη συνέχεια θα δούμε πως εφαρμόζονται τα παραπάνω βήματα Υποθέτουμε πως x, x, x δεν είναι στάσιμη Το κλασικό μοντέλο για το x είναι x = μ + s + y, (3) η χρονοσειρά { } x 7

όπου μ είναι η συνάρτηση τάσης, s είναι η περιοδική ή εποχική συνάρτηση και y είναι μια στάσιμη χρονοσειρά απαλλαγμένη από τάσεις και περιοδικότητες Τυπικά μοντέλα για τη χρονοσειρά { y, y, y } είναι τα μοντέλα AR, MA και ARMA Σκοπός μας είναι, δοθέντων των { x, x,, να βρούμε την πρόβλεψη για ένα χρονικό βήμα ή γενικά για χρονικά βήματα μπροστά, δηλαδή να προβλέψουμε το x + που ορίζεται ως x x = μ + s + y (3) + + + + Αν διαλέξουμε να εκτιμήσουμε τα μ και s ως συναρτήσεις του χρόνου (πχ να προσαρμόσουμε στο μ ένα πολυώνυμο, δες (5)), τότε μπορούμε να επεκτείνουμε τις εκτιμήσεις στο χρόνο + για να βρούμε τα μ + και s + Σ αυτήν την περίπτωση, αφαιρούμε από τις τιμές x, x, x, τις εκτιμήσεις της τάσης και περιοδικότητας και προκύπτουν οι τιμές των y, y, y (πρώτο βήμα) Στη συνέχεια προβλέπουμε το y + με χρήση κάποιου μοντέλου τύπου AR, MA ή ARMA (δεύτερο βήμα) Η πρόβλεψη x () προκύπτει απευθείας από την πρόβλεψη y () και τις επεκτάσεις τάσης και περιοδικότητας μ + και s + (τρίτο βήμα) ως x ( ) = + s + y ( ) (3) μ + + Αν διαλέξουμε να απαλείψουμε τα μ και s χρησιμοποιώντας διαφορές τότε στην ουσία αυτή η πρόβλεψη με τα παραπάνω τρία βήματα είναι η πρόβλεψη με μοντέλα ARIMA ή SARIMA Οι γενικοί τύποι για τις προβλέψεις με αυτά τα μοντέλα είναι πολύπλοκοι αλλά κάποιος μπορεί να καταλάβει πως γίνεται η πρόβλεψη με ARIMA μοντέλο θεωρώντας το ARIMA(p,,q) Παίρνοντας τις πρώτες διαφορές με υστέρηση ένα, από την αρχική χρονοσειρά { x, x, x } προκύπτει η χρονοσειρά { y, y, 3 y }, όπου y = x x, σχηματίζοντας έτσι το πρώτο βήμα της διαδικασίας πρόβλεψης μη-στάσιμων χρονοσειρών Εφαρμόζοντας το μοντέλο ARMA(p,q) στην { y, y, 3 y } βρίσκουμε την πρόβλεψη για ένα χρονικό βήμα y () (δεύτερο βήμα) και η πρόβλεψη για την αρχική χρονοσειρά (τρίτο βήμα) είναι x () = x + y () [Γιατί;] (33) Το σφάλμα πρόβλεψης του x +, e (), είναι το ίδιο με το σφάλμα πρόβλεψης του y + [Γιατί;] Γενικά η πρόβλεψη για χρονικά βήματα είναι x ( ) = x ( ) + y ( ), (34) όπου y () είναι η πρόβλεψη του y + με το μοντέλο ARMA(p,q) και το x ( ) είναι γνωστό από την πρόβλεψη του x +- Για ARIMA(p,d,q) ή SARIMA(p,d,q)(P,D,Q) s η διαδικασία της πρόβλεψης του x + είναι παρόμοια, δηλαδή βρίσκουμε την πρόβλεψη y ( ) με μοντέλο τύπου ARMA και την προσθέτουμε στην κατάλληλη έκφραση των τελευταίων παρατηρήσεων x, x,, σύμφωνα με τις τιμές των d και D Η πρόβλεψη για χρονικά βήματα μπορεί να υπολογισθεί αναδρομικά 8

Ασκήσεις Υπολογίστε την πρόβλεψη και τα όρια πρόβλεψης χρονοσειράς με το μοντέλο του τυχαίου περιπάτου Για μια χρονοσειρά με μέση τιμή μ = 8 εκτιμήθηκε μοντέλο AR() με παράμετρο φ = 5 και διασπορά λευκού κανονικού θορύβου σ = Έστω ότι είναι γνωστό ότι x = (α) Υπολογίστε την πρόβλεψη και τα 95% όρια πρόβλεψης για χρόνους +, +, +3 (β) Σχηματίστε το κατάλληλο διάγραμμα με τις προβλέψεις στο (α) Σχολιάστε πως περιμένετε να συνεχιστούν οι προβλέψεις και τα όρια πρόβλεψης για βήματα >+3 3 Για τα ίδια δεδομένα της άσκησης ( μ = 8, σ =, x = ), θεωρούμε το μοντέλο ΜΑ() με θ = 5 και = (α) Υπολογίστε την πρόβλεψη και τα 95% όρια πρόβλεψης για χρόνους +, +, +3 (β) Σχηματίστε το κατάλληλο διάγραμμα με τις προβλέψεις στο (α) Συγκρίνετε τις προβλέψεις με αυτές του AR() στην άσκηση 4 Για το δείκτη Dow-Joes (Αύγ 8 Δεκ 8, 97) εκτιμήθηκε το μοντέλο ARIMA(,,): ( 447B )( B) x = + 739, ~ WN(,455) για =,, 78 Οι τιμές του δείκτη Dow-Joes είναι για 57, x = 3469 και για 87, x = 5 Υπολογίστε την πρόβλεψη και τα 95% όρια πρόβλεψης του δείκτη για μια και δύο χρονικές στιγμές μπροστά 5 Υποθέτουμε το μοντέλο AR() με σταθερό όρο μ = 5, συντελεστές φ = 8 και φ = 8 και διασπορά λευκού κανονικού θορύβου σ = Υποθέτουμε επίσης ότι είναι γνωστές οι παρατηρήσεις x 99 = 74, x = 66 (α) Γράψτε το γενικό τύπο της πρόβλεψης βημάτων με αυτό το μοντέλο (β) Υπολογίστε την πρόβλεψη και τα 95% όρια πρόβλεψης των x, x και x 3 (β) Σχηματίστε το κατάλληλο διάγραμμα με τις προβλέψεις στο (α) Σχολιάστε πως περιμένετε να συνεχιστούν οι προβλέψεις και τα όρια πρόβλεψης των x 4, x 5 κτλ 6 Έστω το μοντέλο ARMA(,): x = + φ( x μ) + + θ μ, ~ WN(, σ ) (α) Υπολογίστε την πρόβλεψη και τα 95% όρια πρόβλεψης για χρονικές στιγμές μπροστά 9

(β) Για το παραπάνω μοντέλο εκτιμήθηκαν οι παράμετροι ως εξής: σ = 5, μ = 5, φ = και θ = 5 Αν x = 3 προβλέψτε το x +, το x + καθώς και το x + για πολύ μεγάλο 7 Θεωρούμε το μοντέλο ARIMA(,,) ( B ) x = ( + θb) (α) Γράψε τον τύπο που δίνει την πρόβλεψη για βήματα (β) Υπολόγισε τα 95% όρια πρόβλεψης για βήματα που δίνει αυτό το μοντέλο (γ) Για =, διερευνείστε τη σχέση του μοντέλου με το μοντέλο της εκθετικής ομαλοποίησης (δ) Το μοντέλο αυτό χρησιμοποιήθηκε για τη μοντελοποίηση της χρονοσειράς της συγκέντρωσης μιας ουσίας σε μια χημική διεργασία Η παράμετρος του ΜΑ μέρους εκτιμήθηκε ως θ = 7 και η διασπορά του θορύβου ως σ = Δίνονται οι παρατηρήσεις στις χρονικές στιγμές ως ως: 7, 66, 63, 6, 7, 69, 68, 74, 7, 7 Προβλέψτε τις επόμενες 5 προβλέψεις με τα αντίστοιχα 95% όρια πρόβλεψης, ξεκινώντας από τη χρονική στιγμή 8 (δηλαδή x8(), x8(),, x 8(5) ) και τη χρονική στιγμή (δηλαδή x(), x (),, x (5) ) Τι παρατηρείτε; (ε) Με βάση τις παραπάνω προβλέψεις, ποια είναι η διαφορά της πρόβλεψης με μοντέλο ARIMA(,,) από την πρόβλεψη με μοντέλο MA(); 8 Δίνονται οι παρατηρήσεις 7 - -5 7-9 6-3 - Θεωρούμε ότι οι παρατηρήσεις προέρχονται από μια AR διαδικασία με μέση τιμή και ο λευκός θόρυβος έχει κανονική κατανομή Προσαρμόστηκαν τα μοντέλα AR() και AR() στην παραπάνω χρονοσειρά και εκτιμήθηκαν οι παράμετροι τους: ˆ φ = 7 για το AR() και ˆ φ = 4, ˆ φ = 8 για το AR() (α) Επιλέξτε ένα από τα δύο μοντέλα χρησιμοποιώντας το κριτήριο AIC βοήθεια: κριτήριο AIC: AIC( p) = log( ˆ σ ) + p (β) Κάνετε προβλέψεις για τις χρονικές στιγμές 9 και με το καταλληλότερο μοντέλο (σημειακή εκτίμηση και 95% όρια πρόβλεψης) 9 Θεωρείστε το παρακάτω μοντέλο ( φb)( Bx ) =( + θ ), ~ Ν (, σ ) και είναι IID (α) Θεωρώντας ως αφετηρία πρόβλεψης τη χρονική στιγμή, βρείτε τη σημειακή πρόβλεψη βημάτων μπροστά x ( ) του x + (β) Βρείτε τη διασπορά του σφάλματος πρόβλεψης για ένα και δύο βήματα μπροστά