ΤΜΗΜΑΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥΣΧΕΔΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝΣΥΣΤΗΜΑΤΩΝ. ΤΕΧΝΙΚΕΣ ΠΡΟΒΛΕΨΕΩΝ& ΕΛΕΓΧΟΥ ΜΑΘΗΜΑ ΘΕΩΡΙΑΣ-ΣΤΑΣΙΜΕΣΔΙΑΔΙΚΑΣΙΕΣ-ΥΠΟΔΕΙΓΜΑΤΑ ARIMA (p,d,q)

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "ΤΜΗΜΑΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥΣΧΕΔΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝΣΥΣΤΗΜΑΤΩΝ. ΤΕΧΝΙΚΕΣ ΠΡΟΒΛΕΨΕΩΝ& ΕΛΕΓΧΟΥ ΜΑΘΗΜΑ ΘΕΩΡΙΑΣ-ΣΤΑΣΙΜΕΣΔΙΑΔΙΚΑΣΙΕΣ-ΥΠΟΔΕΙΓΜΑΤΑ ARIMA (p,d,q)"

Transcript

1 ΤΜΗΜΑΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥΣΧΕΔΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝΣΥΣΤΗΜΑΤΩΝ ΤΕΧΝΙΚΕΣ ΠΡΟΒΛΕΨΕΩΝ& ΕΛΕΓΧΟΥ ΜΑΘΗΜΑ ΘΕΩΡΙΑΣ-ΣΤΑΣΙΜΕΣΔΙΑΔΙΚΑΣΙΕΣ-ΥΠΟΔΕΙΓΜΑΤΑ ARIMA (p,d,q)

2 ΕΠΙΧ - Τεχνικές Προβλέψεων & Ελέγχου ιαφάνεια 1 ΥΠΟΔΕΙΓΜΑΤΑ ARIMA(p,d,q) Τα ολοκληρωμένα αυτοπαλινδρομικά μοντέλα κινητού μέσου όρου (AutoRegressive-Integrated-Moving Average) ARIMA(p,d,q) είναι στοχαστικά μαθηματικά μοντέλα με τα οποία προσπαθούμε να περιγράψουμε τη διαχρονική εξέλιξη κάποιου φυσικού μεγέθους. Δεδομένου ότι για την πλειοψηφία των φυσικών μεγεθών είναι αδύνατη η πλήρης γνώση και καταγραφή όλων των παραγόντων που επηρεάζουν την εξέλιξη τους στο χρόνο, είναι πολύ δύσκολη η διαχρονική περιγραφή του μεγέθους από ένα ντετερμινιστικό μοντέλο. Από την άλλη μεριά, η εξάρτηση τέτοιων μεγεθών από μη ντετερμινιστικούς παράγοντες(π.χ. καιρός, τυχαία γεγονότα) καθιστά δυνατή την περιγραφή της διαχρονικής τους εξέλιξης από ένα στοχαστικό μοντέλο, με το οποίο μπορεί να υπολογιστεί η πιθανότητα με την οποία η τιμή του μεγέθους βρίσκεται σε κάποιο διάστημα.. A L Yt a 0 ( ) = + Θ ( L ) ε t

3 ΕΠΙΧ - Τεχνικές Προβλέψεων & Ελέγχου ιαφάνεια 2 Υπόδειγµα ARIMA (p, d, q) Γενικά, έχουν αναπτυχθεί πολλά και ποικίλα τέτοια µοντέλα για την περιγραφή των διακυµάνσεων κάποιου µεγέθους µέσα στο χρόνο. Τα µοντέλα ARIMA χρησιµοποιούνται ευρύτατα γιατί βρίσκουν εφαρµογή στη µελέτη πολλών µεγεθών και φαίνεται να δίνουν µια "καλή" εικόνα της διαχρονικής τους συµπεριφοράς, καθώς και ικανοποιητικά αποτελέσµατα στην πρόβλεψη των µελλοντικών τιµών του µεγέθους.

4 ΕΠΙΧ - Τεχνικές Προβλέψεων & Ελέγχου ιαφάνεια 3 Μεθοδολογία ARIMA(p,d,q) Τα μοντέλα ARIMA έχουν μελετηθεί εκτεταμένα από τους Box και Jenkins, σε βαθμό που τα ονόματα των παραπάνω να είναι σχεδόν συνώνυμα με τις ARIMA διαδικασίες και τις εφαρμογές τους στην ανάλυση και την πρόβλεψη χρονοσειρών. Οι Box-Jenkins πρότειναν μια οικογένεια αλγεβρικών μοντέλων πρόβλεψης, από τα οποία μπορεί κάποιος να διαλέξει το "καταλληλότερο" για την πρόβλεψη μιας δεδομένης χρονοσειράς. Στα μοντέλα αυτά οι προβλέψεις βασίζονται αποκλειστικά στις παρελθούσες τιμές και τα εμφανισθέντα πρότυπα συμπεριφοράς της χρονοσειράς που εξετάζεται.

5 ΕΠΙΧ - Τεχνικές Προβλέψεων & Ελέγχου ιαφάνεια 4 ARIMA(p,d,q) Μέχρι τώρα ασχοληθήκαμε με στάσιμες στοχαστικές διαδικασίες πράγμα που σημαίνει ότι ο μέσος, η διακύμανση και οι αυτοδιακυμάνσεις δεν εξαρτώνται από το χρόνο. Μια απλή μορφή αυτοπαλίνδρομης διαδικασίας πρώτης τάξης μη στάσιμηςείναι: Yt= Yt-1+ εtόπουημεταβλητή εtείναιλευκός θόρυβος. Ηανωτέρωμορφήείναιγνωστήωςτυχαίοςπερίπατοςήτυχαία διαδρομή(random walk). Όταν υπάρχει σταθερός όρος είναι γνωστή ως τυχαία διαδρομή με περιπλάνηση(random walk with drift).yt= α+ Yt-1+ εt Μια στοχαστική διαδικασία που ακολουθεί την τυχαία διαδρομή δεν είναι στάσιμη ως προς τη διακύμανση. Αν υποθέσουμε ότι εt ακολουθεί κατανομή(μ,σ2) η στοχαστική διαδικασία που ακολουθεί την τυχαία διαδρομή δεν είναι στάσιμη ως προς τη διακύμανση και το μέσο. Αν πάρουμε τις πρώτες διαφορές της Yt η στοχαστική διαδικασία που ακολουθεί την τυχαία διαδρομή είναι στάσιμη.

6 ΕΠΙΧ - Τεχνικές Προβλέψεων & Ελέγχου ιαφάνεια 5 ARIMA(p,d,q) Οι περισσότερες από τις χρονολογικές σειρές(οικονομικού ή φυσικού περιεχομένου) δεν έχουν χαρακτηριστικά στάσιμων διαδικασιών. Μπορούν όμως να μετατραπούν σε στάσιμες παίρνοντας τις πρώτες ή τις δεύτερες κ.λ.πδιαφορές. Αυτό είναι αναγκαίο για να αποφύγουμε το πρόβλημα της φαινομενικής ή νόθου παλινδόμησης(spurious regression). Όταν μια σειρά μετατρέπεται σε στάσιμη παίρνοντας τις πρώτες διαφορές λέμεότιησειράείναιολοκληρωμένηπρώτηςτάξης(integratedfirstorder) καισυμβολίζεταιμει(1). Αν η σειρά μετατρέπεται σε στάσιμη παίρνοντας τις δεύτερες διαφορές λέμε ότι η σειρά είναι ολοκληρωμένη δεύτερης τάξης και συμβολίζεται με Ι(2).

7 ΕΠΙΧ - Τεχνικές Προβλέψεων & Ελέγχου ιαφάνεια 6 ARIMA(p,d,q) Ανησειράμετατρέπεταισεστάσιμηπαίρνονταςτιςd διαφορέςλέμεότιη σειρά είναι ολοκληρωμένη d τάξης και συμβολίζεται με Ι(d). Κάθε στάσιμη σειρά θεωρείται ολοκληρωμένη μηδενικής τάξης δηλαδή Ι(0). Ανορισθεί οτελεστήςτωνδιαφορώνδωςεξής: Δ= 1-L ο τελεστήςτωνπρώτωνδιαφορών Δ2 = (1-L)2 ο τελεστήςτωνδεύτερωνδιαφορών. Δd= (1-L)d ο τελεστήςτωνd διαφορών

8 ΕΠΙΧ - Τεχνικές Προβλέψεων & Ελέγχου ιαφάνεια 7 ARIMA(p,d,q) Ένα υπόδειγμα ARMΑ(p, q) που εφαρμόζεται σε μια ολοκληρωμένη σειρά d τάξης ονομάζεται αυτοπαλίνδρομο ολοκληρωμένο υπόδειγμα κινητού μέσου τάξης(p,d,q) (Autoregressive Integrated Moving Average) και συμβολίζεται ως ARIMA (p,d,q). (Όπου p συμβολίζει τους όρους του αυτοπαλίνδρομου υποδείγματος, q τους όρους του υποδείγματος των κινητών μέσων). Για παράδειγμα ARIMA (2,1,1) σημαίνει ότι η σειρά καθίσταται στάσιμη με τις πρώτες διαφορές και στην προκύπτουσα σειρά των πρώτων διαφορών εφαρμόζεται το ARMA (2,1). Η τάξη του ARIMA (p,d,q) προσδιορίζεται με τη μεθοδολογία των Box Jenkins.

9 ΕΠΙΧ - Τεχνικές Προβλέψεων & Ελέγχου ιαφάνεια8 Box-Jenkins Methodology Η μεθοδολογία Box-Jenkins για την ανάλυση χρονολογικών σειρών περιλαμβάνει τρία στάδια: 1) Ταυτοποίηση 2) Εκτίμηση και Διαγνωστικός Έλεγχος 2α)Έλεγχος Καταλοίπων 2β) Έλεγχος Τάξεως Υποδείγματος 2γ) Κριτήρια Επιλογής Υποδείγματος 3) Προβλέψεις.

10 ΕΠΙΧ - Τεχνικές Προβλέψεων & Ελέγχου ιαφάνεια 9 Ταυτοποίηση (Identification) Η ταυτοποίηση περιλαμβάνει τον καθορισμό των τιμών p,d και q. Αρχικά περιλαμβάνει τον καθορισμό του αριθμού d των διαφορών που χρησιμοποιούμε για να μετατραπεί μια διαδικασία σε στάσιμη εάν αυτή δεν είναι. Έπειτα πρέπει να καθοριστεί η τάξη(p) της αυτοπαλίνδρομης διαδικασίας και η τάξη (q) της διαδικασίαςκινητούμέσου.

11 ΕΠΙΧ - Τεχνικές Προβλέψεων & Ελέγχου ιαφάνεια 10 Εκτίμηση(Estimation) Το στάδιο της εκτίμησης περιλαμβάνει την εκτίμηση των p παραμέτρων της AR διαδικασίας όπως και των q παραμέτρων της διαδικασίας MA. Παράλληλη με την στατιστική συνάρτηση Q των Box-Pierce ελέγχεται η από κοινού σημαντικότητα ενός αριθμού συντελεστών αυτοσυσχετίσεως. Από την άλλη διενεργείται και έλεγχος της τάξεως συγκρίνοντας το υπόδειγμα με άλλο μεγαλύτερης τάξεως. (Κριτήρια AIC,SBC).

12 ΕΠΙΧ - Τεχνικές Προβλέψεων & Ελέγχου ιαφάνεια 11 Προβλέψεις (Forecasting) Ο κύριος σκοπός της εξειδίκευσης και εκτιμήσεως ενός υποδείγματος ARIMA είναι η διενέργεια προβλέψεων σε βραχυχρόνια περίοδο. Με βάση λοιπόν το εκτιμώμενο υπόδειγμα και τις υπάρχουσες πληροφορίες μέχρι την περίοδο Τ,είναι δυνατόν να προβλέψουμε την τιμή της μεταβλητής μας την περίοδο Τ+1, Τ+2 κ.τ.λ.

13 ΕΠΙΧ - Τεχνικές Προβλέψεων & Ελέγχου ιαφάνεια 12 Μερικάκριτήριαεπιλογήςυποδειγμάτων Τα κριτήρια αυτά είναι χρήσιμα για επιλογή υποδειγμάτων, και σύγκριση προβλέψεων Τοκριτήριοτου Akaike(AIC): 2 lnaic ln RSS k = + N N Συγκρίνοντας δυο υποδείγματα με το κριτήριο AIC, επιλέγεται εκείνο γιατοοποίοητιμήτουκριτηρίουτουaicείναιημικρότερη. RSS k lnsic = ln + ln( N) N N Το κριτήριο του Schwarz(SIC): Συγκρίνοντας δυο υποδείγματα με το κριτήριο SIC, επιλέγεται εκείνο για το οποίο η τιμή του κριτηρίου του SIC είναι η μικρότερη.

14 ΕΠΙΧ - Τεχνικές Προβλέψεων & Ελέγχου ιαφάνεια 13 ΕΚΤΙΜΗΣΗARIMA ΥΠΟΔΕΙΓΜΑΤΟΣ Εκτιμούμετιςp παραμέτρους α1, α2,.., αp, τηςar διαδικασίας και τις q παραμέτρους θ1, θ2,.,θq της AM διαδικασίας. Αν έχουμε να εκτιμήσουμε μόνο το AR υπόδειγμα εφαρμόζουμε την μέθοδο των ελαχίστων τετραγώνων OLS. Ανησειράπεριέχεικαιόρουςκινητούμέσου(ΜΑ) τότεγιατην εκτίμηση των αντιστοίχων παραμέτρων χρησιμοποιούνται μη γραμμικές μέθοδοι.

15 ΕΠΙΧ - Τεχνικές Προβλέψεων & Ελέγχου ιαφάνεια 14 ΑΞΙΟΛΟΓΗΣΗARIMA ΥΠΟΔΕΙΓΜΑΤΟΣ Ελέγχεται η καταλληλότητα του υποδείγματος ARIMA δηλαδή πόσο καλά ταιριάζει στα δεδομένα μας. Ο έλεγχος της καταλληλότητας του υποδείγματος ARIMA περιλαμβάνει: τους στατιστικούς ελέγχους της σημαντικότητας των συντελεστών, την συμπεριφορά των καταλοίπων, την τάξη του υποδείγματος, τηνπροβλεπτικήτουικανότητα. Η συμπεριφορά των καταλοίπων αφορά το γεγονός εάν το υπόδειγμα ARIMA ταιριάζει στα δεδομένα μας θα πρέπει τα κατάλοιπα να συμπεριφέρονται ως μια διαδικασία λευκού θορύβου. Αυτό σημαίνει ότι τα κατάλοιπα δεν θα πρέπει να αυτοσυσχετίζονται.

16 ΕΠΙΧ - Τεχνικές Προβλέψεων & Ελέγχου 15 ιαφάνεια Έλεγχοι στασιµότητας Έλεγχος του Bartlett (Bartlett Test), Q Στατιστική (Box Pierce Test), Στατιστική των Ljung Box (Ljung Box Statistic) Έλεγχοι µοναδιαίας ρίζας (unit root test) (εκτός παρούσας ύλης)

17 ΕΠΙΧ - Τεχνικές Προβλέψεων & Ελέγχου ιαφάνεια 16 ΤΑΞΗARIMA ΥΠΟΔΕΙΓΜΑΤΟΣ Η καταλληλότητα του εκτιμώμενου υποδείγματος ελέγχεται με ένα άλλο υπόδειγμα μεγαλύτερης τάξης. Δηλαδή το εκτιμώμενο υπόδειγμα ARIMA (p, d, q) συγκρίνεται με τα υποδείγματα ARIMA (p+1, d, q) και ARIMA (p, d, q+1). Αν το υπόδειγμα που εκτιμήθηκε περιγράφει τη διαδικασία που παρήγαγε τα δεδομένα, οι επιπλέον συντελεστές στα μεγαλύτερα υποδείγματα δεν θα πρέπει να είναι στατιστικά σημαντικοί(διάφοροι του μηδενός). Χρησιμοποιούνται τα κριτήρια AIC-SBC.

18 ΕΠΙΧ - Τεχνικές Προβλέψεων & Ελέγχου ιαφάνεια 17 ΠΡΟΒΛΕΠΤΙΚΗΙΚΑΝΟΤΗΤΑ ARIMA ΥΠΟΔΕΙΓΜΑΤΟΣ Έστω το υπόδειγμα ARΜΑ(1,1) το οποίο είναι προς εκτίμηση από Τ παρατηρήσεις: Yt= δ+ α1 Yt 1+ εt + θ1 εt 1 Για πρόβλεψη h=1 περίοδο μπροστά από την τελευταία Τ παρατήρηση έχουμε: YT+1 = δ+ α1 YΤ+ θ1ετ Με διακύμανση του σφάλματος πρόβλεψης: V(εT+1) = σ2 Ακολουθώντας την ίδια διαδικασία βρίσκουμετιςπροβλέψειςγιαδύο, τρειςήγιαh περιόδους μπροστά από την τελευταία Τ παρατήρηση. [Καθώς όμως η περίοδος πρόβλεψης μεγαλώνει το όριο της πρόβλεψης συγκλίνει προς τον μέσο].

19 ΕΠΙΧ - Τεχνικές Προβλέψεων & Ελέγχου ιαφάνεια 18 Αξιολόγηση Προβλέψεων Κριτήριο της Μέσης Απόλυτης Απόκλισης (Mean Absolute Deviation (MAD)) : 1. Υπολογισµός της απόλυτης διαφοράς µεταξύ προβλέψεων και πραγµατικών τιµών 2. Εύρεση της µέσης τιµής της διαφοράς. Κριτήριο του Μέσου Τετραγωνικού Λάθους (Mean Squared Error (MSE)) : 1. Υπολογισµός του τετραγώνου της διαφοράς µεταξύ προβλέψεων και πραγµατικών τιµών. 2. Εύρεση της µέσης τιµής της διαφοράς

20 ΕΠΙΧ - Τεχνικές Προβλέψεων & Ελέγχου ιαφάνεια 18a Παράδειγµα Προβλέψεις Τιµές Απόλυτη Τετραγωνικό Απόκλιση Λάθος Σύνολα MAD=42/5 = 8.4 MSE=342/5 = 68.4

21 ΕΠΙΧ - Τεχνικές Προβλέψεων & Ελέγχου ιαφάνεια 19 Α. Ρίζα του µέσου του τετραγώνου του σφάλµατος (Root Mean Square Error - RMSE) RMSE M M f a 2 2 ( Yt Y ) t ( εt ) t = 1 t = 1 = = N N Y t f Y t α = προβλεπόµενη τιµή = παρατηρούµενη τιµή N = αριθµός χρονικών περιόδων MSE = M t= 1 ( ε ) N t 2 MSE

22 ΕΠΙΧ - Τεχνικές Προβλέψεων & Ελέγχου ιαφάνεια 20 Β. Μέσο Απόλυτο Σφάλµα (Mean Absolute Error - ΜΑΕ) M MAE = 1 N t= 1 f Y t Y a t Γ. Μέσο Απόλυτο Ποσοστιαίο Σφάλµα (Mean Absolute Percentage Error - ΜΑPE) M 1 MAPE = N t= 1 Y f t Y Y a t a t

23 ΕΠΙΧ - Τεχνικές Προβλέψεων & Ελέγχου ιαφάνεια 21 Συντελεστής Ανισότητας του Theil (Theil s Inequality Coefficient) T h eil U = R M S E t M = 1 a ( Y ) N Αν Theil = 0 οι προβλεπόµενες τιµές συµπίπτουν απολύτως µε τις πραγµατικές. Αν Theil > 1 οι προβλέψεις είναι πολύ κακές. Αν Theil = 1 οι προβλέψεις είναι µηδέν. Ο συντελεστής ανισότητας είναι ανεξάρτητος από τις µονάδες µέτρησης και για το λόγο αυτό είναι ο περισσότερο κατάλληλος για σύγκριση της προβλεπτικής ικανότητας διαφόρων υποδειγµάτων. t 2 UV+UV+UC=1 Bias-Variance-Covariance

24 ΕΠΙΧ - Τεχνικές Προβλέψεων & Ελέγχου ιαφάνεια 22 Άσκηση1-Παραδείγματα Έστω για μια χρονολογική σειρά που εκφράζει τριμηνιαία στοιχεία και ακολουθεί το υπόδειγμα Y = Y + Y Y + ε 0.5ε t t 1 t 4 t 5 t t 1 Είναι στάσιμη; Με ποιόν μετασχηματισμό θα γίνει και ποιο είναι το καινούργιο υπόδειγμα που θα προκύψειαπότονμετασχηματισμόαυτό;

25 ΕΠΙΧ - Τεχνικές Προβλέψεων & Ελέγχου ιαφάνεια 23 Άσκηση2-Παραδείγματα Να εκφράσετε τις ακόλουθες στοχαστικές διαδικασίες: (1 LY ) = (1 L L ) t (1 LY ) = (1 L)(1 L ) t θ θ ε θ θ ε t t

26 ΕΠΙΧ - Τεχνικές Προβλέψεων & Ελέγχου ιαφάνεια 24 Άσκηση3-Παραδείγματα Δίνονται οι 10 πρώτες δειγματικές αυτοσυσχετίσεις και δειγματικές μερικές αυτοσυσχετίσεις από 100 παρατηρήσεις μιας χρονοσειράς ρ : 0.91,0.87,0.62,0.48,0.36,0.25,0.16,0.11,0.08,0.07 s ρ : 0.91, 0.64, 0.14, 0.11, 0.08, 0.05, 0.04, 0.03, 0.02, 0.02 ss 1) Να βρεθούν οι στατιστικά σημαντικές αυτοσυσχετίσεις και μερικές αυτοσυσχετίσεις. 2) Να βρεθεί το κατάλληλο υπόδειγμα 3) Να βρεθούν οι αρχικές εκτιμήσεις του υποδείγματος.

27 ΕΠΙΧ - Τεχνικές Προβλέψεων & Ελέγχου ιαφάνεια 26 ΆσκησειςΑποΔημελή Ναγίνουνοιασκήσεις1 έως7 απότοτρίτοκεφάλαιο του βιβλίου.

28 ΕΠΙΧ - Τεχνικές Προβλέψεων & Ελέγχου ιαφάνεια 27 ιαδικασία Box Jenkins