1. Εισαγωγή...σελ Δεδομένα της εργασίας...σελ Μεθοδολογία...σελ Ανάλυση των δεδομένων.σελ Συγκριτικά αποτελέσματα..σελ.

Σχετικά έγγραφα
Χρονολογικές Σειρές (Time Series) Lecture notes Φ.Κουντούρη 2008

ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ MSc Τραπεζικής & Χρηματοοικονομικής

ΠΟΛΛΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ: ΑΣΚΗΣΕΙΣ

Τεχνικές Προβλέψεων Αυτοπαλινδρομικά Μοντέλα Κινητού Μέσου Όρου (ARIMA)

ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Τμήμα Τραπεζικής & Χρηματοοικονομικής

Εισόδημα Κατανάλωση

Τεχνικές Προβλέψεων Αυτοπαλινδρομικά Μοντέλα Κινητού Μέσου Όρου (ARIMA)

2. ΕΠΙΛΟΓΗ ΤΟΥ ΜΕΓΕΘΟΥΣ ΤΩΝ ΠΑΡΑΤΗΡΗΣΕΩΝ

ΑΠΟ ΤΟ ΔΕΙΓΜΑ ΣΤΟΝ ΠΛΗΘΥΣΜΟ

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

Οικονομετρία Ι. Ενότητα 9: Αυτοσυσχέτιση. Δρ. Χαϊδώ Δριτσάκη Τμήμα Λογιστικής & Χρηματοοικονομικής

5. ΤΟ ΓΕΝΙΚΟ ΓΡΑΜΜΙΚΟ ΜΟΝΤΕΛΟ (GENERAL LINEAR MODEL) 5.1 Εναλλακτικά μοντέλα του απλού γραμμικού μοντέλου: Το εκθετικό μοντέλο

ΤΜΗΜΑ ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥ ΣΧΕΔΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ

ΜΑΘΗΜΑ 3ο. Βασικές έννοιες

ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ. Παπάνα Αγγελική

ΟΙΚΟΝΟΜΕΤΡΙΑ. Βιολέττα Δάλλα. Εθνικό και Καποδιστριακό Πανεπιστήµιο Αθηνών

Τεχνικές Προβλέψεων Αυτοπαλινδρομικά Μοντέλα Κινητού Μέσου Όρου (ARIMA)

ΠΕΡΙΕΧΟΜΕΝΑ ΠΡΟΛΟΓΟΣ 7. ΚΕΦΑΛΑΙΟ 1: Εισαγωγικές Έννοιες 13

ΤΜΗΜΑΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥΣΧΕΔΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝΣΥΣΤΗΜΑΤΩΝ

1. Ποιες είναι οι διαφορές μεταξύ αυτοπαλίνδρομων υποδειγμάτων (AR) και υποδειγμάτων κινητού μέσου (MA);

ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Τραπεζικής & Χρηματοοικονομικής

Οικονομετρία Ι. Ενότητα 6: Πολλαπλό Γραμμικό Υπόδειγμα Παλινδρόμησης. Δρ. Χαϊδώ Δριτσάκη Τμήμα Λογιστικής & Χρηματοοικονομικής

Χρονικές σειρές 6 Ο μάθημα: Αυτοπαλίνδρομα μοντέλα (2)

ΤΜΗΜΑΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥΣΧΕΔΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝΣΥΣΤΗΜΑΤΩΝ

Πολλαπλή παλινδρόμηση (Multivariate regression)

ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΤΜΗΜΑ ΟΡΓΑΝΩΣΗΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΔΙΔΑΣΚΩΝ: ΘΑΝΑΣΗΣ ΚΑΖΑΝΑΣ. Οικονομετρία

3. ΣΕΙΡΙΑΚΟΣ ΣΥΝΤΕΛΕΣΤΗΣ ΣΥΣΧΕΤΙΣΗΣ

Λογιστική Παλινδρόµηση

Παραβίασητωνβασικώνυποθέσεωντηςπαλινδρόμησης (Violation of the assumptions of the classical linear regression model)

ΟΙΚΟΝΟΜΕΤΡΙΑ Κεφάλαιο 2

ΜΑΘΗΜΑ 3ο. Υποδείγματα μιας εξίσωσης

Απλή Παλινδρόμηση και Συσχέτιση

Χρονικές σειρές 10 Ο μάθημα: Μη στάσιμα μοντέλα ARIMA Μεθοδολογία Box-Jenkins Εαρινό εξάμηνο Τμήμα Μαθηματικών ΑΠΘ

Χρονοσειρές, Μέρος Β 1 Πρόβλεψη Χρονικών Σειρών

10. ΠΟΛΛΑΠΛΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ. Παπάνα Αγγελική

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

Στασιμότητα χρονοσειρών Νόθα αποτελέσματα-spurious regression Ο έλεγχος στασιμότητας είναι απαραίτητος ώστε η στοχαστική ανάλυση να οδηγεί σε ασφαλή

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

Τίτλος Εργασίας: Η χρήση της μεθοδολογίας Box Jenkins στην ανάλυση χρονοσειρών

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ. ΜΑΘΗΜΑ 4ο

Τεχνολογικό Εκπαιδευτικό Ίδρυμα Δυτικής Μακεδονίας Western Macedonia University of Applied Sciences Κοίλα Κοζάνης Kozani GR 50100

ΟΙΚΟΝΟΜΕΤΡΙΑ. Ενότητα 4: Ανάλυση Χρονολογικών Σειρών. Αναπλ. Καθηγητής Νικόλαος Σαριαννίδης Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά)

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

ΜΑΘΗΜΑ 4 ο. Μοναδιαία ρίζα

ΚΕΦΑΛΑΙΟ 6 ΠΡΟΒΛΕΨΕΙΣ ΜΕ ΥΠΟΔΕΙΓΜΑΤΑ ΧΡΟΝΟΣΕΙΡΩΝ

ΠΟΣΟΤΙΚΕΣ ΜΕΘΟΔΟΙ ΙI (ΣΤΑΤΙΣΤΙΚΗ ΓΙΑ ΤΗ ΔΙΟΙΚΗΣΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ) (ΟΔΕ 2116)

(i) Περιγραφική ανάλυση των μεταβλητών PRICE

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium iv

4. ΕΠΙΛΟΓΗ ΤΗΣ ΜΕΘΟΔΟΥ ΠΡΟΒΛΕΨΗΣ

ΤΜΗΜΑΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥΣΧΕΔΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝΣΥΣΤΗΜΑΤΩΝ ΕΡΓΑΣΤΗΡΙΟ ΤΕΧΝΙΚΩΝ ΠΡΟΒΛΕΨΕΩΝ& ΕΛΕΓΧΟΥ ΜΑΘΗΜΑ ΤΡΙΤΟ-ΑΥΤΟΣΥΣΧΕΤΙΣΗ (AUTOCORRELATION)

Στατιστική ΙΙΙ-Εφαρμογές Χρονολογικές Σειρές(Μέθοδοι Εξομάλυνσης ΙΙΙ-Εφαρμογές)

Πολλαπλή παλινδρόµηση. Μάθηµα 3 ο

Χρονικές σειρές 2 Ο μάθημα: Εισαγωγή στις χρονοσειρές

ΧΡΟΝΟΣΕΙΡΕΣ & ΠΡΟΒΛΕΨΕΙΣ-ΜΕΡΟΣ 7 ΕΛΕΓΧΟΙ. (TEST: Unit Root-Cointegration )

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΤΜΗΜΑ ΟΡΓΑΝΩΣΗΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΔΙΔΑΣΚΩΝ: ΘΑΝΑΣΗΣ ΚΑΖΑΝΑΣ. Οικονομετρία

ΣΥΣΧΕΤΙΣΗ και ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ. ΜΑΘΗΜΑ 3ο

ΤΕΛΕΣΤΕΣ ΚΑΙ ΣΤΑΤΙΣΤΙΚΑ ΕΡΓΑΛΕΙΑ ΑΝΑΛΥΣΗΣ ΧΡΟΝΟΣΕΙΡΩΝ

Ερωτήσεις κατανόησης στην Οικονομετρία (Με έντονα μαύρα γράμματα είναι οι σωστές απαντήσεις)

Ανάλυση Χρονοσειρών. Κεφάλαιο Ανάλυση Χρονοσειρών

Διαχείριση Υδατικών Πόρων

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 8. Συνεχείς Κατανομές Πιθανοτήτων Η Κανονική Κατανομή

ΤΜΗΜΑ ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥ ΣΧΕΔΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝ ΣΥΣΤΗΜΑΤΩΝ

ΤΜΗΜΑΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥΣΧΕΔΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝΣΥΣΤΗΜΑΤΩΝ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Απλή Γραμμική Παλινδρόμηση I

Κεφάλαιο 16 Απλή Γραμμική Παλινδρόμηση και Συσχέτιση

ΤΜΗΜΑΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥΣΧΕΔΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝΣΥΣΤΗΜΑΤΩΝ

2. ΧΡΗΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΠΑΚΕΤΩΝ ΣΤΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

Το στατιστικό κριτήριο που μας επιτρέπει να. μιας ή πολλών άλλων γνωστών μεταβλητών. Η σχέση ανάμεσα στις μεταβλητές που μελετώνται

Μενύχτα, Πιπερίγκου, Σαββάτης. ΒΙΟΣΤΑΤΙΣΤΙΚΗ Εργαστήριο 6 ο


Αντικείμενο του κεφαλαίου είναι: Ανάλυση συσχέτισης μεταξύ δύο μεταβλητών. Εξίσωση παλινδρόμησης. Πρόβλεψη εξέλιξης

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ. Κεφάλαιο 10. Εισαγωγή στην εκτιμητική

Εισαγωγή στην Στατιστική (ΔΕ200Α-210Α)

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ Ι Συμπληρωματικές Σημειώσεις Δημήτριος Παντελής

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 30 Μαρτίου /32

Χ. Εμμανουηλίδης, 1

Εισαγωγή στην Στατιστική (ΔΕ200Α-210Α)

ΤΜΗΜΑΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥΣΧΕΔΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝΣΥΣΤΗΜΑΤΩΝ. ΕΡΓΑΣΤΗΡΙΟ ΤΕΧΝΙΚΩΝ ΠΡΟΒΛΕΨΕΩΝ& ΕΛΕΓΧΟΥ ΜΑΘΗΜΑ ΠΕΜΠΤΟ-ΑΥTOΠΑΛΙΝΔΡΟΜΑ ΥΠΟΔΕΙΓΜΑΤΑ(AR(p))

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Οικονομετρία Διάλεξη 2η: Απλή Γραμμική Παλινδρόμηση. Διδάσκουσα: Κοντογιάννη Αριστούλα

Χρονικές σειρές 11 Ο μάθημα: Προβλέψεις

ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΤΜΗΜΑ ΟΡΓΑΝΩΣΗΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΔΙΔΑΣΚΩΝ: ΘΑΝΑΣΗΣ ΚΑΖΑΝΑΣ. Οικονομετρία

Α. Μπατσίδης Πρόχειρες βοηθητικές διδακτικές σημειώσεις

Πρόλογος Μέρος Ι: Απλό και πολλαπλό υπόδειγμα παλινδρόμησης Αντικείμενο της οικονομετρίας... 21

Συσχέτιση μεταξύ δύο συνόλων δεδομένων

ΚΕΦΑΛΑΙΟ ΙΙΙ ΠΟΛΛΑΠΛΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

Ανάλυση της ιακύµανσης

Χρονικές σειρές 8 Ο μάθημα: Μοντέλα κινητού μέσου

Εργασία. στα. Γενικευμένα Γραμμικά Μοντέλα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΔΙΕΘΝΕΙΣ ΧΡΗΜΑΤΟΟΙΚΟΝΟΜΙΚΕΣ ΑΓΟΡΕΣ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΤΜΗΜΑΤΑ: ΜΑΘΗΜΑΤΙΚΩΝ ΜΗΧΑΝΙΚΩΝ Η/Υ ΚΑΙ ΠΛΗΡΟΦΟΡΙΚΗΣ ΘΕΜΑ ΔΙΠΛΩΜΑΤΙΚΗΣ ΕΡΓΑΣΙΑΣ: ΑΝΑΛΥΣΗ ΜΟΝΤΕΛΩΝ ΧΡΟΝΟΛΟΓΙΚΩΝ ΣΕΙΡΩΝ

ΟΙΚΟΝΟΜΕΤΡΙΑ. Η μέθοδος των βοηθητικών μεταβλητών. Παπάνα Αγγελική

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης

Χρονοσειρές - Μάθημα 5

Μέρος V. Ανάλυση Παλινδρόμηση (Regression Analysis)

Transcript:

Περιεχόμενα 1. Εισαγωγή...σελ. 2 2. Δεδομένα της εργασίας......σελ. 3 3. Μεθοδολογία......σελ. 6 4. Ανάλυση των δεδομένων.σελ.13 5. Συγκριτικά αποτελέσματα..σελ.20 6. Συμπεράσματα.....σελ.20 7. Παράρτημα 1Α σελ.22 1Β..σελ.28 1Γ σελ.35 1Δ σελ.41 8. Παράρτημα 2Α σελ.48 2Β..σελ.49 2Γ. σελ.49 9. Βιβλιογραφία... σελ.51 1

1. Εισαγωγή Η ανάλυση χρονολογικών σειρών είναι ένα χρήσιμο εργαλείο, διαθέσιμο σε αυτούς που είναι επιφορτισμένοι με την λήψη επιχειρηματικών αποφάσεων. Η κατασκευή ικανών υποδειγμάτων που ερμηνεύουν χρονολογικές σειρές, μπορεί να οδηγήσει σε μεθόδους προβλέψεων της αναμενόμενης πορείας ενός δείκτη, της τιμής μιας μετοχής, της ισοτιμίας ενός νομίσματος, κλπ, κάτι που είναι ιδιαίτερο χρήσιμο στην λήψη μιας επιχειρηματικής απόφασης. Οι χρονολογικές σειρές παρουσιάζουν μια σειρά από χαρακτηριστικά όπως είναι η τάση, η εποχικότητα, η κυκλικότητα, κλπ. Για παράδειγμα το ακαθάριστο εθνικό προϊόν μιας χώρας ή το γενικό επίπεδο τιμών είναι χρονολογικές σειρές που παρουσιάζει αυξητική τάση σε σχέση με τον χρόνο. Η αύξηση αυτή μπορεί να μην παρατηρηθεί μια συγκεκριμένη χρονιά, αλλά γενικά το επίπεδο αυξάνει με την πάροδο του χρόνου. Άλλες χρονολογικές σειρές όπως είναι οι μέσες μηνιαίες θερμοκρασίες για κάθε έτος παρουσιάζουν εποχικότητα, καθώς οι τιμές της θερμοκρασίας είναι κατά κανόνα υψηλότερες τους θερινούς μήνες απ ότι τον χειμώνα για κάθε έτος παρατήρησης. Στόχος της ανάλυσης είναι να ανιχνεύσει αυτά τα χαρακτηριστικά, εφόσον υπάρχουν σε μια δεδομένη χρονολογική σειρά, και να οδηγήσει στην υιοθέτηση του καταλληλότερου υποδείγματος. Στην διαδικασία επιλογής ενός υποδείγματος θα πρέπει να προτιμάται η λιγότερο πολύπλοκη συνάρτηση η οποία ερμηνεύει επαρκώς την χρονολογική σειρά (principle of parsimony). Δηλαδή το υπόδειγμα που χρησιμοποιείται θα πρέπει να απαιτεί τον μικρότερο αριθμό από παραμέτρους, που θα ερμηνεύουν επαρκώς την χρονολογική σειρά. Ο Albert Einstein είχε πει ότι «τα πάντα πρέπει να γίνουν όσο το δυνατόν απλούστερα, αλλά όχι πιο απλά από ότι είναι». Η ταυτοποίηση συνίσταται στην εύρεση των συντελεστών ενός γενικότερου υποδείγματος που από την μέχρι ως τώρα ανάλυση του δείγματος φαίνεται να παρουσιάζουν κάποια συγκεκριμένα χαρακτηριστικά, τα οποία είναι αναγνωρίσιμα σε γνωστά υποδείγματα. Μερικά από τα χρησιμοποιούμενες μεθόδους (εργαλεία) για την ταυτοποίηση του υποδείγματος είναι η εξέταση της συνάρτηση αυτοσυσχέτισης (autocorrelation function), μερικής (partial autocorrelation function) και εκτεταμένης συνάρτησης αυτοσυσχέτισης (extended autocorrelation function), κ.α. Τα εργαλεία αυτά αναλύονται διεξοδικότερα στο τμήμα 3.1 της εργασίας. Αφού επιλεγεί το καταλληλότερο υπόδειγμα, υποβάλλεται σε έλεγχο. Ο έλεγχος αυτός μπορεί να γίνει με δύο κύριες μεθόδους : την εξέταση της κανονικότητας των καταλοίπων και την εξέταση ενός γενικότερου υποδείγματος που περιλαμβάνει το ελεγχόμενο υπόδειγμα ως ειδική περίπτωση. 2

Σημαντικό ρόλο στην λήψη μιας απόφασης, παίζει η ικανότητα αυτού που αποφασίζει να κάνει ασφαλείς και όσο το δυνατόν ακριβέστερες προβλέψεις όσο αφορά την διαμόρφωση του οικονομικού περιβάλλοντος (τιμή ενός δείκτη, εξέλιξη σε έναν τομέα, κλπ) σε μια χρονική στιγμή ή σε ένα συγκεκριμένο χρονικό διάστημα. Τα υποδείγματα λοιπόν που υιοθετούνται από την μέχρι έως τώρα ανάλυση, αξιολογούνται ως προς την προβλεπτική τους ικανότητα. Η συγκριτική αυτή ανάλυση των υποδειγμάτων ονομάζεται benchmarking, και βοηθάει στην εφαρμογή του καταλληλότερου υποδείγματος για τον σχηματισμό μιας πρόβλεψης, λαμβάνοντας υπόψη τις έως σήμερα γνωστές τιμές της χρονολογικής σειράς. Επειδή η πρόβλεψη αφορά το μέλλον, στο οποίο δεν υπάρχουν παρατηρημένες τιμές, η αξιολόγηση βασίζεται στις παρατηρημένες τιμές του δείγματος. Το διαθέσιμο δείγμα χωρίζεται σε δύο μέρη, από τα οποία το ένα το χειριζόμαστε ως δείγμα εκμάθησης (training) και το άλλο ως δείγμα δοκιμής των προβλέψεων (testing). Τα σφάλματα πρόβλεψης είναι ίσα με την διαφορά των προβλέψεων από τις παρατηρούμενες πραγματικές τιμές Η αξιολόγηση στηρίζεται στην συγκριτική ανάλυση τεσσάρων μέτρων αξιολόγησης, τα οποία επεξηγούνται αναλυτικά στο τμήμα 3 της εργασίας. Αφού επιλεγεί το καταλληλότερο υπόδειγμα από τα ανταγωνιστικά διαθέσιμα υποδείγματα, η σημειακή πρόβλεψη την χρονική στιγμή t+1 λαμβάνεται ως η τιμή του που παίρνει η συνάρτηση του υποδείγματος με δεδομένες τις τιμές της χρονολογικής σειράς έως την στιγμή t. 2. Δεδομένα της εργασίας Αντικείμενο της παρούσας εργασίας είναι η ανάλυση της τάσης και η πρόβλεψη χρονολογικών σειρών σε εβδομαδιαία δεδομένα τιμών αγαθών (commodities) όπως είναι ο καφές, το κακάο, το κριθάρι και το ρύζι. Το ενδιαφέρον εστιάζεται στην αγορά των αγαθών και συγκεκριμένα στο κλάδο των τροφίμων, διότι αυτός παρουσιάζει μια ιδιαίτερη δυναμική τα τελευταία χρόνια, αλλά και γιατί οι επιπτώσεις από την αύξηση των τιμών των αγαθών αυτών επηρεάζει μεγάλο μερίδιο του παγκόσμιου πληθυσμού και μπορεί να αποτελέσει αιτία έντονων αντιπαραθέσεων. Στο κλάδο των τροφίμων το 2007 παρατηρήθηκε αύξηση 32% στις συμφωνίες (contracts) για αγοραπωλησία τέτοιων αγαθών στις αγορές όπου διαπραγματεύεται η τιμή τους (commodity markets). 3

Τα δεδομένα ελήφθησαν το διάστημα από 19-3-2004 έως 13-3-2009, από την ιστοσελίδα της Ναυτεμπορικής (www.naftemporiki.gr) και αποτελούνται από T=261 δείγματα για κάθε χρονολογική σειρά. Η εισαγωγή και επεξεργασία των δεδομένων στον υπολογιστή, η δημιουργία των γραφημάτων, και η κατασκευή των υποδειγμάτων έγινε με την χρήση του ελεύθερου λογισμικού του πακέτου της R. Τα γραφήματα από την επεξεργασία των τεσσάρων χρονολογικών σειρών (διαφορές, ACF, κλπ) βρίσκονται στο παράρτημα 1, καθώς και τα αναλυτικά αποτελέσματα της R. Επίσης στο παράρτημα 2 βρίσκεται και ο κώδικας των υποδειγμάτων που χρησιμοποιήθηκε. Όπου ο κώδικας είναι παραπλήσιος αυτός δεν περιλήφθηκε στα παραρτήματα. Στα παρακάτω σχήματα 2.1 έως 2.4 σχεδιάζονται τα γραφήματα των τεσσάρων χρονολογικών σειρών. Τα χρησιμοποιούμενα σύμβολα είναι COFSV-NYC, CCARR-NYC, BAR-TERM-TEX και RI-THWHT1ST-A για την σειρά του καφέ, του κακάο, του κριθαριού και το ρυζιού αντίστοιχα. Σχήμα 2.1 4

Σχήμα 2.2 Σχήμα 2.3 5

Σχήμα 2.4 3. Μεθοδολογία 3.1 Μεθοδολογία ARIMA: ταυτοποίηση, εκτίμηση, έλεγχος καταλοίπων. Τα ανταγωνιστικά υποδείγματα (competing models) που χρησιμοποιούνται ανήκουν στην οικογένεια των υποδειγμάτων ARIMA(p,d,q). H γενική μορφή αυτών των υποδειγμάτων είναι: W t =φ 1 W t-1 +φ 2 W t-2 + +φ p W t-p + e t - θ 1 e t-1 θ 2 e t-2 - -θ q e t-q Όπου το W t = d Y t είναι η διαφορά βαθμού d της αρχικής χρονολογικής σειράς. Η μεθοδολογία που ακολουθείται των Box-Jenkins για την στρατηγική επιλογής των καλύτερων υποδειγμάτων που ερμηνεύουν τις χρονολογικές σειρές που αναλύουμε. Η στρατηγική που ακολουθείται για την επιλογή του καταλληλότερου υποδείγματος παρουσιάζεται στο παρακάτω σχήμα 3.1 : 6

Ταυτοποίηση : επιλογή κατάλληλων τιμών των παραμέτρων p,d,q του υποδείγματος ARIMA Εκτίμηση του υποδείγματος : εύρεση των παραμέτρων του φ i και θ i Έλεγχος καταλληλότητας του υποδείγματος Εξέταση των καταλοίπων Αποτέλεσμα ελέγχου μη αποδεκτό αποδεκτό υιοθέτηση υποψήφιου υποδείγματος Σχήμα 3.1 Στο πρώτο στάδιο για τον προσδιορισμό των παραμέτρων του υποδείγματος (ταυτοποίηση) χρησιμοποιήθηκαν τα εργαλεία της συνάρτησης αυτοσυσχέτισης του δείγματος (autocorrelation function), της μερικής συνάρτησης αυτοσυσχέτισης (pacf) και της εκτεταμένης αυτοσυσχέτισης (EACF μέθοδος των Tsay και Tiao). Η μορφή της συνάρτησης αυτοσυσχέτισης μπορεί να οδηγήσει στην επιλογή των συντελεστών ενός υποδείγματος ARIMA, εάν αυτή παραπέμπει σε συνάρτηση ενός γνωστού υποδείγματος. Για παράδειγμα στα υποδείγματα MA(q), η συνάρτηση αυτοσυσχέτισης μηδενίζεται για τιμές της υστέρησης (lag) μεγαλύτερες από q. Η ιδιότητα αυτή μπορεί να οδηγήσει στην ταυτοποίηση ενός τέτοιου υποδείγματος. Παρόλα αυτά, στα αυτοπαλίνδρομα υποδείγματα AR(p), η συνάρτηση αυτοσυσχέτισης δεν μηδενίζεται μετά από κάποια τιμή της υστέρησης, αλλά μειώνεται σταδιακά. Έτσι απαιτείται μια άλλη συνάρτηση για να βοηθήσει στον προσδιορισμό της τάξης του υποδείγματος. Ως τέτοια συνάρτηση μπορεί να οριστεί η συσχέτιση μεταξύ του Y t και Y t-k, αφού αφαιρέσουμε την επίδραση των ενδιάμεσων μεταβλητών Y t-1,y t-2,y t-3,..y t-k+1. Η συνάρτηση αυτή είναι η συνάρτηση μερικής αυτοσυσχέτισης (partial autocorrelation function) και 7

υπάρχουν αρκετοί τρόποι για να την ορίσουμε επακριβώς. Ένας από αυτούς είναι να την ορίσουμε βάση της παρακάτω σχέσης, με την προϋπόθεση ότι η Y t είναι μια κανονικά κατανεμημένη χρονολογική σειρά : Φ kk = Corr(Y t,y t-k Y t-1,y t-2,y t-3,..y t-k+1 ) Όπως μπορεί να αποδειχθεί μια σημαντική ιδιότητα της συνάρτησης μερικής αυτοσυσχέτισης είναι ότι η τιμή της πέφτει απότομα για τιμές υστέρησης μεγαλύτερες από p, σε ένα αυτοπαλίνδρομο υπόδειγμα AR(p). Σημαντική παρατήρηση σε αυτό το σημείο, είναι το γεγονός ότι η μερική αυτοσυσχέτιση ενός υποδείγματος MA(1) δεν μηδενίζεται για τιμές της υστέρησης k μεγαλύτερες από 1, αλλά μειώνεται εκθετικά προς το μηδέν καθώς αυξάνεται το k. Γενικεύοντας, αποδεικνύεται ότι η συνάρτηση μερικής αυτοσυσχέτισης ενός υποδείγματος MA(q) συμπεριφέρεται όπως η συνάρτηση αυτοσυσχέτισης ενός υποδείγματος AR(p). Οι συναρτήσεις αυτές είναι ένα χρήσιμο εργαλείο για τον προσδιορισμό υποδειγμάτων AR(p) και MA(q). Ωστόσο στα μικτά υποδείγματα της μορφής ARMA(p,q), οι θεωρητικές συναρτήσεις αυτοσυσχέτισης (acf) και μερικής αυτοσυσχέτισης (pacf) έχουν πάρα πολλές μη μηδενικές τιμές, κάνοντας δύσκολο τον προσδιορισμό ενός τέτοιου υποδείγματος από τις συναρτήσεις acf και pacf. Ένα από τα γραφικά εργαλεία που προτάθηκαν για την επίλυση αυτού του προβλήματος είναι η μέθοδος της εκτεταμένης συνάρτησης αυτοσυσχέτισης ( EACF : extended autocorrelation function) των Tsay και Tiao (1985). Η μέθοδος EACF, χρησιμοποιεί το γεγονός ότι εάν το τμήμα AR ενός μικτού υποδείγματος ARMA είναι γνωστό, φιλτράροντάς το από μια παρατηρούμενη χρονολογική σειρά, καταλήγουμε σε μια καθαρή διαδικασία MA(q), η οποία έχει την ιδιότητα του μηδενισμού της συνάρτησης αυτοσυσχέτισης (acf) για k>q. Οι συντελεστές του τμήματος AR μπορούν να εκτιμηθούν με μια πεπερασμένη διαδικασία παλινδρομήσεων. Η θεωρητική συνάρτηση της εκτεταμένης αυτοσυσχέτισης δίδεται από έναν πίνακα p επί q, ο οποίος περιέχει τιμές O και x. Ο προσδιορισμός των παραμέτρων p και q ενός υποδείγματος ARMA(p,q) γίνεται από τον σχηματισμό ενός τριγώνου το οποίο περιέχει μόνο μηδενικά, και η πάνω αριστερή κορυφή του οποίου δείχνει τις τιμές p και q. Με την χρήση αυτών των παραπάνω εργαλείων επιλέγονται οι κατάλληλες τιμές για τις παραμέτρους p και q των υποδειγμάτων ARIMA. Η παράμετρος d προσδιορίστηκε λαμβάνοντας τις πρώτες διαφορές των τιμών του δείγματος και ελέγχοντας αν αυτές έχουν τάση. Αν και αυτές 8

παρουσιάζουν τάση τότε λαμβάνονται οι δεύτερες διαφορές και ελέγχονται και αυτές. Η διαδικασία επαναλαμβάνεται μέχρι την διαφορά βαθμού d του δείγματος στην οποία δεν υπάρχει τάση. Στο δεύτερο στάδιο, έγινε εκτίμηση του υποδείγματος και εύρεση των παραμέτρων του φ i και θ i, με χρήση των συναρτήσεων arima της R. Στο στάδιο αυτό δεν έγινε επιλογή από κάποιες από τις γνωστές μεθόδους εκτίμησης των παραμέτρων (ελαχίστων τετραγώνων, μεγίστης πιθανοφάνειας, κ.α.), αλλά η εκτίμηση έγινε με την προεπιλεγμένη (default) μέθοδο του στατιστικού πακέτου της R. Στο τρίτο στάδιο γίνεται ο έλεγχος της καταλληλότητας του υποδείγματος. Στην γενική μορφή τα κατάλοιπα ενός υποδείγματος είναι : Κατάλοιπο = πραγματική παρατηρούμενη τιμή τιμή πρόβλεψης Αν το μοντέλο είναι σωστά προσδιορισμένο και οι εκτιμήσεις των παραμέτρων είναι λογικά κοντά στις πραγματικές τιμές, τότε τα κατάλοιπα θα πρέπει να έχουν τις ιδιότητες που έχει ο λευκός θόρυβος. Θα πρέπει να συμπεριφέρονται κατά προσέγγιση σαν ανεξάρτητες, κανονικά κατανεμημένες μεταβλητές με μηδενικό μέσο όρο και σταθερή διακύμανση. Αποκλίσεις από αυτές τις ιδιότητες μπορεί να μας βοηθήσουν να επιλέξουμε ένα πιο κατάλληλο υπόδειγμα. Το πρώτο τεστ που κάνουμε είναι να απεικονίσουμε γραφικά τα κατάλοιπα σαν συνάρτηση του χρόνου. Αν το μοντέλο είναι επαρκές, τότε αναμένουμε η γραφική παράσταση να απεικονίζει μια διακύμανση τιμών εντός κάποιων ορίων γύρω από το μηδενικό επίπεδο, χωρίς να υπάρχουν εμφανείς τάσεις σε σχέση με τον χρόνο. Ένα δεύτερο εργαλείο για την εξέταση της κανονικότητας των καταλοίπων είναι το διάγραμμα Q-Q ( quantile quantile plot ή normal scores). Εάν τα κατάλοιπα είναι κανονικά κατανεμημένα, τότε η μορφή του διαγράμματος θα είναι κατά προσέγγιση ευθεία γραμμή. Εάν η απόκλιση από την ευθεία είναι αρκετή, τότε απορρίπτουμε την υπόθεση της κανονικής κατανομής των καταλοίπων και το υπόδειγμά μας θα πρέπει να αναθεωρηθεί. Ένα τρίτο εργαλείο ανάλυσης της συμπεριφοράς των καταλοίπων είναι η συνάρτηση αυτοσυσχέτισης. Εάν στο διάγραμμα των καταλοίπων οι διαδοχικές τιμές είναι πολύ κοντά η 9

μία στην άλλη, υπάρχει δηλαδή ένδειξη για ύπαρξη αυτοσυσχέτισης των καταλοίπων, τότε αυτή θα γίνει φανερή με την εξέταση του διαγράμματος της συνάρτησης αυτοσυσχέτισης. Εάν για κάποιο ή κάποια lag η τιμή της συνάρτησης είναι μεγαλύτερη από το τυπικό σφάλμα, τότε τα κατάλοιπα παρουσιάζουν σημαντική αυτοσυσχέτιση και η υπόθεση της κανονικότητάς του θα πρέπει να απορριφθεί. Εάν η εξέταση των καταλοίπων με έναν ή συνδυασμό από τους παραπάνω τρεις τρόπους οδηγεί σε απόρριψη της υπόθεσης της κανονικότητας των καταλοίπων, τότε όπως φαίνεται και στο σχήμα 3.1, το υποψήφιο υπόδειγμα εγκαταλείπεται και η διαδικασία προσδιορισμού των παραμέτρων του υποδείγματος ξεκινά ξανά από το πρώτο βήμα. 3.2 Μεθοδολογία αξιολόγησης προβλεπτικής ικανότητας. Αφού προσδιορίστηκαν τα υποψήφια υποδείγματα ARIMA(p,q), έγινε έλεγχος της προβλεπτικής ικανότητας τους. χρησιμοποιώντας το ίδιο το δείγμα για τον έλεγχο αυτό. Το διαθέσιμο δείγμα χωρίζεται σε δύο μέρη, από τα οποία το ένα το χειριζόμαστε ως δείγμα εκμάθησης (training) και το άλλο ως δείγμα δοκιμής των προβλέψεων (testing). Με τον τρόπο αυτό ελέγχουμε το υπόδειγμα ως προς την προβλεπτική του ικανότητα, κάνοντας σύγκριση των προγενέστερων τιμών του τμήματος δοκιμής, με αυτές που δίνει το υπόδειγμα με δεδομένες τις τιμές του τμήματος εκμάθησης. Στο σημείο αυτό έχουμε δύο διαθέσιμες τεχνικές ως προς την επιλογή του δείγματος εκμάθησης. Η μία είναι να θεωρήσουμε ένα σταθερό τμήμα του δείγματος, ως διάστημα εκμάθησης (recursive evaluation testing) για την πρόβλεψη όλων των υπολοίπων τιμών του δείγματος δοκιμής και η άλλη είναι να χρησιμοποιήσουμε ένα κυλιόμενο τμήμα σταθερού αριθμού δειγμάτων (παράθυρο) το οποίο θα μετατοπίζεται κατά ένα δείγμα στο χρόνο για κάθε νέα πρόβλεψη που θα υπολογίζουμε βάση του υποδείγματος (rolling evaluation testing). Από τις δύο διαθέσιμες τεχνικές επιλέγουμε την τεχνική κυλιόμενου δείγματος (rolling sample evaluation), διότι στον σχηματισμό της πρόβλεψης λαμβάνει υπόψη της τις τελευταίες παρατηρούμενες πραγματικές τιμές και όχι τις προβλέψεις αυτών. Ο έλεγχος έτσι της προβλεπτικής ικανότητας του υποδείγματος γίνεται αντικειμενικότερα για όλες τις τιμές του δείγματος αφού και τελευταίες τιμές του δείγματος δοκιμής έχουν προβλεφθεί, έχοντας 10

δεδομένες πραγματικές προγενέστερες τιμές και όχι προγενέστερες προβλέψεις. Επίσης με το κυλιόμενο παράθυρο αξιοποιούνται τα δεδομένα ολόκληρου του δείγματος και όχι ενός μόνο τμήματός του. Η σύγκριση των υποδειγμάτων που επιλέχθηκαν ως υποψήφια για έλεγχο προβλεπτικής ικανότητας (competing models) βάση της μεθοδολογίας που αναλύθηκε στο τμήμα 3.1, γίνεται με τα υποδείγματα που θεωρούνται ως υποδείγματα αναφοράς ή βάσης. Στα τελευταία αυτά υποδείγματα συμπεριλαμβάνεται το τυχαίο βάδισμα (random walk), το τυχαίο βάδισμα με εκτροπή (random walk with drift) και η γραμμική τάση (linear trend). Τα υποδείγματα βάσης συμμετέχουν στην συγκριτική ανάλυση (benchmarking), διότι μας δίνουν μια καλύτερη εικόνα για την φύση των χρονολογικών σειρών. Εάν η χρονολογική σειρά ταιριάζει καλύτερα σε ένα από αυτά τα υποδείγματα, μας βοηθάει να κατανοήσουμε εάν παρουσιάζει τάση στον χρόνο και εάν αυτή η τάση είναι ντετερμινιστική ή στοχαστική. Για τον λόγο αυτό περιλαμβάνονται στην συγκριτική ανάλυση, καθώς αποτελούν ένα μέτρο βάση του οποίου συγκρίνεται το υπόδειγμα που ερμηνεύει καλύτερα μια δεδομένη χρονολογική σειρά. Το μέγεθος του κυλιόμενου παραθύρου (rolling sample) τέθηκε ίσο με T 1 =200 και υπολογίστηκαν έτσι T-T 1 =261-200=61 προβλέψεις, οι οποίες καταχωρήθηκαν σε έναν πίνακα που ονομάστηκε forecasts. Στον πίνακα με την ονομασία forerrors καταχωρήθηκαν τα σφάλματα των προβλέψεων, δηλαδή οι διαφορές των πραγματικών τιμών από τις προβλέψεις του κάθε υποδείγματος. Τα σφάλματα παίρνουν διαφορετικές τιμές για κάθε πρόβλεψη που σχηματίζεται με χρήση του αντίστοιχου υποδείγματος. Η συνολική σύγκριση μεταξύ των υποδειγμάτων είναι δυνατή μόνο εάν χρησιμοποιηθούν κάποια συνολικά μέτρα αξιολόγησης που να λαμβάνουν υπόψη τους όλο το δείγμα. Τα υποδείγματα αξιολογήθηκαν με βάση 4 μέτρα αξιολόγησης, του παρακάτω πίνακα : Μέγιστο απόλυτο σφάλμα MaxAFE max πρόβλεψης e j, j=b,1,2,,m t t 1 t T 1 j Μέσο Σφάλμα πρόβλεψης MeanFE 1 t e t T 1 t T 0 1 11

T 1 Μέσο απόλυτο σφάλμα πρόβλεψης MeanAFE Μέσο τετραγωνικό σφάλμα πρόβλεψης j e t 1 t T1 t T0 1 T 1 MeanSFE e j T t T 1 t 1 t 1 0 2 Τα υποδείγματα εκείνα τα οποία πέτυχαν τις μικρότερες τιμές στα παραπάνω μέτρα αξιολόγησης, έλαβαν την καλύτερη βαθμολογία ως προς την προβλεπτική τους ικανότητα. Επίσης για κάθε υπόδειγμα που υποβλήθηκε στον συγκριτικό έλεγχο (benchmarking), έγινε έλεγχος της συσχέτισης των σφαλμάτων και των εκτιμήσεων (forecast unbiased regression). Το υπόδειγμα της γραμμικής παλινδρόμησης μεταξύ των πραγματικών τιμών του δείγματος της χρονολογικής σειράς και των προβλέψεων, φαίνεται στην πιο κάτω σχέση : Y t 1 t 1 t 1 t ^ j a y (3.2.1) Από την παραπάνω σχέση προκύπτει ότι, αν οι εκτιμητές είναι κοντά στις τιμές α=0 και β=1, τότε οι πραγματικές τιμές ισούνται με τις προβλέψεις, κάτι που είναι απόλυτα επιθυμητό για το υπόδειγμα. Η σχέση 3.2.1 μπορεί να μετασχηματιστεί αν αφαιρέσουμε και από τα δύο μέρη της τον όρο της πρόβλεψης, ως ακολούθως : Y ^ e ^ j t 1 y a ( 1) t 1 t j t 1 t ^ a y j t 1 t ^ y t 1 j t 1 t t 1 Ο όρος στα αριστερά της παραπάνω σχέσης είναι το σφάλμα των προβλέψεων και το γ αντικατέστησε τον όρο β-1. Αν η εκτίμηση του συντελεστή γ είναι ίση με 0, τότε τα σφάλματα των προβλέψεων είναι ίσα με α, δηλαδή όλες οι προβλέψεις μεροληπτούν κατά μία σταθερή τιμή. Κατά τον έλεγχο της παλινδρόμησης των σφαλμάτων με τις προβλέψεις, επιθυμητό για το ελεγχόμενο υπόδειγμα είναι οι εκτιμητές α και γ να μην είναι στατιστικά σημαντικοί. Μια καλή ένδειξη για αυτό δίνουν οι στατιστικές t των παραμέτρων α και γ, καθώς και το R 2 της παλινδρόμησης για κάθε υπόδειγμα. Όλες αυτές οι τιμές των 12

στατιστικών συμπεριλαμβάνονται στον τελικό συγκριτικό πίνακα των υποδειγμάτων μαζί με τα τέσσερα μέτρα αξιολόγησης. 4. Ανάλυση των δειγμάτων των χρονολογικών σειρών 4.1 Χρονολογική σειρά του καφέ. Στο πρώτο δείγμα της χρονολογικής σειράς του καφέ, το γράφημα του οποίου φαίνεται στο σχήμα 1Α.1 του παραρτήματος 1, φαίνεται η σειρά να παρουσιάζει μια γραμμική αυξητική τάση. Εκτιμούμε το απλό γραμμικό υπόδειγμα για το δείγμα, και σχεδιάζουμε την ευθεία της γραμμικής παλινδρόμησης πάνω στο ίδιο γράφημα. Η εκτίμηση της παλινδρόμησης έγινε με την παραδοχή ότι τα κατάλοιπα είναι ασυσχέτιστα και κανονικά κατανεμημένα (λευκός θόρυβος). Στο σχήμα 1Α.2 φαίνεται το διάγραμμα των καταλοίπων της παλινδρόμησης. Στο διάγραμμα αυτό (1Α.2) οι διαδοχικές τιμές των καταλοίπων φαίνεται τα να είναι πολύ κοντά η μία με την άλλη, κάτι που δεν συμβαδίζει με μια σειρά λευκού θορύβου. Επίσης από το διάγραμμα της συνάρτησης αυτοσυσχέτισης των κανονικοποιημένων καταλοίπων του γραμμικού υποδείγματος (σχήμα 1Α.3 του υποδείγματος 1), οι τιμές της συνάρτησης αυτοσυσχέτισης ξεπερνούν κατά πολύ τα τυποποιημένα σφάλματα, κάτι το οποίο δεν περιμένουμε από μια συνάρτηση λευκού θορύβου που θα έπρεπε να είναι η σειρά των καταλοίπων. Για τον έλεγχο της κανονικότητας των καταλοίπων μπορούμε να χρησιμοποιήσουμε επί προσθέτως και το διάγραμμα Q-Q ( quantile quantile plot ή normal scores). Στο διάγραμμα αυτό (σχήμα 1Α.4 του παραρτήματος 1) βλέπουμε ότι αποκλίνει σημαντικά από την ευθεία γραμμή της κανονικής κατανομής. Το υπόδειγμα επομένως της γραμμικής τάσης δεν μπορεί να θεωρηθεί κατάλληλο για την συγκεκριμένο δείγμα της χρονολογικής σειράς και η τάση που φαίνεται να παρουσιάζει είναι στοχαστική. Εφόσον η σειρά παρουσιάζει τάση, διερευνούμε τις πρώτες διαφορές της χρονολογικής σειράς. Στο Σχήμα 1Α.5 φαίνεται η σειρά των διαφορών του δείγματος της χρονολογικής σειράς του καφέ. Από το διάγραμμα αυτό φαίνεται ότι η πρώτη διαφορά εξαλείφει το πρόβλημα της τάσης, επομένως η τιμή του d σε ένα υπόδειγμα ARIMA(p,d,q) πρέπει να ληφθεί ίση με 1. Στο σχήμα 1Α.6 13

φαίνεται η σειρά της συνάρτησης αυτοσυσχέτισης των διαφορών του δείγματος. Από το διάγραμμα αυτό φαίνεται να μην υπάρχει ικανή συσχέτιση μεταξύ των δειγμάτων, η οποία θα μας οδηγούσε στην υιοθέτηση ενός υποδείγματος MA ή AR. Αντιθέτως οι τιμές της acf είναι μεταξύ των ορίων των κανονικοποιημένων τιμών και έτσι η χρονολογική σειρά φαίνεται να είναι τυχαίο βάδισμα (random walk). Επίσης η συνάρτηση EACF (extended autocorrelation function) της σειράς των διαφορών των τιμών φαίνεται στο σχήμα 1A.7 του ιδίου παραρτήματος. Και αυτό μας οδηγεί στην εξέταση ενός υποδείγματος ARIMA(0,1,0) δηλαδή του υποδείγματος του τυχαίου βαδίσματος. Στον συγκριτικό έλεγχο (benchmarking) της προβλεπτικής ικανότητας ελήφθησαν ως υποδείγματα βάσης (benchmark) το τυχαίο βάδισμα (random walk) και το τυχαίο βάδισμα με εκτροπή (random walk with drift). Ως ανταγωνιστικά υποδείγματα ελήφθησαν τα υποδείγματα ARIMA(1,1,0) και ARIMA(0,1,1) που είναι γενικότερο του υποδείγματος του τυχαίου βαδίσματος. Τα αναλυτικά αποτελέσματα της εκτέλεσης του προγράμματος της R που εκτελεί το benchmarking, βρίσκονται στο τέλος του παραρτήματος 1Α. Τα συγκριτικά αποτελέσματα των υποδειγμάτων με βάση τα μέτρα maxafe, meanfe, meanafe και meansfe, καθώς και τους συντελεστές της παλινδρόμησης των σφαλμάτων με τις προβλέψεις (forecast unbiased regression), παρουσιάζονται παρακάτω για τα τέσσερα υποδείγματα (τυχαίο βάδισμα, τυχαίο βάδισμα με εκτροπή, ARIMA(1,1,0), ARIMA(0,1,1) ) για την χρονολογική σειρά του καφέ : Υπόδειγμα maxafe MeanFE MeanAFE MeanSFE α γ R 2 Random walk 24.9-0.35 4.784 42.38 12.35-0.093 0.042 Random walk 25.34-0.56 4.797 42.77 13.46-0103 0.052 with drift ARIMA(1,1,0) 25.03-0.3578 4.7805 42.68 12.98-0.098 0.047 ARIMA(0,1,1) 25.05-0.3583 4.7802 42.69 12.95-0.098 0.046 4.2 Χρονολογική σειρά του κακάο. Στο δεύτερο δείγμα της χρονολογικής σειράς του κακάο, το γράφημα του οποίου φαίνεται στο σχήμα 1Β.1 του παραρτήματος 1, φαίνεται η σειρά να παρουσιάζει μια γραμμική αυξητική τάση. 14

Εκτιμούμε το απλό γραμμικό υπόδειγμα για το δείγμα, και σχεδιάζουμε την ευθεία της γραμμικής παλινδρόμησης πάνω στο ίδιο γράφημα. Η εκτίμηση της παλινδρόμησης έγινε με την παραδοχή ότι τα κατάλοιπα είναι ασυσχέτιστα και κανονικά κατανεμημένα (λευκός θόρυβος). Στο σχήμα 1Β.2 φαίνεται το διάγραμμα των καταλοίπων της παλινδρόμησης. Στο διάγραμμα αυτό (1Β.2) οι διαδοχικές τιμές των καταλοίπων φαίνεται τα να είναι πολύ κοντά η μία με την άλλη, κάτι που υποδηλώνει αυτοσυσχέτιση μεταξύ των καταλοίπων, χαρακτηριστικό που δεν περιμένουμε από μια σειρά λευκού θορύβου. Επίσης από το διάγραμμα της συνάρτησης αυτοσυσχέτισης των κανονικοποιημένων καταλοίπων του γραμμικού υποδείγματος (σχήμα 1Β.3 του υποδείγματος 1), οι τιμές της συνάρτησης αυτοσυσχέτισης ξεπερνούν κατά πολύ τα τυποποιημένα σφάλματα, κάτι το οποίο δεν περιμένουμε από μια συνάρτηση λευκού θορύβου που θα έπρεπε να είναι η σειρά των καταλοίπων. Για τον έλεγχο της κανονικότητας των καταλοίπων μπορούμε να χρησιμοποιήσουμε επί προσθέτως και το διάγραμμα Q-Q ( quantile quantile plot ή normal scores). Στο διάγραμμα αυτό (σχήμα 1Β.4 του παραρτήματος 1) βλέπουμε ότι αποκλίνει σημαντικά από την ευθεία γραμμή της κανονικής κατανομής. Το υπόδειγμα επομένως της γραμμικής τάσης δεν μπορεί να θεωρηθεί κατάλληλο για την συγκεκριμένο δείγμα της χρονολογικής σειράς και η τάση που φαίνεται να παρουσιάζει είναι στοχαστική. Εφόσον η σειρά παρουσιάζει τάση, διερευνούμε τις πρώτες διαφορές της χρονολογικής σειράς. Στο Σχήμα 1Β.5 φαίνεται η σειρά των διαφορών του δείγματος της χρονολογικής σειράς του κακάο. Από το διάγραμμα αυτό φαίνεται ότι η πρώτη διαφορά εξαλείφει το πρόβλημα της τάσης, επομένως η τιμή του d σε ένα υπόδειγμα ARIMA(p,d,q) πρέπει να ληφθεί ίση με 1. Η συνάρτηση μερικής αυτοσυσχέτισης των διαφορών του δείγματος σχεδιάζεται στο σχήμα 1Β.6. Παρατηρούμε ότι για υστέρηση lag=3,36 και 38 η συνάρτηση δείχνει στατιστικά σημαντικές τιμές, γεγονός το οποίο θα πρέπει να διερευνηθεί περαιτέρω. Η συνάρτηση EACF της σειράς των διαφορών των τιμών φαίνεται στο σχήμα 1Β.7. Από την διάταξη των στατιστικά σημαντικών τιμών του πίνακα, οδηγούμαστε στην εξέταση ενός υποδείγματος ARIMA(0,1,3). Στον συγκριτικό έλεγχο (benchmarking) της προβλεπτικής ικανότητας των υποδειγμάτων ελήφθησαν εκτός από το τυχαίο βάδισμα (random walk) και το τυχαίο βάδισμα με εκτροπή (random walk with drift) και τα υποδείγματα ARIMA(0,1,3) και ARIMA(1,1,3) που είναι το 15

γενικότερο του υποδείγματος ARIMA(0,1,3). Τα αναλυτικά αποτελέσματα της εκτέλεσης του προγράμματος της R που εκτελεί το benchmarking, βρίσκονται στο τέλος του παραρτήματος 1Β. Τα συγκριτικά αποτελέσματα των υποδειγμάτων με βάση τα μέτρα maxafe, meanfe, meanafe και meansfe, καθώς και τους συντελεστές της παλινδρόμησης των σφαλμάτων με τις προβλέψεις (forecast unbiased regression), παρουσιάζονται στον παρακάτω πίνακα για τα τέσσερα υποδείγματα (τυχαίο βάδισμα, τυχαίο βάδισμα με εκτροπή, ARIMA(0,1,3), ARIMA(1,1,3) ) για την χρονολογική σειρά του κακάο : Υπόδειγμα maxafe MeanFE MeanAFE MeanSFE α γ R 2 Random walk 627 0,754 132,33 57510 508-0,174 0,088 Random walk 635,86-5,66 131,82 27677 515-0,178 0,092 with drift ARIMA(0,1,3) 627,32-1,1 133,74 28064 477-0,16 0,073 ARIMA(1,1,3) 633,79-0,48 133,75 29070 499-0,17 0,077 4.3 Χρονολογική σειρά του κριθαριού. Το τρίτο δείγμα της χρονολογικής σειράς του κριθαριού, το γράφημα του οποίου φαίνεται στο σχήμα 1Γ.1 του παραρτήματος 1, φαίνεται η σειρά να παρουσιάζει μια γραμμική αυξητική τάση. Εκτιμούμε το απλό γραμμικό υπόδειγμα για το δείγμα, και σχεδιάζουμε την ευθεία της γραμμικής παλινδρόμησης πάνω στο ίδιο γράφημα. Η εκτίμηση της παλινδρόμησης έγινε με την παραδοχή ότι τα κατάλοιπα είναι ασυσχέτιστα και κανονικά κατανεμημένα (λευκός θόρυβος). Στο σχήμα 1Γ.2 φαίνεται το διάγραμμα των κανονικοποιημένων καταλοίπων της παλινδρόμησης. Στο διάγραμμα αυτό (1Γ.2) οι διαδοχικές τιμές των καταλοίπων φαίνεται τα να είναι πολύ κοντά η μία με την άλλη, κάτι που υποδηλώνει αυτοσυσχέτιση μεταξύ των καταλοίπων, χαρακτηριστικό που δεν περιμένουμε από μια σειρά λευκού θορύβου. Επίσης από το διάγραμμα της συνάρτησης αυτοσυσχέτισης των κανονικοποιημένων καταλοίπων του γραμμικού υποδείγματος (σχήμα 1Γ.3 του υποδείγματος 1), οι τιμές της ξεπερνούν κατά πολύ τα τυποποιημένα σφάλματα, κάτι το οποίο δεν περιμένουμε από μια συνάρτηση λευκού θορύβου, που θα έπρεπε να είναι η σειρά των καταλοίπων. Για τον έλεγχο της κανονικότητας των καταλοίπων μπορούμε να 16

χρησιμοποιήσουμε επί προσθέτως και το διάγραμμα Q-Q ( quantile quantile plot ή normal scores). Στο διάγραμμα αυτό (σχήμα 1Γ.4 του παραρτήματος 1) βλέπουμε ότι αποκλίνει σημαντικά από την ευθεία γραμμή της κανονικής κατανομής. Το υπόδειγμα επομένως της γραμμικής τάσης δεν μπορεί να θεωρηθεί κατάλληλο για την συγκεκριμένο δείγμα της χρονολογικής σειράς και η τάση που παρουσιάζει είναι στοχαστική. Εφόσον η σειρά παρουσιάζει τάση, διερευνούμε τις πρώτες διαφορές της χρονολογικής σειράς. Στο Σχήμα 1Γ.5 φαίνεται η σειρά των διαφορών του δείγματος της χρονολογικής σειράς του κριθαριού. Από το διάγραμμα αυτό φαίνεται ότι η πρώτη διαφορά εξαλείφει το πρόβλημα της τάσης, επομένως η τιμή του d σε ένα υπόδειγμα ARIMA(p,d,q) πρέπει να ληφθεί ίση με 1. Ωστόσο από ένα σημείο του δείγματος και πέρα παρατηρούνται μεγάλης τιμές (peaks), οι οποίες υποδηλώνουν την ύπαρξη απότομων μεταβολών στην αρχική σειρά (levels). Εν συνεχεία, παίρνοντας την συνάρτηση αυτοσυσχέτισης του διαφορών του δείγματος (σχήμα 1Γ.6), παρατηρούμε ότι για lag=1,2,4,15,19, κλπ, η συνάρτηση έχει στατιστικά σημαντικές τιμές. Η συνάρτηση EACF της σειράς των διαφορών των τιμών φαίνεται στο σχήμα 1Γ.7. Από την διάταξη των στατιστικά σημαντικών τιμών του πίνακα αυτού οδηγούμαστε στην εξέταση ενός υποδείγματος ARIMA(0,1,4),. Στον συγκριτικό έλεγχο (benchmarking) της προβλεπτικής ικανότητας των υποδειγμάτων ελήφθησαν εκτός από το τυχαίο βάδισμα (random walk) και το τυχαίο βάδισμα με εκτροπή (random walk with drift) και τα υποδείγματα ARIMA(0,1,4) και ARIMA(1,1,4) που είναι το γενικότερο του υποδείγματος ARIMA(0,1,4). Τα αναλυτικά αποτελέσματα της εκτέλεσης του προγράμματος της R που εκτελεί το benchmarking, βρίσκονται στο τέλος του παραρτήματος 1Γ. Τα συγκριτικά αποτελέσματα των υποδειγμάτων με βάση τα μέτρα maxafe, meanfe, meanafe και meansfe, καθώς και τους συντελεστές της παλινδρόμησης των σφαλμάτων με τις προβλέψεις (forecast unbiased regression), παρουσιάζονται στον παρακάτω πίνακα για τα τέσσερα υποδείγματα (τυχαίο βάδισμα, τυχαίο βάδισμα με εκτροπή, ARIMA(0,1,4), ARIMA(1,1,4) για την χρονολογική σειρά του κριθαριού : Υπόδειγμα maxafe MeanFE MeanAFE MeanSFE α γ R 2 Random walk 0,71-0,0462 0,118 0,0294-0,0084-0,0078 0,002 17

Random walk 0,7289-0,0588 0,1219 0,0309-0,0004-0,012 0,006 with drift ARIMA(0,1,4) 0,7101-0,0313 0,1218 0,0300 0,0642-0,0199 0,015 ARIMA(1,1,4) 0,711-0,0309 0,1228 0,0303 0,0638-0,0197 0,015 4.4 Χρονολογική σειρά του ρυζιού. Το τέταρτο δείγμα της χρονολογικής σειράς του ρυζού, το γράφημα του οποίου φαίνεται στο σχήμα 1Δ.1 του παραρτήματος 1, φαίνεται η σειρά να παρουσιάζει μια γραμμική αυξητική τάση. Εκτιμούμε το απλό γραμμικό υπόδειγμα για το δείγμα, και σχεδιάζουμε την ευθεία της γραμμικής παλινδρόμησης πάνω στο ίδιο γράφημα. Η εκτίμηση της παλινδρόμησης έγινε με την παραδοχή ότι τα κατάλοιπα είναι ασυσχέτιστα και κανονικά κατανεμημένα (λευκός θόρυβος). Στο σχήμα 1Δ.2 φαίνεται το διάγραμμα των κανονικοποιημένων καταλοίπων της παλινδρόμησης. Στο διάγραμμα αυτό (1Δ.2) οι διαδοχικές τιμές των καταλοίπων φαίνεται τα να είναι πολύ κοντά η μία με την άλλη, κάτι που υποδηλώνει αυτοσυσχέτιση μεταξύ των καταλοίπων, χαρακτηριστικό που δεν περιμένουμε από μια σειρά λευκού θορύβου. Επίσης από το διάγραμμα της συνάρτησης αυτοσυσχέτισης των κανονικοποιημένων καταλοίπων του γραμμικού υποδείγματος (σχήμα 1Δ.3 του υποδείγματος 1), οι τιμές της ξεπερνούν κατά πολύ τα τυποποιημένα σφάλματα, κάτι το οποίο δεν περιμένουμε από μια συνάρτηση λευκού θορύβου που θα έπρεπε να είναι η σειρά των καταλοίπων. Για τον έλεγχο της κανονικότητας των καταλοίπων μπορούμε να χρησιμοποιήσουμε επί προσθέτως και το διάγραμμα Q-Q ( quantile quantile plot ή normal scores). Στο διάγραμμα αυτό (σχήμα 1Δ.4 του παραρτήματος 1) βλέπουμε ότι η καμπύλη αποκλίνει σημαντικά από την ευθεία γραμμή της κανονικής κατανομής. Το υπόδειγμα επομένως της γραμμικής τάσης δεν μπορεί να θεωρηθεί κατάλληλο για την συγκεκριμένο δείγμα της χρονολογικής σειράς και η τάση που φαίνεται να παρουσιάζει είναι στοχαστική. Εφόσον η σειρά παρουσιάζει τάση, διερευνούμε τις πρώτες διαφορές της χρονολογικής σειράς. Στο Σχήμα 1Δ.5 φαίνεται η σειρά των διαφορών του δείγματος της χρονολογικής σειράς του 18

ριζιού. Από το διάγραμμα αυτό φαίνεται ότι η πρώτη διαφορά εξαλείφει το πρόβλημα της τάσης, επομένως η τιμή του d σε ένα υπόδειγμα ARIMA(p,d,q) πρέπει να ληφθεί ίση με 1. Ωστόσο, όπως και στην προηγούμενη χρονολογική σειρά, από ένα σημείο του δείγματος και πέρα παρατηρούνται μεγάλης τιμές (peaks), οι οποίες υποδηλώνουν την ύπαρξη απότομων μεταβολών στην αρχική σειρά (levels). Εν συνεχεία, παίρνοντας την μερική συνάρτηση αυτοσυσχέτισης (pacf) του διαφορών του δείγματος (σχήμα 1Δ.6), παρατηρούμε ότι για lag=1,5 η συνάρτηση έχει στατιστικά σημαντικές τιμές, ενώ για lag=8,11 και 20 έχει οριακά στατιστικά σημαντικές τιμές. Η συνάρτηση EACF της σειράς των διαφορών των τιμών η οποία φαίνεται στο σχήμα 1Δ.7 δίνει μια καλύτερη εικόνα. Από την διάταξη των στατιστικά σημαντικών τιμών του πίνακα οδηγούμαστε στην εξέταση ενός υποψήφιου υποδείγματος ARIMA(0,1,7),. Στον συγκριτικό έλεγχο (benchmarking) της προβλεπτικής ικανότητας των υποδειγμάτων ελήφθησαν εκτός από το τυχαίο βάδισμα (random walk) και το τυχαίο βάδισμα με εκτροπή (random walk with drift) και τα υποδείγματα ARIMA(0,1,7) και ARIMA(0,1,8) που είναι το γενικότερο του υποδείγματος ARIMA(0,1,7). Τα αναλυτικά αποτελέσματα της εκτέλεσης του προγράμματος της R που εκτελεί το benchmarking, βρίσκονται στο τέλος του παραρτήματος 1Δ. Τα συγκριτικά αποτελέσματα των υποδειγμάτων με βάση τα μέτρα maxafe, meanfe, meanafe και meansfe, καθώς και τους συντελεστές της παλινδρόμησης των σφαλμάτων με τις προβλέψεις (forecast unbiased regression), παρουσιάζονται στον παρακάτω πίνακα για τα τέσσερα υποδείγματα (τυχαίο βάδισμα, τυχαίο βάδισμα με εκτροπή, ARIMA(0,1,7), ARIMA(1,1,8) για την χρονολογική σειρά του ρυζιού : Υπόδειγμα maxafe MeanFE MeanAFE MeanSFE α γ R 2 Random walk 155 4,147 23,229 1287,76 41,84-0,0528 0,057 Random walk 152,96 2,014 23,614 1288,04 43,44-0,0578 0,068 with drift ARIMA(0,1,7) 118,95 1,646 25,543 1332,80 53,19-0,0719 0,105 ARIMA(0,1,8) 128,77 0,197 25,967 1534,37 65,20-0,0906 0,150 19

5. Συγκριτικά αποτελέσματα Τα αποτελέσματα της συγκριτική ανάλυσης της προβλεπτικής ικανότητας των υποδειγμάτων, και για τις τέσσερις χρονολογικές σειρές συγκεντρώθηκαν στον παρακάτω πίνακα. Υπόδειγμα με μικρότερη τιμή στο μέτρο αξιολόγησης Χρονολογική σειρά maxafe MeanFE MeanAFE MeanSFE Καφέ rw rw ARIMA(0,1,1) rw Κακάο rw ARIMA(1,1,3) rw with drift rw Κριθάρι rw ARIMA(1,1,4) rw rw ρύζι ARIMA(0,1,7) ARIMA(0,1,8) rw rw Το υπόδειγμα του τυχαίου βαδίσματος (rw) πετυχαίνει καλύτερες τιμές στα περισσότερα μέτρα σύγκρισης έναντι των ανταγωνιστικών υποδειγμάτων ARIMA(p,d,q), για όλες τις χρονολογικές σειρές τιμών των αγαθών. Το υπόδειγμα του τυχαίου βαδίσματος, ως μερική περίπτωση μιας αλυσίδας Markov, έχει την ιδιότητα οι μελλοντικές τιμές να εξαρτώνται μόνο από την παρούσα κατάσταση και να είναι ανεξάρτητες από τις τιμές του παρελθόντος. Με άλλα λόγια η παρούσα κατάσταση περιέχει όλη την πληροφορία η οποία θα μπορούσε να επηρεάσει την μελλοντική εξέλιξη της χρονολογικής σειράς. Έτσι η γνώση των ιστορικών τιμών της χρονολογικής σειράς, δεν βοηθάει στον σχηματισμό προβλέψεων για το μέλλον. 6. Συμπεράσματα Στην παρούσα εργασία έγινε προσπάθεια να υποδειγματοποιηθούν οι χρονολογικές σειρές των τιμών τεσσάρων αγαθών της αγοράς τροφίμων, ώστε τα υποδείγματα αυτά να αποτελέσουν εργαλείο για τον σχηματισμό προβλέψεων για την εξέλιξη της αγοράς. Η ανάλυση ακολούθησε την μεθοδολογία Box-Jenkins, για την εύρεση των υποδειγμάτων βάσης και των ανταγωνιστικών υποδειγμάτων, που υποβλήθηκαν εν συνεχεία σε έλεγχο της προβλεπτικής τους ικανότητας με την τεχνική κυλιόμενου δείγματος (rolling sample evaluation). 20

Τα αποτελέσματα του συγκριτικού ελέγχου (benchmarking), έδειξαν ότι το υπόδειγμα του τυχαίου βαδίσματος είναι το καταλληλότερο από τα υποδείγματα που υποβλήθηκαν στον έλεγχο. Το αποτέλεσμα αυτό είναι σε συμφωνία με την υπόθεση του τυχαίου βαδίσματος, την οικονομική δηλαδή θεωρία η οποία υποστηρίζει ότι οι τιμές στις αγορές εξελίσσονται σύμφωνα με το τυχαίο βάδισμα και ως εκ τούτου δεν μπορούν να προβλεφθούν από τις ιστορικές τιμές της σειράς. Η θεωρία αυτή «δένει» με την υπόθεση της αποτελεσματικής αγοράς (efficient market hypothesis). Οι τιμές δηλαδή των αγαθών ενσωματώνουν όλη την διαθέσιμη πληροφορία της αγοράς, και αλλάζουν στιγμιαία ως αποτέλεσμα της ενσωμάτωσης νέας πληροφορίας. Έτσι είναι αδύνατο για κάποιον να προβλέψει μελλοντικές τιμές χρησιμοποιώντας πληροφορία από το παρελθόν που έχει ήδη ενσωματωθεί στην παρούσα τιμή, εκτός και αν η πρόβλεψή του επαληθευτεί κατά τύχη. Το μέγεθος του δείγματος αλλά και η τύχη μπορεί εσφαλμένα να οδηγήσουν στην υιοθέτηση ενός υποδείγματος τάσης οι τιμές του οποίου φαίνεται να ταιριάζουν στο δείγμα, η προβλεπτική ικανότητα του οποίου όμως να αποδειχθεί ανεπαρκής για τον σχηματισμό ασφαλών προβλέψεων. 21

Παράρτημα 1 Γραφήματα χρονολογικών σειρών 1Α. καφές (COFSV-NYC) Σχήμα 1Α.1 Σχήμα 1Α.2 22

Σχήμα 1Α.3 Σχήμα 1Α.4 23

Σχήμα 1Α.5 Σχήμα 1Α.6 AR/MA 0 1 2 3 4 5 6 7 8 9 10 11 12 13 0 o o o o o o o o o o o o o o 1 x o o o o o o o o o o o o o 2 o o o o o o o o o o o o o o 3 o x o o o o o o o o o o o o 4 x o x x o o o o o o o o o o 5 x o o x x o o o o o o o o o 6 x x o x o o o o o o o o o o 7 x x o x x x x o o o o o o o Σχήμα 1Α.7 24

# -------- results of benchmark for series : kafes -------------------- > # maxafe > apply(abs(forerrors),2,max) [1] 24.90000 25.34146 25.02522 25.04507 > # MeanFE > apply(forerrors,2,mean) [1] -0.3540984-0.5625134-0.3577656-0.3583064 > # MeanAFE > apply(abs(forerrors),2,mean) [1] 4.783607 4.796725 4.780452 4.780205 > # MeanSFE > apply(forerrors^2,2,mean) [1] 42.38131 42.77375 42.67634 42.68931 > # forecast unbeased regression > eb<-forerrors[,1] > fb<-forecasts[,2] > summary(lm(eb~fb)) Call: lm(formula = eb ~ fb) Residuals: Min 1Q Median 3Q Max -22.1072-2.6646-0.4608 4.7477 15.1418 Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) 12.35064 7.92329 1.559 0.124 fb -0.09328 0.05785-1.612 0.112 Residual standard error: 6.469 on 59 degrees of freedom 25

Multiple R-squared: 0.0422, Adjusted R-squared: 0.02597 F-statistic: 2.6 on 1 and 59 DF, p-value: 0.1122 > eb<-forerrors[,2] > fb<-forecasts[,3] > summary(lm(eb~fb)) Call: lm(formula = eb ~ fb) Residuals: Min 1Q Median 3Q Max -22.0682-2.5694-0.3599 4.7480 15.1105 Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) 13.45581 7.82568 1.719 0.0908. fb -0.10276 0.05705-1.801 0.0768. Signif. codes: 0 *** 0.001 ** 0.01 * 0.05. 0.1 1 Residual standard error: 6.45 on 59 degrees of freedom Multiple R-squared: 0.05213, Adjusted R-squared: 0.03607 F-statistic: 3.245 on 1 and 59 DF, p-value: 0.07675 > eb<-forerrors[,3] > fb<-forecasts[,4] > summary(lm(eb~fb)) Call: lm(formula = eb ~ fb) Residuals: Min 1Q Median 3Q Max -22.0958-2.4669-0.4807 4.5400 15.1444 Coefficients: Estimate Std. Error t value Pr(> t ) 26

(Intercept) 12.97761 7.89459 1.644 0.1055 fb -0.09790 0.05764-1.699 0.0947. Signif. codes: 0 *** 0.001 ** 0.01 * 0.05. 0.1 1 Residual standard error: 6.476 on 59 degrees of freedom Multiple R-squared: 0.04662, Adjusted R-squared: 0.03046 F-statistic: 2.885 on 1 and 59 DF, p-value: 0.09467 > eb<-forerrors[,4] > fb<-forecasts[,5] > summary(lm(eb~fb)) Call: lm(formula = eb ~ fb) Residuals: Min 1Q Median 3Q Max -22.1188-2.4635-0.4776 4.5695 15.1471 Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) 12.94829 7.89914 1.639 0.1065 fb -0.09769 0.05767-1.694 0.0956. Signif. codes: 0 *** 0.001 ** 0.01 * 0.05. 0.1 1 Residual standard error: 6.478 on 59 degrees of freedom Multiple R-squared: 0.04638, Adjusted R-squared: 0.03021 F-statistic: 2.869 on 1 and 59 DF, p-value: 0.09555 > # ---------------------------------------------------- 27

1Β. κακάο (CCARR-NYC) Σχήμα 1Β.1 Σχήμα 1Β.2 28

Σχήμα 1Β.3 Σχήμα 1Β.4 29

Σχήμα 1Β.5 Σχήμα 1Β.6 30

eacf(diff(kakao)) AR/MA 0 1 2 3 4 5 6 7 8 9 10 11 12 13 0 o o x o o o o o o o o o o o 1 x o x o o o o o o o o o o o 2 x o o o o o o o o o o o o o 3 x x x o o o o o o o o o o o 4 x x o x o o o o o o o o o o 5 x x o o x o o o o o o o o o 6 x x x o x x o o o o o o o o 7 x x x o x o o o o o o o o o Σχήμα 1Β.7 > # -------- results of benchmark for series : kakao -------------------- > # maxafe > apply(abs(forerrors),2,max) [1] 627.0000 635.8643 627.3158 633.7867 > # MeanFE > apply(forerrors,2,mean) [1] 0.7540984-5.6638932-1.0945904-0.4793982 > # MeanAFE > apply(abs(forerrors),2,mean) [1] 132.3279 131.8211 133.7367 133.7525 > # MeanSFE > apply(forerrors^2,2,mean) [1] 27510.33 27677.49 28064.27 29070.68 > # forecast unbeased regression > eb<-forerrors[,1] > fb<-forecasts[,2] > summary(lm(eb~fb)) Call: lm(formula = eb ~ fb) Residuals: 31

Min 1Q Median 3Q Max -568.58-101.94 40.11 127.79 223.94 Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) 508.64686 213.38886 2.384 0.0204 * fb -0.17443 0.07294-2.391 0.0200 * Signif. codes: 0 *** 0.001 ** 0.01 * 0.05. 0.1 1 Residual standard error: 161 on 59 degrees of freedom Multiple R-squared: 0.08836, Adjusted R-squared: 0.07291 F-statistic: 5.718 on 1 and 59 DF, p-value: 0.02000 > eb<-forerrors[,2] > fb<-forecasts[,3] > summary(lm(eb~fb)) Call: lm(formula = eb ~ fb) Residuals: Min 1Q Median 3Q Max -569.24-101.88 39.26 128.32 223.64 Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) 514.94424 212.82851 2.420 0.0186 * fb -0.17840 0.07259-2.458 0.0169 * Signif. codes: 0 *** 0.001 ** 0.01 * 0.05. 0.1 1 Residual standard error: 161 on 59 degrees of freedom Multiple R-squared: 0.09287, Adjusted R-squared: 0.07749 F-statistic: 6.04 on 1 and 59 DF, p-value: 0.01694 > eb<-forerrors[,3] > fb<-forecasts[,4] 32

> summary(lm(eb~fb)) Call: lm(formula = eb ~ fb) Residuals: Min 1Q Median 3Q Max -570.80-115.68 13.97 138.01 258.40 Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) 477.06023 221.96621 2.149 0.0357 * fb -0.16411 0.07584-2.164 0.0345 * Signif. codes: 0 *** 0.001 ** 0.01 * 0.05. 0.1 1 Residual standard error: 164 on 59 degrees of freedom Multiple R-squared: 0.07353, Adjusted R-squared: 0.05782 F-statistic: 4.682 on 1 and 59 DF, p-value: 0.03453 > eb<-forerrors[,4] > fb<-forecasts[,5] > summary(lm(eb~fb)) Call: lm(formula = eb ~ fb) Residuals: Min 1Q Median 3Q Max -574.1609-111.5017 0.8605 142.7600 258.8179 Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) 499.18465 225.06714 2.218 0.0304 * fb -0.17153 0.07692-2.230 0.0296 * Signif. codes: 0 *** 0.001 ** 0.01 * 0.05. 0.1 1 Residual standard error: 166.5 on 59 degrees of freedom 33

Multiple R-squared: 0.07774, Adjusted R-squared: 0.06211 F-statistic: 4.973 on 1 and 59 DF, p-value: 0.02956 > # ---------------------------------------------------- 34

1Γ. κριθάρι (BAR-TERM-TEX) Σχήμα 1Γ.1 Σχήμα 1Γ.2 35

Σχήμα 1Γ.3 Σχήμα 1Γ.4 36

Σχήμα 1Γ.5 > eacf(diff(krithari)) AR/MA 0 1 2 3 4 5 6 7 8 9 10 11 12 13 0 x x o x o o o o o o o o o o 1 o x o x o o o o o o o o o o 2 x o x x o o o o o o o o o o 3 x x x x o o o o o o o o o o 4 x x x o x o o o o o o o o o 5 o x o x o o o o o o o o o o 6 o x o x o o o o o o o o o o 7 o x o o o o o o o o o o o o Σχήμα 1Γ.6 Σχήμα 1Γ.7 37

> # -------- results of benchmark for series: krithari -------------------- > # maxafe > apply(abs(forerrors),2,max) [1] 0.7100000 0.7288945 0.7100762 0.7094448 > # MeanFE > apply(forerrors,2,mean) [1] -0.04622951-0.05882033-0.03127298-0.03095636 > # MeanAFE > apply(abs(forerrors),2,mean) [1] 0.1180328 0.1219985 0.1218669 0.1227843 > # MeanSFE > apply(forerrors^2,2,mean) [1] 0.02937705 0.03088139 0.03005973 0.03030710 > # forecast unbeased regression > eb<-forerrors[,1] > fb<-forecasts[,2] > summary(lm(eb~fb)) Call: lm(formula = eb ~ fb) Residuals: Min 1Q Median 3Q Max -0.65102-0.06478 0.03419 0.08537 0.47514 Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) -0.008466 0.099144-0.085 0.932 fb -0.007844 0.020105-0.390 0.698 38

Residual standard error: 0.1676 on 59 degrees of freedom Multiple R-squared: 0.002573, Adjusted R-squared: -0.01433 F-statistic: 0.1522 on 1 and 59 DF, p-value: 0.6978 > eb<-forerrors[,2] > fb<-forecasts[,3] > summary(lm(eb~fb)) Call: lm(formula = eb ~ fb) Residuals: Min 1Q Median 3Q Max -0.65033-0.06498 0.03390 0.08596 0.47589 Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) -0.0004114 0.0991397-0.004 0.997 fb -0.0121004 0.0200501-0.604 0.548 Residual standard error: 0.1679 on 59 degrees of freedom Multiple R-squared: 0.006135, Adjusted R-squared: -0.01071 F-statistic: 0.3642 on 1 and 59 DF, p-value: 0.5485 > eb<-forerrors[,3] > fb<-forecasts[,4] > summary(lm(eb~fb)) Call: lm(formula = eb ~ fb) Residuals: Min 1Q Median 3Q Max -0.646146-0.060528-0.003221 0.086696 0.420734 Coefficients: 39

Estimate Std. Error t value Pr(> t ) (Intercept) 0.06426 0.10034 0.640 0.524 fb -0.01991 0.02040-0.976 0.333 Residual standard error: 0.172 on 59 degrees of freedom Multiple R-squared: 0.01589, Adjusted R-squared: -0.0007932 F-statistic: 0.9524 on 1 and 59 DF, p-value: 0.3331 > eb<-forerrors[,4] > fb<-forecasts[,5] > summary(lm(eb~fb)) Call: lm(formula = eb ~ fb) Residuals: Min 1Q Median 3Q Max -0.646081-0.060849-0.004221 0.086485 0.431198 Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) 0.06386 0.10084 0.633 0.529 fb -0.01976 0.02050-0.964 0.339 Residual standard error: 0.1728 on 59 degrees of freedom Multiple R-squared: 0.0155, Adjusted R-squared: -0.001187 F-statistic: 0.9289 on 1 and 59 DF, p-value: 0.3391 > # ---------------------------------------------------- 40

1Δ. ρύζι (RI-THWHT1ST-A) Σχήμα 1Δ.1 Σχήμα 1Δ.2 41

Σχήμα 1Δ.3 Σχήμα 1Δ.4 42

Σχήμα 1Δ.5 Σχήμα 1Δ.6 43

> eacf(diff(rizi)) AR/MA 0 1 2 3 4 5 6 7 8 9 10 11 12 13 0 x x x x x x o o o o o o o o 1 o o o o x x x x o o o o o o 2 o o o o x o x o o o o o o o 3 x o o x x x x o o o o o o o 4 x o o x x o x x o o o o o o 5 x x x o x o x o o o o o o o 6 x o x o x x o x x o o o o o 7 x o x x x x o o x o x o o x Σχήμα 1Δ.7 > # -------- results of benchmark for series : rizi -------------------- > # maxafe > apply(abs(forerrors),2,max) [1] 155.0000 152.9698 118.9565 128.7774 > # MeanFE > apply(forerrors,2,mean) [1] 4.1475410 2.0141280 1.6468321 0.1979122 > # MeanAFE > apply(abs(forerrors),2,mean) [1] 23.22951 23.61467 25.54358 25.96752 > # MeanSFE > apply(forerrors^2,2,mean) [1] 1287.762 1288.047 1332.801 1534.378 > # forecast unbeased regression > eb<-forerrors[,1] > fb<-forecasts[,2] > summary(lm(eb~fb)) Call: lm(formula = eb ~ fb) Residuals 44

Min 1Q Median 3Q Max -71.229-15.942-6.849 8.908 148.655 Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) 41.84611 20.40832 2.050 0.0448 * fb -0.05283 0.02789-1.894 0.0631. Signif. codes: 0 *** 0.001 ** 0.01 * 0.05. 0.1 1 Residual standard error: 35.19 on 59 degrees of freedom Multiple R-squared: 0.05731, Adjusted R-squared: 0.04134 F-statistic: 3.587 on 1 and 59 DF, p-value: 0.06314 > eb<-forerrors[,2] > fb<-forecasts[,3] > summary(lm(eb~fb)) Call: lm(formula = eb ~ fb) Residuals: Min 1Q Median 3Q Max -71.257-16.031-6.717 9.048 148.542 Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) 43.44215 20.34362 2.135 0.0369 * fb -0.05788 0.02772-2.088 0.0411 * Signif. codes: 0 *** 0.001 ** 0.01 * 0.05. 0.1 1 Residual standard error: 35.16 on 59 degrees of freedom Multiple R-squared: 0.06882, Adjusted R-squared: 0.05304 F-statistic: 4.36 on 1 and 59 DF, p-value: 0.04111 > eb<-forerrors[,3] 45

> fb<-forecasts[,4] > summary(lm(eb~fb)) Call: lm(formula = eb ~ fb) Residuals: Min 1Q Median 3Q Max -88.181-21.999-2.919 15.863 127.455 Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) 53.19310 20.00741 2.659 0.0101 * fb -0.07198 0.02723-2.644 0.0105 * Signif. codes: 0 *** 0.001 ** 0.01 * 0.05. 0.1 1 Residual standard error: 35.06 on 59 degrees of freedom Multiple R-squared: 0.1059, Adjusted R-squared: 0.09077 F-statistic: 6.99 on 1 and 59 DF, p-value: 0.01049 > eb<-forerrors[,4] > fb<-forecasts[,5] > summary(lm(eb~fb)) Call: lm(formula = eb ~ fb) Residuals: Min 1Q Median 3Q Max -97.0634-19.7064-0.7068 18.4386 135.0442 Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) 65.2050 20.6317 3.160 0.00249 ** fb -0.0906 0.0280-3.236 0.00199 ** 46

Signif. codes: 0 *** 0.001 ** 0.01 * 0.05. 0.1 1 Residual standard error: 36.7 on 59 degrees of freedom Multiple R-squared: 0.1507, Adjusted R-squared: 0.1363 F-statistic: 10.47 on 1 and 59 DF, p-value: 0.00199 > # ---------------------------------------------------- 47

Παράρτημα 2 2Α. Κώδικας δημιουργίας γραφημάτων ------------------------------- # Manolis Bozis # es06084@uop.gr # ------------------------------- # commodities # # Remove everything from memory, start from scratch rm(list=ls(all=true)) # Load data from file commodities.csv data<-read.csv("commodities.csv",header=t,sep=";",dec=",") # Convert dates into native R-format and separate the commodities dates <- as.date(data$date,format="%d/%m/%y") kafes <- data[,2] kakao <- data[,3] krithari<-data[,4] rizi<-data[,5] # ------------ Trends ---------------- kafes_trend=lm(kafes~dates) summary(kafes_trend) plot(dates,kafes,type="l",ylab='cofsv-nyc') abline(kafes_trend,col='red') windows() kakao_trend=lm(kakao~dates) summary(kakao_trend) plot(dates,kakao,type="l",ylab='ccarr-nyc') abline(kakao_trend,col='red') windows() krithari_trend=lm(krithari~dates) summary(krithari_trend) plot(dates,krithari,type="l",ylab='bar-term-tex') abline(krithari_trend,col='red') windows() rizi_trend=lm(rizi~dates) summary(rizi_trend) plot(dates,rizi,type="l",ylab='ri-thwht1st-a') abline(rizi_trend,col='red') # ------------------------------------ 48

2Β. Κώδικας ταυτοποίησης υποδειγμάτων ARIMA # Remove everything from memory, start from scratch rm(list=ls(all=true)) # Load data from file commodities.csv data<-read.csv("commodities.csv",header=t,sep=";",dec=",") # Convert dates into native R-format and separate the commodities dates <- as.date(data$date,format="%d/%m/%y") kafes <- data[,2] kakao <- data[,3] krithari<-data[,4] rizi<-data[,5] names<-colnames(data) # ------------ Acfs ---------------- xname=names[2] n <- length(kafes) acf(kafes,lag.max=100,main=paste("acf of series",xname)) windows() acf(diff(kafes),xaxp=c(0,20,10),main=paste("acf of diff series",xname)) windows() xname=names[3] acf(diff(kakao),lag.max=100,main=paste("acf of diff series",xname)) windows() xname=names[4] acf(diff(krithari),lag.max=100,main=paste("acf of diff series",xname)) windows() xname=names[5] acf(diff(rizi),lag.max=100,main=paste("acf of diff series",xname)) library(tsa) eacf(diff(kafes)) eacf(diff(kakao)) eacf(diff(krithari)) eacf(diff(rizi)) # ------------------------------------ 2Γ. Κώδικας benchmarking υποδειγμάτων # Load data from file commodities.csv data<-read.csv("commodities.csv",header=t,sep=";",dec=",") # Convert dates into native R-format and separate the commodities dates <- as.date(data$date,format="%d/%m/%y") kafes <- log(data[,2]) kakao <- log(data[,3]) krithari<-data[,4] 49

rizi<-data[,5] # here we export the length of data T<-length(dates) # 261 t <- seq(t) # here we will define the size of the training and testing samples T0<-200 # training sample = 200 T1<-T-T0 # testing sample = 61 # # here we define how many competing models we are going to have M<-3 # # initialize storage forecasts<-matrix(0,nrow=t1,ncol=m+2) # dim 111 x 4 forerrors<-matrix(0,nrow=t1,ncol=m+1) # dim 111 x 3 # # here we do the actual computations within a loop # for the models # benchmark model is random walk # first competing model is random walk with drift # second competing model is ARIMA(0,1,7) # third competing model is ARIMA(1,1,8) for (i in seq(0,t1-1,1)) { # Split the data yi<-rizi[seq(i+1,t0+i,1)] # for sliding window # compute the forecasts # # Benchmark Forecast : Random walk yfb<-rizi[t0+i] # first competing model : Random walk with drift yf1<-mean(diff(yi))+rizi[t0+i] # second competing model : ARIMA(0,1,7) out_arima <- arima(yi,order=c(0,1,7)) yf2 <- predict(out_arima,n.ahead=1)$pred # Third competing model : ARIMA(1,1,8) out_arima2 <- arima(yi,order=c(0,1,8)) yf3 <- predict(out_arima2,n.ahead=1)$pred } # save everithing forecasts[i+1,]<-c(rizi[t0+i+1],yfb,yf1,yf2,yf3) forerrors[i+1,]<-rizi[t0+i+1]-c(yfb,yf1,yf2,yf3) 50

Βιβλιογραφία 1. Statistical Methods for Forecasting, Bovas Abraham and Johannes Ledolter, John Wiley & Sons,Inc 1983,2005 2. Time Series Analysis with Applications in R, Jonathan D. Cryer Kung Sik Chan, Springer Texts in Statistics, Second Edition 3. Σημειώσεις από τις διαλέξεις του μαθήματος «Χρονολογικές Σειρές» του αναπληρωτή καθηγητή Δημήτριου Θωμάκου, Πανεπιστήμιο Πελοποννήσου, Τμήμα Οικονομικών Σπουδών, 2009. Σχετικές ιστοσελίδες στο διαδίκτυο : 1. http://www.naftemporiki.gr 2. http://www.naftemporiki.gr/markets/contents.asp?serviceid=6 3. http://www.r-project.org 4. http://cran.r-project.org/doc/contrib/usingr.pdf 5. http://en.wikipedia.org/wiki/efficient-market_hypothesis 6. http://en.wikipedia.org/wiki/random_walk_hypothesis 7. http://en.wikipedia.org/wiki/markov_chain 51