ΕΠΑΝΑ ΕΙΓΜΑΤΟΛΗΨΙΑ ΧΡΟΝΟΣΕΙΡΩΝ ΜΕ ΜΝΗΜΗ ΜΑΚΡΑΣ ΙΑΡΚΕΙΑΣ ΚΑΙ ΕΦΑΡΜΟΓΗ

Σχετικά έγγραφα
Χρονικές σειρές 5 Ο μάθημα: Γραμμικά στοχαστικά μοντέλα (1) Αυτοπαλίνδρομα μοντέλα Εαρινό εξάμηνο Τμήμα Μαθηματικών ΑΠΘ

Χρονικές σειρές 2 Ο μάθημα: Εισαγωγή στις χρονοσειρές

A2. ΠΑΡΑΓΩΓΟΣ-ΚΛΙΣΗ-ΜΟΝΟΤΟΝΙΑ

Στατιστική για Πολιτικούς Μηχανικούς Λυμένες ασκήσεις μέρους Β

ΕΛΕΓΧΟΙ ΠΡΟΣΑΡΜΟΓΗΣ & ΥΠΟΘΕΣΕΩΝ

Σηµειώσεις Οικονοµετρίας Ι.. ικαίος Τσερκέζος

αx αx αx αx 2 αx = α e } 2 x x x dx καλείται η παραβολική συνάρτηση η οποία στο x

Στασιμότητα χρονοσειρών Νόθα αποτελέσματα-spurious regression Ο έλεγχος στασιμότητας είναι απαραίτητος ώστε η στοχαστική ανάλυση να οδηγεί σε ασφαλή

1. Εισαγωγή Ο έλεγχος υποθέσεων αναφέρεται στις ιδιότητες µιας άγνωστης παραµέτρους του πληθυσµού: Ο κατηγορούµενος είναι αθώος

4. ΚΕΦΑΛΑΙΟ ΕΦΑΡΜΟΓΕΣ ΤΟΥ ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΥ FOURIER

Εφαρμοσμένη Στατιστική: Συντελεστής συσχέτισης. Παλινδρόμηση απλή γραμμική, πολλαπλή γραμμική

Εργασία στο µάθηµα Ανάλυση εδοµένων

Εισαγωγή στα Προσαρµοστικά Συστήµατα

) = a ο αριθµός των µηχανών n ο αριθµός των δειγµάτων που παίρνω από κάθε µηχανή

ΓΡΑΜΜΙΚΗ ΜΟΝΤΕΛΟΠΟΙΗΣΗ ΜΗ-ΚΑΝΟΝΙΚΩΝ ΧΡΟΝΟΣΕΙΡΩΝ ΜΕΣΩ ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΥ ΣΕ ΚΑΝΟΝΙΚΕΣ ΧΡΟΝΟΣΕΙΡΕΣ

Χρονικές σειρές 8 Ο μάθημα: Μοντέλα κινητού μέσου

ΑΠΟ ΤΟ ΔΕΙΓΜΑ ΣΤΟΝ ΠΛΗΘΥΣΜΟ

Επαναληπτικές Ασκήσεις για το µάθηµα Ψηφιακή Επεξεργασία Σηµάτων

Εισαγωγή στη Χρήση του SPSS for Windows Σελίδα:

ΤΜΗΜΑΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥΣΧΕΔΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝΣΥΣΤΗΜΑΤΩΝ

ΣΤΑΤΙΣΤΙΚΗ ΕΠΕΞΕΡΓΑΣΙΑ ΓΙΑ ΤΗΝ ΑΠΟΤΙΜΗΣΗ ΤΩΝ ΑΠΟΤΕΛΕΣΜΑΤΩΝ

ΣΗΜΕΙΩΣΕΙΣ ΓΙΑ ΤΟ ΜΑΘΗΜΑ ΣΤΑΤΙΣΤΙΚΗ ΓΙΑ ΠΟΛΙΤΙΚΟΥΣ ΜΗΧΑΝΙΚΟΥΣ ΜΕΡΟΣ Β

Χρονολογικές Σειρές (Time Series) Lecture notes Φ.Κουντούρη 2008

ΕΙΣΑΓΩΓΗ. Μη Παραµετρική Στατιστική, Κ. Πετρόπουλος. Τµήµα Μαθηµατικών, Πανεπιστήµιο Πατρών

Μηχανική ΙI. Μετασχηµατισµοί Legendre. της : (η γραφική της παράσταση δίνεται στο ακόλουθο σχήµα). Εάν

Χρονοσειρές, Μέρος Β 1 Πρόβλεψη Χρονικών Σειρών

ΜΑΘΗΜΑ 3ο. Βασικές έννοιες

Κεφάλαιο 2. Μέθοδος πεπερασµένων διαφορών προβλήµατα οριακών τιµών µε Σ Ε

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

2. Στοιχεία Πολυδιάστατων Κατανοµών

1.4 Λύσεις αντιστρόφων προβλημάτων.

Χρονικές σειρές 10 Ο μάθημα: Μη στάσιμα μοντέλα ARIMA Μεθοδολογία Box-Jenkins Εαρινό εξάμηνο Τμήμα Μαθηματικών ΑΠΘ

Χρονικές σειρές 6 Ο μάθημα: Αυτοπαλίνδρομα μοντέλα (2)

Εργασία στο µάθηµα Ανάλυση εδοµένων

ΟΝΟΜΑΤΕΠΩΝΥΜΟ

Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 19/5/2017

Ευστάθεια Συστηµάτων Αυτοµάτου Ελέγχου: Αλγεβρικά κριτήρια

[ ], σχηµατίζουµε το άθροισµα. Το άθροισµα αυτό είναι µια δυαδική πράξη η οποία αντιστοιχεί στις ακολουθίες f [ 1

Κεφάλαιο 7 Βασικά Θεωρήµατα του ιαφορικού Λογισµού

Βέλτιστα Ψηφιακά Φίλτρα: Φίλτρα Wiener, Ευθεία και αντίστροφη γραµµική πρόβλεψη

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium iv

Άσκηση 1 (α) ============================================================== Έχουµε L = π, εποµένως η σειρά Fourier είναι: 1 2 a. cos. a n. b n.

ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Τραπεζικής & Χρηματοοικονομικής

Αριθμητική εύρεση ριζών μη γραμμικών εξισώσεων

Ανάλυση Δεδοµένων µε χρήση του Στατιστικού Πακέτου R

ΣΤΟΧΑΣΤΙΚΑ ΣΗΜΑΤΑ ΚΑΙ ΕΦΑΡΜΟΓΕΣ

4.3. Γραµµικοί ταξινοµητές

Χρονοσειρές - Μάθημα 9 Aνάλυση χρονοσειρών και δυναμικά συστήματα

Κεϕάλαιο 6. Χρονοσειρές

MEΤΑΣΧΗΜΑΤΙΣΜΟΙ ΤΗΣ ΜΟΡΦΗΣ Y= g( X1, X2,..., Xn)

στατιστική θεωρεία της δειγµατοληψίας

Αλγόριθµοι και Πολυπλοκότητα

11 Το ολοκλήρωµα Riemann

3. ΣΕΙΡΙΑΚΟΣ ΣΥΝΤΕΛΕΣΤΗΣ ΣΥΣΧΕΤΙΣΗΣ

Ακαδηµαϊκό Έτος , Εαρινό Εξάµηνο ιδάσκων Καθ.: Νίκος Τσαπατσούλης

ΤΜΗΜΑΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥΣΧΕΔΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝΣΥΣΤΗΜΑΤΩΝ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ

ΠΑΡΟΥΣΙΑΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ

Κεφάλαιο 3 ΣΥΣΧΕΤΙΣΗ ΚΑΙ ΠΑΛΙΝ ΡΟΜΗΣΗ. 3.1 Συσχέτιση δύο τ.µ.

ΚΕΦΑΛΑΙΟ 3 ΜΕΛΕΤΗ ΑΠΟ ΟΣΗΣ ΚΑΙ ΕΠΙΤΥΧΙΑΣ ΗΜΕΡΗΣΙΩΝ ΗΜΟΣΙΩΝ ΚΑΙ Ι ΙΩΤΙΚΩΝ ΛΥΚΕΙΩΝ ΕΙΣΑΓΩΓΗ

Πολλαπλή παλινδρόµηση. Μάθηµα 3 ο

cov(x, Y ) = E[(X E[X]) (Y E[Y ])] cov(x, Y ) = E[X Y ] E[X] E[Y ]

Κεφάλαιο 6 Παράγωγος

Γραµµικός Προγραµµατισµός - Μέθοδος Simplex

Στοχαστικές Μέθοδοι στους Υδατικούς Πόρους Φασματική ανάλυση χρονοσειρών

ΤΕΣΤ ΣΤΑΤΙΣΤΙΚΗΣ ΕΦΑΡΜΟΣΜΕΝΗΣ ΣΤΑΤΙΣΤΙΚΗΣ ΓΕΩΡΓΙΚΟΥ ΠΕΙΡΑΜΑΤΙΣΜΟΥ. Τεστ 1 ο Κατανοµή Συχνοτήτων (50 βαθµοί)

ΤΜΗΜΑΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥΣΧΕΔΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝΣΥΣΤΗΜΑΤΩΝ

Έλεγχος Υποθέσεων. Δρ. Αθανάσιος Δαγούμας, Επ. Καθηγητής Οικονομικής της Ενέργειας & των Φυσικών Πόρων, Πανεπιστήμιο Πειραιώς

2) Περιγραφή ιακριτών Ποσοτικών εδοµένων

1. Ποιες είναι οι διαφορές μεταξύ αυτοπαλίνδρομων υποδειγμάτων (AR) και υποδειγμάτων κινητού μέσου (MA);

ΠΟΛΥΩΝΥΜΙΚΕΣ - ΡΗΤΕΣ ΑΝΙΣΩΣΕΙΣ P x = x+ 2 4 x x 3x x x x 3x

Thanasis Xenos ΕΛΛΗΝΙΚΗ ΜΑΘΗΜΑΤΙΚΗ ΕΤΑΙΡΕΙΑ ΠΑΡΑΡΤΗΜΑ ΗΜΑΘΙΑΣ

Επαναληπτικές Ερωτήσεις για Οικονοµετρία 2

Ακρότατα υπό συνθήκη και οι πολλαπλασιαστές του Lagrange

Τεχνικές Προβλέψεων Αυτοπαλινδρομικά Μοντέλα Κινητού Μέσου Όρου (ARIMA)

Σηµειώσεις στις σειρές

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium Iii

ΓΡΑΜΜΙΚΗ ΠΑΛΙΝ ΡΟΜΗΣΗ

ΤΜΗΜΑΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥΣΧΕΔΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝΣΥΣΤΗΜΑΤΩΝ

ONE WAY ANOVA. .Π.Μ.Σ. Μαθηµατικά των Υπολογιστών & των αποφάσεων. Πάτρα, 11 Ιανουαρίου 2011

11ο Πανελλήνιο Συνέδριο της ΕΕΦ, Λάρισα 30-31/03, 1-2/04/2006. Πρακτικά Συνεδρίου

ΚΕΦΑΛΑΙΟ 5 ΤΟ ΠΛΕΟΝΕΚΤΗΜΑ ΤΩΝ ΥΠΟΨΗΦΙΩΝ ΠΑΛΑΙΟΤΕΡΩΝ ΕΤΩΝ

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 8. Συνεχείς Κατανομές Πιθανοτήτων Η Κανονική Κατανομή

Είδη Μεταβλητών. κλίµακα µέτρησης

ΚΑΤΑΝΟΜΕΣ ΠΙΘΑΝΟΤΗΤΑΣ ΤΥΧΑΙΩΝ ΜΕΤΑΒΛΗΤΩΝ (Συνέχεια)

A6. ΕΛΑΣΤΙΚΟΤΗΤΑ-ΡΥΘΜΟΣ ΑΝΑΠΤΥΞΗΣ

ΑΝΑΛΥΣΗ ΤΗΣ ΑΠΟΚΛΙΣΗΣ ΑΠΟ ΤΗΝ ΗΜΙΤΟΝΟΕΙΔΗ ΚΑΜΠΥΛΗ ΒΡΟΧΟΠΤΩΣΗΣ ΚΑΙ ΧΡΗΣΗ ΤΗΣ ΩΣ ΔΕΙΚΤΗ ΚΛΙΜΑΤΙΚΗΣ ΑΛΛΑΓΗΣ

Εκτίμηση μη-γραμμικών χαρακτηριστικών

Q 12. c 3 Q 23. h 12 + h 23 + h 31 = 0 (6)

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ

ΚΕΦΑΛΑΙΟ 3 ΑΡΙΘΜΗΤΙΚΗ ΕΠΙΛΥΣΗ ΓΡΑΜΜΙΚΩΝ ΣΥΣΤΗΜΑΤΩΝ. nn n n

ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ ΜΠΣ Τραπεζικής & Χρηματοοικονομικής

, όπου οι σταθερές προσδιορίζονται από τις αρχικές συνθήκες.

ΕΙΣΑΓΩΓΗ ΣΤΙΣ ΧΡΟΝΟΛΟΓΙΚΕΣ ΣΕΙΡΕΣ (Time-series Analysis)

Είδαµε στο προηγούµενο κεφάλαιο ότι, όταν τα δεδοµένα που χρησιµοποιούνται σε ένα υπόδειγµα, δεν προέρχονται από στάσιµες χρονικές σειρές έχουµε το

ΜΑΘΗΜΑ 4 ο. Μοναδιαία ρίζα

Λύσεις 1 ης Σειράς Ασκήσεων (Αξιολόγηση της Αποτελεσµατικότητας της Ανάκτησης)

Ασκήσεις για το µάθηµα «Ανάλυση Ι και Εφαρµογές» (ε) Κάθε συγκλίνουσα ακολουθία άρρητων αριθµών συγκλίνει σε άρρητο αριθµό.

Γενικές Παρατηρήσεις για τις Εργαστηριακές Ασκήσεις Φυσικοχηµείας

Transcript:

ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΣΧΟΛΗ ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΦΥΣΙΚΗΣ ΜΕΤΑΠΤΥΧΙΑΚΟ ΥΠΟΛΟΓΙΣΤΙΚΗΣ ΦΥΣΙΚΗΣ Γεωργία Κιούση ΕΠΑΝΑ ΕΙΓΜΑΤΟΛΗΨΙΑ ΧΡΟΝΟΣΕΙΡΩΝ ΜΕ ΜΝΗΜΗ ΜΑΚΡΑΣ ΙΑΡΚΕΙΑΣ ΚΑΙ ΕΦΑΡΜΟΓΗ ιπλωµατική Εργασία Επιβλέπων: Κουγιουµτζής ηµήτρης Επίκουρος Καθηγητής, Γενικό Τµήµα, Πολυτεχνική Σχολή Α.Π.Θ. Θεσσαλονίκη, Ιούνιος 2010

Περιεχόµενα 1. Εισαγωγή 1.1 Συσχετίσεις, αυτοσυσχέτιση και φάσµα ισχύος... 5 1.2 Μέθοδος φιλτραρίσµατος Fourier... 8 1.3 Εκτίµηση του εκθέτη συσχέτισης µακράς κλίµακας... 10 1.3.1 Ανάλυση αλλαγής κλίµακας τους εύρους... 10 1.3.2 Ανάλυση διακυµάνσεων µε απαλοιφή τάσης... 13 1.3.3 Προβλήµατα εκτίµησης εκθέτη Hurst. 16 1.4 Η έννοια των υποκατάστατων χρονοσειρών... 16 1.5 Έλεγχοι υποθέσεων και σηµαντικότητας... 20 2. Υποκατάστατες χρονοσειρές και µελέτη διατήρησης των συσχετίσεων των αρχικών χρονοσειρών 2.1 Εκτίµηση εκθέτη Hurst... 22 2.2 Στατιστικός έλεγχος της διατήρησης του εκθέτη Hurst.. 28 Α. Μετρήσεις των ποσοστών απόρριψης από τη δηµιουργία υποκατάστατων χρονοσειρών άµεσα.. 28 Β. Μετρήσεις των ποσοστών απόρριψης από τη δηµιουργία υποκατάστατων χρονοσειρών έµµεσα 33 2.3 Συζήτηση αποτελεσµάτων... 37 3. Προσθήκη εξωτερικής τάσης και προσπάθεια εντοπισµού της µε τη βοήθεια των υποκατάστατων χρονοσειρών 3.1 Εξωτερική τάση... 38 3.2 Υπολογισµός µέγιστης κλίσης... 39 3.3 Σχέση ανάµεσα στον εκθέτη φάσµατος η και την κλίση b... 40 3.4 Μελέτη της φύσης των τάσεων των χρονοσειρών... 41 3.5 Μελέτη αποτελεσµάτων... 45 3.6 Συµπεράσµατα µελέτης... 50 4. Μελέτη τάσεων σε πραγµατική χρονοσειρά 4.1 Εφαρµογή 51 Α. Μελέτη διατήρησης συσχετίσεων µακράς κλίµακας 52 Β. Μελέτη διατήρησης τάσεων. 53 4.2 Συζήτηση των αποτελεσµάτων 54 5. Συµπεράσµατα 57 Παραρτήµατα Α. Ο κώδικας για τον υπολογισµό εκθέτη συσχέτισης µακράς κλίµακας.. 60 Β. Ο κώδικας για τον υπολογισµό µέγιστης κλίσης µιας χρονοσειράς... 62 Γ. Ο κώδικας για τον έλεγχο σηµαντικότητας... 64 Βιβλιογραφία... 66-2 -

- 3 -

Περίληψη Στη διπλωµατική εργασία αυτή, µελετάµε χρονοσειρές µε µακράς κλίµακας συσχετίσεις (δηλαδή η αυτοσυσχέτιση ακολουθεί νόµο δύναµης, η 1 συγκεκριµένα για 0< η< 1 είναι ρ( τ ) τ ). Αυτές οι χρονοσειρές δηµιουργήθηκαν µε τη µέθοδο φιλτραρίσµατος Fourier για εκθέτες η= 1,,3. Για η < 2 οι χρονοσειρές είναι στάσιµες ενώ για η > 2 είναι µη στάσιµες. Η µελέτη βασίζεται πάνω στη θεωρία υποκατάστατων χρονοσειρών που δηµιουργούνται µε τους αλγόριθµους AAFT, IAAFT και STAP. Αρχικά θα µελετηθούν οι αλγόριθµοι ως προς τη διατήρηση των συσχετίσεων µακράς κλίµακας στις υποκατάστατες χρονοσειρές µε στατιστικό ελέγχου τον εκθέτη συσχετίσεων µακράς κλίµακας Hurst Η. Ο στατιστικός έλεγχος πραγµατοποιείται µε το z-score και την µέθοδο rank ordering µε επίπεδο σηµαντικότητας 5%. Για τον υπολογισµό του Η χρησιµοποιούµε την DFA και την R/S ανάλυση. Παρατηρούµε ότι ο AAFT δεν διατηρεί τις συσχετίσεις, ο IAAFT και ο STAP τις διατηρούν για στάσιµες χρονοσειρές, ενώ για µη στάσιµες χρονοσειρές επιλέγουµε τη δηµιουργία των υποκατάστατων χρονοσειρών από τις µεταβολές της αρχικής για να µπορέσουν οι δύο αλγόριθµοι να τις διατηρήσουν. Στη συνέχεια επεκτείνουµε την µελέτη µας σε χρονοσειρές που έχουν υποστεί προσθήκη εξωτερικών γραµµικών τάσεων. ηµιουργούνται πάλι υποκατάστατες χρονοσειρές και ελέγχεται η διατήρηση των εξωτερικών τάσεων σε αυτές. Παρατηρούµε ότι ο IAAFT µπορεί να τις διαχωρίσει από τις τάσεις του συστήµατος (µε εξαίρεση χρονοσειρές µε µικρό µήκος Ν και µικρό εκθέτη η) ενώ ο STAP το επιτυγχάνει µόνο για τις χρονοσειρές µε η < 2. Τέλος, θα δούµε ένα παράδειγµα της χρονοσειράς της θερµοκρασίας του βορείου ηµισφαιρίου για τα έτη 1850 2006, όπου παρουσιάζεται γραµµική τάση µε κλίση 0,0059. Η µηδενική υπόθεση που κάνουµε είναι ότι η τάση αυτή είναι εσωτερική του συστήµατος του κλίµατος και όχι εξωγενής παρέµβαση σε αυτό (π.χ. ανθρωπογενής παρέµβαση). Θα χρησιµοποιήσουµε εννιά ανακατασκευασµένες χρονοσειρές µε διάφορα µοντέλα που προσοµοιώνουν τη θερµοκρασία στα προγενέστερα του 1850 έτη. Οι χρονοσειρές αυτές παρουσιάζουν συσχετίσεις µακράς κλίµακας. Πρώτα ελέγχουµε αν οι AAFT, IAAFT και STAP διατηρούν τις συσχετίσεις αυτές µε στατιστικό ελέγχου τον H. Αφού διαπιστωθεί ότι τις διατηρούν, επόµενο βήµα είναι να ελέγξουµε αν ισχύει η µηδενική υπόθεση. Καταλήγουµε στο συµπέρασµα ότι η τάση της χρονοσειράς της θερµοκρασίας των ετών 1850 2006 κλίσης 0,0059 δεν µπορεί να δικαιολογηθεί µέσω των τάσεων των µακρινών συσχετίσεων αλλά οφείλεται σε εξωτερικούς παράγοντες. - 4 -

Abstract In the present thesis, we study time series with long term correlations (ie. η 1 < η< is ρ( τ ) τ ). These the autocorrelation follows power law, which for 0 1 time series have been constructed with the Fourier filtering method for spectral exponents η= 1,,3. Time series for η < 2 are stationary, while for η > 2 are non stationary. This work is based on the theory of surrogate data, constructed by the algorithms AAFT, IAAFT and STAP. Initially, the algorithms will be tested on the preservation of the long term correlations with Hurst exponent H as test statistic. The statistical test is realized by using z-score and rank ordering method, with significance level 5%. DFA and R/S analysis are used for the calculation of H. We observe that AAFT does not preserve the correlations, while IAAFT and STAP preserve them, but only for stationary time series. For non stationary, we choose to create the surrogates by using the first differences of the initial time series in order to succeed. Next, we extend our study on time series that have external linear trends. Again, we create surrogates and test whether external trends are preserved. We see that IAAFT can separate external trends from the internal ones (except for short time series with small exponent η), while STAP achieves that only for η < 2. In the last chapter, we apply on the time series of the temperatures of northern hemisphere for the years 1850 2006, where linear trend of slope 0.0059 is observed. The null hypothesis is that this trend is internal due to the long term correlations of the climate and not external (ie. anthropogenic causes). We use nine reconstructed (by various models) time series, simulating the temperatures in the years prior to 1850. These time series present long term correlations. First, we check whether AAFT, IAAFT and STAP preserve these correlations with test statistic the H. Having seen that this is true, our next step is to test the null hypothesis. Our conclusion is that the trend of the original time series of the temperature for the years 1850 2006 with slope 0.0059 cannot be justified by the internal trends due the long term correlations, but it is the aftermath of external factors. - 5 -

Κεφάλαιο 1 Εισαγωγή 1.1 Συσχετίσεις, αυτοσυσχέτιση και φάσµα ισχύος Η χρονοσειρά µιας µεταβλητής { 0, 1,..., N } πραγµατοποίηση µιας στοχαστικής διαδικασίας { y t } t= χρονοσειρά της µεταβολής των τιµών της µεταβλητής { 0, 1,..., N } θεωρηθεί ως πραγµατοποίηση µιας άλλης στοχαστικής διαδικασίας { } y y y µπορεί να θεωρηθεί ως [1,2]. Αντίστοιχα η x x x, µπορεί να x =. Η µεταβολή των τιµών της µεταβλητής θα ορίζεται από δω και στο εξής από τις πρώτες διαφορές των τιµών της µεταβλητής xt = yt yt 1 [3]. Ο λόγος για να χρησιµοποιηθούν οι πρώτες διαφορές αντί για την ίδια τη χρονοσειρά είναι ότι οι µεταβολές ενός µεγάλου συνόλου µη στάσιµων χρονοσειρών είναι στάσιµες χρονοσειρές. Έτσι η διαδικασία της διαφόρισης κάνει δυνατό την εφαρµογή αναλυτικών εργαλείων και θεωρητικών αποτελεσµάτων που έχουν αναπτυχθεί για στάσιµες χρονοσειρές στις µη στάσιµες. t t Σχήµα 1.1: (α) Μη στάσιµη χρονοσειρά και (β) η συνάρτηση αυτοσυσχέτισής της, (γ) Στάσιµη χρονοσειρά και (δ) η συνάρτηση αυτοσυσχέτισής της - 6 -

Στο Σχήµα 1.1 (α,β) έχουµε ένα παράδειγµα µιας µη στάσιµης χρονοσειράς (κατασκευασµένης µε τη µέθοδο φιλτραρίσµατος Fourier, παρ. 1.2) και της αυτοσυσχέτισής της. ιαπιστώνουµε ότι οι τιµές της αυτοσυσχέτισης φθίνουν πολύ αργά, γεγονός που υποδυκνείει ότι η χρονοσειρά έχει τάσεις. Στο Σχήµα 1.1 (γ) φαίνεται η χρονοσειρά των µεταβολών και στο Σχήµα 1.1 (δ) η συνάρτηση αυτοσυσχέτισής της. ιαπιστώνουµε εδώ ότι για χρόνο υστέρησης 0 έχει αυτοσυσχέτιση 1, όπως είναι φυσικό, και ότι για χρόνο υστέρησης 1 η αυτοσυσχέτιση έχει τιµή 0,17. Αµέσως µετά όµως πέφτει στο 0 και διατηρείται εκεί όσο και να µεγαλώνει ο χρόνος υστέρησης. Φαίνεται δηλαδή ότι πλέον η χρονοσειρά δεν έχει τάσεις. Θεωρητικά, η αυτοσυσχέτιση ορίζεται από τη σχέση: ρ τ = Ε y µ µ { t yt τ } ( ) ( )( ) ενώ αριθµητικά υπολογίζουµε την εκτίµηση αυτοσυσχέτισης: Ν 1 r ( τ ) = ( yt µ )( yt τ µ ) Ν τ t= τ + 1 όπου µ η µέση τιµή της χρονοσειράς, τ ο χρόνος υστέρησης και Ν το µήκος της χρονοσειράς. Η παρούσα εργασία βασίζεται σε υπολογιστικές µεθόδους, εποµένως χάριν συντοµίας θα χρησιµοποιούµε τον όρο «αυτοσυσχέτιση ρ» εννοώντας την εκτίµηση αυτοσυσχέτισης r. Για τη µελέτη συσχετίσεων σε χρονοσειρές χρησιµοποιείται η αυτοσυσχέτιση, που είναι η κανονικοποίηση της αυτοδιασποράς µε τη διασπορά [3,4]. Η αυτοσυσχέτιση µετράει τη συσχέτιση µεταβλητών της { } y t t= που βρίσκονται σε χρονική υστέρηση τ και αποτελεί ένα µέτρο της «µνήµης» της στοχαστικής διαδικασίας. Για παράδειγµα, ο λευκός θόρυβος έχει µηδενική µνήµη και η αυτοσυσχέτιση µηδενίζεται για όλες τις µη µηδενικές υστερήσεις. Μαρκοβιανές στοχαστικές διαδικασίες κάποιας τάξης έχουν πεπερασµένη µνήµη και η αυτοσυσχέτιση φθίνει εκθετικά. Η µορφή της συνάρτησης αυτοσυσχέτισης σε αυτή τη περίπτωση είναι: ( ) = exp ( ν / ) ρ τ τ τ ο δηλαδή φθίνει εκθετικά µε ρυθµό που δίνεται από τον εκθέτη ν και το χρόνο συσχέτισης τ. Ο χαρακτηριστικός χρόνος µνήµης υποδηλώνεται από την ο τιµή του ( ) τ c = ρ τ dτ. Για υστερήσεις µεγαλύτερες του τ c η αυτοσυσχέτιση 0 πρακτικά µηδενίζεται. Τέτοιες στοχαστικές διαδικασίες έχουν συσχετίσεις βραχείας κλίµακας. Υπάρχουν όµως και στοχαστικές διαδικασίες όπου η αυτοσυσχέτιση φθίνει αργά ακολουθώντας κάποιο νόµο δύναµης, ο οποίος για 0< η< 1 είναι: και το ολοκλήρωµα ρ ( τ ) 0 1 ( ) τ η ρ τ dτ δεν είναι πεπερασµένο. εν υπάρχει δηλαδή, κάποιος χαρακτηριστικός χρόνος τ c που να χωρίζει σε χρόνους ύπαρξης µνήµης (υστερήσεις µη µηδενικής αυτοσυσχέτισης) και µη ύπαρξη µνήµης (υστερήσεις µηδενικής αυτοσυσχέτισης). Μεταβλητές της στοχαστικής - 7 -

διαδικασίας παραµένουν συσχετισµένες όσο µακριά χρονικά και αν βρίσκονται και µια τέτοια στοχαστική διαδικασία έχει συσχετίσεις µακράς κλίµακας. Μια τυχαία ακολουθία σηµείων στο διάγραµµα της χρονοσειράς δείχνει έλλειψη συσχετίσεων µεταξύ των τιµών της χρονοσειράς. Μία τέτοια χρονοσειρά ονοµάζεται "τυχαία", που σηµαίνει ότι η τιµή σε έναν χρόνο t ειναι ανεξάρτητη από τις τιµές σε άλλες χρονικές στιγµές. Αντιθέτως, αν οι διαδοχικές τιµές µιας χρονοσειράς δεν είναι ανεξάρτητες µεταξύ τους, τότε η χρονοσειρά δεν είναι τυχαία (σχήµα 1.2). Σχήµα 1.2: ιάγραµµα χρονοσειράς όπου οι τιµές φαίνεται να επιµένουν να διατηρούνται στα ύψη τους. Υπάρχει δηλαδή τάση οι υψηλές τιµές να ακολουθούν υψηλές τιµές και οι χαµηλές να ακολουθούν χαµηλές (τµήµατα µέσα σε κύκλους). Τέτοιο διάγραµµα χαρακτηρίζει σειρές µε θετική αυτοσυσχέτιση. Οι στατιστικές ιδιότητες που χαρακτηρίσαµε µε την αυτοσυσχέτιση µπορούν να χαρακτηριστούν ισοδύναµα µε το φάσµα ισχύος (θεώρηµα Wiener Khinchin [5] ), που δίνεται ως: π fτ S f e d = 2 ( ) γ ( τ ) όπου γ ( τ ) είναι η αυτοδιασπορά: γ ( τ ) ( µ ) 0 τ { y 2 τ } = Ε. - 8 -

1.2 Μέθοδος φιλτραρίσµατος Fourier Θεωρώντας την έκφραση νόµου δύναµης για το φάσµα ισχύος S ( f ) 1/ f η δηµιουργούνται χρονοσειρές µε µακράς κλίµακας συσχετίσεις για διαφορετικές τιµές του εκθέτη η. Η δηµιουργία αυτών των χρονοσειρών ξεκινά µε τη δηµιουργία µη συσχετισµένων τιµών x i που ακολουθούν Γκαουσιανή κατανοµή. Στη συνέχεια µετασχηµατίζουµε αυτή τη χρονοσειρά µε τον µετασχηµατισµό Fourier στον πεδίο των συχνοτήτων. Πολλαπλασιάζονται ύστερα οι συντελεστές Fourier µε 1/ f η και τέλος επιστρέφουµε στο πεδίο του χρόνου χρησιµοποιώντας τον αντίστροφο µετασχηµατισµό Fourier. Με αυτόν τον τρόπο έχουµε την επιθυµητή χρονοσειρά µακρών συσχετίσεων x i [6]. Για η< 2 η ενέργεια φθίνει µε σταθερό ρυθµό που δηµιουργεί µακρές συσχετίσεις χωρίς όµως η χρονοσειρά να µπορεί να χαρακτηριστεί µηστάσιµη. Αυτό συµβαίνει για η= 2, όπου έχουµε τυχαίο περίπατο. Αντίστοιχα για η= 2.5, 3 οι χρονοσειρές αποτελούν ολοκληρώσεις των χρονοσειρών για η= 0,5 και η= 1 αντίστοιχα. Για τις τελευταίες η ενέργεια φθίνει µε ταχύ ρυθµό µε τη συχνότητα και ουσιαστικά η ενέργεια συγκεντρώνεται µόνο στις πολύ χαµηλές συχνότητες (αργές τάσεις), σχήµα 1.3. Σχήµα 1.3: Χρονοσειρές από στοχαστικές διαδικασίες µε φάσµα ισχύος του τύπου S f f η για τιµές του εκθέτη η = 1.0 : 0.5 : 3.0 ( ) 1/ - 9 -

Σχήµα 1.4: Αυτοσυσχέτιση για τους διαφορετικούς εκθέτες η = 1.0 : 0.5 : 3.0 Για τιµές του εκθέτη η< 2 οι χρονοσειρές έχουν κατά κύριο λόγο µακράς κλίµακας αρνητικές συσχετίσεις (αντι-συσχετίσεις). ηλαδή µια αύξηση µιας τιµής της χρονοσειράς ακολουθείται από µια µείωση της επόµενης. Εποµένως η χρονοσειρά παρουσιάζει έντονες διακυµάνσεις. Όσο όµως αυξάνει ο εκθέτης, δηλαδή η 2, οι χρονοσειρές αποκτούν µακράς κλίµακας θετικές συσχετίσεις, έτσι η αύξηση σε µια τιµή της χρονοσειράς είναι πιο πιθανό να ακολουθηθεί από µια ακόµα αύξηση ή η µείωση από µείωση (σχήµα 1.3). Αυτό έχει ως αποτέλεσµα η χρονοσειρά να παρουσιάζει αργές τάσεις. Στο Σχήµα 1.4 φαίνεται η αυτοσυσχέτιση των χρονοσειρών µε τους παραπάνω χαρακτηριστικούς εκθέτες φάσµατος, όπου παρουσιάζεται ανάλογη συµπεριφορά. ηλαδή οι έντονες µεταβολές παρουσιάζονται στην αυτοσυσχέτιση όταν έχουµε αρνητικές συσχετίσεις ( η< 2 ) ενώ η αυτοσυσχέτιση φαίνεται να φθίνει και να αυξάνει µε πιο σταθερό ρυθµό όταν οι συσχετίσεις γίνονται θετικές ( η 2 ). - 10 -

1.3 Εκτίµηση του εκθέτη συσχέτισης µακράς κλίµακας Για τη µέτρηση της συσχέτισης µακράς κλίµακας θα αναφερθούµε όχι στον εκθέτη η αλλά σε έναν άλλο εκθέτη, τον εκθέτη Hurst Η [7], που σχετίζεται µε τον εκθέτη η ως η = 2Η 1 για τη (στάσιµη) χρονοσειρά των µεταβολών x t και η = 2Η + 1 για τη (µη στάσιµη) χρονοσειρά y t που προκύπτει από την ολοκλήρωση της x t [3, 6]. Ο δείκτης Hurst δηλώνει το βαθµό και τον τύπο της αυτo-συνάφειας, η οποία αναφέρεται στη σχέση της κλίµακας του χρόνου και της κλίµακας των τιµών της παρατηρούµενης διαδικασίας. Η τιµή H = 0.5 χαρακτηρίζει τυχαίο περίπατο y t µε τυχαία βήµατα iid. Για τιµές H < 0.5 έχουµε µακράς κλίµακας αρνητικές συσχετίσεις των δεδοµένων ενώ για H > 0.5 έχουµε µακράς κλίµακας θετικές συσχετίσεις. Στη συνέχεια η εκτίµηση του εκθέτη Hurst θα γίνει µε δύο µεθόδους, την ανάλυση κλίµακας του εύρους (rescaled range analysis, R/S analysis) [7-9] και την ανάλυση διακυµάνσεων ή αυξοµοιώσεων µε απαλοιφή τάσης (detrended fluctuation analysis, DFA) [10 13]. 1.3.1 Ανάλυση αλλαγής κλίµακας του εύρους Η πρώτη µέθοδος για την ανάλυση µακράς κλίµακας συσχετίσεων [3, 7-9], η οποία βασίζεται στη θεωρία του τυχαίου περιπάτου, προτάθηκε από τον ίδιο τον Η. Ε. Hurst (1880-1978). Η µέθοδος ξεκινάει µε τον διαχωρισµό της χρονοσειράς των µεταβολών της µεταβλητής x t (και όχι τη χρονοσειρά της µεταβλητής) σε ν τµήµατα µήκους παραθύρου n, οδηγώντας σε συνολικά N = N / n τµήµατα. Στο δεύτερο βήµα, υπολογίζεται το προφίλ κάθε n [ ] τµήµατος v = 0,, N n 1 από την ολοκλήρωση: όπου x vn 1 s i= 1 j ( j) ( x n i xvn ) Υ = ν ν + i= 1 = xν n+ i είναι ο τοπικός µέσος όρος σε κάθε τµήµα ν. n Στο τρίτο βήµα σε κάθε τµήµα ν υπολογίζεται το εύρος Rv ( ) απόκλιση S ( n ) του προφίλ από τις σχέσεις: v n n 2 ( ) = max ( ) min ( ) S ( n) Y ( j) R n Y j Y j v j= 1 v j= 1 v v 1 n n j = 1 = n και η τυπική Τέλος, υπολογίζεται ο µέσος όρος του λόγου εύρους προς την τυπική απόκλιση από όλα τα τµήµατα: Nn 1 1 Rv ( n) FRS ( n) = N S n n ν = 0 v ( ) v - 11 -

όπου για µεγάλα παράθυρα µήκους n, n 1, ισχύει ο νόµος κλίµακας: F n n Η F ( ) RS RS ( ) H n µετράει τη µεταβολή των τιµών του προφίλ της χρονοσειράς για παράθυρα αυξανόµενου µήκους n. Παράδειγµα υπολογισµού του εκθέτη Hurst µε τη R/S analysis Ως παράδειγµα υπολογισµού του εκθέτη Hurst µε την ανάλυση R/S κατασκευάζουµε µε τη µέθοδο φιλτραρίσµατος Fourier χρονοσειρές µήκους Ν = 512 και Ν = 1024, για τιµές φασµατικού εκθέτη η= 1: 0,5 : 3. Για αυτές τις χρονοσειρές θα δηµιουργήσουµε τα λογαριθµικά διαγράµµατα της F ( n ) συναρτήσει του µήκους παραθύρου n (σχήµα 1.5). RS (α) (β) (γ) (δ) - 12 -

(ε) (στ) (ζ) (η) (θ) (ι) Σχήµα 1.5: Εκτίµηση του εκθέτη Hurst από το γράφηµα λογαρίθµου της συνάρτησης ανάλυσης κλίµακας του εύρους από χρονοσειρά µε εκθέτη φάσµατος η και µήκος Ν ως εξής: (α) η = 1, Ν =512, (β) η = 1, Ν =4096, (γ) η = 1.5, Ν =512, (δ) η = 1.5, Ν =4096, (ε) η = 2, Ν =512, (στ) η = 2, Ν =4096, (ζ) η = 2.5, Ν =512, (η) η = 2.5, Ν =4096, (θ) η = 3, Ν =512, (ι) η = 3, Ν =4096 Οι εκτιµήσεις του εκθέτη Hurst που υπολογίστηκαν φαίνονται στον Πίνακα 1.1. - 13 -

Πίνακας 1.1: Εκτίµηση του εκθέτη Hurst µε τη µέθοδο της ανάλυσης κλίµακας του εύρους για διαφορετικές τιµές µήκους της χρονοσειράς Ν και εκθέτη φάσµατος η Ν = 512 Ν = 4096 η Εκθέτης Ηurst H Αναµενόµενη τιµή Η 1 0.32 0 1.5 0.49 0.25 2 0.59 0.5 2.5 0.72 0.75 3 0.85 1 1 0.29 0 1.5 0.43 0.25 2 0.58 0.5 2.5 0.75 0.75 3 0.88 1 1.3.2 Ανάλυση διακυµάνσεων µε απαλοιφή τάσης Η δεύτερη µέθοδος για την ανάλυση µακράς κλίµακας συσχετίσεων βασίζεται και αυτή στη θεωρία του τυχαίου περιπάτου, προτάθηκε από τον Peng [3, 10-13] και αποτελεί ως σήµερα µια πολύ σηµαντική µέθοδο για την ανίχνευση µακρών συσχετίσεων σε µη στάσιµες χρονοσειρές. Η µέθοδος ξεκινάει µε τον διαχωρισµό της χρονοσειράς των µεταβολών της µεταβλητής x t σε τµήµατα µήκους n για αυξανόµενα n από την αρχή προς το τέλος της χρονοσειράς και από το τέλος προς την αρχή, όπως στην ανάλυση R/S. Έτσι N = N / n τµήµατα. για κάθε µήκος χρονικού παραθύρου n έχουµε [ ] Σε κάθε τµήµα v = 0,, N n 1 εκτιµούµε την τάση βαθµού m µε προσαρµογή πολυωνύµου y m v, n ( j ) βαθµού m στα δεδοµένα y j, για j= 1,, n. Το απαλλαγµένο προφίλ από την τάση είναι: m y = y y j ( ) j j Ο βαθµός του πολυωνύµου ποικίλλει ώστε να απαλείψει σταθερή (m=0), γραµµική (m=1), τετραγωνική (m=2) ή υψηλότερης τάξης τάση. Έτσι η µέθοδος DFA για κάποιο βαθµό πολυωνύµου m συνήθως συµβολίζεται ως DFAm. Η διακύµανση (αυξοµείωση) σε κάθε τµήµα ν δίνεται ως: 2 v v, n 1 n n j = 1 = ( ) 2 F n y Τέλος, η τετραγωνική ρίζα του µέσου όρου των διακυµάνσεων υπολογίζεται από όλα τα τµήµατα: 2Nn 1 1 2 FDFA ( n) = F ( ) m v n 2Nn ν = 0 j n 1/ 2-14 -

Παράδειγµα υπολογισµού του εκθέτη Hurst µε τη DFA analysis (α) (β) (γ) (δ) (ε) (στ) (ζ) (η) - 15 -

(θ) (ι) Σχήµα 1.6: Εκτίµηση του εκθέτη Hurst από το γράφηµα λογαρίθµου της συνάρτησης DFA1 από χρονοσειρά µε εκθέτη φάσµατος η και µήκος Ν ως εξής: (α) η = 1, Ν =512, (β) η = 1, Ν =4096, (γ) η = 1.5, Ν =512, (δ) η = 1.5, Ν =4096, (ε) η = 2, Ν =512, (στ) η = 2, Ν =4096, (ζ) η = 2.5, Ν =512, (η) η = 2.5, Ν =4096, (θ) η = 3, Ν =512, (ι) η = 3, Ν =4096 Στο σχήµα 1.6 παρουσιάζεται η εκτίµηση του εκθέτη Hurst από το γράφηµα F n vs log n για χρονοσειρές µήκους 512 και 4096 για διάφορες τιµές log DFA1 ( ) του εκθέτη η = 1.0 : 0.5 : 3.0. Οι εκτιµήσεις του εκθέτη Hurst φαίνονται στον Πίνακα 1.2. Πίνακας 1.2: Εκτίµηση του εκθέτη Hurst µε τη µέθοδο της ανάλυσης διακυµάνσεων µε απαλοιφή τάσης για διαφορετικές τιµές µήκους της χρονοσειράς Ν και εκθέτη φάσµατος η Ν = 512 Ν = 4096 η Εκθέτης Ηurst H Αναµενόµενη τιµή Η 1 0.17 0 1.5 0.32 0.25 2 0.54 0.5 2.5 0.71 0.75 3 0.94 1 1 0.17 0 1.5 0.32 0.25 2 0.53 0.5 2.5 0.78 0.75 3 1.02 1 Συγκριτικά αν πάρουµε τις δύο µεθόδους θα διαπιστώσουµε ότι η DFA προσεγγίζει καλύτερα τα αναµενόµενα αποτελέσµατα. Όσο µάλιστα αυξάνει το µήκος της χρονοσειράς τόσο πιο ακριβή γίνονται. Πρόβληµα πάντως φαίνεται να παρουσιάζουν και οι δύο µέθοδοι για την εκτίµηση του εκθέτη Hurst όταν η τιµή του είναι 0. - 16 -

1.3.3 Προβλήµατα εκτίµησης εκθέτη Hurst Στον υπολογισµό της κλίσης των σχηµάτων 1.5-1.6 παρατηρούνται δύο προβλήµατα. Το πρώτο έχει να κάνει µε τη µη διατήρηση του νόµου κλίµακας για µεγάλα χρονικά παράθυρα που πλησιάζουν το µήκος της χρονοσειράς. Αυτό είναι αναµενόµενο καθώς σε αυτή την περίπτωση οι τιµές των παραθύρων είναι πολύ λίγες µε αποτέλεσµα τις µεγάλες αποκλίσεις. Για αυτόν τον λόγο έχουν αποκλειστεί κατά την προσαρµογή της ευθείας ελαχίστων τετραγώνων το 10% των αρχικών σηµείων και το 20% των τελικών σηµείων για τα οποία ο νόµος κλίµακας δε διατηρείται. Το δεύτερο πρόβληµα είναι το ίδιο το µήκος της χρονοσειράς. Όταν το µήκος της χρονοσειράς είναι µικρό, τα παράθυρα που µπορούµε να σχηµατίσουµε για να υπολογίσουµε τη διασπορά είναι λιγότερα και έτσι η εκτίµηση του εκθέτη H είναι πιο ασταθής. Η ακρίβεια της εκτίµησης βελτιώνεται όταν το µήκος της χρονοσειράς αυξηθεί σηµαντικά [3]. Αναµένουµε δηλαδή µε την αύξηση του µήκους να αυξάνεται και η ακρίβεια στον υπολογισµό του εκθέτη Hurst. 1.4 Η έννοια των υποκατάστατων χρονοσειρών Η µέθοδος των υποκατάστατων χρονοσειρών εφαρµόζεται ευρέως για να ελεγχθεί µια χρονοσειρά σε κάποια υπόθεση. Τα φυσικά φαινόµενα στον πραγµατικό κόσµο οφείλονται σε συγκεκριµένες αιτίες. Έτσι διαφορετικές αιτίες έχουν ως αποτέλεσµα οι χρονοσειρές να παρουσιάζουν σηµαντικές διαφοροποιήσεις. Μπορεί να είναι τυχαίες ή να παρουσιάζουν ψευδοπεριοδικότητα ή ακόµα να έχουν εµφανείς περιοδικές τάσεις, για παράδειγµα. Για να κατανοηθεί ο µηχανισµός που είναι υπεύθυνος για τη δηµιουργία αυτών των διαφορετικών χρονοσειρών, διατυπώνεται µία µηδενική υπόθεση. Αν, για παράδειγµα, θέλαµε να µελετήσουµε τη χρονοσειρά ως προς τη µη γραµµικότητα, η µηδενική υπόθεση θα ήταν ότι η χρονοσειρά προέρχεται από µια γραµµική διαδικασία η οποία έχει υποστεί πιθανότατα κάποιο στατικό, µη γραµµικό µετασχηµατισµό. Αφού έχει οριστεί αυτή η υπόθεση στη συνέχεια δηµιουργούνται υποκατάστατες χρονοσειρές [14-20] και επιλέγεται το κατάλληλο στατιστικό ελέγχου της µηδενικής υπόθεσης, δηλαδή κάποιο µέγεθος, όπως είναι ο εκθέτης Hurst ή ο φασµατικός εκθέτης. Η βασική ιδέα είναι να παραχθεί ένας αριθµός από διαφορετικές πραγµατοποιήσεις υπό την µηδενική υπόθεση. Στη συνέχεια το στατιστικό ελέγχου υπολογίζεται για την αρχική χρονοσειρά και για το δείγµα αυτό των υποκατάστατων χρονοσειρών. Αν διαπιστωθεί ότι οι τιµές του στατιστικού ελέγχου για τις υποκατάστατες χρονοσειρές και για την αρχική διαφέρουν σηµαντικά καταλήγουµε σε απόρριψη της µηδενικής υπόθεσης. Για να δηµιουργηθούν οι υποκατάστατες χρονοσειρές χρησιµοποιούνται κάποιοι αλγόριθµοι, τρεις από τους οποίους θα παρουσιάσουµε στη συνέχεια: ο AAFT (Amplitude Αdjusted Fourier transform) [14], ο IAAFT (Iterative Amplitude Adjusted Fourier transform) [15,16] και ο STAP (Statistically Transformed Autoregressive Process) [17]. - 17 -

AAFT Στον αλγόριθµο αυτόν [14] αρχικά παίρνουµε µια χρονοσειρά λευκού κανονικού θορύβου, δηλαδή µια τυχαία χρονοσειρά µε κανονική κατανοµή, και διατάσσουµε τα στοιχεία της ώστε να ταιριάζουν στη σειρά κατάταξης της αρχικής χρονοσειράς { n } ' x g ( x ) x (rank ordering). Έτσι δηµιουργείται η χρονοσειρά n= n. Αφού πάρουµε τον µετασχηµατισµό Fourier της { ' n} ανακατεύουµε µε τυχαίο τρόπο τις φάσεις τους ώστε να συµπίπτει το φάσµα ισχύος της µε αυτό της αρχικής χρονοσειράς και έτσι προκύπτει η χρονοσειρά x ' n. Τέλος, παίρνουµε τον αντίστροφο µετασχηµατισµό Fourier της x ' n και { } { } αφού δούµε µε ποια σειρά κατανέµονται τα στοιχεία της (rank ordering) πηγαίνουµε τελικά στην αρχική χρονοσειρά και διατάσσουµε τα δεδοµένα της µε βάση τα νέα δεδοµένα της x ' n. Ο AAFT αλγόριθµος είναι ασυµπτωτικά { } σωστός για N [15]. Οι υποκατάστατες χρονοσειρές έχουν την ίδια κατανοµή ακριβώς µε αυτή της αρχικής χρονοσειράς και προσεγγίζουν το φάσµα ισχύος της. Σηµειώνεται ότι η γραµµική δοµή (φάσµα ισχύος ή αυτοσυσχέτιση) των AAFT υποκατάστατων µπορεί να διαφέρει σηµαντικά από την αντίστοιχη δοµή της αρχικής. ηλαδή, ο AAFT γενικά αποτυγχάνει να ταιριάξει σωστά στις υποκατάστατες χρονοσειρές τις γραµµικές συσχετίσεις. Ο λόγος για αυτό είναι η ενδογενής υπόθεση στον αλγόριθµο ότι ο στατικός µετασχηµατισµός στη µηδενική υπόθεση είναι µονοτονικός, το οποίο δε µπορεί να υποτεθεί για πραγµατικά δεδοµένα [20, 21]. Έτσι λοιπόν, αποκλίσεις στις γραµµικές συσχετίσεις µπορεί να υπάρξουν όταν ο µετασχηµατιµός δεν είναι µονοτονικός. Εποµένως ο αλγόριθµος AAFT µπορεί να χρησιµοποιηθεί για να ελεγχθεί η µηδενική υπόθεση ότι η χρονοσειρά δηµιουργείται από µια γκαουσιανή διαδικασία η οποία έχει υποστεί µόνο µονοτονικό στατικό µετασχηµατισµό. x, Σχήµα 1.7: Αρχική χρονοσειρά (µπλε) και 2 υποκατάστες χρονοσειρές µε τη µέθοδο AAFT (κόκκινη, γαλάζια) και το διάγραµµα αυτοσυσχέτισής τους Στο σχήµα 1.7 παρατηρούµε στο διάγραµµα αυτοσυσχέτισης της αρχικής και δύο υποκατάστατων της χρονοσειρών ότι υπάρχουν αποκλίσεις στις - 18 -

υποκατάστατες αλλά είναι µικρές. Η αρχική χρονοσειρά έχει δηµιουργηθεί από ένα AR µοντέλο και δεν έχει υποστεί µονοτονικό µετασχηµατισµό. IAAFT Μια καλύτερη προσέγγιση των γραµµικών συσχετίσεων επιτυγχάνεται µε έναν απλό επαναληπτικό βρόγχο [15]. Ξεκινάµε µε µια τυχαία αναδιάταξη των δεδοµένων της αρχικής χρονοσειράς. Στη συνέχεια η επανάληψη αποτελείται από δύο συνεχή βήµατα. Στο πρώτο βήµα δηµιουργούµε µια χρονοσειρά λευκού θορύβου τα τετράγωνα των µέτρων της οποίας αντικαθίστανται από αυτά της αρχικής χρονοσειράς ώστε να πάρουµε το επιθυµητό φάσµα ισχύος ενώ διατηρούνται τα ορίσµατά τους. Έτσι σε αυτό το πρώτο βήµα διατηρείται το φάσµα ισχύος, όµως η περιθωριακή κατανοµή τροποποιείται. Για αυτό στο δεύτερο βήµα διατάσσουµε τα στοιχεία ώστε να έχουν την ίδια σειρά µεγέθους µε την αρχική χρονοσειρά, ώστε να πετύχουµε την επιθυµητή κατανοµή. υστυχώς όµως και πάλι το φάσµα ισχύος θα αλλάξει. Έτσι αυτά τα δύο βήµατα θα χρειαστεί να επαναληφθούν πολλές φορές ώστε να επιτύχουµε την επιθυµητή σύγκλιση και ως προς την αυτοσυσχέτιση και ως προς την κατανοµή. Τα IAAFT υποκατάστατα δεδοµένα διατηρούν την κατανοµή, συµπίπτει το φάσµα ισχύος µε αυτό της αρχικής και είναι κατά τα άλλα τυχαία. Η γραµµική δοµή των IAAFT υποκατάστατων παρουσιάζει µικρές αποκλίσεις µε αυτή της αρχικής αλλά σε ορισµένες περιπτώσεις οι διαφορές µπορεί να είναι σηµαντικές ώστε να οδηγήσουν σε απόρριψη. Αυτό γιατί ο αλγόριθµος έχει πάντα την ίδια κατεύθυνση, δηλαδή οι υποκατάστατες χρονοσειρές είναι πάντα λιγότερο συσχετισµένες από ότι η αρχική [18,19]. Ο αλγόριθµος IAAFT µπορεί να χρησιµοποιηθεί για να ελεγχθεί η µηδενική υπόθεση ότι η χρονοσειρά δηµιουργείται από µια γκαουσιανή διαδικασία η οποία έχει υποστεί στατικό µετασχηµατισµό (όχι µόνο µονοτονικό). Σχήµα 1.8: Αρχική χρονοσειρά (µπλε) και 2 υποκατάστες χρονοσειρές µε τη µέθοδο IAAFT (κόκκινη, γαλάζια) και το διάγραµµα αυτοσυσχέτισής τους Στο σχήµα 1.8 παρατηρούµε ότι η συνάρτηση αυτοσυσχέτισης των υποκατάστατων χρονοσειρών συµπίπτει καλύτερα µε την αρχική. - 19 -

STAP Ο STAP [17] δηµιουργεί στοχαστικά υποκατάστατα της αρχικής χρονοσειράς, ως πραγµατοποιήσεις µιας κατάλληλα στατικής µετασχηµατισµένης Γκαουσιανής αυτοπαλινδροµούµενης διαδικασίας. Η αυτοσυσχέτιση και η κατανοµή της αρχικής χρονοσειράς διατηρείται και στις υποκατάστατες χρονοσειρές. Ο αλγόριθµος STAP για τη δηµιουργία υποκατάστατων χρονοσειρών z χρονοσειράς x πραγµατοποιείται ως εξής: Κατασκευάζεται λευκός κανονικός θόρυβος w. Ο µετασχηµατισµός του από την κανονική στη ζητούµενη κατανοµή προσεγγίζεται µε πολυώνυµο βαθµού m. Η αυτοσυσχέτιση της AR(p) διαδικασίας u δίνεται σαν πολυωνυµική συνάρτηση βαθµού m της αυτοσυσχέτισης της αρχικής χρονοσειράς r x. Έτσι, µπορεί να υπολογιστεί η αυτοσυσχέτιση r u. Εν συνεχεία, οι παράµετροι του AR µοντέλου τάξης p µπορούν να υπολογιστούν µε τον αλγόριθµο του Levinson. Εποµένως µπορεί να κατασκευαστεί χρονοσειρά u µε το µοντέλο AR(p) και να µετασχηµατιστεί στη z, ώστε η z να έχει ίδια αυτοσυσχέτιση και κατανοµή µε την αρχική χρονοσειρά x. Επειδή πρακτικά όµως η αυτοσυσχέτιση r z δεν είναι ακριβώς ίδια µε την r x, επαναλαµβάνουµε Κ φορές τη διαδικασία, δηµιουργώντας ένα δείγµα από Κ υποψήφιες υποκατάστατες χρονοσειρές, επιλέγοντας αυτήν µε την κοντινότερη αυτοσυσχέτιση στην r x [18]. Η γραµµική δοµή των STAP υποκατάστατων παρουσιάζει µεγαλύτερες διακυµάνσεις από ότι ο IAAFT αλλά καµία σηµαντική διαφορά από την αρχική αυτοσυσχέτιση. Ο αλγόριθµος STAP µπορεί να χρησιµοποιηθεί για να ελεγχθεί η µηδενική υπόθεση ότι η χρονοσειρά δηµιουργείται από µια γκαουσιανή διαδικασία η οποία έχει υποστεί στατικό µετασχηµατισµό (όχι µόνο µονοτονικό). Σχήµα 1.9: Αρχική χρονοσειρά (µπλε) και 2 υποκατάστες χρονοσειρές µε τη µέθοδο STAP (κόκκινη, γαλάζια) και το διάγραµµα αυτοσυσχέτισής τους Στο σχήµα 1.10 παριστάνονται τα διαγράµµατα αυτοσυσχέτισης µιας χρονοσειράς, που έχει δηµιουργηθεί µε ένα AR µοντέλο, µε τους τρεις αλγόριθµους AAFT, IAAFT και STAP, για 100 δείγµατά τους. Παρατηρούµε ότι η διασπορά της αυτοσυσχέτισης είναι µεγαλύτερη για τον STAP αλγόριθµο - 20 -

από ότι στους άλλους δύο. Ο IAAFT παρουσιάζει µάλιστα πολύ µικρή διασπορά, µε αποτέλεσµα η τάση που έχει η αυτοσυσχέτιση των υποκατάστατων να είναι µικρότερη από αυτήν της αρχικής να γίνεται πολύ σηµαντική. Οµοίως και ο AAFT παρουσιάζει αυτήν την τάση και επιπλέον έχει µεγαλύτερη διασπορά, η οποία στην περίπτωση µη µονοτονικού µετασχηµατισµού της αρχικής χρονοσειράς αυξάνει. Σχήµα 1.10: Η αυτοσυσχέτιση της αρχικής χρονοσειράς (κόκκινη γραµµή) και 100 υποκατάστατών της (µπλε γραµµές) µε τους αλγόριθµους: (α) AAFT, (β) IAAFT, (γ) STAP 1.5 Έλεγχοι υποθέσεων και σηµαντικότητας Για να αποφασίσουµε αν θα δεχτούµε ή θα απορρίψουµε µια υπόθεση ή για να βρούµε εάν τα αποτελέσµατα από δείγµατα διαφέρουν σηµαντικά από αυτά που αναµένονται σύµφωνα µε την υπόθεση, χρησιµοποιούµε διάφορες διαδικασίες, µεθόδους και κανόνες που καλούνται γενικά έλεγχοι υποθέσεων ή έλεγχοι σηµαντικότητας [22]. Όταν ελέγχουµε µια υπόθεση, η µέγιστη πιθανότητα µε την οποία δεχόµαστε να κάνουµε σφάλµα καλείται επίπεδο ή στάθµη σηµαντικότητας. Ως επίπεδο σηµαντικότητας χρησιµοποιείται συνήθως το 0.05 (αυτό θα είναι και το επίπεδο σηµαντικότητας στους επόµενους ελέγχους που θα κάνουµε). ηλαδή αν απορρίψουµε την υπόθεση, είµαστε 95% βέβαιοι ότι πήραµε τη σωστή απόφαση. Στα δεδοµένα µας δύο θα είναι οι έλεγχοι που θα γίνουν. Ο ένας είναι ο έλεγχος µε την τυποποιηµένη µεταβλητή Ζ (z-score) και ο άλλος µε την ταξινόµηση των δεδοµένων κατά αύξουσα σειρά (rank ordering). Στο z-score q0 q η τυποποιηµένη µεταβλητή υπολογίζεται από τη σχέση: Z =, όπου q 0 σ είναι η τιµή του στατιστικού ελέγχου για την αρχική χρονοσειρά, q είναι η µέση τιµή του στατιστικού ελέγχου για τις υποκατάστατες χρονοσειρές και σ q η τυπική τους απόκλιση. Αν λοιπόν πάρουµε ένα δείγµα και βρούµε την τιµή z ανάµεσα στις τιµές -1.96 και +1.96 τότε η υπόθεσή µας είναι ορθή. Σε διαφορετική περίπτωση η υπόθεση απορρίπτεται. Στη µέθοδο rank ordering ταξινοµούµε τις τιµές που υπολογίσαµε για την αρχική χρονοσειρά και τις υποκατάστατες κατά αύξουσα σειρά. Βρίσκουµε στη συνέχεια τη σειρά κατάταξης της τιµής της αρχικής χρονοσειράς. Αν αυτή είναι σε σειρά κατάταξης µικρότερη από το µισό του µήκους των υπό µελέτη τιµών η q - 21 -

( q ) 2 0 1/ 2 πιθανότητα υπολογίζεται από τη σχέση p =, ενώ αν είναι M + 1 µεγαλύτερη από το µισό του µήκους η πιθανότητα υπολογίζεται από τη σχέση q0 1/ 2 p = 2 1 M + 1, όπου q 0 η σειρά κατάταξης της αρχικής τιµής και M ο αριθµός των υποκατάστατων χρονοσειρών. Αν τελικά η τιµή του p που υπολογίζεται είναι µικρότερη από 0.05 τότε η µηδενική υπόθεση απορρίπτεται σε επίπεδο σηµαντικότητας 0.05 (εφαρµογές στα επόµενα κεφάλαια). - 22 -

Kεφάλαιο 2 Υποκατάστατες χρονοσειρές και µελέτη διατήρησης των συσχετίσεων των αρχικών χρονοσειρών 2.1 Εκτίµηση εκθέτη Hurst Οι αλγόριθµοι δηµιουργίας υποκατάστατων χρονοσειρών AAFT [14], IAAFT [15,16], STAP [17] δηµιουργούνται έτσι ώστε να καταφέρουν να κρατήσουν τις γραµµικές συσχετίσεις της αρχικής, δηλαδή την αυτοσυσχέτιση ή το φάσµα ισχύος, και να είναι κατά τα άλλα τυχαίες, διατηρώντας όµως την περιθώρια κατανοµή. Εποµένως το πρώτο βήµα θα αφορά τη µελέτη της διατήρησης των µακρών συσχετίσεων στις υπό µελέτη χρονοσειρές. Αρχικά θα δηµιουργηθούν οι χρονοσειρές µε τη µέθοδο φιλτραρίσµατος Fourier που αναλύθηκε στην εισαγωγή. Πιο συγκεκριµένα οι παράγοντες που επηρεάζουν τις συσχετίσεις που έχουν οι χρονοσειρές είναι δύο: πρώτον ο εκθέτης φάσµατος η, ο οποίος όσο µεγαλύτερος είναι τόσο πιο έντονες είναι οι τάσεις που παρουσιάζει η χρονοσειρά και τόσο πιο αργά φθίνει η αυτοσυσχέτισή της (Σχήµα 1.4), και δεύτερον το µήκος της χρονοσειράς Ν. Η µελέτη, λοιπόν, των συσχετίσεων θα πρέπει να λαµβάνει υπόψιν της αυτούς τους δύο παράγοντες. Στη µελέτη µας θεωρούµε πέντε διαφορετικές τιµές του εκθέτη η = 1, 1.5, 2, 2.5, 3 και τέσσερις διαφορετικές τιµές του µήκους της χρονοσειράς Ν = 512, 1024, 2048, 4096. Για κάθε συνδυασµό εκθέτη φάσµατος µήκος χρονοσειράς δηµιουργούµε 100 δείγµατα χρονοσειρών και για κάθε δείγµα δηµιουργούµε 100 υποκατάστατες χρονοσειρές µε κάθε έναν από τους τρεις αλγόριθµους AAFT, IAAFT, STAP. Έτσι, για παράδειγµα, έχουµε για η = 1 και Ν = 512, 100 δείγµατα χρονοσειρών, όπου για κάθε δείγµα δηµιουργούνται 100 υποκατάστατα ξεχωριστά µε κάθε έναν από τους τρεις αλγόριθµους. Στη συνέχεια, θα δηµιουργηθούν 100 δείγµατα, για η = 1 και Ν =1024 µε 100 υποκατάστατα για το κάθε δείγµα, κ.ο.κ.. Για τη δηµιουργία των υποκατάστατων χρονοσειρών θα θεωρήσουµε ακόµα δύο διαφορετικούς τρόπους κατασκευής τους, δηλαδή, να γίνει είτε άµεσα από την αρχική χρονοσειρά, δηλαδή απευθείας από τα δείγµατα των χρονοσειρών που δηµιουργήθηκαν παραπάνω, είτε έµµεσα από τις µεταβολές των χρονοσειρών των παραπάνω δειγµάτων. Με αυτόν τον τρόπο θα ελέγξουµε αν οι αλγόριθµοι δηµιουργίας υποκατάστατων χρονοσειρών καταφέρνουν να διατηρούν καλύτερα τα γραµµικά στοιχεία των αρχικών, όπως συζητήθηκε στην παρουσίασή τους (Παρ. 1.4). Ανασταλτικό παράγοντα αποτελεί η µη στασιµότητα των χρονοσειρών που παρουσιάζεται για η 2. Οι AAFT, IAAFT θεωρούνται πιο κατάλληλοι για τη δηµιουργία υποκατάστατων στις µη στάσιµες χρονοσειρές επειδή βασίζονται στη µορφή του φάσµατος ισχύος. Αντίθετα ο STAP είναι λιγότερο κατάλληλος γιατί χρησιµοποιεί στάσιµο AR µοντέλο για τη δηµιουργία των υποκατάστατων χρονοσειρών. Στη συνέχεια, θα ελεγχθεί η δηµιουργία τους µε τις δύο παραπάνω προσεγγίσεις - 23 -

για να διαπιστωθεί µε ποιον τρόπο διατηρούνται καλύτερα οι µακρές συσχετίσεις. Το επόµενο βήµα λοιπόν θα είναι αφού έχουµε δηµιουργήσει τις υποκατάστατες χρονοσειρές µε τους αλγόριθµους AAFT, IAAFT, STAP να γίνει και έλεγχος αν τελικά αυτές οι υποκατάστατες χρονοσειρές καταφέρνουν να αποτελούν σωστά υποκατάστατα, µε την έννοια να µπορούν να διατηρούν τις συσχετίσεις των αρχικών χρονοσειρών. Η µελέτη µάλιστα θα επεκταθεί για τις χρονοσειρές που έχουν υποστεί µη µονοτονικό µετασχηµατισµό (δηλαδή τετραγωνικό µετασχηµατισµό) και για αυτές που έχουν υποστεί µονοτονικό µετασχηµατισµό (δηλαδή κυβικό µετασχηµατισµό). Για να γίνει ο έλεγχος θα χρειαστεί κάποιο στατιστικό ελέγχου. Ένα µέτρο δηλαδή, το οποίο θα υπολογίζει τις συσχετίσεις στην αρχική χρονοσειρά και στις υποκατάστατες. Τέτοιο µέτρο αποτελεί ο εκθέτης συσχέτισης µακράς κλίµακας, δηλαδή ο εκθέτης Hurst. Όπως αναφέρθηκε στην παράγραφο 1.3 ο υπολογισµός του θα γίνει µε δύο τρόπους: την ανάλυση αλλαγής κλίµακας του εύρους [7-9] και την ανάλυση διακυµάνσεων µε απαλοιφή τάσης [10-13]. Σύντοµα επαναλαµβάνεται η λογική των δύο µεθόδων. Χωρίζουµε τη χρονοσειρά σε παράθυρα ορισµένου µήκους. Σε αυτά τα παράθυρα υπολογίζεται η διασπορά που παρουσιάζουν οι τιµές της χρονοσειράς. Η διαφορά των δύο µεθόδων βρίσκεται σε αυτό το σηµείο. H R/S Analysis υπολογίζει τη διασπορά από το τετράγωνο της διαφοράς της µέγιστης από την ελάχιστη τιµή, ενώ αντίθετα η DFA Analysis υπολογίζει τη διασπορά από όλα τα σηµεία του παραθύρου µέσω µιας προσαρµογής ενός πολυωνύµου (στη δική µας µελέτη το πολυώνυµο αυτό είναι πρώτου βαθµού). Όπως γίνεται κατανοητό η δεύτερη µέθοδος είναι και πιο ακριβής καθώς λαµβάνει υπόψιν της όλα τα σηµεία. Αφού υπολογιστεί η διασπορά σε όλα τα παράθυρα, λαµβάνεται τελικά ο µέσος όρος, ο οποίος αποτελεί τη διασπορά που παρουσιάζει η χρονοσειρά για το συγκεκριµένο µήκος παραθύρου. Στη συνέχεια η ίδια δουλειά θα γίνει µε διαφορετικό µήκος παραθύρου. Καταλήγουµε να διαπιστώσουµε ότι η µεταβολή της διασποράς συναρτήσει του µήκους του παραθύρου είναι: H ( ) log ( ) ~ log ( ) F n n F n H n ηλαδή, η διασπορά είναι ανάλογη του µήκους του παραθύρου υψωµένο σε κάποιον εκθέτη. Αυτός ο εκθέτης είναι ο εκθέτης συσχέτισης µακράς κλίµακας που µας ενδιαφέρει να υπολογίσουµε. Για να γίνει λοιπόν η εκτίµηση της τιµής του εκθέτη Hurst παίρνουµε τα λογαριθµικά διαγράµµατα των συναρτήσεων ανάλυσης κλίµακας εύρους και ανάλυσης διακυµάνσεων µε απαλοιφή τάσης. Γίνεται γραµµική προσαρµογή των τιµών του γραφήµατος, όπου ο συντελεστής µας δίνει την τελική εκτίµηση του εκθέτη Hurst για τη συγκεκριµένη χρονοσειρά. Στα σχήµατα 2.1-2.4 παρουσιάζονται τα λογαριθµικά διαγράµµατα µε τις µεθόδους DFA και R/S, για χρονοσειρές µε εκθέτη η = 2, µήκος Ν = 2048 που έχουν υποστεί τετραγωνικό και κυβικό µετασχηµατισµό. - 24 -

(α) (β) (γ) Σχήµα 2.1: Λογαριθµικά διαγράµµατα συνάρτησης ανάλυσης κλίµακας εύρους (R/S) για την αρχική χρονοσειρά µήκους N = 2048 µε εκθέτη φάσµατος η = 2 που έχει υποστεί τετραγωνικό µετασχηµατισµό (γαλάζια γραµµή) και ένα δείγµα 100 υποκατάστατών της µε τους τρεις διαφορετικούς αλγόριθµους (α) AAFT, (β) IAAFT, (γ) STAP (α) (β) (γ) Σχήµα 2.2: Οµοίως όπως στο σχήµα 2.1 αλλά µε ανάλυση διακυµάνσεων µε απαλοιφή τάσης (DFA1). (α) (β) (γ) Σχήµα 2.3: Οµοίως όπως στο σχήµα 2.1 αλλά µε κυβικό µετασχηµατισµό. (α) (β) (γ) Σχήµα 2.4: Οµοίως όπως στο σχήµα 2.2 αλλά µε κυβικό µετασχηµατισµό - 25 -

Το πρώτο που γίνεται εµφανές από τα σχήµατα 2.1-2.4 είναι ότι η διασπορά που παρουσιάζουν οι τιµές της κλίσης µε τη µέθοδο DFA είναι µεγαλύτερη από ότι µε την R/S. Πιο συγκεκριµένα στα σχήµατα 2.1(α,β) και 2.2(α,β) φαίνεται πως η εκτίµηση του εκθέτη Hurst για τον τετραγωνικό µετασχηµατισµό παρουσιάζει δυσκολία µε τις µεθόδους AAFT, IAAFT σε αντίθεση µε τον STAP (σχ. 2.1(γ), 2.2(γ)). Αντίθετα µεγαλύτερη ακρίβεια φαίνονται να έχουν οι κλίσεις των υποκατάστατων χρονοσειρών για αυτές που έχουν υποστεί κυβικό µετασχηµατισµό (σχ. 2.3, 2.4). (α) (β) (γ) (δ) Σχήµα 2.5: Εκτίµηση εκθέτη Hurst µε R/S(α,γ) και DFA(β,δ) για χρονοσειρά που έχει υποστεί µη µονοτονικό µετασχηµατισµό (α,β) και µονοτονικό µετασχηµατισµό (γ,δ) µε τους τρεις αλγόριθµους AAFT, IAAFT, STAP. Στο σχήµα 2.5 παρουσιάζουµε ενδεικτικά τα αποτελέσµατα που δίνουν οι αλγόριθµοι δηµιουργίας υποκατάστατων χρονοσειρών για τις περιπτώσεις των σχηµάτων 2.1-2.4. Έτσι παρατηρούµε αρχικά ότι ο AAFT δυσκολεύεται να δηµιουργήσει υποκατάστατες χρονοσειρές που να διατηρούν τον εκθέτη Hurst της αρχικής και µε τις δύο µεθόδους DFA, R/S για τους δύο µετασχηµατισµούς (σχ. 2.5(α-δ)). Αντίθετα ο IAAFT προσεγγίζει αρκετά ικανοποιητικά την τιµή, ενώ τέλος ο STAP παρουσιάζει κι αυτός αποκλίσεις που γίνονται ιδιαίτερα σηµαντικές στον µονοτονικό µετασχηµατισµό. - 26 -

Στη συνέχεια θα παρουσιάσουµε µερικά σχήµατα, ώστε να πάρουµε µια οπτική εικόνα στον τρόπο µε τον οποίο λειτουργούν οι αλγόριθµοι δηµιουργίας υποκατάστατων χρονοσειρών σε σχέση µε την αρχική χρονοσειρά. Στο Σχήµα 2.6 και 2.7 απεικονίζονται γραφήµατα χρονοσειρών για τις διάφορες τιµές του η συγκριτικά µε τις υποκατάστατες χρονοσειρές, που προκύπτουν από τις µεθόδους AAFT, IAAFT, STAP ώστε να υπάρξει και µια οπτική απεικόνιση τους. (α) (β) (γ) (δ) (ε) Σχήµα 2.6: Υποκατάστατες χρονοσειρές µε τις µεθόδους AAFT, IAAFT, STAP για εκθέτη η (α) 1.0, (β) 1.5, (γ) 2.0, (δ) 2.5, (ε) 3.0 για χρονοσειρές που προέρχονται άµεσα από τις αρχικές χρονοσειρές. Κάθε τετράδα σχηµάτων αποτελείται από την αρχική χρονοσειρά (πάνω αριστερά), ΑΑFT υποκατάστατα (πάνω δεξιά), ΙΑΑFT υποκατάστατα (κάτω αριστερά) και STAP υποκατάστατα (κάτω δεξιά) - 27 -

(α) (β) (γ) (δ) (ε) Σχήµα 2.7: Οµοίως µε το σχήµα 2.6 αλλά για χρονοσειρές που προέρχονται έµµεσα από τις µεταβολές των αρχικών χρονοσειρών. Γίνεται εµφανές στα Σχήµατα 2.6, 2.7 η δυσκολία που παρουσιάζουν τα υποκατάστατα των AAFT, STAP να διατηρήσουν τις συσχετίσεις όσο αυξάνει ο η. Βλέπουµε ήδη στο σχήµα 2.6(γ) ότι ο AAFT και ο STAP ότι δε µπορούν να διατηρήσουν τις αργές τάσεις (µη στασιµότητα). Αντίθετα στο σχήµα 2.7(γ) φαίνεται να λειτουργούν πολύ καλύτερα όταν τα υποκατάστατα προκύπτουν από τη χρονοσειρά των µεταβολών και να διατηρούν τις αργές τάσεις. Ο IAAFT φαίνεται να λειτουργεί πολύ ικανοποιητικά και στις δύο περιπτώσεις. Πρόβληµα πάντως φαίνεται να παρουσιάζουν οι AAFT, STAP και στην περίπτωση που δηµιουργούν τις υποκατάστατες χρονοσειρές από τις χρονοσειρές των µεταβολών για µικρό εκθέτη φάσµατος η και πιο συγκεκριµένα για η = 1 (σχ. 2.7(α)). - 28 -

Οι απορρίψεις των ποσοστών οφείλονται στο γεγονός ότι οι αλγόριθµοι AAFT, IAAFT και STAP δεν επιτυγχάνουν να προσεγγίσουν στον επιθυµητό βαθµό τη συνάρτηση αυτοσυσχέτισης. Έτσι οι υποκατάστατες χρονοσειρές δε µπορούν να διατηρήσουν τις συσχετίσεις της αρχικής. Το πρόβληµα µε τα υψηλά ποσοστά απόρριψης οφείλεται ακριβώς σε αυτό. Είναι γνωστό, για παράδειγµα, ότι ο IAAFT δηµιουργεί υποκατάστατα τα οποία είναι ελάχιστα λιγότερο συσχετισµένα από ότι η αρχική χρονοσειρά και κατά περίπτωση σηµαντικά. Επίσης, γνωστό είναι ότι ο STAP, λόγω του ότι προσπαθεί να βρει κατάλληλη τάξη p για το πολυώνυµο του µοντέλου AR(p) (παρ. 1.4, STAP) ώστε να προσεγγίσει την αυτοσυσχέτιση, πολλές φορές αποτυγχάνει, µε αποτέλεσµα η τάξη να είναι πολύ µικρότερη από την επιθυµητή ( p N ), και έτσι σε αρκετές περιπτώσεις να οδηγεί σε απόρριψη της µηδενικής υπόθεσης. Τέλος, ο AAFT είναι προβληµατικός όσον αφορά χρονοσειρές που έχουν υποστεί τετραγωνικό µετασχηµατισµό, γεγονός που κάνει από µόνο του προβληµατική τη χρήση του. 2.2 Στατιστικός έλεγχος της διατήρησης του εκθέτη Hurst Για να βγουν σαφέστερα αποτελέσµατα χρειάζεται να γίνει ένας πιο αναλυτικός έλεγχος. Για τον λόγο αυτόν θα γίνει ένας ευρής έλεγχος της διατήρησης των συσχετίσεων σε ένα µεγάλο φάσµα χρονοσειρών. Έτσι για κάθε εκθέτη η και µήκος χρονοσειράς Ν δηµιουργούµε 100 δείγµατα χρονοσειρών και για το κάθε δείγµα χρονοσειρών δηµιουργούµε 100 υποκατάστατες χρονοσειρές µε τους τρεις αλγόριθµους: AAFT, IAAFT, STAP. Σε κάθε µία από αυτές τις υποκατάστατες χρονοσειρές υπολογίζεται ο εκθέτης συσχέτισης µακράς κλίµακας µε την R/S και DFA Analysis. O εκθέτης Hurst υπολογίζεται και στο αρχικό δείγµα, οπότε και γίνεται σύγκριση της αρχικής τιµής µε τις τιµές που δίνουν οι υποκατάστατες. Μέτρα για την απόρριψη της υπόθεσης ότι οι µακράς κλίµακας συσχετίσεις διατηρούνται και στις υποκατάστατες χρονοσειρές θα αποτελέσουν οι δύο µέθοδοι z-score και rank ordering που αναλύθηκαν στην παράγραφο 1.5. Το επίπεδο σηµαντικότητας θα είναι 5%. Θεωρούµε δηλαδή για κάθε χρονοσειρά το σύνολο των 100 υποκατάστατών της και αν από αυτές το πολύ οι 5 δε διατηρούν τις συσχετίσεις (αποτυχία στην εκτίµηση του εκθέτη Hurst), τότε µπορούµε να δεχτούµε την υπόθεση της διατήρησης τους µε ένα σφάλµα της τάξης του 5 %. Στο τέλος θα έχουµε για κάθε µία χρονοσειρά από το δείγµα των 100 που δηµιουργήσαµε την απόφαση της απόρριψης ή όχι της µηδενικής υπόθεσης. Τέλος, στο σύνολο αυτό των 100 αποφάσεων που κάνουµε υπολογίζουµε τον αριθµό των απορρίψεων. Αυτό αποτελεί το ποσοστό απόρριψης που περιέχεται στους Πίνακες 2.1 και 2.2. Α. Μετρήσεις των ποσοστών απόρριψης από τη δηµιουργία υποκατάστατων χρονοσειρών άµεσα Η µελέτης της διατήρησης ή όχι των συσχετίσεων ξεκινάει σε πρώτη φάση µε τη δηµιουργία των χρονοσειρών άµµεσα από τις αρχικές χρονοσειρές. Στον Πίνακα 2.1 έχουµε το ποσοστό των απορρίψεων όσον αφορά την σωστή εκτίµηση του εκθέτη Hurst για υποκατάστατες χρονοσειρές που έχουν - 29 -

δηµιουργηθεί άµεσα από τις αρχικές και έχουν υποστεί µονοτονικό και µη µονοτονικό µετασχηµατισµό. Ας αναφερθεί ότι τα ποσοστά στα επόµενα διαγράµµατα αφορούν αυτά που έχουν παρθεί µε τη µέθοδο z-score. Οι διαφορές που δίνει η µέθοδος rank ordering είναι της τάξης των ελάχιστων ποσοστιαίων µονάδων µε αποτέλεσµα να µην αλλάζει καθόλου η ποιοτική συµπεριφορά των αλγορίθµων. Για αυτό και στη συνέχεια όπου δε γίνεται ειδική αναφορά στις δύο µεθόδους θα θεωρείται ότι έχουν ισοδύναµο αποτέλεσµα. Ενδιαφέρουσας σηµασίας είναι να δούµε πως µεταβάλλονται αυτά τα ποσοστά µε την αύξηση του εκθέτη φάσµατος η και µε τις δύο µεθόδους υπολογισµού του εκθέτη συσχέτισης µακράς κλίµακας, δηλαδή R/S και DFA Analysis. (α) (β) (γ) Σχήµα 2.8: Γραφήµατα µεταβολής του ποσοστού απορρίψεων της µηδενικής υπόθεσης συναρτήσει του εκθέτη φάσµατος η για (α) AAFT, (β) ΙAAFT, (γ) STAP υποκατάστατα. Αφορούν υποκατάστατα που έχουν δηµιουργηθεί άµεσα από χρονοσειρές που έχουν υποστεί τετραγωνικό µετασχηµατισµό. Η εκτίµηση του Η έγινε µε την µέθοδο DFA. Στο σχήµα 2.8 παριστάνονται οι µεταβολές των ποσοστών απόρριψης της µηδενικής υπόθεσης σε συνάρτηση µε τον εκθέτη φάσµατος για χρονοσειρές µε µη µονοτονικό µετασχηµατισµό. Στο σχήµα 2.8(α) βλέπουµε την µεταβολή για τον ΑΑFT αλγόριθµο. Όπως γνωρίζουµε ο αλγόριθµος αυτός δεν µπορεί να λειτουργήσει σωστά για χρονοσειρές που έχουν υποστεί µη µονοτονικό µετασχηµατισµό, µε αποτέλεσµα εδώ τα ποσοστά απόρριψης να είναι πολύ µεγάλα και να ξεκινούν από το 40% και να φτάνουν πολύ σύντοµα το 100%. Μάλιστα όσο αυξάνει το µήκος της χρονοσειράς το ποσοστό των απορρίψεων αυξάνεται πολύ ακόµα και για µικρό εκθέτη η. Στο (β) γράφηµα βλέπουµε τη συµπεριφορά του IAAFT. Εδώ παρατηρούµε µια πολύ καλύτερη συµπεριφορά καθώς τα ποσοστά για µικρό η είναι πολύ µικρά, γύρω στο 5-10% κι ακόµα κι όταν αυξάνεται ο η, τα ποσοστά απόρριψης αν και αυξάνονται επίσης, παρουσιάζουν πιο ήπιες αυξήσεις που δεν ξεπερνούν το 40% για τις πιο ισχυρές τάσεις που υπάρχουν, δηλαδή για η = 3. Φαίνεται λοιπόν πως ο IAAFT αλγόριθµος µπορεί να φτιάξει υποκατάστατες χρονοσειρές οι οποίες φαίνεται να διατηρούν πολύ καλύτερα τις συσχετίσεις ακόµα κι όταν οι τάσεις γίνονται πολύ έντοντες. Βέβαια τα ποσοστά ακόµα και έτσι υποδυκνείουν ότι κι αυτός ο αλγόριθµος δε καταφέρνει να τις διατηρήσει στο επίπεδο που θα θέλαµε και το οποίο είναι το 5% και δε µπορεί να χαρακτηριστεί χρήσιµος. Τέλος στο (γ) έχουµε τον αλγόριθµο STAP. Ο STAP φαίνεται να µπορεί να διατηρήσει τις συσχετίσεις για µικρό η, µέχρι την τιµή 2, όµως τα ποσοστά φαίνεται να αυξάνουν κατακόρυφα για η = 2.5 και να φτάνουν το 100% για η = 3. Για η = 2.5 µάλιστα η αύξηση γίνεται µεγαλύτερη - 30 -

για µεγαλύτερο µήκος χρονοσειράς. Στα (β) και (γ) δεν φαίνεται να υπάρχουν ουσιώδεις διαφορές για διαφορετικά µήκη της χρονοσειράς. Το σχήµα 2.8 αφορά εκτίµηση του εκθέτη Η µε την ανάλυση DFA. (α) (β) (γ) Σχήµα 2.9: Γραφήµατα µεταβολής του ποσοστού απορρίψεων της µηδενικής υπόθεσης συναρτήσει του εκθέτη φάσµατος η για (α) AAFT, (β) ΙAAFT, (γ) STAP υποκατάστατα. Αφορούν υποκατάστατα που έχουν δηµιουργηθεί άµεσα από χρονοσειρές που έχουν υποστεί τετραγωνικό µετασχηµατισµό. Η εκτίµηση του Η έγινε µε την µέθοδο R/S. Στο σχήµα 2.9 παρατίθενται τα αντίστοιχα γραφήµατα της R/S ανάλυσης. Όπως παρατηρούµε ποιοτικές διαφορές στη συµπεριφορά των δύο µεθόδων δεν υπάρχουν. Φαίνεται απλά τα ποσοστά απόρριψης για τον AAFT και IAAFT να µειώνονται. Στη συνέχεια θα κάνουµε την ίδια µελέτη για τις χρονοσειρές που έχουν υποστεί κυβικό µετασχηµατισµό. (α) (β) (γ) Σχήµα 2.10: Γραφήµατα µεταβολής του ποσοστού απορρίψεων της µηδενικής υπόθεσης συναρτήσει του εκθέτη φάσµατος η για (α) AAFT, (β) ΙAAFT, (γ) STAP υποκατάστατα. Αφορούν υποκατάστατα που έχουν δηµιουργηθεί άµεσα από χρονοσειρές που έχουν υποστεί κυβικό µετασχηµατισµό. Η εκτίµηση του Η έγινε µε την µέθοδο DFA. Στο σχήµα 2.10 παριστάνονται οι µεταβολές των ποσοστών απόρριψης της µηδενικής υπόθεσης σε συνάρτηση µε τον εκθέτη φάσµατος για χρονοσειρές µε µονοτονικό µετασχηµατισµό, όπου ο Η υπολογίζεται µε την DFA. Παρατηρούµε ότι η συµπεριφορά των IAAFT, STAP είναι παρόµοια µε αυτή που είχαν οι αλγόριθµοι για τον µη µονοτονικό µετασχηµατισµό. ιαφορά φαίνεται να παρουσιάζει όµως ο ΑΑFT, ο οποίος για µικρή τιµή του η δίνει πολύ µικρά ποσοστά απόρριψης 5-10%. Ήδη όµως για η = 2 τα ποσοστά αυξάνονται ραγδαία, πιο γρήγορα κι από τον STAP. Για η = 2.5, 3 τα ποσοστά φτάνουν πάλι το 100%. Ακολουθούν τα διαγράµµατα που αφορούν την R/S ανάλυση. - 31 -

(α) (β) (γ) Σχήµα 2.11: Γραφήµατα µεταβολής του ποσοστού απορρίψεων της µηδενικής υπόθεσης συναρτήσει του εκθέτη φάσµατος η για (α) AAFT, (β) ΙAAFT, (γ) STAP υποκατάστατα. Αφορούν υποκατάστατα που έχουν δηµιουργηθεί άµεσα από χρονοσειρές που έχουν υποστεί κυβικό µετασχηµατισµό. Η εκτίµηση του Η έγινε µε την µέθοδο R/S. Ποιοτικά τα σχήµατα 2.11 είναι όµοια µε αυτά του σχήµατος 2.10, που δείχνει ότι οι δύο µέθοδοι DFA και R/S παρουσιάζουν την ίδια συµπεριφορά. Μια µικρή µόνο αύξηση των ποσοστών του φαίνεται να παρουσιάζει ο αλγόριθµος IAAFT, τα οποία µάλιστα είναι πιο µεγάλα για µεγαλύτερο µήκος χρονοσειράς. Τα συµπεράσµατα που προκύπτουν από τον Πίνακα 2.1 και την γραφική αναπαράσταση των τιµών τους στα Σχήµατα 2.8-2.11 συνοψίζονται ως εξής: ο AAFT αλγόριθµος αδυνατεί να δηµιουργήσει υποκατάστατες χρονοσειρές αυτών που έχουν υποστεί τετραγωνικό µετασχηµατισµό, αλλά και µε αυτές που έχουν υποστεί κυβικό µετασχηµατισµό φαίνεται ότι για εκθέτη η που παίρνει τιµές µεγαλύτερες και ίσες του 2 τα ποσοστά αυξάνονται ραγδιαία, δηλαδή αδυνατεί να δηµιουργήσει υποκατάστατα που να διατηρούν τις συσχετίσεις των αρχικών. Αντίθετα IAAFT παρουσιάζει χαµηλά ποσοστά ακόµα κι όταν ο εκθέτης φάσµατος αυξηθεί πάνω από 2. Όταν γίνεται η = 3 δείχνει βέβαια τα ποσοστά να έχουν αυξηθεί πολύ, πλησιάζουν το 40%, αλλά και πάλι είναι τα χαµηλότερα ποσοστά και των τριών αλγορίθµων. Ο STAP φαίνεται ότι ανεξάρτητα µονοτονικού ή µη µονοτονικού µετασχηµατισµού καταφέρνει να δηµιουργήσει καλά υποκατάστατα για εκθέτη η µικρότερο ή ίσο του 2. Αδυναµία δείχνει όµως και αυτός ο αλγόριθµος για η =2.5 και 3 που δείχνει πως ούτε αυτός µπορεί να διατηρήσει τις έντονες τάσεις που παρουσιάζονται. Η αποτυχία αυτή του STAP οφείλεται κυρίως στη δηµιουργία του πολυωνύµου που προσεγγίζει την συνάρτηση µετασχηµατισµού των αυτοσυσχετίσεων. Όταν η αυτοσυσχέτιση είναι τόσο έντονη δεν καταφέρνει πολλές φορές να δηµιουργήσει το πολυώνυµο εκείνο που θα τις προσεγγίσει µε επιτυχία. Έτσι επηρεάζεται το πολυώνυµο του AR µοντέλου που θα δηµιουργήσει τις υποκατάστατες χρονοσειρές. Αν και θα θέλαµε να είναι της τάξης του µήκους της χρονοσειράς ( p= N ) το παίρνουµε σε πρώτη προσέγγιση στο µισό της ώστε να γίνουν οι υπολογισµοί των υποκατάστατων χρονοσειρών πιο γρήγορα. Ακόµα όµως και τότε ο βαθµός του πολυωνύµου είναι µεγάλος αφού σε ορισµένες περιπτώσεις µειώνεται ακόµα και στο 1/10 του αρχικού µήκους της ώστε να µπορέσει να δηµιουργηθεί. Μία τέτοια συµπεριφορά βέβαια έχει ως αποτέλεσµα την κακή προσαρµογή της συνάρτησης αυτοσυσχέτισης µε αποτέλεσµα να υπάρχει ένα τόσο µεγάλο ποσοστό απορρίψεων, ειδικά για µεγάλες τιµές του η. - 32 -