Προσοµοίωση χαοτικών χρονοσειρών Μέρος Β - Μη-γραµµική ανάλυση χρονοσειρών

Σχετικά έγγραφα
Χρονοσειρές - Μάθημα 9 Aνάλυση χρονοσειρών και δυναμικά συστήματα

Εκτίμηση μη-γραμμικών χαρακτηριστικών

Χρονοσειρές - Μάθημα 7. Μη-γραμμική ανάλυση χρονοσειρών

3 Μη-γραμμική ανάλυση χρονοσειρών

Χρονοσειρές - Μάθημα 8. Μη-γραμμική ανάλυση χρονοσειρών

Πραγματικές χρονοσειρές

Παράρτηµα 3 Εξισώσεις Διαφορών και Στοχαστικές Διαδικασίες

Μεταπτυχιακό Πρόγραμμα Φυσικού Τμήματος «Υπολογιστική Φυσική» Θέμα εργασίας στο A Μέρος του μαθήματος «Προσομοίωση Χαοτικών Συστημάτων»

Μηχανική ΙI Ροή στο χώρο των φάσεων, θεώρηµα Liouville

Μαθηµατικό Παράρτηµα 2 Εξισώσεις Διαφορών

Χρονοσειρές, Μέρος Β 1 Πρόβλεψη Χρονικών Σειρών

Χρονικές σειρές 5 Ο μάθημα: Γραμμικά στοχαστικά μοντέλα (1) Αυτοπαλίνδρομα μοντέλα Εαρινό εξάμηνο Τμήμα Μαθηματικών ΑΠΘ

Στατιστική για Πολιτικούς Μηχανικούς Λυμένες ασκήσεις μέρους Β

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΚΕΦΑΛΑΙΑ 3,4. Συστήµατα ενός Βαθµού ελευθερίας. k Για E 0, η (1) ισχύει για κάθε x. Άρα επιτρεπτή περιοχή είναι όλος ο άξονας

όπου D(f ) = (, 0) (0, + ) = R {0}. Είναι Σχήµα 10: Η γραφική παράσταση της συνάρτησης f (x) = 1/x.

Κεφάλαιο 6 Παράγωγος

Κανόνες παραγώγισης ( )

ΣΕΙΡΕΣ TAYLOR. Στην Ενότητα αυτή θα ασχοληθούµε µε την προσέγγιση συναρτήσεων µέσω πολυωνύµων. Πολυώνυµο είναι κάθε συνάρτηση της µορφής:

< 1 για κάθε k N, τότε η σειρά a k συγκλίνει. +, τότε η η σειρά a k αποκλίνει.

Κεφάλαιο 3 ΣΥΣΧΕΤΙΣΗ ΚΑΙ ΠΑΛΙΝ ΡΟΜΗΣΗ. 3.1 Συσχέτιση δύο τ.µ.

Κεφάλαιο 7 Βασικά Θεωρήµατα του ιαφορικού Λογισµού

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ

Πρακτική µε στοιχεία στατιστικής ανάλυσης

ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ

Κεϕάλαιο 6. Χρονοσειρές

ΛΥΣΕΙΣ 6 ης ΕΡΓΑΣΙΑΣ - ΠΛΗ 12,

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Σχολικός Σύµβουλος ΠΕ03

A2. ΠΑΡΑΓΩΓΟΣ-ΚΛΙΣΗ-ΜΟΝΟΤΟΝΙΑ

Κεφάλαιο 4 ΣΥΣΧΕΤΙΣΗ ΚΑΙ ΠΑΛΙΝ ΡΟΜΗΣΗ. 4.1 Συσχέτιση δύο τ.µ.

4.3. Γραµµικοί ταξινοµητές

Ασκήσεις για το µάθηµα «Ανάλυση Ι και Εφαρµογές» (ε) Κάθε συγκλίνουσα ακολουθία άρρητων αριθµών συγκλίνει σε άρρητο αριθµό.

7. Ταλαντώσεις σε συστήµατα µε πολλούς βαθµούς ελευθερίας

αx αx αx αx 2 αx = α e } 2 x x x dx καλείται η παραβολική συνάρτηση η οποία στο x

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ

4 Συνέχεια συνάρτησης

Ακρότατα υπό συνθήκη και οι πολλαπλασιαστές του Lagrange

Χρονικές σειρές 2 Ο μάθημα: Εισαγωγή στις χρονοσειρές


ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ

ΠΟΛΥΩΝΥΜΙΚΕΣ - ΡΗΤΕΣ ΑΝΙΣΩΣΕΙΣ P x = x+ 2 4 x x 3x x x x 3x


Κλασικη ιαφορικη Γεωµετρια

Κεφάλαιο 1. Αριθµητική ολοκλήρωση συνήθων διαφορικών εξισώσεων και συστηµάτων

οµή δικτύου ΣΧΗΜΑ 8.1

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΦΥΣΙΚΗΣ. ΕΞΕΤΑΣΗ ΣΤΗ ΜΗΧΑΝΙΚΗ Ι Σεπτέµβριος 2004

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥ ΩΝ «ΠΛΗΡΟΦΟΡΙΚΗ» ΜΑΘΗΜΑΤΙΚΑ Ι (ΘΕ ΠΛΗ 12) ΕΡΓΑΣΙΑ 4

Είδη Μεταβλητών. κλίµακα µέτρησης

f (x) = l R, τότε f (x 0 ) = l. = lim (0) = lim f(x) = f(x) f(0) = xf (ξ x ). = l. Εστω ε > 0. Αφού lim f (x) = l R, υπάρχει δ > 0

Αρχίζουµε µε την µη συµµετρική µορφή του απειρόβαθου κβαντικού πηγαδιού δυναµικού, το οποίο εκτείνεται από 0 έως L.

Μαθηµατικό Παράρτηµα 2 Εξισώσεις Διαφορών

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ

Ακαδηµαϊκό Έτος , Εαρινό Εξάµηνο ιδάσκων Καθ.: Νίκος Τσαπατσούλης


Γεωµετρικη Θεωρια Ελεγχου

ΤΕΣΤ ΣΤΑΤΙΣΤΙΚΗΣ ΕΦΑΡΜΟΣΜΕΝΗΣ ΣΤΑΤΙΣΤΙΚΗΣ ΓΕΩΡΓΙΚΟΥ ΠΕΙΡΑΜΑΤΙΣΜΟΥ. Τεστ 1 ο Κατανοµή Συχνοτήτων (50 βαθµοί)

Χάος και Φράκταλ. ιδάσκων: Α.Μπούντης, Καθηγητής Ασκήσεις ΟΜΑ Α Α 1) Να δειχθεί ότι η οικογένεια των κλειστών καµπυλών x x e = c τείνει 2 1)

Το θεώρηµα πεπλεγµένων συναρτήσεων

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ

ΚΕΦΑΛΑΙΟ 3 ΑΡΙΘΜΗΤΙΚΗ ΕΠΙΛΥΣΗ ΓΡΑΜΜΙΚΩΝ ΣΥΣΤΗΜΑΤΩΝ. nn n n

ΕΛΕΓΧΟΙ ΠΡΟΣΑΡΜΟΓΗΣ & ΥΠΟΘΕΣΕΩΝ

Παρουσίαση 1 ΙΑΝΥΣΜΑΤΑ

Ανάλυση Δεδοµένων µε χρήση του Στατιστικού Πακέτου R

Αστάθεια (volatility)

cov(x, Y ) = E[(X E[X]) (Y E[Y ])] cov(x, Y ) = E[X Y ] E[X] E[Y ]

Κεφάλαιο 1. Κβαντική Μηχανική ΙΙ - Περιλήψεις, Α. Λαχανάς


Μετασχηµατισµοί Laplace, Αναλογικά Συστήµατα, ιαφορικές Εξισώσεις

Σηµειώσεις Οικονοµετρίας Ι.. ικαίος Τσερκέζος

Αναγνώριση Προτύπων Ι

11 Το ολοκλήρωµα Riemann

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥ ΩΝ: ΠΛΗΡΟΦΟΡΙΚΗ ΘΕ: ΜΑΘΗΜΑΤΙΚΑ ΓΙΑ ΤΗΝ ΠΛΗΡΟΦΟΡΙΚΉ Ι (ΠΛΗ 12) ΛΥΣΕΙΣ ΕΡΓΑΣΙΑΣ 3

Μεθοδολογίες παρεµβολής σε DTM.

ΕΞΙΣΩΣΗ ΕΥΘΕΙΑΣ ΓΕΝΙΚΗ ΜΟΡΦΗ

Η ΤΕΧΝΗ ΤΟΥ ΙΑΒΑΣΜΑΤΟΣ ΜΕΤΑΞΥ ΤΩΝ ΑΡΙΘΜΩΝ (ΠΑΡΕΜΒΟΛΗ ΚΑΙ ΠΡΟΣΕΓΓΙΣΗ)

ΠΑΡΟΥΣΙΑΣΗ ΣΤΑΤΙΣΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ

Γραµµικός Προγραµµατισµός - Μέθοδος Simplex

5 Γενική µορφή εξίσωσης ευθείας

Κεφάλαιο 6. Εισαγωγή στη µέθοδο πεπερασµένων όγκων επίλυση ελλειπτικών και παραβολικών διαφορικών εξισώσεων

ΛΥΣΕΙΣ ΑΣΚΗΣΕΩΝ ΕΞΕΤΑΣΤΙΚΗΣ ΠΕΡΙΟ ΟΥ ΙΟΥΝΙΟΥ 2004., η οποία όµως µπορεί να γραφεί µε την παρακάτω µορφή: 1 e

1.4 Λύσεις αντιστρόφων προβλημάτων.

MEΤΑΣΧΗΜΑΤΙΣΜΟΙ ΤΗΣ ΜΟΡΦΗΣ Y= g( X1, X2,..., Xn)

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ

Αριθµητική Ανάλυση 1 εκεµβρίου / 43

Χρήστος Ι. Σχοινάς Αν. Καθηγητής ΔΠΘ. Συμπληρωματικές σημειώσεις για το μάθημα: «Επιχειρησιακή Έρευνα ΙΙ»

= x. = x1. math60.nb

ιαφορική εντροπία Σεραφείµ Καραµπογιάς

1. Εισαγωγή Ο έλεγχος υποθέσεων αναφέρεται στις ιδιότητες µιας άγνωστης παραµέτρους του πληθυσµού: Ο κατηγορούµενος είναι αθώος

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ

ΚΕΦΑΛΑΙΟ 4 ΑΡΙΘΜΗΤΙΚΕΣ ΜΕΘΟ ΟΙ ΕΥΡΕΣΗΣ ΠΡΑΓΜΑΤΙΚΩΝ Ι ΙΟΤΙΜΩΝ. 4.1 Γραµµικοί µετασχηµατισµοί-ιδιοτιµές-ιδιοδιανύσµατα

Επίλυση Γραµµικών Συστηµάτων

Συνεχείς συναρτήσεις πολλών µεταβλητών. ε > υπάρχει ( ) ( )

ΚΕΦΑΛΑΙΟ 2 ΜΗ ΓΡΑΜΜΙΚΕΣ ΕΞΙΣΩΣΕΙΣ

Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος

ΠΡΟΓΡΑΜΜΑ ΣΠΟΥ ΩΝ ΠΛΗΡΟΦΟΡΙΚΗΣ ΜΑΘΗΜΑΤΙΚΑ Ι ΕΡΓΑΣΙΑ 6 ΛΥΣΕΙΣ

Ανάλυση Σ.Α.Ε στο χώρο κατάστασης

Κεφάλαιο M4. Κίνηση σε δύο διαστάσεις


ΣΗΜΕΙΩΣΕΙΣ ΓΙΑ ΤΟ ΜΑΘΗΜΑ ΣΤΑΤΙΣΤΙΚΗ ΓΙΑ ΠΟΛΙΤΙΚΟΥΣ ΜΗΧΑΝΙΚΟΥΣ ΜΕΡΟΣ Β

Transcript:

Προσοµοίωση χαοτικών χρονοσειρών Μέρος Β - Μη-γραµµική ανάλυση χρονοσειρών Γενικά για χρονοσειρές Θεωρούµε ως χρονοσειρά ένα σύνολο Ν διαδοχικών παρατηρήσεων κάποιου µεγέθους για κάποια χρονική περίοδο T, {,,, N } Συνήθως οι παρατηρήσεις γίνονται µε σταθερό χρονικό βήµα, το χρόνο δειγµατοληψίας τ και είναι T = Nτ Ενδεικτικά αναφέρονται κάποια παραδείγµατα πραγµατικών χρονοσειρών: Ηλεκτροεγκεφαλογραφήµατα (EEG) και ηλεκτροκαρδιογραφήµατα (ECG), όπου ο χρόνος δειγµατοληψίας τ µπορεί να είναι δέκατα του δευτερολέπτου και το µήκος της χρονοσειράς N µπορεί να είναι πολλές χιλιάδες ανάλογα µε την περίοδο καταγραφής EEG before eplepc ezure EEG durng eplepc ezure () 9 () 9 8 8 7 4 e nde 4 e nde Η ολική τάση σ ένα µεταλλικό έλασµα κατά τη διάρκεια πλαστικής παραµόρφωσης µε άσκηση εφελκυσµού, όπου το τ µπορεί να είναι δευτερόλεπτα και το N µερικές χιλιάδες ανάλογα µε τις συνθήκες του πειράµατος και την επιλογή του τ re of aeral deforaon () 9 9 8 4 e nde Χρηµατιστηριακοί δείκτες (όγκου συναλλαγών, µετοχών, γενικός δείκτης), όπου το τ µπορεί να είναι λεπτά, ώρες ή µέρες, και το N µπορεί να είναι µερικές εκατοντάδες ή χιλιάδες ανάλογα µε την περίοδο µελέτης και την επιλογή του τ

7 ASE nde, perod 98 6 ASE volue, perod 98 6 cloe nde 4 volue 8 87 9 9 9 97 year 8 87 9 9 9 97 year Οι ηλιακές κηλίδες, όπου το τ µπορεί να είναι µήνες ή έτη Οι ετήσιες παρατηρήσεις ξεκινάν από το 7 και άρα δεν έχουµε στη διάθεση µας παρά µόνο παρατηρήσεις Annual unpo, perod 7 nuber of unpo 7 7 8 8 9 9 year Μας ενδιαφέρει από την πληροφορία που παίρνουµε από µια χρονοσειρά να διερευνήσουµε και να περιγράψουµε το δυναµικό σύστηµα που µας παράγει τη χρονοσειρά Για παράδειγµα από µια καταγραφή EEG σε κάποιο άτοµο που βρίσκεται σε φυσιολογική λειτουργία ή κατά τη διάρκεια επιληπτικής κρίσης, θέλουµε να διερευνήσουµε τα χαρακτηριστικά του συστήµατος που ορίζει τη λειτουργία και µεταβολή του δυναµικού στον εγκέφαλο Αναφέρονται παρακάτω κάποιοι περιορισµοί που εµφανίζονται συνήθως σε πραγµατικά προβλήµατα: Μονοδιάστατη χρονοσειρά: Συνήθως δεν έχουµε στη διάθεση µας µετρήσεις από άλλα µεγέθη (µεταβλητές) του υπό µελέτη συστήµατος Ακόµα και για τα EEG που µπορεί να έχουµε πολλαπλές καταγραφές από ηλεκτρόδια σε διαφορετικά σηµεία του εγκεφάλου δε γνωρίζουµε αν και πως µπορούµε να αντιστοιχήσουµε τις καταγραφές σε ανεξάρτητες µεταβλητές του συστήµατος του δυναµικού του εγκεφάλου Μόνο µια χρονοσειρά: Σε πολλές περιπτώσεις δεν υπάρχει δυνατότητα επανάληψης της µέτρησης, όπως για τις ηλιακές κηλίδες και τους χρηµατιστηριακούς δείκτες Περιορισµένο µήκος χρονοσειράς: Η διάρκεια της µέτρησης δεν είναι ελεγχόµενη και το µήκος της χρονοσειράς είναι περιορισµένο Για την ανάλυση είναι επιθυµητό µεγάλο µήκος χρονοσειράς αλλά σε πραγµατικές καταστάσεις αυτό δεν είναι δυνατό, όπως για τις ηλιακές κηλίδες Μη-στασιµότητα: Η στασιµότητα ως στατιστική έννοια δηλώνει ότι τα στατιστικά χαρακτηριστικά της στοχαστικής διαδικασίας που παράγει τη χρονοσειρά δε µεταβάλλονται κατά τη χρονική εξέλιξη της Κάτω από την υπόθεση του µηγραµµικού δυναµικού συστήµατος, η στασιµότητα δηλώνει ότι το σύστηµα παραµένει στην ίδια κατάσταση και δε µεταπηδάει σε άλλη κατάσταση, όπως πχ αν

άλλαζε κάποια παράµετρος του συστήµατος Οι πραγµατικές χρονοσειρές όµως συνήθως είναι µη-στάσιµες, περιέχουν χρονικά αργές τάσεις ή αλλάζει η συµπεριφορά τους µε κάποιο τρόπο Για παράδειγµα, κατά την παραµόρφωση του µεταλλικού ελάσµατος η χρονοσειρά της ολικής τάσης παρουσιάζει αυξητική τάση και ταλαντώσεις µε περίοδος και εύρος που µπορεί να παρουσιάζει αυξοµειώσεις στα διάφορα στάδια της παραµόρφωσης Γι αυτό συχνά χωρίζουµε τη µεγάλη χρονοσειρά (δηλαδή την καταγραφή) σε µικρότερες χρονοσειρές και κάνουµε την ανάλυση στην κάθε µια από αυτές τις χρονοσειρές Θόρυβος: Ένα σοβαρό πρόβληµα στην ανάλυση χρονοσειρών είναι η ύπαρξη θορύβου, δηλαδή στοχαστικού µέρους, που «κρύβει» ή δυσκολεύει τον εντοπισµό του αιτιοκρατικού δυναµικού συστήµατος Ο θόρυβος µπορεί να οφείλεται σε απροσδιόριστους παράγοντες που επηρεάζουν την εξέλιξη του συστήµατος (δυναµικός θόρυβος) ή σε αβεβαιότητα και σφάλµα κατά τη µέτρηση (θόρυβος παρατήρησης) Στην υπόθεση εργασίας για ύπαρξη αιτιοκρατικού δυναµικού συστήµατος που κάνουµε στη µη-γραµµική ανάλυση χρονοσειρών συµπεριλαµβάνουµε απαραίτητα και την ύπαρξη θορύβου Οι παραπάνω περιορισµοί που συναντώνται σε πραγµατικά προβλήµατα χρονοσειρών καθιστούν δύσκολη τη διερεύνηση και εκτίµηση αιτιοκρατικού δυναµικού συστήµατος Γι αυτό συχνά η ανάλυση περιορίζεται σε κλασσικές γραµµικές µεθόδους µε περιορισµένες όµως δυνατότητες όπως δίνεται παρακάτω Γραµµική και µη-γραµµική ανάλυση χρονοσειρών Η κλασσική στατιστική ανάλυση χρονοσειρών µελετά γραµµικά χαρακτηριστικά των χρονοσειρών, όπως είναι η αυτοσυσχέτιση r ( τ ) και ισοδύναµα το φάσµα ισχύος P ( f ), και η περιγραφή του δυναµικού συστήµατος που παράγει τη χρονοσειρά γίνεται µε γραµµικά µοντέλα χρονοσειρών, όπως τα µοντέλα τύπου ARMA (αυτοπαλινδροµούµενα και κινητού µέσου µοντέλα) Τα χαρακτηριστικά της χρονοσειράς που µπορεί να µιµηθεί ένα γραµµικό µοντέλο περιορίζονται στη µέση τιµή, διασπορά και αυτοσυσχέτιση Αυτά τα χαρακτηριστικά είναι αρκετά για να περιγράψουν µια γραµµική διαδικασία, δηλαδή ένα γραµµικό δυναµικό στοχαστικό σύστηµα, αλλά δεν αποτελούν ικανοποιητική περιγραφή µιας µη-γραµµικής διαδικασίας Εφαρµόζοντας τη γραµµική ανάλυση σε µια πραγµατική χρονοσειρά που συνήθως έχει τυχαία συµπεριφορά, όπως τα EEG ή οι χρηµατιστηριακοί δείκτες, ένα µεγάλο µέρος της πληροφορίας από τη χρονοσειρά δε µπορεί να περιγραφεί και χαρακτηρίζεται θόρυβος Αυτό το µέρος της πληροφορίας όµως µπορεί να αντιστοιχεί σε µη-γραµµική αιτιοκρατική δυναµική και αυτό προσπαθεί να διερευνήσει η µη-γραµµική ανάλυση Για την κατανόηση της χρησιµότητας της µη-γραµµικής ανάλυσης είναι χρήσιµο να δούµε πρώτα κάποια πλεονεκτήµατα και µειονεκτήµατα της γραµµικής ανάλυσης Πλεονεκτήµατα Τα γραµµικά µοντέλα έχουν απλή µορφή και είναι υπολογιστικά εύκολα και κατανοητά Η γραµµική ανάλυση βασίζεται στην πιθανοκρατική θεωρία κανονικών διαδικασιών που είναι πλήρως κατανοητή και η στατιστική συµπερασµατολογία για κανονικά γραµµικά µοντέλα έχει αναπτυχθεί πλήρως (πχ παραµετρικά διαστήµατα εµπιστοσύνης και πρόβλεψης) Τα γραµµικά µοντέλα είναι ικανοποιητικά για πολλές εφαρµογές και γι αυτό έχουν «επιβιώσει» για πάνω από 7 χρόνια!

Μειονεκτήµατα Τα µοντέλα τύπου ARMA περιγράφουν κανονικές διαδικασίες και άρα δεν προσφέρονται για την περιγραφή χρονοσειρών µε ιδιαίτερα χαρακτηριστικά όπως: έντονη ασυµµετρία ως προς την κατανοµή των δεδοµένων, διαφορετική µορφή αν ο χρόνος αντιστραφεί (e rreverbly), «ξεσπάσµατα» (oubur), δηλαδή τάση προς πιο ακραίες τιµές, σε άτακτα χρονικά διαστήµατα Το αιτιοκρατικό µέρος των γραµµικών µοντέλων µπορεί να δώσει περιορισµένες καταστάσεις Για παράδειγµα αν από ένα ARMA µοντέλο αφαιρέσουµε το στοχαστικό µέρος έχουµε = φ + + φp p ή φ p( B) = και αυτό το µοντέλο µπορεί να περιγράψει τις παρακάτω καταστάσεις του υπό µελέτη δυναµικού συστήµατος (απαλλαγµένου από θόρυβο): a σταθερό οριακό σηµείο (able l pon) αν οι ρίζες του φ p (B) είναι κατά απόλυτη τιµή µικρότερες της µονάδας, b ασταθές σύστηµα (unable ye) αν τουλάχιστον µία ρίζα του φ p (B) είναι κατά απόλυτη τιµή µεγαλύτερη της µονάδας, c ταλάντωση µεταξύ σηµείων που εξαρτώνται από τις αρχικές τιµές αν µια τουλάχιστον ρίζα έχει απόλυτη τιµή τη µονάδα και οι άλλες είναι κατά απόλυτη τιµή µικρότερες της µονάδας Τα µη-γραµµικά δυναµικά συστήµατα µπορούν να δηµιουργούν ποικίλες καταστάσεις χωρίς την επίδραση του θορύβου, τις οποίες τα γραµµικά µοντέλα αδυνατούν να περιγράψουν Αντίστροφα, αυτό σηµαίνει ότι µπορεί τα δεδοµένα να κρύβουν πιο πολύπλοκη δοµή από αυτήν που µπορεί να ανακαλύψει ένα γραµµικό σύστηµα Ιδιαίτερο ενδιαφέρον έχουν χαµηλοδιάστατα µη-γραµµικά δυναµικά συστήµατα που δε µπορούν να περιγραφούν από γραµµικά µοντέλα Αυτά είναι: d ψευδο-περιοδικό σύστηµα (peudo-perodc ye, oru), όταν στο σύστηµα υπάρχουν δύο ταλαντωτές και ο λόγος των συχνοτήτων τους είναι µη-ρητός, e χαοτικό σύστηµα (chaoc ye) Θα αναλύσουµε τη χρονοσειρά µε σκοπό να διερευνήσουµε την ύπαρξη µηγραµµικού δυναµικού συστήµατος (που ενδεχοµένως περιέχει θόρυβο), να µελετήσουµε χαρακτηριστικά του αιτιοκρατικού δυναµικού συστήµατος, να το περιγράψουµε µε κατάλληλο µοντέλο και να πετύχουµε έτσι καλύτερες προβλέψεις Χρονοσειρές και δυναµικά συστήµατα Στη συνέχεια υποθέτουµε πως το υπό µελέτη σύστηµα που παρατηρούµε µέσω µιας χρονοσειράς είναι ένα µη-γραµµικό δυναµικό σύστηµα, διακριτό ή συνεχές, που ορίζεται από κάποιες εξισώσεις διαφορών ή διαφορικές εξισώσεις, αντίστοιχα υναµικά συστήµατα Γενικά µπορούµε να θεωρήσουµε πως ξεκινώντας από κάποια αρχική συνθήκη το σύστηµα δίνεται (σε συνεχή ή διακριτό χρόνο) ως = f ( ), () όπου : το διάνυσµα θέσης (κατάστασης) του συστήµατος τη χρονική στιγµή, d R, όπου d είναι η διάσταση του Ευκλείδειου χώρου καταστάσεων του συστήµατος (γενικότερα ο χώρος µπορεί να είναι µια πολλαπλότητα) 4

: το διάνυσµα θέσης για χρόνο (αρχική συνθήκη) d d f : R R, η συνάρτηση του συστήµατος που απεικονίζει το στο : συνεχής ή διακριτός χρόνος Τα δυναµικά συστήµατα που αφορούν την ανάλυση χρονοσειρών είναι συστήµατα απώλειας ενέργειας (dpave ye), δηλαδή αν εφαρµόσουµε ένα τέτοιο σύστηµα σε κάποιο όγκο αυτός συνεχώς θα µικραίνει Κάθε τροχιά ενός συστήµατος απώλειας d ενέργειας περιορίζεται στο χώρο R και έλκεται από κάποιο αναλλοίωτο σύνολο σηµείων που λέγεται ελκυστής (aracor) Η τροχιά του συστήµατος καταλήγει ασυµπτωτικά σε αυτόν τον ελκυστή [Το παραπάνω δεν είναι ακριβές για κάθε σύστηµα, καθώς µπορεί να µην ισχύει για κάθε αρχική συνθήκη, αλλά µόνο γι αυτές που ανήκουν στη λεγόµενη βάση έλκυσης (ba of aracon) Αυτό όµως δεν θα µας απασχολήσει αφού θεωρούµε ότι η χρονοσειρά είναι η (µονοδιάστατη) παρατήρηση µιας τροχιάς που ανήκει στον ελκυστή] Ο ελκυστής µπορεί να είναι: ένα ευσταθές σηµείο ισορροπίας του συστήµατος (able equlbru pon), ένα πεπερασµένο σύνολο τέτοιων σηµείων (για περιοδικές τροχιές διακριτών συστηµάτων), ένας οριακός κύκλος (l cycle, για περιοδικές τροχιές συνεχών συστηµάτων), ένας τόρος (oru, για ψευδο-περιοδικές τροχιές συνεχών συστηµάτων) κάποιο άλλο µη-πεπερασµένο σύνολο σηµείων που λέγεται παράξενος ελκυστής (range aracor) Οι παράξενοι ελκυστές παρουσιάζουν την ιδιότητα της αυτo-οµοιότητας (elflary) σε διαφορετικές κλίµακες του χώρου, είναι δηλαδή µορφοκλασµατικά σύνολα (fracal) Τα µορφοκλασµατικά σύνολα χαρακτηρίζονται από τη µορφοκλασµατική διάσταση (fracal denon), που είναι ένας µη-ακέραιος αριθµός και δηλώνει το βαθµό αυτο-οµοιότητας Η µορφοκλασµατική διάσταση είναι πάντα µικρότερη της τοπολογικής διάστασης της πολλαπλότητας (ή της Ευκλείδειας διάστασης αν η πολλαπλότητα είναι ο Ευκλείδειος χώρος) στην οποία βρίσκεται ο ελκυστής Οι παράξενοι ελκυστές σχηµατίζονται από τις τροχιές χαοτικών δυναµικών συστηµάτων (chaoc dynacal ye), δηλαδή αιτιοκρατικών δυναµικών συστηµάτων που παρουσιάζουν ευαισθησία στις αρχικές συνθήκες (envy o nal condon) Τα χαοτικά δυναµικά συστήµατα παρουσιάζουν ιδιαίτερο ενδιαφέρον γιατί λόγω της ιδιότητας της ευαισθησίας στις αρχικές συνθήκες, κοντινές τροχιές τους αποκλίνουν πολύ γρήγορα µε αποτέλεσµα να παρουσιάζουν στοχαστική συµπεριφορά Αντίστροφα, πολλά πραγµατικά συστήµατα που φαίνονται τυχαία (όπως όταν µελετάµε µια χρονοσειρά από ένα τέτοιο σύστηµα) ίσως να έχουν αιτιοκρατική µη-γραµµική και ενδεχοµένως χαοτική δοµή Αυτό σηµαίνει ότι χρησιµοποιώντας κατάλληλες µεθόδους που βασίζονται στη θεωρία των δυναµικών συστηµάτων και του χάους έχουµε τη δυνατότητα να εξηγήσουµε και να προβλέψουµε τέτοια συστήµατα (σε µικρό χρονικό ορίζοντα) Χρονοσειρές από δυναµικά συστήµατα Μια χρονοσειρά { } δυναµικό σύστηµα ως η προβολή δηλαδή για =,, N, µπορεί να θεωρηθεί ότι προέρχεται από ένα κάθε σηµείου της τροχιάς του συστήµατος, = h( ), ()

όπου η συνάρτηση προβολής h : R d R λέγεται και συνάρτηση παρατήρησης (obervaon funcon) Για ροές, δηλαδή λύσεις διαφορικών εξισώσεων, όπου ο χρόνος είναι συνεχής ο πραγµατικός χρόνος που αντιστοιχεί σε µια παρατήρηση είναι τ Το σύστηµα µπορεί να περιέχει θόρυβο, ο οποίος διαχωρίζεται σε δύο τύπους: Θόρυβος παρατήρησης ή µέτρησης (obervaonal / eaureen noe) = h( ) + w, () όπου το w θεωρείται συνήθως λευκός και προσθετικός θόρυβος, ασυσχέτιστος µε το και το υναµικός θόρυβος ή θόρυβος συστήµατος (dynacal / ye noe) = f ( ) + ε, (4) όπου το ασυσχέτιστος µε το u για κάθε ε θεωρείται επίσης λευκός και συνήθως προσθετικός θόρυβος, u Μερικά γνωστά δυναµικά συστήµατα Παρακάτω παρουσιάζονται κάποια γνωστά µοντέλα διακριτών και συνεχών χαοτικών συστηµάτων Λογιστική απεικόνιση: + = a ( ) Για διαφορετικές τιµές του a [,4] η απεικόνιση γίνεται σταθερή, περιοδική (καλύπτει όλο το φάσµα των περιόδων) και απεριοδική, δηλαδή χαοτική Στα παρακάτω σχήµατα παρουσιάζονται δύο χρονοσειρές της λογιστικής απεικόνισης, η µία (αριστερά) για a = που δίνει περίοδο 4 και η άλλη (δεξιά) για a = 4 που δίνει χάος perodc logc ap, noe free chaoc logc ap, noe free () 8 6 4 () 8 6 4 Απεικόνιση Henon: 4 6 8 4 6 8 e nde e nde + = a + b Αυτό είναι ένα διακριτό σύστηµα δύο µεταβλητών και είναι χαοτικό για a = 4 και b = Στα παρακάτω σχήµατα παρουσιάζεται ο ελκυστής (αριστερά) και η χρονοσειρά (δεξιά) της απεικόνισης σε χαοτική κατάσταση 6

4 Henon ap chaoc Henon ap, noe free () Σύστηµα Lorenz 4 = a( ) = b = c + 4 6 8 e nde Αυτό είναι ένα συνεχές σύστηµα τριών µεταβλητών και για τις τιµές των παραµέτρων 8 a =, b = 8, c =, το σύστηµα είναι χαοτικό Στα παρακάτω σχήµατα δίνεται µια εικόνα του ελκυστή του συστήµατος Lorenz και χρονοσειρές από τις τρεις µεταβλητές του συστήµατος Lorenz ye Lorenz ye, varable () 4 Lorenz ye, varable 4 e nde 4 () () 4 4 4 e nde Lorenz ye, varable 4 e nde Η µεθοδολογία που θα µελετήσουµε για να αναλύσουµε χρονοσειρές χρησιµοποιώντας τη θεωρία των δυναµικών συστηµάτων και του χάους συνοψίζεται στα παρακάτω θέµατα: Ανακατασκευή του χώρου καταστάσεων Εκτίµηση χαρακτηριστικών του δυναµικού συστήµατος (διάσταση ελκυστή, εκθέτες Lyapunov) Μη-γραµµικά µοντέλα πρόβλεψης 7

Ανακατασκευή χώρου καταστάσεων Σε µια πρώτη προσέγγιση θα θέλαµε ίσως να εκτιµήσουµε τη συνάρτηση του συστήµατος f (ή f για ένα χρονικό βήµα), τη διάσταση του χώρου καταστάσεων d στο οποίο βρίσκονται οι τροχιές που παράγει το σύστηµα καθώς και τη συνάρτηση παρατήρησης h εν είναι όµως δυνατόν από την παρατήρηση µιας µονοδιάστατης µεταβλητής που αφορά το υπό µελέτη σύστηµα να αντλήσουµε όλες αυτές τις πληροφορίες, δηλαδή να πετύχουµε αντιστροφή και από την προβολή στο R να d γυρίσουµε στο χώρο των καταστάσεων R Μπορούµε όµως να φτιάξουµε ένα είδωλο του αρχικού ελκυστή όπως θα δούµε παρακάτω Το θεώρηµα του Taken επιτρέπει κάτω από κάποιες συνθήκες να κατασκευάσουµε ένα νέο χώρο καταστάσεων διάστασης στον οποίο οι ανακατασκευασµένες τροχιές { } R από τη χρονοσειρά { }, δηλαδή ο ανακατασκευασµένος ελκυστής, διατηρεί τις τοπολογικές ιδιότητες του αρχικού ελκυστή και το ανακατασκευασµένο δυναµικό σύστηµα, = + F( ), έχει τα ίδια δυναµικά χαρακτηριστικά µε το αρχικό σύστηµα, = + f( ), δηλαδή επιτυγχάνεται εµβύθιση (ebeddng) Φ του αρχικού ελκυστής στον ανακατασκευασµένο ελκυστή, = Φ( ) Στο παρακάτω σχεδιάγραµµα παρουσιάζεται το πρόβληµα της ανακατασκευής του χώρου καταστάσεων από µια χρονοσειρά M αρχικός χώρος καταστάσεων = f ( ) + εµβύθιση? Φ συνθήκη: > d R = Φ( ) = F ( ) + + Προβολή = h( ) R h Ανακατασκευή Ανακατασκευή + ανακατασκευασµένος χώρος καταστάσεων παρατηρούµενο µέγεθος Το θεώρηµα του Taken δίνει τη συνθήκη D + για την ανακατασκευή του χώρου καταστάσεων, όπου D είναι η µορφοκλασµατική διάσταση του ελκυστή Αν η διάσταση του ανακατασκευασµένου χώρου καταστάσεων δεν είναι ικανοποιητικά µεγάλη, τότε ο ανακατασκευασµένος ελκυστής δεν «ξεδιπλώνεται» πλήρως αλλά παρουσιάζει αυτο-τοµές (nerecon) κι άρα δεν είναι τοπολογικά ισοδύναµος µε τον αρχικό ελκυστή [Σηµειώνεται ότι ένα δυναµικό σύστηµα δεν µπορεί να έχει δύο λύσεις για την ίδια αρχική συνθήκη κι άρα δε µπορούν δύο τροχιές του να τέµνονται] Η συνθήκη βεβαιώνει ότι στον Ευκλείδειο χώρο διάστασης όπου D + δε θα υπάρχουν αυτο-τοµές του ελκυστή Θα πρέπει να σηµειωθεί επίσης ότι το θεώρηµα του Taken αναφέρεται σε χρονοσειρές µε άπειρο µήκος και χωρίς θόρυβο Στην πράξη αυτές οι συνθήκες φυσικά 8

δε συναντώνται και γι αυτό τα αποτελέσµατα της ανακατασκευής µπορούν να θεωρηθούν µόνο προσεγγιστικά Η ανακατασκευή του χώρου καταστάσεων γίνεται απλά µε τη δηµιουργία σηµείων R από τις µονοδιάστατες παρατηρήσεις { } για =,, N Η πιο απλή και συνήθης µέθοδος ανακατασκευής του χώρου καταστάσεων είναι η µέθοδος των υστερήσεων (ehod of delay) και τα σηµεία σχηµατίζονται απλά ως τ ( ) τ ' =,,, () Οι παράµετροι της ανακατασκευής είναι: Η διάσταση εµβύθισης (ebeddng denon) που ορίζει τον αριθµό των παρατηρήσεων που γίνονται συνιστώσες του ανακατασκευασµένου διανύσµατος Η υστέρηση (delay) τ που ορίζει το χρονικό βήµα υστέρησης για την επιλογή των συνιστωσών του ανακατασκευασµένου διανύσµατος αρχίζοντας από το Θα πρέπει να σηµειωθεί ότι η πληροφορία που διοχετεύεται από τη χρονοσειρά στο κάθε ανακατασκευασµένο διάνυσµα καλύπτει το χρονικό παράθυρο τ w = ( ) τ (6) Για να επιτευχθεί σωστή ανακατασκευή θα πρέπει το παράθυρο αυτό να µην είναι ούτε πολύ µικρό, αλλιώς δε θα έχει χρησιµοποιηθεί αρκετή πληροφορία, ούτε πολύ µεγάλο, αλλιώς θα υπάρχει περιττή πληροφορία που θα περιπλέξει την ανακατασκευή Για την ανακατασκευή του χώρου καταστάσεων πρέπει να επιλέξουµε κατάλληλες τιµές για τις παραµέτρους και τ Παρακάτω παρουσιάζονται κάποιες µέθοδοι εκτίµησης των και τ Επιλογή του τ Το πρόβληµα επιλογής κατάλληλου τ παρουσιάζεται όταν οι παρατηρήσεις έχουν γίνει µε µικρό χρόνο δειγµατοληψίας τ και διαδοχικές παρατηρήσεις δε διαφέρουν σηµαντικά Σε µια τέτοια περίπτωση αν χρησιµοποιήσουµε µικρό τ δηµιουργείται πλεονασµός πληροφορίας (redundancy of nforaon) και διαδοχικές συνιστώσες είναι περίπου ίδιες Από την άλλη, αν διαλέξουµε µεγάλο τ η δυναµική του συστήµατος, όπως αυτή προβάλλεται στη χρονοσειρά, αποκόπτεται (rrelevance) εν είναι ξεκάθαρο που βρίσκονται τα όρια µικρού και µεγάλου τ και κάποιος θα µπορούσε ακόµα και να αµφισβητήσει την εγκυρότητα των κριτηρίων του πλεονασµού και της αποκοπής της πληροφορίας για τη δυναµική του συστήµατος Παρ όλα αυτά έχει επικρατήσει να θεωρείται ως καλύτερη επιλογή η µικρότερη τιµή του τ που καθιστά τις συνιστώσες του ασυσχέτιστες: Χρησιµοποιώντας την συνάρτηση της αυτοσυσχέτισης, επιλέγεται ο χρόνος τ για τον οποίο µηδενίζεται η αυτοσυσχέτιση για πρώτη φορά, r ( τ ) = Αν δε φθίνει γρήγορα προς το, επιλέγεται από τη σχέση r ( τ ) = /e Η συνάρτηση αµοιβαίας πληροφορίας (uual nforaon) I( X,Y ) µετράει την γραµµική και µη γραµµική συσχέτιση δύο µεταβλητών X και Y και δίνεται ως pxy (, y) I( X, Y) = pxy (, y)log, (7) p ( ) p ( y) y, X Y όπου p X () είναι η πιθανότητα του Χ=, p XY (, y) είναι η κοινή πιθανότητα Χ= και Y=y και το άθροισµα υπολογίζεται για όλες τις δυνατές τιµές των X και Y 9

(για συνεχείς µεταβλητές X και Y εφαρµόζουµε κατάλληλο διαµερισµό των πεδίων τιµών τους) Για χρονοσειρές η αµοιβαία πληροφορία δίνεται ως I( τ ) = I(, τ ) και αφορά τις µεταβλητές και -τ Η συνάρτηση I( τ ) παίρνει πάντα θετικές τιµές Η υστέρηση τ που αντιστοιχεί στο πρώτο τοπικό ελάχιστο της I( τ ) προτείνεται ως η καταλληλότερη τιµή του τ για την ανακατασκευή του χώρου καταστάσεων Παρουσιάζονται παρακάτω τα γραφήµατα της αυτοσυσχέτισης και της αµοιβαίας πληροφορίας για τη χρονοσειρά της -µεταβλητής του συστήµατος Lorenz για την επιλογή του τ Auocorrelaon of Lorenz Muual nforaon of Lorenz r(τ) 8 6 4 I(τ) 4 6 8 lag τ Σηµειώνεται ότι για χρονοσειρές από απεικονίσεις, δηλαδή από διακριτά συστήµατα, ή από συνεχή συστήµατα που µετρήθηκαν µε µεγάλο τ, συνήθως θέτουµε τ= Επιλογή του Το θεώρηµα του Taken δίνει την ικανή συνθήκη D + για την αποφυγή αυτοτοµών στην ανακατασκευή του ελκυστή Αυτή η συνθήκη δεν είναι και αναγκαία και θα θέλαµε να χρησιµοποιήσουµε όσο το δυνατόν µικρότερη διάσταση εµβύθισης Αν γνωρίζαµε την τοπολογική διάσταση d του Ευκλείδειου χώρου ή της πολλαπλότητας που τον καλύπτει, για τη ζητούµενη βέλτιστη διάσταση εµβύθισης ' θα ίσχυε D + ' d Επειδή όµως d και D είναι άγνωστα δεν υπάρχουν ενδείξεις για την επιλογή του Μια µέθοδος που χρησιµοποιείται συνήθως για την εύρεση του ' είναι η µέθοδος των ψευδών κοντινότερων γειτόνων (ehod of fale neare neghbor, FNN) Η µέθοδος βασίζεται στη σχέση ψευδών γειτόνων και αυτο-τοµών και συνοψίζεται στα παρακάτω σηµεία Αν για κάποια διάσταση εµβύθισης δύο σηµεία του ανακατασκευασµένου ελκυστή και (ο εκθετικός δείκτης δηλώνει τη διάσταση) είναι πολύ j 4 6 8 lag τ κοντά, τότε είτε είναι πραγµατικά γειτονικά σηµεία και βρίσκονται κοντά λόγω της δυναµικής του συστήµατος, ή είναι ψευδή γειτονικά σηµεία και βρίσκονται κοντά λόγω αυτο-τοµής του ελκυστή Αυξάνουµε κατά τη διάσταση εµβύθισης (στο διάνυσµα συνιστώσα -τ για να δώσει το + και j προστίθεται η + ) και εξετάζουµε την απόσταση των +

Αν η απόσταση µεγάλωσε δραµατικά (σύµφωνα µε κάποιο όριο για το λόγο των αποστάσεων για και +) τότε τα σηµεία και j είναι ψευδείς γείτονες στο χώρο R και άρα το δεν είναι ικανοποιητικά µεγάλο Για κάθε σηµείο βρίσκουµε τον κοντινότερο του σηµείο j και ελέγχουµε αν είναι ψευδή γειτονικό σηµείο Αν βρούµε σηµαντικό ποσοστό ψευδών γειτονικών σηµείων αυξάνουµε το κατά Συνεχίζουµε αυτή τη διαδικασία µέχρι τη διάσταση ' για την οποία η πρόσθεση µιας καινούριας συνιστώσας δε δίνει ψευδή γειτονικά σηµεία Τυπικό κριτήριο τερµατισµού για το ποσοστό των ψευδών γειτονικών σηµείων είναι το % Για την εφαρµογή της µεθόδου FNN θα πρέπει να κάνουµε ανακατασκευή του χώρου καταστάσεων για κάθε, και άρα θα πρέπει να ορίσουµε πρώτα την παράµετρο υστέρησης τ Ένα από τα προβλήµατα εφαρµογής αυτής της µεθόδου είναι λοιπόν η εξάρτηση του ' από το τ Επίσης η µέθοδος FNN είναι ευαίσθητη στην ύπαρξη θορύβου Στα παρακάτω δύο σχήµατα παρουσιάζονται γραφήµατα του FNN για διάφορες τιµές του τ για τη χρονοσειρά της -µεταβλητής του συστήµατος Lorenz χωρίς θόρυβο (αριστερά) και µε πρόσθεση λευκού θορύβου (δεξιά) Ο θόρυβος είναι µε κανονική κατανοµή και τυπική απόκλιση (SD) % της SD των δεδοµένων 4 Lorenz: FNN, τ = τ= τ= τ= τ= 4 Lorenz: FNN, τ = τ= τ= τ= τ= % of FNN % of FNN 4 6 8 ebeddng denon 4 6 8 ebeddng denon

Εκτίµηση µη-γραµµικών χαρακτηριστικών του δυναµικού συστήµατος Για τη διερεύνηση του µη-γραµµικού δυναµικού συστήµατος εκτιµούµε µη-γραµµικά χαρακτηριστικά του συστήµατος που αφορούν τη διάσταση του ελκυστή του συστήµατος και την πολυπλοκότητα του συστήµατος Η εκτίµηση τέτοιων χαρακτηριστικών βοηθά επίσης στην επιλογή κατάλληλου µοντέλου για τη χρονοσειρά, πχ η διάσταση καθορίζει τον ελάχιστο αριθµό βαθµών ελευθερίας στο µοντέλο Τα µη-γραµµικά χαρακτηριστικά ορίζονται στα πλαίσια της θεωρίας των µηγραµµικών δυναµικών συστηµάτων και του χάους ως αναλλοίωτα µέτρα του συστήµατος (nvaran eaure), δηλαδή ως σταθερά µεγέθη που δεν αλλοιώνονται από την εξέλιξη του συστήµατος, καθώς και από τη διαδικασία παρατήρησης του όταν αναφερόµαστε σε χρονοσειρές Τέτοια χαρακτηριστικά είναι η πυκνότητα των τροχιών, η µορφοκλασµατική διάσταση, η εντροπία και οι εκθέτες Lyapunov Στη συνέχεια θα µελετήσουµε δύο τέτοια αναλλοίωτα µέτρα ιάσταση συσχέτισης Ένας ελκυστής, όπως κάθε γεωµετρικό αντικείµενο, χαρακτηρίζεται από την Ευκλείδεια διάσταση του Ευκλείδειου χώρου που περιέχει τον ελκυστή (πχ για τον ανακατασκευασµένο χώρο είναι η διάσταση εµβύθισης ) και την τοπολογική διάσταση της πολλαπλότητας πάνω στην οποία βρίσκεται ο ελκυστής Για να χαρακτηρίσουµε όµως την ιδιότητα της αυτο-οµοιότητας εισάγουµε τη µορφοκλασµατική διάσταση Η διάσταση αυτή είναι συνεπής µε τη συνήθη έννοια της διάστασης, δηλαδή πεπερασµένα σύνολα σηµείων έχουν διάσταση, γραµµές έχουν διάσταση και επιφάνειες έχουν διάσταση Επιπλέον, για γεωµετρικά αντικείµενα µε την ιδιότητα της αυτο-οµοιότητας, όπως τυπικά είναι οι παράξενοι ελκυστές, η µορφοκλασµατική διάσταση είναι µηακέραιος αριθµός Η διάσταση συσχέτισης (correlaon denon) ν είναι ένα από τα αναλλοίωτα µέτρα που εκφράζουν τη µορφοκλασµατική διάσταση Άλλα τέτοια µέτρα είναι η διάσταση της µέτρησης κουτιών (bo counng denon) και η διάσταση πληροφορίας (nforaon denon) Θα µελετήσουµε τη διάσταση συσχέτισης λόγω της ευκολίας του υπολογισµού της και της εκτενής χρήσης της σε εφαρµογές Ας θεωρήσουµε έναν ελκυστή ως ένα µη-πεπερασµένο σύνολο σηµείων ορίσουµε την πιθανότητα Ρ( r) j < κι ας η απόσταση δύο σηµείων του ελκυστή να είναι µικρότερη από κάποια απόσταση r, όπου είναι το µήκος του διανύσµατος ορισµένο µε κάποια µετρική, όπως η Ευκλείδεια µετρική Αν µ είναι ο αριθµός των σηµείων που βρίσκονται µέσα σε σφαίρα µε ακτίνα r και κέντρο, τότε η µέση τιµή ως προς όλα τα µ προσεγγίζει την παραπάνω πιθανότητα Σύµφωνα µε το νόµο κλιµάκωσης (calng law) είναι µ ~ r ν όταν r, (8) δηλαδή για µικρές ακτίνες r η πιθανότητα η απόσταση δύο σηµείων του ελκυστή να είναι µικρότερη του r αλλάζει αναλογικά µε κάποια δύναµη της απόστασης r µε σταθερό εκθέτη ν Αν ο ελκυστής έχει συνηθισµένη µορφή (πεπερασµένο σύνολο σηµείων, γραµµή, επιφάνεια κτλ) ο εκθέτης ν είναι ακέραιος αριθµός ενώ αν είναι παράξενος το ν είναι µη-ακέραιος και δηλώνει το βαθµό αυτο-οµοιότητας

Για ένα σύνολο πεπερασµένων σηµείων { }, =,, N, όπως η ανακατασκευασµένη τροχιά από τη χρονοσειρά, το µ εκτιµάται από το άθροισµα συσχέτισης (correlaon u) C (r) N N Cr () = Θ( r j ), (9) N( N ) = j= + όπου Θ () είναι η λεγόµενη Heavde συνάρτηση όταν Θ( ) = όταν > Το διπλό άθροισµα µετράει όλα τα δυνατά ζευγάρια (, j ) που έχουν απόσταση µικρότερη από r Για N και r από το νόµο κλιµάκωσης της (8) βρίσκουµε τη διάσταση συσχέτισης ως ν = dlog C( r) dlog r () Είναι φανερό ότι τα δύο όρια ( N και r ) δεν ικανοποιούνται στην πραγµατικότητα αφού οι χρονοσειρές έχουν πεπερασµένο µήκος και τα δεδοµένα δίνονται µε πεπερασµένη ακρίβεια Περιµένουµε λοιπόν το γράφηµα του logc( r) v log r να σχηµατίζει ευθεία γραµµή (δηλαδή να έχει σταθερή κλίση) για κάποιο διάστηµα σχετικά µικρών τιµών του r, που το ονοµάζουµε περιοχή κλιµάκωσης του r (calng regon) Εναλλακτικά, θα πρέπει για την περιοχή κλιµάκωσης του r, το γράφηµα της παραγώγου που δίνεται στην () να σταθεροποιείται σε µια οριζόντια γραµµή στο ύψος της τιµής ν Για την εκτίµηση χαρακτηριστικής για το σύστηµα διάστασης συσχέτισης ν από µια χρονοσειρά θα πρέπει επιπλέον το ίδιο οριζόντιο επίπεδο της παραγώγου της () να παρατηρείται για διαφορετικές ανακατασκευές του ελκυστή Για τις ανακατασκευές συνήθως χρησιµοποιούµε τη µέθοδο της υστέρησης µε κατάλληλη σταθερή τιµή του τ και αυξανόµενη διάσταση εµβύθισης Περιµένουµε η εκτίµηση της διάστασης συσχέτισης ν ως συνάρτηση της διάστασης εµβύθισης, ν (), να δίνεται ως εξής: Για µικρές τιµές του, όπου η ανακατασκευή του ελκυστή δεν είναι ικανοποιητική, το οριζόντιο επίπεδο που δίνει την εκτίµηση του ν () θα αυξάνει µε την αύξηση του Για µεγαλύτερες τιµές του θα πρέπει το οριζόντιο επίπεδο να συγκλίνει στο ίδιο ύψος ν = ν () Καθώς το µεγαλώνει ακόµα περισσότερο η περιοχή κλιµάκωσης σταδιακά εξαφανίζεται και η εκτίµηση του ν δεν είναι πια δυνατή Η διαδικασία υπολογισµού της διάστασης συσχέτισης ν παριστάνεται γραφικά µε τρία σχήµατα (δες τα σχήµατα στο παρακάτω παράδειγµα): Το πρώτο σχήµα είναι το γράφηµα log C( r) v log r για ένα εύρος τιµών της, =,, a (στο σχήµα παρουσιάζονται a = διαφορετικές γραµµές) d log C( r) Το δεύτερο σχήµα είναι το γράφηµα v log r για το ίδιο εύρος τιµών d log r της

Το τρίτο σχήµα είναι το γράφηµα ν ( ) v, όπου ν () είναι η εκτίµηση της κλίσης από τα γραφήµατα στο πρώτο σχήµα ή του οριζοντίου επιπέδου από τα γραφήµατα στο δεύτερο σχήµα αντίστοιχα για κάθε τιµή του Συνήθως σχηµατίζουµε και το όριο ±SD της απόκλισης για την κλίση ή το οριζόντιο επίπεδο, όπου SD είναι η τυπική απόκλιση Παράδειγµα (σύστηµα Lorenz) Τα παρακάτω τρία σχήµατα συνοψίζουν την εκτίµηση του ν από µια χρονοσειρά παρατηρήσεων της -µεταβλητής του συστήµατος Lorenz ( τ = ) χρησιµοποιώντας ανακατασκευές του χώρου καταστάσεων µε τ = και =,, 8 6 log C(r) 4 = = = log r lope 7 6 4 = = = log r ν 4 4 6 8 Στο πρώτο σχήµα φαίνεται πως τα γραφήµατα log C( r) v log r είναι ευθείες γραµµές για µεγάλο διάστηµα τιµών της απόστασης r Η κλιµάκωση δε διατηρείται για πολύ µικρά r (µικρότερα για µικρά και µεγαλύτερα για µεγάλα ως περίπου log r < ), γιατί δεν υπάρχουν αρκετά σηµεία σε υπερ-σφαίρες µε τόσο µικρές ακτίνες και η στατιστική είναι φτωχή Επίσης η κλιµάκωση δε διατηρείται για πολύ µεγάλα r (περίπου log r > για µεγάλα ), όπου η αυτο-οµοιότητα καταστρέφεται από τη γεωµετρία του ελκυστή Η περιοχή κλιµάκωσης είναι αρκετά µεγάλη και εκτείνεται προσεγγιστικά στο διάστηµα < log r < Η περιοχή d logc( r) κλιµάκωσης φαίνεται και στο δεύτερο σχήµα από το οριζόντιο επίπεδο της κλίσης d log r για µεγάλα Για µικρά η περιοχή κλιµάκωσης επεκτείνεται σε ακόµα µικρότερα r Για = το γράφηµα είναι οριζόντια γραµµή σε στάθµη που αντιστοιχεί σε κλίση, ενώ για = πλησιάζει την οριζόντια γραµµή κλίσης και αυτό δείχνει ότι γι αυτές τις τιµές του η ανακατασκευή δεν είναι ικανοποιητική Για µεγαλύτερα τα γραφήµατα της κλίσης συγκλίνουν σε οριζόντια γραµµή που αντιστοιχεί σε κλίση ν Στο τρίτο σχήµα φαίνεται η σταθερή εκτίµηση του ν για, όπου φαίνεται και το µικρό όριο σφάλµατος ±SD Η πραγµατική διάσταση συσχέτισης είναι 6 και δίνεται από την γκρίζα οριζόντια γραµµή Η εκτίµηση του ν επηρεάζεται από πολλούς παράγοντες: Για χρονοσειρές από συνεχή συστήµατα µε µικρό χρόνο δειγµατοληψίας τ, χρονικά κοντινά σηµεία αλλοιώνουν την στατιστική C (r) γιατί ενώ είναι σε απόσταση µικρότερη του r ανήκουν στην ίδια τροχιά και δε θα έπρεπε να µετρηθούν στο C (r) Η µέτρηση τέτοιων ζευγαριών δίνει υποεκτίµηση του ν Μπορούµε απλά να απαλείψουµε όλα αυτά τα ζευγάρια θέτοντας τη συνθήκη j < w στο άθροισµα της (9), όπου w είναι ένας ικανά µεγάλος χρόνος (πχ ο µέσος χρόνος ταλάντωσης) Για χρονοσειρές από συνεχή συστήµατα η επιλογή του χρόνου υστέρησης τ, σε συνδυασµό και µε την διάσταση εµβύθισης µπορεί να επηρεάσει την εκτίµηση του ν, κυρίως όταν η περιοχή κλιµάκωσης του r είναι µικρή Για πολύ µικρά τ µπορεί η σύγκλιση του ν () για διάφορα να δίνει υποεκτίµηση της 4

πραγµατική διάστασης συσχέτισης, ενώ για µεγάλα τ µπορεί να µη συγκλίνουν οι εκτιµήσεις ν () Ο θόρυβος (συστήµατος ή παρατήρησης) αλλοιώνει την κλιµάκωση για αποστάσεις r ως και το επίπεδο του εύρους του θορύβου Σε τέτοιες αποστάσεις r η αυτο-οµοιότητα καταστρέφεται από το θόρυβο και η κατανοµή των σηµείων καθορίζεται περισσότερο από την κατανοµή του θορύβου παρά από τη δυναµική του συστήµατος Γι αυτό για µικρά r εµφανίζεται η κλίση να προσεγγίζει το Αυτό έχει ως αποτέλεσµα να µικραίνει η περιοχή κλιµάκωσης του r που επιτρέπει την σωστή εκτίµηση του ν Αν µάλιστα το εύρος του θορύβου είναι µεγάλο µπορεί η περιοχή κλιµάκωσης να καλύπτεται πλήρως και να µην είναι δυνατή η εκτίµηση του ν 4 Το µήκος N της χρονοσειράς καθορίζει επίσης το µέγεθος της περιοχής κλιµάκωσης Για µικρό N το διάστηµα των τιµών του r που υποστηρίζει το νόµο κλιµάκωσης συρρικνώνεται από τα αριστερά γιατί για µικρές τιµές του r η στατιστική των σηµείων είναι φτωχή Παράδειγµα (συνέχεια, σύστηµα Lorenz) Ακολουθούµε την ίδια διαδικασία εκτίµησης του ν αλλά στην χρονοσειρά του συστήµατος Lorenz προσθέσαµε λευκό Gauan θόρυβο µε SD % του SD των δεδοµένων Η ανακατασκευή του χώρου καταστάσεων είναι όπως πριν µε τ = και =,, Όπως φαίνεται από τα τρία παρακάτω σχήµατα η περιοχή κλιµάκωσης του r έχει µικρύνει λόγω του θορύβου αλλά η εκτίµηση του ν είναι ακόµα δυνατή για < log r < Επίσης για µικρά r ( log r < ) η κλίση µεγαλώνει και τείνει να προσεγγίσει την αντίστοιχη τιµή του log C(r) 4 lope 8 7 6 4 ν 6 4 log r log r 4 6 8 Επαναλαµβάνουµε την ίδια διαδικασία αλλά για χρόνο υστέρησης τ = Όπως φαίνεται στα τρία παρακάτω σχήµατα αυτή η επιλογή του τ δεν επιτρέπει αξιόπιστη εκτίµηση της διάστασης συσχέτισης Οι κλίσεις δε συγκλίνουν αλλά αυξάνουν καθώς το αυξάνει και εποµένως η εκτίµηση του ν αυξάνει µε το Αυτό συµβαίνει γιατί το παράθυρο χρόνου της ανακατασκευής τ w = ( ) τ γίνεται πολύ µεγάλο και οι αναδιπλώσεις του ελκυστή καταστρέφουν την κλιµάκωση για µεγάλα r ( log r > ), για τα οποία βρήκαµε να διατηρείται κάποια κλιµάκωση παραπάνω για τ = log C(r) 4 log r lope 8 7 6 4 log r ν 6 4 4 6 8

Η εκτίµηση της διάστασης συσχέτισης σε πραγµατικές χρονοσειρές παρουσιάζει πολλές δυσκολίες και η επιλογή των παραµέτρων έχει µεγάλη σηµασία Λόγω ακριβώς της αδυναµίας ακριβής εκτίµησης του ν σε πραγµατικά προβλήµατα, είναι δύσκολο να χαρακτηρίσουµε το σύστηµα ως χαοτικό από τον υπολογισµό µη-ακέραιου ν Για παράδειγµα το αποτέλεσµα ν = ± δεν αποκλείει ότι το σύστηµα που έδωσε τη χρονοσειρά είναι ένας τόρος διάστασης Όµως µπορούµε να συµπεράνουµε ότι µε 4 βαθµούς ελευθερίας (δηλαδή µεταβλητές) θα µπορούσαµε να περιγράψουµε αυτό το σύστηµα Εκθέτες Lyapunov Η ιδιότητα των χαοτικών δυναµικών συστηµάτων να έχουν ευαισθησία στις αρχικές συνθήκες κάνει τροχιές τους που αρχικά είναι πολύ κοντά να αποκλίνουν γρήγορα και µάλιστα εκθετικά Ο µέσος εκθέτης που αντιστοιχεί στη διεύθυνση της µεγαλύτερης απόκλισης των τροχιών είναι ο µεγαλύτερος εκθέτης Lyapunov Γενικά για ένα δυναµικό σύστηµα που παράγει τροχιές σε κάποιο χώρο διάστασης υπάρχουν εκθέτες Lyapunov, ένας για κάθε διεύθυνση Ένας αρνητικός εκθέτης Lyapunov δηλώνει το βαθµό σύγκλισης τροχιών στη διεύθυνση που του αντιστοιχεί ενώ ένας θετικός εκθέτης Lyapunov δηλώνει το βαθµό απόκλισης των τροχιών σε αυτήν τη διεύθυνση Για ροές, τουλάχιστον ένας εκθέτης Lyapunov είναι και αντιστοιχεί στη διεύθυνση της κίνησης της τροχιάς Αν το αιτιοκρατικό δυναµικό σύστηµα δεν είναι χαοτικό τότε δεν έχει κανένα θετικό εκθέτη Lyapunov Για συστήµατα απώλειας ενέργειας το άθροισµα των εκθετών Lyapunov είναι πάντα αρνητικό Υπάρχουν µέθοδοι εκτίµησης όλου του φάσµατος των εκθετών Lyapunov αλλά εδώ θα περιοριστούµε στην εκτίµηση του µέγιστου εκθέτη Lyapunov λ (aal Lyapunov eponen), που µας επιτρέπει να χαρακτηρίσουµε το σύστηµα χαοτικό αν λ >, καθώς και να µετρήσουµε το βαθµό πολυπλοκότητας του συστήµατος µε την τιµή του λ Ας υποθέσουµε ότι δύο σηµεία και βρίσκονται κοντά και σε απόσταση δ = ' που ανήκουν σε δύο διαφορετικές τροχιές ', όπως δείχνει το παρακάτω σχήµα Μετά από κάποιο χρόνο η απόσταση τους γίνεται δ = + ' + Ο µέγιστος εκθέτης Lyapunov ορίζεται ως λ δ δ για () e + δ δ + Αν το σύστηµα είναι χαοτικό και οι τροχιές αποκλίνουν ο εκθέτης λ είναι θετικός Βέβαια δύο τροχιές δε µπορεί συνέχεια να αποκλίνουν καθώς αυξάνει ο χρόνος αφού ο ελκυστής περιορίζεται σε κάποια περιοχή του χώρου καταστάσεων Άρα η σχέση της () ισχύει για χρόνους, όπου το δ παραµένει µικρό Για να είναι δυνατόν λοιπόν να µετρηθεί η απόκλιση θα πρέπει να ισχύει δ 6

Ο ορισµός της () έχει πρακτικές δυσκολίες και δεν επιτρέπει τον υπολογισµό του λ από πεπερασµένη χρονοσειρά αφού δε µπορεί να ισχύει δ και Η εκτίµηση του λ, όπου ο ελκυστής αποτελείται από το σύνολο των ανακατασκευασµένων σηµείων, γίνεται ως εξής: Αρχίζουµε µε ένα σηµείο αναφοράς του ανακατασκευασµένου ελκυστή και βρίσκουµε το κοντινότερο σηµείο ' του ελκυστή, έστω σε απόσταση δ, Υπολογίζουµε την απόσταση των δύο τροχιών που ξεκινούν ύστερα από χρόνο, δηλαδή την απόσταση δ, των σηµείων + και ' + Ορίζουµε ως νέο σηµείο αναφοράς + και επαναλαµβάνουµε τα βήµατα και 4 Επαναλαµβάνουµε την ίδια διαδικασία µέχρι τα σηµεία αναφοράς να καλύψουν όλα τα σηµεία Ο µέγιστος εκθέτης Lyapunov εκτιµάται από το µέσο όρο της εκθετικής απόκλισης δ, από δ, (δες ()) όλων των σηµείων αναφοράς ως λ δ N, j = log () N j= δ, j Για χρονοσειρές, τα σηµεία προέρχονται από την χρονοσειρά µε την ανακατασκευή του χώρου καταστάσεων Εκτός από τις παραµέτρους τ και της ανακατασκευής θα πρέπει να οριστούν κι άλλες παράµετροι του αλγόριθµου εκτίµησης του λ, όπως ο χρόνος (δε θα αναλύσουµε παραπάνω τον αλγόριθµο αυτό εδώ) Όπως και για την εκτίµηση της διάστασης συσχέτισης, η εκτίµηση του λ επηρεάζεται από το θόρυβο και το µήκος της χρονοσειράς κατά τον ίδιο τρόπο, δηλαδή περισσότερος θόρυβος ή µικρότερο µήκος δίνουν χειρότερες εκτιµήσεις του λ Ένα βασικό πρόβληµα µε την εκτίµηση του λ µε την παραπάνω µέθοδο είναι η προϋπόθεση ότι η απόκλιση είναι εκθετική, όπως συµβαίνει στα χαοτικά συστήµατα Όταν εφαρµόζουµε τη µέθοδο σε κάποια χρονοσειρά δε ξέρουµε από πριν αν είναι χαοτική Η µέθοδος αυτή δίνει επίσης θετική τιµή του λ για στοχαστικά συστήµατα Για λ αντιστοιχεί σε απόκλιση ίση µε την παράδειγµα για χρονοσειρά από λευκό θόρυβο, το τυπική απόκλιση του θορύβου για = Η εκτίµηση του λ δε µπορεί λοιπόν να ξεχωρίσει ένα χαοτικό από ένα στοχαστικό σύστηµα Γι αυτό το λόγο υπάρχουν τροποποιήσεις αυτής της µεθόδου αλλά δε θα µας απασχολήσουν εδώ Παράδειγµα (σύστηµα Lorenz) Για τη χρονοσειρά του συστήµατος Lorenz χωρίς θόρυβο και τη χρονοσειρά µε % λευκό θόρυβο, για τις οποίες εκτιµήσαµε τη διάσταση συσχέτισης, εκτιµούµε τώρα το µέγιστο εκθέτη Lyapunov λ για τους συνδυασµούς των παραµέτρων ανακατασκευής του χώρου καταστάσεων τ =,, και =,, Τα αποτελέσµατα δίνονται στα δύο παρακάτω σχήµατα 7

λ 9 8 7 6 4 Lorenz noe free, LLE τ= τ= τ= 4 6 8 λ 9 8 7 6 4 Lorenz + % noe, LLE τ= τ= τ= 4 6 8 Παρατηρούµε ότι όταν η χρονοσειρά δεν έχει θόρυβο η εκτίµηση του λ είναι σταθερή για διάφορους συνδυασµούς των παραµέτρων ανακατασκευής ενώ όταν προστίθεται ο θόρυβος τα αποτελέσµατα της εκτίµησης δε συµφωνούν για διαφορετικές τιµές των τ και και η εκτίµηση του λ γίνεται αβέβαιη Γι αυτό το παράδειγµα φαίνεται πως οι καλύτερες εκτιµήσεις του λ είναι για τιµές του γύρω στο 4 όταν τ= ή 8

4 Μη-γραµµικά µοντέλα πρόβλεψης Θεωρώντας την ανακατασκευή του χώρου των καταστάσεων και την υπόθεση ότι η χρονοσειρά είναι η προβολή κάποιου δυναµικού συστήµατος, τα σηµεία του ανακατασκευασµένου ελκυστή ορίζονται από τη συνάρτηση (διανυσµατικό πεδίο) F : R R, = + F( ), ή γενικά για κάποιο χρονικό βήµα T, T + T= F ( ) Σε T προβλήµατα πρόβλεψης της χρονοσειράς δε µας ενδιαφέρει να εκτιµήσουµε την F αλλά µόνο τη συνιστώσα της, F T : R R, που ορίζει το στοιχείο + T της T χρονοσειράς, + T = F ( ) Είναι φανερό ότι ένα ικανοποιητικό µοντέλο για την T συνάρτηση F θα πρέπει να είναι µη-γραµµικό για να µπορεί να κατέχει τις ιδιότητες του αρχικού συστήµατος όπως αυτές διατηρούνται µέσω της ανακατασκευής Σηµειώνεται ότι αν το σύστηµα είναι χαοτικό τότε έχει ευαισθησία στις αρχικές συνθήκες κι άρα ανεξάρτητα από την καταλληλότητα του µοντέλου οι προβλέψεις περιορίζονται σε µικρό χρονικό ορίζοντα και η αβεβαιότητα της πρόβλεψης αυξάνει εκθετικά σύµφωνα µε τον µέγιστο εκθέτη Lyapunov Υπάρχουν πολλές κλάσεις µη-γραµµικών µοντέλων και τα µοντέλα µπορούν να χωριστούν ανάλογα µε το πώς ορίζονται στο χώρο καταστάσεων σε καθολικά, ηµι-τοπικά και τοπικά Τα καθολικά µοντέλα έχουν µοναδική αναλυτική έκφραση για όλο το πεδίο ορισµού Τέτοια µοντέλα είναι τα πολυωνυµικά και κλασµατικά Τα ηµι-τοπικά µοντέλα εκφράζονται αναλυτικά όπως τα καθολικά µοντέλα αλλά αποτελούνται από ένα σύνολο βασικών συναρτήσεων και γι αυτό η µορφή τους αλλάζει στις διάφορες περιοχές του χώρου καταστάσεων Τέτοια µοντέλα είναι τα νευρωνικά δίκτυα (neural nework) και οι βασικές ακτινωτές συναρτήσεις (radal ba funcon) Τα τοπικά µοντέλα δεν επιδέχονται µοναδική αναλυτική έκφραση για όλο το πεδίο ορισµού αλλά διαµορφώνονται διαφορετικά σε κάθε περιοχή του χώρου καταστάσεων Τέτοια µοντέλα είναι τα µοντέλα πυρήνων (kernel odel) και τα τοπικά γραµµικά µοντέλα Στη συνέχεια θα ασχοληθούµε µε τα τοπικά γραµµικά µοντέλα πρόβλεψης (local lnear predcon odel) γιατί είναι τα πιο γνωστά στα πλαίσια αυτή της ανάλυσης χρονοσειρών Το τοπικό γραµµικό µοντέλο για κάθε χρονική στιγµή είναι + = F( ) = F(, τ,, ( ) τ), () () () () () = φ + φ + φ + + φ τ ( ) τ () () () όπου οι παράµετροι φ, φ,, φ ορίζονται (και εκτιµώνται) για κάθε σηµείο Η βασική διαφορά από το κλασικό αυτοπαλινδροµούµενο AR µοντέλο είναι ότι για την () () () εκτίµηση των παραµέτρων φ, φ,, φ δε χρησιµοποιούνται όλα τα στοιχεία της χρονοσειράς αλλά µόνο κάποια τµήµατα (egen) που «µοιάζουν» στο τµήµα,,, Στον ανακατασκευασµένο χώρο καταστάσεων R αυτά τα { τ ( ) τ } τµήµατα της χρονοσειράς αντιστοιχούν σε γειτονικά σηµεία του = [,,, ]' τ ( ) τ Έστω (), (),, ( K) τα Κ κοντινότερα σηµεία στο που βρέθηκαν για χρόνους µικρότερους του Πριν περάσουµε στο γραµµικό µοντέλο ας ορίσουµε δύο απλά τοπικά 9

µοντέλα Η πιο απλή πρόβλεψη του + είναι από την εικόνα του πιο κοντινού σηµείου (), δηλαδή ˆ () = (4) + () + Αυτή είναι η πρόβλεψη µηδενικής τάξης (zeroh order predcon) Αν συµπεριλάβουµε κι άλλα γειτονικά σηµεία µπορούµε να κάνουµε πρόβλεψη παίρνοντας το µέσο όρο των εικόνων των γειτονικών σηµείων Για K γειτονικά σηµεία του η πρόβλεψη είναι K () = ( j) + () K j= Αυτή είναι η τοπική πρόβλεψη µέσου όρου (local average predcon) Μπορεί εναλλακτικά να οριστεί από το σταθµισµένο µέσο όρο, σταθµίζοντας µε την απόσταση του κάθε γειτονικού σηµείου από το Τα δύο παραπάνω µοντέλα δεν απαιτούν εκτίµηση κάποιας παραµέτρου του µοντέλου ενώ για το τοπικό γραµµικό µοντέλο της () για την πρόβλεψη σε κάθε χρονική στιγµή πρέπει να οριστούν οι παράµετροι () () () φ, φ,, φ Υποθέτουµε ότι το µοντέλο της () ισχύει για µια µικρή περιοχή γύρω από το κι άρα και για τα σηµεία (), (),, ( K) Η εκτίµηση των παραµέτρων δίνεται εύκολα από τη µέθοδο ελαχίστων τετραγώνων ως n ( τ ),,, φ φ φ K j= ( j) + φ φ ( j) φ ( j) ( ) (6) () () () και η πρόβλεψη του + δίνεται από την () για τις τιµές των φ, φ,, φ που προκύπτουν από τη λύση της (6) Για πρόβλεψη T χρονικών βηµάτων µπορούµε απλά να αλλάξουµε τις εικόνες ( j) + για ένα χρονικό βήµα στην (6) µε τις εικόνες ( j ) + T για T χρονικά βήµατα Μπορούµε επίσης να κάνουµε την πρόβλεψη επαναληπτικά προβλέποντας κάθε φορά την επόµενη εικόνα βήµατος Για παράδειγµα, έχοντας υπολογίσει το () σχηµατίζουµε το διάνυσµα + αντικαθιστώντας τη συνιστώσα + µε το (), βρίσκουµε τα γειτονικά σηµεία του + και προχωράµε στον υπολογισµό του ( ) ˆ + Για την αξιολόγηση της απόδοσης των µοντέλων πρόβλεψης χωρίζεται η χρονοσειρά σε δύο τµήµατα: To πρώτο σύνολο σηµείων για την εκµάθηση του µοντέλου (ranng e) Για τα τοπικά µοντέλα αυτό το σύνολο σηµείων δίνει τους γείτονες του σηµείου αναφοράς Το δεύτερο σύνολο σηµείων για την εκτίµηση του λάθους πρόβλεψης (e e) Αυτά είναι τα σηµεία αναφοράς για τα οποία γίνεται πρόβλεψη και συγκρίνεται µε τις πραγµατικές παρατηρήσεις Το λάθος πρόβλεψης µετριέται συνήθως µε τη ρίζα του µέσου τετραγωνικού σφάλµατος re ή µε το κανονικοποιηµένο re (nre) (διαιρώντας µε τη διασπορά της χρονοσειράς) Τιµές του nre κοντά στο αντιστοιχούν σε πολύ καλές προβλέψεις ενώ για nre κοντά στο η πρόβλεψη είναι περίπου ισοδύναµη µε την σταθερή πρόβλεψη χρησιµοποιώντας τη µέση τιµή Παράδειγµα (σύστηµα Lorenz)

Για τη χρονοσειρά σηµείων χωρίς θόρυβο της -µεταβλητής του Lorenz µε τ = προσαρµόστηκε το τοπικό γραµµικό µοντέλο πρόβλεψης (local lnear predcon, LLP) και το µοντέλο πρόβλεψης τοπικού µέσου όρου (local average predcon LAP) µε τ =, = και χρησιµοποιώντας K = γειτονικά σηµεία Οι προβλέψεις για και χρονικά βήµατα δίνονται στα παρακάτω σχήµατα Για T = οι προβλέψεις είναι ικανοποιητικές, µε τη µέθοδο LLP να υπερτερεί σηµαντικά Για χρόνο πρόβλεψης T =, η δυνατότητα πρόβλεψης µειώνεται σηµαντικά και το λάθος πρόβλεψης δε διαφέρει σηµαντικά στα δύο µοντέλα lor: orgnal and predced, T= orgnal LLP() nre=64 LAP() nre=7 lor: orgnal and predced, T= orgnal LLP() nre=8 LAP() nre=678 () () 4 4 44 46 48 e nde 4 4 44 46 48 e nde Επαναλαµβάνουµε την ίδια διαδικασία πρόβλεψης αφού έχουµε προσθέσει % λευκό θόρυβο στη χρονοσειρά Τα αποτελέσµατα δίνονται στα δύο παρακάτω σχήµατα Το λάθος πρόβλεψης έχει αυξηθεί και για τα δύο µοντέλα Για T = η πρόβλεψη µε το τοπικό γραµµικό µοντέλο είναι στο επίπεδο πρόβλεψης του µέσου όρου lor + % noe: orgnal and predced, T= orgnal LLP() nre=7 LAP() nre=6 lor + % noe: orgnal and predced, T= orgnal LLP() nre=9968 LAP() nre=748 () () 4 4 44 46 48 e nde 4 4 44 46 48 e nde Η πρόβλεψη µε τα τοπικά γραµµικά µοντέλα και µε τα µη-γραµµικά µοντέλα γενικότερα επηρεάζεται από τις παραµέτρους τ και καθώς και από το θόρυβο και το µήκος της χρονοσειράς, όπως και για τις εκτιµήσεις των µη-γραµµικών χαρακτηριστικών Για τα τοπικά γραµµικά µοντέλα υπάρχουν και άλλοι παράγοντες που καθορίζουν την απόδοση του µοντέλου, όπως ο αριθµός των γειτονικών σηµείων K Ανεξάρτητα από την καταλληλότητα του µοντέλου και την επιλογή των παραµέτρων η πρόβλεψη χαοτικών χρονοσειρών έχει νόηµα για µικρό χρονικό ορίζοντα που ορίζεται από τον µέγιστο εκθέτη Lyapunov

Ασκήσεις ηµιουργείστε µια χρονοσειρά σηµείων από τη λογιστική απεικόνιση για α=4 Κάντε ανακατασκευή του χώρου καταστάσεων για = και τ=,, Τι παρατηρείτε; Θα µπορούσατε να εκτιµήσετε σωστά τη διάσταση συσχέτισης για = και τ= και γιατί; Έστω ότι η χρονοσειρά είναι λευκός οµοιόµορφος θόρυβος και ότι η απόσταση δύο σηµείων ορίζεται από τη au nor, {, k =,, } = a, j k kτ όπου τ και ο χρόνος υστέρησης και η διάσταση εµβύθισης της ανακατασκευής του χώρου καταστάσεων Χρησιµοποιώντας το νόµο κλιµάκωσης για την πιθανότητα Ρ r της (8) δείξτε ότι η διάσταση συσχέτισης είναι ν = ( ) j < είξτε ότι για µονοδιάστατη απεικόνιση + = f ( ) ο εκθέτης Lyapunov είναι N df λ = l ln ( n ) N N n= d 4 Η απεικόνιση en ap είναι ένα τµηµατικό πολυώνυµο που δίνεται ως < + = ( ) a Σχηµατίστε το διάγραµµα διασποράς της απεικόνισης αυτής και βρείτε τα σηµεία ισορροπίας Υπολογίστε την ευστάθεια τους (ένα σηµείο ισορροπίας είναι df ευσταθής αν ( ) < ) d b Υπολογίστε τροχιές της απεικόνισης (κάνετε ως επαναλήψεις) για κάποιες διαφορετικές αρχικές συνθήκες; Τι παρατηρείτε; c είξτε ότι η απεικόνιση αυτή είναι χαοτική χρησιµοποιώντας τον εκθέτη Lyapunov (δες Άσκηση ) ίνεται η χρονοσειρά { }, =,, 44 98 6 97 7 7 7 9 4 8 6 6 a Υπολογίστε και κάνετε τη γραφική παράσταση της συνάρτησης αυτοσυσχέτισης b Προσαρµόστε µοντέλο AR() και AR() στη χρονοσειρά c Προσαρµόστε µοντέλο πολυωνύµου τύπου = a + a + a στη χρονοσειρά d Κάνετε διάγραµµα διασποράς και σχεδιάστε επάνω σε αυτό τα γραφήµατα του πολυωνυµικού µοντέλου και του µοντέλου AR() Τι παρατηρείτε; e Υπολογίστε το re από την προσαρµογή και συγκρίνετε τα τρία µοντέλα f Κάνετε προβλέψεις και µε τα τρία µοντέλα για ( T), T =, (δηλαδή τις επόµενες παρατηρήσεις) g Κάνετε προβλέψεις για ( T), T =, χρησιµοποιώντας το µοντέλο πρόβλεψης µηδενικού βαθµού και συγκρίνετε τις προβλέψεις και µε τα 4 µοντέλα j kτ