ΣΥΓΚΡΙΣΗ ΣΥΝΤΕΛΕΣΤΩΝ ΣΥΣΧΕΤΙΣΗΣ ΣΕ ΧΡΟΝΟΣΕΙΡΕΣ ΜΕΤΑΠΤΥΧΙΑΚΗ ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ. Φαίδρα Θεοδοσίου

Σχετικά έγγραφα
Χρονικές σειρές 2 Ο μάθημα: Εισαγωγή στις χρονοσειρές

Στασιμότητα χρονοσειρών Νόθα αποτελέσματα-spurious regression Ο έλεγχος στασιμότητας είναι απαραίτητος ώστε η στοχαστική ανάλυση να οδηγεί σε ασφαλή

ΜΑΘΗΜΑ 3ο. Βασικές έννοιες

ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Τραπεζικής & Χρηματοοικονομικής

ΑΠΟ ΤΟ ΔΕΙΓΜΑ ΣΤΟΝ ΠΛΗΘΥΣΜΟ

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 2 Μαΐου /23

Χρονολογικές Σειρές (Time Series) Lecture notes Φ.Κουντούρη 2008

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Εφαρμοσμένη Στατιστική: Συντελεστής συσχέτισης. Παλινδρόμηση απλή γραμμική, πολλαπλή γραμμική

ΕΙΔΙΚΑ ΘΕΜΑΤΑ ΔΙΑΧΕΙΡΙΣΗΣ ΚΙΝΔΥΝΟΥ. Συσχέτιση (Correlation) - Copulas

Χρονικές σειρές 5 Ο μάθημα: Γραμμικά στοχαστικά μοντέλα (1) Αυτοπαλίνδρομα μοντέλα Εαρινό εξάμηνο Τμήμα Μαθηματικών ΑΠΘ

Χ. Εμμανουηλίδης, 1

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ. ΜΑΘΗΜΑ 4ο

ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΤΜΗΜΑ ΟΡΓΑΝΩΣΗΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΔΙΔΑΣΚΩΝ: ΘΑΝΑΣΗΣ ΚΑΖΑΝΑΣ. Οικονομετρία

ΤΜΗΜΑΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥΣΧΕΔΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝΣΥΣΤΗΜΑΤΩΝ

Χρονικές σειρές 3 Ο μάθημα: Βασικές στοχαστικές διαδικασίες Μη στάσιμες χρονοσειρές Εαρινό εξάμηνο Τμήμα Μαθηματικών ΑΠΘ

Υ: Νόσος. Χ: Παράγοντας Κινδύνου 1 (Ασθενής) 2 (Υγιής) Σύνολο. 1 (Παρόν) n 11 n 12 n 1. 2 (Απών) n 21 n 22 n 2. Σύνολο n.1 n.2 n..

Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 19/5/2017

ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΤΜΗΜΑ ΟΡΓΑΝΩΣΗΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΔΙΔΑΣΚΩΝ: ΘΑΝΑΣΗΣ ΚΑΖΑΝΑΣ. Οικονομετρία

9. Παλινδρόμηση και Συσχέτιση

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

ΘΕΩΡΙΑ ΟΙΚΟΝΟΜΕΤΡΙΑΣ ΣΥΝΟΠΤΙΚΕΣ ΣΗΜΕΙΩΣΕΙΣ

Εισόδημα Κατανάλωση

Υ: Νόσος. Χ: Παράγοντας Κινδύνου 1 (Ασθενής) 2 (Υγιής) Σύνολο. 1 (Παρόν) n 11 n 12 n 1. 2 (Απών) n 21 n 22 n 2. Σύνολο n.1 n.2 n..

ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ. Παπάνα Αγγελική

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

Δειγματοληψία. Πρέπει να γνωρίζουμε πως πήραμε το δείγμα Το πλήθος n ij των παρατηρήσεων σε κάθε κελί είναι τ.μ. με μ ij συμβολίζουμε την μέση τιμή:

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

HMY 795: Αναγνώριση Προτύπων

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

ΤΜΗΜΑΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥΣΧΕΔΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝΣΥΣΤΗΜΑΤΩΝ

ΕΠΑΝΑΛΗΨΗ ΒΑΣΙΚΩΝ ΕΝΝΟΙΩΝ ΣΤΑΤΙΣΤΙΚΗΣ

Δειγματοληψία. Πρέπει να γνωρίζουμε πως πήραμε το δείγμα Το πλήθος n ij των παρατηρήσεων σε κάθε κελί είναι τ.μ. με μ ij συμβολίζουμε την μέση τιμή:

Χρονικές σειρές 6 Ο μάθημα: Αυτοπαλίνδρομα μοντέλα (2)

Πινάκες συνάφειας. Βαρύτητα συμπτωμάτων. Φύλο Χαμηλή Υψηλή. Άνδρες. Γυναίκες

3.4.2 Ο Συντελεστής Συσχέτισης τ Του Kendall

HMY 799 1: Αναγνώριση Συστημάτων

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium iv

ΟΙΚΟΝΟΜΕΤΡΙΑ Κεφάλαιο 2

Κεφάλαιο 9. Έλεγχοι υποθέσεων

Στοχαστικές Μέθοδοι στους Υδατικούς Πόρους Τυχαίες μεταβλητές, στοχαστικές ανελίξεις και χρονοσειρές

Κεφάλαιο 9. Έλεγχοι υποθέσεων

Αναλυτική Στατιστική

ΘΕΩΡΙΑ ΠΛΗΡΟΦΟΡΙΑΣ. Κεφάλαιο 2 : Πληροφορία και Εντροπία Διάλεξη: Κώστας Μαλιάτσος Χρήστος Ξενάκης, Κώστας Μαλιάτσος

Διαχείριση Υδατικών Πόρων

ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ. Παπάνα Αγγελική

ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ MSc Τραπεζικής & Χρηματοοικονομικής

Χρονοσειρές, Μέρος Β 1 Πρόβλεψη Χρονικών Σειρών

Οικονομετρία Ι. Ενότητα 4: Διάστημα Εμπιστοσύνης - Έλεγχος Υποθέσεων. Δρ. Χαϊδώ Δριτσάκη Τμήμα Λογιστικής & Χρηματοοικονομικής

Τεχνικές Προβλέψεων Αυτοπαλινδρομικά Μοντέλα Κινητού Μέσου Όρου (ARIMA)

3. Κατανομές πιθανότητας

Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης

X = = 81 9 = 9

HMY 795: Αναγνώριση Προτύπων. Διάλεξη 2

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

ΣΤΟΧΑΣΤΙΚΑ ΣΥΣΤΗΜΑΤΑ & ΕΠΙΚΟΙΝΩΝΙΕΣ 1o Τμήμα (Α - Κ): Αμφιθέατρο 4, Νέα Κτίρια ΣΗΜΜΥ Θεωρία Πιθανοτήτων & Στοχαστικές Ανελίξεις - 2

Χρονικές σειρές 10 Ο μάθημα: Μη στάσιμα μοντέλα ARIMA Μεθοδολογία Box-Jenkins Εαρινό εξάμηνο Τμήμα Μαθηματικών ΑΠΘ

Χρονικές σειρές 8 Ο μάθημα: Μοντέλα κινητού μέσου

Στατιστική. Εκτιμητική

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 14 Μαρτίου /34

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I Παντελής Δημήτριος Τμήμα Μηχανολόγων Μηχανικών

Α Ν Ω Τ Α Τ Ο Σ Υ Μ Β Ο Υ Λ Ι Ο Ε Π Ι Λ Ο Γ Η Σ Π Ρ Ο Σ Ω Π Ι Κ Ο Υ Ε Ρ Ω Τ Η Μ Α Τ Ο Λ Ο Γ Ι Ο

ΟΙΚΟΝΟΜΕΤΡΙΑ. Β μέρος: Ετεροσκεδαστικότητα. Παπάνα Αγγελική

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

Χρήστος Ξενάκης. Πανεπιστήμιο Πειραιώς, Τμήμα Ψηφιακών Συστημάτων

Μάθημα 1: Εισαγωγή στην ανα λυση χρονοσειρω ν, στασιμο τητα και αυτοσυσχε τιση

Στατιστική Ι. Ενότητα 9: Κατανομή t-έλεγχος Υποθέσεων. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

Θεωρία Πιθανοτήτων & Στατιστική

ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ ΜΠΣ Τραπεζικής & Χρηματοοικονομικής

ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ 3 ΔΕΣΜΕΥΜΕΝΗ ΠΙΘΑΝΟΤΗΤΑ, ΟΛΙΚΗ ΠΙΘΑΝΟΤΗΤΑ ΘΕΩΡΗΜΑ BAYES, ΑΝΕΞΑΡΤΗΣΙΑ ΚΑΙ ΣΥΝΑΦΕΙΣ ΕΝΝΟΙΕΣ 71

ΚΕΦΑΛΑΙΟ 3ο ΤΥΧΑΙΟΙ ΑΡΙΘΜΟΙ ΕΛΕΓΧΟΣ ΤΥΧΑΙΟΤΗΤΑΣ

Είδη Μεταβλητών Κλίμακα Μέτρησης Οι τεχνικές της Περιγραφικής στατιστικής ανάλογα με την κλίμακα μέτρησης Οι τελεστές Π και Σ

Στατιστική είναι το σύνολο των μεθόδων και θεωριών που εφαρμόζονται σε αριθμητικά δεδομένα προκειμένου να ληφθεί κάποια απόφαση σε συνθήκες

Μάθημα 5-6: Στάσιμες πολυμεταβλητές χρονοσειρές και μοντέλα Διασυσχέτιση Διανυσματικά αυτοπαλίνδρομα μοντέλα Δίκτυα από πολυμεταβλητές χρονοσειρές

ΕΞΕΤΑΣΗ ΤΗΣ ΣΧΕΣΗΣ ΔΥΟ ΜΕΤΑΒΛΗΤΩΝ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΟΙΚΟΝΟΜΕΤΡΙΑ. Βιολέττα Δάλλα. Εθνικό και Καποδιστριακό Πανεπιστήµιο Αθηνών

Χρονοσειρές Μάθημα 3. Γραμμικές στάσιμες διαδικασίες. Γραμμική χρονοσειρά (στοχαστική διαδικασία) Z Z ~ WN(0, ) είναι στάσιμη. Θεωρούμε μ=0 E[ X ] 0

ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ

Αντικείμενο του κεφαλαίου είναι: Ανάλυση συσχέτισης μεταξύ δύο μεταβλητών. Εξίσωση παλινδρόμησης. Πρόβλεψη εξέλιξης

3. ΣΕΙΡΙΑΚΟΣ ΣΥΝΤΕΛΕΣΤΗΣ ΣΥΣΧΕΤΙΣΗΣ

ΤΕΧΝΙΚΗ ΥΔΡΟΛΟΓΙΑ Πιθανοτική προσέγγιση των υδρολογικών μεταβλητών

Στατιστική Συμπερασματολογία

Χρονοσειρές - Μάθημα 7. Μη-γραμμική ανάλυση χρονοσειρών

Επισκόπηση ύλης Πιθανοτήτων: Μέρος ΙΙ. M. Kούτρας

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ ΠΙΘΑΝΟΤΗΤΕΣ 13 ΚΕΦΑΛΑΙΟ 1 ΕΙΣΑΓΩΓΗ 15 ΚΕΦΑΛΑΙΟ 2 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 19

HMY 429: Εισαγωγή στην Επεξεργασία Ψηφιακών. Χρόνου (Ι)

Οι παρατηρήσεις του δείγματος, μεγέθους n = 40, δίνονται ομαδοποιημένες κατά συνέπεια ο δειγματικός μέσος υπολογίζεται από τον τύπο:

Μάθημα 2: Mη-στάσιμη χρονοσειρά, έλεγχος μοναδιαίας ρίζας και έλεγχος ανεξαρτησίας

Διάλεξη 1: Στατιστική Συμπερασματολογία - Εκτίμηση Σημείου

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ: ΠΙΘΑΝΟΤΗΤΕΣ 11 ΚΕΦΑΛΑΙΟ 1 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 13

Είδη Μεταβλητών. κλίµακα µέτρησης

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium Iii

ΤΜΗΜΑΕΠΙΧΕΙΡΗΜΑΤΙΚΟΥΣΧΕΔΙΑΣΜΟΥ & ΠΛΗΡΟΦΟΡΙΑΚΩΝΣΥΣΤΗΜΑΤΩΝ

Στοχαστικές Μέθοδοι στους Υδατικούς Πόρους Φασματική ανάλυση χρονοσειρών

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

Εργαστήριο Οικονομετρίας Προαιρετική Εργασία 2016 Χειμερινό Εξάμηνο

HMY 799 1: Αναγνώριση Συστημάτων

ΟΚΙΜΑΣΙΕΣ χ 2 (CHI-SQUARE)

Transcript:

ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΤΜΗΜΑ ΜΑΘΗΜΑΤΙΚΩΝ ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ ΣΤΑΤΙΣΤΙΚΗ ΚΑΙ ΕΠΙΧΕΙΡΗΣΙΑΚΗ ΕΡΕΥΝΑ ΣΥΓΚΡΙΣΗ ΣΥΝΤΕΛΕΣΤΩΝ ΣΥΣΧΕΤΙΣΗΣ ΣΕ ΧΡΟΝΟΣΕΙΡΕΣ ΜΕΤΑΠΤΥΧΙΑΚΗ ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ Φαίδρα Θεοδοσίου Επιβλέπουσα : Ε. Μπόρα- Σέντα Αναπ. Καθηγήτρια Α.Π.Θ. Θεσσαλονίκη, 6 Δεκεμβρίου 200

2

ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΤΜΗΜΑ ΜΑΘΗΜΑΤΙΚΩΝ ΜΕΤΑΠΤΥΧΙΑΚΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ ΣΤΑΤΙΣΤΙΚΗ ΚΑΙ ΕΠΙΧΕΙΡΗΣΙΑΚΗ ΕΡΕΥΝΑ ΣΥΓΚΡΙΣΗ ΣΥΝΤΕΛΕΣΤΩΝ ΣΥΣΧΕΤΙΣΗΣ ΣΕ ΧΡΟΝΟΣΕΙΡΕΣ ΜΕΤΑΠΤΥΧΙΑΚΗ ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ Φαίδρα Θεοδοσίου Επιβλέπουσα : Ε. Μπόρα- Σέντα Aναπ. Καθηγήτρια Α.Π.Θ. Εγκρίθηκε από την τριμελή επιτροπή... Ε. Μπόρα- Σέντα Δ. Κουγιουμτζής Π. Μωυσιάδης Αναπ..Καθηγήτρια Α.Π.Θ. Aναπ. Καθηγητής Α.Π.Θ Καθηγητής Α.Π.Θ. Θεσσαλονίκη, 6 Δεκεμβρίου 200 3

Φαίδρα Θεοδοσίου Πτυχιούχος Μαθηματικός Α.Π.Θ. Copyright Φαίδρα Θεοδοσίου Με επιφύλαξη παντός δικαιώματος. All right reserved. Απαγορεύεται η αντιγραφή, αποθήκευση και διανομή της παρούσας εργασίας εξ ολοκλήρου ή τμήματος αυτής, για εμπορικό σκοπό. Επιτρέπεται η ανατύπωση, αποθήκευση και διανομή για σκοπό μη κερδοσκοπικό, εκπαιδευτικής ή ερευνητικής φύσης, υπό την προϋπόθεση να αναφέρεται η πηγή προέλευσης και να διατηρείται το παρόν μήνυμα. Ερωτήματα που αφορούν τη χρήση της εργασίας για κερδοσκοπικό σκοπό πρέπει να απευθύνονται προς το συγγραφέα. Οι απόψεις και τα συμπεράσματα που περιέχονται σε αυτό το έγγραφο εκφράζουν τον συγγραφέα και δεν πρέπει να ερμηνευτεί ότι εκφράζουν τις επίσημες θέσεις του Α.Π.Θ. 4

ΠΕΡΙΛΗΨΗ Για να μελετήσουμε την σχέση μεταξύ δύο τυχαίων μεταβλητών χρησιμοποιούμε τον όρο συσχέτιση. Κατά καιρούς διάφορα μέτρα έχουν οριστεί για τον υπολογισμό της συσχέτισης δύο τυχαίων μεταβλητών. Το πιο γνωστό και ευρέως διαδεδομένο μέτρο είναι ο συντελεστής συσχέτισης του Pearson. Σε αυτή την εργασία χρησιμοποιείται εκτός από τον συντελεστή του Pearson, οι συντελεστές των Kendall, Spearman, την Αμοιβαία Πληροφορία καθώς επίσης και ένα νέο μέτρο το Order Correlation. O στόχος της εργασίας είναι η σύγκριση των παραπάνω μέτρων σε διάφορα συστήματα χρονοσειρών. Αναλυτικά στο πρώτο κεφάλαιο παρουσιάζεται μέτρα συσχέτισης που χρησιμοποιούνται για την εύρεση συσχέτισης μεταξύ δύο τυχαίων μεταβλητών. Στο δεύτερο κεφάλαιο παρουσιάζουμε τα ευρέως διαδεδομένα μέτρα συσχέτισης που χρησιμοποιούνται στις χρονοσειρές. Στο επόμενο κεφάλαιο παρουσιάζεται μία έρευνα για τη σύγκριση συντελεστών συσχέτισης σε πραγματικά ημερήσια δεδομένα. Στο τέταρτο κεφάλαιο αναλύουμε την διαδικασία της προσομοίωσης που πραγματοποιήθηκε. Τέλος στο πέμπτο κεφάλαιο παρουσιάζονται και αξιολογούνται τα αποτελέσματα των προσομοιώσεων. ΛΕΞΕΙΣ ΚΛΕΙΔΙΑ Συντελεστής Συσχέτισης, Συνάρτηση Αυτοσυσχέτισης, Χρονικές Σειρές 5

ABSTRACT To study the relationship between two random variables we use the term correlation. From time to time various measures have been defined for calculating the correlation between two random variables. The most famous and widely used measure is the correlation of Pearson. In the current study apart from the Pearson coefficient, the Kendall and Spearman coefficients, the Mutual Information and the most recent measure of Order Correlation are used. The comparison of the abovementioned measures in various time series systems is the main objective of the study. In the first chapter, the correlation measures used to find the correlation between two random variables are presented. In the second chapter the most widely measures used in the series analysis are presented. While in the following chapter a survey comparing the correlation coefficients from real daily data is presented. In the fourth chapter the simulation procedure followed in the study is analyzed. Finally, in the last chapter the results of the simulations are presented and evaluated KEY WORDS Correlation Coefficient, Autocorrelation Function, Time series 6

ΠΙΝΑΚΑΣ ΠΕΡΙΕΧΟΜΕΝΩΝ ΠΕΡΙΛΗΨΗ.5 ABSTRACT.6 ΠΙΝΑΚΑΣ ΠΕΡΙΕΧΟΜΕΝΩΝ.7 ΕΙΣΑΓΩΓΗ..9 Κεφάλαιο σελίδα ΚΕΦΑΛΑΙΟ ΜΕΤΡΑ ΣΥΣΧΕΤΙΣΗΣ ΤΥΧΑΙΩΝ ΜΕΤΑΒΛΗΤΩΝ. Συντελεστής συσχέτισης του Pearson....2 Συντελεστής συσχέτισης του Kendall....2. Κατανομή του συντελεστή συσχέτισης του Kendall 2.3 Συντελεστής συσχέτισης του Spearman 2.3. Κατανομή του συντελεστή συσχέτισης του Spearman.3.4 Συντελεστής Συσχέτισης Order Correlation..4.4. Ορισμός.4.4.2 Ιδιότητες του νέου συντελεστή συσχέτισης..4.4.3 Η εφαρμογή των Xu, Chang, Hung, Kwan και Fung...7.5 Αμοιβαία Πληροφορία...9.5. Υπολογισμός της Αμοιβαίας Πληροφορίας..9.5.2 Εκτίμηση της Αμοιβαίας Πληροφορίας 2.6 Global συντελεστής συσχέτισης 22.7 Υπόλοιπα μέτρα συσχέτισης..22 ΚΕΦΑΛΑΙΟ 2.23 ΜΕΤΡΑ ΣΥΣΧΕΤΙΣΗΣ ΣΕ ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ.. 2. Συντελεστής του Pearson...23 2.. Συνάρτηση Μερικής Αυτοσυσχέτισης.24 2.2 Συντελεστής του Kendall.. 26 2.3 Συντελεστής του Spearman 26 2.4 Αμοιβαία Πληροφορία...27 7

2.5 Test of autocorrelation στην οικονομετρική ανάλυση 28 2.5. Durbin- Watson τεστ..28 2.5.2 Durbin s h τεστ...29 ΚΕΦΑΛΑΙΟ 3..3 ΑΞΙΟΛΟΓΗΣΗ ΤΩΝ ΜΕΤΡΩΝ ΑΥΤΟΣΥΣΧΕΤΙΣΗΣ ΣΕ ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ 3. Εισαγωγή.3 3.2 Έρευνα των Dionisio A., Menezes R.και Mendes D.A...3 ΚΕΦΑΛΑΙΟ 4.37 Η ΔΙΑΔΙΚΑΣΙΑ ΤΗΣ ΠΡΟΣΟΜΟΙΩΣΗΣ.. 4. Συστήματα..37 4.2 Η διαδικασία της προσομοίωσης...37 ΚΕΦΑΛΑΙΟ 5..40 ΑΠΟΤΕΛΕΣΜΑΤΑ ΚΑΙ ΑΞΙΟΛΟΓΗΣΗ ΠΡΟΣΟΜΟΙΩΣΕΩΝ ΓΙΑ ΤΗ ΣΥΓΚΡΙΣΗ ΣΥΝΤΕΛΕΣΤΩΝ ΣΥΣΧΕΤΙΣΗΣ ΣΕ ΧΡΟΝΟΣΕΙΡΕΣ. 5. Οι προσομοιώσεις.40 5.2 Αποτελέσματα Λευκού Θορύβου από Κανονική Κατανομή 40 5.3 Αποτελέσματα Λευκού Θορύβου από Εκθετική Κατανομή.46 5.4 Αποτελέσματα Λευκού Θορύβου από Cauchy Κατανομή 5 5.5 Αποτελέσματα Αυτοπαλινδρομούμενου Μοντέλου τάξης 55 5.6 Αποτελέσματα Henon Map και Ikeda Map...60 5.7 Συμπεράσματα αποτελέσματα...62 ΠΑΡΑΡΤΗΜΑ...63 ΒΙΒΛΙΟΓΡΑΦΙΑ...66 8

ΕΙΣΑΓΩΓΗ Στη Θεωρία Πιθανοτήτων και στη Στατιστική χρησιμοποιείται το μέτρο της συσχέτισης, που μας δείχνει τη σχέση μεταξύ δύο τυχαίων μεταβλητών. Η ανακάλυψη του όρου συσχέτισης από τον Francis Galton το 888, είναι μία από τις πιο θεμελιώδεις εξελίξεις της ιστορίας της στατιστικής. Λίγο αργότερα ο Karl Pearson, το 920, εξέλιξε τον όρο συσχέτιση και διασαφήνισε αρκετές θεωρίες του Galton. Έθεσε ερωτήματα που αφορούσαν τη γενίκευση της συσχέτισης, πέραν των γραμμικών σχέσεων. Μελέτησε περιπτώσεις όπου η παλινδρόμηση ήταν μη-γραμμική και η θεωρητική διασπορά ασταθής. Όμως δεν κατάφερε να γενικεύσει τον όρο της συσχέτισης σε τέτοιες περιπτώσεις. Ο πιο γνωστός συντελεστής συσχέτισης, ο οποίος προϋποθέτει κανονικότητα είναι του Pearson. Στις περιπτώσεις που δεν έχουμε κανονικότητα ή δεν γνωρίζουμε κάποια παραμετρική κατανομή των τυχαίων μεταβλητών χρησιμοποιούμε μη παραμετρικές μεθόδους συσχέτισης όπως Spearman s ρ, Kendall s καθώς και την Αμοιβαία Πληροφορία. Στην ανάλυση των χρονικών σειρών, όπου έχουμε παρατηρήσεις στον χρόνο μιας μεταβλητής, επειδή η συσχέτιση αφορά μία τυχαία μεταβλητή σε διαφορετικές υστερήσεις, χρησιμοποιούμε τον όρο αυτοσυσχέτιση. Πριν ξεκινήσουμε την ανάλυση των χρονικών σειρών χρειάζεται να ελέγξουμε αν οι παρατηρήσεις της τυχαίας μεταβλητής είναι πράγματι συσχετισμένες. Αν δεν είναι, δεν χρειάζεται να εφαρμοστεί ανάλυση χρονικών σειρών. Στην ανάλυση των χρονοσειρών, επίσης ο πιο ευρέως διαδεδομένος συντελεστής αυτοσυσχέτισης είναι του Pearson. Όμως λόγω των περιορισμών του, δηλαδή της ύπαρξης κανονικότητας ή τουλάχιστον της ύπαρξης γνωστής παραμετρικής κατανομής της τυχαίας μεταβλητής, πρέπει να γίνεται προσεκτικά η χρήση του. Λόγω των παραπάνω προβλημάτων δημιουργήθηκε η ανάγκη να βρεθούν νέες συναρτήσεις αυτοσυσχέτισης για να καλύψουν τις περιπτώσεις, όπως της μη κανονικότητας και της άγνωστης κατανομής της μεταβλητής. Κάποιες από αυτές είναι οι συναρτήσεις αυτοσυσχέτισης των Kendall, Spearman καθώς επίσης και συνάρτηση της Αμοιβαίας Πληροφορίας. Οι δειγματικές αυτοσυσχετίσεις είναι ένα από τα σημαντικότερα «εργαλεία» για την ανάλυση των χρονικών σειρών. Μας βοηθούν να εξετάσουμε την τυχαιότητα 9

μια χρονικής σειράς και να εκτιμήσουμε την εξάρτηση των παρατηρήσεων για διάφορες υστερήσεις. Ακόμα, σημαντικά οικονομικά φαινόμενα μπορούν να εξεταστούν, εξετάζοντας την τυχαιότητα των αντίστοιχων σειρών, όπως η αποτελεσματικότητα της αγοράς (market efficiency [Fama (970)]), ορθολογική προσδοκία (rational expectations [Kantor (979)]) και άλλα. Στη βιβλιογραφία έχουν δοθεί αρκετοί ορισμοί των δειγματικών αυτοσυσχετίσεων. Στην συνέχεια θα δώσουμε τον ορισμό που έχουν προτείνει οι Box και Jenkins (976,p.32). Ορισμός Αυτοσυσχέτισης Έστω x, x 2,..., x n, οι παρατηρήσεις μια χρονικής σειράς. Η δειγματική αυτοσυσχέτιση υστέρησης k συμβολίζεται με r k και δίνεται από τη σχέση όπου X n n k n 2 k = ( i )( i+ k )/ ( i ) k n i= i= r X X X X X X = X / n είναι η δειγματική μέση τιμή. i= i, Σε αυτή την εργασία, αρχικά στο πρώτο κεφάλαιο θα αναφέρουμε τα μέτρα συσχέτισης μαζί με τις μαθηματικές τους ιδιότητες, τα οποία χρησιμοποιούνται στην εύρεση συσχέτισης δύο τυχαίων μεταβλητών. Στο δεύτερο κεφάλαιο θα παρουσιάσουμε αναλυτικά τα μέτρα αυτυσυσχέτισης που χρησιμοποιούνται σε χρονικές σειρές. Στο τρίτο κεφάλαιο θα αξιολογήσουμε τα μέτρα αυτοσυσχέτισης χρονικών σειρών. Στο τέταρτο κεφάλαιο θα παρουσιάσουμε την διαδικασία των προσομοιώσεων και στο τελευταίο κεφάλαιο θα παρουσιάσουμε και θα αξιολογήσουμε τα αποτελέσματα των προσομοιώσεων. 0

ΚΕΦΑΛΑΙΟ ΜΕΤΡΑ ΣΥΣΧΕΤΙΣΗΣ ΤΥΧΑΙΩΝ ΜΕΤΑΒΛΗΤΩΝ. Συντελεστής Συσχέτισης του Pearson O πιο ευρέως διαδεδομένος συντελεστής συσχέτισης είναι του Pearson (Pearson, 920). Tον συναντάμε αλλιώς με τον όρο linear ή product-moment correlation. Στη στατιστική ο συντελεστής συσχέτισης του Pearson είναι ένα μέτρο συσχέτισης (γραμμικής εξάρτησης) μεταξύ δύο μεταβλητών Χ και Υ, με τιμές στο διάστημα [-,+]. Χρησιμοποιείται ευρέως ως ένα μέτρο γραμμικής συσχέτισης δύο μεταβλητών. Έστω ( x, y ) για i =, 2,..., n οι τιμές δύο τυχαίων μεταβλητών Χ και Υ, ο i i δειγματικός συντελεστής συσχέτισης του Pearson υπολογίζεται ως : n X i X Yi Y r = ( ) ( ), n s s i= x y όπου X s, Y s είναι η δειγματική μέση τιμή και η τυπική απόκλιση των τυχαίων, x, y μεταβλητών..2 Συντελεστής Συσχέτισης του Kendall Ο συντελεστής συσχέτισης του Kendall (938) είναι μη παραμετρικό στατιστικό το οποίο χρησιμοποιείται για να μας δώσει το βαθμό συσχέτισης δύο τυχαίων μεταβλητών. Αναπτύχθηκε από τον Maurice Kendall το938. Σύμφωνα με τους Field, Hartley και Pearson (957) ο συντελεστής υπολογίζεται με τον παρακάτω τρόπο. Έστω παρατηρήσεων Χ και Υ αντίστοιχα Για κάθε τάξη R, R i =, 2,..., n οι τάξεις των i ' i R i των παρατηρήσεων της μεταβλητής Χ, υπολογίζουμε τον αριθμό από τις τάξεις των παρατηρήσεων της

μεταβλητής Υ, ' R i για τις οποίες ισχύει ότι ' R i > R i με j>i. Προσθέτοντας τους παραπάνω αριθμούς έχουμε ένα θετικό άθροισμα το οποίο συμβολίζεται με συντελεστής συσχέτισης του Kendall ορίζεται : r K = 4P, K 2 ( n n) P K. Ο.2. Η κατανομή του συντελεστή Αν και έχουν γίνει ικανοποιητικές προσεγγίσεις για την εύρεση της κατανομής του συντελεστή του Kendall για μεγάλο αριθμό παρατηρήσεων, εδώ θα παρουσιάσουμε την κατανομή για μικρό πλήθος. Έστω ότι ( x, y ) για i=,2,,n οι τιμές δύο τυχαίων μεταβλητών Χ και Υ, οι i i οποίες ακολουθούν κανονική κατανομή, με συντελεστή συσχέτισης ρ. Υποθέτουμε ότι τα xi είναι τοποθετημένα κατά μέγεθος και τα τιμή του συντελεστή δόθηκε από τον Greiner (909) 2 E( rk ) = sin π Ενώ η διασπορά του δόθηκε από τον Esscher (924) : ρ ' Ri είναι οι τάξεις των y i. Η μέση 2 2 2 var( rk ) = sin ρ + 2( n 2) sin ρ n( n ) π 9 π 2 2 2.3 Συντελεστής Συσχέτισης του Spearman Ένα άλλο μη παραμετρικό μέτρο (ανεξάρτητο οποιασδήποτε κατανομής) δόθηκε από τον Spearman το 904. Για να ορίσουμε τον συντελεστή συσχέτισης του Spearman, αρκεί να αντικαταστήσουμε στον συντελεστή του Pearson τις παρατηρήσεις με τις τάξεις τους. 2

Έστω R, R i ' i i =, 2,..., n οι τάξεις των παρατηρήσεων Χ και Υ αντίστοιχα, ορίζουμε τον συντελεστή συσχέτισης του Spearman και τον συμβολίζουμε με r S r s = n ' ' ( Ri R)( Ri R ) i= n n 2 ' ' 2 ( Ri R) ( Ri R ) i= i= Μία άλλη μορφή του συντελεστή του Spearman που χρησιμοποιείται ευκολότερα, σύμφωνα με τους Field, Hartley και Pearson (957) είναι n ' 2 όπου S = ( R R ). S i = i i r S 6 S S 3 ( n n) Επειδή για τον υπολογισμό του συντελεστή χρησιμοποιούνται οι τάξεις των μεταβλητών και όχι οι αντίστοιχες τιμές τους, είναι πιο εύκολος ο υπολογισμός του..3. Κατανομή του συντελεστή Αν και έχουν γίνει ικανοποιητικές προσεγγίσεις για την εύρεση της κατανομής του συντελεστή του Spearman (904) για μεγάλο αριθμό παρατηρήσεων, εδώ θα παρουσιάσουμε την κατανομή για μικρό πλήθος. Έστω ότι ( x, y ) για i=,2,,n οι τιμές δύο τυχαίων μεταβλητών Χ και Υ, οι i i οποίες ακολουθούν κανονική κατανομή, με συντελεστή συσχέτισης ρ. Υποθέτουμε ότι τα xi είναι τοποθετημένα κατά μέγεθος και τα τιμή του συντελεστή δόθηκε από τον Moran (948) ' R i είναι οι τάξεις των 6 E( rs ) = sin + ( 2)sin ( n ) 2 ρ n ρ + π, y i. Η μέση Ενώ η διασπορά είναι μία προσέγγιση μέσω του Kendall (949) και David, Kendall και Stuart (95) var( r s ) =,563464 + 0,304743 + 0,55286 + 0,06552 +... n 2 4 6 8 { ρ ρ ρ ρ } 3

.4 Συντελεστής Συσχέτισης Order Correlation Ένα νέο, μη γραμμικό μέτρο συσχέτισης και μη συμμετρικό είναι ο συντελεστής Order Correlation, ο οποίος βασίζεται στις τάξεις των παρατηρήσεων. Με τον συντελεστή ασχολήθηκαν οι Xu, Chang, Hung, Kwan και Fung (2006) με εφαρμογή πάνω στα βιοσήματα. Θεωρητικές μελέτες και πειραματικά αποτελέσματα έδειξαν ότι έχει :. μικρή μεροληψία 2. υψηλή ευαισθησία 3. γρήγορο υπολογισμό 4. ισχύ κάτω από μονότονους μη γραμμικούς μετασχηματισμούς. Το νέο μέτρο έχει τα ίδια πλεονεκτήματα με τους τρεις γνωστούς συντελεστές συσχέτισης (Pearson, Kendall, Spearman) δηλαδή η εκτέλεσή του είναι παρόμοια με του Pearson όταν υπάρχει γραμμικότητα, υπολογίζεται αρκετά γρήγορα και έχει τις ίδιες ιδιότητες με τους συντελεστές των Spearman και Kendall όταν υπάρχει μη γραμμικότητα..4. Ορισμός Έστω ότι ( x, y ), i =,,n οι παρατηρήσεις δύο τυχαίων μεταβλητών Χ και i i Υ. Δημιουργούμε δύο νέες μεταβλητές ( x () i, y [] i ) τέτοιες ώστε : x () L x ( N ) και y, K, y N σύμφωνα με τη διάταξη της χρονικής σειράς x i. Επίσης δημιουργούμε [] [ ] άλλες δύο μεταβλητές ( x [] i, y () i ) όπου y() L y( N ) και x[], K, x[ N ] σύμφωνα με τη διάταξη της χρονικής σειράς y i. Ορίζουμε το συντελεστή συσχέτισης ως: rxy (, ) = N i= N i= ( x x ) y () i ( N + i ) [] i ( x x ) y () i ( N + i ) () i. ().4.2 Ιδιότητες του συντελεστή συσχέτισης : 4

a) r [, + ] b) Παίρνει την τιμή +(-) όταν οι χρονικές σειρές x και y είναι μονότονα αύξουσες (φθίνουσες). c) Αν x και y είναι ανεξάρτητες ισόνομες τυχαίες μεταβλητές (I.I.D.) τότε Erxy {(, )} = 0. Απόδειξη: a) Έχουμε ότι : N N N x y x y x y ( N + i ) ( i) ( i) [ i] ( i) ( i) i= i= i= N N N N N N x y x y x y x y x y x y ( N + i ) () i ( N + i ) [] i () i () i () i () i ( N + i ) [] i ( N + i ) () i i= i= i= i= i= i= οπότε : N N N ( x x ) y ( x x ) y ( x x ) y r () i ( N + i ) () i () i ( N + i ) [] i () i ( N + i ) () i i= i= i= b) Υποθέτουμε ότι y = φ( x ), i =, K, n. Αν η φ() είναι αύξουσα συνάρτηση i i τότε έχουμε y = y i οπότε σύμφωνα με την πρώτη ιδιότητα r =. [] i () i Ανάλογα ο συντελεστής συσχέτισης θα είναι ίσος με - αν η φ() είναι φθίνουσα συνάρτηση. c) Ορίζω τον αριθμητή της σχέση () U και τον παρανομαστή της V. Χρησιμοποιώντας ανάπτυγμα Taylor της U/ V γύρω από τις μέσες τιμές E(U) και E(V) αγνοώντας όλους τους όρους τάξης μεγαλύτερης του δύο έχουμε: U E( U) U U r = = + ( U E( U)) ( ) ( V E( V)) ( ) V E( V) + U V U E U V V U E U = ( ) = ( ) V= E( V) V= E( V) U U + ( U E( U)) ( ) + ( V E( V)) ( ) 2 2 2 2 2 2 2 2 U V U E( U) V V = U= E( U) V= E( V) V= E( V) 2 U + ( U E( U)) ( V E( V)) ( ) U V V U= E( U) V = E( V) 5

U E( U) ( U E( U)) E( U) 2 = + + ( V E( V)) ( ) + ( U E( U)) 0 V E V E V E V 2 ( ) ( ) ( ) 2 2 EU ( ) + V E V + U E U V E V 2 EV ( ) EV ( ) 2 ( ( )) ( ) ( ( )) ( ( )) ( ) 3 2 ( ) ( ) cov(, ) Er () = EU + var( V) EU UV 3 2 EV ( ) EV ( ) EV ( ) Θα δείξω ότι Er {} = 0δηλαδή ότι EU ( ) = 0 και cov( UV, ) = 0. N ( ) U= ( x x ) y EU ( ) = ( Ex ( ) Ex ( )) Ey () i ( N + i ) [] i () i ( N + i ) [] i i= i= (θ.δ.ο. E( y [] i ) = 0) N Η συνάρτηση πυκνότητας πιθανότητας της μεταβλητής y[] i είναι: + g ( y) = f( y/ x) f i ( x) dx [] i () f ( y/ x) = f( y) τότε: όμως αν υποθέσουμε ότι x και y ανεξάρτητες τότε + + + + E[ y ] = y g ( y) dy = y f ( y) dy f ( x) dx = y f ( y) dy = E[ y] [] i [] i () i Όμως οι Χ και Υ είναι ανεξάρτητες ισόνομες τυχαίες μεταβλητές (I.I.D.) οπότε Ey [ ] = 0 Ey [ ] = 0. () i Άρα EU ( ) = 0 και EU ( ) EV ( ) = 0 co v( UV, ) = EU ( EU ( ))( V EV ( )) = EUV ( ), οπότε θα δείξω ότι EUV ( ) = 0 N N N N N N EU ( V) = Ex [ x ] Ey [ y ] Ex [ x ] Ey [ y ] Ex [ x () i ( j) [] i ( j) () i ( j) [] i ( N + i ) ( N + i ) ( j) i= j= i= j= i= j= N N Ey [ y ] + Ex [ x ] Ey [ y ] [] i ( j) ( N + i ) ( j) [] i ( N j+ ) i= j= ] Παρατηρούμε ότι η πιθανότητα y[] i y( j) = είναι ίση με /Ν και λόγω της υπόθεσης ότι η Χ και Υ είναι I.I.D. τυχαίες μεταβλητές, έχουμε ότι 2 E[ y[] i y( j )] = E( y ). Οπότε ο πρώτος όρος του αθροίσματος της παραπάνω σχέσης N 6

έχει τη μορφή 2 2 E( y ) E[( xi ) ]. Παρόμοια αποτελέσματα υπάρχουν και για τους N άλλους τρεις όρους του αθροίσματος της παραπάνω σχέσης. Οπότε καταλήγουμε στο συμπέρασμα ότι Δείξαμε λοιπόν ότι Er {} = 0. EUV ( ) = 0 δηλαδή cov( UV, ) = 0..4.3 Η εφαρμογή των Xu, Chang, Hung, Kwan και Fung Οι Xu, Chang, Hung, Kwan και Fung σύγκριναν τους συντελεστές συσχέτισης των Pearson, Spearman και Kendall με το νέο συντελεστή Order Correlation χρησιμοποιώντας τα βιοσήματα. Τα βιοσήματα διαχωρίζονται σε δύο κατηγορίες: Α) στα ημιπεριοδικά σήματα (όπως ένα κανονικό ECG) και B) στα σήματα που παράγονται από θόρυβο (όπως τα ΕΕG ) Λόγω ανάγκης σύγκρισης, παράχθηκαν δύο επεισόδια από πραγματικά σήματα, ένα από κάθε κατηγορία και τα δύο στα 000 Hz, ώστε να υπάρχει συνέπεια στη έρευνα. Το αποτέλεσμα των δύο σημάτων συμβολίστηκε αντίστοιχα. Για την ολοκλήρωση της στατιστικής ανάλυσης, παράχθηκαν 000 επεισόδια από ανεξάρτητο λευκό γκαουσιανό θόρυβο (μ=0 και s, s h e 2 σ =). Όλα τα προσομοιωμένα σήματα περιέχουν 000 δείγματα. Χωρίς περιορισμό της γενικότητας, οι sζ, ζ = h,eκανονικοποιούνται με μέση τιμή μηδέν και διασπορά ένα, προτού ενσωματωθούν στα δύο μοντέλα που θα περιγράψουμε παρακάτω. Τα μοντέλα που χρησιμοποιήθηκαν είναι ένα γραμμικό μοντέλο και ένα μη γραμμικό. Σε κάθε μοντέλο, δύο σήματα Χ και Υ παράχθηκαν από τις δύο κατηγορίες των βιοσημάτων και 000 επεισόδια από λευκό θόρυβο που αναφέραμε στην προηγούμενη παράγραφο. Υπολογίζοντας τη συσχέτιση μεταξύ των Χ και Υ και με τους τέσσερις συντελεστές, τέσσερα σύνολα από συντελεστές συσχέτισης δημιουργήθηκαν. Λόγω των 000 θορύβων που περιλαμβάνουν, κάθε r ξ (όπου ξ= Ρ για Pearson, ξ= x για Order Correlation, ξ= Κ για Kendall και ξ= S για Spearman) είναι μία τυχαία μεταβλητή με δική της κατανομή η οποία ολοκληρώνει την στατιστική ανάλυση. Στα δύο παρακάτω μοντέλα ο δείκτης i παίρνει τιμές από το 7

έως το 000, το n ( i) δηλώνει το θόρυβο, r ξ και v ξ δηλώνει τη μέση τιμή και την τυπική απόκλιση των r ξ. Το γραμμικό μοντέλο ορίζεται από την σχέση : x ( i ) = s ( i ) y i ρ s i ρ n i 2 ( ) = ( ) + ( ) όπου ρ={-,-0.99,,0.99,} χαρακτηρίζει τη γραμμική σχέση. Επειδή πρόκειται για γραμμικό μοντέλο, είναι γνωστό πως ο συντελεστής συσχέτισης του Pearson δίνει καλύτερα αποτελέσματα, είναι αμερόληπτος και E [ r p ( x, y )] = ρ για οποιαδήποτε κατανομή του s ( i ).Δυστυχώς στους άλλους τρεις συντελεστές συσχέτισης δεν υπάρχει η παραπάνω ιδιότητα. Ο στόχος του μοντέλου είναι η σύγκριση της μεροληψίας των τριών συντελεστών, όπως επίσης και την ισχύ τους να αναγνωρίζουν διαφορετικά ρ. Το μη γραμμικό μοντέλο χρησιμοποιήθηκε για να μελετήσει την επίδραση των μη γραμμικών μετασχηματισμών των τεσσάρων συντελεστών συσχέτισης και ορίζεται : x ( i ) = T [ β s ( i )] x y i T s i n i 2 ( ) = y [ β { ρ ( ) + ρ ( )} ] 2 όπου T [ = ] sgn( )( ) και T [ = ] exp( ). Η παράμετρος β ελέγχει το βαθμό της μη x y γραμμικότητας (μεγαλύτερες τιμές της παραμέτρου δίνουν ισχυρή μη γραμμικότητα) ενώ η ρ έχει το ίδιο νόημα με το γραμμικό μοντέλο. Τα αποτελέσματα στα οποία κατέληξαν είναι πως ο νέος συντελεστής Order Correlation είναι μεταξύ των συντελεστών των Pearson και των Kendall και Spearman. Έχει κάποια από τα πλεονεκτήματα των τριών συντελεστών. Όμως στις περισσότερες περιπτώσεις ο νέος συντελεστής δεν έδωσε τα καλύτερα αποτελέσματα, παρόλα αυτά ήταν συνήθως δεύτερος συγκρινόμενος με τους άλλους τρεις. Τέλος, σύμφωνα με τους συγγραφείς, το γεγονός ότι σχεδόν σε κάθε περίπτωση ο συντελεστής Order Correlation δίνει τα δεύτερα καλύτερα αποτελέσματα για το κάθε μοντέλο, εξασφαλίζει να αποφεύγονται τα χειρότερα αποτελέσματα όταν δεν γνωρίζουμε την ύπαρξη μη γραμμικότητας του συστήματος. 8

.5 Αμοιβαία Πληροφορία Η αμοιβαία πληροφορία έχει ιδιότητες που την καθιστούν ως ένα από τα ιδανικά μέτρα της στατιστικής εξάρτησης. Το πιο γνωστό μέτρο για την εξάρτηση δύο τυχαίων μεταβλητών είναι ο συντελεστής της γραμμικής συσχέτισης, που δεν είναι τίποτα άλλο παρά κανονικοποιημένη συνδιασπορά και ερμηνεύει μόνο γραμμικές σχέσεις. Η ανωτερότητα της αμοιβαίας πληροφορίας βρίσκεται στο γεγονός ότι υπολογίζει γραμμική και μη γραμμική εξάρτηση. Όμως παρόλα αυτά μπορεί να υπολογιστεί μόνο για μερικές κατανομές πιθανοτήτων. Η διαδικασία υπολογισμού της αμοιβαίας πληροφορίας είναι ο υπολογισμός των εντροπιών. Στην παρακάτω ενότητα παρουσιάζουμε αναλυτικά τον υπολογισμό της αμοιβαίας πληροφορίας..5. Υπολογισμός Αμοιβαίας Πληροφορίας Για να ορίσουμε την αμοιβαία πληροφορία, θα ορίσουμε αρχικά την εντροπία ενός συστήματος. Ο όρος εντροπία έχει τις ρίζες του στο θεώρημα πληροφορίας του Shannon (948). Έρχεται από το δεύτερο νόμο της Θερμοδυναμικής και αναφέρεται στο ποσό της παρούσας αναταραχής ενός συστήματος. Στη θεωρία της πληροφορίας, η εντροπία αναφέρεται στο ποσό της αβεβαιότητας που παρουσιάζεται από μία κατανομή πιθανοτήτων. Στατιστικά, αυτό ερμηνεύεται ως ένα μέτρο διασποράς της κατανομής. Το μέτρο του Shannon για την αβεβαιότητα ή για την εντροπία ορίζεται ως : n H ( x) = p( xi) log p( x i) i= Για μία διακριτή τυχαία μεταβλητή, p( x i ) είναι η πιθανότητα της i τιμής της Χ και n είναι ο αριθμός των τιμών της Χ που μπορεί να πάρει. Η βάση του λογάριθμου δεν είναι σημαντική και συνήθως ορίζεται από την εφαρμογή. Στο θεώρημα πληροφορίας συνήθως παίρνουμε λογάριθμο με βάση το δύο. Η εντροπία μίας κατανομής είναι μη αρνητική, μηδέν όταν υπάρχει μόνο ένα πιθανό ενδεχόμενο 9

( px ( ) = ) και μεγιστοποιείται όταν όλες οι τιμές την τυχαίας μεταβλητής Χ είναι ισοπίθανες, δηλαδή ( ) = ( ) = K = ( ) =. n px px2 px n Η από κοινού εντροπία μετράει την αβεβαιότητα της κοινής κατανομής πιθανοτήτων της Χ και Υ και ορίζεται ως: n m j k j k j= k= H( X, Y) = p( x, y ) log p( x, y ) Εδώ τα Χ και Υ είναι τυχαίες μεταβλητές διακριτών κατανομών πιθανοτήτων που παίρνουν n και m τιμές αντίστοιχα. Υπάρχει επίσης και το μέτρο της δεσμευμένης εντροπίας : n m j k k j. j= k= HY ( / X) = px (, y) log py ( / x) Χρησιμοποιώντας τους ορισμούς της εντροπίας, της από κοινού εντροπίας και της δεσμευμένης εντροπίας, μπορούμε να ορίσουμε την αμοιβαία πληροφορία. Η αμοιβαία πληροφορία είναι η μείωση της αβεβαιότητας της Χ δεδομένου ότι γνωρίζουμε την Υ. Ορίζεται ως: I( X; Y) = H( Y) H( X / Y) I( X; Y) = H( X) H( Y / X) I( XY ; ) = HX ( ) + HY ( ) HXY (, ) I( X; Y) = I( Y; X) I( X; X) = H( X) Είναι συμμετρικό μέγεθος και η αμοιβαία πληροφορία του ίδιου του Χ είναι η εντροπία του. Λόγω της τελευταίας ιδιότητας, πολλές φορές η εντροπία αναφέρεται και ως αυτό-πληροφορία. Η αμοιβαία πληροφορία ποσοτικοποιεί το πόσο καλά μια τιμή της τυχαίας μεταβλητής Χ προβλέπει μία τιμή της Υ. Αν και η αμοιβαία πληροφορία μετρά την στατιστική εξάρτηση μεταξύ δύο μεταβλητών, έχει μερικά μειονεκτήματα. Δεν παίρνει τιμές μεταξύ του 0 και και η μέγιστη τιμή της εξαρτάται από το μέγεθος των τυχαίων μεταβλητών και από τις περιθώριες κατανομές. Ο συντελεστής συσχέτισης της εντροπίας έχει δημιουργηθεί για να αντιμετωπίζονται τα παραπάνω μειονεκτήματα: 20

ρ = H I( X; Y) ( H ( X ) + H ( Y )) 2 Ο συντελεστής συσχέτισης της εντροπίας είναι κανονικοποιημένος οπότε παίρνει τιμές μεταξύ του 0 και του, δηλαδή 0 ρh. Είναι 0 όταν οι δύο κατανομές είναι ανεξάρτητες και όταν είναι απόλυτα εξαρτημένες. Επιπλέον δεν υπάρχουν περιορισμοί για τις περιθώριες πιθανότητες px ( j ) και p( yk ) ώστε ο ρ H να φτάσει στη μέγιστη τιμή του. Σύμφωνα με τους Dionisio, Menezes, Mendes (2003), η αμοιβαία πληροφορία είναι ένα μέτρο το οποίο μπορεί να χρησιμοποιηθεί σε financial time series. Ένα πολύ σημαντικό πλεονέκτημα της είναι η ικανότητα της να μετρά τη μη γραμμική εξάρτηση χωρίς να είναι απαραίτητα γνωστή η θεωρητική συνάρτηση πιθανότητας της τυχαίας μεταβλητής..5.2 Εκτίμηση της αμοιβαίας πληροφορίας Η πιο συστηματική μελέτη για την εκτίμηση της αμοιβαίας πληροφορίας έχει γίνει μέσω του ιστογράμματος. Δεδομένης της αρχής των συντεταγμένων Ο και του πλάτους h χωρίζουμε τον κάθε άξονα σε Μ διακριτά διαστήματα. Έτσι τα κουτιά, a i που δημιουργούνται έχουν διαστάσεις [mh,(m+)h], m=0,,m. Συμβολίζουμε με n i το πλήθος των παρατηρήσεων που βρίσκονται στο κουτί a i και κάνουμε μία n n i j εκτίμηση των πιθανοτήτων με τις παρατηρούμενες τιμές pa ( i) =, pb ( j) = και n n nij pa ( i, bj) =. Οπότε η αμοιβαία πληροφορία μπορεί να υπολογιστεί από τον n παρακάτω τύπο (Steuer et.al, 2002) : nij I( X, Y) = logn+ nij log n nn ij i j 2

.6 Global Συντελεστής συσχέτισης Χρησιμοποιώντας την Αμοιβαία Πληροφορία δύο τυχαίων μεταβλητών Χ και Υ, ορίζεται ένα νέο μέτρο ο global συντελεστής συσχέτισης (λ), ο οποίος χρησιμοποιήθηκε από τους Granger, Lin (994), Darbellay (998a) και Soofi (997). Ορίζεται ως : λ = e 2 I( X, Y ) Ο συντελεστής παίρνει τιμές από το 0 έως το, οπότε μπορούμε να τον συγκρίνουμε με τον γραμμικό συντελεστή συσχέτισης (Pearson s r) Η συνάρτηση λ ( X, Y ) περιλαμβάνει την γενική συσχέτιση, γραμμική και μη γραμμική, μεταξύ των Χ και Υ και μπορεί να ερμηνευτεί ως η πρόβλεψη του Υ μέσω του Χ. Αυτό το μέτρο συσχέτισης βασίζεται πάνω στις εμπειρικές κατανομές, αλλά δεν εξαρτάται από το μοντέλο που χρησιμοποιούμε για να προβλέψουμε την Υ. Παρακάτω αναφέρουμε τις ιδιότητες του συντελεστή. λ ( X, Y) = 0, αν κα μόνο αν η μεταβλητή Χ δεν περιέχει πληροφορίες για την Υ, δηλαδή η Χ δεν μπορεί να προβλέψει την Υ και αντίστροφα. λ ( X, Y) =, αν μπορούμε να προβλέψουμε την Χ μέσω της Υ και αντίστροφα..7 Υπόλοιπα μέτρα συσχέτισης Στη βιβλιογραφία υπάρχει πληθώρα εργασιών που ασχολούνται με μέτρα συσχέτισης δύο τυχαίων μεταβλητών είτε είναι διακριτές ή είναι συνεχείς. Κάποια από αυτά είναι ο Λόγος Συσχέτισης η (Correlation Ratio eta), οι συντελεστές του Somers d και d, συντελεστής συσχέτισης μέγιστης απόκλισης (greatest deviation) XY YX r gd, συντελεστής Gamma (γ). Επιλέξαμε να αναλύσουμε σε αυτό το κεφάλαιο, αυτά που συναντήσαμε συχνότερα χρησιμοποιήσουμε στην συνέχεια της εργασίας. στη βιβλιογραφία και αυτά θα 22

ΚΕΦΑΛΑΙΟ 2 ΜΕΤΡΑ ΣΥΣΧΕΤΙΣΗΣ ΣΕ ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ Εισαγωγή Στο προηγούμενο κεφάλαιο αναφέραμε και αναλύσαμε μέτρα που χρησιμοποιούνται για την εύρεση εξάρτησης μεταξύ τυχαίων μεταβλητών. Στις χρονικές σειρές όμως επειδή εξετάζουμε τις τιμές μιας τυχαίας μεταβλητής σε συνάρτηση του χρόνου, το αντικείμενο είναι πιο περίπλοκο. Ο συντελεστής του Pearson, σύμφωνα με τη βιβλιογραφία, χρησιμοποιείται περισσότερο. Όμως αυτό μας περιορίζει γιατί πρέπει η χρονική σειρά να είναι στάσιμη και να γνωρίζουμε την κατανομή της τυχαίας μεταβλητής. Για τον παραπάνω λόγο, δημιουργήθηκε η ανάγκη εύρεσης μη παραμετρικών μεθόδων ελέγχου ανεξαρτησίας. Στη βιβλιογραφία βρέθηκαν μη παραμετρικά μέτρα που χρησιμοποιούνται σε περιπτώσεις που δεν γνωρίζουμε την κατανομή της τυχαίας μεταβλητής. Οι συντελεστές του Spearman, Kendall, η αμοιβαία πληροφορία είναι κάποια από αυτά. 2. Συντελεστής του Pearson Για να παρουσιάσουμε το συντελεστή του Pearson στις χρονικές σειρές, αρχικά θα πρέπει να αναφέρουμε τον ορισμό της στάσιμης χρονικής σειράς, τους ορισμούς των συναρτήσεων αυτοδιασποράς,αυτοσυχέτισης και τις ιδιότητες τους. Μία χρονική σειρά { X t } όπου t=,2,,n λέγεται στάσιμη δεύτερης τάξης αν: EX t = μ και var( X ) = σ, t N t 2 x 23

t s γ t s cov( X, X ) =, t, s T ή cov( Xt, Xt+ k) = γ k, t N, k, δηλαδή έχει συνδιασπορά σταθερή, ανεξάρτητη του χρόνου t η οποία εξαρτάται μόνο από την υστέρηση k. Η συνάρτηση της θεωρητικής αυτοδιασποράς για μία στάσιμη χρονική σειρά, για υστερήσεις k= 0,±, ±2, είναι γ = E( X μ)( X μ) = cov( X, X ) k t t+ k t t+ k Ο συντελεστής αυτοσυσχέτισης υστέρησης k δηλώνει το βαθμό εξάρτησης μεταξύ τιμών μιας χρονικής σειράς, που απέχουν k χρονικά βήματα. Οπότε η συνάρτηση της θεωρητικής αυτοσυσχέτισης ή κοινώς ο συντελεστής του Pearson είναι : γ ρ k = = γ 0 Cov( X, X + k), για k= 0,±, ±2, Var( X ) Var( X ) k t t t Για κάθε στοχαστική διαδικασία ισχύει ρ 0 =. Επιπλέον, η συνάρτηση αυτοσυσχέτισης είναι συμμετρική ως προς το μηδέν, γιατί για κάθε υστέρηση k ισχύει ρ =. Συνεπώς το γράφημα των αυτοσυσχετίσεων (correlogram) παίρνει μόνο τις k ρ k θετικές τιμές της υστέρησης. Ο συντελεστής αυτοσυσχέτισης t+ k ρ k μετρά την αυτοσυσχέτιση μεταξύ των τιμών της χρονικής σειράς X, X, οπότε μπορούμε να ορίσουμε τους συντελεστές συσχέτισης όλων των υστερήσεων, δηλαδή ρ, ρ2,..., ρk. t t k 2.. Συνάρτηση Μερικής Αυτοσυσχέτισης Η συνάρτηση μερικής αυτοσυσχέτισης ϕ kk, ορίζεται από τη σχέση ϕ kk corr X t X t+ k X t+ X t+ 2 X t+ k = (,,..., ) για k =, 2,... Δηλαδή είναι ο συντελεστής συσχέτισης της διδιάστατης κατανομής των X t και X t + k με συνθήκη στις Xt, Xt,..., Xt k. Η μηδενική υπόθεση ( H : 0 0 ϕ kk = ) απορρίπτεται όταν τα + + 2 + ϕ kk βρίσκονται εκτός του διαστήματος 2 2, N N. Οι συναρτήσεις της αυτοσυσχέτισης και της μερικής αυτοσυσχέτισης μας βοηθούν να προσδιορίσουμε ακριβώς ένα μοντέλο ARIMA, που περιγράφει μία 24

στοχαστική διαδικασία { X } t. Συγκεκριμένα, αν η διαδικασία είναι λευκός θόρυβος, όλες οι αυτοσυσχετίσεις και μερικές αυτοσυσχετίσεις είναι μηδέν. Αν είναι αυτοπαλινδρομούμενο μοντέλο τάξης p, τότε οι μερικές αυτοσυσχετίσεις είναι μηδέν για υστερήσεις k>p. Ενώ αν είναι μοντέλο κινούμενου μέσου τάξης q τότε οι αυτοσυσχετίσεις θα είναι μηδέν για υστερήσεις k>q. Οι συναρτήσεις της αυτοσυσχέτισης και της μερικής αυτοσυσχέτισης είναι θεωρητικές συναρτήσεις και εφαρμόζονται σε στοχαστικές διαδικασίες. Όταν αναλύουμε χρονικές σειρές με πεπερασμένους όρους, πρέπει να τις υπολογίζουμε. Η δειγματική συνάρτηση αυτοσυχέτισης ορίζεται : ˆ ρ = k T t= k+ ( X m)( X m) N t t= t k ( X m) όπου m η δειγματική μέση τιμή της σειράς. Η συνάρτηση της μερικής αυτοσυσχέτισης μπορεί να εκτιμηθεί από την OLS regression: X = aˆ + aˆ X + aˆ X +... + aˆ X + e ˆ ϕ t 0 t 2 t 2 k t k kk = aˆ k Για να ελέγξουμε αν η δειγματική αυτοσυσχέτιση είναι ίση με το μηδέν, θα πρέπει να προσδιορίσουμε την κατανομή των εκτιμητών της θεωρητικής αυτοσυσχέτισης. O Barlett (946) ανέπτυξε ένα τεστ και έδειξε πως αν η χρονική σειρά είναι διαδικασία λευκού θορύβου τότε οι εκτιμητές ακολουθούν κανονική κατανομή με μέση τιμή μηδέν και διασπορά /Τ, όπου Τ το μέγεθος της σειράς. Τα ίδια χαρακτηριστικά έχουν και οι εκτιμητές της συνάρτησης της μερικής αυτοσυσχέτισης. Τα παραπάνω συμπεράσματα, τα παίρνουμε για μεγάλες χρονικές σειρές μεγέθους Τ. Όταν το μέγεθος είναι μικρό, ο Fuller (976) έδειξε ότι η θεωρητική μέση τιμή διαφέρει από τη δειγματική και η διασπορά είναι μικρότερη από /Τ. Επομένως θα πρέπει να συγκρίνουμε τις τιμές των δειγματικών συντελεστών με.96 τις κρίσιμες τιμές ±, ώστε να πραγματοποιήσουμε τεστ με 95% διάστημα T εμπιστοσύνης για την μηδενική υπόθεση της μη αυτοσυσχέτισης ή μερικής αυτοσυσχέτισης υστέρησης k. t 2 t 25

2.2 Συντελεστής του Kendall Σύμφωνα με τους Ferguson, Genest, Hallin (2000), για να εξετάσουμε την εξάρτηση μεταξύ των παρατηρήσεων μια χρονικής σειράς για διάφορες υστερήσεις k, χρησιμοποιούμε προσαρμοσμένο τον συντελεστή συσχέτισης του Kendall. Έστω X, X2,..., X n μία χρονική σειρά με n 3, R, R2,..., R n οι τάξεις των αντίστοιχων παρατηρήσεων της χρονικής σειράς και το πλήθος των τάξεων που έχουν διαφορετικές τιμές. Ορίζουμε τον συντελεστή συσχέτισης του Kendall υστέρησης k : τ kn, N k N 4 N k = 2 =, n k ( n k )( n k ) 2 όπου το στατιστικό N = I( R < R, R > R. Είναι αναμενόμενο η N k n n ) k i j i+ k j+ k i= j= κατανομή του N k να εξαρτάται από την εκάστοτε υστέρηση. Σύμφωνα με την υπόθεση της τυχαιότητας, η μέση τιμή του στατιστικού N k δίνεται από τον τύπο: (3n 3k ) ( n k) k EN ( k ) =, όταν k < n / 2 και 2 6 ( n k) ( n k ) EN ( k ) =, όταν n /2 k < n. 4 Τέλος, αποδείχθηκε ότι το στατιστικό 3 n τ k, n / 2 είναι ασυμπτωτικά ισοδύναμος με τον συντελεστή του Spearman για υστέρηση k. 2.3 Συντελεστής του Spearman Ο συντελεστής συσχέτισης του Spearman είναι ένα μη παραμετρικό μέτρο, γιατί υπολογίζει τη συσχέτιση μεταξύ δύο τιμών μιας χρονικής σειράς χρησιμοποιώντας τις τάξεις των τιμών. Έστω X, X2,..., X n μία χρονική σειρά και R, R2,..., R n οι τάξεις των τιμών. Οπότε η πιθανότητα για κάθε αντιμετάθεση ( d, d2,..., d n ) των,,n είναι 26

P[( R, R2,..., Rn) = ( d, d2,..., dn)] =, n! επομένως οι τάξεις είναι μεταβλητές. Σύμφωνα με τους Dufour και Roy (985), ορίζουμε τον συντελεστή συσχέτισης του Spearman για χρονοσειρές ως: r n k ( Ri R)( Ri+ k R) i= k = n 2 ( Ri R) i=, k n όπου n n + R = Ri = n = 2 Σε αυτή την περίπτωση ο παρανομαστής του συντελεστή είναι ένας σταθερός αριθμός, οπότε ισοδύναμα μπορούμε να μελετήσουμε την διασπορά n k ( )( + ) C = R R R R, k n. k i i k i= i Πολλοί συγγραφείς μελέτησαν και σύγκριναν με διάφορα τεστ τον συντελεστή του Spearman, κάποιοι από αυτούς είναι οι Stuart (956), Knoke(977), Dufour(98) 2.4 Αμοιβαία Πληροφορία Η αμοιβαία πληροφορία είναι ένα μέτρο που υπολογίζει τη γραμμική και τη μη γραμμική συσχέτιση μεταξύ δύο τιμών μιας χρονικής σειράς x t, x t k για διαφορετικές υστερήσεις k. Έχει οριστεί από τους Kantz and Schreiber (997) ως: p i, j Ι ( k) = pi log. i, j pp i j Οι Biswas και Apratim (2009) ασχολήθηκαν με τον υπολογισμό της αμοιβαίας πληροφορίας στις χρονικές σειρές, σε συγκεκριμένα μοντέλα χρονικών σειρών, δηλαδή στα μοντέλα ΑR(p), MA(q) και ARMA(,). Έστω { Y }ένα αυτοπαλινδρομούμενο μοντέλο τάξης p και { ε } ανεξάρτητες t τυχαίες μεταβλητές με Ε( ε t )=μ και Var( ε t )= σ 2 ε, τότε t 27

= φ + φ + + φ +ε, όπου φ j (0,), j =, 2,..., pκαι Yt Yt 2 Yt 2... p Yt p t p φ j= j (0,). Ορίζουμε την αμοιβαία πληροφορία,για κάθε θετικό ακέραιο k, μεταξύ των Y και ως : t Yt k k ( φ,..., φp ) ( 2 φ,..., φp 3 φ,..., φp i= ( )) I( k) = log f ( ) f ( ) + f ( ) p i p i f2( φ,..., φp ) + log + f3( φ,..., φp) ( f2( φ,..., φp) + f3( φ,..., φp) p i )) p i pi για κατάλληλα f, f2, f 3 τα οποία μπορεί να εξαρτώνται από την υστέρηση k αλλά όχι από το χρόνο t. Σε ένα κινούμενου μέσου μοντέλο τάξης q, σύμφωνα με τους Biswas και Apratim, η αμοιβαία πληροφορία υπολογίζεται διαφορετικά. Έστω { }ένα ΜΑ(q) με : Y = θ ε + θ ε + + θ ε, όπου ε t ανεξάρτητες τυχαίες μεταβλητές, η t 0 t t... q t q αμοιβαία πληροφορία ορίζεται ως μια αύξουσα συνάρτηση: q k I( k) = θ θ r = 0 r r+ k Τέλος ορίζεται σε ένα μικτό μοντέλο ARMA(,), Yt = φ Yt + εt + θε t, η αμοιβαία πληροφορία: Y t ( θ0 θ( θ0) ) ( θ0 θ( θ0) ) I() = + log + p ( p i ) k i= (( θ0 + θ( θ0) ) pi + ( φpi + θθ 0) ) k + log + i= pi i {( θ0 θ( θ0) ) pi ( φpi θθ 0) } + +. pi Ενώ για τα αυτοπαλινδρομούμενα μοντέλα και για τα κινούμενου μέσου μοντέλα βρέθηκε ο γενικός τύπος υπολογισμού της αμοιβαίας πληροφορίας για τις διάφορες τάξεις τους, στα μικτά μοντέλα ARMA δεν βρέθηκε κάποια σχέση μεταξύ του εκτιμητή της αμοιβαίας πληροφορίας και της κατανομής των παραμέτρων στη γενική μορφή τους. 28

2.5 Test of autocorrelation στην οικονομετρική ανάλυση Η αυτοσυσχέτιση είναι σημαντική στην οικονομετρική ανάλυση σύμφωνα με τους Levich και Rizzo (998). Όταν σε μία χρονική σειρά εμφανίζεται σημαντική αυτοσυσχέτιση, τότε μπορούμε να την περιγράψουμε με κάποιο γνωστό μοντέλο χρονικών σειρών(π.χ. ARIMA model) και να επιτύχουμε την πρόβλεψη για μελλοντικές τιμές της. Θα παρουσιάσουμε, σύμφωνα με τους συγγραφείς, τα πιο ευρέως χρησιμοποιημένα τεστ. 2.5. Durbin- Watson test Το τεστ Durbin- Watson δημοσιεύτηκε πρώτη φορά το 950. Πιθανόν είναι το πιο γνωστό τεστ αυτοσυσχέτισης. Θεωρούμε τα υπόλοιπα από ένα OLS regression model, μεγέθους Τ. Για να εξετάσουμε τη μηδενική υπόθεση της απουσίας της αυτοσυσχέτισης πρώτης τάξης, ορίζουμε το στατιστικό του Durbin- Watson τεστ: d = T i = 2 e t ( e e ) 2 Ένα πρώτο βασικό μειονέκτημα είναι ότι τα διαστήματα αποδοχής και απόρριψης της μηδενικής υπόθεσης δεν είναι ξεκάθαρα. Το DW τεστ βασίζεται σε δύο όρια, d u. Σε ένα δίπλευρο τεστ, όπου συγκρίνει μαζί την θετική και την αρνητική αυτοσυσχέτιση, απορρίπτουμε την μηδενική υπόθεση όταν οι τιμές του d βρίσκονται κάτω από το ή πάνω από το 4- d. Ενώ αποδεχόμαστε την μηδενική υπόθεση ( d t T i = e 2 t t d και δηλαδή την παρουσία αυτοσυσχέτισης) όταν οι τιμές του d βρίσκονται μεταξύ των d u 29

και 4-. Ωστόσο, αν οι τιμές του τεστ βρίσκονται μεταξύ d και d ή 4- d και 4- d du, δεν βγάζουμε κάποιο συμπέρασμα. Ένα δεύτερο μειονέκτημα του DW τεστ είναι ότι ενώ εξετάζει την μηδενική υπόθεση την απουσίας της αυτοσυσχέτισης πρώτης τάξης, συνήθως συναντάμε σε πραγματικές οικονομικές χρονικές σειρές αυτοσυσχετίσεις μεγαλύτερων τάξεων. u u 2.5.2 Durbin s h test Για να επιλυθούν τα παραπάνω προβλήματα του Durbin- Watson τεστ, ο Durbin (970) πρότεινε ένα τροποποιημένο τεστ, το h-test, το οποίο κάτω από την μηδενική υπόθεση είναι κανονικοποιημένο με διασπορά ένα. Το τεστ ορίζεται ως: d T h = 2 2 Tσ β 2 όπου σ β είναι ένας εκτιμητής της διασποράς του συντελεστή β των χρονικών σειρών και Τα είναι το μέγεθος της σειράς. Το Durbin s h τεστ δεν γίνεται να εφαρμοστεί αν 2 Tσ β. Οπότε λίγο αργότερα πρότεινε ένα καινούργιο τεστ, το m- τεστ. /2 30

ΚΕΦΑΛΑΙΟ 3 ΑΞΙΟΛΟΓΗΣΗ ΤΩΝ ΜΕΤΡΩΝ ΑΥΤΟΣΥΣΧΕΤΙΣΗΣ ΣΕ ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ 3. Εισαγωγή Σε προηγούμενο κεφάλαιο αναφέραμε συντελεστές και ελέγχους που χρησιμοποιούνται για την εύρεση συσχέτισης στις χρονικές σειρές. Στη βιβλιογραφία βρέθηκαν αρκετές μελέτες που αναφέρονταν στις ιδιότητες των συντελεστών και των ελέγχων καθώς και εφαρμογών αυτών, όμως λίγοι ήταν εκείνοι που ασχολήθηκαν με τη σύγκριση και την αξιολόγηση των συντελεστών για διάφορα μοντέλα χρονικών σειρών. Σε αυτό το κεφάλαιο θα παρουσιάσουμε αξιολογήσεις συγκεκριμένων μέτρων συσχέτισης που βρέθηκαν στην βιβλιογραφία για συγκεκριμένα μοντέλα. 3.2 Έρευνα των Dionisio A., Menezes R.και Mendes D.A Για να εκτιμήσουμε κάποια πιθανή σειριακή εξάρτηση σε οικονομικές χρονικές σειρές, σύμφωνα με τους Dionisio A., Menezes R.και Mendes D.A. ( 2003), θα πρέπει να εξετάσουμε για πιθανή γραμμική εξάρτηση, δηλαδή να προσπαθήσουμε να ελέγξουμε την παρουσία αυτοσυσχέτισης. Για την έρευνα επιλέχθηκαν οι ημερήσιες τιμές μετοχών στο τέλος συνεδρίασης του χρηματιστήριου δηλαδή οι ASE (Greece), CAC 40(France), DAX 30(Germany), FTSE 00(UK),PS 20(Portugal),IBEX 35(Spain),S&P 500(USA).Εφάρμοσαν Ljung-Box τεστ και τα αποτελέσματα παρουσιάζονται στον Πίνακα. Είναι πολύ σημαντικό το γεγονός ότι 3

η εξάρτηση είναι στατιστικά σημαντική σε όλους τους παρακάτω δείκτες, εκτός από DAX 30, IBEX 35, και S&P 500. ASE CAC 40 DAX 35 FTSE 00 IBEX 35 PS20 S&P 500 LBQ(0) 37,97 24,208 7,43 45,76 4,757 54,40 6,782 ρ 0,08 0,03-0,025 0,022 0,032 0,29 0,00 ρ 2-0,006-0,028-0,03-0,058-0,035 0,039-0,025 ρ 3-0,023-0.07-0,02-0,084-0,047 0,005-0,046 Πίνακας : Ljung-Box τεστ και συντελεστής αυτοσυσχέτισης για ημερήσιες παρατηρήσεις. Αρχικά, υπολόγισαν την μέση αμοιβαία πληροφορία και τον global συντελεστή συσχέτισης για υστερήσεις k=,,0 για κάθε δείκτη. Ο global συντελεστής συσχέτισης (λ) παίρνει τιμές από το 0 μέχρι το υπολογίζεται από τον τύπο: λ = e 2 I( X, Y ) Οπότε μπορούμε να διαχωρίσουμε τους παραπάνω δείκτες σε τρεις ομάδες. Η πρώτη περιλαμβάνει τους δείκτες με χαμηλή σειριακή εξάρτηση, δηλαδή τους CAC 40, FTSE 00. Η δεύτερη αυτούς με μία μέση σειριακή εξάρτηση, δηλαδή τους IBEX 35, PS20 και η τελευταία εκείνους με σημαντική σειριακή εξάρτηση δηλαδή τους DAX 30, IBEX 35, και S&P 500. Ο δείκτης S&P 500 παρουσιάζει την μεγαλύτερη τιμή του global συντελεστή συσχέτισης, το οποίο μαζί με την απουσία της γραμμικής αυτοσυσχέτισης, μας δείχνει ότι υπάρχει μη γραμμική εξάρτηση. Όπως έχουν παρατηρήσει οι Bonanno, Lillo, Mantegna (200) και οι Mantegna, Palagyi, Stanley (999) η συνάρτηση της αυτοσυσχέτισης θα πρέπει να είναι μία μονότονη φθίνουσα συνάρτηση για τις διάφορες υστερήσεις, το οποίο δε συμφωνεί με τα δικά τους αποτελέσματα. Ωστόσο η έλλειψη της αυτοσυσχέτισης δε σημαίνει ανεξαρτησία. Μη γραμμική εξάρτηση μπορεί να είναι σημαντική σε μεγαλύτερες υστερήσεις Παρακάτω υπολογίζονται από τους συγγραφείς Dionisio A., Menezes R.και Mendes D.A. (2003), η μέση αμοιβαία πληροφορία και ο global συντελεστής συσχέτισης (λ) για τις σειρές που αναφέραμε παραπάνω. Συγκρίνονται με την 32

κανονική αμοιβαία πληροφορία και με το γραμμικό συντελεστή συσχέτισης στους πίνακες 2,3 και 4 Mutual Inf. NMI λ R Lag: ASE 0.0326 0.00583 0.2468 0.0760 CAC 40 0.00008 0.00009 0.0273 0.039 DAX 30 0.00772 0.0003 0.2379 0.02470 FTSE 00 0.00054 0.00023 0.03277 0.0253 IBEX 35 0.00000 0.0005 0.0093 0.03203 PSI 20 0.042 0.0084 0.6687 0.294 S&P 500 0.090 0.00000 0.936 0.008 Πίνακας 2: Μέση Αμοιβαία Πληροφορία, global συντελεστής συσχέτισης (λ), κανονικοποιημένη Αμοιβαία πληροφορία και γραμμικός συντελεστής συσχέτισης (r) ημερήσιων παρατηρήσεων υστέρησης. Σύμφωνα με τα αποτελέσματα που Πίνακα 2, ο γραμμικός συντελεστής και ο global συντελεστής συσχέτισης δε δίνουν τα ίδια αποτελέσματα. Συγκεκριμένα r < r < r < r < r < r < r S & P500 CAC 40 FTSE00 DAX 30 IBEX 35 ASE PSI 20 λ < λ < λ < λ < λ < λ < λ IBEX 35 CAC 40 FTSE00 DAX 30 PSI 20 S & P500 ASE. Mutual Inf. NMI λ r Lag: e 2 ASE CAC 40 DAX 30 FTSE 00 IBEX 35 PSI 20 S&P 500 0.08042 0.05 0.0370 0.0508 0.0000 0.03596 0.0753 0.09 0.00087 0.0005 0.0074 0.00082 0.0706 0.00032 0.38545 0.4853 0.26709 0.7238 0.00488 0.26343 0.37392 0.090 0.0379 0.0408 0.06247 0.04855 0.2992 0.02476 33

Πίνακας 3: Μέση Αμοιβαία Πληροφορία, global συντελεστής συσχέτισης (λ), κανονικοποιημένη Αμοιβαία πληροφορία και γραμμικός συντελεστής συσχέτισης (r) ημερήσιων παρατηρήσεων υστέρησης 2. Ο πίνακας 3 μας δείχνει επίσης ο γραμμικός συντελεστής και ο global συντελεστής συσχέτισης δε δίνουν τα ίδια αποτελέσματα. Συγκεκριμένα και εδώ: r < r < r < r < r < r < r S & P500 CAC 40 DAX 30 IBEX 35 FTSE00 ASE PSI 20 λ < λ < λ < λ < λ < λ < λ. IBEX 35 CAC 40 FTSE00 PSI 20 DAX 30 S & P 500 ASE Και εδώ, η σειρά S&P 500 έχει τον μικρότερο συντελεστή γραμμικής συσχέτισης, ωστόσο έχει έναν από τους μεγαλύτερους συντελεστές της global συσχέτισης, δηλαδή είναι πιθανή η ύπαρξη μη γραμμικής ανεξαρτησίας. Όμως για την σειρά ASE δεν μπορούμε να πάρουμε τα ίδια συμπεράσματα, γιατί παρουσιάζει μεγάλες τιμές στους συντελεστές της γραμμικής και global συσχέτισης. Η σειρά PSI 20 έχει τη μεγαλύτερη τιμή της γραμμικής συσχέτισης, ενώ ο global συντελεστής συσχέτισης της είναι σημαντικά μικρότερος από τους αντίστοιχους των σειρών DAX 30, ASE, S&P 500. Mutual Inf. NMI λ r Lag:,2 e 3 ASE 0.095 0.0745 0.42948 0.092 CAC 40 0.00893 0.00359 0.3308 0.07683 DAX 30 0.05254 0.0034 0.3584 0.0482 FTSE 00 0.04030 0.00808 0.27829 0.023 IBEX 35 0.00073 0.00223 0.03826 0.06566 PSI 20 0.06559 0.02500 0.35063 0.2990 S&P 500 0.376 0.0052 0.45 0.05229 Πίνακας 4: Μέση Αμοιβαία Πληροφορία, global συντελεστής συσχέτισης (λ), κανονική Αμοιβαία πληροφορία και γραμμικός συντελεστής συσχέτισης (r) ημερήσιων παρατηρήσεων υστέρησης 3. Η ανάλυση του πίνακα 4 δείχνει ότι τα αποτελέσματα για τους δύο συντελεστές διαφοροποιούνται. Δηλαδή: 34

r < r < r < r < r < r < r D AX 30 S & P500 IBEX 35 CAC 40 FTSE00 ASE PSI 20 λ < λ < λ < λ < λ < λ < λ IBEX 35 CAC 40 FTSE00 DAX 30 PSI 20 ASE S & P500 Ο global συντελεστής συσχέτισης (λ) είναι μεγαλύτερος από το συντελεστή γραμμικής συσχέτισης (r) στις περισσότερες περιπτώσεις, επισημαίνοντας την ύπαρξη πιθανής εξάρτησης. Η σειρά S&P 500 παρουσιάζει μία πολύ ισχυρή μη γραμμική εξάρτηση. Σύμφωνα με τα αποτελέσματα του Ljung-Box τεστ δεν έχουμε στοιχεία ύπαρξης σημαντικής γραμμικής αυτοσυσχέτισης, όμως αυτό έρχεται σε αντίθεση με τον global συντελεστής συσχέτισης (λ), όπου οι τιμές του είναι μεγαλύτερες από το 0,9 σε όλες τις περιπτώσεις που αναλύσαμε. Εξακριβώνουμε λοιπόν ότι η μη γραμμική εξάρτηση έχει την τάση να μεγαλώνει καθώς οι υστερήσεις αυξάνονται. Είναι σημαντικό να τονίσουμε ότι η διαφορά (λ-r) δεν αντιστοιχεί ακριβώς σε μη γραμμικό μέρος του μέτρου της εξάρτησης, Τα αποτελέσματα παρουσιάζουν την ύπαρξη της global εξάρτησης μεγαλύτερη από την αντίστοιχη του γραμμικού συντελεστή συσχέτισης. Σύμφωνα με τους Dionisio A., Menezes R.και Mendes D.A. (2003), είναι πολύ ενδιαφέρον να μελετήσουμε τις φιλτραρισμένες σειρές. Οι φιλτραρισμένες σειρές υπολογίστηκαν ως μία διαδικασία ARMA(3,0) και εφαρμόστηκε το Ljung-Box τεστ. Οι φιλτραρισμένες σειρές δεν υπολογίστηκαν για τα DAX 30 και S&P 500, γιατί δεν παρουσίασαν για καμία υστέρηση σημαντική γραμμική συσχέτιση. ASE CAC 40 FTSE 00 IBEX 35 PS20 LBQ(0) 7,484,702 37,572 9,02 9,4532 ρ 0,002 0,0 0,08 0,03-0,002 ρ 2-0,05-0,03-0,00-0,034 0,03 ρ 3-0.02-0,002-0,085-0,00-0,002 Πίνακας 5: Ljung-Box τεστ και συντελεστής αυτοσυσχέτισης για ημερήσιες φιλτραρισμένες παρατηρήσεις. Οι νέες σειρές δεν παρουσιάζουν καθόλου γραμμική αυτοσυσχέτιση. Επίσης οι συγγραφείς χρησιμοποίησαν, για να εξακριβώσουν την ύπαρξη μη γραμμικής εξάρτησης, το BDS τεστ (Hsieh 989). Τα αποτελέσματα του τεστ έδειξαν την 35

απόρριψη της μηδενικής υπόθεσης δηλαδή ότι οι παρατηρήσεις των σειρών είναι μη γραμμικά ανεξάρτητες. Η αμοιβαία πληροφορία μας βοηθάει επίσης να γνωρίζουμε την σχέση των υπολοίπων e, t et. Ο Πίνακας 6 μας δείχνει ότι ο global συντελεστής συσχέτισης έχει μεγαλύτερες τιμές από τον συντελεστή γραμμικής συσχέτισης σε όλες τις περιπτώσεις. Συγκεκριμένα στις ASE και PS20 εμφανίζεται ισχυρή και στατιστικά σημαντική global συσχέτιση. Mutual Inf. NMI λ r Lag: ASE 0.042 0.00000 0.5025 0.0090 CAC 40 0.00224 0.00006 0.06690 0.030 FTSE 00 0.0005 0.0004 0.03205 0.0673 IBEX 35 0.0000 0.00047 0.0054 0.03074 PSI 20 0.00535 0.00000 0.032 0.0066 Πίνακας 6: Μέση Αμοιβαία Πληροφορία, global συντελεστής συσχέτισης (λ), κανονικοποιημένη Αμοιβαία πληροφορία και γραμμικός συντελεστής συσχέτισης (r) ημερήσιων φιλτραρισμένων παρατηρήσεων υστέρησης. Ως συμπέρασμα, μπορούμε να πούμε ότι τα επίπεδα του global συντελεστή συσχέτισης είναι πολύ υψηλά ειδικά αν υπολογίσουμε ότι οι τιμές του γραμμικού συντελεστή δεν είναι σημαντικές. Τα αποτελέσματα της παραπάνω έρευνας είναι όμοια με τα αποτελέσματα άλλων ερευνών, όπως των Darbellay και Wuertz (2000) και Maasoumi και Racine (2002). Η παρουσία της σειριακής εξάρτησης, σύμφωνα με την έρευνα των Dionisio A., Menezes R.και Mendes D.A., πρέπει να εξασφαλίζει μία στρατηγική ώστε να παράγει συστηματικά κέρδη 36

ΚΕΦΑΛΑΙΟ 4 Η ΔΙΑΔΙΚΑΣΙΑ ΤΗΣ ΠΡΟΣΟΜΟΙΩΣΗΣ Για να επιτύχουμε την σύγκριση των μέτρων αυτοσυσχέτισης, χρησιμοποιήσαμε το πρόγραμμα Matlab. Συγκεκριμένα στο πρόγραμμα δημιουργήσαμε έναν αλγόριθμο. Ο αλγόριθμος περιλαμβάνει εντολές και συναρτήσεις του προγράμματος, καθώς και άλλες που δημιουργήσαμε. Στο παράρτημα παραθέτουμε ολόκληρο τον αλγόριθμο. Αρχικά σε κάθε προσομοίωση ορίσαμε το μέγεθος του δείγματος της σειράς, την υστέρηση που χρησιμοποιήσαμε, η οποία σε όλες τις περιπτώσεις ήταν και το διάνυσμα με τη στάθμη σημαντικότητας το οποίο έπαιρνε τιμές από 0.0 μέχρι 0.20 με βήμα 0.0. Δημιουργήσαμε για κάθε παραμετρικό και μη παραμετρικό μέτρο συσχέτισης έναν πίνακα, στον οποίο αποθηκεύονταν οι αντίστοιχες p-τιμές ελέγχου του, καθώς επίσης και πίνακες στους οποίους αποθηκεύονται οι τιμές των συντελεστών. Στη συνέχεια ορίσαμε το σύστημα που χρησιμοποιούσαμε κάθε φορά. Για τα συστήματα του λευκού θορύβου από Κανονική, Εκθετική και Cauchy κατανομή, χρησιμοποιήθηκαν οι γεννήτριες τυχαίων αριθμών του προγράμματος. Όμως για τα συστήματα του Αυτοπαλινδρομούμενου Μοντέλου, Ikeda map και Henon map χρησιμοποιήσαμε δικές μας συναρτήσεις και όποτε χρειαζόταν αλλάζαμε τις τιμές των παραμέτρων. Ειδικά για το σύστημα του Αυτοπαλινδρομούμενου Μοντέλου, χρησιμοποιήσαμε για το θόρυβο του Κανονική και Εκθετική κατανομή και οι τιμές της παραμέτρου φ ήταν 0.3,0.7,-0.3,-0.7. Αναλυτικά τα συστήματα που χρησιμοποιήθηκαν αναλύονται στην παρακάτω ενότητα 37

4. Τα συστήματα Για να μπορέσουμε να αξιολογήσουμε και να συγκρίνουμε τους πέντε συντελεστές συσχέτισης χρησιμοποιήθηκαν χρονικές σειρές διαφόρων συστημάτων που αναφέρονται αναλυτικά παρακάτω.. Διαδικασία Λευκού Θορύβου από Κανονική Κατανομή με μέση τιμή 0 και διασπορά. Δηλαδή X N(0,) t 2. Διαδικασία Λευκού Θορύβου από Εκθετική Κατανομή με παράμετρο ΜU= 0.5 3. Διαδικασία Λευκού Θορύβου από Κατανομή Cauchy, δηλαδή t-student κατανομή με βαθμό ελευθερίας. 4. Διαδικασία AR(), με θόρυβο από κανονική κατανομή με μέση τιμή 0 και διασπορά και από εκθετική κατανομή με ΜU= 0.5, με τιμές της παραμέτρου φ= 0.3, 0.7, -0.3, -0.7 X = ϕ X + e όπου e N(0,), e Exp(0.5). t t t 5. Henon Map με θόρυβο από κανονική κατανομή t X = s + e, s =.4s + 0.3 s, e N (0, σ ) 2 2 t t t t t t 2 t e 6. Ιkeda Map X X i i X 2 t = + 0.9 t exp{0.4 6 /( + t ) } t 4.2 Η διαδικασία της προσομοίωσης Χωρίζοντας την χρονική σειρά σε δύο διανύσματα, σύμφωνα με την υστέρηση, αρχίζει ο υπολογισμός των τριών παραμετρικών συντελεστών Spearman, Pearson και Kendall με χρήση συνάρτησης του Matlab και έπειτα ο υπολογισμός των Order Correlation και Αμοιβαίας Πληροφορίας. Μετά την ολοκλήρωση του υπολογισμού των παραπάνω συντελεστών, συνεχίσαμε με τον υπολογισμό των μη παραμετρικών. Για να πάρουμε τις τιμές των μη παραμετρικών συντελεστών, χρησιμοποιούμε την ίδια σειρά αντιμεταθέτοντας την. Η νέα σειρά που χρησιμοποιείται κάθε φορά μετά την αντιμετάθεση χωρίζεται πάλι σε δύο διανύσματα λόγω της υστέρησης και υπολογίζονται οι συντελεστές συσχέτισης. Με αυτόν τον 38

τρόπο, αντιμεταθέτοντας τις τιμές της σειράς, ελέγχουμε την μεταβολή των τιμών των συντελεστών. Η διαδικασία της αντιμετάθεσης πραγματοποιείται 000 φορές, οπότε παίρνουμε 000 τιμές για κάθε συντελεστή. Συνολικά κάθε πίνακας που περιέχει τις τιμές κάθε συντελεστή αποτελείται από 00 τιμές, μία τιμή από τον παραμετρικό υπολογισμό του και 000 από τον μη παραμετρικό. Στη συνέχεια κάθε πίνακας που περιέχει τις τιμές των συντελεστών επανατοποθετείται σε αύξουσα σειρά.υπολογίζεται το ποσοστό α των τιμών του κάθε συντελεστή που παίρνει τιμή, δηλαδή παρουσιάζει τις τιμές της σειράς εξαρτημένες απορρίπτοντας έτσι την μηδενική υπόθεση της ανεξαρτησίας. Εάν το ποσοστό αυτό ήταν μεγαλύτερο από το 0.5 τότε η p-τιμή ελέγχου του συντελεστή δίνεται από τον τύπο 2 (-α). Σε αντίθετη περίπτωση, δηλαδή που το ποσοστό θα ήταν μικρότερο από το 0.5, η p-τιμή ελέγχου υπολογίζεται από τον τύπο 2 α. Για την ολοκλήρωση της προσομοίωσης, υπολογίζεται η σημαντικότητα του κάθε συντελεστή. Η σημαντικότητα υπολογίζεται βρίσκοντας το ποσοστό που η p- τιμή ελέγχου κάθε συντελεστή είναι μικρότερη από την εκάστοτε στάθμη σημαντικότητας. Τέλος το πρόγραμμα ολοκληρωνόταν παραθέτοντας γραφήματα με τη σημαντικότητα του κάθε συντελεστή, παραμετρικού και μη, μαζί με τις τιμές της στάθμης σημαντικότητας. 39