Θεωρητική και εμπειρική σύγκριση στοχαστικών μεθόδων και μεθόδων μηχανικής μάθησης στην πρόβλεψη υδρολογικών διεργασιών

Σχετικά έγγραφα
Κλιματική αλλαγή, δυναμική Hurst- Kolmogorov και αβεβαιότητα

Στοχαστική ανάλυση και προσοµοίωση υδροµετεωρολογικών διεργασιών σχετικών µε την αιολική και ηλιακή ενέργεια

Κασταλία Σύστηµα στοχαστικής προσοµοίωσης υδρολογικών µεταβλητών

Μη μετρούμενες λεκάνες απορροής: Διερεύνηση στη λεκάνη του Πηνειού Θεσσαλίας, στη θέση Σαρακίνα

Data Analytics Και Ευφυή Συστήματα Πρόβλεψης Δεδομένων Σε Χρονοσειρά. Εφαρμογή Στον Εναρμονισμένο Δείκτη Τιμών Καταναλωτή.

βροχοπτώσεων 1 ο Πανελλήνιο Συνέδριο Μεγάλων Φραγµάτων Νοεµβρίου 2008, Λάρισα Ενότητα: Φράγµατα, θέµατα Υδραυλικής-Υδρολογίας

Προσομοίωση βροχόπτωσης απορροής με τη χρήση της παλινδρόμησης των μηχανών διανυσμάτων υποστήριξης

Η επίδραση της δειγματοληπτικής αβεβαιότητας των εισροών στη στοχαστική προσομοίωση ταμιευτήρα

ΜΑΘΗΜΑ: Εισαγωγή στις Αρχές της Επιστήμης των Η/Υ. 1 η ΘΕΜΑΤΙΚΗ ΕΝΟΤΗΤΑ: ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ

Τεχνικές Προβλέψεων Αυτοπαλινδρομικά Μοντέλα Κινητού Μέσου Όρου (ARIMA)

Χρονολογικές Σειρές (Time Series) Lecture notes Φ.Κουντούρη 2008

Υδρολογική διερεύνηση λειτουργίας ταµιευτήρα Πλαστήρα

Τεχνητή Νοημοσύνη. 18η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

Μέθοδοι Μηχανών Μάθησης για Ευφυή Αναγνώριση και ιάγνωση Ιατρικών εδοµένων

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Data Mining - Classification

Στοιχεία εισηγητή Ημερομηνία: 10/10/2017

Μηχανουργική Τεχνολογία ΙΙ

1 (forward modeling) 2 (data-driven modeling) e- Quest EnergyPlus DeST 1.1. {X t } ARMA. S.Sp. Pappas [4]

Σεμινάριο Τελειοφοίτων. 2 - Επιλογή Επεξεργασία Ερευνητικού Θέματος

Εισαγωγή στην υδροπληροφορική και βελτιστοποίηση συστημάτων υδατικών πόρων

ΠΡΟΓΡΑΜΜΑ ΚΑΡΑΘΕΟΔΩΡΗΣ 2008

Εισαγωγή στην υδροπληροφορική και βελτιστοποίηση συστημάτων υδατικών πόρων

Διακριτικές Συναρτήσεις

Βαθμονόμηση και Επαλήθευση του Λογισμικού SWMM σε μια Λεκάνη του Παντορροϊκού Συστήματος Αποχέτευσης της Αθήνας

Επιχειρηματικές Προβλέψεις: Μέθοδοι & Τεχνικές Ενημερωτικό Μαθήματος Διάλεξη 1

Στοχαστικές Μέθοδοι στους Υδατικούς Πόρους Φασματική ανάλυση χρονοσειρών

μαθήματος: 120 Επίπεδο μαθήματος: Προπτυχιακό Μεταπτυχιακό Τύπος μαθήματος: Υποχρεωτικό Επιλογής Κατηγορία Ώρες 8 ο διδασκαλίας

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΔΠΜΣ ΠΕΡΙΒΑΛΛΟΝ ΚΑΙ ΑΝΑΠΤΥΞΗ

ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΤΜΗΜΑ ΟΡΓΑΝΩΣΗΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΔΙΔΑΣΚΩΝ: ΘΑΝΑΣΗΣ ΚΑΖΑΝΑΣ. Οικονομετρία

5 ο Πανελλήνιο Συνέδριο ΑΓΡΟΝΟΜΩΝ και ΤΟΠΟΓΡΑΦΩΝ ΜΗΧΑΝΙΚΩΝ. Ινώ ΠΑΠΑΓΕΩΡΓΑΚΗ * & Ιωάννης ΝΑΛΜΠΑΝΤΗΣ

Τεχνικές Προβλέψεων. 3η Ενότητα

Τεχνικές Προβλέψεων. Ενημερωτικό Μαθήματος

Τεχνικές Προβλέψεων. Προβλέψεις

ΣΤΟΧΑΣΤΙΚΗ ΠΡΟΣΟΜΟΙΩΣΗ ΤΗΣ ΧΩΡΙΚΗΣ ΔΟΜΗΣ ΤΗΣ ΒΡΟΧΗΣ. Παρουσίαση διπλωματικής εργασίας Αθανάσιος Πασχάλης Επιβλέπων καθηγητής: Δημήτρης Κουτσογιάννης

HMY 795: Αναγνώριση Προτύπων

Βραχυπρόθεσμη πρόβλεψη ενεργειακής ζήτησης Προσεγγίσεις βασισμένες στη Μηχανική Μάθηση

Κύρια σημεία. Μεθοδολογικές εργασίες. Άρθρα Εφαρμογών. Notes - Letters to the Editor. Εργασίες στη Στατιστική Μεθοδολογία

ΣΥΓΓΡΑΦΗ ΕΠΙΣΤΗΜΟΝΙΚΗΣ ΕΡΕΥΝΑΣ

ΕΦΑΡΜΟΓΗ ΠΡΟΒΛΕΨΗΣ ΕΤΑΙΡΙΚΗΣ ΠΤΩΧΕΥΣΗΣ ΣΤΟ ΠΛΑΙΣΙΟ ΤΗΣ ΕΛΕΓΚΤΙΚΗΣ ΑΞΙΟΛΟΓΗΣΗΣ ΠΕΡΙ «ΣΥΝΕΧΙΣΗΣ ΔΡΑΣΤΗΡΙΟΤΗΤΑΣ»

ΠΕΡΙΓΡΑΜΜΑ ΜΑΘΗΜΑΤΟΣ- ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ & ΣΤΑΤΙΣΤΙΚΑ ΠΑΚΕΤΑ (ΣΤ3) ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ. ΚΩΔΙΚΟΣ ΜΑΘΗΜΑΤΟΣ ΣT3 ΕΞΑΜΗΝΟ ΣΠΟΥΔΩΝ 2 ο

Ανάπτυξη και δηµιουργία µοντέλων προσοµοίωσης ροής και µεταφοράς µάζας υπογείων υδάτων σε καρστικούς υδροφορείς µε χρήση θεωρίας νευρωνικών δικτύων

Τεχνικές Προβλέψεων. Προβλέψεις

Ιωάννα Ανυφαντή, Μηχανικός Περιβάλλοντος Επιβλέπων: Α. Ευστρατιάδης, ΕΔΙΠ ΕΜΠ. Αθήνα, Ιούλιος 2018

ΤΕΧΝΙΚΗ ΥΔΡΟΛΟΓΙΑ Πιθανοτική προσέγγιση των υδρολογικών μεταβλητών

Απλές Μέθοδοι Εκτίμησης Ακραίων Γεγονότων Βροχής

Πολυ-επίπεδη στατιστική ανάλυση της πιθανότητας και της σοβαρότητας ατυχήματος αξιοποιώντας κυκλοφοριακά και μετεωρολογικά δεδομένα υψηλής ευκρίνειας

Στοχαστικές Μέθοδοι στους Υδατικούς Πόρους Μακροπρόθεσμη εμμονή και ανελίξεις απλής ομοιοθεσίας (simple scaling)

Αλεξάνδρειο ΣΕΙ Θεσσαλονίκης 1. Σμήμα Διοίκησης Επιχειρήσεων 2. Σμήμα Μηχανικών Πληροφορικής

Συστήματα υποστήριξης αποφάσεων στη διαχείριση υδατικών πόρων: Η περίπτωση του υδροδοτικού συστήματος της Αθήνας

ΜΑΡΚΟΠΟΥΛΟΣ ΑΠΟΣΤΟΛΟΣ ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΠΟΛΙΤΙΚΩΝ ΜΗΧΑΝΙΚΩΝ ΤΟΜΕΑΣ ΥΔΑΤΙΚΩΝ ΠΟΡΩΝ ΚΑΙ ΠΕΡΙΒΑΛΛΟΝΤΟΣ ΙΟΥΛΙΟΣ 2017

Τεχνικές Προβλέψεων Αυτοπαλινδρομικά Μοντέλα Κινητού Μέσου Όρου (ARIMA)

ΤΕΙ ΚΕΝΤΡΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ

Συστήματα υποστήριξης αποφάσεων στη διαχείριση υδατικών πόρων: Η περίπτωση του υδροδοτικού συστήματος της Αθήνας

Ένα φειδωλό μοντέλο για την πρόβλεψη των χαμηλών ροών σε μεσογειακά υδατορεύματα

Επιχειρηματικές Προβλέψεις: Μέθοδοι & Τεχνικές Εισαγωγή στις Μεθόδους Προβλέψεων Διάλεξη 5

Κατασκευή ισοδύναμων ερωτημάτων για το αυτοματοποιημένο σύστημα πιστοποίησης εκπαιδευτικών στις βασικές δεξιότητες πληροφορικής

ΠΕΡΙΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ 3 ΔΕΣΜΕΥΜΕΝΗ ΠΙΘΑΝΟΤΗΤΑ, ΟΛΙΚΗ ΠΙΘΑΝΟΤΗΤΑ ΘΕΩΡΗΜΑ BAYES, ΑΝΕΞΑΡΤΗΣΙΑ ΚΑΙ ΣΥΝΑΦΕΙΣ ΕΝΝΟΙΕΣ 71

Επιχειρηματικές Προβλέψεις: Μέθοδοι & Τεχνικές Ενημερωτικό Μαθήματος Διάλεξη 1

Ζωντανό Εργαστήριο Thessaloniki Active and Healthy Ageing Living Lab Παρακολούθηση ατόμων στο σπίτι σε πραγματικό χρόνο

Ανάλυση σχημάτων βασισμένη σε μεθόδους αναζήτησης ομοιότητας υποακολουθιών (C589)

ΟΝΟΜΑΤΕΠΩΝΥΜΟ

Σύγχρονες τάσεις στην εκτίµηση ακραίων βροχοπτώσεων

ΤΙ ΕIΝΑΙ ΠΡΟΒΛΕΨΕΙΣ; Διαδικασία εκτίμησης μελλοντικών καταστάσεων βασιζόμενη συνήθως σε ιστορικά στοιχεία

Σύγχρονα συστήµατα προβλέψεων και µοντελοποίησης. Τµήµα Στατιστικής και Αναλογιστικών Χρηµατοοικονοµικών Μαθηµατικών

ΑΠΟΔΟΣΗ ΕΛΕΓΧΩΝ ΓΡΑΜΜΙΚΗΣ ΤΑΣΗΣ ΧΡΟΝΟΣΕΙΡΩΝ ΜΕ ΧΡΗΣΗ ΤΕΧΝΙΚΩΝ ΤΥΧΑΙΟΠΟΙΗΣΗΣ

Υδρονοµέας Σύστηµα υποστήριξης της διαχείρισης υδατικών πόρων

Βραχυπρόθεσμη τοπική μετεωρολογική πρόγνωση με αναζήτηση ανάλογων καταστάσεων

Πληροφοριακά Συστήματα & Περιβάλλον

Προσαρμογή περιοχικών υδρολογικών σχέσεων στις Ελληνικές λεκάνες

ΠΡΟΗΓΜΕΝΑ ΣΥΣΤΗΜΑΤΑ ΜΕΤΑΦΟΡΩΝ

ΠΕΡΙΕΧΟΜΕΝΑ ΜΕΡΟΣ ΠΡΩΤΟ ΠΙΘΑΝΟΤΗΤΕΣ 13 ΚΕΦΑΛΑΙΟ 1 ΕΙΣΑΓΩΓΗ 15 ΚΕΦΑΛΑΙΟ 2 ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΠΙΘΑΝΟΤΗΤΑΣ 19

Τεχνολογικό Εκπαιδευτικό Ίδρυμα Δυτικής Μακεδονίας Western Macedonia University of Applied Sciences Κοίλα Κοζάνης Kozani GR 50100

Υδρολογική διερεύνηση της διαχείρισης της λίµνης Πλαστήρα

Υδρολογική διερεύνηση της διαχείρισης της λίµνης Πλαστήρα

Big Data/Business Intelligence

Analyze/Forecasting/Create Models

Κεφάλαιο 20. Ανακάλυψη Γνώσης σε Βάσεις δεδοµένων. Τεχνητή Νοηµοσύνη - Β' Έκδοση Ι. Βλαχάβας, Π. Κεφαλάς, Ν. Βασιλειάδης, Φ. Κόκκορας, Η.

Αναγνώριση Προτύπων Ι

Εθνικό Μετσόβιο Πολυτεχνείο

ΒΙΟΓΡΑΦΙΚΟ ΣΗΜΕΙΩΜΑ ΣΤΥΛΙΑΝΗΣ Κ. ΣΟΦΙΑΝΟΠΟΥΛΟΥ Αναπληρώτρια Καθηγήτρια. Τµήµα Τεχνολογίας & Συστηµάτων Παραγωγής.

Επιχειρηματικές Προβλέψεις: Μέθοδοι & Τεχνικές Ενημερωτικό Μαθήματος Διάλεξη 1

Εξόρυξη γνώμης πολιτών από ελεύθερο κείμενο

Εφαρμογή Υπολογιστικών Τεχνικών στην Γεωργία

Τεχνικές Προβλέψεων. Προβλέψεις

Ανάπτυξη Μοντέλου Εκτίμησης της Ποιότητας του Χάρτη

ΕΛΛΗΝΙΚΗ ΕΤΑΙΡΕΙΑ ΠΕΡΙΦΕΡΕΙΑΚΗΣ ΕΠΙΣΤΗΜΗΣ ERSA

Χαλκίδης Νέστωρας, Τσαγιοπούλου Μαρία, Παπακωνσταντίνου Νίκος, Μωυσιάδης Θεόδωρος. Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης 2016

Τεχνικές Προβλέψεων Αυτοπαλινδρομικά Μοντέλα Κινητού Μέσου Όρου (ARIMA)

Ανάλυση μεγάλων δεδομένων με χρήση εργαλείων εξόρυξης δεδομένων. Η περίπτωση μιας εφαρμογής υποστήριξης αποφάσεων εκλογικής ψήφου.

Α.Σ.ΠΑΙ.Τ.Ε. Π.Μ.Σ. ΕΠΙΣΤΗΜΕΣ ΤΗΣ ΑΓΩΓΗΣ

Τεχνικές Εξόρυξης Δεδομένων


Προγραμματισμός Ζήτησης και Προμηθειών της ΕΑ. Δημοκρίτειο Πανεπιστήμιο, Τμήμα Μηχανικών Παραγωγής & Διοίκησης 1

Presentation Structure

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ

ΑΚΑΔΗΜΙΑ ΤΩΝ ΠΟΛΙΤΩΝ

«ΣΥΓΧΡΟΝΑ ΕΡΓΑΛΕΙΑ, ΤΕΧΝΙΚΕΣ ΚΑΙ ΜΕΘΟΔΟΛΟΓΙΕΣ ΓΙΑ ΤΟ ΧΑΡΑΚΤΗΡΙΣΜΟ ΚΥΒΕΡΝΟΕΠΙΘΕΣΕΩΝ ΚΑΙ ΚΑΚΟΒΟΥΛΟΥ Λ ΟΓΙΣΜΙΚΟΥ»

Πηγές για τα αναλυτικά στοιχεία του ΑΠΘ συνολικά αλλά και της Πολυτεχνικής Σχολής ήταν οι παρακάτω:

ΥΔΡΟΛΟΓΙΑ. Ενότητα 4: Όμβριες Καμπύλες - Ασκήσεις. Καθ. Αθανάσιος Λουκάς. Εργαστήριο Υδρολογίας και Ανάλυσης Υδατικών Συστημάτων

ΣΥΣΧΕΤΙΣΗ ΚΥΚΛΟΦΟΡΙΑΚΩΝ ΜΕΓΕΘΩΝ ΜΕ ΤΗ ΣΟΒΑΡΟΤΗΤΑ ΚΑΙ ΤΗΝ ΠΙΘΑΝΟΤΗΤΑ ΟΔΙΚΩΝ ΑΤΥΧΗΜΑΤΩΝ. Απόστολος Ζιακόπουλος

Transcript:

Εθνικό Μετσόβιο Πολυτεχνείο Διεπιστημονικό - Διατμηματικό Πρόγραμμα Μεταπτυχιακών Σπουδών Επιστήμη και Τεχνολογία Υδατικών Πόρων Θεωρητική και εμπειρική σύγκριση στοχαστικών μεθόδων και μεθόδων μηχανικής μάθησης στην πρόβλεψη υδρολογικών διεργασιών Γεωργία Παπαχαραλάμπους Πολιτικός Μηχανικός Επιβλέπων: Δ. Κουτσογιάννης, Καθηγητής Ζωγράφου, 27 Οκτωβρίου 2016

Μηχανική μάθηση για προβλέψεις στην υδρολογία Η πρόβλεψη της εξέλιξης υδρολογικών διεργασιών είναι χρήσιμη. Το πρακτικό και ερευνητικό ενδιαφέρον για τις μεθόδους σημειακής εκτίμησης εξακολουθεί να είναι μεγάλο (Krzysztofowicz 2001). Οι μέθοδοι μηχανικής μάθησης χρησιμοποιούνται ευρέως για προβλέψεις στον χώρο της υδρολογίας ως εναλλακτική των κλασικών στοχαστικών μεθόδων. Δημοφιλείς μέθοδοι μηχανικής μάθησης είναι τα: Νευρωνικά Δίκτυα - Neural Networks (NN) Μεγάλος αριθμός πρακτικών εφαρμογών, βλ. Maier and Dandy (2000) και αναφορές εντός Support Vector Machines (SVM) Μεγάλος αριθμός πρακτικών εφαρμογών, βλ. Raghavendra and Deka (2014) και αναφορές εντός 2

Σύγκριση μεθόδων πρόβλεψης στη βιβλιογραφία Η έρευνα εστιάζει συχνά στην σύγκριση μεθόδων μηχανικής μάθησης με κλασικές στοχαστικές μεθόδους. Όσον αφορά τον χώρο της υδρολογίας: Μεγάλος αριθμός σχετικών εργασιών, π.χ. Jain et al. (1999), Kisi (2004), Khan and Coulibaly (2006), Lin et al. (2006), Han et al. (2007), Yu and Liong (2007), Koutsoyiannis et al. (2008), Wang et al. (2009), Belayneh et al. (2014) Οι διενεργούμενες συγκρίσεις στην βιβλιογραφία αφορούν συνήθως μελέτες περίπτωσης. Η εξαγωγή γενικών συμπερασμάτων μπορεί να επιτευχθεί μέσω της σύγκρισης σε ικανό αριθμό διαφορετικών περιπτώσεων - χρονοσειρών. Εργασίες που επιχειρούν σε ορισμένο βαθμό γενίκευση είναι αυτές των: Ahmed et al. (2010): Σύγκριση 8 μεθόδων πρόβλεψης σε 1 045 ιστορικές χρονοσειρές από διάφορα επιστημονικά πεδία Thissen et al. (2003): Σύγκριση 3 μεθόδων πρόβλεψης σε δύο συνθετικές χρονοσειρές μεγάλου μήκους και σε μία ιστορική χρονοσειρά από τον χώρο της χημειομετρίας 3

Διενεργούμενη σύγκριση και σημεία πρωτοτυπίας Αντικείμενο της εργασίας είναι η σύγκριση κλασικών στοχαστικών μεθόδων και μεθόδων μηχανικής μάθησης στην πρόβλεψη της μελλοντικής συμπεριφοράς υδρολογικών διεργασιών. Η διενεργούμενη σύγκριση αφορά μακροπρόθεσμες προβλέψεις στην χρονική κλίμακα των παρατηρήσεων. Πραγματοποιείται σε: θεωρητικό επίπεδο εξαγωγή γενικών συμπερασμάτων βασική συνεισφορά της εργασίας εμπειρικό επίπεδο ενίσχυση γενικών συμπερασμάτων ανάδειξη επιμέρους σημείων Η πρωτοτυπία της διενεργούμενης σύγκρισης έγκειται στην χρήση: συνθετικών χρονοσειρών, που συνιστούν ένα ευρύ φάσμα διαφορετικών περιπτώσεων αρκετών μεθόδων πρόβλεψης (στοχαστικών και μηχανικής μάθησης) αρκετών μέτρων ποιότητας των προβλέψεων ως μαθηματικών εργαλείων ποσοτικοποίησης της επίδοσης των μεθόδων 4

Ερωτήματα σχετικά με την σύγκριση μεθόδων πρόβλεψης Διαφέρει η επίδοση μεθόδων μηχανικής μάθησης σε σχέση με εκείνη κλασικών στοχαστικών μεθόδων; Αν ναι, είναι καλύτερη ή χειρότερη; Πόσο καλή σε σχέση με το σύνολο μπορεί να είναι η επίδοση μιας μεθόδου ως προς όλα τα εκάστοτε υπολογιζόμενα μέτρα; Υπάρχουν μέθοδοι, οι οποίες συγκρινόμενες με άλλες θα έχουν εμφανώς καλύτερη ή χειρότερη επίδοση από αυτές; Εξεζητημένες μέθοδοι δίνουν καλύτερες προβλέψεις από απλούστερες μεθόδους; Είναι εφικτή κάποια ομαδοποίηση μεθόδων που συναξιολογούνται με βάση την επίδοση τους; Είναι δυνατή η διατύπωση πλεονεκτημάτων και μειονεκτημάτων για μεθόδους πρόβλεψης με βάση συγκρίσεις όπως η διενεργούμενη; Πόσο μπορεί να διαφέρει η επίδοση μιας μεθόδου πρόβλεψης συγκριτικά με τις υπόλοιπες κατά την εφαρμογή της σε δύο διαφορετικές χρονοσειρές; 5

Μεθοδολογία σύγκρισης μεθόδων πρόβλεψης Πραγματοποιήθηκαν 20 πειράματα προσομοίωσης μεγάλης κλίμακας. Συμπληρωματικά έγιναν 8 μελέτες περίπτωσης. Χρησιμοποιήθηκαν συνολικά 28 μέθοδοι πρόβλεψης. Η ποιότητα των προβλέψεων ποσοτικοποιήθηκε χρήσει 22 μέτρων. Δεδομένα Μέθοδοι πρόβλεψης Μέτρα 20 x 2 000 συνθετικές χρονοσειρές 120 παρατηρήσεων από προσομοίωση στοχαστικών ανελίξεων ARMA, ARIMA, ARFIMA, SARIMA 8 ιστορικές χρονοσειρές 19 κλασικές στοχαστικές μέθοδοι από τις εξής οικογένειες μεθόδων: Naive, ARMA, ARIMA, ARFIMA, SARIMA, Exponential Smoothing 9 μέθοδοι μηχανικής μάθησης: 3 μέθοδοι NN, 6 6 μέθοδοι SVM 22 μέτρα που παρέχουν (συν)αξιολόγηση με βάση τα εξής κριτήρια: ακρίβεια αμεροληψία αμεροληψία ως προς την διακύμανση συσχέτιση 6

Εφαρμογή στοχαστικών μεθόδων αναλογία 75:25 training set test set Οι συνθετικές χρονοσειρές χωρίζονται σε δύο τμήματα 90 και 30 παρατηρήσεων για εφαρμογή των στοχαστικών μεθόδων. Το πρώτο χρησιμοποιείται για την εκπαίδευση των μοντέλων και το δεύτερο ως χρονοσειρά - στόχος, δηλαδή ως αναφορά για την σύγκριση των προβλέψεων μεταξύ τους. 7

Εφαρμογή μεθόδων μηχανικής μάθησης αναλογία 50:25:25 training set validation set test set Οι συνθετικές χρονοσειρές χωρίζονται σε τρία τμήματα 60, 30 και 30 παρατηρήσεων για εφαρμογή των μεθόδων μηχανικής μάθησης. Το πρώτο και το δεύτερο χρησιμοποιούνται για την εκπαίδευση των μοντέλων, ενώ το τρίτο χρησιμοποιείται ως χρονοσειρά - στόχος, δηλαδή ως αναφορά για την σύγκριση των προβλέψεων μεταξύ τους. 8

Κώδικας στο R Ο βασικός κώδικας είναι 3 500 γραμμών. Χρησιμοποιήθηκαν 5 παραλλαγές. Συνδυάστηκαν συναρτήσεις κυρίως από τα παρακάτω πακέτα. stats (R Core Team 2016) CombMSC (Smith 2012) βασικό πακέτο του R EnvStats (Millard 2013) forecast (Hyndman 2016, Hyndman and Khandakar 2008) fracdiff (Maechler 2012) ggextra (Attali 2016) λοιπά πακέτα του R ggplot2 (Wickham 2009) HKprocess (Tyralis 2016) hydrogof (Zambrano-Bigiarini 2014) rminer (Cortez 2010, 2015) 9

Παράδειγμα προβλέψεων σε συνθετικές χρονοσειρές Προσομοιωμένη στοχαστική ανέλιξη AR(1) με φ 1 = 0.7 10

Παράδειγμα προβλέψεων σε συνθετικές χρονοσειρές Προσομοιωμένη στοχαστική ανέλιξη AR(1) με φ 1 = 0.7 11

RMSE των προβλέψεων 2 000 συνθετικές χρονοσειρές από προσομοίωση της AR(1) με φ 1 = 0.7 αστάθεια αστάθεια αναμενόμενα μικρότερη ακρίβεια σχετικά μεγάλη ακρίβεια 12

rsd μεταξύ προβλέψεων και παρατηρήσεων 2 000 συνθετικές χρονοσειρές από προσομοίωση της AR(1) με φ 1 = 0.7 αναμενόμενη υποεκτίμηση αναμενόμενη υπερεκτίμηση rsd: λόγος των τυπικών αποκλίσεων αστάθεια 13

Nash-Sutcliffe Efficiency (NSE) των προβλέψεων 2 000 συνθετικές χρονοσειρές από προσομοίωση της AR(1) με φ 1 = 0.7 αποδεκτή ακρίβεια για το 25% των δοκιμών αναμενόμενα μικρότερη ακρίβεια far outliers removed 14

Συντελεστής συσχέτισης (Pearson s r, Pr) 2 000 συνθετικές χρονοσειρές από προσομοίωση της AR(1) με φ 1 = 0.7 μικρότερη συσχέτιση μικρή συσχέτιση 15

Heatmap συναξιολόγησης μεθόδων με βάση τα μέτρα συναξιολόγηση ως προς τις διάμεσες τιμές 2 000 συνθετικές χρονοσειρές από προσομοίωση της AR(1) με φ 1 = 0.7 16

Ιστορική χρονοσειρά μέγιστου ετήσιου βάθους του Νείλου 848 παρατηρήσεις Hurst Η = 0.72 training set test set Δεδομένα: Koutsoyiannis (2013) 17

Συνάρτηση αυτοσυσχέτισης (ACF) Ιστορική χρονοσειρά μέγιστου ετήσιου βάθους του Νείλου ένδειξη σημαντικής μακροπρόθεσμης εμμονής 18

Προβλέψεις μέγιστου ετήσιου βάθους Νείλου ακραία παρατήρηση που αδυνατούν να προβλέψουν οι μέθοδοι 19

Heatmap συναξιολόγησης μεθόδων με βάση τα μέτρα ιστορική χρονοσειρά μέγιστου βάθους Νείλου 20

Συνεισφορά της εργασίας Γενικώς δεν υπάρχουν μέθοδοι καλύτερες ή χειρότερες ταυτόχρονα ως προς το σύνολο των μέτρων, με αποτέλεσμα η συνολική εικόνα να είναι μάλλον ομοιόμορφη. Υπάρχουν μέθοδοι που είναι σταθερά καλύτερες ή χειρότερες από άλλες ως προς συγκεκριμένα μέτρα. Μέθοδοι περισσότερο εξεζητημένες δεν δίνουν κατ ανάγκην καλύτερες προβλέψεις από απλούστερες μεθόδους. Παρότι μία γενική κατάταξη των μεθόδων δεν είναι εφικτή, εφικτή είναι μια καταρχήν κατηγοριοποίηση τους με βάση την παρόμοια επίδοση στα διάφορα μέτρα. Η εν λόγω κατηγοριοποίηση μπορεί να εξαρτάται και από την στοχαστική ανέλιξη. Οι μέθοδοι μηχανικής μάθησης φαίνεται να μην διαφέρουν από τις κλασικές στοχαστικές μεθόδους ως προς τα όσα διατυπώνονται παραπάνω. Οι διάφορες μέθοδοι SVM διαφέρουν μεταξύ τους λιγότερο από ό,τι κλασικές στοχαστικές μέθοδοι ή μέθοδοι NN που βασίζονται στον ίδιο αλγόριθμο. 21

Συνεισφορά της εργασίας Οι αλγόριθμοι μηχανικής μάθησης προσφέρουν εν δυνάμει καλή επίδοση ως προς την ακρίβεια. Η επίδοση μιας μεθόδου πρόβλεψης ενδεχομένως να διαφέρει σε μεγάλο βαθμό κατά την εφαρμογή σε δύο διαφορετικές χρονοσειρές. Οι συγκεκριμένες διαφορές εξαρτώνται τόσο από την μέθοδο όσο και από τη στοχαστική ανέλιξη. Τα ανωτέρω γενικά συμπεράσματα αναδεικνύουν την σημασία της θεωρητικής σύγκρισης που διενεργεί η παρούσα εργασία. Η μικρής κλίμακας εμπειρική σύγκριση τονίζει επιμέρους σημεία του θέματος, ενώ ενισχύει ακόμη τα συμπεράσματα της θεωρητικής σύγκρισης που προηγείται. Κάποιος που χρησιμοποιεί συγχρόνως τα αποτελέσματα και των δύο περιπτώσεων σύγκρισης έχει μια περισσότερο ολοκληρωμένη εικόνα. Σημαντικό σημείο στην παρούσα εργασία αποδεικνύεται ακόμη η χρήση αρκετών μεθόδων και μέτρων. Λιγότερες μέθοδοι και λιγότερα μέτρα θα οδηγούσαν σε πολύ διαφορετική συνολική εικόνα. 22

Προτάσεις για περαιτέρω έρευνα Προτείνεται η διενέργεια προσομοιώσεων με σκοπό την σύγκριση κλασικών στοχαστικών μεθόδων και μεθόδων μηχανικής μάθησης για την περίπτωση της βραχυπρόθεσμης πρόβλεψης, η οποία είναι επίσης χρήσιμη. Προτείνεται η υιοθέτηση της μεθοδολογίας της παρούσας εργασίας για την αξιολόγηση της επίδοσης μεθόδων για τις οποίες υπάρχει θεωρητικό ή/και πρακτικό ενδιαφέρον. Η κατανόηση των θεωρητικών ιδιοτήτων των διαφόρων μεθόδων απαιτεί συστηματική και εστιασμένη σε καθεμία από αυτές έρευνα. Τα μέτρα που χρησιμοποιούνται στην συναξιολόγηση θα πρέπει να γίνουν σε μεγαλύτερο βαθμό κατανοητά, γεγονός που σημαίνει ότι η έρευνα θα πρέπει να εστιάσει και σε αυτά. Όσον αφορά τις μεθόδους μηχανικής μάθησης, προτείνεται η διενέργεια προσομοιώσεων με σκοπό τη διερεύνηση τόσο των διαφόρων τρόπων επιλογής των χρονικών υστερήσεων για την κατασκευή του πίνακα των διανυσμάτων που χρησιμοποιούνται στην παλινδρόμηση όσο και των διαφόρων τρόπων επιλογής των υπερπαραμέτρων. 23

Αναφορές Ahmed NK, Atiya AF, GayarAn NE, El-Shishiny H (2010) An empirical comparison of machine learning models for time series forecasting. Econometric Reviews 29(5-6):594-621. doi:10.1080/07474938.2010.481556 Attali D (2016) ggextra: Add Marginal Histograms to 'ggplot2', and More 'ggplot2' Enhancements. R package version 0.5 Belayneh A, Adamowski J, Khalil B, Ozga-Zielinski B (2014) Long-term SPI drought forecasting in the Awash River Basin in Ethiopia using wavelet neural network and wavelet support vector regression models. Journal of Hydrology 508:418-429. doi:10.1016/j.jhydrol.2013.10.052 Cortez P (2010) Data Mining with Neural Networks and Support Vector Machines Using the R/rminer Tool. In: Perner P (eds) Advances in Data Mining. Applications and Theoretical Aspects. Springer Berlin Heidelberg, pp 572-583. doi:10.1007/978-3-642-14400-4_44 Cortez P (2015) rminer: Data Mining Classification and Regression Methods. R package version 1.4.1 Han D, Chan L, Zhu N (2007) Flood forecasting using support vector machines. Journal of Hydroinformatics 9(4):267-276. doi:10.2166/hydro.2007.027 Hyndman RJ (2016) forecast: Forecasting functions for time series and linear models. R package version 7.1 Hyndman RJ, Khandakar Y (2008) Automatic time series forecasting: the forecast package for R. Journal of Statistical Software 27(3):1-22. doi:10.18637/jss.v027.i03 24

Αναφορές Jain SK, Das A, Srivastava DK (1999) Application of ANN for reservoir inflow prediction and operation. Journal of Water Resources 125(5):263-271. doi:10.1061/(asce)0733-9496(1999)125:5(263) Khan MS, Coulibaly P (2006) Application of support vector machine in lake water level prediction. Journal of Hydrologic Engineering 11(3):199-205. doi:10.1061/(asce)1084-0699(2006)11:3(199) Kisi O (2004) River flow modeling using artificial neural networks. Journal of Hydrologic Engineering 9(1):60-63. doi:10.1061/(asce)1084-0699(2004)9:1(60) Koutsoyiannis D (2013) Hydrology and change. Hydrological Sciences Journal 58(6):1177-1197. doi:10.1080/02626667.2013.804626 Koutsoyiannis D, Yao H, Georgakakos A (2008) Medium-range flow prediction for the Nile: a comparison of stochastic and deterministic methods. Hydrological Sciences Journal 53(1). doi:10.1623/hysj.53.1.142 Krzysztofowicz R (2001) The case for probabilistic forecasting in hydrology. Journal of Hydrology 249(1-4):2-9. doi:10.1016/s0022-1694(01)00420-6 Lin JY, Cheng CT, Chau KW (2006) Using support vector machines for long-term discharge prediction. Hydrological Sciences Journal 51(4):599-612. doi:10.1623/hysj.51.4.599 Maechler M (2012) fracdiff: Fractionally differenced ARIMA aka ARFIMA(p,d,q) models. R package version 1.4-2 Maier HR, Dandy GC (2000) Neural networks for the prediction and forecasting of water resources variables: a review of modelling issues and applications. Environmental modelling & software 15(1):101-124. doi:10.1016/s1364-8152(99)00007-9 25

Αναφορές Millard SP (2013) EnvStats: An R Package for Environmental Statistics. In: Høst G (eds) Encyclopedia of Environmetrics. doi:10.1002/9780470057339.vae043.pub2 R Core Team (2016). R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. Available online at:https://www.r-project.org/ Raghavendra NS, Deka PC (2014) Support vector machine applications in the field of hydrology: a review. Applied soft computing 19:372-386. doi:10.1016/j.asoc.2014.02.002 Smith AK (2012) CombMSC: Combined Model Selection Criteria. R package version 1.4.2 Thissen U, Van Brakel R, De Weijer AP, Melssena WJ, Buydens LMC (2003) Using support vector machines for time series prediction. Chemometrics and Intelligent Laboratory Systems 69(1-2):35-49. doi:10.1016/s0169-7439(03)00111-4 Tyralis H (2016) HKprocess: Hurst-Kolmogorov Process. R package version 0.0-2 Wang WC, Chau KW, Cheng CT, Qiu L (2009) A comparison of performance of several artificial intelligence methods for forecasting monthly discharge time series. Journal of Hydrology 374(3-4):294-306. doi:10.1016/j.jhydrol.2009.06.019 Wickham H (2009) ggplot2: Elegant Graphics for Data Analysis. Springer-Verlag New York Yu X, Liong SY (2007) Forecasting of hydrologic time series with ridge regression in feature space. Journal of Hydrology 332(3-4):290-302. doi:10.1016/j.jhydrol.2006.07.003 Zambrano-Bigiarini M (2014) hydrogof: Goodness-of-fit functions for comparison of simulated and observed hydrological time series. R package version 0.3-8 26