ΜΕΤΕΩΡΟΛΟΓΙΚΕΣ ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ: ΕΦΑΡΜΟΓΕΣ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΚΑΙ ΕΠΙΔΡΑΣΗ ΤΗΣ ΔΙΑΜΟΡΦΩΣΗΣ ΤΗΣ ΕΙΣΟΔΟΥ ΣΤΗΝ ΑΠΟΔΟΣΗ ΤΟΥΣ

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "ΜΕΤΕΩΡΟΛΟΓΙΚΕΣ ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ: ΕΦΑΡΜΟΓΕΣ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΚΑΙ ΕΠΙΔΡΑΣΗ ΤΗΣ ΔΙΑΜΟΡΦΩΣΗΣ ΤΗΣ ΕΙΣΟΔΟΥ ΣΤΗΝ ΑΠΟΔΟΣΗ ΤΟΥΣ"

Transcript

1 ΜΕΤΕΩΡΟΛΟΓΙΚΕΣ ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ: ΕΦΑΡΜΟΓΕΣ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΚΑΙ ΕΠΙΔΡΑΣΗ ΤΗΣ ΔΙΑΜΟΡΦΩΣΗΣ ΤΗΣ ΕΙΣΟΔΟΥ ΣΤΗΝ ΑΠΟΔΟΣΗ ΤΟΥΣ ΕΥΑΓΓΕΛΟΣ ΤΣΑΓΚΑΛΙΔΗΣ ΔΙΔΑΚΤΟΡΙΚΗ ΔΙΑΤΡΙΒΗ Επιβλέπων Καθηγητής: Γεώργιος Ευαγγελίδης, Αναπληρωτής Καθηγητής Μέλη τριμελούς Συμβουλευτικής Επιτροπής: Μαρία Σατρατζέμη, Καθηγήτρια Δημήτριος Δέρβος, Καθηγητής Τμήμα Εφαρμοσμένης Πληροφορικής Πανεπιστήμιο Μακεδονίας Θεσσαλονίκη Νοέμβριος 2011

2 2011, Ευάγγελος Τσαγκαλίδης Η έγκριση της μεταπτυχιακής εργασίας από το Τμήμα Εφαρμοσμένης Πληροφορικής του Πανεπιστημίου Μακεδονίας δεν υποδηλώνει απαραιτήτως και αποδοχή των απόψεων του συγγραφέα εκ μέρους του Τμήματος (Ν.5343/32 αρ.202 παρ.2). II

3 ΠΕΡΙΛΗΨΗ Τα συστήματα βάσεων δεδομένων αναπτύχθηκαν για τη συλλογή, αποθήκευση, οργάνωση και διαχείριση δεδομένων. Από τις βάσεις δεδομένων γίνεται ανάκληση δεδομένων και πληροφοριών μέσω γνωστών και σαφώς διατυπωμένων ερωτημάτων και επιπλέον ανακάλυψη πληροφοριών με την εφαρμογή τεχνικών Εξόρυξης Πληροφορίας. Το ερώτημα για την ανακάλυψη πληροφοριών προς το σύστημα διαχείρισης της βάσης δεδομένων δεν είναι αρχικά γνωστό, όπως στην περίπτωση της ανάκλησης, αλλά είναι το αποτέλεσμα της διερεύνησης που προκαλείται με τη διατύπωση μιας υπόθεσης ή μιας δήλωσης. Στην παρούσα διατριβή σχεδιάζεται αρχικά μια μετεωρολογική βάση δεδομένων από την οποία εξάγονται δεδομένα προορισμού τόσο για εφαρμογές Εξόρυξης Πληροφορίας όσο για τη διεξαγωγή ερευνητικού έργου με χρήση τροποποιημένης διαδικασίας Ανακάλυψης Γνώσης σε Βάσεις Δεδομένων. Οι εφαρμογές Εξόρυξης Πληροφορίας που αφορούν τα επιχειρησιακά δεδομένα του Εθνικού Προγράμματος Χαλαζικής Προστασίας του Οργανισμού Ελληνικών Γεωργικών Ασφαλίσεων είναι η Εκτίμηση της κλάσης χαλαζιού, η Πρόβλεψη μεγίστου μεγέθους χαλαζιού, η Πρόβλεψη των τιμών των παραμέτρων σποράς του Εθνικού Προγράμματος Χαλαζικής Προστασίας και ο Προσδιορισμός του Παρατηρούμενου Δείκτη Κατηγορίας Σωρειτόμορφης Ημέρας (Convective Day Category). Η διαδικασία της Ανακάλυψης Γνώσης ή Εξόρυξης Πληροφορίας από τη μετεωρολογική βάση δεδομένων χρησιμοποιείται για τη διεξαγωγή ερευνητικού έργου τροποποιώντας κατάλληλα το μοντέλο CRISP-DM. Το αντικείμενο της εφαρμογής αυτής είναι η δημιουργία ενός ή περισσότερων μοντέλων Εξόρυξης Πληροφορίας για τον προσδιορισμό της καταγραφής ή μη υετού σε ένα σημείο επί του εδάφους, χρησιμοποιώντας δεδομένα ενός Μετεωρολογικού Σταθμού της Εθνικής Μετεωρολογικής Υπηρεσίας και του συνόλου ERA-40 του Ευρωπαϊκού Κέντρου Μεσοπρόθεσμων Προγνώσεων Καιρού (ECMWF). Στα πλαίσια του ερευνητικού έργου διατυπώνονται διαφορετικά σενάρια και στρατηγικές επιλογής ή μετασχηματισμού των δεδομένων εισόδου σε τεχνικές Εξόρυξης Πληροφορίας, τα οποία βασίζονται κυρίως στην εμπειρική γνώση του πεδίου των δεδομένων και έχουν κατεύθυνση την εξέταση θεμάτων που δύνανται να επηρεάσουν την απόδοση πέντε αλγορίθμων κατηγοριοποίησης. Ειδικότερα, μελετάται η επίδραση του μεγέθους του συνόλου δεδομένων εκπαίδευσης στην απόδοση των αλγορίθμων και προσδιορίζεται η τιμή του ελαχίστου μεγέθους με την οποία εξασφαλίζεται η μέγιστη απόδοση κάθε αλγορίθμου. Ακόμη, εξετάζοντας δύο διαφορετικά σενάρια σχηματισμού των δεδομένων εκπαίδευσης αποδεικνύεται ότι η απόδοση των αλγορίθμων είναι ανεξάρτητη από την επιλογή είτε τυχαίων στιγμιότυπων είτε όλων των στιγμιότυπων τυχαία επιλεγόμενων ετών. Επίσης, εξετάζοντας τρία διαφορετικά σενάρια που σχετίζονται με το μετασχηματισμό των ανεξάρτητων μεταβλητών ή χαρακτηριστικών εισόδου, βασιζόμενοι στην κοινή πρακτική των επιχειρησιακών μετεωρολόγων, οι οποίοι συνηθίζουν να εξετάζουν τις μεταβολές των μετεωρολογικών παραμέτρων κατά τη διαδικασία πρόγνωσης του καιρού σε μια περιοχή, τα αποτελέσματα στην απόδοση III

4 των αλγορίθμων κατηγοριοποίησης είναι καλύτερα στην περίπτωση που χρησιμοποιούνται οι κανονικές τιμές των παραμέτρων παρά οι μεταβολές. Σημειώνεται ότι τα τρία αυτά σενάρια εξετάζονται τόσο για τη φυσική κατανομή των δεδομένων ως προς την εξαρτημένη μεταβλητή όσο για την ισόρροπη κατανομή με χρήση της μεθόδου της τυχαίας υπο-δειγματοληψίας. Η κλάση υετού του χρησιμοποιούμενου συνόλου δεδομένων εμπίπτει στην περίπτωση του ζητήματος της Ασύμμετρης Κλάσης, η αντιμετώπιση του οποίου επιχειρείται με την εφαρμογή τεχνικών διαφόρων μεθόδων. Ειδικότερα, εφαρμόζονται εννέα τεχνικές της μεθόδου της Αναθεωρημένης Δειγματοληψίας (Resampling), πέραν της δειγματοληψίας με τη φυσική κατανομή, τόσο από τη βιβλιογραφία όσο νέων προτεινόμενων που βασίζονται στην εμπειρία στο πεδίο των μετεωρολογικών δεδομένων. Επίσης, εφαρμόζεται η μέθοδος boosting AdaBoost M1 για τη βελτίωση της απόδοσης των αλγορίθμων κατηγοριοποίησης. Τα αποτελέσματα έδειξαν ότι μόνο η απόδοση ενός αλγόριθμου δεν επηρεάστηκε από την εφαρμογή αυτών των τεχνικών σε σχέση με τη φυσική κατανομή. Αντίθετα, η απόδοση των υπολοίπων τεσσάρων βελτιώθηκε σημαντικά, ιδιαίτερα με τη χρήση μιας νέας προτεινόμενης τεχνικής που βασίζεται στην εμπειρία στο πεδίο των μετεωρολογικών δεδομένων. IV

5 ΕΥΧΑΡΙΣΤΙΕΣ Με την ολοκλήρωση της διατριβής θα ήθελα να ευχαριστήσω θερμά όλους όσους συνέβαλαν σε αυτή την προσπάθεια. Τον επιβλέποντα Αναπληρωτή Καθηγητή κ. Γεώργιο Ευαγγελίδη για την καθοδήγηση, τη βοήθεια και το χρόνο που αφιέρωσε, δίνοντάς μου την ευκαιρία να περιηγηθώ στην ανακάλυψη γνώσης σε βάσεις δεδομένων και να συντάξω την παρούσα διατριβή. Η συνεργασία μαζί του ήταν εποικοδομητική και εξαιρετικά ευχάριστη. Τα άλλα δύο μέλη της τριμελούς επιτροπής, την Καθηγήτρια κα Μαρία Σατρατζέμη και τον Καθηγητή κ. Δημήτριο Δέρβο για τη συμβολή τους. Τον Καθηγητή κ. Δημήτριο Παπαναστασίου, η βοήθεια του οποίου σε ένα κομβικό σημείο της ερευνητικής προσπάθειας, υπήρξε καθοριστική για τη συνέχεια. Τον Διδάκτορα κ. Λεωνίδα Καραμητόπουλο που συνέβαλε κι αυτός με τις ιδέες και τις παρατηρήσεις του. Τέλος, τον Οργανισμό Ελληνικών Γεωργικών Ασφαλίσεων (ΕΛΓΑ), όπου εργάζομαι ως Μετεωρολόγος και ενίοτε ως Πληροφορικός, καθώς επίσης την Εθνική Μετεωρολογική Υπηρεσία (ΕΜΥ) και το Ευρωπαϊκό Κέντρο Μεσοπρόθεσμων Προγνώσεων Καιρού (ECMWF) για την παροχή μετεωρολογικών δεδομένων (συμβάσεις 40/2007 και 23/2008 μεταξύ Πανεπιστημίου Μακεδονίας και ΕΜΥ). V

6 VI

7 ΠΕΡΙΕΧΟΜΕΝΑ 1. ΕΙΣΑΓΩΓΗ Ανακάλυψη Γνώσης σε Βάσεις Δεδομένων-Εξόρυξη Πληροφορίας Σχεδιασμός και ανάπτυξη εφαρμογής Μετεωρολογικής Βάσης Δεδομένων Εφαρμογές Εξόρυξης Πληροφορίας Διεξαγωγή ερευνητικού έργου Δημιουργία συνόλου δεδομένων προορισμού Επιλογή του συνόλου δεδομένων εκπαίδευσης Σενάρια μετασχηματισμού των δεδομένων εισόδου Ασύμμετρη κλάση Ερευνητικό κίνητρο Περιγραφή της διατριβής ΑΝΑΚΑΛΥΨΗ ΓΝΩΣΗΣ ΣΕ ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ - ΕΞΟΡΥΞΗ ΠΛΗΡΟΦΟΡΙΑΣ Επιστημονική μέθοδος Ανακάλυψη Γνώσης σε Βάσεις Δεδομένων Cross Industry Standard Process for Data Mining (CRISP-DM) Εξόρυξη Πληροφορίας Καθοδηγούμενη Εκμάθηση (Supervised Learning) Αλγόριθμοι Κατηγοριοποίησης Μη Καθοδηγούμενη Εκμάθηση Αλγόριθμος K-Means Κανόνες Συσχετισμού (Association Rules) Αλγόριθμος Apriori ΣΧΕΔΙΑΣΜΟΣ ΚΑΙ ΑΝΑΠΤΥΞΗ ΜΕΤΕΩΡΟΛΟΓΙΚΗΣ ΒΑΣΗΣ ΔΕΔΟΜΕΝΩΝ Οργανισμός Ελληνικών Γεωργικών Ασφαλίσεων - Εθνικό Πρόγραμμα Χαλαζικής Προστασίας Οργανισμός Ελληνικών Γεωργικών Ασφαλίσεων (ΕΛ.Γ.Α.) Εθνικό Πρόγραμμα Χαλαζικής Προστασίας (Ε.Π.Χ.Π.) Ανάπτυξη Εφαρμογής Βάσης Δεδομένων Μοντελοποίηση των επιχειρησιακών δεδομένων (Enterprise Data Modeling) Εννοιολογικό μοντέλο της Βάσης Δεδομένων (Conceptual model) Λογικός Σχεδιασμός της Βάσης Δεδομένων (Logical model) Φυσικός σχεδιασμός και δημιουργία της Βάσης Δεδομένων Σύστημα εφαρμογής Ανακάλυψης Γνώσης ΕΦΑΡΜΟΓΕΣ ΑΝΑΚΑΛΥΨΗΣ ΓΝΩΣΗΣ ΣΤΗ ΜΕΤΕΩΡΟΛΟΓΙΚΗ ΒΑΣΗ ΔΕΔΟΜΕΝΩΝ Κατηγοριοποίηση του μεγίστου μεγέθους χαλαζιού Αντικείμενο Δεδομένα προορισμού Μετασχηματισμός δεδομένων Σχέσεις των ανεξάρτητων μεταβλητών με την εξηρτημένη κλάση Εφαρμογή τεχνικών Εξόρυξης Πληροφορίας - Αξιολόγηση Συμπεράσματα Πρόβλεψη μεγίστου μεγέθους χαλαζιού Αντικείμενο VII

8 Δεδομένα προορισμού Μετασχηματισμός δεδομένων Μετασχηματισμός δεδομένων - Μείωση διαστάσεων δεδομένων εισόδου Σχέσεις των ανεξάρτητων μεταβλητών με την εξαρτημένη κλάση Εφαρμογή τεχνικής Καθοδηγούμενης Εκμάθησης - Αξιολόγηση Συμπεράσματα - Δράσεις Πρόβλεψη των τιμών των παραμέτρων σποράς του Εθνικού Προγράμματος Χαλαζικής Προστασίας Αντικείμενο Δεδομένα προορισμού - Μετασχηματισμός δεδομένων Εφαρμογή τεχνικών Εξόρυξης Πληροφορίας - Αξιολόγηση Συμπεράσματα - Δράσεις Προσδιορισμός του Παρατηρούμενου Δείκτη Κατηγορίας Σωρειτόμορφης Ημέρας (Convective Day Category, CDC) Αντικείμενο Δεδομένα προορισμού Μετασχηματισμός δεδομένων Εφαρμογή τεχνικής Εξόρυξης Πληροφορίας - Αξιολόγηση Συμπεράσματα - Δράσεις ΣΧΕΔΙΑΣΜΟΣ ΕΡΕΥΝΗΤΙΚΟΥ ΕΡΓΟΥ Προτεινόμενη διαδικασία Ανακάλυψης Γνώσης από Βάσεις Δεδομένων Σύνολο δεδομένων Αντικείμενο της εφαρμογής Ανακάλυψης Γνώσης Μετεωρολογία - Μέθοδοι πρόγνωσης καιρού Διατύπωση σεναρίων και στρατηγικών επιλογής ή μετασχηματισμού των δεδομένων Προετοιμασία δεδομένων Επιλογή τυχαίων δειγμάτων Αλγόριθμοι Εξόρυξης Πληροφορίας - Μοντελοποίηση Αξιολόγηση μοντέλων Σύγκριση σεναρίων και στρατηγικών ΔΗΜΙΟΥΡΓΙΑ ΣΥΝΟΛΟΥ ΔΕΔΟΜΕΝΩΝ ΠΡΟΟΡΙΣΜΟΥ Δεδομένα υετού μετεωρολογικού σταθμού - Επεξεργασία και μετασχηματισμός Σύνολο δεδομένων ERA Επιλογή δείγματος δεδομένων από το σύνολο δεδομένων ERA Επεξεργασία και μετασχηματισμός των δεδομένων ERA Επιλογή Χαρακτηριστικών Ανάλυση Κύριων Συνιστωσών Σύνολο δεδομένων προορισμού ΕΠΙΔΡΑΣΗ ΤΗΣ ΕΠΙΛΟΓΗΣ ΤΟΥ ΣΥΝΟΛΟΥ ΔΕΔΟΜΕΝΩΝ ΕΚΠΑΙΔΕΥΣΗΣ ΣΤΗΝ ΕΞΟΡΥΞΗ ΠΛΗΡΟΦΟΡΙΑΣ ΣΕ ΜΕΤΕΩΡΟΛΟΓΙΚΕΣ ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ Αντικείμενο μελέτης Σύνολα δεδομένων Εκπαίδευσης και Ελέγχου Ανάλυση Εκτέλεση αλγορίθμων - Μοντελοποίηση Αξιολόγηση Συγκρίσεις Συμπεράσματα ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΣ ΔΕΔΟΜΕΝΩΝ ΕΙΣΟΔΟΥ ΣΕ ΤΕΧΝΙΚΕΣ ΕΞΟΡΥΞΗΣ ΜΕΤΕΩΡΟΛΟΓΙΚΗΣ ΠΛΗΡΟΦΟΡΙΑΣ Αντικείμενο μελέτης Σύνολα δεδομένων Εκπαίδευσης και Ελέγχου Σενάρια μετασχηματισμού των συνόλων δεδομένων εκπαίδευσης Ασύμμετρη Κλάση Δημιουργία συνόλων δεδομένων Εκπαίδευσης και Ελέγχου Ανάλυση VIII

9 Εκτέλεση αλγορίθμων - Μοντελοποίηση Αξιολόγηση Συγκρίσεις Συμπεράσματα ΑΣΥΜΜΕΤΡΗ ΚΛΑΣΗ Το πρόβλημα της Ασύμμετρης Κλάσης Μέθοδοι αντιμετώπισης της Ασύμμετρης Κλάσης Μέθοδος Αναθεωρημένης Δειγματοληψίας Μέθοδος boosting Μέθοδος Εκμάθησης με Ευαισθησία Κόστους Μέθοδος Αναθεωρημένης Δειγματοληψίας Τεχνικές Αναθεωρημένης Δειγματοληψίας Σύνολα δεδομένων Εκπαίδευσης και Ελέγχου Εκτέλεση αλγορίθμων - Μοντελοποίηση Αξιολόγηση Συγκρίσεις Συμπεράσματα εφαρμογής τεχνικών Αναθεωρημένης Δειγματοληψίας Μέθοδος boosting Μοντελοποίηση και αξιολόγηση Συγκρίσεις Συμπεράσματα εφαρμογής της μεθόδου boosting Συμπεράσματα ΑΠΟΤΕΛΕΣΜΑΤΑ - ΣΥΜΠΕΡΑΣΜΑΤΑ Σχεδιασμός και ανάπτυξη Εφαρμογής Βάσης Δεδομένων Εφαρμογές Εξόρυξης Πληροφορίας Κατηγοριοποίηση του μεγίστου μεγέθους χαλαζιού Πρόβλεψη μεγίστου μεγέθους χαλαζιού Πρόβλεψη των τιμών των παραμέτρων σποράς του Εθνικού Προγράμματος Χαλαζικής Προστασίας Προσδιορισμός του Παρατηρούμενου Δείκτη Κατηγορίας Σωρειτόμορφης Ημέρας (Convective Day Category, CDC) Διεξαγωγή ερευνητικού έργου Δημιουργία συνόλου δεδομένων προορισμού Επιλογή του συνόλου δεδομένων εκπαίδευσης Σενάρια μετασχηματισμού των δεδομένων εισόδου Ασύμμετρη κλάση Σχολιασμός Μελλοντικές επεκτάσεις Συνεισφορά της διατριβής ΒΙΒΛΙΟΓΡΑΦΙΑ ΠΑΡΑΡΤΗΜΑ Ι. Χαρακτηριστικά των Σχέσεων της Βάσης Δεδομένων ΙΙ. Δημιουργία Πινάκων που απαρτίζουν τη Σχεσιακή Βάση Δεδομένων με SQL (Structure Query Language) ΙΙΙ. Θηκογράμματα (Box plots) ανά έτος, των τιμών μετεωρολογικών παραμέτρων 129 IX

10 ΛΙΣΤΑ ΠΙΝΑΚΩΝ Πίνακας 2.1: Καθοδηγούμενη Εκμάθηση σε μετεωρολογικά δεδομένα Πίνακας 2.2: Σύνολο μετεωρολογικών δεδομένων για εφαρμογή Κανόνων Συσχετισμού Πίνακας 2.3: Αποτελέσματα εφαρμογής του αλγόριθμου Apriori σε σύνολο μετεωρολογικών δεδομένων Πίνακας 4.1: Δείγμα των δεδομένων προορισμού Πίνακας 4.2: Μέση τιμή (Mean), τυπική απόκλιση (St. dev.), ελάχιστη (Min.) και μέγιστη τιμή (Max.) των μεταβλητών Reflectivity, Cloud top, VIL, VIL Density και Mean temperature Πίνακας 4.3: Κατανομή της μεταβλητής Type Πίνακας 4.4: Κατανομή της μεταβλητής Month Πίνακας 4.5: Κατανομή της μεταβλητής WBZ Πίνακας 4.6: Κατανομή της μεταβλητής Hail Πίνακας 4.7: Ακρίβεια για διαφορετικά υποσύνολα μεταβλητών εισόδου Πίνακας 4.8: Πίνακας Ενδεχομένων των κλάσεων της μεταβλητής εξόδου Hail του αλγόριθμου Naïve Bayes με μεταβλητές εισόδου τις Cloud_top και Reflectivity Πίνακας 4.9: Πίνακας Ενδεχομένων των κλάσεων της μεταβλητής εξόδου Hail του αλγόριθμου C4.5 με μεταβλητές εισόδου τις Cloud_top, Reflectivity, WBZ και Mean_temperature Πίνακας 4.10: Μέση τιμή (Mean), τυπική απόκλιση (St. dev.), ελάχιστη (Min.) και μέγιστη τιμή (Max.) της μεταβλητής Hail size Πίνακας 4.11: Πίνακας Περιστρεφόμενων Συνιστωσών της Ανάλυσης Κύριων Συνιστωσών Πίνακας 4.12: Συντελεστές Παλινδρόμησης (α) Πίνακας 4.13: Συντελεστές Παλινδρόμησης (β) Πίνακας 4.14: ANOVA της Παλινδρόμησης (α) Πίνακας 4.15: ANOVA της Παλινδρόμησης (β) Πίνακας 4.16: Συντελεστές Παλινδρόμησης Πίνακας 4.17: Στατιστικά στοιχεία των χαρακτηριστικών χαλαζοκαταιγίδας Πίνακας 4.18: Κατηγορίες των χαρακτηριστικών χαλαζοκαταιγίδων Πίνακας 4.19: Στατιστικά στοιχεία των παραμέτρων σποράς Πίνακας 4.20: Κατηγορίες των παραμέτρων σποράς Πίνακας 4.21: Πρόβλεψη των τιμών παραμέτρων σποράς από τα χαρακτηριστικά των χαλαζοκαταιγίδων Πίνακας 4.22: Προσδιορισμός του τύπου της χαλαζοκαταιγίδας από τις τιμές των παραμέτρων σποράς Πίνακας 4.23: Προσδιορισμός του απαιτούμενου χρόνου σποράς από τις τιμές των παραμέτρων που εκφράζουν την πραγματοποιούμενη σπορά Πίνακας 4.24: Τιμές Δείκτη CDC Ελληνικού Εθνικού Προγράμματος Χαλαζικής Προστασίας Πίνακας 4.25: Τιμές της μεταβλητής εισόδου Hailsr Πίνακας 4.26: Τιμές της μεταβλητής εισόδου Reflectivity Πίνακας 4.27: Τιμές της μεταβλητής εισόδου Ppirhi Πίνακας 4.28: Τιμές της μεταβλητής εισόδου Cloud_top Πίνακας 4.29: Πίνακας Ενδεχομένων των κλάσεων της μεταβλητής εξόδου CDC X

11 Πίνακας 6.1: Κατανομή των καιρικών φαινομένων και της καταγραφής υετού στο έδαφος Πίνακας 6.2: Κατανομή των καιρικών φαινομένων χωρίς την καταγραφή υετού στο έδαφος Πίνακας 6.3: Πίνακας συνιστωσών με τα φορτία και με εφαρμογή της περιστροφής 75 Πίνακας 6.4: Διακύμανση που ερμηνεύεται από τις κύριες συνιστώσες με περιστροφή και οι αντιπροσωπευτικές μεταβλητές του συνόλου δεδομένων ERA Πίνακας 7.1: Μεγέθη συνόλων δεδομένων Εκπαίδευσης και Ελέγχου των στρατηγικών των Ετών και των Στιγμιότυπων Πίνακας 7.2: Μέση τιμή και τυπική απόκλιση της μετρικής AUC, της στρατηγικής των Ετών για κάθε αλγόριθμο και μέγεθος των δεδομένων Εκπαίδευσης Πίνακας 7.3: Μέση τιμή και τυπική απόκλιση της μετρικής AUC της στρατηγικής των Στιγμιότυπων για κάθε αλγόριθμο και μέγεθος των δεδομένων Εκπαίδευσης Πίνακας 8.1: Μέση τιμή και τυπική απόκλιση της μετρικής AUC για τη Φυσική Κατανομή του συνόλου δεδομένων Εκπαίδευσης Πίνακας 8.2: Μέση τιμή και τυπική απόκλιση της μετρικής AUC για την Ισόρροπη Κατανομή του συνόλου δεδομένων Εκπαίδευσης Πίνακας 9.1: Αριθμός στιγμιότυπων που ανήκουν στη θετική κλάση, στην αρνητική κλάση και το σύνολό τους για το αρχικό σύνολο δεδομένων, τις ομάδες, τα υποσύνολα και τις εφαρμοζόμενες τεχνικές, καθώς επίσης και το αντίστοιχο εκατοστιαίο ποσοστό ως προς το αρχικό σύνολο δεδομένων Πίνακας 9.2: Αριθμός στιγμιότυπων που ανήκουν στις συστάδες Βροχή, Χιόνι και Καταιγίδα της θετικής κλάσης και το συνολικό τους αριθμό για το αρχικό σύνολο δεδομένων, τις ομάδες, τα υποσύνολα και τις εφαρμοζόμενες τεχνικές, καθώς επίσης και τα αντίστοιχα εκατοστιαία ποσοστά ως προς το αρχικό σύνολο δεδομένων και ως προς το σύνολο δεδομένων της θετικής κλάσης Πίνακας 9.3: Αριθμός στιγμιότυπων που ανήκουν στις συστάδες Ομίχλης και Μη σημαντικού φαινομένου της αρνητικής κλάσης και το συνολικό τους αριθμό για το αρχικό σύνολο δεδομένων, τις ομάδες, τα υποσύνολα και τις εφαρμοζόμενες τεχνικές, καθώς επίσης και τα αντίστοιχα εκατοστιαία ποσοστά ως προς το αρχικό σύνολο δεδομένων και ως προς το σύνολο δεδομένων της αρνητικής κλάσης Πίνακας 9.4: Μέση Τιμή και Τυπική Απόκλιση της μετρικής AUC για κάθε τεχνική και αλγόριθμο Πίνακας 9.5: Μέση Τιμή και Τυπική Απόκλιση της μετρικής AUC για κάθε τεχνική και αλγόριθμο XI

12 ΛΙΣΤΑ ΕΙΚΟΝΩΝ Εικόνα 2.1: Μοντέλο επτά βημάτων της διαδικασίας Ανακάλυψης Γνώσης σε Βάσεις Δεδομένων (Roiger and Geatz, 2003)... 9 Εικόνα 2.2: Το μοντέλο CRISP-DM της διαδικασίας Ανακάλυψης Γνώσης σε Βάσεις Δεδομένων (Chapman et al., 2000) Εικόνα 2.3: Νευρώνας (Perceptron) Εικόνα 2.4: Παράδειγμα Νευρωνικού Δικτύου με τροφοδότηση προς τα εμπρός Εικόνα 3.1: Περιοχές εφαρμογής του Ε.Π.Χ.Π Εικόνα 3.2: Αεροσκάφη Προγραμμάτων Τροποποίησης Καιρού (Website of Atmospherics Inc.) Εικόνα 3.3: Κατακόρυφη τομή καταιγίδας, δημιουργία χαλαζοκόκκων (Website of Weather Modification Inc.) Εικόνα 3.4: Εικόνα αρχείου του καταγραφικού συστήματος ΤΙΤΑΝ του μετεωρολογικού Radar S-band του αεροδρομίου Μακεδονία Εικόνα 3.5: Διάγραμμα Οντοτήτων Σχέσεων Εικόνα 3.6 : Λογικό Σχήμα Σχεσιακής Βάσης Δεδομένων Εικόνα 3.7 : Διάγραμμα Συστήματος εφαρμογής Ανακάλυψης Γνώσης Εικόνα 4.1: Δέντρο Απόφασης δημιουργημένο με τον αλγόριθμο C Εικόνα 4.2: Δέντρο Απόφασης δημιουργημένο με τον αλγόριθμο C Εικόνα 5.1: Διεξαγωγή ερευνητικού έργου σύμφωνα με το τροποποιημένο μοντέλο CRISP-DM Εικόνα 6.1: Απεικόνιση (scree plot) των τιμών των ιδιοτιμών των συνιστωσών Εικόνα 7.1: Θηκογράμματα (box plots) των τιμών της μετρικής AUC για κάθε στρατηγική, μέγεθος συνόλων δεδομένων Εκπαίδευσης και αλγόριθμο Εικόνα 8.1: Θηκογράμματα (box plots) των τιμών της μετρικής AUC για κάθε αλγόριθμο, σύνολο δεδομένων και κατανομή Εικόνα 9.1: Θηκογράμματα (box plots) των τιμών της μετρικής AUC για κάθε αλγόριθμο και ομάδα-1 τεχνικών αντιμετώπισης της Ασύμμετρης Κλάσης Εικόνα 9.2: Θηκογράμματα (box plots) των τιμών της μετρικής AUC για κάθε αλγόριθμο και ομάδα-2 τεχνικών αντιμετώπισης της Ασύμμετρης Κλάσης Εικόνα 9.3: Θηκογράμματα (box plots) των τιμών της μετρικής AUC για κάθε αλγόριθμο και τεχνική XII

13 ΚΕΦΑΛΑΙΟ 1 ΕΙΣΑΓΩΓΗ Αντικείμενο της παρούσας διατριβής είναι ο σχεδιασμός και η ανάπτυξη μιας μετεωρολογικής βάσης δεδομένων που αφορά τα δεδομένα πραγματικής Επιχείρησης ή Οργανισμού, από την οποία εξάγονται δεδομένα προορισμού για την εφαρμογή Εξόρυξης Πληροφορίας και κυρίως για τη διεξαγωγή ερευνητικού έργου που σχετίζεται με την επίδραση της επιλογής των συνόλων εκπαίδευσης στην απόδοση αλγόριθμων Εξόρυξης Πληροφορίας. Σκοπός είναι η οργάνωση και διαχείριση επιχειρησιακών δεδομένων σε σχεσιακή βάση δεδομένων, η εξέταση της δυνατότητας εξαγωγής πληροφοριών με εφαρμογή τεχνικών Εξόρυξης Πληροφορίας και η αξιοποίησή τους επιχειρησιακά με την ανάπτυξη των κατάλληλων εφαρμογών. Επίσης, η διεξαγωγή ερευνητικού έργου με χρήση τροποποιημένης διαδικασίας Ανακάλυψης Γνώσης σε Μετεωρολογικές Βάσεις Δεδομένων. Ειδικότερα, εξετάζονται και συγκρίνονται μεταξύ τους, διαφορετικά σενάρια και στρατηγικές επιλογής ή μετασχηματισμού των δεδομένων εισόδου σε τεχνικές Εξόρυξης Πληροφορίας, εξετάζοντας θέματα που δύνανται να επηρεάσουν την απόδοσή τους. Χρησιμοποιούνται μέθοδοι και τεχνικές γνωστές από τη βιβλιογραφία, αλλά επιπλέον και αυτό αποτελεί το κίνητρο για τη μελέτη και τη συμβολή αυτής της διατριβής, προτείνονται νέες στρατηγικές, οι οποίες βασίζονται στην εμπειρική γνώση του πεδίου των μετεωρολογικών δεδομένων. 1.1 Ανακάλυψη Γνώσης σε Βάσεις Δεδομένων-Εξόρυξη Πληροφορίας Η Ανακάλυψη Γνώσης σε Βάσεις Δεδομένων (KDD) είναι η αλληλεπιδραστική, επαναληπτική διαδικασία η οποία επιχειρεί να εξάγει ανεκδήλωτες, μέχρι τότε άγνωστες και πιθανό χρήσιμες γνώσεις από τα δεδομένα. Η Ανακάλυψη Γνώσης σε Βάσεις Δεδομένων περιγράφεται ως η εφαρμογή της Επιστημονικής Μεθόδου στην Εξόρυξη Πληροφορίας. Εξόρυξη Πληροφορίας (Data Mining) είναι η αυτόματη ανάλυση και εξαγωγή γνώσης από τα δεδομένα μιας Βάσης Δεδομένων με εφαρμογή μιας ή περισσοτέρων τεχνικών μηχανικής εκμάθησης. Ειδικότερα, ο σκοπός είναι ο προσδιορισμός και αναγνώριση τάσεων και προτύπων μορφών (patterns) στα δεδομένα. Η γνώση που αποκτάται από την εφαρμογή της Εξόρυξης Πληροφορίας αποδίδεται ως ένα μοντέλο ή μια γενίκευση των δεδομένων. Υπάρχουν πολλές τεχνικές Εξόρυξης Πληροφορίας, όλες όμως χρησιμοποιούν την επαγωγική εκμάθηση. Η επαγωγική εκμάθηση είναι η διαδικασία, όπου με την παρατήρηση εξειδικευμένων παραδειγμάτων εννοιών που αποτελούν το αντικείμενο εκμάθησης, επιχειρείται ο ορισμός γενικευμένων εννοιών. Στην Καθοδηγούμενη εκμάθηση χρησιμοποιείται ένα σύνολο δεδομένων με παραδείγματα της έννοιας που θα υποβληθεί σε εκμάθηση. Κάθε παράδειγμα αποτελείται από τις τιμές των χαρακτηριστικών εισόδου ή των ανεξάρτητων 1

14 μεταβλητών, οι οποίες έχουν επιλεγεί από τον αναλυτή ως ικανές για τον προσδιορισμό της τιμής του τελευταίου χαρακτηριστικού που είναι γνωστό ως η κλάση ή το χαρακτηριστικό εξόδου ή η εξαρτημένη μεταβλητή και αποτελεί την έννοια προς εκμάθηση. Με την κατασκευή ενός μοντέλου με το οποίο επιχειρείται η γενίκευση των δεδομένων, είναι δυνατή η απόδοση μιας τιμής στην εξαρτημένη μεταβλητή όταν εισάγονται οι τιμές των ανεξάρτητων μεταβλητών. Με τον τρόπο αυτό γίνεται κατηγοριοποίηση κατηγορικών μεταβλητών και εκτίμηση ποσοτικών, ενώ όταν η κατηγοριοποίηση ή η εκτίμηση αφορά, σύμφωνα με τη φύση των δεδομένων, την τιμή της εξαρτημένης μεταβλητής στο μέλλον, τότε γίνεται πρόβλεψη. Η Μη καθοδηγούμενη εκμάθηση σε αντίθεση με την Καθοδηγούμενη εκμάθηση χρησιμοποιείται για τη δημιουργία μοντέλων γενίκευσης δεδομένων χωρίς την προηγούμενη ύπαρξη κλάσεων. Στιγμιότυπα δεδομένων ομαδοποιούνται σε συστάδες (clusters) σύμφωνα με το κριτήριο ομοιότητας που χρησιμοποιεί κάθε αλγόριθμος συσταδοποίησης, η ερμηνεία των οποίων (συστάδων) είναι υπόθεση του αναλυτή. Οι Κανόνες Συσχετισμού είναι η στρατηγική Εξόρυξης Πληροφορίας με την εφαρμογή της οποίας, ανακαλύπτονται ενδιαφέρουσες συσχετίσεις μεταξύ διαφορετικών στοιχείων ενός συνόλου δεδομένων. Οι Κανόνες Συσχετισμού παρουσιάζουν τις συνθήκες των τιμών εκείνων των χαρακτηριστικών ενός συνόλου δεδομένων, οι οποίες συμβαίνουν συχνά, μαζί σε αυτά τα χαρακτηριστικά. Η μορφή των πληροφοριών που παρουσιάζουν είναι «εάν Χ τότε Υ» ή «Χ => Υ» και αντίθετα με τους κανόνες λογικής «εάν τότε» η φύση τους σχετίζεται με τις πιθανότητες εμφάνισης. 1.2 Σχεδιασμός και ανάπτυξη εφαρμογής Μετεωρολογικής Βάσης Δεδομένων Η Βάση Δεδομένων είναι μια συλλογή δεδομένων που σχετίζεται με μια Επιχείρηση ή Οργανισμό. Στην παρούσα διατριβή σχεδιάζεται η Εφαρμογή Σχεσιακής Βάσης Δεδομένων με τη μοντελοποίηση των επιχειρησιακών και μετεωρολογικών δεδομένων του Κέντρου Μετεωρολογικών Εφαρμογών (ΚΕ.Μ.Ε.) του Οργανισμού Ελληνικών Γεωργικών Ασφαλίσεων (ΕΛ.Γ.Α.), καθώς και μετεωρολογικών δεδομένων από Μετεωρολογικούς Σταθμούς της Εθνικής Μετεωρολογικής Υπηρεσίας (Ε.Μ.Υ.) και το Ευρωπαϊκό Κέντρο Μεσοπρόθεσμων Προγνώσεων Καιρού (ECMWF) και στη συνέχεια με την ανάπτυξη του εννοιολογικού και λογικού μοντέλου της Βάσης. Κατόπιν, υλοποιείται το φυσικό σχήμα της Βάσης και αναπτύσσεται η Εφαρμογή της Βάσης Δεδομένων από την οποία εξάγονται δεδομένα προορισμού τόσο για εφαρμογές Εξόρυξης Πληροφορίας όσο για τη διεξαγωγή ερευνητικού έργου με χρήση τροποποιημένης διαδικασίας Ανακάλυψης Γνώσης σε Βάσεις Δεδομένων. 1.3 Εφαρμογές Εξόρυξης Πληροφορίας Η μετεωρολογική βάση δεδομένων του ΚΕ.Μ.Ε που εφαρμόζει το Ελληνικό Εθνικό Πρόγραμμα Χαλαζικής Προστασίας (Ε.Π.Χ.Π.), χρησιμοποιείται σε τέσσερεις εφαρμογές Ανακάλυψης Γνώσης από Βάση Δεδομένων. 2

15 Η πρώτη εφαρμογή αφορά την κατηγοριοποίηση του μεγίστου μεγέθους χαλαζιού στο έδαφος από μετεωρολογικά δεδομένα Radar και Παρατήρησης Ανώτερης Ατμόσφαιρας χρησιμοποιώντας αλγόριθμους Καθοδηγούμενης εκμάθησης. Η δεύτερη εφαρμογή αποτελεί συνέχεια της προηγούμενης εφαρμογής με σκοπό την ανάπτυξη ενός μοντέλου εργαλείου πρόβλεψης βασισμένο στα δεδομένα του μετεωρολογικού Radar, της παρατήρησης ανώτερης ατμόσφαιρας και των επιχειρήσεων σποράς των νεφών. Στη φάση μετασχηματισμού των δεδομένων εφαρμόζεται η Παραγοντική Ανάλυση (Factor Analysis) και στη φάση εφαρμογής τεχνικής Εξόρυξης Πληροφορίας η Γραμμική Παλινδρόμηση. Το αποτέλεσμα είναι η κατασκευή ενός μοντέλου για τη μετατροπή των παρατηρήσεων του μετεωρολογικού Radar σε μέγεθος πιθανού χαλαζιού στο έδαφος. Στην τρίτη εφαρμογή χρησιμοποιούνται δύο ομάδες δεδομένων, τα δεδομένα που σχετίζονται με τα χαρακτηριστικά των χαλαζοκαταιγίδων και τα επιχειρησιακά δεδομένα σποράς τους. Το αντικείμενο της μελέτης είναι η πρόβλεψη των τιμών των παραμέτρων σποράς από τα χαρακτηριστικά των χαλαζοκαταιγίδων (1 η πρόταση), ο προσδιορισμός του τύπου της χαλαζοκαταιγίδας από τις τιμές των παραμέτρων σποράς (2 η πρόταση) και ο προσδιορισμός του απαιτούμενου χρόνου σποράς της χαλαζοκαταιγίδας από τις τιμές των παραμέτρων που εκφράζουν την πραγματοποιούμενη σπορά (3 η πρόταση). Η ανάδειξη πιθανής ύπαρξης συσχετισμών μεταξύ των χαρακτηριστικών των χαλαζοκαταιγίδων και των παραμέτρων σποράς που παρουσιάζουν ενδιαφέρον, γίνεται με τη χρήση Κανόνων Συσχετισμού (Association Rules). Η τέταρτη εφαρμογή αποτελεί ένα πρόβλημα Κατηγοριοποίησης, όπου επιχειρείται ο προσδιορισμός του Παρατηρούμενου Δείκτη Κατηγορίας Σωρειτόμορφης Ημέρας (Παρατηρούμενος Δείκτης CDC) από επιχειρησιακά δεδομένα του Ε.Π.Χ.Π για κάθε ημέρα εφαρμογής του Προγράμματος. Το αντίστοιχο μοντέλο Κατηγοριοποίησης που αναπτύσσεται μπορεί να χρησιμοποιηθεί για την ανάπτυξη εφαρμογής αυτόματης εξαγωγής του Παρατηρούμενου Δείκτη CDC. 1.4 Διεξαγωγή ερευνητικού έργου Η διαδικασία της Ανακάλυψης Γνώσης ή Εξόρυξης Πληροφορίας από Βάσεις Δεδομένων (KDD) χρησιμοποιείται για τη διεξαγωγή ερευνητικού έργου τροποποιώντας κατάλληλα το μοντέλο CRISP-DM. Το αντικείμενο της εφαρμογής Ανακάλυψης Γνώσης από Βάσεις Δεδομένων είναι η δημιουργία ενός ή περισσότερων μοντέλων Εξόρυξης Πληροφορίας για τον προσδιορισμό της καταγραφής ή μη υετού στο έδαφος, στο μετεωρολογικό σταθμό Μίκρας Θεσσαλονίκης κατά τη χρονική περίοδο αναφοράς μιας κύριας συνοπτικής ώρας (00, 06, 12 και 18UTC). Για το σκοπό αυτό χρησιμοποιούνται ως ανεξάρτητες μεταβλητές, οι τιμές των μεταβλητών των δεδομένων ERA-40, του πλησιέστερου προς το σταθμό της Μίκρας κόμβο του πλέγματος, στην αντίστοιχη κύρια συνοπτική ώρα. Στα πλαίσια του ερευνητικού έργου διατυπώνονται διαφορετικά σενάρια και στρατηγικές επιλογής ή μετασχηματισμού των δεδομένων με κατεύθυνση την εξέταση θεμάτων που δύνανται να επηρεάσουν την απόδοση των τεχνικών Εξόρυξης Πληροφορίας. Στο στάδιο προετοιμασίας των δεδομένων υλοποιούνται τα σενάρια 3

16 και οι στρατηγικές με την επιλογή ενός σχετικά μεγάλου αριθμού (εκατό ή περισσότερων) τυχαίων δειγμάτων δεδομένων. Το καθένα από αυτά τα δείγματα αποτελεί την είσοδο σε πέντε (5) αλγόριθμους Εξόρυξης Πληροφορίας. Οι αλγόριθμοι κατηγοριοποίησης είναι ο C4.5 των Δέντρων Απόφασης, ο k- Πλησιέστερος Γείτονας, το Νευρωνικό Δίκτυο Πολυεπίπεδων Νευρώνων με Οπισθοδιάδοση, ο Naïve Bayesian και ο RIPPER Δημιουργία συνόλου δεδομένων προορισμού Τα δεδομένα υετού του μετεωρολογικού σταθμού Μίκρας Θεσσαλονίκης, όπως και τα δεδομένα του συνόλου δεδομένων ERA-40, επεξεργάζονται και μετασχηματίζονται κατά το στάδιο μετασχηματισμού των δεδομένων. Στη συνέχεια, εφαρμόζοντας τη μέθοδο Ανάλυσης Κύριων Συνιστωσών (Principal Component Analysis, PCA), μειώνονται οι διαστάσεις του συνόλου δεδομένων ERA-40, παράγοντας ένα υποσύνολο ανεξάρτητων μεταξύ τους χαρακτηριστικών. Από την ανωτέρω επεξεργασία προκύπτει το σύνολο των δεδομένων προορισμού, όπου η εξηρτημένη μεταβλητή είναι ο Υετός που αναφέρεται στην καταγραφή ή μη υετού Επιλογή του συνόλου δεδομένων εκπαίδευσης Αρχικά μελετάται, η επίδραση του μεγέθους του συνόλου δεδομένων εκπαίδευσης στην απόδοση διαφόρων αλγορίθμων Εξόρυξης Πληροφορίας και ιδιαίτερα η διαπίστωση της ύπαρξης ενός ελαχίστου μεγέθους και ο προσδιορισμός της τιμής του με την οποία είναι δυνατό να εξασφαλιστεί η μέγιστη απόδοση ενός αλγορίθμου. Ακόμη, εξετάζονται δύο διαφορετικά σενάρια σχηματισμού των δεδομένων εκπαίδευσης με την επιλογή τυχαίων στιγμιότυπων ή την επιλογή όλων των στιγμιότυπων τυχαία επιλεγόμενων ετών, λαμβάνοντας υπόψη ότι οι καιρικές συνθήκες ακολουθούν ετήσιο κύκλο Σενάρια μετασχηματισμού των δεδομένων εισόδου Εξετάζονται τρία διαφορετικά σενάρια που σχετίζονται με το μετασχηματισμό των ανεξάρτητων μεταβλητών ή χαρακτηριστικών εισόδου και τα οποία βασίζονται στην κοινή πρακτική των επιχειρησιακών μετεωρολόγων κατά τη διαδικασία πρόγνωσης του καιρού σε μια περιοχή. Συγκεκριμένα στο πρώτο σενάριο, το σύνολο δεδομένων εισόδου αποτελείται από τις τιμές των ανεξάρτητων μεταβλητών, όπως αυτές έχουν διαμορφωθεί στο σύνολο δεδομένων προορισμού. Στο δεύτερο σενάριο, το σύνολο δεδομένων εισόδου αποτελείται από τις παρελθούσες 24-ωρες μεταβολές των τιμών των ανεξάρτητων μεταβλητών κάθε κύριας συνοπτικής ώρας. Ενώ στο τρίτο σενάριο, το σύνολο δεδομένων εισόδου αποτελείται από τις τιμές των ανεξάρτητων μεταβλητών, όπως αυτές έχουν διαμορφωθεί στο σύνολο δεδομένων προορισμού και επιπλέον από τις παρελθούσες 24-ωρες μεταβολές των τιμών των μεταβλητών κάθε κύριας συνοπτικής ώρας που σχετίζονται με τα στοιχεία ανέμου. Τέλος, τα τρία αυτά σενάρια εξετάζονται τόσο για τη φυσική κατανομή των δεδομένων υετού (κλάση ή εξαρτημένη μεταβλητή), όσο για την ισόρροπη κατανομή τους. 4

17 Ασύμμετρη κλάση Η κλάση υετού του χρησιμοποιούμενου συνόλου δεδομένων εμπίπτει στην περίπτωση του ζητήματος της Ασύμμετρης Κλάσης, η αντιμετώπιση του οποίου επιχειρείται με την εφαρμογή τεχνικών διαφόρων μεθόδων. Ειδικότερα, εφαρμόζονται εννέα (9) τεχνικές της μεθόδου της Αναθεωρημένης Δειγματοληψίας (Re-sampling), πέραν της δειγματοληψίας με τη Φυσική κατανομή, τόσο από τη βιβλιογραφία όσο νέων προτεινόμενων που βασίζονται στην εμπειρία στο πεδίο των μετεωρολογικών δεδομένων. Επίσης, εφαρμόζεται η μέθοδος boosting AdaBoost M1 για τη βελτίωση της απόδοσης των αλγορίθμων κατηγοριοποίησης. Η μέθοδος της Εκμάθησης με Ευαισθησία Κόστους (Cost Sensitive Learning), η οποία προϋποθέτει τη διαθεσιμότητα πληροφοριών κόστους δεν εφαρμόζεται, καθώς στην εξεταζόμενη περίπτωση της πρόβλεψης της τιμής του υετού yes ή no, η πρόβλεψη αυτών των δύο κατηγοριών έχει την ίδια αξία ή σημασία. 1.5 Ερευνητικό κίνητρο Το ερευνητικό κίνητρο για την εκπόνηση της διατριβής μπορεί να θεωρηθεί ότι συνίσταται από τρεις άξονες του επιστημονικού πεδίου των Βάσεων Δεδομένων και της Εξόρυξης Πληροφορίας, οι οποίοι σε συνδυασμό με την εμπειρία στο πεδίο των μετεωρολογικών δεδομένων βρίσκουν εφαρμογή και ερευνητικό αντικείμενο στην επίλυση προβλημάτων με μετεωρολογικό περιεχόμενο. Ο πρώτος άξονας σχετίζεται με το σχεδιασμό και την ανάπτυξη σχεσιακής μετεωρολογικής βάσης δεδομένων από διαφορετικές πηγές δεδομένων κάτω από ένα ενιαίο σχήμα, καθώς επίσης και τη δημιουργία δεδομένων προορισμού για την είσοδο σε αλγόριθμους Εξόρυξης Πληροφορίας. Ο δεύτερος άξονας περιλαμβάνει πρωτότυπες εφαρμογές Εξόρυξης Πληροφορίας που αφορούν τα επιχειρησιακά δεδομένα του Εθνικού Προγράμματος Χαλαζικής Προστασίας του Οργανισμού ΕΛ.Γ.Α. Ο τρίτος άξονας σχετίζεται με τη διεξαγωγή ερευνητικού έργου, το οποίο εστιάζεται στην επίδραση που έχει η διαμόρφωση της εισόδου αλγορίθμων κατηγοριοποίησης στην απόδοσή τους. Ειδικότερα, εξετάζονται σενάρια και στρατηγικές επιλογής και μετασχηματισμού του συνόλου εκπαίδευσης, καθώς και το πρόβλημα αντιμετώπισης της ασύμμετρης κλάσης στα μετεωρολογικά δεδομένα. 1.6 Περιγραφή της διατριβής Το Κεφάλαιο 2 αναφέρεται στην Ανακάλυψη Γνώσης σε Βάσεις Δεδομένων. Επίσης, γίνεται περιγραφή της Εξόρυξης Πληροφορίας, των μεθόδων της και επεξηγούνται οι αλγόριθμοι που χρησιμοποιούνται στην παρούσα διατριβή. Στο Κεφάλαιο 3 περιγράφεται ο σχεδιασμός και η ανάπτυξη μιας εφαρμογής σχεσιακής μετεωρολογικής βάσης δεδομένων πραγματικής Επιχείρησης ή Οργανισμού. Στο Κεφάλαιο 4 παρουσιάζονται τέσσερεις εφαρμογές Ανακάλυψης Γνώσης στη βάση δεδομένων που περιγράφεται στο προηγούμενο Κεφάλαιο. 5

18 Στο Κεφάλαιο 5 προτείνεται μια τροποποιημένη διαδικασία Ανακάλυψης Γνώσης σε Βάσεις Δεδομένων, η οποία χρησιμοποιείται για τη διεξαγωγή ερευνητικού έργου με τη διατύπωση διαφορετικών σεναρίων και στρατηγικών επιλογής ή μετασχηματισμού των δεδομένων εισόδου με κατεύθυνση την εξέταση θεμάτων που δύνανται να επηρεάσουν την απόδοση των τεχνικών Εξόρυξης Πληροφορίας. Ακόμη, περιγράφονται οι μέθοδοι πρόγνωσης του καιρού από τους μετεωρολόγους. Στο Κεφάλαιο 6 περιγράφονται αναλυτικά όλα τα στάδια και οι διεργασίες με τις οποίες παράγεται από τη μετεωρολογική βάση δεδομένων που παρουσιάζεται στο Κεφάλαιο 3, το σύνολο των δεδομένων προορισμού για τη διεξαγωγή ερευνητικού έργου. Στο Κεφάλαιο 7 ερευνάται η επίδραση του τρόπου επιλογής του συνόλου δεδομένων εκπαίδευσης στην απόδοση αλγόριθμων κατηγοριοποίησης. Στο Κεφάλαιο 8 εξετάζονται διαφορετικά σενάρια μετασχηματισμού των δεδομένων εισόδου που βασίζονται στην επιχειρησιακή μετεωρολογική πρακτική. Στο Κεφάλαιο 9 μελετάται και αντιμετωπίζεται το ζήτημα της Ασύμμετρης Κλάσης στα δεδομένα με την εφαρμογή μεθόδων και τεχνικών γνωστών από τη βιβλιογραφία και νέων προτεινόμενων από την εμπειρική γνώση στο πεδίο των μετεωρολογικών δεδομένων. Τέλος, στο Κεφάλαιο 10 αναφέρονται όλα τα αποτελέσματα και συμπεράσματα της διατριβής. 6

19 ΚΕΦΑΛΑΙΟ 2 ΑΝΑΚΑΛΥΨΗ ΓΝΩΣΗΣ ΣΕ ΒΑΣΕΙΣ ΔΕΔΟΜΕΝΩΝ - ΕΞΟΡΥΞΗ ΠΛΗΡΟΦΟΡΙΑΣ 2.1 Επιστημονική μέθοδος Η επιστημονική μέθοδος (Schafersman, 1994) συνίσταται από ένα αριθμό βημάτων: 1. Αρχικά τίθεται μια ερώτηση ή προσδιορίζεται ένα σημαντικό πρόβλημα, τα οποία όμως θα πρέπει να διατυπωθούν με τέτοιο τρόπο ώστε να είναι δυνατή η απάντησή τους. Και σε αυτό το σημείο ξεκινά κάθε προσπάθεια απόκτησης γνώσης. 2. Αμέσως μετά, χρειάζεται να γίνουν παρατηρήσεις συλλέγοντας σχετικά δεδομένα και πληροφορίες, ώστε να επιχειρηθεί η απάντηση στο ερώτημα ή η λύση στο πρόβλημα που τέθηκαν αρχικά. 3. Στο επόμενο βήμα πρέπει να προταθεί μια απάντηση στο ερώτημα ή μια λύση στο πρόβλημα. Στην επιστήμη γενικότερα, αυτή η προτεινόμενη απάντηση ή λύση ονομάζεται «επιστημονική υπόθεση» και πρέπει να τεθεί με τρόπο ώστε να είναι δυνατός ο έλεγχός της, διαφορετικά θα είναι άχρηστη για τη συνέχιση της έρευνας. 4. Στη συνέχεια, ακολουθεί ο έλεγχος της υπόθεσης, ο οποίος γίνεται με την εκτέλεση ενός ή περισσοτέρων πειραμάτων. Επειδή όμως υπάρχουν και περιπτώσεις, όπου η διεξαγωγή πειραμάτων δεν είναι πάντα εφικτή, όπως για παράδειγμα σε ερωτήσεις ή προβλήματα που σχετίζονται με τα άστρα, το σχηματισμό βουνών κ.ά., ο δεύτερος τρόπος ελέγχου της υπόθεσης είναι να γίνουν περισσότερες παρατηρήσεις. Κάθε υπόθεση έχει συνεπαγωγές και κάνει συγκεκριμένες προβλέψεις σχετικά με το υπό έρευνα φαινόμενο ή διαδικασία. Με χρήση λογικών και εμπειρικών μαρτυριών μπορεί να πραγματοποιηθεί ο έλεγχος της υπόθεσης εξετάζοντας την επιτυχία των προβλέψεων και πόσο συμφωνούν οι προβλέψεις και τα συνεπαγόμενα με νέα δεδομένα, νέα πρότυπα μορφής (patterns) και ίσως με νέα μοντέλα. 5. Εάν η υπόθεση αποτύχει να επιβεβαιωθεί κατά τον έλεγχο, θα πρέπει είτε να απορριφθεί είτε να τροποποιηθεί. Οι περισσότεροι επιστήμονες προτιμούν την τροποποίηση της υπόθεσης, καθώς δεν επιθυμούν την απόρριψη της γενικότερης ιδέας που εκφράστηκε από την απορριφθείσα υπόθεση. Συνεχίζοντας με την τροποποιημένη υπόθεση θα πρέπει και αυτή να ελεγχθεί. Στην περίπτωση επιβεβαίωσης της υπόθεσης (corroborated hypothesis) κατά τον έλεγχο και επαλήθευσης των προβλέψεων, η υπόθεση μπορεί να δημοσιευθεί. Από αυτό το σημείο αρχίζει ο έλεγχος της υπόθεσης από άλλους επιστήμονες και στην περίπτωση συνέχισής της επιβεβαίωσής της, τότε μπορεί να θεωρηθεί ως αξιόπιστη γνώση (reliable knowledge) και επιστημονικό γεγονός (scientific fact). Αυτό το τμήμα της επιστημονικής μεθόδου ονομάζεται «υποθετική-συμπερασματική μέθοδος», επειδή κάποιος συμπεραίνει τα αποτελέσματα των προβλέψεων της υπόθεσης και ελέγχει αυτά τα συμπεράσματα. Ενώ, ο «Επαγωγικός συλλογισμός», ο εναλλακτικός του 7

20 «Συμπερασματικού συλλογισμού», χρησιμοποιήθηκε νωρίτερα κατά το σχηματισμό της υπόθεσης. 6. Το τελευταίο στάδιο της επιστημονικής μεθόδου περιλαμβάνει τη δόμηση, υποστήριξη ή εναπόθεση αμφιβολιών μιας επιστημονικής θεωρίας. Η «επιστημονική θεωρία» είναι μια ενιαία και ολοκληρωμένη ερμηνεία θεμελιωδών φυσικών διαδικασιών ή φαινομένων, η οποία είναι εξ ολοκλήρου δομημένη από επιβεβαιωμένες υποθέσεις, δηλαδή από αξιόπιστες γνώσεις και αρχικά μη συσχετισμένα μεταξύ τους επιστημονικά γεγονότα. 2.2 Ανακάλυψη Γνώσης σε Βάσεις Δεδομένων Με τον όρο «Γνώση» (Knowledge) εννοούνται οι σχέσεις και οι πρότυπες μορφές μεταξύ των δεδομένων και με την «Πληροφορία», η νέα γνώση, μη φανερή, την οποία μπορεί κανείς να χρησιμοποιήσει και να ωφεληθεί από αυτή (Roiger and Geatz, 2003). Εξόρυξη Πληροφορίας (Data Mining) είναι η αυτόματη ανάλυση και εξαγωγή γνώσης από τα δεδομένα μιας Βάσης Δεδομένων με εφαρμογή μιας ή περισσοτέρων τεχνικών μηχανικής εκμάθησης. Ειδικότερα, ο σκοπός είναι ο προσδιορισμός και αναγνώριση τάσεων και προτύπων μορφών (patterns) στα δεδομένα. Η γνώση που αποκτάται από την εφαρμογή της Εξόρυξης Πληροφορίας αποδίδεται ως ένα μοντέλο ή μια γενίκευση των δεδομένων. Ο όρος Ανακάλυψη Γνώσης σε Βάσεις Δεδομένων (Knowledge Discovery in Databases, KDD) χρησιμοποιείται συχνά εναλλακτικά με τον όρο Εξόρυξη Πληροφορίας (Data Mining). Επιπρόσθετα με την Εξόρυξη Πληροφορίας, η Ανακάλυψη Γνώσης σε Βάσεις Δεδομένων περιλαμβάνει μια μεθοδολογία για τη συλλογή, επιλογή και προετοιμασία των δεδομένων, καθώς επίσης και τη λήψη αποφάσεων για ενέργειες που θα πρέπει να γίνουν αμέσως μετά την Εξόρυξη Πληροφορίας. Έτσι λοιπόν, μπορεί να οριστεί η Ανακάλυψη Γνώσης σε Βάσεις Δεδομένων (KDD) ως η αλληλεπιδραστική, επαναληπτική διαδικασία η οποία επιχειρεί να εξάγει ανεκδήλωτες, μέχρι τότε άγνωστες και πιθανό χρήσιμες γνώσεις από τα δεδομένα. Η Ανακάλυψη Γνώσης σε Βάσεις Δεδομένων περιγράφεται ως η εφαρμογή της Επιστημονικής Μεθόδου στην Εξόρυξη Πληροφορίας. Στην Εικόνα 2.1 παρουσιάζεται σχηματικά ένα μοντέλο επτά (7) βημάτων της διαδικασίας Ανακάλυψης Γνώσης σε Βάσεις Δεδομένων (Roiger and Geatz, 2003). Η διαδικασία περιλαμβάνει τα βήματα του προσδιορισμού του στόχου, της δημιουργίας δεδομένων προορισμού, της προ-επεξεργασίας, του μετασχηματισμού και της εξόρυξης των δεδομένων, της ερμηνείας και της αξιολόγησης των αποτελεσμάτων και τελικά της εφαρμογής της γνώσης. Στο πρώτο βήμα προσδιορισμού του στόχου οι ενέργειες εστιάζονται στην κατανόηση του υπό εξέταση πεδίου για ανακάλυψη γνώσης και στη διατύπωση μιας υπόθεσης προς εξέταση. Στη συνέχεια ακολουθεί η δημιουργία δεδομένων προορισμού (δεύτερο βήμα) επιλέγοντας το υπό εξέταση σύνολο δεδομένων. 8

21 Το επόμενο βήμα (τρίτο) της προ-επεξεργασίας των δεδομένων έχει κυρίως τη μορφή του καθαρισμού των δεδομένων. Στο βήμα αυτό γίνεται εξέταση του θορύβου στα δεδομένα, δηλαδή των τυχαίων λαθών στις τιμές των χαρακτηριστικών, εξομάλυνση των δεδομένων και αντιμετωπίζονται οι απούσες τιμές. Στο τέταρτο βήμα μετασχηματισμού των δεδομένων προστίθενται ή αφαιρούνται χαρακτηριστικά ή στιγμιότυπα. Επίσης γίνεται κανονικοποίηση, μετατροπή του τύπου και εξομάλυνση των δεδομένων. Σημειώνεται ότι η εξομάλυνση των δεδομένων μπορεί να γίνει είτε στο προηγούμενο βήμα της προ-επεξεργασίας είτε στο βήμα του μετασχηματισμού των δεδομένων. Αμέσως μετά (πέμπτο βήμα), εφαρμόζονται ένας ή περισσότεροι αλγόριθμοι Εξόρυξης Πληροφορίας με αποτέλεσμα τη δημιουργία του καλύτερου μοντέλου γενίκευσης και αντιπροσώπευσης των δεδομένων. Στο έκτο βήμα εξετάζεται η έξοδος του προηγούμενου βήματος ερμηνεύοντας και αξιολογώντας τα αποτελέσματα ώστε να διαπιστωθεί η χρησιμότητα και το ενδιαφέρον που παρουσιάζουν. Επίσης, η λήψη απόφασης για επανάληψη της διαδικασίας επανερχόμενοι στο δεύτερο βήμα της δημιουργίας δεδομένων προορισμού και επιχειρώντας αλλαγές σε κάποια ή σε όλα από τα ενδιάμεσα βήματα. Τελικά, στην περίπτωση που η ανακαλυφθείσα γνώση μπορεί να θεωρηθεί χρήσιμη τότε στο έβδομο βήμα της ενέργειας, υιοθετείται και εφαρμόζεται κατάλληλα στην επίλυση προβλημάτων. Εικόνα 2.1: Μοντέλο επτά βημάτων της διαδικασίας Ανακάλυψης Γνώσης σε Βάσεις Δεδομένων (Roiger and Geatz, 2003) 9

22 Σημειώνεται ότι υπάρχουν διάφορες παραλλαγές των μοντέλων αυτών που αφορούν το περιεχόμενο και τον αριθμό βημάτων. 2.3 Cross Industry Standard Process for Data Mining (CRISP-DM) Ένα δεύτερο μοντέλο επεξεργασίας το οποίο έχει αποδεδειγμένη εφαρμογή είναι το Cross Industry Standard Process for Data Mining, CRISP-DM (Chapman et al., 2000). Το CRISP-DM παρέχει μια επισκόπηση του κύκλου ζωής ενός έργου Εξόρυξης Πληροφορίας. Περιλαμβάνει τις αντίστοιχες φάσεις ενός έργου, τις δραστηριότητες και τις σχέσεις μεταξύ των δραστηριοτήτων. Ο κύκλος ζωής ενός έργου Εξόρυξης Πληροφορίας αποτελείται από έξι (6) φάσεις, όπου η σειρά των φάσεων δεν είναι δεσμευτική. Η μπρος πίσω μετακίνηση μεταξύ διαφορετικών φάσεων συχνά απαιτείται να γίνει και αυτό εξαρτάται από το αποτέλεσμα μιας φάσης, τη φάση ή ποια συγκεκριμένη δραστηριότητα της φάσης ακολουθεί αμέσως μετά. Στην Εικόνα 2.2 τα βέλη υποδεικνύουν τις πιο σημαντικές και συχνές εξαρτήσεις μεταξύ των φάσεων. Ο εξωτερικός κύκλος συμβολίζει την κυκλική φύση της Εξόρυξης Πληροφορίας. Η διαδικασία συνεχίζεται και μετά την εύρεση κάποιας λύσης, καθώς η εμπειρία και η γνώση που αποκτώνται αποτελούν έναυσμα νέων ερωτηματικών, ακολουθώντας νέους κύκλους Εξόρυξης Πληροφορίας εστιάζοντας την αναζήτηση σε πιο εξειδικευμένα θέματα. Παρακάτω παρατίθεται μια σύντομη περιγραφή των φάσεων: Εικόνα 2.2: Το μοντέλο CRISP-DM της διαδικασίας Ανακάλυψης Γνώσης σε Βάσεις Δεδομένων (Chapman et al., 2000) 1. Κατανόηση της επιχείρησης 10

23 Η αρχική φάση εστιάζεται στην κατανόηση του αντικειμένου του έργου και στις απαιτήσεις, όπως αυτές πηγάζουν από τη σκοπιά της επιχείρησης και στη συνέχεια τη μετατροπή αυτών στη διατύπωση ενός προβλήματος Εξόρυξης Πληροφορίας και σε ένα πρωταρχικό σχέδιο για την επίτευξη των στόχων. 2. Κατανόηση των δεδομένων Η φάση της κατανόησης των δεδομένων ξεκινά με μια αρχική συλλογή δεδομένων και συνεχίζει με ενέργειες για την εξοικείωση με τα δεδομένα, τον εντοπισμό προβλημάτων ποιότητας σε αυτά, την αρχική διείσδυση ή την ανακάλυψη υποσυνόλων με ενδιαφέρον ώστε να διατυπωθούν υποθέσεις μη εμφανών πληροφοριών. 3. Προετοιμασία δεδομένων Η φάση της προετοιμασίας των δεδομένων περιλαμβάνει όλες τις ενέργειες σχηματισμού του τελικού συνόλου δεδομένων από τα αρχικά δεδομένα, τα οποία (τελικά δεδομένα ή δεδομένα προορισμού) είναι αυτά που θα τροφοδοτήσουν τα εργαλεία μοντελοποίησης. Οι εργασίες ετοιμασίας των δεδομένων είναι πιθανό να εκτελεστούν πολλές φορές και χωρίς μια προκαθορισμένη σειρά. Οι εργασίες περιλαμβάνουν επιλογή πίνακα, εγγραφής και χαρακτηριστικού, όπως επίσης μετασχηματισμό και καθαρισμό των δεδομένων. 4. Μοντελοποίηση Σε αυτή τη φάση επιλέγονται και εφαρμόζονται διάφορες τεχνικές μοντελοποίησης οι παράμετροι των οποίων ρυθμίζονται με τις βέλτιστες τιμές απόδοσης. Για κάθε τύπο προβλημάτων Εξόρυξης Πληροφορίας υπάρχουν διάφορες τεχνικές. Κάποιες τεχνικές έχουν ειδικές απαιτήσεις ανάλογα με τη μορφή των δεδομένων και για το λόγο αυτό συχνά απαιτείται η επιστροφή στη φάση προετοιμασίας. 5. Αξιολόγηση Σε αυτή τη φάση του έργου έχει κατασκευαστεί ένα μοντέλο ή μοντέλα τα οποία φαίνεται να έχουν υψηλή ποιότητα από τη σκοπιά της ανάλυσης δεδομένων. Προτού περάσει η διαδικασία στην επόμενη φάση της αξιοποίησης του μοντέλου, είναι σημαντική η αξιολόγησή του και η επανεξέταση των βημάτων που εκτελέστηκαν για να κατασκευαστεί το μοντέλο, ώστε να υπάρχει η διαβεβαίωση ότι ανταποκρίνεται στους στόχους της επιχείρησης. 6. Εφαρμογή - Αξιοποίηση Η δημιουργία του μοντέλου γενικά δεν είναι το τέλος του έργου. Ο σκοπός του μοντέλου είναι η ανακάλυψη γνώσης από τα δεδομένα, όμως αυτή η γνώση θα πρέπει να οργανωθεί και να παρουσιαστεί με τέτοιο τρόπο ώστε ο τελικός αποδέκτης χρήστης να μπορεί να τη χρησιμοποιήσει. Ανάλογα με τις απαιτήσεις η φάση της Εφαρμογής μπορεί να είναι μια απλή αναφορά ή μια πιο σύνθετη δραστηριότητα, όπου θα πρέπει να εκτελεστεί μια επαναληπτική διαδικασία Εξόρυξης Πληροφορίας. Σε πολλές περιπτώσεις θα είναι ο χρήστης και όχι ο αναλυτής, ο οποίος θα εκτελέσει τα βήματα της Εφαρμογής και Αξιοποίησης και είναι σημαντικό να κατανοήσει τις ενέργειες που θα πρέπει να κάνει, ώστε να χρησιμοποιήσει τα μοντέλα που κατασκευάστηκαν. 11

24 2.4 Εξόρυξη Πληροφορίας Εξόρυξη Πληροφορίας (Data Mining) ορίζεται η διαδικασία κατά την οποία γίνεται ανάλυση και εξαγωγή γνώσης αυτόματα από τα δεδομένα μιας Βάσης Δεδομένων με τη χρήση μιας ή περισσοτέρων τεχνικών μηχανικής εκμάθησης. Ο σκοπός της Εξόρυξης Πληροφορίας είναι ο προσδιορισμός τάσεων και πρότυπων μορφών (patterns) στα δεδομένα. Η γνώση που αποκομίζεται συνίσταται σε ένα μοντέλο γενίκευσης των δεδομένων. Σημειώνεται ότι η εξαγόμενη γνώση δεν είναι γνωστή εκ των προτέρων σε αντίθεση με την ανάκληση δεδομένων ή πληροφορίας από μια Βάση Δεδομένων, όπου το ερώτημα προς τη Βάση είναι γνωστό και δεν έχει τη μορφή εξεταζόμενης υπόθεσης. Υπάρχουν πολλές τεχνικές Εξόρυξης Πληροφορίας, όλες όμως χρησιμοποιούν την επαγωγική εκμάθηση. Η επαγωγική εκμάθηση είναι η διαδικασία, όπου με την παρατήρηση εξειδικευμένων παραδειγμάτων εννοιών που αποτελούν το αντικείμενο εκμάθησης, επιχειρείται ο ορισμός γενικευμένων εννοιών. Η έννοια είναι ένα σύνολο αντικειμένων, συμβόλων ή γεγονότων που μοιράζονται συγκεκριμένα χαρακτηριστικά. Η έξοδος της εφαρμογής Εξόρυξης Πληροφορίας είναι έννοιες. Γνωστές δομές εννοιών είναι τα Δέντρα Απόφασης, οι Κανόνες, τα Νευρωνικά Δίκτυα και οι Μαθηματικές εξισώσεις. (Roiger and Geatz, 2003). 2.5 Καθοδηγούμενη Εκμάθηση (Supervised Learning) Η επαγωγική εκμάθηση χρησιμοποιείται για τον προσδιορισμό του ορισμού βασικών εννοιών. Ως παράδειγμα επαγωγικής καθοδηγούμενης εκμάθησης εννοιών ή απλά Καθοδηγούμενης εκμάθησης (induction-based supervised concept learning ή supervised learning) αναφέρεται η περίπτωση του επιχειρησιακού μετεωρολόγου, ο οποίος εξετάζει τις τιμές διαφόρων μετεωρολογικών παραμέτρων σε μια συγκεκριμένη γεωγραφική περιοχή σε μια συγκεκριμένη συνοπτική ώρα και επιπλέον ενημερώνεται για την καταγραφή υετού (βροχή, χιόνι, καταιγίδα κ.ά.) στο έδαφος, στην ίδια περιοχή, την ίδια ώρα. Το παράδειγμα (example) αυτό αποτελεί ένα στιγμιότυπο δεδομένων (instance), το οποίο επαναλαμβάνεται πολλές φορές και ο επιχειρησιακός μετεωρολόγος σχηματίζει εμπειρικά το δικό του μοντέλο ή μοντέλα κατηγοριοποίησης. Στο μέλλον χρησιμοποιεί αυτά τα εμπειρικά μοντέλα κατηγοριοποίησης, ώστε να προβλέψει την εμφάνιση υετού σε μια περιοχή λαμβάνοντας ως δεδομένα τις προγνωστικές τιμές των μετεωρολογικών παραμέτρων των αριθμητικών μοντέλων της μετεωρολογίας. Στην Καθοδηγούμενη εκμάθηση χρησιμοποιείται ένα σύνολο δεδομένων με παραδείγματα της έννοιας που θα υποβληθεί σε εκμάθηση και η οποία στο ανωτέρω παράδειγμα είναι η εμφάνιση υετού σε μια περιοχή. Στον παρακάτω Πίνακα 2.1 παρουσιάζεται ως παράδειγμα, ένα μικρό σύνολο δεδομένων, όπου στην πρώτη γραμμή εμφανίζονται τα ονόματα των χαρακτηριστικών και στις υπόλοιπες γραμμές οι τιμές τους. Κάθε γραμμή αποτελεί ένα στιγμιότυπο δεδομένων. Οι πρώτες εννέα στήλες αποτελούν τα χαρακτηριστικά εισόδου ή τις ανεξάρτητες μεταβλητές που αντιστοιχούν στις μετεωρολογικές παραμέτρους, οι οποίες έχουν επιλεγεί από τον αναλυτή ως ικανές για τον προσδιορισμό της τιμής του τελευταίου χαρακτηριστικού που είναι γνωστό ως η κλάση ή το χαρακτηριστικό εξόδου ή η εξαρτημένη μεταβλητή. 12

25 Πίνακας 2.1: Καθοδηγούμενη Εκμάθηση σε μετεωρολογικά δεδομένα G200 RV1000 D300 F300 F925 DIV300 T200 PV500 D925 PREC ,8 W ,3 222,5 33 S no ,8 W ,7 222,2 14,6 SE no ,1 W ,1 217,5 26 SE no ,9 W ,9 218,5 38,4 E no ,2 SW ,5 218,1 29,5 E yes ,9 SW ,1 34 SE yes ,6 SW ,6 220,4 33,5 SE yes ,7 SW ,2 222,6 60,2 S yes W ,2 225,1 70 W yes ,5 W ,1 225,5 66,2 NW no ,6 NW ,2 223,8 39,8 NW no ,5 NW ,4 224,3 40,5 N no ,3 NE ,8 225,8 62,7 NW yes NE ,2 223,6 58,8 N yes NE ,5 222,3 65,9 N yes ,5 NE ,7 62,7 N yes N ,1 221,9 49,5 N yes ,7 NE ,3 220,8 51,5 NW no ,1 N ,8 43,8 NE no ,4 N ,1 219,4 36,9 N no ,5 NW ,3 219,5 33,1 SW? ,6 W ,7 43,8 SW? W ,1 76,9 SW? ,9 W ,9 219,9 56,2 W? ,1 NW ,6 218,8 35,1 SW? Στην πρώτη γραμμή του Πίνακα 2.1, το χαρακτηριστικό G200 είναι το Γεωδυναμικό ύψος στα 200hPa, το RV1000 ο Σχετικός στροβιλισμός στα 1000hPa, το D300 η Διεύθυνση ανέμου στα 300hPa, το F300 η ταχύτητα ανέμου στα 300hPa, το F925 η ταχύτητα ανέμου στα 925hPa, το DIV300 η Απόκλιση στα 300hPa, το Τ200 η θερμοκρασία στα 200hPa, το PV500 ο Δυνητικός στροβιλισμός στα 500hPa, το D925 η Διεύθυνση ανέμου στα 925hPa και η κλάση PREC η εμφάνιση υετού στο έδαφος. Ο Πίνακας 2.1 μετά την πρώτη γραμμή με τα ονόματα των χαρακτηριστικών, περιλαμβάνει και 25 γραμμές ή στιγμιότυπα δεδομένων με τιμές των χαρακτηριστικών. Παρατηρούμε ότι μόνο τα πρώτα 20 στιγμιότυπα δεδομένων έχουν την τιμή yes ή no για την κλάση PREC, ενώ τα τελευταία 5 στιγμιότυπα δεδομένων έχουν άγνωστη τιμή. Στη συνέχεια με χρήση των 20 στιγμιότυπων δεδομένων που αποτελούν το σύνολο δεδομένων εκπαίδευσης, αναπτύσσεται ένα μοντέλο κατηγοριοποίησης. Το μοντέλο αυτό θα χρησιμοποιηθεί για την κατηγοριοποίηση των 5 στιγμιότυπων δεδομένων, τα οποία αποτελούν το σύνολο δεδομένων ελέγχου και των οποίων η τιμή της κλάσης είναι άγνωστη, αποδίδοντας τελικά μια τιμή σε αυτήν. Στο παράδειγμά μας, οι τιμές της κλάσης PREC είναι yes ή no και μια από αυτές τις δύο τιμές θα αποδοθεί σε κάθε στιγμιότυπο δεδομένων άγνωστης κλάσης. Αυτό το παράδειγμα, στην περίπτωση της Καθοδηγούμενης εκμάθησης, είναι ένα παράδειγμα Κατηγοριοποίησης (Classification), όπου η εξαρτημένη μεταβλητή είναι Κατηγορική (Categorical). 13

iii ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος

iii ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος iii ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος xi 1 Αντικείμενα των Πιθανοτήτων και της Στατιστικής 1 1.1 Πιθανοτικά Πρότυπα και Αντικείμενο των Πιθανοτήτων, 1 1.2 Αντικείμενο της Στατιστικής, 3 1.3 Ο Ρόλος των Πιθανοτήτων

Διαβάστε περισσότερα

Περιεχόμενα. ΚΕΦΑΛΑΙΟ 1 Κατευθύνσεις στην έρευνα των επιστημών υγείας. ΚΕΦΑΛΑΙΟ 2 Έρευνα και θεωρία

Περιεχόμενα. ΚΕΦΑΛΑΙΟ 1 Κατευθύνσεις στην έρευνα των επιστημών υγείας. ΚΕΦΑΛΑΙΟ 2 Έρευνα και θεωρία Περιεχόμενα Σχετικά με τους συγγραφείς... ΧΙΙΙ Πρόλογος... XV Eισαγωγή...XVΙΙ ΚΕΦΑΛΑΙΟ 1 Κατευθύνσεις στην έρευνα των επιστημών υγείας Εισαγωγή... 1 Τι είναι η έρευνα;... 2 Τι είναι η έρευνα των επιστημών

Διαβάστε περισσότερα

Διπλωματική Εργασία: «Συγκριτική Μελέτη Μηχανισμών Εκτίμησης Ελλιπούς Πληροφορίας σε Ασύρματα Δίκτυα Αισθητήρων»

Διπλωματική Εργασία: «Συγκριτική Μελέτη Μηχανισμών Εκτίμησης Ελλιπούς Πληροφορίας σε Ασύρματα Δίκτυα Αισθητήρων» Τμήμα Πληροφορικής και Τηλεπικοινωνιών Πρόγραμμα Μεταπτυχιακών Σπουδών Διπλωματική Εργασία: «Συγκριτική Μελέτη Μηχανισμών Εκτίμησης Ελλιπούς Πληροφορίας σε Ασύρματα Δίκτυα Αισθητήρων» Αργυροπούλου Αιμιλία

Διαβάστε περισσότερα

Βραχυπρόθεσμη τοπική μετεωρολογική πρόγνωση με αναζήτηση ανάλογων καταστάσεων

Βραχυπρόθεσμη τοπική μετεωρολογική πρόγνωση με αναζήτηση ανάλογων καταστάσεων ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΠΟΛΙΤΙΚΩΝ ΜΗΧΑΝΙΚΩΝ ΤΟΜΕΑΣ ΥΔΑΤΙΚΩΝ ΠΟΡΩΝ ΚΑΙ ΠΕΡΙΒΑΛΛΟΝΤΟΣ Βραχυπρόθεσμη τοπική μετεωρολογική πρόγνωση με αναζήτηση ανάλογων καταστάσεων Γεώργιος Θεοδωρόπουλος Επιβλέπων

Διαβάστε περισσότερα

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R, Επίκουρος Καθηγητής, Τομέας Μαθηματικών, Σχολή Εφαρμοσμένων Μαθηματικών και Φυσικών Επιστημών, Εθνικό Μετσόβιο Πολυτεχνείο. Περιεχόμενα Εισαγωγή στο

Διαβάστε περισσότερα

Τεχνικές Εξόρυξης Δεδομένων

Τεχνικές Εξόρυξης Δεδομένων ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ Διατμηματικό Μεταπτυχιακό Πρόγραμμα στα Πληροφοριακά Συστήματα ( MIS ) Τεχνικές Εξόρυξης Δεδομένων για την βελτίωση της απόδοσης σε Κατανεμημένα Συστήματα Ζάχος Δημήτριος Επιβλέποντες:

Διαβάστε περισσότερα

ΔΙΕΡΕΥΝΗΣΗ ΚΛΙΜΑΤΙΚΩΝ ΑΛΛΑΓΩΝ ΓΙΑ ΤΟ ΝΗΣΙ ΤΗΣ ΝΑΞΟΥ

ΔΙΕΡΕΥΝΗΣΗ ΚΛΙΜΑΤΙΚΩΝ ΑΛΛΑΓΩΝ ΓΙΑ ΤΟ ΝΗΣΙ ΤΗΣ ΝΑΞΟΥ ΔΙΕΡΕΥΝΗΣΗ ΚΛΙΜΑΤΙΚΩΝ ΑΛΛΑΓΩΝ ΓΙΑ ΤΟ ΝΗΣΙ ΤΗΣ ΝΑΞΟΥ ΜΑΜΜΑΣ ΚΩΝ/ΝΟΣ ΑΜ:331/2003032 ΝΟΕΜΒΡΙΟΣ 2010 Ευχαριστίες Σε αυτό το σημείο θα ήθελα να ευχαριστήσω όλους όσους με βοήθησαν να δημιουργήσω την παρούσα

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 18. 18 Μηχανική Μάθηση

ΚΕΦΑΛΑΙΟ 18. 18 Μηχανική Μάθηση ΚΕΦΑΛΑΙΟ 18 18 Μηχανική Μάθηση Ένα φυσικό ή τεχνητό σύστηµα επεξεργασίας πληροφορίας συµπεριλαµβανοµένων εκείνων µε δυνατότητες αντίληψης, µάθησης, συλλογισµού, λήψης απόφασης, επικοινωνίας και δράσης

Διαβάστε περισσότερα

ΙΑ ΟΧΙΚΕΣ ΒΕΛΤΙΩΣΕΙΣ

ΙΑ ΟΧΙΚΕΣ ΒΕΛΤΙΩΣΕΙΣ Tel.: +30 2310998051, Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης Σχολή Θετικών Επιστημών Τμήμα Φυσικής 541 24 Θεσσαλονίκη Καθηγητής Γεώργιος Θεοδώρου Ιστοσελίδα: http://users.auth.gr/theodoru ΙΑ ΟΧΙΚΕΣ ΒΕΛΤΙΩΣΕΙΣ

Διαβάστε περισσότερα

ΗΥ562 Προχωρημένα Θέματα Βάσεων Δεδομένων Efficient Query Evaluation over Temporally Correlated Probabilistic Streams

ΗΥ562 Προχωρημένα Θέματα Βάσεων Δεδομένων Efficient Query Evaluation over Temporally Correlated Probabilistic Streams ΗΥ562 Προχωρημένα Θέματα Βάσεων Δεδομένων Efficient Query Evaluation over Temporally Correlated Probabilistic Streams Αλέκα Σεληνιωτάκη Ηράκλειο, 26/06/12 aseliniotaki@csd.uoc.gr ΑΜ: 703 1. Περίληψη Συνεισφοράς

Διαβάστε περισσότερα

ΔΕΙΓΜΑ ΠΡΙΝ ΤΙΣ ΔΙΟΡΘΩΣΕΙΣ

ΔΕΙΓΜΑ ΠΡΙΝ ΤΙΣ ΔΙΟΡΘΩΣΕΙΣ ΠΕΡΙΕΧOΜΕΝΑ Πρόλογος στη δεύτερη έκδοση Πρόλογος στην πρώτη έκδοση Εισαγωγή Τι είναι η μεθοδολογία έρευνας Οι μέθοδοι έρευνας ΜEΡOΣ A : ΓNΩΡΙΜΙΑ ΜΕ ΤΗΝ ΕΠΙΣΤΗΜOΝΙΚΗ ΕΡΓΑΣΙΑ ΚΕΦΑΛΑΙO 1: Γενικά για την επιστημονική

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ ΜEΡOΣ A : ΓNΩΡΙΜΙΑ ΜΕ ΤΗΝ ΕΠΙΣΤΗΜOΝΙΚΗ ΕΡΓΑΣΙΑ

ΠΕΡΙΕΧΟΜΕΝΑ ΜEΡOΣ A : ΓNΩΡΙΜΙΑ ΜΕ ΤΗΝ ΕΠΙΣΤΗΜOΝΙΚΗ ΕΡΓΑΣΙΑ ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος στη δεύτερη έκδοση........................................... 13 Πρόλογος στην πρώτη έκδοση............................................ 17 Εισαγωγή................................................................

Διαβάστε περισσότερα

ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ

ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ ΠΕΡΙΓΡΑΦΗ ΚΑΙ ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ Είδη μεταβλητών Ποσοτικά δεδομένα (π.χ. ηλικία, ύψος, αιμοσφαιρίνη) Ποιοτικά δεδομένα (π.χ. άνδρας/γυναίκα, ναι/όχι) Διατεταγμένα (π.χ. καλό/μέτριο/κακό) 2 Περιγραφή ποσοτικών

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ Ερωτήσεις πολλαπλής επιλογής Συντάκτης: Δημήτριος Κρέτσης 1. Ο κλάδος της περιγραφικής Στατιστικής: α. Ασχολείται με την επεξεργασία των δεδομένων και την ανάλυση

Διαβάστε περισσότερα

ΜΕΘΟΔΟΙ ΕΡΥΕΝΑΣ ΔΙΑΛΕΞΗ 1: ΕΙΣΑΓΩΓΗ ΣΤΙΣ ΜΕΘΟΔΟΥΣ ΕΡΕΥΝΑΣ - ΠΕΡΙΓΡΑΜΜΑ

ΜΕΘΟΔΟΙ ΕΡΥΕΝΑΣ ΔΙΑΛΕΞΗ 1: ΕΙΣΑΓΩΓΗ ΣΤΙΣ ΜΕΘΟΔΟΥΣ ΕΡΕΥΝΑΣ - ΠΕΡΙΓΡΑΜΜΑ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΙΑΣ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΧΩΡΟΤΑΞΙΑΣ, ΠΟΛΕΟΔΟΜΙΑΣ ΚΑΙ ΠΕΡΙΦΕΡΕΙΑΚΗΣ ΑΝΑΠΤΥΞΗΣ ΠΜΣ «ΕΠΕΝΔΥΣΕΙΣ ΚΑΙ ΠΕΡΙΦΕΡΕΙΑΚΗ ΑΝΑΠΤΥΞΗ» ΜΕΘΟΔΟΙ ΕΡΥΕΝΑΣ ΔΙΑΛΕΞΗ 1: ΕΙΣΑΓΩΓΗ ΣΤΙΣ ΜΕΘΟΔΟΥΣ

Διαβάστε περισσότερα

Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος

Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος Χιωτίδης Γεώργιος Τμήμα Λογιστικής και Χρηματοοικονομικής Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ. ΠΡΟΛΟΓΟΣ... vii ΠΕΡΙΕΧΟΜΕΝΑ... ix ΓΕΝΙΚΗ ΒΙΒΛΙΟΓΡΑΦΙΑ... xv. Κεφάλαιο 1 ΓΕΝΙΚΕΣ ΕΝΝΟΙΕΣ ΑΠΟ ΤΗ ΣΤΑΤΙΣΤΙΚΗ

ΠΕΡΙΕΧΟΜΕΝΑ. ΠΡΟΛΟΓΟΣ... vii ΠΕΡΙΕΧΟΜΕΝΑ... ix ΓΕΝΙΚΗ ΒΙΒΛΙΟΓΡΑΦΙΑ... xv. Κεφάλαιο 1 ΓΕΝΙΚΕΣ ΕΝΝΟΙΕΣ ΑΠΟ ΤΗ ΣΤΑΤΙΣΤΙΚΗ ΠΡΟΛΟΓΟΣ... vii ΠΕΡΙΕΧΟΜΕΝΑ... ix ΓΕΝΙΚΗ ΒΙΒΛΙΟΓΡΑΦΙΑ... xv Κεφάλαιο 1 ΓΕΝΙΚΕΣ ΕΝΝΟΙΕΣ ΑΠΟ ΤΗ ΣΤΑΤΙΣΤΙΚΗ 1.1 Πίνακες, κατανομές, ιστογράμματα... 1 1.2 Πυκνότητα πιθανότητας, καμπύλη συχνοτήτων... 5 1.3

Διαβάστε περισσότερα

ΕΠΙΧΕΙΡΗΣΙΑΚΗ ΕΡΕΥΝΑ ΘΕΩΡΙΑ ΚΑΙ ΕΦΑΡΜΟΓΗ ΤΟΥ ΓΡΑΜΜΙΚΟΥ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΥ ΣΤΗ ΛΗΨΗ ΑΠΟΦΑΣΕΩΝ (1)

ΕΠΙΧΕΙΡΗΣΙΑΚΗ ΕΡΕΥΝΑ ΘΕΩΡΙΑ ΚΑΙ ΕΦΑΡΜΟΓΗ ΤΟΥ ΓΡΑΜΜΙΚΟΥ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΥ ΣΤΗ ΛΗΨΗ ΑΠΟΦΑΣΕΩΝ (1) ΕΠΙΧΕΙΡΗΣΙΑΚΗ ΕΡΕΥΝΑ ΘΕΩΡΙΑ ΚΑΙ ΕΦΑΡΜΟΓΗ ΤΟΥ ΓΡΑΜΜΙΚΟΥ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΥ ΣΤΗ ΛΗΨΗ ΑΠΟΦΑΣΕΩΝ (1) 1 Προέλευση και ιστορία της Επιχειρησιακής Έρευνας Αλλαγές στις επιχειρήσεις Τέλος του 19ου αιώνα: βιομηχανική

Διαβάστε περισσότερα

ΠΕΡΙΓΡΑΦΙΚΗ και ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

ΠΕΡΙΓΡΑΦΙΚΗ και ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ ΠΕΡΙΓΡΑΦΙΚΗ και ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Εισήγηση 4A: Έλεγχοι Υποθέσεων και Διαστήματα Εμπιστοσύνης Διδάσκων: Δαφέρμος Βασίλειος ΤΜΗΜΑ ΠΟΛΙΤΙΚΗΣ ΕΠΙΣΤΗΜΗΣ ΣΧΟΛΗΣ ΚΟΙΝΩΝΙΚΩΝ

Διαβάστε περισσότερα

Τεχνικές Μείωσης Διαστάσεων. Ειδικά θέματα ψηφιακής επεξεργασίας σήματος και εικόνας Σ. Φωτόπουλος- Α. Μακεδόνας

Τεχνικές Μείωσης Διαστάσεων. Ειδικά θέματα ψηφιακής επεξεργασίας σήματος και εικόνας Σ. Φωτόπουλος- Α. Μακεδόνας Τεχνικές Μείωσης Διαστάσεων Ειδικά θέματα ψηφιακής επεξεργασίας σήματος και εικόνας Σ. Φωτόπουλος- Α. Μακεδόνας 1 Εισαγωγή Το μεγαλύτερο μέρος των δεδομένων που καλούμαστε να επεξεργαστούμε είναι πολυδιάστατα.

Διαβάστε περισσότερα

Σ.Ε.Π. (Σύνθετο Εργαστηριακό Περιβάλλον)

Σ.Ε.Π. (Σύνθετο Εργαστηριακό Περιβάλλον) ΔΡΑΣΤΗΡΙΟΤΗΤΑ: ΝΟΜΟΙ ΙΔΑΝΙΚΩΝ ΑΕΡΙΩΝ με τη βοήθεια του λογισμικού Σ.Ε.Π. (Σύνθετο Εργαστηριακό Περιβάλλον) Φυσική Β Λυκείου Θετικής & Τεχνολογικής Κατεύθυνσης Νοέμβριος 2013 0 ΤΙΤΛΟΣ ΝΟΜΟΙ ΙΔΑΝΙΚΩΝ ΑΕΡΙΩΝ

Διαβάστε περισσότερα

Εξαμηνιαία Εργασία Β. Κανονική Κατανομή - Επαγωγική Στατιστική

Εξαμηνιαία Εργασία Β. Κανονική Κατανομή - Επαγωγική Στατιστική 1 ΕΞΑΜΗΝΙΑΙΑ Β ΤΟ ΦΩΤΟΒΟΛΤΑΙΚΟ ΠΑΡΚΟ ΑΣΠΑΙΤΕ Τμήμα Εκπαιδευτικών Ηλεκτρολογίας Εργαστήριο Συλλογής και Επεξεργασίας Δεδομένων Διδάσκοντες: Σπύρος Αδάμ, Λουκάς Μιχάλης, Παναγιώτης Καράμπελας Εξαμηνιαία

Διαβάστε περισσότερα

ΕΛΕΓΧΟΣ ΠΑΡΑΓΩΓΙΚΩΝ ΔΙΕΡΓΑΣΙΩΝ

ΕΛΕΓΧΟΣ ΠΑΡΑΓΩΓΙΚΩΝ ΔΙΕΡΓΑΣΙΩΝ ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Ανώτατο Εκπαιδευτικό Ίδρυμα Πειραιά Τεχνολογικού Τομέα ΕΛΕΓΧΟΣ ΠΑΡΑΓΩΓΙΚΩΝ ΔΙΕΡΓΑΣΙΩΝ Ενότητα: Αναγνώριση Διεργασίας - Προσαρμοστικός Έλεγχος (Process Identification) Αλαφοδήμος Κωνσταντίνος

Διαβάστε περισσότερα

Πρόλογος... xv. Κεφάλαιο 1. Εισαγωγικές Έννοιες... 1

Πρόλογος... xv. Κεφάλαιο 1. Εισαγωγικές Έννοιες... 1 Πρόλογος... xv Κεφάλαιο 1. Εισαγωγικές Έννοιες... 1 1.1.Ιστορική Αναδρομή... 1 1.2.Βασικές Έννοιες... 5 1.3.Πλαίσιο ειγματοληψίας (Sampling Frame)... 9 1.4.Κατηγορίες Ιατρικών Μελετών.... 11 1.4.1.Πειραµατικές

Διαβάστε περισσότερα

Μέθοδοι Μηχανών Μάθησης για Ευφυή Αναγνώριση και ιάγνωση Ιατρικών εδοµένων

Μέθοδοι Μηχανών Μάθησης για Ευφυή Αναγνώριση και ιάγνωση Ιατρικών εδοµένων Μέθοδοι Μηχανών Μάθησης για Ευφυή Αναγνώριση και ιάγνωση Ιατρικών εδοµένων Εισηγητής: ρ Ηλίας Ζαφειρόπουλος Εισαγωγή Ιατρικά δεδοµένα: Συλλογή Οργάνωση Αξιοποίηση Data Mining ιαχείριση εδοµένων Εκπαίδευση

Διαβάστε περισσότερα

2. ΕΠΙΛΟΓΗ ΜΟΝΤΕΛΟΥ ΜΕ ΤΗ ΜΕΘΟΔΟ ΤΟΥ ΑΠΟΚΛΕΙΣΜΟΥ ΜΕΤΑΒΛΗΤΩΝ (Backward Elimination Procedure) Στην στατιστική βιβλιογραφία υπάρχουν πολλές μέθοδοι για

2. ΕΠΙΛΟΓΗ ΜΟΝΤΕΛΟΥ ΜΕ ΤΗ ΜΕΘΟΔΟ ΤΟΥ ΑΠΟΚΛΕΙΣΜΟΥ ΜΕΤΑΒΛΗΤΩΝ (Backward Elimination Procedure) Στην στατιστική βιβλιογραφία υπάρχουν πολλές μέθοδοι για 2. ΕΠΙΛΟΓΗ ΜΟΝΤΕΛΟΥ ΜΕ ΤΗ ΜΕΘΟΔΟ ΤΟΥ ΑΠΟΚΛΕΙΣΜΟΥ ΜΕΤΑΒΛΗΤΩΝ (Backward Elimination Procedure) Στην στατιστική βιβλιογραφία υπάρχουν πολλές μέθοδοι για τον καθορισμό του καλύτερου υποσυνόλου από ένα σύνολο

Διαβάστε περισσότερα

Μέρος Β /Στατιστική. Μέρος Β. Στατιστική. Γεωπονικό Πανεπιστήμιο Αθηνών Εργαστήριο Μαθηματικών&Στατιστικής/Γ. Παπαδόπουλος (www.aua.

Μέρος Β /Στατιστική. Μέρος Β. Στατιστική. Γεωπονικό Πανεπιστήμιο Αθηνών Εργαστήριο Μαθηματικών&Στατιστικής/Γ. Παπαδόπουλος (www.aua. Μέρος Β /Στατιστική Μέρος Β Στατιστική Γεωπονικό Πανεπιστήμιο Αθηνών Εργαστήριο Μαθηματικών&Στατιστικής/Γ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) Από τις Πιθανότητες στη Στατιστική Στα προηγούμενα, στο

Διαβάστε περισσότερα

Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500

Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500 Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500 Πληθυσμός Δείγμα Δείγμα Δείγμα Ο ρόλος της Οικονομετρίας Οικονομική Θεωρία Διατύπωση της

Διαβάστε περισσότερα

ΠΡΟΔΙΑΓΡΑΦΕΣ - ΟΔΗΓΙΕΣ ΔΙΑΜΟΡΦΩΣΗΣ ΘΕΜΑΤΩΝ ΓΙΑ ΤΟ ΜΑΘΗΜΑ

ΠΡΟΔΙΑΓΡΑΦΕΣ - ΟΔΗΓΙΕΣ ΔΙΑΜΟΡΦΩΣΗΣ ΘΕΜΑΤΩΝ ΓΙΑ ΤΟ ΜΑΘΗΜΑ ΠΡΟΔΙΑΓΡΑΦΕΣ - ΟΔΗΓΙΕΣ ΔΙΑΜΟΡΦΩΣΗΣ ΘΕΜΑΤΩΝ ΓΙΑ ΤΟ ΜΑΘΗΜΑ Μαθηματικά (Άλγεβρα - Γεωμετρία) Α ΤΑΞΗ ΗΜΕΡΗΣΙΟΥ και Α, Β ΤΑΞΕΙΣ ΕΣΠΕΡΙΝΟΥ ΓΕΝΙΚΟΥ ΛΥΚΕΙΟΥ Α ΤΑΞΗ ΗΜΕΡΗΣΙΟΥ και Α ΤΑΞΗ ΕΣΠΕΡΙΝΟΥ ΕΠΑΛ ΚΕΝΤΡΙΚΗ

Διαβάστε περισσότερα

ΑΚΑΔΗΜΙΑ ΤΩΝ ΠΟΛΙΤΩΝ

ΑΚΑΔΗΜΙΑ ΤΩΝ ΠΟΛΙΤΩΝ ΑΚΑΔΗΜΙΑ ΤΩΝ ΠΟΛΙΤΩΝ Αστική Μη Κερδοσκοπική Εταιρεία- ISO 9001 Σαπφούς 3, 81100 Μυτιλήνη (1ος Όροφος) 2251054739 (09:00-14:30) academy@aigaion.org civilacademy.ucoz.org «ΠΡΟΓΡΑΜΜΑ ΜΕΘΟΔΟΛΟΓΙΑΣ ΕΡΕΥΝΑΣ

Διαβάστε περισσότερα

Διάταξη Θεματικής Ενότητας ΕΠΑ51 / Εφαρμοσμένη Εκπαιδευτική Έρευνα

Διάταξη Θεματικής Ενότητας ΕΠΑ51 / Εφαρμοσμένη Εκπαιδευτική Έρευνα Διάταξη Θεματικής Ενότητας ΕΠΑ51 / Εφαρμοσμένη Εκπαιδευτική Έρευνα Σχολή ΣΑΚΕ Σχολή Ανθρωπιστικών και Κοινωνικών Επιστημών Πρόγραμμα Σπουδών ΕΠΑ Επιστημών της Αγωγής Θεματική Ενότητα ΕΠΑ51 Εφαρμοσμένη

Διαβάστε περισσότερα

Θεμελιώδεις αρχές επιστήμης και μέθοδοι έρευνας

Θεμελιώδεις αρχές επιστήμης και μέθοδοι έρευνας A. Montgomery Θεμελιώδεις αρχές επιστήμης και μέθοδοι έρευνας Καρολίνα Δουλουγέρη, ΜSc Υποψ. Διαδάκτωρ Σήμερα Αναζήτηση βιβλιογραφίας Επιλογή μεθοδολογίας Ερευνητικός σχεδιασμός Εγκυρότητα και αξιοπιστία

Διαβάστε περισσότερα

Ζητήματα ηήμ με τα δεδομένα

Ζητήματα ηήμ με τα δεδομένα Ζητήματα ηήμ με τα δεδομένα Ποιότητα Απαλοιφή θορύβου Εντοπισμός ανωμαλιών λώ Ελλιπείς τιμές Μετασχηματισμός Κβάντωση Μείωση μεγέθους Γραμμών: ειγματοληψία Στηλών: Ιδιοδιανύσματα, Επιλογή χαρακτηριστικών

Διαβάστε περισσότερα

Υπερπροσαρμογή (Overfitting) (1)

Υπερπροσαρμογή (Overfitting) (1) Αλγόριθμος C4.5 Αποφυγή υπερπροσαρμογής (overfitting) Reduced error pruning Rule post-pruning Χειρισμός χαρακτηριστικών συνεχών τιμών Επιλογή κατάλληλης μετρικής για την επιλογή των χαρακτηριστικών διάσπασης

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ 1 ΕΙΣΑΓΩΓΗ... 1 2 ΤΟ PASW ΜΕ ΜΙΑ ΜΑΤΙΑ... 13 3 ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ: Η ΜΕΣΗ ΤΙΜΗ ΚΑΙ Η ΔΙΑΜΕΣΟΣ... 29

ΠΕΡΙΕΧΟΜΕΝΑ 1 ΕΙΣΑΓΩΓΗ... 1 2 ΤΟ PASW ΜΕ ΜΙΑ ΜΑΤΙΑ... 13 3 ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ: Η ΜΕΣΗ ΤΙΜΗ ΚΑΙ Η ΔΙΑΜΕΣΟΣ... 29 ΠΕΡΙΕΧΟΜΕΝΑ 1 ΕΙΣΑΓΩΓΗ... 1 Μεταβλητές...5 Πληθυσμός, δείγμα...7 Το ευρύτερο γραμμικό μοντέλο...8 Αναφορές στη βιβλιογραφία... 11 2 ΤΟ PASW ΜΕ ΜΙΑ ΜΑΤΙΑ... 13 Περίληψη... 13 Εισαγωγή... 13 Με μια ματιά...

Διαβάστε περισσότερα

Ανάλυση Διασποράς Ανάλυση Διασποράς διακύμανση κατά παράγοντες διακύμανση σφάλματος Παράδειγμα 1: Ισομεγέθη δείγματα

Ανάλυση Διασποράς Ανάλυση Διασποράς διακύμανση κατά παράγοντες διακύμανση σφάλματος Παράδειγμα 1: Ισομεγέθη δείγματα Ανάλυση Διασποράς Έστω ότι μας δίνονται δείγματα που προέρχονται από άγνωστους πληθυσμούς. Πόσο διαφέρουν οι μέσες τιμές τους; Με άλλα λόγια: πόσο πιθανό είναι να προέρχονται από πληθυσμούς με την ίδια

Διαβάστε περισσότερα

ΕΠΙΣΤΗΜΟΝΙΚΟΙ ΥΠΟΛΟΓΙΣΜΟΙ: Μια ενδιαφέρουσα σταδιοδρομία

ΕΠΙΣΤΗΜΟΝΙΚΟΙ ΥΠΟΛΟΓΙΣΜΟΙ: Μια ενδιαφέρουσα σταδιοδρομία ΕΠΙΣΤΗΜΟΝΙΚΟΙ ΥΠΟΛΟΓΙΣΜΟΙ: Μια ενδιαφέρουσα σταδιοδρομία N. Μισυρλής (e-mail: nmis@di.uoa.gr) Τμήμα Πληροφορικής και Τηλεπικοινωνιών Πανεπιστήμιο Αθηνών Parallel Scientific Computing Laboratory (PSCL)

Διαβάστε περισσότερα

ΟΡΓΑΝΩΣΗ ΚΑΙ ΥΛΟΠΟΙΗΣΗ ΜΙΑΣ ΕΡΕΥΝΑΣ. ΜΑΝΟΥΣΟΣ ΕΜΜ. ΚΑΜΠΟΥΡΗΣ, ΒΙΟΛΟΓΟΣ, PhD ΙΑΤΡΙΚHΣ

ΟΡΓΑΝΩΣΗ ΚΑΙ ΥΛΟΠΟΙΗΣΗ ΜΙΑΣ ΕΡΕΥΝΑΣ. ΜΑΝΟΥΣΟΣ ΕΜΜ. ΚΑΜΠΟΥΡΗΣ, ΒΙΟΛΟΓΟΣ, PhD ΙΑΤΡΙΚHΣ ΟΡΓΑΝΩΣΗ ΚΑΙ ΥΛΟΠΟΙΗΣΗ ΜΙΑΣ ΕΡΕΥΝΑΣ ΜΑΝΟΥΣΟΣ ΕΜΜ. ΚΑΜΠΟΥΡΗΣ, ΒΙΟΛΟΓΟΣ, PhD ΙΑΤΡΙΚHΣ ΧΑΡΑΚΤΗΡΙΣΤΙΚΑ ΤΗΣ ΕΠΙΣΤΗΜΟΝΙΚΗΣ ΕΡΕΥΝΑΣ Η επιστημονική έρευνα στηρίζεται αποκλειστικά στη συστηματική μελέτη της εμπειρικής

Διαβάστε περισσότερα

Κεφάλαιο 9. Έλεγχοι υποθέσεων

Κεφάλαιο 9. Έλεγχοι υποθέσεων Κεφάλαιο 9 Έλεγχοι υποθέσεων 9.1 Εισαγωγή Όταν παίρνουμε ένα ή περισσότερα τυχαία δείγμα από κανονικούς πληθυσμούς έχουμε τη δυνατότητα να υπολογίζουμε στατιστικά, όπως μέσους όρους, δειγματικές διασπορές

Διαβάστε περισσότερα

Οι στατιστικοί έλεγχοι x τετράγωνο, t- test, ANOVA & Correlation. Σταμάτης Πουλακιδάκος

Οι στατιστικοί έλεγχοι x τετράγωνο, t- test, ANOVA & Correlation. Σταμάτης Πουλακιδάκος Οι στατιστικοί έλεγχοι x τετράγωνο, t- test, ANOVA & Correlation Σταμάτης Πουλακιδάκος Μερικά εισαγωγικά λόγια Οι έλεγχοι των ερευνητικών υποθέσεων πραγματοποιούνται με διάφορους στατιστικούς ελέγχους,

Διαβάστε περισσότερα

Συνοπτικά περιεχόμενα

Συνοπτικά περιεχόμενα b Συνοπτικά περιεχόμενα 1 Τι είναι η στατιστική;... 25 2 Περιγραφικές τεχνικές... 37 3 Επιστήμη και τέχνη των διαγραμματικών παρουσιάσεων... 119 4 Αριθμητικές μέθοδοι της περιγραφικής στατιστικής... 141

Διαβάστε περισσότερα

Αναγνώριση Προτύπων Ι

Αναγνώριση Προτύπων Ι Αναγνώριση Προτύπων Ι Ενότητα 1: Μέθοδοι Αναγνώρισης Προτύπων Αν. Καθηγητής Δερματάς Ευάγγελος Τμήμα Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται

Διαβάστε περισσότερα

Τα κύρια σηµεία της παρούσας διδακτορικής διατριβής είναι: Η πειραµατική µελέτη της µεταβατικής συµπεριφοράς συστηµάτων γείωσης

Τα κύρια σηµεία της παρούσας διδακτορικής διατριβής είναι: Η πειραµατική µελέτη της µεταβατικής συµπεριφοράς συστηµάτων γείωσης Κεφάλαιο 5 ΣΥΜΠΕΡΑΣΜΑΤΑ Το σηµαντικό στην επιστήµη δεν είναι να βρίσκεις καινούρια στοιχεία, αλλά να ανακαλύπτεις νέους τρόπους σκέψης γι' αυτά. Sir William Henry Bragg 5.1 Ανακεφαλαίωση της διατριβής

Διαβάστε περισσότερα

Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης

Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης 1 Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης Όπως γνωρίζουμε από προηγούμενα κεφάλαια, στόχος των περισσότερων στατιστικών αναλύσεων, είναι η έγκυρη γενίκευση των συμπερασμάτων, που προέρχονται από

Διαβάστε περισσότερα

Στόχος της ψυχολογικής έρευνας:

Στόχος της ψυχολογικής έρευνας: Στόχος της ψυχολογικής έρευνας: Συστηματική περιγραφή και κατανόηση των ψυχολογικών φαινομένων. Η ψυχολογική έρευνα χρησιμοποιεί μεθόδους συστηματικής διερεύνησης για τη συλλογή, την ανάλυση και την ερμηνεία

Διαβάστε περισσότερα

LOGO. Εξόρυξη Δεδομένων. Δειγματοληψία. Πίνακες συνάφειας. Καμπύλες ROC και AUC. Σύγκριση Μεθόδων Εξόρυξης

LOGO. Εξόρυξη Δεδομένων. Δειγματοληψία. Πίνακες συνάφειας. Καμπύλες ROC και AUC. Σύγκριση Μεθόδων Εξόρυξης Εξόρυξη Δεδομένων Δειγματοληψία Πίνακες συνάφειας Καμπύλες ROC και AUC Σύγκριση Μεθόδων Εξόρυξης Πασχάλης Θρήσκος PhD Λάρισα 2016-2017 pthriskos@mnec.gr LOGO Συμπερισματολογία - Τι σημαίνει ; Πληθυσμός

Διαβάστε περισσότερα

1 η ΕΡΓΑΣΤΗΡΙΑΚΗ ΑΣΚΗΣΗ

1 η ΕΡΓΑΣΤΗΡΙΑΚΗ ΑΣΚΗΣΗ ΑΕΙ ΠΕΙΡΑΙΑ ΤΤ ΤΜΗΜΑ ΜΗΧΑΝΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ Τ.Ε. ΕΡΓΑΣΤΗΡΙΟ ΜΗΧΑΝΙΚΗΣ ΤΩΝ ΡΕΥΣΤΩΝ Σκοπός της άσκησης 1 η ΕΡΓΑΣΤΗΡΙΑΚΗ ΑΣΚΗΣΗ Σκοπός αυτής της άσκησης είναι η εξοικείωση των σπουδαστών με τα σφάλματα που

Διαβάστε περισσότερα

Περιεχόμενα. Ανάλυση προβλήματος. Δομή ακολουθίας. Δομή επιλογής. Δομή επανάληψης. Απαντήσεις. 1. Η έννοια πρόβλημα Επίλυση προβλημάτων...

Περιεχόμενα. Ανάλυση προβλήματος. Δομή ακολουθίας. Δομή επιλογής. Δομή επανάληψης. Απαντήσεις. 1. Η έννοια πρόβλημα Επίλυση προβλημάτων... Περιεχόμενα Ανάλυση προβλήματος 1. Η έννοια πρόβλημα...13 2. Επίλυση προβλημάτων...17 Δομή ακολουθίας 3. Βασικές έννοιες αλγορίθμων...27 4. Εισαγωγή στην ψευδογλώσσα...31 5. Οι πρώτοι μου αλγόριθμοι...54

Διαβάστε περισσότερα

Οπτική αντίληψη. Μετά?..

Οπτική αντίληψη. Μετά?.. Οπτική αντίληψη Πρωτογενής ερεθισµός (φυσικό φαινόµενο) Μεταφορά µηνύµατος στον εγκέφαλο (ψυχολογική αντίδραση) Μετατροπή ερεθίσµατος σε έννοια Μετά?.. ΓΙΑ ΝΑ ΚΑΤΑΝΟΗΣΟΥΜΕ ΤΗΝ ΟΡΑΣΗ ΠΡΕΠΕΙ ΝΑ ΑΝΑΛΟΓΙΣΤΟΥΜΕ

Διαβάστε περισσότερα

Τα Διδακτικά Σενάρια και οι Προδιαγραφές τους. του Σταύρου Κοκκαλίδη. Μαθηματικού

Τα Διδακτικά Σενάρια και οι Προδιαγραφές τους. του Σταύρου Κοκκαλίδη. Μαθηματικού Τα Διδακτικά Σενάρια και οι Προδιαγραφές τους του Σταύρου Κοκκαλίδη Μαθηματικού Διευθυντή του Γυμνασίου Αρχαγγέλου Ρόδου-Εκπαιδευτή Στα προγράμματα Β Επιπέδου στις ΤΠΕ Ορισμός της έννοιας του σεναρίου.

Διαβάστε περισσότερα

Ιδιότητες και Τεχνικές Σύνταξης Επιστημονικού Κειμένου Σχολιασμός ερευνητικής πρότασης

Ιδιότητες και Τεχνικές Σύνταξης Επιστημονικού Κειμένου Σχολιασμός ερευνητικής πρότασης Ιδιότητες και Τεχνικές Σύνταξης Επιστημονικού Κειμένου Σχολιασμός ερευνητικής πρότασης Αναστασία Χριστοδούλου, Dr. Γεώργιος Δαμασκηνίδης Τμήμα Ιταλικής Γλώσσας & Φιλολογίας Θεσσαλονίκη, 2015 Ιδιότητες

Διαβάστε περισσότερα

ΔΗΜΟΚΡΙΤΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΡΑΚΗΣ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΙΑΣ. Μεταπτυχιακό πρόγραμμα ΑΣΚΗΣΗ ΚΑΙ ΠΟΙΟΤΗΤΑ ΖΩΗΣ ΠΛΗΡΟΦΟΡΙΑΚΟ ΕΝΤΥΠΟ ΜΑΘΗΜΑΤΟΣ

ΔΗΜΟΚΡΙΤΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΡΑΚΗΣ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΙΑΣ. Μεταπτυχιακό πρόγραμμα ΑΣΚΗΣΗ ΚΑΙ ΠΟΙΟΤΗΤΑ ΖΩΗΣ ΠΛΗΡΟΦΟΡΙΑΚΟ ΕΝΤΥΠΟ ΜΑΘΗΜΑΤΟΣ ΔΗΜΟΚΡΙΤΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΡΑΚΗΣ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΙΑΣ Μεταπτυχιακό πρόγραμμα ΑΣΚΗΣΗ ΚΑΙ ΠΟΙΟΤΗΤΑ ΖΩΗΣ ΠΛΗΡΟΦΟΡΙΑΚΟ ΕΝΤΥΠΟ ΜΑΘΗΜΑΤΟΣ 1. ΤΙΤΛΟΣ ΜΑΘΗΜΑΤΟΣ: Θεωρία και εφαρμογές επεξεργασίας πληροφορίας 2.

Διαβάστε περισσότερα

ΑΛΓΟΡΙΘΜΟΣ ΕΠΙΛΟΓΗΣ ΥΠΟΠΙΝΑΚΑ ΜΕ ΤΗΝ ΠΛΗΣΙΕΣΤΕΡΗ ΑΠΕΙΚΟΝΙΣΗ ΜΕΣΩ ΤΗΣ AFC ΣΤΟ ΓΕΝΙΚΕΥΜΕΝΟ ΠΙΝΑΚΑ

ΑΛΓΟΡΙΘΜΟΣ ΕΠΙΛΟΓΗΣ ΥΠΟΠΙΝΑΚΑ ΜΕ ΤΗΝ ΠΛΗΣΙΕΣΤΕΡΗ ΑΠΕΙΚΟΝΙΣΗ ΜΕΣΩ ΤΗΣ AFC ΣΤΟ ΓΕΝΙΚΕΥΜΕΝΟ ΠΙΝΑΚΑ Ελληνικό Στατιστικό Ινστιτούτο Πρακτικά 18 ου Πανελληνίου Συνεδρίου Στατιστικής (2005) σελ.247-256 ΑΛΓΟΡΙΘΜΟΣ ΕΠΙΛΟΓΗΣ ΥΠΟΠΙΝΑΚΑ ΜΕ ΤΗΝ ΠΛΗΣΙΕΣΤΕΡΗ ΑΠΕΙΚΟΝΙΣΗ ΜΕΣΩ ΤΗΣ AFC ΣΤΟ ΓΕΝΙΚΕΥΜΕΝΟ ΠΙΝΑΚΑ ΣΥΜΠΤΩΣΕΩΝ

Διαβάστε περισσότερα

Κεφάλαιο 9. Έλεγχοι υποθέσεων

Κεφάλαιο 9. Έλεγχοι υποθέσεων Κεφάλαιο 9 Έλεγχοι υποθέσεων 9.1 Εισαγωγή Όταν παίρνουμε ένα ή περισσότερα τυχαία δείγμα από κανονικούς πληθυσμούς έχουμε τη δυνατότητα να υπολογίζουμε στατιστικά, όπως μέσους όρους, δειγματικές διασπορές

Διαβάστε περισσότερα

Εισαγωγή στην επιστήμη και την επιστημονική μέθοδο

Εισαγωγή στην επιστήμη και την επιστημονική μέθοδο Εισαγωγή στην επιστήμη και την επιστημονική μέθοδο I. Τι είναι η επιστήμη; A. Ο στόχος της επιστήμης είναι να διερευνήσει και να κατανοήσει τον φυσικό κόσμο, για να εξηγήσει τα γεγονότα στο φυσικό κόσμο,

Διαβάστε περισσότερα

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Κ. Μ. 436

ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Κ. Μ. 436 ΠΕΡΙΓΡΑΦΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Ι Κ. Μ. 436 A εξάμηνο 2009-2010 Περιγραφική Στατιστική Ι users.att.sch.gr/abouras abouras@sch.gr sch.gr abouras@uth.gr Μέτρα θέσης Η θέση αντιπροσωπεύει τη θέση της κατανομής κατά

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 5. Κύκλος Ζωής Εφαρμογών ΕΝΟΤΗΤΑ 2. Εφαρμογές Πληροφορικής. Διδακτικές ενότητες 5.1 Πρόβλημα και υπολογιστής 5.2 Ανάπτυξη εφαρμογών

ΚΕΦΑΛΑΙΟ 5. Κύκλος Ζωής Εφαρμογών ΕΝΟΤΗΤΑ 2. Εφαρμογές Πληροφορικής. Διδακτικές ενότητες 5.1 Πρόβλημα και υπολογιστής 5.2 Ανάπτυξη εφαρμογών 44 Διδακτικές ενότητες 5.1 Πρόβλημα και υπολογιστής 5.2 Ανάπτυξη εφαρμογών Διδακτικοί στόχοι Σκοπός του κεφαλαίου είναι οι μαθητές να κατανοήσουν τα βήματα που ακολουθούνται κατά την ανάπτυξη μιας εφαρμογής.

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ Εισαγωγή Μεθοδολογία της Έρευνας ΕΙΚΟΝΑ 1-1 Μεθοδολογία της έρευνας.

ΚΕΦΑΛΑΙΟ Εισαγωγή Μεθοδολογία της Έρευνας ΕΙΚΟΝΑ 1-1 Μεθοδολογία της έρευνας. ΚΕΦΑΛΑΙΟ 1 Εισαγωγή Η Μεθοδολογία της Έρευνας (research methodology) είναι η επιστήμη που αφορά τη μεθοδολογία πραγματοποίησης μελετών με συστηματικό, επιστημονικό και λογικό τρόπο, με σκοπό την παραγωγή

Διαβάστε περισσότερα

Κεφάλαιο Τέσσερα Αριθμητικές Μέθοδοι Περιγραφικής Στατιστικής

Κεφάλαιο Τέσσερα Αριθμητικές Μέθοδοι Περιγραφικής Στατιστικής Κεφάλαιο Τέσσερα Αριθμητικές Μέθοδοι Περιγραφικής Στατιστικής Copyright 2009 Cengage Learning 4.1 Αριθμητικές Μέθοδοι Περιγραφικής Στατιστικής Δείκτες Κεντρικής Θέσης [Αριθμητικός] Μέσος, Διάμεσος, Επικρατούσα

Διαβάστε περισσότερα

Κεφάλαιο 20. Ανακάλυψη Γνώσης σε Βάσεις δεδοµένων. Τεχνητή Νοηµοσύνη - Β' Έκδοση Ι. Βλαχάβας, Π. Κεφαλάς, Ν. Βασιλειάδης, Φ. Κόκκορας, Η.

Κεφάλαιο 20. Ανακάλυψη Γνώσης σε Βάσεις δεδοµένων. Τεχνητή Νοηµοσύνη - Β' Έκδοση Ι. Βλαχάβας, Π. Κεφαλάς, Ν. Βασιλειάδης, Φ. Κόκκορας, Η. Κεφάλαιο 20 Ανακάλυψη Γνώσης σε Βάσεις δεδοµένων Τεχνητή Νοηµοσύνη - Β' Έκδοση Ι. Βλαχάβας, Π. Κεφαλάς, Ν. Βασιλειάδης, Φ. Κόκκορας, Η. Σακελλαρίου Τεχνητή Νοηµοσύνη, B' Έκδοση - 1 - Ανακάλυψη Γνώσης σε

Διαβάστε περισσότερα

Συνήθεις διαφορικές εξισώσεις προβλήματα οριακών τιμών

Συνήθεις διαφορικές εξισώσεις προβλήματα οριακών τιμών Συνήθεις διαφορικές εξισώσεις προβλήματα οριακών τιμών Οι παρούσες σημειώσεις αποτελούν βοήθημα στο μάθημα Αριθμητικές Μέθοδοι του 5 ου εξαμήνου του ΤΜΜ ημήτρης Βαλουγεώργης Καθηγητής Εργαστήριο Φυσικών

Διαβάστε περισσότερα

1.1 Εξόρυξη πληροφορίας: Ορισμός Τι μπορούν να μάθουν οι υπολογιστές 33 Τρεις θεωρήσεις για τις έννοιες 34 Καθοδηγούμενη εκμάθηση 36

1.1 Εξόρυξη πληροφορίας: Ορισμός Τι μπορούν να μάθουν οι υπολογιστές 33 Τρεις θεωρήσεις για τις έννοιες 34 Καθοδηγούμενη εκμάθηση 36 1.1 Εξόρυξη πληροφορίας: Ορισμός 32 1.2 Τι μπορούν να μάθουν οι υπολογιστές 33 Τρεις θεωρήσεις για τις έννοιες 34 Καθοδηγούμενη εκμάθηση 36 Καθοδηγούμενη εκμάθηση: Παράδειγμα δένδρου αποφάσεων 37 Μη καθοδηγούμενη

Διαβάστε περισσότερα

Στατιστικές συναρτήσεις Γραφική και πινακοποιημένη αναπαράσταση δεδομένων (ιστόγραμμα) Διαχειριστής Σεναρίων Κινητός Μέσος σε Χρονοσειρές o o o

Στατιστικές συναρτήσεις Γραφική και πινακοποιημένη αναπαράσταση δεδομένων (ιστόγραμμα) Διαχειριστής Σεναρίων Κινητός Μέσος σε Χρονοσειρές o o o ΙΩΑΝΝΗΣ Κ. ΔΗΜΗΤΡΙΟΥ Εφαρμογές Ποσοτικές Ανάλυσης με το Excel 141 ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ Ανάλυση Δεδομένων Στατιστικές συναρτήσεις Γραφική και πινακοποιημένη αναπαράσταση δεδομένων (ιστόγραμμα) Διαχειριστής

Διαβάστε περισσότερα

Τα σχέδια μαθήματος 1 Εισαγωγή

Τα σχέδια μαθήματος 1 Εισαγωγή Τα σχέδια μαθήματος 1 Εισαγωγή Τα σχέδια μαθήματος αποτελούν ένα είδος προσωπικών σημειώσεων που κρατά ο εκπαιδευτικός προκειμένου να πραγματοποιήσει αποτελεσματικές διδασκαλίες. Περιέχουν πληροφορίες

Διαβάστε περισσότερα

ΤΟΠΟΓΡΑΦΙΚΑ ΔΙΚΤΥΑ ΚΑΙ ΥΠΟΛΟΓΙΣΜΟΙ ΑΝΑΣΚΟΠΗΣΗ ΘΕΩΡΙΑΣ ΣΥΝΟΡΘΩΣΕΩΝ

ΤΟΠΟΓΡΑΦΙΚΑ ΔΙΚΤΥΑ ΚΑΙ ΥΠΟΛΟΓΙΣΜΟΙ ΑΝΑΣΚΟΠΗΣΗ ΘΕΩΡΙΑΣ ΣΥΝΟΡΘΩΣΕΩΝ ΤΟΠΟΓΡΑΦΙΚΑ ΔΙΚΤΥΑ ΚΑΙ ΥΠΟΛΟΓΙΣΜΟΙ ΑΝΑΣΚΟΠΗΣΗ ΘΕΩΡΙΑΣ ΣΥΝΟΡΘΩΣΕΩΝ Βασίλης Δ. Ανδριτσάνος Δρ. Αγρονόμος - Τοπογράφος Μηχανικός ΑΠΘ Επίκουρος Καθηγητής ΤΕΙ Αθήνας 3ο εξάμηνο http://eclass.teiath.gr Παρουσιάσεις,

Διαβάστε περισσότερα

Περιεχόμενο του μαθήματος

Περιεχόμενο του μαθήματος ΤΕΧΝΟΛΟΓΙΑ ΛΟΓΙΣΜΙΚΟΥ Απαιτήσεις Λογισμικού Περιπτώσεις χρήσης Δρ Βαγγελιώ Καβακλή Τμήμα Πολιτισμικής Τεχνολογίας και Επικοινωνίας Πανεπιστήμιο Αιγαίου Εαρινό Εξάμηνο 2012-2013 1 Περιεχόμενο του μαθήματος

Διαβάστε περισσότερα

Αναγνώριση Προτύπων Ι

Αναγνώριση Προτύπων Ι Αναγνώριση Προτύπων Ι Ενότητα 3: Στοχαστικά Συστήματα Αν. Καθηγητής Δερματάς Ευάγγελος Τμήμα Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες

Διαβάστε περισσότερα

Ανάλυση και Σχεδιασμός Μεταφορών Ι Γένεση Μετακινήσεων

Ανάλυση και Σχεδιασμός Μεταφορών Ι Γένεση Μετακινήσεων Γένεση Μετακινήσεων Παναγιώτης Παπαντωνίου Δρ. Πολιτικός Μηχανικός, Συγκοινωνιολόγος ppapant@upatras.gr Πάτρα, 2017 Εισαγωγή Αθροιστικά μοντέλα (Aggregate models) Ανάλυση κατά ζώνη πόσες μετακινήσεις ξεκινούν

Διαβάστε περισσότερα

Δειγματοληψία στην Ερευνα. Ετος

Δειγματοληψία στην Ερευνα. Ετος ΓΕΩΠΟΝΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ Τμήμα Αγροτικής Οικονομίας & Ανάπτυξης Μέθοδοι Γεωργοοικονομικής και Κοινωνιολογικής Ερευνας Δειγματοληψία στην Έρευνα (Μέθοδοι Δειγματοληψίας - Τρόποι Επιλογής Τυχαίου Δείγματος)

Διαβάστε περισσότερα

Περιεχόμενα. Πρώτος πρόλογος... 13 Δεύτερος Πρόλογος... 15 Αντί Προλόγου... 17 Εισαγωγικό σημείωμα επιμελητών... 25

Περιεχόμενα. Πρώτος πρόλογος... 13 Δεύτερος Πρόλογος... 15 Αντί Προλόγου... 17 Εισαγωγικό σημείωμα επιμελητών... 25 Περιεχόμενα Πρώτος πρόλογος... 13 Δεύτερος Πρόλογος... 15 Αντί Προλόγου... 17 Εισαγωγικό σημείωμα επιμελητών... 25 ΚΕΦΑΛΑΙΟ 1 Στόχος και στάδια διεξαγωγής της εμπειρικής κοινωνικής έρευνας... 27 1.1 Στόχοι

Διαβάστε περισσότερα

ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΠΟΛΙΤΙΚΩΝ ΜΗΧΑΝΙΚΩΝ ΤΟΜΕΑΣ ΥΔΡΑΥΛΙΚΗΣ ΚΑΙ ΤΕΧΝΙΚΗΣ ΠΕΡΙΒΑΛΛΟΝΤΟΣ

ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΠΟΛΙΤΙΚΩΝ ΜΗΧΑΝΙΚΩΝ ΤΟΜΕΑΣ ΥΔΡΑΥΛΙΚΗΣ ΚΑΙ ΤΕΧΝΙΚΗΣ ΠΕΡΙΒΑΛΛΟΝΤΟΣ ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΠΟΛΙΤΙΚΩΝ ΜΗΧΑΝΙΚΩΝ ΤΟΜΕΑΣ ΥΔΡΑΥΛΙΚΗΣ ΚΑΙ ΤΕΧΝΙΚΗΣ ΠΕΡΙΒΑΛΛΟΝΤΟΣ ΕΥΑΓΓΕΛΙΑΣ Π. ΛΟΥΚΟΓΕΩΡΓΑΚΗ Διπλωματούχου Πολιτικού Μηχανικού ΟΛΟΚΛΗΡΩΜΕΝΟ

Διαβάστε περισσότερα

Μεθοδολογία ερευνητικής εργασίας

Μεθοδολογία ερευνητικής εργασίας Μεθοδολογία ερευνητικής εργασίας Σύντομος οδηγός επιβίωσης Μεθοδολογία Ερευνητικής Εργασίας: Γ. Τράπαλης & Ά. Μητρέλης 1 Τι είναι Έρευνα: η παραγωγή πρωτότυπων αποτελεσμάτων μέσω της συστηματικής, ορθολογικής

Διαβάστε περισσότερα

τρόπος για να εμπεδωθεί η θεωρία. Για την επίλυση των παραδειγμάτων χρησιμοποιούνται στατιστικά πακέτα, ώστε να είναι δυνατή η ανάλυση μεγάλου όγκου

τρόπος για να εμπεδωθεί η θεωρία. Για την επίλυση των παραδειγμάτων χρησιμοποιούνται στατιστικά πακέτα, ώστε να είναι δυνατή η ανάλυση μεγάλου όγκου ΠΡΟΛΟΓΟΣ Η γραμμική παλινδρόμηση χρησιμοποιείται για την μελέτη των σχέσεων μεταξύ μετρήσιμων μεταβλητών. Γενικότερα, η γραμμική στατιστική συμπερασματολογία αποτελεί ένα ευρύ πεδίο της στατιστικής ανάλυσης

Διαβάστε περισσότερα

Βιοστατιστική ΒΙΟ-309

Βιοστατιστική ΒΙΟ-309 Βιοστατιστική ΒΙΟ-309 Χειμερινό Εξάμηνο Ακαδ. Έτος 2015-2016 Ντίνα Λύκα lika@biology.uoc.gr 1. Εισαγωγή Εισαγωγικές έννοιες Μεταβλητότητα : ύπαρξη διαφορών μεταξύ ομοειδών μετρήσεων Μεταβλητή: ένα χαρακτηριστικό

Διαβάστε περισσότερα

Ανακάλυψη κανόνων συσχέτισης από εκπαιδευτικά δεδομένα

Ανακάλυψη κανόνων συσχέτισης από εκπαιδευτικά δεδομένα 6ο Πανελλήνιο Συνέδριο των Εκπαιδευτικών για τις ΤΠΕ «Αξιοποίηση των Τεχνολογιών της Πληροφορίας και της Επικοινωνίας στη Διδακτική Πράξη» Σύρος 6-8 Μαϊου 2011 Ανακάλυψη κανόνων συσχέτισης από εκπαιδευτικά

Διαβάστε περισσότερα

Η ΜΕΘΟΔΟΣ PCA (Principle Component Analysis)

Η ΜΕΘΟΔΟΣ PCA (Principle Component Analysis) Η ΜΕΘΟΔΟΣ PCA (Principle Component Analysis) Η μέθοδος PCA (Ανάλυση Κύριων Συνιστωσών), αποτελεί μία γραμμική μέθοδο συμπίεσης Δεδομένων η οποία συνίσταται από τον επαναπροσδιορισμό των συντεταγμένων ενός

Διαβάστε περισσότερα

Σκοπός του κεφαλαίου είναι η κατανόηση των βασικών στοιχείων μιας στατιστικής έρευνας.

Σκοπός του κεφαλαίου είναι η κατανόηση των βασικών στοιχείων μιας στατιστικής έρευνας. 7 ο ΜΑΘΗΜΑ ΚΕΦΑΛΑΙΟ 2 ΣΤΑΤΙΣΤΙΚΗ Σκοπός Σκοπός του κεφαλαίου είναι η κατανόηση των βασικών στοιχείων μιας στατιστικής έρευνας. Προσδοκώμενα αποτελέσματα Όταν θα έχετε ολοκληρώσει τη μελέτη αυτού του κεφαλαίου

Διαβάστε περισσότερα

Περιγραφή του εκπαιδευτικού/ μαθησιακού υλικού (Teaching plan)

Περιγραφή του εκπαιδευτικού/ μαθησιακού υλικού (Teaching plan) On-the-fly feedback, Upper Secondary Περιγραφή του εκπαιδευτικού/ μαθησιακού υλικού (Teaching plan) Τάξη: Β Λυκείου Διάρκεια ενότητας Μάθημα: Φυσική Θέμα: Ταλαντώσεις (αριθμός Χ διάρκεια μαθήματος): 6X90

Διαβάστε περισσότερα

Κύρια σημεία. Η έννοια του μοντέλου. Έρευνα στην εφαρμοσμένη Στατιστική. ΈρευναστηΜαθηματικήΣτατιστική. Αντικείμενο της Μαθηματικής Στατιστικής

Κύρια σημεία. Η έννοια του μοντέλου. Έρευνα στην εφαρμοσμένη Στατιστική. ΈρευναστηΜαθηματικήΣτατιστική. Αντικείμενο της Μαθηματικής Στατιστικής Κύρια σημεία Ερευνητική Μεθοδολογία και Μαθηματική Στατιστική Απόστολος Μπουρνέτας Τμήμα Μαθηματικών ΕΚΠΑ Αναζήτηση ερευνητικού θέματος Εισαγωγή στην έρευνα Ολοκλήρωση ερευνητικής εργασίας Ο ρόλος των

Διαβάστε περισσότερα

Αριθμητική πρόγνωση καιρού και η συμβολή της στην πρόγνωση τοπικών πλημμυρών

Αριθμητική πρόγνωση καιρού και η συμβολή της στην πρόγνωση τοπικών πλημμυρών Αριθμητική πρόγνωση καιρού και η συμβολή της στην πρόγνωση τοπικών πλημμυρών Αναστάσιος Παπαδόπουλος Ινστιτούτο Θαλάσσιων Βιολογικών Πόρων και Εσωτερικών Υδάτων Πρόγνωση Καιρού Οι πρώτες επιστημονικές

Διαβάστε περισσότερα

Εισαγωγικό Μάθημα Βασικές Έννοιες - Ανάλυση Απαιτήσεων

Εισαγωγικό Μάθημα Βασικές Έννοιες - Ανάλυση Απαιτήσεων ..?????? Εργαστήριο ΒΑΣΕΙΣ????????? ΔΕΔΟΜΕΝΩΝ Βάσεων Δεδομένων?? ΙΙ Εισαγωγικό Μάθημα Βασικές Έννοιες - . Γενικά Τρόπος Διεξαγωγής Ορισμός: Βάση Δεδομένων (ΒΔ) είναι μια συλλογή από σχετιζόμενα αντικείμενα

Διαβάστε περισσότερα

Στατιστική Επιχειρήσεων ΙΙ

Στατιστική Επιχειρήσεων ΙΙ ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Ανώτατο Εκπαιδευτικό Ίδρυμα Πειραιά Τεχνολογικού Τομέα Στατιστική Επιχειρήσεων ΙΙ Ενότητα #4: Έλεγχος Υποθέσεων Μιλτιάδης Χαλικιάς Τμήμα Διοίκησης Επιχειρήσεων Άδειες Χρήσης Το παρόν

Διαβάστε περισσότερα

Σκοπός του μαθήματος

Σκοπός του μαθήματος Σκοπός του μαθήματος Στο μάθημα αυτό γίνεται εφαρμογή, με τη βοήθεια του υπολογιστή και τη χρήση του στατιστικού προγράμματος S.P.S.S., της στατιστικής θεωρίας που αναπτύχθηκε στα μαθήματα «Εισαγωγή στη

Διαβάστε περισσότερα

2 ΟΥ και 8 ΟΥ ΚΕΦΑΛΑΙΟΥ

2 ΟΥ και 8 ΟΥ ΚΕΦΑΛΑΙΟΥ ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ ΠΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ ΠΕΡΙΒΑΛΛΟΝ ΕΠΙΜΕΛΕΙΑ: ΜΑΡΙΑ Σ. ΖΙΩΓΑ ΚΑΘΗΓΗΤΡΙΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΘΕΩΡΙΑ 2 ΟΥ και 8 ΟΥ ΚΕΦΑΛΑΙΟΥ ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΔΟΜΗ ΕΠΑΝΑΛΗΨΗΣ 1) Πότε χρησιμοποιείται η δομή επανάληψης

Διαβάστε περισσότερα

ΠΡΟΒΛΕΨΗ ΧΡΕΟΚΟΠΙΑΣ ΜΕ ΜΕΘΟΔΟΥΣ ΕΞΟΡΥΞΗΣ ΓΝΩΣΗΣ ΑΠΟ ΔΕΔΟΜΕΝΑ(DATA MINING)

ΠΡΟΒΛΕΨΗ ΧΡΕΟΚΟΠΙΑΣ ΜΕ ΜΕΘΟΔΟΥΣ ΕΞΟΡΥΞΗΣ ΓΝΩΣΗΣ ΑΠΟ ΔΕΔΟΜΕΝΑ(DATA MINING) ΤΕΙ ΙΟΝΙΩΝ ΝΗΣΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΓΩΝ ΠΛΗΡΟΦΟΡΙΚΗΣ ΣΤΗ ΔΙΟΙΚΗΣΗ ΚΑΙ ΤΗΝ ΟΙΚΟΝΟΜΙΑ ΠΡΟΒΛΕΨΗ ΧΡΕΟΚΟΠΙΑΣ ΜΕ ΜΕΘΟΔΟΥΣ ΕΞΟΡΥΞΗΣ ΓΝΩΣΗΣ ΑΠΟ ΔΕΔΟΜΕΝΑ(DATA MINING) Των σπουδαστών Σκλαβενίτης Αργύρης (Α.Μ. 535) Στασινός

Διαβάστε περισσότερα

6 ο ΜΑΘΗΜΑ Έλεγχοι Υποθέσεων

6 ο ΜΑΘΗΜΑ Έλεγχοι Υποθέσεων 6 ο ΜΑΘΗΜΑ Έλεγχοι Υποθέσεων 6.1 Το Πρόβλημα του Ελέγχου Υποθέσεων Ενός υποθέσουμε ότι μία φαρμακευτική εταιρεία πειραματίζεται πάνω σε ένα νέο φάρμακο για κάποια ασθένεια έχοντας ως στόχο, τα πρώτα θετικά

Διαβάστε περισσότερα

ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ ΜΑΡΚΕΤΙΝΓΚ

ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ ΜΑΡΚΕΤΙΝΓΚ ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ ΜΑΡΚΕΤΙΝΓΚ Ενότητα 2: Μάρκετινγκ Στόχοι Αποφάσεις Ιδεολογία Ανάλυση Στρατηγικής Βλαχοπούλου Μάρω Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons.

Διαβάστε περισσότερα

Πέτρος Γαλάνης, MPH, PhD Εργαστήριο Οργάνωσης και Αξιολόγησης Υπηρεσιών Υγείας Τμήμα Νοσηλευτικής, Πανεπιστήμιο Αθηνών

Πέτρος Γαλάνης, MPH, PhD Εργαστήριο Οργάνωσης και Αξιολόγησης Υπηρεσιών Υγείας Τμήμα Νοσηλευτικής, Πανεπιστήμιο Αθηνών Πέτρος Γαλάνης, MPH, PhD Εργαστήριο Οργάνωσης και Αξιολόγησης Υπηρεσιών Υγείας Τμήμα Νοσηλευτικής, Πανεπιστήμιο Αθηνών Σχέση μεταξύ εμβολίων και αυτισμού Θέση ύπνου των βρεφών και συχνότητα εμφάνισης του

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 1ο ΑΝΑΛΥΣΗ ΠΡΟΒΛΗΜΑΤΟΣ

ΚΕΦΑΛΑΙΟ 1ο ΑΝΑΛΥΣΗ ΠΡΟΒΛΗΜΑΤΟΣ ΚΕΦΑΛΑΙΟ 1ο ΑΝΑΛΥΣΗ ΠΡΟΒΛΗΜΑΤΟΣ Στέργιος Παλαμάς 2006- ΣΤΟΧΟΙ ΚΕΦΑΛΑΙΟΥ: Πλήρης Κατανόηση του Προβλήματος Προσδιορισμός των Συστατικών Μερών του Προβλήματος Ανάλυση Προβλήματος σε απλούστερα Προσδιορισμός

Διαβάστε περισσότερα

Έρευνα Μάρκετινγκ Ενότητα 5

Έρευνα Μάρκετινγκ Ενότητα 5 ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Ενότητα 5 : Μέθοδοι Στατιστικής Ανάλυσης Χριστίνα Μπουτσούκη Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative

Διαβάστε περισσότερα

ΑΝΑΛΥΣΗ ΠΟΙΟΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ. Γεράσιμος Παπαναστασάτος, Ph.D. Αθήνα, Σεπτέμβριος 2016

ΑΝΑΛΥΣΗ ΠΟΙΟΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ. Γεράσιμος Παπαναστασάτος, Ph.D. Αθήνα, Σεπτέμβριος 2016 ΑΝΑΛΥΣΗ ΠΟΙΟΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ Γεράσιμος Παπαναστασάτος, Ph.D. Αθήνα, Σεπτέμβριος 2016 ΚΕΘΕΑ Τομέας Έρευνας Η ποιοτική έρευνα επιχειρεί να περιγράψει, αναλύσει, κατανοήσει, ερμηνεύσει κοινωνικά φαινόμενα,

Διαβάστε περισσότερα

ΑΝΑΛΥΣΗ ΠΟΙΟΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ

ΑΝΑΛΥΣΗ ΠΟΙΟΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ ΑΝΑΛΥΣΗ ΠΟΙΟΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ Γεράσιμος Παπαναστασάτος, Ph.D. Αθήνα, Σεπτέμβριος 2016 ΚΕΘΕΑ Τομέας Έρευνας Η ποιοτική έρευνα επιχειρεί να περιγράψει, αναλύσει, κατανοήσει, ερμηνεύσει κοινωνικά φαινόμενα,

Διαβάστε περισσότερα

ΕΠΙΣΤΗΜΟΝΙΚΟΙ ΥΠΟΛΟΓΙΣΜΟΙ: Μια ενδιαφέρουσα σταδιοδρομία

ΕΠΙΣΤΗΜΟΝΙΚΟΙ ΥΠΟΛΟΓΙΣΜΟΙ: Μια ενδιαφέρουσα σταδιοδρομία ΕΠΙΣΤΗΜΟΝΙΚΟΙ ΥΠΟΛΟΓΙΣΜΟΙ: Μια ενδιαφέρουσα σταδιοδρομία N. Μισυρλής (e-mail: nmis@di.uoa.gr) Τμήμα Πληροφορικής και Τηλεπικοινωνιών Πανεπιστήμιο Αθηνών Parallel Scientific Computing Laboratory (PSCL)

Διαβάστε περισσότερα

ΠΛΑΙΣΙΟ ΣΤΟΧΑΣΤΙΚΗΣ ΠΡΟΣΟΜΟΙΩΣΗΣ ΓΙΑ ΤΗΝ ΕΚΤΙΜΗΣΗ ΧΑΡΑΚΤΗΡΙΣΤΙΚΩΝ ΥΔΡΟΛΟΓΙΚΩΝ & ΕΝΕΡΓΕΙΑΚΩΝ ΜΕΓΕΘΩΝ

ΠΛΑΙΣΙΟ ΣΤΟΧΑΣΤΙΚΗΣ ΠΡΟΣΟΜΟΙΩΣΗΣ ΓΙΑ ΤΗΝ ΕΚΤΙΜΗΣΗ ΧΑΡΑΚΤΗΡΙΣΤΙΚΩΝ ΥΔΡΟΛΟΓΙΚΩΝ & ΕΝΕΡΓΕΙΑΚΩΝ ΜΕΓΕΘΩΝ ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΔΠΜΣ ΕΠΙΣΤΗΜΗ & ΤΕΧΝΟΛΟΓΙΑ ΥΔΑΤΙΚΩΝ ΠΟΡΩΝ ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ ΠΛΑΙΣΙΟ ΣΤΟΧΑΣΤΙΚΗΣ ΠΡΟΣΟΜΟΙΩΣΗΣ ΓΙΑ ΤΗΝ ΕΚΤΙΜΗΣΗ ΧΑΡΑΚΤΗΡΙΣΤΙΚΩΝ ΥΔΡΟΛΟΓΙΚΩΝ & ΕΝΕΡΓΕΙΑΚΩΝ ΜΕΓΕΘΩΝ ΕΚΠΟΝΗΣΗ: ΙΩΑΝΝΑ

Διαβάστε περισσότερα

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Στατιστική II Διάλεξη 1 η : Εισαγωγή-Επανάληψη βασικών εννοιών Εβδομάδα 1 η : ,

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Στατιστική II Διάλεξη 1 η : Εισαγωγή-Επανάληψη βασικών εννοιών Εβδομάδα 1 η : , Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Στατιστική II Διάλεξη 1 η : Εισαγωγή-Επανάληψη βασικών εννοιών Εβδομάδα 1 η :1-0-017, 3-0-017 Διδάσκουσα: Κοντογιάννη Αριστούλα Σκοπός του μαθήματος Η παρουσίαση

Διαβάστε περισσότερα

ΑΝΑΛΥΣΗ ΠΟΙΟΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ

ΑΝΑΛΥΣΗ ΠΟΙΟΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ ΑΝΑΛΥΣΗ ΠΟΙΟΤΙΚΩΝ ΔΕΔΟΜΕΝΩΝ Τομέας Έρευνας ΚΕΘΕΑ Η ποιοτική έρευνα επιχειρεί να περιγράψει, αναλύσει, κατανοήσει, ερμηνεύσει κοινωνικά φαινόμενα, έννοιες ή συμπεριφορές επιχειρεί να απαντήσει το γιατί

Διαβάστε περισσότερα

Μεθοδολογία των Επιστημών του Ανθρώπου: Στατιστική

Μεθοδολογία των Επιστημών του Ανθρώπου: Στατιστική Μεθοδολογία των Επιστημών του Ανθρώπου: Στατιστική Ενότητα 2: Βασίλης Γιαλαμάς Σχολή Επιστημών της Αγωγής Τμήμα Εκπαίδευσης και Αγωγής στην Προσχολική Ηλικία Περιεχόμενα ενότητας Παρουσιάζονται οι βασικές

Διαβάστε περισσότερα

Οικονομετρία Ι. Ενότητα 4: Διάστημα Εμπιστοσύνης - Έλεγχος Υποθέσεων. Δρ. Χαϊδώ Δριτσάκη Τμήμα Λογιστικής & Χρηματοοικονομικής

Οικονομετρία Ι. Ενότητα 4: Διάστημα Εμπιστοσύνης - Έλεγχος Υποθέσεων. Δρ. Χαϊδώ Δριτσάκη Τμήμα Λογιστικής & Χρηματοοικονομικής Οικονομετρία Ι Ενότητα 4: Διάστημα Εμπιστοσύνης - Έλεγχος Υποθέσεων Δρ. Χαϊδώ Δριτσάκη Τμήμα Λογιστικής & Χρηματοοικονομικής Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative

Διαβάστε περισσότερα

Μηχανική Λογισμικού για Διαδικτυακές & Φορητές Εφαρμογές

Μηχανική Λογισμικού για Διαδικτυακές & Φορητές Εφαρμογές Μεταπτυχιακό Δίπλωμα Ειδίκευσης Μηχανική Λογισμικού για Διαδικτυακές & Φορητές Εφαρμογές Δρ. Κακαρόντζας Γεώργιος Επίκουρος Καθηγητής Τμ. Μηχανικών Πληροφορικής Τ.Ε. Μηχανική Λογισμικού για Διαδικτυακές

Διαβάστε περισσότερα

ΔΗΜΟΚΡΙΤΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΡΑΚΗΣ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΙΑΣ. Μεταπτυχιακό πρόγραμμα ΑΣΚΗΣΗ ΚΑΙ ΠΟΙΟΤΗΤΑ ΖΩΗΣ ΠΛΗΡΟΦΟΡΙΑΚΟ ΕΝΤΥΠΟ ΜΑΘΗΜΑΤΟΣ

ΔΗΜΟΚΡΙΤΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΡΑΚΗΣ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΙΑΣ. Μεταπτυχιακό πρόγραμμα ΑΣΚΗΣΗ ΚΑΙ ΠΟΙΟΤΗΤΑ ΖΩΗΣ ΠΛΗΡΟΦΟΡΙΑΚΟ ΕΝΤΥΠΟ ΜΑΘΗΜΑΤΟΣ ΔΗΜΟΚΡΙΤΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΡΑΚΗΣ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΙΑΣ Μεταπτυχιακό πρόγραμμα ΑΣΚΗΣΗ ΚΑΙ ΠΟΙΟΤΗΤΑ ΖΩΗΣ ΠΛΗΡΟΦΟΡΙΑΚΟ ΕΝΤΥΠΟ ΜΑΘΗΜΑΤΟΣ 1. ΤΙΤΛΟΣ ΜΑΘΗΜΑΤΟΣ: Θεωρία και Εφαρμογές Επεξεργασίας Πληροφορίας 2.

Διαβάστε περισσότερα