ΤΕΧΝΙΚΕΣ ΠΡΟΒΛΕΨΗΣ ΠΟΛΛΑΠΛΩΝ ΜΕΤΑΒΛΗΤΩΝ ΕΞΟΔΟΥ

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "ΤΕΧΝΙΚΕΣ ΠΡΟΒΛΕΨΗΣ ΠΟΛΛΑΠΛΩΝ ΜΕΤΑΒΛΗΤΩΝ ΕΞΟΔΟΥ"

Transcript

1 ΤΕΧΝΙΚΕΣ ΠΡΟΒΛΕΨΗΣ ΠΟΛΛΑΠΛΩΝ ΜΕΤΑΒΛΗΤΩΝ ΕΞΟΔΟΥ Συγγραφέας: Αικατερίνη Βρέκου Επιβλέπων: Δρ. Γρηγόριος Τσουμάκας, Λέκτορας ΜΕΤΑΠΤΥΧΙΑΚΗ ΕΡΓΑΣΙΑ ως μέρος των υποχρεώσεων για τη λήψη του ΜΕΤΑΠΤΥΧΙΑΚΟΥ ΔΙΠΛΩΜΑΤΟΣ στην ΠΛΗΡΟΦΟΡΙΚΗ με εξειδίκευση στα ΠΛΗΡΟΦΟΡΙΑΚΑ ΣΥΣΤΗΜΑΤΑ Τμήμα Πληροφορικής, Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης Θεσσαλονίκη Φεβρουάριος 2013

2 ii ΠΕΡΙΛΗΨΗ Αικατερίνη Βρέκου του Γεωργίου και της Δήμητρας. MSc, Τμήμα Πληροφορικής, Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης, Φεβρουάριος, Τίτλος: Τεχνικές Πρόβλεψης Πολλαπλών Μεταβλητών Εξόδου. Επιβλέπων: Γρηγόριος Τσουμάκας. Η παρούσα διατριβή πραγματεύεται το πρόβλημα της ταυτόχρονης πρόβλεψης πολλαπλών αριθμητικών μεταβλητών εξόδου (στόχων). Αρχικά περιγράφονται γνωστές μέθοδοι τόσο απλής παλινδρόμησης, όσο και παλινδρόμησης πολλαπλών στόχων, ενώ παρουσιάζονται και οι μετρικές αξιολόγησης μοντέλων παλινδρόμησης. Στη διατριβή προτείνεται μία νέα μέθοδος παλινδρόμησης πολλαπλών στόχων, που προσεγγίζει το πρόβλημα των πολλαπλών μεταβλητών εξόδου, μετασχηματίζοντας το σε πρόβλημα με μία μεταβλητή εξόδου. Υποθέτει πως οι μεταβλητές εξόδου εμφανίζουν γραμμική συσχέτιση μεταξύ τους και χρησιμοποιεί τυχαίους γραμμικούς συνδυασμούς των μεταβλητών αυτών κατά το μετασχηματισμό των δεδομένων. Τέλος χρησιμοποιεί μία ομάδα από τέτοιου είδους μοντέλα πρόβλεψης για να αυξήσει τη συνολική ακρίβεια. Σκοπός αυτής της τεχνικής είναι να εκμεταλλευτεί την πληροφορία που μπορεί να αποφέρουν οι συσχετίσεις των μεταβλητών εξόδου για την επίλυση του προβλήματος.

3 iii EXTENDED ABSTRACT IN ENGLISH Vrekou Aikaterini, G. MSc, Computer Science Department, Aristotle University of Thessaloniki, Greece. February, Title: Multi-Output Prediction Techniques. Supervisor: Grigorios Tsoumakas. In this dissertation we studied the problem of predictive learning and more specifically the problem of predicting multiple attributes at once. We mostly focused on regression, where the output variables are numeric. At first, we present some known regression and multi-target regression techniques and also the metrics that can be used for evaluating regression models. The next chapters include a presentation of a proposed method for multi-target regression. This method transforms the multi-target problem into a single-target one, by making the assumption that the target attributes are correlated linearly and thus using random linear combinations of these target attributes during the transformation process. Finally it uses an ensemble of models of that kind to increase the predictive performance of the system. The goal of this technique is to take advantage of any information that can be provided from the fact that the output attributes may be related. The dissertation is organized as follows: In Chapter 2 we present the background knowledge necessary to understand the notions that are used in the following chapters. We describe the Machine Learning field and its categorization. In addition, we analyze regression and the metrics that can be used in this domain. Finally, ensembles are presented, along with their creation methodology. Chapter 3 is dedicated to multi-target regression, that is the prediction of multiple numeric attributes at once. We mention the most popular methods that are able to address this task. In Chapter 4 the proposed method that we mentioned above is presented, which is applied in

4 multi-target regression tasks. We analyze the methodology of the algorithm and make some important notes. iv In Chapter 5 the experimental framework that was used for the evaluation of our method is discussed. We describe the datasets that were used for the evaluation and present the calculated results. Finally Chapter 6 consist of the conclusions of this project and some proposals for future work.

5 v ΕΥΧΑΡΙΣΤΙΕΣ Η διατριβή αυτή εκπονήθηκε κατά τη διάρκεια του 3ου εξαμήνου των μεταπτυχιακών σπουδών στο Τμήμα Πληροφορικής του Αριστοτελείου Πανεπιστημίου Θεσσαλονίκης, στα πλαίσια των υποχρεώσεων για τη λήψη του Μεταπτυχιακού Διπλώματος στην Πληροφορική με εξειδίκευση στα Πληροφοριακά Συστήματα. Θα ήθελα να ευχαριστήσω καταρχήν τον κ. Γρηγόριο Τσουμάκα, επιβλέποντα καθηγητή της διατριβής μου και καθηγητή μου από το δεύτερο εξάμηνο εισαγωγής μου στο μεταπτυχιακό πρόγραμμα σπουδών του τμήματος Πληροφορικής, ο οποίος επέλεξε και το συγκεκριμένο θέμα της εργασίας, ένα θέμα που κράτησε το ενδιαφέρον μου από την πρώτη μέρα της ενασχόλησης μου μαζί του. Τον ευχαριστώ για την άψογη συνεργασία μας, για το γεγονός πως ήταν πάντα πρόθυμος να με καθοδηγεί και συμβουλεύει αλλά και την εμπιστοσύνη που μου έδειξε. Επίσης, ευχαριστώ θερμά τους γονείς μου, Δήμητρα και Γιώργο, για τη συμπαράσταση και την αγάπη τους που μου έδειξαν σε όλα τα χρόνια των σπουδών μου και για την εμπιστοσύνη και υποστήριξη σε όλα τα σχέδιά μου. Τέλος, ένα μεγάλο ευχαριστώ στους φίλους μου και στον αδερφό μου για τη συμπαράσταση τους όταν τη χρειαζόμουν και για την σημαντική ενθάρρυνση που μου προσφέρουν απλόχερα. Στον Αχιλλέα, τον Νίκο, την Αγγελική, την Κατερίνα, τον Γιώργο, την Κωνσταντίνα. Τους ευχαριστώ ιδιαίτερα που με στηρίζουν και πιστεύουν σε μένα.

6 vi ΠΕΡΙΕΧΟΜΕΝΑ ΠΕΡΙΛΗΨΗ...ii EXTENDED ABSTRACT IN ENGLISH...iii ΕΥΧΑΡΙΣΤΙΕΣ...v ΠΕΡΙΕΧΟΜΕΝΑ...vi ΕΥΡΕΤΗΡΙΟ ΠΙΝΑΚΩΝ...viii ΕΥΡΕΤΗΡΙΟ ΕΙΚΟΝΩΝ...ix ΣΥΝΤΟΜΟΓΡΑΦΙΕΣ...x ΚΕΦΑΛΑΙΟ 1.ΕΙΣΑΓΩΓΗ Περιγραφή του προβλήματος Δομή Διατριβής...2 ΚΕΦΑΛΑΙΟ 2.ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ Μηχανική Μάθηση Κατηγορίες Μηχανικής Μάθησης...5 Μάθηση με επίβλεψη...6 Μάθηση χωρίς επίβλεψη Παλινδρόμηση (regression)...7 Γραμμική Παλινδρόμηση...9 Παλινδρόμηση Ridge (ridge regression)...9 Νευρωνικά Δίκτυα...10 Παλινδρόμηση Διανυσμάτων Υποστήριξης...12 Regression trees και model trees Μετρικές Αξιολόγησης Παλινδρόμησης...14 Mean Squared Error (MSE)...14 Root Mean Squared Error (RMSE)...14 Mean Absolute Error (MAE)...15 Ο συντελεστής R Relative Squared Error (RSE), Root Relative Squared Error (RRSE) και Relative Absolute Error (RAE)...15 Συντελεστής Συσχέτισης (Correlation Coefficient CC) Ομάδες Μοντέλων...16 ΚΕΦΑΛΑΙΟ 3.ΠΑΛΙΝΔΡOΜΗΣΗ ΠΟΛΛΑΠΛΩΝ ΣΤΟΧΩΝ MULTI-TARGET REGRESSION Περιγραφή Παλινδρόμησης Πολλαπλών Στόχων Δημοφιλέστερες μέθοδοι...20 Single Target method (ST)...21 Multi-Target Rules...21 Multi Target Regression Trees (MTRT)...22 Stacked Regression...23 Classifier Chains...24 ΚΕΦΑΛΑΙΟ 4.Ο ΑΛΓΟΡΙΘΜΟΣ RANDOM LINEAR COMBINATIONS...25

7 4.1 Περιγραφή του αλγορίθμου RLC Παρατηρήσεις σχετικά με τον αλγόριθμο RLC...28 ΚΕΦΑΛΑΙΟ 5.ΠΕΙΡΑΜΑΤΙΚΗ ΜΕΛΕΤΗ Πειραματική διαδικασία Περιγραφή των συνόλων δεδομένων Αποτελέσματα...33 ΚΕΦΑΛΑΙΟ 6.ΣΥΜΠΕΡΑΣΜΑΤΑ...40 ΒΙΒΛΙΟΓΡΑΦΙΑ...42 vii

8 viii ΕΥΡΕΤΗΡΙΟ ΠΙΝΑΚΩΝ Πίνακας 5.1: Στατιστικά των συνόλων δεδομένων που χρησιμοποιήθηκαν κατά την αξιολόγηση.. 31 Πίνακας 5.2: Συγκεντρωτικά αποτελέσματα των μεθόδων RLC και ST στα αρχικά σύνολα δεδομένων...39 Πίνακας 5.3: Συγκεντρωτικά αποτελέσματα των μεθόδων RLC και ST στα σύνολα δεδομένων μετά την κανονικοποίηση...39

9 ix ΕΥΡΕΤΗΡΙΟ ΕΙΚΟΝΩΝ Εικόνα 2.1: Παράδειγμα τεχνητού νευρωνικού δικτύου...11 Εικόνα 2.2: Το υπερεπίπεδο μέγιστου περιθωρίου...12 Εικόνα 2.3: Παράδειγμα Regression Tree...13 Εικόνα 2.4: Παράδειγμα Model Tree...13 Εικόνα 3.1: Παράδειγμα Multi Target Regression Tree...23 Εικόνα 5.1: Αποτελέσματα στο κανονικοποιημένο σύνολο δεδομένων Solar Flare Εικόνα 5.2: Αποτελέσματα στο σύνολο δεδομένων Solar Flare Εικόνα 5.3: Αποτελέσματα στο σύνολο δεδομένων Solar Flare Εικόνα 5.4: Αποτελέσματα στο κανονικοποιημένο σύνολο δεδομένων Solar Flare Εικόνα 5.5: Αποτελέσματα στο σύνολο κανονικοποιημένο δεδομένων Water Quality...34 Εικόνα 5.6: Αποτελέσματα στο σύνολο δεδομένων Water Quality...34 Εικόνα 5.7: Αποτελέσματα στο σύνολο δεδομένων River Flow...35 Εικόνα 5.8: Αποτελέσματα στο κανονικοποιημένο σύνολο δεδομένων River Flow...35 Εικόνα 5.9: Αποτελέσματα στο κανονικοποιημένο σύνολο δεδομένων ATP1d...36 Εικόνα 5.10: Αποτελέσματα στο σύνολο δεδομένων ATP1d...36 Εικόνα 5.11: Αποτελέσματα στο σύνολο δεδομένων ATP7d...36 Εικόνα 5.12: Αποτελέσματα στο κανονικοποιημένο σύνολο δεδομένων ATP7d...36 Εικόνα 5.13: Αποτελέσματα στο κανονικοποιημένο σύνολο δεδομένων SCM1d...37 Εικόνα 5.14: Αποτελέσματα στο σύνολο δεδομένων SCM1d...37 Εικόνα 5.15: Αποτελέσματα στο σύνολο δεδομένων SCM20d...38 Εικόνα 5.16: Αποτελέσματα στο κανονικοποιημένο σύνολο δεδομένων SCM20d...38

10 x ΣΥΝΤΟΜΟΓΡΑΦΙΕΣ ΜΜ Μηχανική Μάθηση ΤΝ Τεχνητή Νοημοσύνη SSR Sum of Squared Residuals BLUE Best Linear Unbiased Estimator SVM Support Vector Machines MSE Mean Squared Error RMSE Root Mean Squared Error MAE Mean Absolute Error CC Correlation Coefficient MTR Multi-Target Regression ST Single Target MTRT Multi Target Regression Tree PCT Predictive Clustering Tree RLC Random Linear Combinations

11 1 ΚΕΦΑΛΑΙΟ 1. ΕΙΣΑΓΩΓΗ 1.1 Περιγραφή του προβλήματος 1.2 Δομή Διατριβής Πολύ συχνά οι επιστήμονες της Πληροφορικής βρίσκονται αντιμέτωποι με ένα πολύπλοκο πρόβλημα: αυτό της τεράστιας αύξησης του όγκου δεδομένων. Δεδομένα παράγονται σε διάφορες δραστηριότητες της καθημερινής ζωής και με πολλούς τρόπους. Στην εργασία, στο σπίτι, στο πανεπιστήμιο, μέσω υπολογιστών, έξυπνων κινητών τηλεφώνων ή tablets η παραγωγή νέων δεδομένων γίνεται ασταμάτητα με γοργούς ρυθμούς. Όμως αυτά δεν αποτελούν από μόνα τους πληροφορία. Χρειάζεται κάποιο είδος οργάνωσης τους που θα βοηθά στην παραγωγή χρήσιμων συμπερασμάτων και θα συμβάλλει κατά συνέπεια στην αύξηση της γνώσης. 1.1 Περιγραφή του προβλήματος Ο τεράστιος διαθέσιμος όγκος δεδομένων δεν είναι δυνατόν να επεξεργαστεί χειροκίνητα. Είναι απαραίτητη, επομένως, η ανάπτυξη αυτοματοποιημένων τεχνικών επεξεργασίας δεδομένων που θα έχουν υποβοηθητικό ρόλο στη διαδικασία ανακάλυψης γνώσης. Ένας τρόπος οργάνωσης της γνώσης είναι η εύρεση προτύπων και η δημιουργία μοντέλων από τα δεδομένα, πράγμα που αποτελεί και το αντικείμενο της Μηχανικής Μάθησης. Η Μηχανική Μάθηση είναι ένας γενικός όρος που περιλαμβάνει αρκετές τεχνικές και μεθόδους μάθησης από δεδομένα. Μία δημοφιλής κατηγορία προβλημάτων Μηχανικής Μάθησης είναι τα προβλήματα πρόβλεψης. Στη πρόβλεψη, προσπαθούμε να εξάγουμε χρήσιμες πληροφορίες παρατηρώντας τη φύση των δεδομένων. Πιο συγκεκριμένα, προσπαθούμε να προβλέψουμε την τιμή κάποιων άγνωστων χαρακτηριστικών με βάση την προγενέστερη γνώση που διαθέτουμε επάνω στο πρόβλημα. Η τιμή των χαρακτηριστικών μπορεί να είναι είτε δυαδική (0/1, υπάρχει/δεν υπάρχει), είτε αριθμητική. Παραδείγματος χάρη, μία τράπεζα θα μπορούσε να αποφασίζει αν θα πρέπει να δοθεί δάνειο σε έναν πελάτη ή όχι (δυαδικό χαρακτηριστικό) με βάση χαρακτηριστικά όπως το μηνιαίο εισόδημά του, την ηλικία του, την οικογενειακή του κατάσταση και την

12 2 περιουσιακή του κατάσταση. Επίσης, μία ομάδα δασολόγων θα μπορούσε να προβλέψει το ύψος που θα φτάσει ένα δέντρο (αριθμητικό χαρακτηριστικό) με βάση το είδος του δέντρου, τα συστατικά του χώματος, το υψόμετρο κλπ. Η διαδικασία της μάθησης για την πρόβλεψη περιλαμβάνει λειτουργίες όπως η επιλογή της κατάλληλης μεθόδου για το πρόβλημα και η ρύθμιση των παραμέτρων της μεθόδου. Η επιλογή αυτή επηρεάζει την ακρίβεια του μοντέλου πρόβλεψης που προκύπτει. Εκτός από την ίδια την πρόβλεψη, και η μορφή του μοντέλου πρόβλεψης μπορεί με τη σειρά της να αποτελεί χρήσιμη πληροφορία για το πρόβλημα. Αυτό όμως σημαίνει πως θα πρέπει να είναι απλό και εύκολα ερμηνεύσιμο από τον άνθρωπο. Στην πράξη βέβαια, όσο πιο ακριβές είναι ένα μοντέλο, τόσο μεγαλύτερη πολυπλοκότητα εμφανίζει. Συνεπώς η επιλογή του μοντέλου θα πρέπει να είναι βασισμένη στις ανάγκες του προβλήματος και σε τι αυτό στοχεύει: απλότητα ή μεγάλη ακρίβεια. 1.2 Δομή Διατριβής Η εργασία ασχολείται με αυτό ακριβώς το αντικείμενο, την πρόβλεψη. Εξετάζονται οι τεχνικές μάθησης που βοηθούν στην πρόβλεψη αριθμητικών συγκεκριμένα χαρακτηριστικών και μάλιστα δίνεται ιδιαίτερα βάση σε αυτές που μπορούν να προβλέπουν περισσότερα του ενός χαρακτηριστικά. Επίσης προτείνεται ένας αλγόριθμος πρόβλεψης πολλαπλών αριθμητικών μεταβλητών που εκμεταλλεύεται τις συσχετίσεις μεταξύ των μεταβλητών αυτών. Παρουσιάζεται η πειραματική αξιολόγηση του αλγορίθμου, ενώ τέλος αναφέρονται τα συμπεράσματα που προέκυψαν από την αξιολόγηση καθώς και προτάσεις για μελλοντική έρευνα. Αναλυτικά, η δομή της εργασίας είναι η ακόλουθη: Στο κεφάλαιο 2 παρουσιάζεται το υπόβαθρο που είναι απαραίτητο για την κατανόηση της ορολογίας που χρησιμοποιείται στη συνέχεια. Αναλύεται εκτενέστερα το πεδίο της Μηχανικής Μάθησης και αναφέρονται οι κατηγορίες στις οποίες αυτή διακρίνεται. Επίσης, γίνεται ιδιαίτερη αναφορά στην παλινδρόμηση, που είναι γενικά η πρόβλεψη ενός αριθμητικού χαρακτηριστικού, αλλά και στις κυριότερες μετρικές αξιολόγησης των μοντέλων παλινδρόμησης. Τέλος περιγράφουμε την μέθοδο των ομάδων μοντέλων, πως αυτές δημιουργούνται και που μπορούν να εφαρμοστούν. Το κεφάλαιο 3 είναι αφιερωμένο στην παλινδρόμηση πολλαπλών στόχων, η οποία είναι υποκατηγορία της παλινδρόμησης και στοχεύει στην πρόβλεψη πολλαπλών αριθμητικών

13 χαρακτηριστικών ταυτόχρονα. Ακόμη αναφέρονται οι δημοφιλέστερες μέθοδοι με τις οποίες επιλύονται αυτού του είδους τα προβλήματα μάθησης. 3 Στο κεφάλαιο 4 γίνεται η παρουσίαση του αλγορίθμου που προτείνει η συγκεκριμένη εργασία και ο οποίος εφαρμόζεται σε προβλήματα παλινδρόμησης πολλαπλών στόχων. Πραγματοποιείται η περιγραφή του ενώ ακολουθούν μερικές παρατηρήσεις και σημεία άξια προσοχής στον αλγόριθμο αυτό. Το κεφάλαιο 5 αποτελεί την πειραματική αξιολόγηση του αλγορίθμου που προτείνεται. Αναφέρονται τα σύνολα δεδομένων που χρησιμοποιήθηκαν, καθώς και η συγκεκριμένη μέθοδος αξιολόγησης που εφαρμόστηκε. Φυσικά παρουσιάζονται τα αποτελέσματα που προέκυψαν από την αξιολόγηση. Τέλος στο κεφάλαιο 6 αναφέρονται τα συμπεράσματα που μπόρεσαν να εξαχθούν από αυτήν την εργασία με βάση τα αποτελέσματα του κεφαλαίου 5, ενώ αναλύονται και τα σημεία που θα μπορούσαν να αποτελέσουν το έναυσμα περαιτέρω μελέτης.

14 4 ΚΕΦΑΛΑΙΟ 2. ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ 2.1 Μηχανική Μάθηση 2.2 Κατηγορίες Μηχανικής Μάθησης 2.3 Παλινδρόμηση (regression) 2.4 Μετρικές Αξιολόγησης Παλινδρόμησης 2.5 Ομάδες Μοντέλων Στο συγκεκριμένο κεφάλαιο αναλύονται οι βασικές έννοιες που χρησιμοποιούνται στην παρούσα εργασία και είναι απαραίτητες ως υπόβαθρο για την κατανόηση όσων ακολουθούν στη συνέχεια. Αρχικά αναφέρουμε συνοπτικά τι ακριβώς είναι η μηχανική μάθηση και με τι ασχολείται. Παρουσιάζουμε τα είδη στα οποία μπορούμε να διακρίνουμε τη μηχανική μάθηση και περιγράφουμε αναλυτικά τα προβλήματα παλινδρόμησης καθώς και κάποιες από τις βασικές μεθόδους επίλυσης τέτοιων προβλημάτων. Στη συνέχεια αναφέρουμε τις κυριότερες μετρικές και μεθόδους που χρησιμοποιούνται για την αξιολόγηση των διαφόρων τεχνικών και αλγορίθμων παλινδρόμησης και πως αυτές μπορούν να εφαρμοστούν. Τέλος εξηγούμε τι είναι οι ομάδες μοντέλων, με ποιο τρόπο δημιουργούνται και τι πλεονεκτήματα μπορούν να επιφέρουν στα προβλήματα μάθησης. 2.1 Μηχανική Μάθηση Η Μηχανική Μάθηση (ΜΜ) έχει της ρίζες της στην Τεχνητή Νοημοσύνη και αποτελεί εξέλιξη της. Αφορά στην κατασκευή αλγορίθμων και στην ανάπτυξη τεχνικών για την εξαγωγή νέας γνώσης από δεδομένα. Επίσης στοχεύει στη δημιουργία μοντέλων και προτύπων για την οργάνωση της ήδη υπάρχουσας γνώσης. Οι αλγόριθμοι και τα μοντέλα ΜΜ έχουν τη δυνατότητα να βελτιώνονται αυτόματα με την εμπειρία. Η Μηχανική Μάθηση μπορεί να συσχετιστεί άμεσα τόσο με την Εξόρυξη Δεδομένων (Data Mining) όσο και με την Ανακάλυψη Γνώσης από Βάσεις Δεδομένων (Knowledge Discovery in Databases) καθώς και τα δύο αυτά πεδία δανείζονται τις τεχνικές και τους αλγορίθμους από τη ΜΜ

15 5 για τη διαδικασία της ανακάλυψης γνώσης. Επίσης αλγόριθμοι Μηχανικής Μάθησης μπορούν να εφαρμοστούν και για την Αναγνώριση Προτύπων (Pattern Recognition), και μάλιστα κυρίως όσοι υποστηρίζουν τον χειρισμό αριθμητικών δεδομένων. Ακόμη, μπορούμε να πούμε ότι η ΜΜ σχετίζεται σημαντικά και με το πεδίο της Στατιστικής, ειδικά στο κομμάτι της ανάλυσης δεδομένων αλλά και των μετρικών αξιολόγησης, μερικές από τις οποίες θα αναφερθούν και στη συνέχεια. Υπάρχουν διάφοροι ορισμοί για τη Μηχανική Μάθηση. Ενδεικτικά αναφέρουμε τον ορισμό του (Mitchell, 1997): Ένα πρόγραμμα υπολογιστή θεωρείται ότι μαθαίνει από την εμπειρία Ε σε σχέση με μία κατηγορία εργασιών Τ και μία μετρική απόδοσης P, αν η απόδοση του σε εργασίες της Τ, όπως μετριούνται από την P, βελτιώνονται με την εμπειρία Ε. και τον ορισμό του (Carbonell, 1987): Μηχανική Μάθηση είναι η μελέτη υπολογιστικών μεθόδων για την απόκτηση νέας γνώσης, νέων δεξιοτήτων και νέων τρόπων οργάνωσης της υπάρχουσας γνώσης.. Οι εφαρμογές της καλύπτουν ένα ευρύ φάσμα αναγκών. Για παράδειγμα, η ΜΜ εφαρμόζεται στην Βιοπληροφορική (στοίχιση ακολουθιών, ανάλυση δεδομένων από μικροσυστοιχίες), στην Μηχανική Όραση (αναγνώριση αντικειμένων, τμηματοποίηση εικόνας), στην Ρομποτική (υπολογισμός κατάστασης, λήψη απόφασης), στην Ομιλία (αναγνώριση, εξακρίβωση ομιλητή), στην Οικονομία (πρόβλεψη τιμής μετοχών), στην Φαρμακευτική (διάγνωση, θεραπεία, σχεδίαση φαρμάκων), στα Παιχνίδια (σχεδιασμός ικανών και προσαρμόσιμων αντιπάλων) και στα Πολυμέσα (ανάκτηση με βάση το περιεχόμενο). Σε όλες αυτές τις εφαρμογές μπορούμε να διακρίνουμε ορισμένα χαρακτηριστικά, τα οποία είναι ενδεικτικά των περιπτώσεων στις οποίες η Μηχανική Μάθηση μπορεί να δώσει λύση. Τέτοια χαρακτηριστικά είναι τα εξής: δεν υπάρχει άνθρωπος ειδικός (πχ. ανάλυση DNA), υπάρχει συχνή αλλαγή συμπεριφοράς (πχ. πρόβλεψη τιμής μετοχών) και υπάρχει τεράστιος όγκος δεδομένων που απαιτούνται για την αντιμετώπιση του προβλήματος (αναγνώριση προτύπων σε κείμενο). Σε τέτοιες περιπτώσεις που φαίνονται απρόσιτες για την επίλυση τους από τον ανθρώπινο νου, οδηγούμαστε σε λύσεις που παρέχονται από τς μεθόδους της Μηχανικής Μάθησης. 2.2 Κατηγορίες Μηχανικής Μάθησης Έως σήμερα έχουν αναπτυχθεί διάφοροι αλγόριθμοι ΜΜ, αρκετά διαφορετικοί μεταξύ τους, τους οποίους όμως μπορούμε να εντάξουμε σε δύο κατηγορίες της Μηχανικής Μάθησης: την μάθηση με επίβλεψη (Supervised Learning) και την μάθηση χωρίς επίβλεψη (Unsupervised Learning).

16 6 Μάθηση με επίβλεψη Στην μάθηση με επίβλεψη ο στόχος είναι η δημιουργία ενός μοντέλου που θα μάθει μία έννοια ή μία συνάρτηση από παραδείγματα τα οποία περιγράφουν το μοντέλο αυτό. Ονομάζεται έτσι από το γεγονός ότι θεωρούμε πως υπάρχει κάποιος επιβλέπων που γνωρίζει και παρέχει την τιμή εξόδου της συνάρτησης για τα παραδείγματα που εξετάζονται. Επομένως, πριν από την κατασκευή του μοντέλου υπάρχει κάποια επιπρόσθετη πληροφορία, η οποία είναι η τιμή εξόδου για ένα σύνολο από γνωστά παραδείγματα, τα οποία ανήκουν στο σύνολο εκπαίδευσης (training set). Μετά την κατασκευή του, το μοντέλο είναι δυνατό να γενικευτεί και να προβλέψει την έξοδο για παραδείγματα για τα οποία αυτή δεν είναι γνωστή. Ο (Vapnik, 1999) ορίζει τη μάθηση με επίβλεψη ως εξής: Η μάθηση με επίβλεψη αποτελείται από τρία συστατικά: 1) τυχαία διανύσματα x ανεξάρτητα μεταξύ τους που ακολουθούν μία καθορισμένη, αλλά άγνωστη κατανομή D(x), 2) έναν υποθετικό επιβλέποντα που επιστρέφει ένα διάνυσμα y για κάθε x, σύμφωνα με μία καθορισμένη, αλλά άγνωστη κατανομή υπό συνθήκη D(y, x), και 3) ένα σύνολο από συναρτήσεις μοντελοποίησης f(x, β), όπου β = (β 1, β 2,...) είναι μία μετά-παράμετρος που καθορίζει τη συνάρτηση μέσα στο σύνολο. Ο στόχος είναι η εύρεση του β έτσι ώστε η συνάρτηση f(x, β) να προσεγγίζει με όσο το δυνατόν μεγαλύτερη ακρίβεια τις απαντήσεις του επιβλέποντα. Για την αξιολόγηση της ακρίβειας του μοντέλου χρειαζόμαστε ένα νέο σύνολο παραδειγμάτων για τα οποία είναι γνωστή η έξοδος τους σε μας, αλλά στο μοντέλο θεωρούνται άγνωστα καθώς δε συμπεριλαμβάνονται στο σύνολο εκπαίδευσης, και που ονομάζεται σύνολο ελέγχου (test set). Σε πολλές περιπτώσεις όμως τα δεδομένα δεν είναι αρκετά έτσι ώστε να χωριστούν σε δύο διαφορετικά σύνολα (τα σύνολα εκπαίδευσης και ελέγχου) και να κατασκευαστεί ένα αξιόπιστο μοντέλο. Για το λόγο αυτό είναι διαδεδομένη η τεχνική της διασταύρωσης (cross-validation). Σύμφωνα με την τεχνική αυτή: 1) τα δεδομένα χωρίζονται σε k υποσύνολα ίσου μεγέθους και 2) χρησιμοποιούμε τα k-1 υποσύνολα για την εκπαίδευση του μοντέλου και αυτό που απομένει για τον έλεγχο του. Επαναλαμβάνουμε το βήμα 2 k φορές, διαλέγοντας διαφορετικό υποσύνολο

17 7 ελέγχου κάθε φορά. Το τελικό ποσοστό σφάλματος είναι αυτό που προκύπτει από το μέσο όρο των ποσοστών των k επαναλήψεων και αποτελεί εκτίμηση της απόδοσης του μοντέλου. Έχει αποδειχθεί πειραματικά πως μια καλή επιλογή για το k είναι η τιμή 10. Μάθηση χωρίς επίβλεψη Στην μάθηση χωρίς επίβλεψη δεν έχουμε καμία γνώση εκ των προτέρων για την έξοδο των παραδειγμάτων. Με άλλα λόγια το διάνυσμα y είναι άγνωστο, καθώς δεν υπάρχει κανένας επιβλέπων που να το παρέχει. Το σύστημα καλείται να ανακαλύψει από μόνο του συσχετίσεις ή ομάδες στα παραδείγματα εισόδου βασισμένο αποκλειστικά στα χαρακτηριστικά τους, χωρίς να είναι γνωστό αν υπάρχουν ομάδες, ποιες είναι και πόσες είναι αυτές. Γι' αυτό το λόγο τα προβλήματα μάθησης χωρίς επίβλεψη θεωρούνται δυσκολότερα. Ως αποτέλεσμα προκύπτουν διαφορετικά μοντέλα και πρότυπα, το καθένα από τα οποία περιγράφει ένα μέρος μόνο από τα δεδομένα. Παραδείγματα τέτοιων προτύπων είναι οι κανόνες συσχέτισης (association rules) και οι ομάδες (clusters). Οι τεχνικές που χρησιμοποιούνται συνήθως είναι αυτές της ομαδοποίησης (Berkhin, 2006; Xu and Wunsch II, 2005) και της ανάλυσης ανεξάρτητων συνιστωσών (independent component analysis)(hyvärinen and Oja, 2000). Στην κατηγορία της μάθησης χωρίς επίβλεψη μπορούμε να εντάξουμε και την ήμι-επιβλεπόμενη μάθηση (Chapelle et al., 2010) αλλά και τα προβλήματα ενισχυτικής μάθησης (Buşoniu et al., 2008) καθώς το περιβάλλον αποτελεί κάτι άγνωστο για τον πράκτορα που πρέπει να το ανακαλύψει. Στην ήμι-επιβλεπόμενη μάθηση έχουμε λίγα παραδείγματα με γνωστή έξοδο και ένα μεγάλο σύνολο άγνωστων παραδειγμάτων. Στην ενισχυτική μάθηση ένας πράκτορας καλείται να μάθει μία συμπεριφορά αλληλεπιδρώντας με ένα δυναμικό περιβάλλον και να επιλέξει μία σειρά αποφάσεων μέσω της δοκιμής και του σφάλματος. Λόγω της ιδιαίτερης φύσης της, η ενισχυτική μάθηση θα μπορούσε να θεωρηθεί και ως μία ξεχωριστή κατηγορία Μηχανικής Μάθησης. Ο αλγόριθμος που προτείνουμε στη συνέχεια ανήκει στην κατηγορία της μάθησης με επίβλεψη. Χρησιμοποιεί δηλαδή ένα σύνολο από δεδομένα εκπαίδευσης για να εκπαιδεύσει το μοντέλο πρόβλεψης και το αξιολογεί με ένα σύνολο ελέγχου όπου αυτό είναι δυνατόν. Για σύνολα δεδομένων που τα παραδείγματα δεν είναι αρκετά, η εκπαίδευση γίνεται με τη μέθοδο του crossvalidation επιλέγοντας k= Παλινδρόμηση (regression) Στην μάθηση με επίβλεψη διακρίνονται δύο είδη προβλημάτων, τα προβλήματα ταξινόμησης

18 8 και τα προβλήματα παλινδρόμησης. Η ταξινόμηση αφορά στη δημιουργία μοντέλων πρόβλεψης διακριτών τάξεων (κλάσεων / κατηγοριών, πχ. ομάδα αίματος). Η παλινδρόμηση (regression) αφορά στη δημιουργία μοντέλων πρόβλεψης αριθμητικών τιμών (πχ. πρόβλεψη αυριανής μέσης θερμοκρασίας). Και στις δύο περιπτώσεις χρησιμοποιείται ένα σύνολο δεδομένων εισόδου για την παραγωγή ενός μοντέλου που θα προβλέπει την έξοδο σε άγνωστα δεδομένα. Η συγκεκριμένη εργασία πραγματεύεται προβλήματα παλινδρόμησης. Για το λόγο αυτό στη συνέχεια αναλύεται εκτενέστερα η έννοια αυτή. Η παλινδρόμηση αναφέρεται στη μοντελοποίηση της συσχέτισης μια εξαρτημένης μεταβλητής y (έξοδος), η οποία είναι αριθμητική, από μία ή περισσότερες ανεξάρτητες μεταβλητές Χ=(x 1, x 2,..., x n ) (είσοδοι). Στόχος είναι η πρόβλεψη της τιμής της εξόδου όταν είναι γνωστές οι τιμές των εισόδων. Ως εφαρμογές μπορούμε να αναφέρουμε την πρόβλεψη της ζήτησης για ένα νέο προϊόν με βάση τις δαπάνες διαφήμισης, της ταχύτητας των ανέμων με βάση την θερμοκρασία, την υγρασία και την ατμοσφαιρική πίεση του περιβάλλοντος ή της αξίας ακινήτων με βάση την τοποθεσία, τον αριθμό των δωματίων και την έκταση του οικοπέδου. Η παλινδρόμηση περιγράφεται με τη μορφή εξίσωσης ως εξής: y = f(x, β) + ε όπου y είναι η εξαρτημένη μεταβλητή, X είναι το διάνυσμα των ανεξάρτητων μεταβλητών, β είναι το διάνυσμα των άγνωστων παραμέτρων συσχέτισης και ε το τυχαίο σφάλμα που προκύπτει κατά την πρόβλεψη από την ύπαρξη μη ελεγχόμενων τυχαίων παραγόντων. Η συνάρτηση f είναι η συνάρτηση παλινδρόμησης. Για την επιτυχία του μοντέλου είναι απαραίτητη η ελαχιστοποίηση του σφάλματος μεταξύ πραγματικής και προβλεπόμενης τιμής της εξαρτημένης μεταβλητής d = y f(x, β). Επειδή η ελαχιστοποίηση του σφάλματος απαιτεί δύσκολους και περίπλοκους υπολογισμούς, χρησιμοποιούνται συνήθως συγκεκριμένες μορφές για τη συνάρτηση παλινδρόμησης (γραμμική,...) που προέρχονται από το πεδίο της στατιστικής Ταυτόχρονα το ίδιο πρόβλημα προσπαθούν να επιλύσουν και διαφορετικές προσεγγίσεις που προέρχονται αποκλειστικά από το πεδίο της ΜΜ. Υπάρχουν επομένως αρκετές τεχνικές για την εύρεση της κατάλληλης συνάρτησης παλινδρόμησης, όπως επίσης και αρκετές μετρικές του σφάλματος. Στη συνέχεια θα αναφερθούν οι κυριότερες από αυτές τις τεχνικές, ενώ στην επόμενη υποενότητα γίνεται αναφορά σε μερικές από τις μετρικές που χρησιμοποιούνται για τον προσδιορισμό του σφάλματος.

19 9 Γραμμική Παλινδρόμηση Η πιο απλή μορφή της συνάρτησης παλινδρόμησης είναι η γραμμική συνάρτηση παλινδρόμησης, στην οποία η εξαρτημένη μεταβλητή είναι γραμμικός συνδυασμός των ανεξάρτητων μεταβλητών. Χρησιμοποιείται όταν η συσχέτιση μεταξύ εξαρτημένης και ανεξάρτητων μεταβλητών μπορεί να προσομοιωθεί από μία ευθεία γραμμή. Για κάθε παράδειγμα εισόδου η συνάρτηση γράφεται με τη μορφή εξίσωσης ως εξής: y = Χβ+ ε Το σφάλμα ε είναι μια τυχαία μεταβλητή με την ιδιότητα: μ=0. Συνήθως υποθέτουμε πως το διάνυσμα σφάλματος ε ακολουθεί κανονική κατανομή. Σκοπός είναι η εύρεση του διανύσματος άγνωστων παραμέτρων συσχέτισης β, η τιμή του καθενός αποτελεί έναν δείκτη της επίδρασης που έχει η συγκεκριμένη ανεξάρτητη μεταβλητή επάνω στην εξαρτημένη. Συχνά ως μέθοδος επίλυσης της γραμμικής παλινδρόμησης επιλέγεται η μέθοδος των ελαχίστων τετραγώνων (sum of squared residuals SSR). Στη μέθοδο αυτή, η τιμή του β που αναζητούμε είναι αυτή που ελαχιστοποιεί την ποσότητα: SSR = Σ y-xβ 2. Η τιμή αυτή, όταν το σφάλμα ε είναι τυχαίο, είναι σύμφωνα με το θεώρημα Gauss-Markov ο καλύτερος γραμμικός αμερόληπτος εκτιμητής (best linear unbiased estimator BLUE). Αυτός είναι και ο λόγος που η συγκεκριμένη μέθοδος είναι τόσο διαδεδομένη. Παρόλο που το αποτέλεσμα είναι ένα καθολικό μοντέλο που καλύπτει όλα τα παραδείγματα εισόδου, αυτή η μέθοδος δέχεται κριτική πως είναι υπεραπλουστευμένη διότι πραγματοποιεί προφανώς την υπόθεση της γραμμικότητας, ενώ ο υπολογισμός των παραμέτρων συσχέτισης είναι εφικτός και αξιόπιστος μόνο όταν ο αριθμός των παραδειγμάτων είναι κατά πολύ μεγαλύτερος από τον αριθμό των χαρακτηριστικών. Παλινδρόμηση Ridge (ridge regression) Όπως αναφέρθηκε προηγουμένως, η γραμμική παλινδρόμηση μπορεί και επιστρέφει αμερόληπτες εκτιμήσεις. Υπάρχουν όμως περιπτώσεις στις οποίες αυτοί οι αμερόληπτοι εκτιμητές δεν είναι οι πιο κατάλληλοι. Μία τέτοια περίπτωση αποτελεί όταν δύο ή περισσότερες ανεξάρτητες μεταβλητές εμφανίζουν ισχυρή συσχέτιση μεταξύ τους. Εξαιτίας αυτού του γεγονότος, οι εκτιμήσεις που υπολογίζει η μέθοδος των ελαχίστων τετραγώνων παρουσιάζουν υψηλές διακυμάνσεις. Η παλινδρόμηση Ridge (Hoerl και Kennard, 1970) αντιμετωπίζει αυτό το γεγονός με τη χρήση

20 10 εκτιμητών που δεν είναι πλέον αμερόληπτοι, έχουν όμως μικρότερη διακύμανση από τους εκτιμητές των ελαχίστων τετραγώνων. Βασίζεται στην συστηματοποίηση Tikhonov (Tikhonov, 1963). Συγκεκριμένα προσθέτουμε στον υπολογισμό των ελαχίστων τετραγώνων έναν επιπλέον πίνακα Γ, οποίος είναι συνήθως πολλαπλάσιος του μοναδιαίου πίνακα Ι, δηλαδή: Γ = λι. Η ποσότητα που θέλουμε να ελαχιστοποιήσουμε είναι η: Σ y-xβ 2 + Σ ΓΧ 2. Ο Γ δεν είναι απαραίτητος να είναι πολλαπλάσιος του Ι, αλλά αυτή είναι η απλούστερη περίπτωση. Η παλινδρόμηση Ridge υπολογίζει εκτιμητές που παρουσιάζουν μικρή διακύμανση, αυτό όμως έχει κόστος. Οι εκτιμήσεις δεν είναι πλέον αμερόληπτες, δηλαδή οι αναμενόμενη τιμή τους δεν είναι ίση με την πραγματική τους τιμή. Συνήθως τείνουν να υποεκτιμούν τις πραγματικές τιμές. Όμως εξαιτίας της μικρής διακύμανσης, που είναι τις περισσότερες φορές πολύ μικρότερη από τη διακύμανση του γραμμικού μοντέλου, το συνολικό μέσο τετραγωνικό σφάλμα είναι επίσης πολύ μικρότερο, πράγμα που δείχνει πως οι συγκεκριμένοι εκτιμητές έχουν καλύτερη συμπεριφορά. Νευρωνικά Δίκτυα Τα προβλήματα παλινδρόμησης μπορούν να επιλυθούν και με την εφαρμογή τεχνητών νευρωνικών δικτύων. Το βασικό δομικό στοιχείο στα νευρωνικά δίκτυα είναι ασφαλώς ο νευρώνας, ο οποίος δέχεται ως σήματα εισόδου συνεχείς μεταβλητές και παράγει την έξοδο, η οποία είναι μία αριθμητική τιμή. Η έξοδος εξαρτάται από το σώμα του τεχνητού νευρώνα, το οποίο αποτελείται από τον αθροιστή και μία συνάρτηση ενεργοποίησης. Ένα τεχνητό νευρωνικό δίκτυο στη γενική του μορφή αποτελείται από ένα σύνολο διαφορετικών επιπέδων νευρώνων. Συγκεκριμένα αποτελείται από ένα επίπεδο εισόδου (input layer) που περιέχει νευρώνες (input nodes) χωρίς συνάρτηση ενεργοποίησης οι οποίοι απλά προωθούν την είσοδο στο επόμενο επίπεδο, από ένα επίπεδο εξόδου (output layer) που αποτελείται από μονάδες εξόδου (output nodes) και μεταξύ αυτών ένα ή περισσότερα ενδιάμεσα (κρυφά) επίπεδα (hidden layers) που αποτελούνται από εσωτερικές (κρυφές) μονάδες (hidden nodes) οι οποίες δεν είναι ορατές αλλά αποτελούν εσωτερικό τμήμα του τεχνητού νευρωνικού δικτύου. Τα ενδιάμεσα επίπεδα είναι προαιρετικά, ενώ ο ακριβής αριθμός τους δεν είναι καθορισμένος αλλά αποτελεί θέμα πειραματισμού. Οι νευρώνες συνδέονται μεταξύ τους με κανάλια επικοινωνίας που μεταφέρουν κωδικοποιημένα τα αριθμητικά δεδομένα που δίνονται στην είσοδο (input layer) του συστήματος. Κάθε τεχνητός νευρώνας δέχεται εισόδους από νευρώνες με τους οποίους συνδέεται και υπολογίζει μια τιμή εξόδου σαν συνάρτηση των εισόδων του την οποία διοχετεύει σε επόμενους νευρώνες με τους οποίους και επικοινωνεί.

21 11 Εικόνα 2.1: Παράδειγμα τεχνητού νευρωνικού δικτύου. Για την εκπαίδευση του νευρωνικού δικτύου μπορεί να χρησιμοποιηθεί είτε μάθηση με επίβλεψη, είτε μάθηση χωρίς επίβλεψη, όπου το δίκτυο αυτό-οργανώνεται με βάση τα διανύσματα εισόδου. Στη μάθηση με επίβλεψη έχουμε τα δίκτυα πρόσθιας τροφοδότησης (feedforward), στα οποία η ροή πληροφορίας είναι προς μία κατεύθυνση και δεν υπάρχουν συνδέσεις από νευρώνες ενός επιπέδου προς νευρώνες προηγούμενου επιπέδου. Αντίθετα στη μάθηση χωρίς επίβλεψη συναντούμε τα δίκτυα με ανατροφοδότηση (feedback ή recurrent), στα οποία υπάρχουν συνδέσεις από νευρώνες ενός επιπέδου προς νευρώνες προηγούμενου επιπέδου ή/και νευρώνες του ίδιου επιπέδου και οι υπολογισμοί γίνονται σε δύο στάδια. Το πρώτο στάδιο είναι ίδιο με αυτό του δικτύου πρόσθιας τροφοδότησης; ενώ στο δεύτερο στάδιο γίνονται οι υπολογισμοί για τις συνδέσεις ανατροφοδότησης. H εκπαίδευση αναφέρεται στην εκμάθηση τόσο της δομής του νευρωνικού δικτύου όσο των βαρών (weights) σύνδεσης που αποθηκεύονται στους νευρώνες του δικτύου και μεταβάλλουν τα σήματα εισόδου. Μετά το τέλος της εκπαίδευσης του, το νευρωνικό δίκτυο μπορεί να γενικευτεί και να παράγει προβλέψεις για άγνωστα δεδομένα. Σύμφωνα με τους (Bailey και Thompson, 1990) τα νευρωνικά δίκτυα μπορούν να εφαρμοστούν όταν α. η εφαρμογή γίνεται σε δεδομένα που εξαρτώνται από πολλαπλές και αλληλοεξαρτώμενες παραμέτρους, β. υπάρχει επαρκής αριθμός δεδομένων ή παραδειγμάτων, γ. τα διαθέσιμα δεδομένα δεν είναι πλήρη, περιέχουν σφάλματα και περιγράφουν συγκεκριμένα παραδείγματα και δ. η σχέση που αποτελεί τη λύση στο πρόβλημα είναι ή άγνωστη ή ο προσδιορισμός της είναι επίπονος (απαιτεί χρόνο, έμπειρο προσωπικό, καταστροφή του πρωτογενούς υλικού που είναι η πηγή πληροφόρησης κλπ.). Τα πλεονεκτήματα τους είναι ότι αναδεικνύουν συσχετίσεις ανάμεσα στα δεδομένα ακόμη και όταν αυτές δεν είναι αντιληπτές με συνήθεις στατιστικές μεθόδους. Η δυνατότητα αυτό-οργάνωσης που τα χαρακτηρίζει επιτρέπει την χρήση μεγάλης ποσότητας

22 12 πληροφορίας στα δεδομένα εισαγωγής, αυξάνοντας έτσι την ακρίβεια των προβλέψεων. Επίσης σε σχέση με τη γραμμική παλινδρόμηση, έχουν το πλεονέκτημα της δυνατότητάς τους να μοντελοποιούν μη γραμμικά δεδομένα. Παλινδρόμηση Διανυσμάτων Υποστήριξης Η Παλινδρόμηση Διανυσμάτων Υποστήριξης (Support Vector Regression) βασίζεται στις γνωστές από τη ΜΜ Μηχανές Διανυσμάτων Υποστήριξης (Support Vector Machines - SVM). Στα SVM το πρόβλημα έγκειται στην εύρεση της εξίσωσης που περιγράφει το υπερεπίπεδο μέγιστου περιθωρίου (maximum margin hyperplane), το οποίο διαχωρίζει τα θετικά από τα αρνητικά παραδείγματα. Προϋπόθεση είναι το πρόβλημα να είναι γραμμικά διαχωρίσιμο. Τα παραδείγματα με την μικρότερη απόσταση από το υπερεπίπεδο μέγιστου περιθωρίου είναι τα διανύσματα υποστήριξης (support vectors). Όσο περισσότερο απέχουν τα διανύσματα υποστήριξης που αναφέρονται στα θετικά παραδείγματα από αυτά που αναφέρονται στα αρνητικά, τόσο μεγαλύτερη επιτυχία έχει το μοντέλο στην ταξινόμηση παραδειγμάτων. Εικόνα 2.2: Το υπερεπίπεδο μέγιστου περιθωρίου. Σε ότι αφορά την παλινδρόμηση, η διαδικασία είναι παρόμοια. Βασική ιδέα είναι η εύρεση μιας συνάρτησης που προσεγγίζει τα παραδείγματα εκπαίδευσης μέσω της ελαχιστοποίησης του σφάλματος πρόβλεψης. Η διαφορά είναι πως το σύνολο των σημείων με απόσταση μεγαλύτερη από μία καθορισμένη από το χρήστη παράμετρο ε, αποβάλλονται. Τα διανύσματα υποστήριξης είναι όλα εκείνα τα σημεία που βρίσκονται κοντά στην επιφάνεια της συνάρτησης. Regression trees και model trees Τα δέντρα απόφασης της ΜΜ που χρησιμοποιούνται για την ταξινόμηση παραδειγμάτων σε

23 13 διακριτές κλάσεις μπορούν να χρησιμοποιηθούν με ορισμένες τροποποιήσεις και για την πρόβλεψη αριθμητικών τιμών. Τα καταληκτικά φύλλα, δηλαδή περιέχουν πλέον αριθμούς αντί για κατηγορίες/κλάσεις. Σε αυτήν την περίπτωση τα δέντρα ονομάζονται regression trees. Οι διαφορές των regression trees σε σχέση με τα δέντρα απόφασης είναι πως οι κόμβοι του δέντρου περιέχουν τώρα αριθμητική ποσότητα, η οποία αντιστοιχεί στη μέση τιμή όλων των παραδειγμάτων που καταλήγουν στα φύλλα που ακολουθούν και πως τα συμπεράσματα των κανόνων που προκύπτουν από το δέντρο αναφέρουν τη μέση τιμή των παραδειγμάτων στα οποία εφαρμόζεται ο κανόνας. Σε σχέση με τη γραμμική παλινδρόμηση το δέντρο παρέχει μεγαλύτερη ακρίβεια προβλέψεων. Ωστόσο παραμένει ογκώδες και δυσνόητο ενώ ορισμένες φορές πραγματοποιείται υπερμοντελοποίηση των δεδομένων. Εκτός από τα regression trees, υπάρχει και μία άλλη κατηγορία δέντρων που χρησιμοποιούνται για πρόβλεψη αριθμητικών τιμών, τα model trees. Τα model trees συνδυάζουν τα δέντρα απόφασης με τη γραμμική παλινδρόμηση. Τα φύλλα τους δεν περιέχουν αριθμητικές τιμές αλλά εξισώσεις γραμμικής παλινδρόμησης που χρησιμοποιούνται για να προβλέψουν την εξαρτημένη μεταβλητή των παραδειγμάτων που φτάνουν σε αυτά. Τα model trees υπερέχουν έναντι των regression trees τόσο σε ότι αφορά τη μορφή τους η οποία είναι συνήθως πιο συμπαγής, όσο και σε προβλεπτική ικανότητα, διότι εκμεταλλεύονται την τοπική γραμμικότητα που μπορεί να εμφανίζεται στα δεδομένα. Μία ακόμη διαφορά είναι πως τα regression trees δε θα προβλέψουν ποτέ μία τιμή εκτός του εύρους τιμών που συνάντησαν κατά την εκπαίδευση τους από τα δεδομένα. Αντίθετα, τα model trees μπορούν να επεκταθούν και εκτός του εύρους τιμών της εκπαίδευσης. Εικόνα 2.3: Παράδειγμα Regression Tree. Εικόνα 2.4: Παράδειγμα Model Tree.

24 Μετρικές Αξιολόγησης Παλινδρόμησης Στην προηγούμενη υποενότητα παρουσιάσαμε κάποιες βασικές μεθόδους που χρησιμοποιούμε για την επίλυση των προβλημάτων παλινδρόμησης. Σε αυτήν αναλύουμε τις κυριότερες μετρικές που εφαρμόζονται στην παλινδρόμηση και ουσιαστικά αποτιμούν και αξιολογούν το μοντέλο που έχει παραχθεί κατά τη διαδικασία της εκπαίδευσης με τις παραπάνω μεθόδους. Συνήθως ο έλεγχος ενός μοντέλου γίνεται με τον υπολογισμό και την εκτίμηση του σφάλματος πρόβλεψης ανάμεσα στην πραγματική τιμή εξόδου και την προβλεπόμενη τιμή εξόδου, το οποίο εξαρτάται άμεσα από τις παραμέτρους συσχέτισης μεταξύ των μεταβλητών που έχουν υπολογιστεί. Υπάρχουν πολλά στατιστικά μέτρα τα οποία είναι διαθέσιμα για την εκτίμηση της ποιότητας προσαρμογής των δεδομένων στα παραγόμενα μοντέλα. Παρακάτω αναφέρονται τα βασικότερα από αυτά, που έχουν και την πιο ευρεία περιοχή χρήσης. Για λόγους συμβολισμού ορίζουμε ως n τον αριθμό των παραδειγμάτων στο σύνολο ελέγχου, y την πραγματική τιμή εξόδου της εξαρτημένης μεταβλητής και p την προβλεπόμενη τιμή του μοντέλου για την εξαρτημένη μεταβλητή. Mean Squared Error (MSE) Το μέσο τετραγωνισμένο σφάλμα για ένα σύνολο δεδομένων είναι η μέση τιμή του τετραγώνου του σφάλματος πρόβλεψης σε όλα τα παραδείγματα του συνόλου δεδομένων: n 1 MSE ( y, p)= 1 ( y n i p i ) 2 i=0 Το MSE είναι ένα από τα πιο δημοφιλή μέτρα αξιολόγησης. Το καλύτερο αποτέλεσμα είναι το 0.0, ενώ οι μεγαλύτερες τιμές αποτελούν χειρότερα σκορ. Root Mean Squared Error (RMSE) MSE : Το μέσο τετραγωνικό σφάλμα είναι η ρίζα του αντίστοιχου μέσου τετραγωνισμένου σφάλματος n 1 RMSE ( y, p)= 1 ( y n i p i ) 2 i=0 Το πλεονέκτημα του RMSE είναι ότι βρίσκεται στην ίδια διάσταση με την προβλεπόμενη τιμή.

25 15 Το καλύτερο αποτέλεσμα είναι το 0.0, ενώ οι μεγαλύτερες τιμές αποτελούν χειρότερα σκορ. Mean Absolute Error (MAE) Το μέσο απόλυτο σφάλμα για ένα σύνολο δεδομένων είναι η μέση τιμή της απόλυτης τιμής του σφάλματος πρόβλεψης σε όλα τα παραδείγματα του συνόλου δεδομένων: n 1 MAE ( y, p)= 1 y n i p i i =0 Το ΜΑΕ είναι λιγότερο ευαίσθητο σε τιμές προς εξαίρεση (outliers) από τα MSE και RMSE, επηρεάζεται δηλαδή σε από μεγαλύτερα σφάλματα. Το καλύτερο αποτέλεσμα είναι το 0.0, ενώ οι μεγαλύτερες τιμές αποτελούν χειρότερα σκορ. Ο συντελεστής R 2 Ο συντελεστής R 2 αποτελεί ένα μέτρο της ακρίβειας πρόβλεψης των μελλοντικών παραδειγμάτων από το μοντέλο. R 2 ( y, p)=1 n 1 i=0 n 1 i =0 ( y i p i ) 2 1, όπου y= n 1 n ( y i y) 2 i =0 y i Το καλύτερο αποτέλεσμα είναι το 1.0, ενώ οι μικρότερες τιμές αποτελούν χειρότερα σκορ. Relative Squared Error (RSE), Root Relative Squared Error (RRSE) και Relative Absolute Error (RAE) Οι τρεις αυτές μετρικές αντιστοιχούν στη λογική των MSE, RMSE και MAE. Η πρώτη από τις τρεις μάλιστα είναι ίση με τον όρο του κλάσματος στο συντελεστή R 2. RSE ( y, p)= n 1 i =0 n 1 i =0 n 1 ( y i p i ) 2 ( y i p i ) i=0, RRSE( y, ( y i y) p)= 2, RAE( y, p)= n 1 2 ( y i y) 2 i=0 n 1 i=0 n 1 i=0 y i p i y i y, όπου

26 16 n 1 y= 1 n i =0 y i Αποτελούν τις τιμές σφάλματος σε σύγκριση με το σφάλμα που θα προέκυπτε αν κάθε πρόβλεψη ήταν ίση με τη μέση τιμή. Το καλύτερο αποτέλεσμα είναι το 0.0, ενώ οι μεγαλύτερες τιμές αποτελούν χειρότερα σκορ. Συντελεστής Συσχέτισης (Correlation Coefficient CC) Ο συντελεστής συσχέτισης αποτιμά τη συσχέτιση που υπάρχει μεταξύ των πραγματικών τιμών εξόδου και της προβλέψεων. n 1 CC ( y, p)= S ( p i p)( y i y) py i=0, όπου S S p S py = y n 1, S p = n 1 i =0 ( p i p) n 1, S y = n 1 i=0 ( y i y) n 1 Κυμαίνεται από 1 για απολύτως συσχετιζόμενα αποτελέσματα, μέχρι 0 όταν δεν υπάρχει καμία συσχέτιση και -1 όταν τα αποτελέσματα έχουν πλήρως αρνητική συσχέτιση. Ζητούμενο για τη συγκεκριμένη μετρική είναι η μεγιστοποίηση της τιμής της. 2.5 Ομάδες Μοντέλων Το ζητούμενο στη ΜΜ είναι η παραγωγή αντιπροσωπευτικών προβλέψεων που είναι όσο το δυνατόν πιο κοντά στην πραγματικότητα. Μία μέθοδος που μπορεί να βελτιώσει την προβλεπτική ικανότητα ενός συστήματος, είναι αντί να εκπαιδεύσουμε ένα μόνο μοντέλο, να εκπαιδεύσουμε μία ομάδα μοντέλων (ensemble), και να τα χρησιμοποιήσουμε όλα για την πρόβλεψη. Τα ensembles τα συναντούμε στη βιβλιογραφία και με τους όρους multiple classifier systems, committees of classifiers, classifier fusion, classifier combination και classifier aggregation (Džeroski et al., 2008). Η μέθοδος αυτή βασίζεται στην ιδέα πως και οι άνθρωποι, όταν βρίσκονται μπροστά στη λήψη μίας σημαντικής απόφασης συμβουλεύονται πολλές διαφορετικές πηγές. Έτσι και στη ΜΜ μπορούμε να συμβουλευτούμε μία πληθώρα μοντέλων που αφορούν το ίδιο πρόβλημα και να συνδυάσουμε τις αποφάσεις τους ώστε να παράγουμε ακριβέστερες προβλέψεις. Αυτό φυσικά δεν έρχεται δωρεάν χωρίς κόστος. Η εκπαίδευση μίας ομάδας μοντέλων και ο συνδυασμός των αποτελεσμάτων τους έχει μεγαλύτερο υπολογιστικό κόστος από την εκπαίδευση ενός μόνο μοντέλου. Επίσης τα ensembles έχουν πλεονεκτήματα σε σχέση με ένα απλό μοντέλο και σε ότι αφορά τα

27 17 άγνωστα δεδομένα. Ένα μοντέλο μπορεί να έχει μεγάλη ακρίβεια πρόβλεψης στα δεδομένα εκπαίδευσης, αλλά δεν υπάρχει καμιά εγγύηση ότι η πρόβλεψη σε άγνωστα για το μοντέλο δεδομένα θα εμφανίζει την ίδια ακρίβεια. Οπότε όταν εκπαιδεύουμε ένα μόνο μοντέλο μπορεί εύκολα να καταλήξουμε με ένα κακό μοντέλο (βέβαια με τις μετρικές αξιολόγησης μοντέλων, μπορούμε να ελαχιστοποιήσουμε αυτό το ρίσκο). Από την άλλη, όταν χρησιμοποιούμε ομάδες μοντέλων για την πρόβλεψη, το ρίσκο αυτό είναι μειωμένο. Ας αναφέρουμε όμως πιο συγκεκριμένα τι είναι τα ensembles. Ένα ensemble είναι ένα σύνολο μοντέλων, που εκπαιδεύονται με βάση έναν συγκεκριμένο αλγόριθμο. Η διαδικασία της δημιουργίας της ομάδας μοντέλων αποτελείται από δύο βήματα. Στο πρώτο πραγματοποιείται η εκπαίδευση κάθε μοντέλου που περιλαμβάνεται στην ομάδα μοντέλων. Μπορούμε να χρησιμοποιήσουμε για το καθένα είτε τον ίδιο αλγόριθμο, με ίδιες ή διαφορετικές ρυθμίσεις των παραμέτρων του, είτε διαφορετικό αλγόριθμο και να τα εκπαιδεύσουμε είτε παράλληλα είτε σε σειρά. Στο δεύτερο βήμα τα μοντέλα ή οι προβλέψεις τους πρέπει να συνδυαστούν για την παραγωγή ενός τελικού μοντέλου ή μίας τελικής πρόβλεψης. Υπάρχουν γενικά δύο προσεγγίσεις για το συνδυασμό των μοντέλων μέσα σε μία ομάδα μοντέλων: η επιλογή μοντέλου (model selection) και ο συνδυασμός όλων των μοντέλων (model fusion). Στην πρώτη περίπτωση, αξιολογούμε την ικανότητα πρόβλεψης των μοντέλων της ομάδας με βάση κάποιες μετρικές αξιολόγησης και χρησιμοποιούμε τις προβλέψεις μόνο του καλύτερου μοντέλου ως προβλέψεις όλης της ομάδας. Στην δεύτερη περίπτωση, λαμβάνονται υπόψη οι προβλέψεις όλων των μοντέλων για την πραγματοποίηση μιας πρόβλεψης από την ομάδα. Αυτό μπορεί να γίνει είτε παίρνοντας το μέσο όρο των προβλέψεων για προβλήματα παλινδρόμησης, είτε προβλέποντας ως έξοδο την κλάση που είχε τις περισσότερες ψήφους για προβλήματα ταξινόμησης, όπως περιγράφεται στο (Breiman, 1996) ή με πιο περίπλοκους υπολογισμούς (Ho et al., 1994; Kittler et al., 1998). Επιπλέον, για να είναι επιτυχημένη μία ομάδα μοντέλων, χρειάζεται τα μοντέλα που την αποτελούν να χαρακτηρίζονται από ποικιλομορφία. Ο συνδυασμός όμοιων μοντέλων, όχι μόνο δεν βελτιώνει την προβλεπτική ικανότητα του συστήματος, αλλά ίσα ίσα αυξάνει το υπολογιστικό κόστος του τελικού μοντέλου. Δύο μοντέλα είναι διαφορετικά όταν πραγματοποιούν διαφορετικά σφάλματα για νέα παραδείγματα. Αν αυτά συνδυαστούν με έναν έξυπνο τρόπο, μπορεί να παραχθεί ένα πιο ακριβές μοντέλο. Η ποικιλομορφία μπορεί να επιτευχθεί με διάφορους τρόπους. Για παράδειγμα, μπορούμε να τροποποιήσουμε το σύνολο εκπαίδευσης εισάγοντας βάρη στα παραδείγματα (Breiman, 1996; Freund και Schapire, 1996) ή αλλάζοντας τις τιμές κάποιων

28 18 χαρακτηριστικών των παραδειγμάτων (Breiman, 1999). Ένας άλλος τρόπος είναι και αυτός που αναφέρθηκε προηγουμένως, δηλαδή η τροποποίηση του αλγορίθμου, χρησιμοποιώντας διαφορετικούς αλγορίθμους για κάθε μοντέλο ή τον ίδιο αλγόριθμο με διαφορετικές παραμέτρους (Dietterich, 2000). Οι ομάδες μοντέλων μπορούν να χρησιμοποιηθούν και ως διαγνωστικό τεστ συμβατικών μοντέλων (Berk, 2006). Αυτό μπορεί να γίνει συγκρίνοντας την ποιότητα πρόβλεψης της καλύτερης ομάδας μοντέλων με αυτήν του στατιστικού μοντέλου. Όσο μεγαλύτερη είναι η διαφορά, τόσο περισσότερη πληροφορία λείπει από το μοντέλο. Έτσι μπορούν να αναδειχθούν ποια μοντέλα χρειάζονται ίσως τροποποίηση έτσι ώστε να περιγραφούν με καλύτερο τρόπο. Επίσης οι ομάδες μοντέλων μπορούν να χρησιμοποιηθούν για να διερευνήσουν την σχέση ανάμεσα στις εξαρτημένες και τις ανεξάρτητες μεταβλητές. Χαρακτηριστικά ή συναρτήσεις που παραβλέπονται στα συμβατικά μοντέλα, μπορούν να αναδειχθούν με τη μέθοδο των ομάδων. Αντίθετα τα χαρακτηριστικά που μπορεί να θεωρηθούν σημαντικά στο συμβατικό μοντέλο, μπορεί με τη μέθοδο των ομάδων να αποδειχθούν ασήμαντα. Αυτό δε σημαίνει απαραίτητα ότι η συγκεκριμένη μέθοδος είναι ανώτερη, μπορεί όμως η ανάλυση της αιτίας του γιατί διαφέρουν τα αποτελέσματα στις δύο μεθόδους να αποδειχθεί διαφωτιστική. Τα ensembles έχουν προσελκύσει το ενδιαφέρον της επιστημονικής κοινότητας της ΜΜ (Dietterich, 1997) επειδή συνήθως μπορούν να προβλέπουν αποτελέσματα με μεγαλύτερη ακρίβεια απ' ότι ένα απλό μοντέλο. Το γεγονός αυτό αποδεικνύεται και από εμπειρικές μελέτες (Dietterich, 2000; Breiman, 2001) που έχουν διεξαχθεί, τόσο σε προβλήματα ταξινόμησης όσο και παλινδρόμησης. Επιπλέον, έχουν προταθεί αρκετές θεωρητικές μελέτες που δικαιολογούν την αποτελεσματικότητα μερικών δημοφιλών μεθόδων ομάδων (Kittler et al., 1998; Schapire, 1999).

29 19 ΚΕΦΑΛΑΙΟ 3. ΠΑΛΙΝΔΡOΜΗΣΗ ΠΟΛΛΑΠΛΩΝ ΣΤΟΧΩΝ MULTI-TARGET REGRESSION 3.1 Περιγραφή Παλινδρόμησης Πολλαπλών Στόχων 3.2 Δημοφιλέστερες Μέθοδοι Στο παρακάτω κεφάλαιο αναλύεται η έννοια της παλινδρόμησης πολλαπλών στόχων, η οποία αποτελεί και το πεδίο που απευθύνεται ο αλγόριθμος που προτείνουμε σε επόμενη ενότητα. Περιγράφουμε τι είναι η παλινδρόμηση πολλαπλών στόχων με τυπικό τρόπο και αναφέρουμε τα προβλήματα στα οποία αυτή βρίσκει εφαρμογή. Τέλος γίνεται αναφορά σε δημοφιλείς τεχνικές και μεθόδους που επιχειρούν να αντιμετωπίσουν τέτοιου είδους προβλήματα. 3.1 Περιγραφή Παλινδρόμησης Πολλαπλών Στόχων Ήδη σε προηγούμενη ενότητα εξηγήσαμε τον όρο παλινδρόμηση, που είναι γνωστός τόσο από τη ΜΜ όσο και από τη Στατιστική. Αναφέρουμε και πάλι πως ως παλινδρόμηση (regression) ορίζεται η διαδικασία εκμάθησης ενός μοντέλου που προβλέπει μία αριθμητική μεταβλητή εξόδου (στόχος) από μία ή περισσότερες μεταβλητές εισόδου (χαρακτηριστικά). Η παλινδρόμηση πολλαπλών στόχων (multi-target regression - MTR) πραγματοποιεί την ίδια διαδικασία, μόνο που αυτήν τη φορά το μοντέλο προβλέπει περισσότερες της μίας μεταβλητές εξόδου από τα ίδια χαρακτηριστικά για κάθε παράδειγμα που του δίνεται ως είσοδος. Στη βιβλιογραφία μπορούμε να τη συναντήσουμε και με τις ονομασίες multi-output regression και multivariate regression. Στη συνέχεια θα περιγράψουμε τη διαδικασία του MTR με περισσότερο τυπικό τρόπο. Συμβολίζουμε με Χ και Υ δύο τυχαία διανύσματα, όπου το Χ αποτελείται από d μεταβλητές εισόδου X 1, X 2,..., X d και το Υ από m μεταβλητές εξόδου Υ 1, Υ 2,..., Υ m. Έστω ότι έχουν δημιουργηθεί παραδείγματα της μορφής (x, y) στο χώρο X Y σύμφωνα με μία κατανομή πιθανοτήτων Ρ(Χ, Υ), όπου X = R d και Y = R m αντίστοιχα είναι τα πεδία ορισμού των Χ και Υ. Στα παραδείγματα (x, y), το x=[x 1,..., x d ] είναι το διάνυσμα εισόδου και το y=[y 1,..., y m ]

30 20 είναι το διάνυσμα εξόδου, τα οποία είναι στιγμιότυπα των X και Υ αντίστοιχα. Για ένα σύνολο D={(x 1, y 1 ), (x 2, y 2 ),..., (x n, y n )} που αποτελείται από n παραδείγματα εκπαίδευσης, ο στόχος στο MTR είναι η εκμάθηση ενός μοντέλου h: X Y το οποίο όταν θα του δοθεί ένα διάνυσμα εισόδου x q, θα προβλέπει ένα διάνυσμα εξόδου ŷ q = h(x q ) που προσεγγίζει όσο το δυνατόν περισσότερο το πραγματικό διάνυσμα εξόδου y q. Το MTR μπορεί να βρει εφαρμογή σε δραστηριότητες όπως τη πρόβλεψη τιμών μετοχών, την πρόβλεψη της κατανομής των ειδών ή της δομής των κοινοτήτων (Demšar et al.,2006), όπου η πρόβλεψη αφορά το πλήθος των διαφορετικών ειδών που ζουν στο ίδιο περιβάλλον, την επεξεργασία φυσικής γλώσσας (Jeong και Lee, 2009), την βιοπληροφορική (Liu et al., 2010), τη φαρμακευτική (Bickel et al., 2008) κ.α Δημοφιλέστερες μέθοδοι Οι μέθοδοι που χρησιμοποιούνται για την πρόβλεψη πολλαπλών στόχων είτε στην ταξινόμηση είτε στην παλινδρόμηση μπορούν να χωριστούν γενικά σε δύο κατηγορίες. Η πρώτη κατηγορία αφορά μεθόδους που κατασκευάζουν πολλαπλά μοντέλα, μετασχηματίζοντας το multi-target πρόβλημά σε ένα σύνολο από προβλήματα single-target, έτσι ώστε να εφαρμόσουν τους κλασικούς αλγόριθμους μάθησης που χρησιμοποιούνται και στην απλή παλινδρόμηση. Η δεύτερη κατηγορία αντίθετα αφορά την κατασκευή ενός μόνο μοντέλου που προβλέπει απευθείας όλες τις μεταβλητές στόχους και συνήθως περιλαμβάνει το μετασχηματισμό ενός γνωστού αλγορίθμου μάθησης ώστε να διαχειρίζεται τα παραδείγματα με πολλαπλές μεταβλητές εξόδου. Τα πλεονεκτήματα της δεύτερης κατηγορίας είναι πως παράγει μοντέλα που είναι πιο εύκολα ερμηνεύσιμα από το χρήστη, είναι μικρότερα σε μέγεθος από ένα σύνολο μοντέλων, υπάρχει μικρότερος κίνδυνος υπερμοντελοποίησης 1, ενώ εκτός από τις συσχετίσεις ανάμεσα στις μεταβλητές εισόδου και τις μεταβλητές εξόδου, μπορεί να εκμεταλλευτεί και συσχετίσεις μεταξύ των ίδιων των μεταβλητών εξόδου. Σε ότι αφορά το τελευταίο κομμάτι πρέπει να αναφερθεί πως εάν το σύνολο δεδομένων είναι μεγάλο, ο αριθμός των πιθανών συσχετίσεων αυξάνει εκθετικά, οπότε οι μέθοδοι αυτές είναι περισσότερο ακριβείς σε μικρά παρά σε μεγάλα σύνολα δεδομένων. Επίσης δεν υπάρχουν εγγυήσεις πως η κατασκευή ενός μοντέλου για όλο το πρόβλημα θα δίνει πάντα καλύτερες προβλέψεις, αλλά μπορεί, για μία συγκεκριμένη μεταβλητή στόχο, το μοντέλο 1 Υπερμοντελοποίηση: το φαινόμενο στο οποίο το μοντέλο της ΜΜ εμφανίζει υψηλή ακρίβεια στα δεδομένα εκπαίδευσης, αλλά όχι και σε άγνωστα δεδομένα που καλείται να προβλέψει στο μέλλον.

31 21 single-target που απευθύνεται σε αυτήν να είναι ακριβέστερο. Ακολουθούν μερικές δημοφιλείς τεχνικές που εφαρμόζονται στο πρόβλημα του Multi-Target Regression, οι οποίες είναι αντιπροσωπευτικές και των δύο κατηγοριών. Μόνο τα Multi-Target Rules και τα Multi-Target Decision Trees ανήκουν στη δεύτερη κατηγορία. Αυτό οφείλεται στο γεγονός πως ο μετασχηματισμός του προβλήματος σε single-target και στη συνέχεια η επίλυση του είναι συνήθως απλούστερος στην υλοποίηση του. Single Target method (ST) Στη μέθοδο Single Target το multi-target μοντέλο h αποτελείται από m single-target μοντέλα h j : X R, όπου η εκπαίδευση του καθενός γίνεται σε ένα μετασχηματισμένο σύνολο δεδομένων εκπαίδευσης D={(x 1, y 1 j), (x 2, y 2 j),..., (x n, y n j)} για την πρόβλεψη μίας μόνο μεταβλητής στόχου Y j. Με αυτόν τον τρόπο οι μεταβλητές στόχοι προβλέπονται ανεξάρτητα και οι πιθανές συσχετίσεις μεταξύ τους αγνοούνται. Ουσιαστικά πρόκειται για μία ομάδα μοντέλων (ensemble), που η τελική πρόβλεψη παράγεται με τη συγκέντρωση των προβλέψεων από τα m μοντέλα. Η μέθοδος αυτή όταν αφορά προβλήματα ταξινόμησης είναι γνωστή και ως Binary Relevance BM (Tsoumakas και Katakis, 2007; Godbole και Sarawagi, 2004). Η κριτική που δέχεται είναι ως προς το γεγονός της υπόθεσης ανεξαρτησίας. Η υπόθεση αυτή οδηγεί σε απώλεια πληροφορίας από τις πιθανές συσχετίσεις που μπορεί να υπήρχαν, με αποτέλεσμα να προβλέπονται στην έξοδο είτε πολύ λίγες, είτε πολλές ετικέτες, είτε ετικέτες που δεν μπορούν να συνυπάρξουν μαζί σε ένα πρόβλημα ταξινόμησης ή απλά λανθασμένες προβλέψεις σε ένα πρόβλημα παλινδρόμησης. Multi-Target Rules Μία επιπλέον μέθοδος είναι και αυτή της εκμάθησης κανόνων πολλαπλών στόχων (multi-target rules) (Ženko, 2007; Ženko και Džeroski, 2008). Η εκμάθηση κανόνων είναι χρήσιμη εφόσον αυτή η αναπαράσταση μοντέλου είναι και η πιο κατανοητή στον άνθρωπο. Εφαρμόζει τον κλασικό αλγόριθμο σειριακής κάλυψης (Michalski, 1969), και μαθαίνει διατεταγμένα ή μη διατεταγμένα σύνολα κανόνων, τόσο σε προβλήματα παλινδρόμησης όσο και σε προβλήματα ταξινόμησης. Η συγκεκριμένη μέθοδος δείχνει να τα πηγαίνει καλύτερα στην ταξινόμηση, όπου τα αποτελέσματα είναι σχετικά συγκρίσιμα με τις εναλλακτικές μεθόδους, ενώ στην παλινδρόμηση οι εναλλακτικές προσεγγίσεις είναι καλύτερες από τη μέθοδο των multi-target rules (Ženko, 2007).

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Data Mining - Classification

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Data Mining - Classification ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ Data Mining - Classification Data Mining Ανακάλυψη προτύπων σε μεγάλο όγκο δεδομένων. Σαν πεδίο περιλαμβάνει κλάσεις εργασιών: Anomaly Detection:

Διαβάστε περισσότερα

Τεχνητή Νοημοσύνη. 18η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

Τεχνητή Νοημοσύνη. 18η διάλεξη ( ) Ίων Ανδρουτσόπουλος. Τεχνητή Νοημοσύνη 18η διάλεξη (2016-17) Ίων Ανδρουτσόπουλος http://www.aueb.gr/users/ion/ 1 Οι διαφάνειες αυτής της διάλεξης βασίζονται: στο βιβλίο Machine Learning του T. Mitchell, McGraw- Hill, 1997,

Διαβάστε περισσότερα

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΚΑΙ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΠΛΗΡΟΦΟΡΙΑΣ ΠΑΡΟΥΣΙΑΣΗ ΤΕΛΙΚΗΣ ΕΡΓΑΣΙΑΣ ΛΙΝΑ ΜΑΣΣΟΥ

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΚΑΙ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΠΛΗΡΟΦΟΡΙΑΣ ΠΑΡΟΥΣΙΑΣΗ ΤΕΛΙΚΗΣ ΕΡΓΑΣΙΑΣ ΛΙΝΑ ΜΑΣΣΟΥ ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΚΑΙ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΠΑΡΟΥΣΙΑΣΗ ΤΕΛΙΚΗΣ ΕΡΓΑΣΙΑΣ ΛΙΝΑ ΜΑΣΣΟΥ Δ.Π.Μ.Σ: «Εφαρμοσμένες Μαθηματικές Επιστήμες» 2008

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 18. 18 Μηχανική Μάθηση

ΚΕΦΑΛΑΙΟ 18. 18 Μηχανική Μάθηση ΚΕΦΑΛΑΙΟ 18 18 Μηχανική Μάθηση Ένα φυσικό ή τεχνητό σύστηµα επεξεργασίας πληροφορίας συµπεριλαµβανοµένων εκείνων µε δυνατότητες αντίληψης, µάθησης, συλλογισµού, λήψης απόφασης, επικοινωνίας και δράσης

Διαβάστε περισσότερα

Μέθοδοι Μηχανών Μάθησης για Ευφυή Αναγνώριση και ιάγνωση Ιατρικών εδοµένων

Μέθοδοι Μηχανών Μάθησης για Ευφυή Αναγνώριση και ιάγνωση Ιατρικών εδοµένων Μέθοδοι Μηχανών Μάθησης για Ευφυή Αναγνώριση και ιάγνωση Ιατρικών εδοµένων Εισηγητής: ρ Ηλίας Ζαφειρόπουλος Εισαγωγή Ιατρικά δεδοµένα: Συλλογή Οργάνωση Αξιοποίηση Data Mining ιαχείριση εδοµένων Εκπαίδευση

Διαβάστε περισσότερα

ΔΠΜΣ: ΕΦΑΡΜΟΣΜΕΝΕΣ ΜΑΘΗΜΑΤΙΚΕΣ ΕΠΙΣΤΗΜΕΣ ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΤΕΛΙΚΗ ΕΡΓΑΣΙΑ

ΔΠΜΣ: ΕΦΑΡΜΟΣΜΕΝΕΣ ΜΑΘΗΜΑΤΙΚΕΣ ΕΠΙΣΤΗΜΕΣ ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΤΕΛΙΚΗ ΕΡΓΑΣΙΑ Ε Θ Ν Ι Κ Ο Μ Ε Τ Σ Ο Β Ι Ο Π Ο Λ Υ Τ Ε Χ Ν Ε Ι Ο ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ & ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΔΠΜΣ: ΕΦΑΡΜΟΣΜΕΝΕΣ ΜΑΘΗΜΑΤΙΚΕΣ ΕΠΙΣΤΗΜΕΣ ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΤΕΛΙΚΗ ΕΡΓΑΣΙΑ ΟΝΟΜΑΤΕΠΩΝΥΜΟ:

Διαβάστε περισσότερα

HMY 799 1: Αναγνώριση Συστημάτων

HMY 799 1: Αναγνώριση Συστημάτων HMY 799 : Αναγνώριση Συστημάτων Διάλεξη Γραμμική παλινδρόμηση (Linear regression) Εμπειρική συνάρτηση μεταφοράς Ομαλοποίηση (smoothing) Y ( ) ( ) ω G ω = U ( ω) ω +Δ ω γ ω Δω = ω +Δω W ( ξ ω ) U ( ξ) G(

Διαβάστε περισσότερα

Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500

Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500 Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500 Πληθυσμός Δείγμα Δείγμα Δείγμα Ο ρόλος της Οικονομετρίας Οικονομική Θεωρία Διατύπωση της

Διαβάστε περισσότερα

Ενότητα 1: Εισαγωγή. ΤΕΙ Στερεάς Ελλάδας. Τμήμα Φυσικοθεραπείας. Προπτυχιακό Πρόγραμμα. Μάθημα: Βιοστατιστική-Οικονομία της υγείας Εξάμηνο: Ε (5 ο )

Ενότητα 1: Εισαγωγή. ΤΕΙ Στερεάς Ελλάδας. Τμήμα Φυσικοθεραπείας. Προπτυχιακό Πρόγραμμα. Μάθημα: Βιοστατιστική-Οικονομία της υγείας Εξάμηνο: Ε (5 ο ) ΤΕΙ Στερεάς Ελλάδας Τμήμα Φυσικοθεραπείας Προπτυχιακό Πρόγραμμα Μάθημα: Βιοστατιστική-Οικονομία της υγείας Εξάμηνο: Ε (5 ο ) Ενότητα 1: Εισαγωγή Δρ. Χρήστος Γενιτσαρόπουλος Λαμία, 2017 1.1. Σκοπός και

Διαβάστε περισσότερα

Μηχανική Μάθηση: γιατί;

Μηχανική Μάθηση: γιατί; Μηχανική Μάθηση Μηχανική Μάθηση: γιατί; Απαραίτητη για να μπορεί ο πράκτορας να ανταπεξέρχεται σε άγνωστα περιβάλλοντα Δεν είναι δυνατόν ο σχεδιαστής να προβλέψει όλα τα ενδεχόμενα περιβάλλοντα. Χρήσιμη

Διαβάστε περισσότερα

ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΚΑΙ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ

ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΚΑΙ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΚΑΙ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΔΠΜΣ : ΕΦΑΡΜΟΣΜΕΝΕΣ ΜΑΘΗΜΑΤΙΚΕΣ ΕΠΙΣΤΗΜΕΣ ΡΟΗ ΠΙΘΑΝΟΝΤΗΤΕΣ ΚΑΙ ΣΤΑΤΙΣΤΙΚΗΣ ΕΡΓΑΣΙΑ 08: ΕΙΡΗΝΗ ΛΥΓΚΩΝΗ 1 Ο ΣΤΑΔΙΟ: Πριν εφαρμόσουμε οποιοδήποτε αλγόριθμο

Διαβάστε περισσότερα

Διακριτικές Συναρτήσεις

Διακριτικές Συναρτήσεις Διακριτικές Συναρτήσεις Δρ. Δηµήτριος Τσέλιος Επίκουρος Καθηγητής ΤΕΙ Θεσσαλίας Τµήµα Διοίκησης Επιχειρήσεων Θερµικός χάρτης των XYZ ξενοδοχείων σε σχέση µε τη γεωγραφική περιοχή τους P. Adamopoulos New

Διαβάστε περισσότερα

Το μοντέλο Perceptron

Το μοντέλο Perceptron Το μοντέλο Perceptron Αποτελείται από έναν μόνο νευρώνα McCulloch-Pitts w j x x 1, x2,..., w x T 1 1 x 2 w 2 Σ u x n f(u) Άνυσμα Εισόδου s i x j x n w n -θ w w 1, w2,..., w n T Άνυσμα Βαρών 1 Το μοντέλο

Διαβάστε περισσότερα

ΕΛΕΓΧΟΣ ΠΑΡΑΓΩΓΙΚΩΝ ΔΙΕΡΓΑΣΙΩΝ

ΕΛΕΓΧΟΣ ΠΑΡΑΓΩΓΙΚΩΝ ΔΙΕΡΓΑΣΙΩΝ ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Ανώτατο Εκπαιδευτικό Ίδρυμα Πειραιά Τεχνολογικού Τομέα ΕΛΕΓΧΟΣ ΠΑΡΑΓΩΓΙΚΩΝ ΔΙΕΡΓΑΣΙΩΝ Ενότητα: Αναγνώριση Διεργασίας - Προσαρμοστικός Έλεγχος (Process Identification) Αλαφοδήμος Κωνσταντίνος

Διαβάστε περισσότερα

Αναγνώριση Προτύπων Ι

Αναγνώριση Προτύπων Ι Αναγνώριση Προτύπων Ι Ενότητα 1: Μέθοδοι Αναγνώρισης Προτύπων Αν. Καθηγητής Δερματάς Ευάγγελος Τμήμα Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται

Διαβάστε περισσότερα

Μέθοδοι Μηχανικής Μάθησης στην επεξεργασία Τηλεπισκοπικών Δεδομένων. Δρ. Ε. Χάρου

Μέθοδοι Μηχανικής Μάθησης στην επεξεργασία Τηλεπισκοπικών Δεδομένων. Δρ. Ε. Χάρου Μέθοδοι Μηχανικής Μάθησης στην επεξεργασία Τηλεπισκοπικών Δεδομένων Δρ. Ε. Χάρου Πρόγραμμα υπολογιστικής ευφυίας Ινστιτούτο Πληροφορικής & Τηλεπικοινωνιών ΕΚΕΦΕ ΔΗΜΟΚΡΙΤΟΣ exarou@iit.demokritos.gr Μηχανική

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΕΤΡΙΑ. Βιολέττα Δάλλα. Εθνικό και Καποδιστριακό Πανεπιστήµιο Αθηνών

ΟΙΚΟΝΟΜΕΤΡΙΑ. Βιολέττα Δάλλα. Εθνικό και Καποδιστριακό Πανεπιστήµιο Αθηνών ΟΙΚΟΝΟΜΕΤΡΙΑ Βιολέττα Δάλλα Τµήµα Οικονοµικών Επιστηµών Εθνικό και Καποδιστριακό Πανεπιστήµιο Αθηνών 1 Εισαγωγή Οικονοµετρία (Econometrics) είναι ο τοµέας της Οικονοµικής επιστήµης που περιγράφει και αναλύει

Διαβάστε περισσότερα

Μοντέλο Perceptron πολλών στρωμάτων Multi Layer Perceptron (MLP)

Μοντέλο Perceptron πολλών στρωμάτων Multi Layer Perceptron (MLP) Μοντέλο Perceptron πολλών στρωμάτων Multi Layer Perceptron (MLP) x -0,5 a x x 2 0 0 0 0 - -0,5 y y 0 0 x 2 -,5 a 2 θ η τιμή κατωφλίου Μία λύση του προβλήματος XOR Multi Layer Perceptron (MLP) x -0,5 Μία

Διαβάστε περισσότερα

ΔΠΜΣ: ΕΦΑΡΜΟΣΜΕΝΕΣ ΜΑΘΗΜΑΤΙΚΕΣ ΕΠΙΣΤΗΜΕΣ ΡΟΗ: ΣΤΑΤΙΣΤΙΚΗ-ΠΙΘΑΝΟΤΗΤΕΣ ΜΑΘΗΜΑ: ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΤΕΛΙΚΗ ΕΡΓΑΣΙΑ ΔΗΜΗΤΡΑ ΤΑΤΣΙΟΥ

ΔΠΜΣ: ΕΦΑΡΜΟΣΜΕΝΕΣ ΜΑΘΗΜΑΤΙΚΕΣ ΕΠΙΣΤΗΜΕΣ ΡΟΗ: ΣΤΑΤΙΣΤΙΚΗ-ΠΙΘΑΝΟΤΗΤΕΣ ΜΑΘΗΜΑ: ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΤΕΛΙΚΗ ΕΡΓΑΣΙΑ ΔΗΜΗΤΡΑ ΤΑΤΣΙΟΥ ΔΠΜΣ: ΕΦΑΡΜΟΣΜΕΝΕΣ ΜΑΘΗΜΑΤΙΚΕΣ ΕΠΙΣΤΗΜΕΣ ΡΟΗ: ΣΤΑΤΙΣΤΙΚΗ-ΠΙΘΑΝΟΤΗΤΕΣ ΜΑΘΗΜΑ: ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΤΕΛΙΚΗ ΕΡΓΑΣΙΑ ΔΗΜΗΤΡΑ ΤΑΤΣΙΟΥ ΠΡΟΕΠΙΣΚΟΠΗΣΗ ΚΑΙ ΕΞΕΡΕΥΝΗΣΗ ΤΩΝ ΔΕΔΟΜΕΝΩΝ Τα προς επεξεργασία

Διαβάστε περισσότερα

ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Τραπεζικής & Χρηματοοικονομικής

ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Τραπεζικής & Χρηματοοικονομικής ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Τραπεζικής & Χρηματοοικονομικής Υποθέσεις του Απλού γραμμικού υποδείγματος της Παλινδρόμησης Η μεταβλητή ε t (διαταρακτικός όρος) είναι τυχαία μεταβλητή με μέσο όρο

Διαβάστε περισσότερα

ΗΥ562 Προχωρημένα Θέματα Βάσεων Δεδομένων Efficient Query Evaluation over Temporally Correlated Probabilistic Streams

ΗΥ562 Προχωρημένα Θέματα Βάσεων Δεδομένων Efficient Query Evaluation over Temporally Correlated Probabilistic Streams ΗΥ562 Προχωρημένα Θέματα Βάσεων Δεδομένων Efficient Query Evaluation over Temporally Correlated Probabilistic Streams Αλέκα Σεληνιωτάκη Ηράκλειο, 26/06/12 aseliniotaki@csd.uoc.gr ΑΜ: 703 1. Περίληψη Συνεισφοράς

Διαβάστε περισσότερα

ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ. Παπάνα Αγγελική

ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ. Παπάνα Αγγελική ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ 7o Μάθημα: Απλή παλινδρόμηση (ΕΠΑΝΑΛΗΨΗ) Παπάνα Αγγελική Μεταδιδακτορική ερευνήτρια, ΑΠΘ & ΠΑΜΑΚ E-mail: angeliki.papana@gmail.com, agpapana@auth.gr Webpage: http://users.auth.gr/agpapana

Διαβάστε περισσότερα

«Αναζήτηση Γνώσης σε Νοσοκομειακά Δεδομένα»

«Αναζήτηση Γνώσης σε Νοσοκομειακά Δεδομένα» ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Πρόγραμμα Σπουδών M.I.S. «Αναζήτηση Γνώσης σε Νοσοκομειακά Δεδομένα» Μεταπτυχιακός Φοιτητής: Επιβλέπων Καθηγητής: Εξεταστής Καθηγητής: Τορτοπίδης Γεώργιος Μηχανικός

Διαβάστε περισσότερα

Ανάλυση και Σχεδιασμός Μεταφορών Ι Ανάλυση Διακριτών Επιλογών

Ανάλυση και Σχεδιασμός Μεταφορών Ι Ανάλυση Διακριτών Επιλογών Ανάλυση Διακριτών Επιλογών Παναγιώτης Παπαντωνίου Δρ. Πολιτικός Μηχανικός, Συγκοινωνιολόγος Πάτρα, 2017 Περιεχόμενα Αθροιστικά μοντέλα Εξατομικευμένα μοντέλα Μοντέλα Διακριτών Μεταβλητών Θεωρία Μεγιστοποίησης

Διαβάστε περισσότερα

ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ

ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΚΑΙ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ Δ.Π.Μ.Σ. ΕΦΑΡΜΟΣΜΕΝΕΣ ΜΑΘΗΜΑΤΙΚΕΣ ΕΠΙΣΤΗΜΕΣ ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΤΕΛΙΚΗ ΕΡΓΑΣΙΑ ΧΟΥΧΟΥΜΗΣ ΙΩΑΝΝΗΣ Το σύνολο των

Διαβάστε περισσότερα

Εργαστήρια Text Mining & Sentiment Analysis με Rapid Miner

Εργαστήρια Text Mining & Sentiment Analysis με Rapid Miner 10. Text Mining Για να μπορέσουμε να χρησιμοποιήσουμε τις δυνατότητες text mining του Rapid Miner πρέπει να εγκαταστήσουμε το Text Mining Extension. Πηγαίνουμε Help Updates and Extensions (Marketplace)

Διαβάστε περισσότερα

Μάθηση και Γενίκευση. "Τεχνητά Νευρωνικά Δίκτυα" (Διαφάνειες), Α. Λύκας, Παν. Ιωαννίνων

Μάθηση και Γενίκευση. Τεχνητά Νευρωνικά Δίκτυα (Διαφάνειες), Α. Λύκας, Παν. Ιωαννίνων Μάθηση και Γενίκευση Το Πολυεπίπεδο Perceptron (MultiLayer Perceptron (MLP)) Έστω σύνολο εκπαίδευσης D={(x n,t n )}, n=1,,n. x n =(x n1,, x nd ) T, t n =(t n1,, t np ) T Θα πρέπει το MLP να έχει d νευρώνες

Διαβάστε περισσότερα

Προεπεξεργασία Δεδομένων. Αποθήκες και Εξόρυξη Δεδομένων Διδάσκουσα: Μαρία Χαλκίδη

Προεπεξεργασία Δεδομένων. Αποθήκες και Εξόρυξη Δεδομένων Διδάσκουσα: Μαρία Χαλκίδη Προεπεξεργασία Δεδομένων Αποθήκες και Εξόρυξη Δεδομένων Διδάσκουσα: Μαρία Χαλκίδη Η διαδικασίας της ανακάλυψης γνώσης Knowledge Discovery (KDD) Process Εξόρυξη δεδομένων- πυρήνας της διαδικασίας ανακάλυψης

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΕΤΡΙΑ. Β μέρος: Ετεροσκεδαστικότητα. Παπάνα Αγγελική

ΟΙΚΟΝΟΜΕΤΡΙΑ. Β μέρος: Ετεροσκεδαστικότητα. Παπάνα Αγγελική ΟΙΚΟΝΟΜΕΤΡΙΑ Ενότητα 10: Οικονομετρικά προβλήματα: Παραβίαση των υποθέσεων Β μέρος: Ετεροσκεδαστικότητα Παπάνα Αγγελική Μεταδιδακτορική ερευνήτρια, ΑΠΘ E-mail: angeliki.papana@gmail.com, agpapana@auth.gr

Διαβάστε περισσότερα

Διπλωματική Εργασία: «Συγκριτική Μελέτη Μηχανισμών Εκτίμησης Ελλιπούς Πληροφορίας σε Ασύρματα Δίκτυα Αισθητήρων»

Διπλωματική Εργασία: «Συγκριτική Μελέτη Μηχανισμών Εκτίμησης Ελλιπούς Πληροφορίας σε Ασύρματα Δίκτυα Αισθητήρων» Τμήμα Πληροφορικής και Τηλεπικοινωνιών Πρόγραμμα Μεταπτυχιακών Σπουδών Διπλωματική Εργασία: «Συγκριτική Μελέτη Μηχανισμών Εκτίμησης Ελλιπούς Πληροφορίας σε Ασύρματα Δίκτυα Αισθητήρων» Αργυροπούλου Αιμιλία

Διαβάστε περισσότερα

Κεφάλαιο 20. Ανακάλυψη Γνώσης σε Βάσεις δεδοµένων. Τεχνητή Νοηµοσύνη - Β' Έκδοση Ι. Βλαχάβας, Π. Κεφαλάς, Ν. Βασιλειάδης, Φ. Κόκκορας, Η.

Κεφάλαιο 20. Ανακάλυψη Γνώσης σε Βάσεις δεδοµένων. Τεχνητή Νοηµοσύνη - Β' Έκδοση Ι. Βλαχάβας, Π. Κεφαλάς, Ν. Βασιλειάδης, Φ. Κόκκορας, Η. Κεφάλαιο 20 Ανακάλυψη Γνώσης σε Βάσεις δεδοµένων Τεχνητή Νοηµοσύνη - Β' Έκδοση Ι. Βλαχάβας, Π. Κεφαλάς, Ν. Βασιλειάδης, Φ. Κόκκορας, Η. Σακελλαρίου Τεχνητή Νοηµοσύνη, B' Έκδοση - 1 - Ανακάλυψη Γνώσης σε

Διαβάστε περισσότερα

Τεχνητή Νοημοσύνη. 17η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

Τεχνητή Νοημοσύνη. 17η διάλεξη ( ) Ίων Ανδρουτσόπουλος. Τεχνητή Νοημοσύνη 17η διάλεξη (2016-17) Ίων Ανδρουτσόπουλος http://.aueb.gr/users/ion/ 1 Οι διαφάνειες αυτής της διάλεξης βασίζονται: στο βιβλίο Artificia Inteigence A Modern Approach των S. Russe και

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 5. Κύκλος Ζωής Εφαρμογών ΕΝΟΤΗΤΑ 2. Εφαρμογές Πληροφορικής. Διδακτικές ενότητες 5.1 Πρόβλημα και υπολογιστής 5.2 Ανάπτυξη εφαρμογών

ΚΕΦΑΛΑΙΟ 5. Κύκλος Ζωής Εφαρμογών ΕΝΟΤΗΤΑ 2. Εφαρμογές Πληροφορικής. Διδακτικές ενότητες 5.1 Πρόβλημα και υπολογιστής 5.2 Ανάπτυξη εφαρμογών 44 Διδακτικές ενότητες 5.1 Πρόβλημα και υπολογιστής 5.2 Ανάπτυξη εφαρμογών Διδακτικοί στόχοι Σκοπός του κεφαλαίου είναι οι μαθητές να κατανοήσουν τα βήματα που ακολουθούνται κατά την ανάπτυξη μιας εφαρμογής.

Διαβάστε περισσότερα

ΤΟ ΜΟΝΤΕΛΟ Οι Υποθέσεις Η Απλή Περίπτωση για λi = μi 25 = Η Γενική Περίπτωση για λi μi..35

ΤΟ ΜΟΝΤΕΛΟ Οι Υποθέσεις Η Απλή Περίπτωση για λi = μi 25 = Η Γενική Περίπτωση για λi μi..35 ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΣΧΟΛΗ ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΜΑΘΗΜΑΤΙΚΩΝ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ ΤΟΜΕΑΣ ΣΤΑΤΙΣΤΙΚΗΣ ΚΑΙ ΕΠΙΧΕΙΡΗΣΙΑΚΗΣ ΕΡΕΥΝΑΣ ΑΝΑΛΥΣΗ ΤΩΝ ΣΥΣΧΕΤΙΣΕΩΝ ΧΡΕΟΚΟΠΙΑΣ ΚΑΙ ΤΩΝ

Διαβάστε περισσότερα

ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ (Data Mining) Πανδή Αθηνά

ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ (Data Mining) Πανδή Αθηνά ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ (Data Mining) Πανδή Αθηνά Μάιος 2008 Τα δεδομένα που έχουμε προς επεξεργασία χωρίζονται σε τρία μέρη: 1. Τα δεδομένα εκπαίδευσης (training set) που αποτελούνται από 2528

Διαβάστε περισσότερα

τρόπος για να εμπεδωθεί η θεωρία. Για την επίλυση των παραδειγμάτων χρησιμοποιούνται στατιστικά πακέτα, ώστε να είναι δυνατή η ανάλυση μεγάλου όγκου

τρόπος για να εμπεδωθεί η θεωρία. Για την επίλυση των παραδειγμάτων χρησιμοποιούνται στατιστικά πακέτα, ώστε να είναι δυνατή η ανάλυση μεγάλου όγκου ΠΡΟΛΟΓΟΣ Η γραμμική παλινδρόμηση χρησιμοποιείται για την μελέτη των σχέσεων μεταξύ μετρήσιμων μεταβλητών. Γενικότερα, η γραμμική στατιστική συμπερασματολογία αποτελεί ένα ευρύ πεδίο της στατιστικής ανάλυσης

Διαβάστε περισσότερα

Πανεπιστήµιο Κύπρου Πολυτεχνική Σχολή

Πανεπιστήµιο Κύπρου Πολυτεχνική Σχολή Πανεπιστήµιο Κύπρου Πολυτεχνική Σχολή Τµήµα Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών ΗΜΜΥ 795: ΑΝΑΓΝΩΡΙΣΗ ΠΡΟΤΥΠΩΝ Ακαδηµαϊκό έτος 2010-11 Χειµερινό Εξάµηνο Τελική εξέταση Τρίτη, 21 εκεµβρίου 2010,

Διαβάστε περισσότερα

Γ. Πειραματισμός Βιομετρία

Γ. Πειραματισμός Βιομετρία Γενικά Συσχέτιση και Συμμεταβολή Όταν σε ένα πείραμα παραλλάσουν ταυτόχρονα δύο μεταβλητές, τότε ενδιαφέρει να διερευνηθεί εάν και πως οι αλλαγές στη μία μεταβλητή σχετίζονται με τις αλλαγές στην άλλη.

Διαβάστε περισσότερα

HMY 795: Αναγνώριση Προτύπων

HMY 795: Αναγνώριση Προτύπων HMY 795: Αναγνώριση Προτύπων Διάλεξη 3 Επιλογή μοντέλου Επιλογή μοντέλου Θεωρία αποφάσεων Επιλογή μοντέλου δεδομένα επικύρωσης Η επιλογή του είδους του μοντέλου που θα χρησιμοποιηθεί σε ένα πρόβλημα (π.χ.

Διαβάστε περισσότερα

Απλή Γραμμική Παλινδρόμηση I

Απλή Γραμμική Παλινδρόμηση I Απλή Γραμμική Παλινδρόμηση I. Εισαγωγή Έστω ότι θέλουμε να ερευνήσουμε εμπειρικά τη σχέση που υπάρχει ανάμεσα στις δαπάνες κατανάλωσης και στο διαθέσιμο εισόδημα, των οικογενειών. Σύμφωνα με την Κεϋνσιανή

Διαβάστε περισσότερα

Κινητά Δίκτυα Επικοινωνιών. Συμπληρωματικό υλικό. Προσαρμοστική Ισοστάθμιση Καναλιού

Κινητά Δίκτυα Επικοινωνιών. Συμπληρωματικό υλικό. Προσαρμοστική Ισοστάθμιση Καναλιού Κινητά Δίκτυα Επικοινωνιών Συμπληρωματικό υλικό Προσαρμοστική Ισοστάθμιση Καναλιού Προσαρμοστικοί Ισοσταθμιστές Για να υπολογίσουμε τους συντελεστές του ισοσταθμιστή MMSE, απαιτείται να λύσουμε ένα γραμμικό

Διαβάστε περισσότερα

Αντικείμενο του κεφαλαίου είναι: Ανάλυση συσχέτισης μεταξύ δύο μεταβλητών. Εξίσωση παλινδρόμησης. Πρόβλεψη εξέλιξης

Αντικείμενο του κεφαλαίου είναι: Ανάλυση συσχέτισης μεταξύ δύο μεταβλητών. Εξίσωση παλινδρόμησης. Πρόβλεψη εξέλιξης Γραμμική Παλινδρόμηση και Συσχέτιση Αντικείμενο του κεφαλαίου είναι: Ανάλυση συσχέτισης μεταξύ δύο μεταβλητών Εξίσωση παλινδρόμησης Πρόβλεψη εξέλιξης Διμεταβλητές συσχετίσεις Πολλές φορές χρειάζεται να

Διαβάστε περισσότερα

Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 19/5/2017

Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 19/5/2017 Απλή Γραμμική Παλινδρόμηση και Συσχέτιση 2 Εισαγωγή Η ανάλυση παλινδρόμησης περιλαμβάνει το σύνολο των μεθόδων της στατιστικής που αναφέρονται σε ποσοτικές σχέσεις μεταξύ μεταβλητών Πρότυπα παλινδρόμησης

Διαβάστε περισσότερα

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ Μ.Ν. Ντυκέν, Πανεπιστήμιο Θεσσαλίας Τ.Μ.Χ.Π.Π.Α. Ε. Αναστασίου, Πανεπιστήμιο Θεσσαλίας Τ.Μ.Χ.Π.Π.Α. ΔΙΑΛΕΞΗ 07 & ΔΙΑΛΕΞΗ 08 ΣΗΜΠΕΡΑΣΜΑΤΙΚΗ ΣΤΑΤΙΣΤΙΚΗ Βόλος, 016-017 ΕΙΣΑΓΩΓΗ ΣΤΗΝ

Διαβάστε περισσότερα

Τ.Ε.Ι. ΑΝΑΤΟΛΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ ΚΑΙ ΘΡΑΚΗΣ ΤΜΗΜΑ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΓΡΑΜΜΙΚΟΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ

Τ.Ε.Ι. ΑΝΑΤΟΛΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ ΚΑΙ ΘΡΑΚΗΣ ΤΜΗΜΑ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΓΡΑΜΜΙΚΟΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ Τ.Ε.Ι. ΑΝΑΤΟΛΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ ΚΑΙ ΘΡΑΚΗΣ ΤΜΗΜΑ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΓΡΑΜΜΙΚΟΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ ΕΙΣΗΓΗΤΗΣ: Δρ. Ιωάννης Σ. Τουρτούρας Μηχανικός Παραγωγής & Διοίκησης Δ.Π.Θ. Χρηματοδότηση Το παρόν εκπαιδευτικό

Διαβάστε περισσότερα

1. ΣΤΑΤΙΚΗ ΑΡΙΣΤΟΠΟΙΗΣΗ

1. ΣΤΑΤΙΚΗ ΑΡΙΣΤΟΠΟΙΗΣΗ . ΣΤΑΤΙΚΗ ΑΡΙΣΤΟΠΟΙΗΣΗ. Μέγιστα και Ελάχιστα Συναρτήσεων Χωρίς Περιορισμούς Συναρτήσεις μιας Μεταβλητής Εστω f ( x) είναι συνάρτηση μιας μόνο μεταβλητής. Εστω επίσης ότι x είναι ένα σημείο στο πεδίο ορισμού

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΔΙΚΤΥΑ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΔΙΚΤΥΑ ΘΕΜΑ 1 ο (2,5 μονάδες) ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΔΙΚΤΥΑ Τελικές εξετάσεις Πέμπτη 21 Ιουνίου 2012 16:30-19:30 Υποθέστε ότι θέλουμε

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική ΟΙΚΟΝΟΜΕΤΡΙΑ Ενότητα 13: Επανάληψη Παπάνα Αγγελική Μεταδιδακτορική ερευνήτρια, ΑΠΘ E-mail: angeliki.papana@gmail.com, agpapana@auth.gr Webpage: http://users.auth.gr/agpapana 1 Γιατί μελετούμε την Οικονομετρία;

Διαβάστε περισσότερα

9. Παλινδρόμηση και Συσχέτιση

9. Παλινδρόμηση και Συσχέτιση 9. Παλινδρόμηση και Συσχέτιση Παλινδρόμηση και Συσχέτιση Υπάρχει σχέση ανάμεσα σε δύο ή περισσότερες μεταβλητές; Αν ναι, ποια είναι αυτή η σχέση; Πως μπορεί αυτή η σχέση να χρησιμοποιηθεί για να προβλέψουμε

Διαβάστε περισσότερα

Η Μηχανική Μάθηση στο Σχολείο: Μια Προσέγγιση για την Εισαγωγή της Ενισχυτικής Μάθησης στην Τάξη

Η Μηχανική Μάθηση στο Σχολείο: Μια Προσέγγιση για την Εισαγωγή της Ενισχυτικής Μάθησης στην Τάξη 6 ο Πανελλήνιο Συνέδριο «Διδακτική της Πληροφορικής» Φλώρινα, 20-22 Απριλίου 2012 Η Μηχανική Μάθηση στο Σχολείο: Μια Προσέγγιση για την Εισαγωγή της Ενισχυτικής Μάθησης στην Τάξη Σάββας Νικολαΐδης 1 ο

Διαβάστε περισσότερα

Συνήθεις διαφορικές εξισώσεις προβλήματα οριακών τιμών

Συνήθεις διαφορικές εξισώσεις προβλήματα οριακών τιμών Συνήθεις διαφορικές εξισώσεις προβλήματα οριακών τιμών Οι παρούσες σημειώσεις αποτελούν βοήθημα στο μάθημα Αριθμητικές Μέθοδοι του 5 ου εξαμήνου του ΤΜΜ ημήτρης Βαλουγεώργης Καθηγητής Εργαστήριο Φυσικών

Διαβάστε περισσότερα

ΑΝΔΡΟΥΛΑΚΗΣ ΜΑΝΟΣ A.M AΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ

ΑΝΔΡΟΥΛΑΚΗΣ ΜΑΝΟΣ A.M AΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΑΝΔΡΟΥΛΑΚΗΣ ΜΑΝΟΣ A.M. 09470015 AΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ Διδάσκων: Γιώργος Τζιραλής ΔΠΜΣ ΕΦΑΡΜΟΣΜΕΝΕΣ ΜΑΘΗΜΑΤΙΚΕΣ ΕΠΙΣΤΗΜΕΣ Στάδιο 1 ο. Προεπισκόπηση-προεπεξεργασία δεδομένων: Δίδονται τα παρακάτω

Διαβάστε περισσότερα

3. ΣΕΙΡΙΑΚΟΣ ΣΥΝΤΕΛΕΣΤΗΣ ΣΥΣΧΕΤΙΣΗΣ

3. ΣΕΙΡΙΑΚΟΣ ΣΥΝΤΕΛΕΣΤΗΣ ΣΥΣΧΕΤΙΣΗΣ 3. ΣΕΙΡΙΑΚΟΣ ΣΥΝΤΕΛΕΣΤΗΣ ΣΥΣΧΕΤΙΣΗΣ Πρόβλημα: Ένας ραδιοφωνικός σταθμός ενδιαφέρεται να κάνει μια ανάλυση για τους πελάτες του που διαφημίζονται σ αυτόν για να εξετάσει την ποσοστιαία μεταβολή των πωλήσεων

Διαβάστε περισσότερα

Αριθμητική Ανάλυση & Εφαρμογές

Αριθμητική Ανάλυση & Εφαρμογές Αριθμητική Ανάλυση & Εφαρμογές Διδάσκων: Δημήτριος Ι. Φωτιάδης Τμήμα Μηχανικών Επιστήμης Υλικών Ιωάννινα 2017-2018 Υπολογισμοί και Σφάλματα Παράσταση Πραγματικών Αριθμών Συστήματα Αριθμών Παράσταση Ακέραιου

Διαβάστε περισσότερα

Πρόλογος... xv. Κεφάλαιο 1. Εισαγωγικές Έννοιες... 1

Πρόλογος... xv. Κεφάλαιο 1. Εισαγωγικές Έννοιες... 1 Πρόλογος... xv Κεφάλαιο 1. Εισαγωγικές Έννοιες... 1 1.1.Ιστορική Αναδρομή... 1 1.2.Βασικές Έννοιες... 5 1.3.Πλαίσιο ειγματοληψίας (Sampling Frame)... 9 1.4.Κατηγορίες Ιατρικών Μελετών.... 11 1.4.1.Πειραµατικές

Διαβάστε περισσότερα

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ. Κεφάλαιο 10. Εισαγωγή στην εκτιμητική

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ. Κεφάλαιο 10. Εισαγωγή στην εκτιμητική ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΔΥΤΙΚΗΣ ΕΛΛΑΔΑΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΠΑΤΡΑΣ Εργαστήριο Λήψης Αποφάσεων & Επιχειρησιακού Προγραμματισμού Καθηγητής Ι. Μητρόπουλος ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ

Διαβάστε περισσότερα

10. ΠΟΛΛΑΠΛΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

10. ΠΟΛΛΑΠΛΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ 0. ΠΟΛΛΑΠΛΗ ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ 0. ΤΟ ΓΕΝΙΚΟ ΓΡΑΜΜΙΚΟ ΜΟΝΤΕΛΟ Συχνά στην πράξη το μοντέλο της απλής γραμμικής παλινδρόμησης είναι ανεπαρκές για την περιγραφή της μεταβλητότητας που υπάρχει στην εξαρτημένη

Διαβάστε περισσότερα

ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΤΜΗΜΑ ΟΡΓΑΝΩΣΗΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΔΙΔΑΣΚΩΝ: ΘΑΝΑΣΗΣ ΚΑΖΑΝΑΣ. Οικονομετρία

ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΤΜΗΜΑ ΟΡΓΑΝΩΣΗΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΔΙΔΑΣΚΩΝ: ΘΑΝΑΣΗΣ ΚΑΖΑΝΑΣ. Οικονομετρία ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΤΜΗΜΑ ΟΡΓΑΝΩΣΗΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΔΙΔΑΣΚΩΝ: ΘΑΝΑΣΗΣ ΚΑΖΑΝΑΣ Οικονομετρία 6.1 Ετεροσκεδαστικότητα: Εισαγωγή Συχνά, η υπόθεση της σταθερής διακύμανσης των όρων σφάλματος,

Διαβάστε περισσότερα

ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ. Παπάνα Αγγελική

ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ. Παπάνα Αγγελική ΧΡΟΝΙΚΕΣ ΣΕΙΡΕΣ 7ο μάθημα: Πολυμεταβλητή παλινδρόμηση (ΕΠΑΝΑΛΗΨΗ) Παπάνα Αγγελική Μεταδιδακτορική ερευνήτρια, ΑΠΘ & ΠΑΜΑΚ E-mail: angeliki.papana@gmail.com, agpapana@auth.gr Webpage: http://users.auth.gr/agpapana

Διαβάστε περισσότερα

ΕΤΑΙΡΙΚΗ ΚΟΙΝΩΝΙΚΗ ΕΥΘΥΝΗ ΣΤΗΝ ΝΑΥΤΙΛΙΑΚΗ ΒΙΟΜΗΧΑΜΙΑ

ΕΤΑΙΡΙΚΗ ΚΟΙΝΩΝΙΚΗ ΕΥΘΥΝΗ ΣΤΗΝ ΝΑΥΤΙΛΙΑΚΗ ΒΙΟΜΗΧΑΜΙΑ ΤΕΧΝΟΛΟΓΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΚΑΙ ΟΙΚΟΝΟΜΙΑΣ Μεταπτυχιακή διατριβή ΕΤΑΙΡΙΚΗ ΚΟΙΝΩΝΙΚΗ ΕΥΘΥΝΗ ΣΤΗΝ ΝΑΥΤΙΛΙΑΚΗ ΒΙΟΜΗΧΑΜΙΑ Ανδρούλα Γιαπάνη Λεμεσός, Φεβρουάριος 2018 0 i ΤΕΧΝΟΛΟΓΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ

Διαβάστε περισσότερα

3η Ενότητα Προβλέψεις

3η Ενότητα Προβλέψεις ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ Μονάδα Προβλέψεων & Στρατηγικής Forecasting & Strategy Unit Τεχνικές Προβλέψεων 3η Ενότητα Προβλέψεις (Μέρος 4 ο ) http://www.fsu.gr

Διαβάστε περισσότερα

Αναγνώριση Προτύπων Ι

Αναγνώριση Προτύπων Ι Αναγνώριση Προτύπων Ι Ενότητα 3: Στοχαστικά Συστήματα Αν. Καθηγητής Δερματάς Ευάγγελος Τμήμα Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες

Διαβάστε περισσότερα

ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Τμήμα Τραπεζικής & Χρηματοοικονομικής

ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Τμήμα Τραπεζικής & Χρηματοοικονομικής ΤΕΙ ΔΥΤΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ Μεταπτυχιακό Τμήμα Τραπεζικής & Χρηματοοικονομικής Πολλαπλό Γραμμικό Υπόδειγμα Παλινδρόμησης Τα υποδείγματα του απλού γραμμικού υποδείγματος της παλινδρόμησης (simple linear regression

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική

ΟΙΚΟΝΟΜΕΤΡΙΑ. Παπάνα Αγγελική ΟΙΚΟΝΟΜΕΤΡΙΑ Ενότητα 3: Ανάλυση γραμμικού υποδείγματος Απλή παλινδρόμηση (2 ο μέρος) Παπάνα Αγγελική Μεταδιδακτορική ερευνήτρια, ΑΠΘ E-mail: angeliki.papana@gmail.com, agpapana@auth.gr Webpage: http://users.auth.gr/agpapana

Διαβάστε περισσότερα

Εισαγωγή στα Τεχνητά Νευρωνικά Δίκτυα. "Τεχνητά Νευρωνικά Δίκτυα" (Διαφάνειες), Α. Λύκας, Παν. Ιωαννίνων

Εισαγωγή στα Τεχνητά Νευρωνικά Δίκτυα. Τεχνητά Νευρωνικά Δίκτυα (Διαφάνειες), Α. Λύκας, Παν. Ιωαννίνων Εισαγωγή στα Τεχνητά Νευρωνικά Δίκτυα Τεχνητή Νοημοσύνη (Artificial Intelligence) Ανάπτυξη μεθόδων και τεχνολογιών για την επίλυση προβλημάτων στα οποία ο άνθρωπος υπερέχει (?) του υπολογιστή Συλλογισμοί

Διαβάστε περισσότερα

Μεθοδική Ανάπτυξη Δικτυακής Υποδομής. Παρουσίαση στην ημερίδα για Σύγχρονες τάσεις στις Τηλεπικοινωνίες και Τεχνολογίες Αιχμής

Μεθοδική Ανάπτυξη Δικτυακής Υποδομής. Παρουσίαση στην ημερίδα για Σύγχρονες τάσεις στις Τηλεπικοινωνίες και Τεχνολογίες Αιχμής Μεθοδική Ανάπτυξη Δικτυακής Υποδομής Παρουσίαση στην ημερίδα για Σύγχρονες τάσεις στις Τηλεπικοινωνίες και Τεχνολογίες Αιχμής 14-01-2006 1 Περιεχόμενα Η ανάγκη για μεθοδικό σχεδιασμό δικτύων Μία δομημένη

Διαβάστε περισσότερα

ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΤΜΗΜΑ ΟΡΓΑΝΩΣΗΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΔΙΔΑΣΚΩΝ: ΘΑΝΑΣΗΣ ΚΑΖΑΝΑΣ. Οικονομετρία

ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΤΜΗΜΑ ΟΡΓΑΝΩΣΗΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΔΙΔΑΣΚΩΝ: ΘΑΝΑΣΗΣ ΚΑΖΑΝΑΣ. Οικονομετρία ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΤΜΗΜΑ ΟΡΓΑΝΩΣΗΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΔΙΔΑΣΚΩΝ: ΘΑΝΑΣΗΣ ΚΑΖΑΝΑΣ Οικονομετρία I.1 Τι Είναι η Οικονομετρία; Η κυριολεκτική ερμηνεία της λέξης, οικονομετρία είναι «οικονομική

Διαβάστε περισσότερα

ΠΟΣΟΤΙΚΕΣ ΜΕΘΟΔΟΙ ΙI (ΣΤΑΤΙΣΤΙΚΗ ΓΙΑ ΤΗ ΔΙΟΙΚΗΣΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ) (ΟΔΕ 2116)

ΠΟΣΟΤΙΚΕΣ ΜΕΘΟΔΟΙ ΙI (ΣΤΑΤΙΣΤΙΚΗ ΓΙΑ ΤΗ ΔΙΟΙΚΗΣΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ) (ΟΔΕ 2116) Σελίδα 1 ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΟΡΓΑΝΩΣΗΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΜΑΘΗΜΑ: ΠΟΣΟΤΙΚΕΣ ΜΕΘΟΔΟΙ ΙΙ (ΣΤΑΤΙΣΤΙΚΗ ΓΙΑ ΤΗ ΔΙΟΙΚΗΣΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ) (ΟΔΕ 2116) ΠΑΝΕΠΙΣΤΗΜΙΑΚΟΣ ΥΠΟΤΡΟΦΟΣ ΠΑΝΑΓΙΩΤΗΣ

Διαβάστε περισσότερα

ΠΕΙΡΑΜΑΤΙΚΕΣ ΠΡΟΣΟΜΟΙΩΣΕΙΣ ΚΕΦΑΛΑΙΟ 4. είναι η πραγματική απόκριση του j δεδομένου (εκπαίδευσης ή ελέγχου) και y ˆ j

ΠΕΙΡΑΜΑΤΙΚΕΣ ΠΡΟΣΟΜΟΙΩΣΕΙΣ ΚΕΦΑΛΑΙΟ 4. είναι η πραγματική απόκριση του j δεδομένου (εκπαίδευσης ή ελέγχου) και y ˆ j Πειραματικές Προσομοιώσεις ΚΕΦΑΛΑΙΟ 4 Όλες οι προσομοιώσεις έγιναν σε περιβάλλον Matlab. Για την υλοποίηση της μεθόδου ε-svm χρησιμοποιήθηκε το λογισμικό SVM-KM που αναπτύχθηκε στο Ecole d Ingenieur(e)s

Διαβάστε περισσότερα

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2 Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας Verson ΜΙΑ ΣΥΜΒΑΣΗ: Προκειμένου να καταστήσουμε πιο συμπαγή το συμβολισμό H : ορίζουμε Ετσι έχουμε *=[ ] an *=[ ]. H : * * ΣΗΜΕΙΩΣΗ: Στη συνέχεια εκτός αν ορίζεται

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΕΤΡΙΑ. Ενότητα 2: Παλινδρόμηση. Αναπλ. Καθηγητής Νικόλαος Σαριαννίδης Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά)

ΟΙΚΟΝΟΜΕΤΡΙΑ. Ενότητα 2: Παλινδρόμηση. Αναπλ. Καθηγητής Νικόλαος Σαριαννίδης Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) ΟΙΚΟΝΟΜΕΤΡΙΑ Ενότητα 2: Παλινδρόμηση. Αναπλ. Καθηγητής Νικόλαος Σαριαννίδης Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons.

Διαβάστε περισσότερα

ΤΕΧΝΟΛΟΓΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΣΧΟΛΗ ΜΗΧΑΝΙΚΗΣ ΚΑΙ ΤΕΧΝΟΛΟΓΙΑΣ. Πτυχιακή εργασία ΕΤΟΙΜΑΣΙΑ ΔΕΛΤΙΟΥ ΠΟΣΟΤΗΤΩΝ ΜΕ ΤΗ ΧΡΗΣΗ ΛΟΓΙΣΜΙΚΟΥ ΠΡΟΓΡΑΜΜΑΤΟΣ

ΤΕΧΝΟΛΟΓΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΣΧΟΛΗ ΜΗΧΑΝΙΚΗΣ ΚΑΙ ΤΕΧΝΟΛΟΓΙΑΣ. Πτυχιακή εργασία ΕΤΟΙΜΑΣΙΑ ΔΕΛΤΙΟΥ ΠΟΣΟΤΗΤΩΝ ΜΕ ΤΗ ΧΡΗΣΗ ΛΟΓΙΣΜΙΚΟΥ ΠΡΟΓΡΑΜΜΑΤΟΣ ΤΕΧΝΟΛΟΓΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΣΧΟΛΗ ΜΗΧΑΝΙΚΗΣ ΚΑΙ ΤΕΧΝΟΛΟΓΙΑΣ Πτυχιακή εργασία ΕΤΟΙΜΑΣΙΑ ΔΕΛΤΙΟΥ ΠΟΣΟΤΗΤΩΝ ΜΕ ΤΗ ΧΡΗΣΗ ΛΟΓΙΣΜΙΚΟΥ ΠΡΟΓΡΑΜΜΑΤΟΣ Χρύσω Κωνσταντίνου Λεμεσός 2016 ΤΕΧΝΟΛΟΓΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ

Διαβάστε περισσότερα

Εφαρμοσμένη Στατιστική

Εφαρμοσμένη Στατιστική ΠΑΝΕΠΙΣΤΗΜΙΟ ΙΩΑΝΝΙΝΩΝ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Εφαρμοσμένη Στατιστική Παλινδρόμηση Διδάσκων: Επίκουρος Καθηγητής Κωνσταντίνος Μπλέκας Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης

Διαβάστε περισσότερα

Αν έχουμε δύο μεταβλητές Χ και Υ και σύμφωνα με την οικονομική θεωρία η μεταβλητή Χ προσδιορίζει τη συμπεριφορά της Υ το ερώτημα που τίθεται είναι αν

Αν έχουμε δύο μεταβλητές Χ και Υ και σύμφωνα με την οικονομική θεωρία η μεταβλητή Χ προσδιορίζει τη συμπεριφορά της Υ το ερώτημα που τίθεται είναι αν ΜΑΘΗΜΑ 12ο Αιτιότητα Ένα από τα βασικά προβλήματα που υπάρχουν στην εξειδίκευση ενός υποδείγματος είναι να προσδιοριστεί η κατεύθυνση που μία μεταβλητή προκαλεί μία άλλη σε μία εξίσωση παλινδρόμησης. Στην

Διαβάστε περισσότερα

ΤΕΧΝΟΛΟΓΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΣΧΟΛΗ ΓΕΩΤΕΧΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΚΑΙ ΕΠΙΣΤΗΜΗΣ & ΤΕΧΝΟΛΟΓΙΑΣ ΠΕΡΙΒΑΛΛΟΝΤΟΣ. Πτυχιακή εργασία

ΤΕΧΝΟΛΟΓΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΣΧΟΛΗ ΓΕΩΤΕΧΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΚΑΙ ΕΠΙΣΤΗΜΗΣ & ΤΕΧΝΟΛΟΓΙΑΣ ΠΕΡΙΒΑΛΛΟΝΤΟΣ. Πτυχιακή εργασία ΤΕΧΝΟΛΟΓΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΣΧΟΛΗ ΓΕΩΤΕΧΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΚΑΙ ΕΠΙΣΤΗΜΗΣ & ΤΕΧΝΟΛΟΓΙΑΣ ΠΕΡΙΒΑΛΛΟΝΤΟΣ Πτυχιακή εργασία ΜΕΤΑΤΡΟΠΗ ΑΝΘΡΑΚΑ (ΚΑΡΒΟΥΝΟ) ΣΕ ΕΝΕΡΓΟ ΑΝΘΡΑΚΑ ΜΕΣΩ ΧΗΜΙΚΗΣ ΚΑΙ ΘΕΡΜΙΚΗΣ ΕΠΕΞΕΡΓΑΣΙΑΣ

Διαβάστε περισσότερα

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 5 Συλλογή Δεδομένων & Δειγματοληψία

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 5 Συλλογή Δεδομένων & Δειγματοληψία ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΔΥΤΙΚΗΣ ΕΛΛΑΔΑΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΠΑΤΡΑΣ Εργαστήριο Λήψης Αποφάσεων & Επιχειρησιακού Προγραμματισμού Καθηγητής Ι. Μητρόπουλος ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ ΘΕΜΑ 1 ο (2.5 µονάδες) ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ Τελικές εξετάσεις 21 Σεπτεµβρίου 2004 ιάρκεια: 3 ώρες Το παρακάτω σύνολο

Διαβάστε περισσότερα

ΓΕΩΠΟΝΙΚΗ ΣΧΟΛΗ ΑΠΘ Εργαστήριο Πληροφορικής στη Γεωργία ΠΛΗΡΟΦΟΡΙΚΗ Ι

ΓΕΩΠΟΝΙΚΗ ΣΧΟΛΗ ΑΠΘ Εργαστήριο Πληροφορικής στη Γεωργία ΠΛΗΡΟΦΟΡΙΚΗ Ι ΓΕΩΠΟΝΙΚΗ ΣΧΟΛΗ ΑΠΘ Εργαστήριο Πληροφορικής στη Γεωργία ΠΛΗΡΟΦΟΡΙΚΗ Ι Συστήματα Υποστήριξης Αποφάσεων Τα Συστήματα Υποστήριξης Αποφάσεων (Σ.Υ.Α. - Decision Support Systems, D.S.S.) ορίζονται ως συστήματα

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ Ερωτήσεις πολλαπλής επιλογής Συντάκτης: Δημήτριος Κρέτσης 1. Ο κλάδος της περιγραφικής Στατιστικής: α. Ασχολείται με την επεξεργασία των δεδομένων και την ανάλυση

Διαβάστε περισσότερα

Βραχυπρόθεσμη τοπική μετεωρολογική πρόγνωση με αναζήτηση ανάλογων καταστάσεων

Βραχυπρόθεσμη τοπική μετεωρολογική πρόγνωση με αναζήτηση ανάλογων καταστάσεων ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΠΟΛΙΤΙΚΩΝ ΜΗΧΑΝΙΚΩΝ ΤΟΜΕΑΣ ΥΔΑΤΙΚΩΝ ΠΟΡΩΝ ΚΑΙ ΠΕΡΙΒΑΛΛΟΝΤΟΣ Βραχυπρόθεσμη τοπική μετεωρολογική πρόγνωση με αναζήτηση ανάλογων καταστάσεων Γεώργιος Θεοδωρόπουλος Επιβλέπων

Διαβάστε περισσότερα

Ασκήσεις Φροντιστηρίου «Υπολογιστική Νοημοσύνη Ι» 5 o Φροντιστήριο

Ασκήσεις Φροντιστηρίου «Υπολογιστική Νοημοσύνη Ι» 5 o Φροντιστήριο Πρόβλημα ο Ασκήσεις Φροντιστηρίου 5 o Φροντιστήριο Δίνεται το παρακάτω σύνολο εκπαίδευσης: # Είσοδος Κατηγορία 0 0 0 Α 2 0 0 Α 0 Β 4 0 0 Α 5 0 Β 6 0 0 Α 7 0 Β 8 Β α) Στον παρακάτω κύβο τοποθετείστε τα

Διαβάστε περισσότερα

Δύο είναι οι κύριες αιτίες που μπορούμε να πάρουμε από τον υπολογιστή λανθασμένα αποτελέσματα εξαιτίας των σφαλμάτων στρογγυλοποίησης:

Δύο είναι οι κύριες αιτίες που μπορούμε να πάρουμε από τον υπολογιστή λανθασμένα αποτελέσματα εξαιτίας των σφαλμάτων στρογγυλοποίησης: Ορολογία bit (binary digit): δυαδικό ψηφίο. Τα δυαδικά ψηφία είναι το 0 και το 1 1 byte = 8 bits word: η θεμελιώδης μονάδα σύμφωνα με την οποία εκπροσωπούνται οι πληροφορίες στον υπολογιστή. Αποτελείται

Διαβάστε περισσότερα

ΘΕΩΡΙΑ ΟΙΚΟΝΟΜΕΤΡΙΑΣ ΣΥΝΟΠΤΙΚΕΣ ΣΗΜΕΙΩΣΕΙΣ

ΘΕΩΡΙΑ ΟΙΚΟΝΟΜΕΤΡΙΑΣ ΣΥΝΟΠΤΙΚΕΣ ΣΗΜΕΙΩΣΕΙΣ ΘΕΩΡΙΑ ΟΙΚΟΝΟΜΕΤΡΙΑΣ ΣΥΝΟΠΤΙΚΕΣ ΣΗΜΕΙΩΣΕΙΣ ΑΠΛΟ ΓΡΑΜΜΙΚΟ ΥΠΟΔΕΙΓΜΑ Συντελεστής συσχέτισης (εκτιμητής Person: r, Y ( ( Y Y xy ( ( Y Y x y, όπου r, Y (ισχυρή θετική γραμμική συσχέτιση όταν, ισχυρή αρνητική

Διαβάστε περισσότερα

ΤΕΧΝΟΛΟΓΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΣΧΟΛΗ ΜΗΧΑΝΙΚΗΣ ΚΑΙ ΤΕΧΝΟΛΟΓΙΑΣ. Πτυχιακή εργασία

ΤΕΧΝΟΛΟΓΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΣΧΟΛΗ ΜΗΧΑΝΙΚΗΣ ΚΑΙ ΤΕΧΝΟΛΟΓΙΑΣ. Πτυχιακή εργασία ΤΕΧΝΟΛΟΓΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΣΧΟΛΗ ΜΗΧΑΝΙΚΗΣ ΚΑΙ ΤΕΧΝΟΛΟΓΙΑΣ Πτυχιακή εργασία ΕΠΙΛΥΣΗ ΤΟΥ ΠΡΟΒΛΗΜΑΤΟΣ ΧΡΟΝΟΠΡΟΓΡΑΜΜΑΤΙΣΜΟΥ ΜΕΤΑΔΟΣΗΣ ΣΕ ΑΣΥΡΜΑΤΑ ΔΙΚΤΥΑ ΜΕ ΣΥΣΚΕΥΕΣ ΔΙΑΚΡΙΤΩΝ ΤΙΜΩΝ ΙΣΧΥΟΣ ΜΕ ΤΗ ΧΡΗΣΗ

Διαβάστε περισσότερα

ΔΙΚΤΥO RBF. "Τεχνητά Νευρωνικά Δίκτυα" (Διαφάνειες), Α. Λύκας, Παν. Ιωαννίνων

ΔΙΚΤΥO RBF. Τεχνητά Νευρωνικά Δίκτυα (Διαφάνειες), Α. Λύκας, Παν. Ιωαννίνων ΔΙΚΤΥO RBF Αρχιτεκτονική δικτύου RBF Δίκτυα RBF: δίκτυα συναρτήσεων πυρήνα (radial basis function networks). Πρόσθιας τροφοδότησης (feedforward) για προβλήματα μάθησης με επίβλεψη. Εναλλακτικό του MLP.

Διαβάστε περισσότερα

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Οικονομετρία Διάλεξη 3η: Απλή Γραμμική Παλινδρόμηση. Διδάσκουσα: Κοντογιάννη Αριστούλα

Τμήμα Διοίκησης Επιχειρήσεων (Γρεβενά) Μάθημα: Οικονομετρία Διάλεξη 3η: Απλή Γραμμική Παλινδρόμηση. Διδάσκουσα: Κοντογιάννη Αριστούλα Τμήμα Διοίκησης Επιχειρήσεων Γρεβενά Μάθημα: Οικονομετρία Διάλεξη 3η: Απλή Γραμμική Παλινδρόμηση Διδάσκουσα: Κοντογιάννη Αριστούλα Ιδιότητες εκτιμώμενης ευθείας παλινδρόμησης με τη μέθοδο των ελαχίστων

Διαβάστε περισσότερα

ΟΙΚΟΝΟΜΕΤΡΙΑ Κεφάλαιο 2

ΟΙΚΟΝΟΜΕΤΡΙΑ Κεφάλαιο 2 013 [Κεφάλαιο ] ΟΙΚΟΝΟΜΕΤΡΙΑ Κεφάλαιο Μάθημα Εαρινού Εξάμηνου 01-013 M.E. OE0300 Πανεπιστήμιο Θεσσαλίας Τμήμα Μηχανικών Χωροταξίας, Πολεοδομίας και Περιφερειακής Ανάπτυξης [Οικονομετρία 01-013] Μαρί-Νοέλ

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 07-08 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Επικ. Καθηγητής v.koutras@fme.aegea.gr Τηλ: 7035468 Θα μελετήσουμε

Διαβάστε περισσότερα

ΤΟΠΟΓΡΑΦΙΚΑ ΔΙΚΤΥΑ ΚΑΙ ΥΠΟΛΟΓΙΣΜΟΙ ΑΝΑΣΚΟΠΗΣΗ ΘΕΩΡΙΑΣ ΣΥΝΟΡΘΩΣΕΩΝ

ΤΟΠΟΓΡΑΦΙΚΑ ΔΙΚΤΥΑ ΚΑΙ ΥΠΟΛΟΓΙΣΜΟΙ ΑΝΑΣΚΟΠΗΣΗ ΘΕΩΡΙΑΣ ΣΥΝΟΡΘΩΣΕΩΝ ΤΟΠΟΓΡΑΦΙΚΑ ΔΙΚΤΥΑ ΚΑΙ ΥΠΟΛΟΓΙΣΜΟΙ ΑΝΑΣΚΟΠΗΣΗ ΘΕΩΡΙΑΣ ΣΥΝΟΡΘΩΣΕΩΝ Βασίλης Δ. Ανδριτσάνος Δρ. Αγρονόμος - Τοπογράφος Μηχανικός ΑΠΘ Επίκουρος Καθηγητής ΤΕΙ Αθήνας 3ο εξάμηνο http://eclass.teiath.gr Παρουσιάσεις,

Διαβάστε περισσότερα

ΕΕΟ 11. Η χρήση στατιστικών εργαλείων στην εκτιμητική

ΕΕΟ 11. Η χρήση στατιστικών εργαλείων στην εκτιμητική ΕΕΟ 11 Η χρήση στατιστικών εργαλείων στην εκτιμητική 1. Εισαγωγή 2. Προϋποθέσεις χρήσης των Αυτοματοποιημένων Εκτιμητικών Μοντέλων (ΑΕΜ) 3. Περιορισμοί στη χρήση των ΑΕΜ εφόσον έχουν πληρωθεί οι προϋποθέσεις

Διαβάστε περισσότερα

Δρ. Χάϊδω Δριτσάκη. MSc Τραπεζική & Χρηματοοικονομική

Δρ. Χάϊδω Δριτσάκη. MSc Τραπεζική & Χρηματοοικονομική Ποσοτικές Μέθοδοι Δρ. Χάϊδω Δριτσάκη MSc Τραπεζική & Χρηματοοικονομική Τεχνολογικό Εκπαιδευτικό Ίδρυμα Δυτικής Μακεδονίας Western Macedonia University of Applied Sciences Κοίλα Κοζάνης 50100 Kozani GR

Διαβάστε περισσότερα

Η Επίδραση των Events στην Απόδοση των Μετοχών

Η Επίδραση των Events στην Απόδοση των Μετοχών Χρηματοοικονομικά και Διοίκηση Μεταπτυχιακή διατριβή Η Επίδραση των Events στην Απόδοση των Μετοχών Άντρεα Φωτίου Λεμεσός, Μάιος 2018 ΤΕΧΝΟΛΟΓΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ ΣΧΟΛΗ ΧΡΗΜΑΤΟΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΔΙΟΙΚΗΣΗΣ

Διαβάστε περισσότερα

Εξόρυξη Γνώσης από Βιολογικά εδομένα

Εξόρυξη Γνώσης από Βιολογικά εδομένα Παρουσίαση Διπλωματικής Εργασίας Εξόρυξη Γνώσης από Βιολογικά εδομένα Καρυπίδης Γεώργιος (Μ27/03) Επιβλέπων Καθηγητής: Ιωάννης Βλαχάβας MIS Πανεπιστήμιο Μακεδονίας Φεβρουάριος 2005 Εξόρυξη Γνώσης από Βιολογικά

Διαβάστε περισσότερα

Στατιστική Επιχειρήσεων Ι

Στατιστική Επιχειρήσεων Ι ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Τεχνολογικό Εκπαιδευτικό Ίδρυμα Πειραιά Στατιστική Επιχειρήσεων Ι Ενότητα 4: Πολυδιάστατες Τυχαίες Μεταβλητές Μιλτιάδης Χαλικιάς, Επίκουρος Καθηγητής Τμήμα Διοίκησης Επιχειρήσεων Άδειες

Διαβάστε περισσότερα

ΠΙΛΟΤΙΚΗ ΕΦΑΡΜΟΓΗ ΑΥΤΟΝΟΜΩΝ ΣΥΣΤΗΜΑΤΩΝ ΠΛΟΗΓΗΣΗΣ ΓΙΑ ΤΗΝ ΠΑΡΑΓΩΓΗ ΥΨΗΛΗΣ ΑΝΑΛΥΣΗΣ ΟΡΘΟΦΩΤΟΓΡΑΦΙΩΝ ΓΕΩΡΓΙΚΩΝ ΕΚΤΑΣΕΩΝ

ΠΙΛΟΤΙΚΗ ΕΦΑΡΜΟΓΗ ΑΥΤΟΝΟΜΩΝ ΣΥΣΤΗΜΑΤΩΝ ΠΛΟΗΓΗΣΗΣ ΓΙΑ ΤΗΝ ΠΑΡΑΓΩΓΗ ΥΨΗΛΗΣ ΑΝΑΛΥΣΗΣ ΟΡΘΟΦΩΤΟΓΡΑΦΙΩΝ ΓΕΩΡΓΙΚΩΝ ΕΚΤΑΣΕΩΝ Σχολή Μηχανικής & Τεχνολογίας Τμήμα Πολιτικών & Μηχανικών Γεωπληροφορικής Μεταπτυχιακή διατριβή ΠΙΛΟΤΙΚΗ ΕΦΑΡΜΟΓΗ ΑΥΤΟΝΟΜΩΝ ΣΥΣΤΗΜΑΤΩΝ ΠΛΟΗΓΗΣΗΣ ΓΙΑ ΤΗΝ ΠΑΡΑΓΩΓΗ ΥΨΗΛΗΣ ΑΝΑΛΥΣΗΣ ΟΡΘΟΦΩΤΟΓΡΑΦΙΩΝ ΓΕΩΡΓΙΚΩΝ

Διαβάστε περισσότερα

Αριθμητική Ανάλυση και Εφαρμογές

Αριθμητική Ανάλυση και Εφαρμογές Αριθμητική Ανάλυση και Εφαρμογές Διδάσκων: Δημήτριος Ι. Φωτιάδης Τμήμα Μηχανικών Επιστήμης Υλικών Ιωάννινα 07-08 Αριθμητική Παραγώγιση Εισαγωγή Ορισμός 7. Αν y f x είναι μια συνάρτηση ορισμένη σε ένα διάστημα

Διαβάστε περισσότερα

Κεφ. 7: Συνήθεις διαφορικές εξισώσεις (ΣΔΕ) - προβλήματα αρχικών τιμών

Κεφ. 7: Συνήθεις διαφορικές εξισώσεις (ΣΔΕ) - προβλήματα αρχικών τιμών Κεφ. 7: Συνήθεις διαφορικές εξισώσεις (ΣΔΕ) - προβλήματα αρχικών τιμών 7. Εισαγωγή (ορισμός προβλήματος, αριθμητική ολοκλήρωση ΣΔΕ, αντικατάσταση ΣΔΕ τάξης n με n εξισώσεις ης τάξης) 7. Μέθοδος Euler 7.3

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ. ΠΡΟΛΟΓΟΣ... vii ΠΕΡΙΕΧΟΜΕΝΑ... ix ΓΕΝΙΚΗ ΒΙΒΛΙΟΓΡΑΦΙΑ... xv. Κεφάλαιο 1 ΓΕΝΙΚΕΣ ΕΝΝΟΙΕΣ ΑΠΟ ΤΗ ΣΤΑΤΙΣΤΙΚΗ

ΠΕΡΙΕΧΟΜΕΝΑ. ΠΡΟΛΟΓΟΣ... vii ΠΕΡΙΕΧΟΜΕΝΑ... ix ΓΕΝΙΚΗ ΒΙΒΛΙΟΓΡΑΦΙΑ... xv. Κεφάλαιο 1 ΓΕΝΙΚΕΣ ΕΝΝΟΙΕΣ ΑΠΟ ΤΗ ΣΤΑΤΙΣΤΙΚΗ ΠΡΟΛΟΓΟΣ... vii ΠΕΡΙΕΧΟΜΕΝΑ... ix ΓΕΝΙΚΗ ΒΙΒΛΙΟΓΡΑΦΙΑ... xv Κεφάλαιο 1 ΓΕΝΙΚΕΣ ΕΝΝΟΙΕΣ ΑΠΟ ΤΗ ΣΤΑΤΙΣΤΙΚΗ 1.1 Πίνακες, κατανομές, ιστογράμματα... 1 1.2 Πυκνότητα πιθανότητας, καμπύλη συχνοτήτων... 5 1.3

Διαβάστε περισσότερα

ΟΜΑΔΕΣ. Δημιουργία Ομάδων

ΟΜΑΔΕΣ. Δημιουργία Ομάδων Δημιουργία Ομάδων Μεθοδολογίες ομαδοποίησης δεδομένων: Μέθοδοι για την εύρεση των κατηγοριών και των υποκατηγοριών που σχηματίζουν τα δεδομένα του εκάστοτε προβλήματος. Ομαδοποίηση (clustering): εργαλείο

Διαβάστε περισσότερα

Γ Γυμνασίου: Οδηγίες Γραπτής Εργασίας και Σεμιναρίων. Επιμέλεια Καραβλίδης Αλέξανδρος. Πίνακας περιεχομένων

Γ Γυμνασίου: Οδηγίες Γραπτής Εργασίας και Σεμιναρίων. Επιμέλεια Καραβλίδης Αλέξανδρος. Πίνακας περιεχομένων Γ Γυμνασίου: Οδηγίες Γραπτής Εργασίας και Σεμιναρίων. Πίνακας περιεχομένων Τίτλος της έρευνας (title)... 2 Περιγραφή του προβλήματος (Statement of the problem)... 2 Περιγραφή του σκοπού της έρευνας (statement

Διαβάστε περισσότερα