Π ΤΥΧΙΑΚΗ/ Δ ΙΠΛΩΜΑΤΙΚΗ Ε ΡΓΑΣΙΑ

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "Π ΤΥΧΙΑΚΗ/ Δ ΙΠΛΩΜΑΤΙΚΗ Ε ΡΓΑΣΙΑ"

Transcript

1 Α ΡΙΣΤΟΤΕΛΕΙΟ Π ΑΝΕΠΙΣΤΗΜΙΟ Θ ΕΣΣΑΛΟΝΙΚΗΣ ΣΧΟΛΗ ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Π ΤΥΧΙΑΚΗ/ Δ ΙΠΛΩΜΑΤΙΚΗ Ε ΡΓΑΣΙΑ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΚΑΙ ΠΡΟΒΛΕΨΗ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΑΓΩΝΩΝ ΠΟΔΟΣΦΑΙΡΟΥ ΠΑΥΛΟΣ ΠΟΛΙΑΝΙΔΗΣ Α.Ε.Μ: 1586 ΕΠΙΒΛΕΠΩΝ ΚΑΘΗΓΗΤΗΣ: Γρηγόριος Τσουμάκας, Λέκτορας ΘΕΣΣΑΛΟΝΙΚΗ ΙΟΥΛΙΟΣ 2010

2

3

4

5

6

7 ΠΕΡΙΛΗΨΗ Π ΕΡΙΛΗΨΗ Το αντικείμενο της παρούσας πτυχιακής εργασίας είναι η στατιστική ανάλυση καθώς και η πρόβλεψη αγώνων ποδοσφαίρου. Το πρώτο κομμάτι της εργασίας αφορά την συγκέντρωση πληροφοριών σχετικά με αγώνες ποδοσφαίρου από όλο τον κόσμο (όπως αποτελέσματα, ημερομηνία, σκορ ημιχρόνου, πρωτάθλημα κ.α. ) καθώς επίσης και τις αποδόσεις στοιχήματος στους αγώνες αυτούς. Τα δεδομένα συλλέγονται με αυτόματο τρόπο από αρχεία XML που είναι διαθέσιμα στον ιστότοπο του ΟΠΑΠ και αποθηκεύονται σε μια βάση δεδομένων. Στο δεύτερο κομμάτι της εργασίας γίνεται μια προσπάθεια πρόβλεψης των αποτελεσμάτων των αγώνων, χρησιμοποιώντας τις πληροφορίες που συγκεντρώσαμε και είναι αποθηκευμένες στην βάση δεδομένων. Πρόκειται ουσιαστικά, για εφαρμογή αλγορίθμων μηχανικής μάθησης και συγκεκριμένα αλγορίθμων ταξινόμησης (classification algorithms) ώστε να γίνει η κατάταξη των επικείμενων αγώνων ποδοσφαίρου σε μια από τις τρείς κατηγορίες ( νίκη γηπεδούχου ομάδας, ισοπαλία, νίκη φιλοξενούμενης ομάδας), σύμφωνα με την δυναμική των ομάδων. Το πρόβλημα αυτό ανήκει στην κατηγορία των προβλημάτων ταξινόμησης, στα οποία δεν μας ενδιαφέρει απλώς να κατατάξουμε ένα στιγμιότυπο (instance) σε κάποια από τις εναλλακτικές κλάσεις (classification labels), αλλά μας ενδιαφέρει και το κόστος ( ή ανάλογα το κέρδος ) που θα έχουμε από αυτήν την κατηγοριοποίηση. Οι αλγόριθμοι αυτή, λαμβάνουν υπ όψιν το κόστος της σωστής πρόβλεψης καθώς και το κόστος της λανθασμένης πρόβλεψης (misclassification cost) ώστε να πετύχουν όσο το δυνατόν πιο ιδανική πρόβλεψη. Το είδος αυτό της μάθησης, ονομάζεται costsensitive machine learning[5,3]. Το σύνολο των παραπάνω αλγορίθμων, ανήκει στην κατηγορία των λεγόμενων αλγορίθμων μάθησης που είναι ευαίσθητοι ως προς το κόστος (cost-sensitive learning algorithms). Αποτελεί έναν νέο τομέα της μηχανικής μάθησης γύρω από τον οποίο γίνεται πολύ έρευνα, γιατί καθίσταται όλο και πιο φανερό ότι οι περισσότερες εφαρμογές μηχανικής μάθησης, πλέον απαιτούν τη χρήση cost-sensitive αλγορίθμων, οι οποίοι θα εξετάζουν τον κίνδυνο που εγκυμονεί η πρόβλεψη που θα κάνουν. Στις σελίδες που ακολουθούν θα δείξουμε πώς θα εφαρμόσουμε cost-sensitive algorithms with different cost per instance (όπου το κόστος κατηγοριοποίησης είναι διαφορετικό για κάθε στιγμιότυπο ) πάνω στο δικό μας πρόβλημα. ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΚΑΙ ΠΡΟΒΛΕΨΗ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΑΓΩΝΩΝ ΠΟΔΟΣΦΑΙΡΟΥ VII

8

9 ΕΥΧΑΡΙΣΤΙΕΣ Ε ΥΧΑΡΙΣΤΙΕΣ Καταρχάς θα ήθελα να εκφράσω τις αληθινές μου ευχαριστίες στον επιβλέπων της πτυχιακής εργασίας κ. Τσουμάκα Γρηγόριο, Λέκτορα του τμήματος πληροφορικής του Αριστοτέλειου πανεπιστημίου, για την εμπιστοσύνη μου έδειξε κατά την ανάθεση της παρούσας πτυχιακής, αλλά και την αμέριστη συμπαράσταση καθ όλη τη διάρκεια της εκπόνησης της. Τέλος θα ήθελα να ευχαριστήσω του γονείς μου, για όλη τη βοήθεια τόσο ψυχολογική όσο και οικονομική, που μου προσέφεραν όλα αυτά τα χρόνια Πολιανίδης Παύλος ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΚΑΙ ΠΡΟΒΛΕΨΗ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΑΓΩΝΩΝ ΠΟΔΟΣΦΑΙΡΟΥ VIII

10

11 ΠΕΡΙΕΧΟΜΕΝΑ Π ΕΡΙΕΧΟΜΕΝΑ ΠΕΡΙΛΗΨΗ... VII ΕΥΧΑΡΙΣΤΙΕΣ... VIII ΠΕΡΙΕΧΟΜΕΝΑ... IX ΛΙΣΤΑ ΣΧΗΜΑΤΩΝ... XII ΛΙΣΤΑ ΠΙΝΑΚΩΝ... XIII ΚΕΦΑΛΑΙΟ 1: ΕΙΣΑΓΩΓΗ ΚΕΦΑΛΑΙΟ 2: ΑΛΓΟΡΙΘΜΟΙ ΜΗΑΧΑΝΙΚΗΣ ΜΑΘΗΣΗΣ ΤΑΞΙΝΟΜΗΣΗ ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ... ERROR! BOOKMARK NOT DEFINED ΒΗΜΑΤΑ ΕΚΤΕΛΕΣΗΣ ΑΠΟΤΙΜΗΣΗ ΑΚΡΙΒΕΙΑΣ ΜΕΘΟΔΟΙ ΑΠΟΤΙΜΗΣΗΣ ΑΚΡΙΒΕΙΑΣ HOLD-OUT ΤΥΧΑΙΑ ΔΕΙΓΜΑΤΟΛΗΨΙΑ(RANDOM SAMPLING) ΠΟΛΛΑΠΛΗ ΔΙΑ-ΕΓΚΥΡΟΠΟΙΗΣΗ BOOT-STRAP ΑΛΓΟΡΙΘΜΟΙ ΤΑΞΙΝΟΜΗΣΗΣ C BEST-FIRST DECISION TREES LADTREE BOOSTING BAYESIAN CLASSIFIER ΘΕΩΡΗΜΑ BAYES ΑΦΕΛΗΣ BAYES (NAÏVE BAYES) ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΚΑΙ ΠΡΟΒΛΕΨΗ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΑΓΩΝΩΝ ΠΟΔΟΣΦΑΙΡΟΥ IX

12 ΠΑΥΛΟΣ ΠΟΛΙΑΝΙΔΗΣ SUPPORT VECTOR MACHINES ΓΡΑΜΜΙΚΩΣ ΔΙΑΧΩΡΙΣΗΜΑ ΔΕΔΟΜΕΝΑ COST-SENSITIVE ΜΑΘΗΣΗ ΠΕΡΙΓΡΑΦΗ COST-SENSITIVE ΜΑΘΗΣΗΣ ΠΛΑΙΣΙΟ ΛΕΙΤΟΥΡΓΙΑΣ COST-SENSITIVE ΜΑΘΗΣΗΣ COST-SENSITIVE ΑΛΓΟΡΙΘΜΟΙ METACOST CSROULETTE ΑΞΙΟΛΟΓΗΣΗ COST-SENSITIVE ΚΑΤΗΓΟΡΙΟΠΟΙΗΤΩΝ ΚΕΦΑΛΑΙΟ 3: Η ΕΦΑΡΜΟΓΗ ΕΙΣΑΓΩΓΗ ΠΕΡΙΓΡΑΦΗ ΤΟΥ ΠΡΟΒΛΗΜΑΤΟΣ ΑΡΧΙΤΕΚΤΟΝΙΚΗ ΤΟΥ ΣΥΣΤΗΜΑΤΟΣ ΠΡΟΣΕΓΓΙΣΗ ΤΟΥ ΠΡΟΒΛΗΜΑΤΟΣ ΕΠΙΛΟΓΗ ΕΡΓΑΛΕΙΩΝ ΕΠΙΛΟΓΗ ΧΑΡΑΚΤΗΡΙΣΤΙΚΩΝ ΠΕΡΙΓΡΑΦΗ ΒΑΣΗΣ ΔΕΔΟΜΕΝΩΝ Ο ΠΙΝΑΚΑΣ COUPONINFO ΤΕΧΝΙΚΗ ΑΝΑΛΥΣΗ ΚΩΔΙΚΑ ΠΑΚΕΤΟ XMLPARSING Η ΚΛΑΣΗ DOMPARSER Η ΚΛΑΣΗ FOOTBALLMATCHINFO Η ΚΛΑΣΗ MATCHRESULTS Η ΚΛΑΣΗ METADATA ΠΑΚΕΤΟ EXCEPTIONS ΠΑΚΕΤΟ UTILS ΠΑΚΕΤΟ STATISTICS Η ΚΛΑΣΗ STATISTIC Η ΚΛΑΣΗ TEAM Η ΚΛΑΣΗ CHART ΠΑΚΕΤΟ DBMANIPULATION Η ΚΛΑΣΗ DBMANAGER ΠΑΚΕΤΟ MACHINELEARNING Η ΚΛΑΣΗ ARFFCREATOR Η ΚΛΑΣΗ EVALUATOR Η ΚΛΑΣΗ PREDICTOR ΠΑΚΕΤΟ MACHINELEARNING.ROULETTESAMPLING Η ΚΛΑΣΗ LINE Η ΚΛΑΣΗ SEGMENT X ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΚΑΙ ΠΡΟΒΛΕΨΗ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΑΓΩΝΩΝ ΠΟΔΟΣΦΑΙΡΟΥ

13 ΠΕΡΙΕΧΟΜΕΝΑ Η ΚΛΑΣΗ CPRS ΠΑΚΕΤΟ GUI Η ΚΛΑΣΗ SPLASH Η ΚΛΑΣΗ GAMESTABMANIPULATOR Η ΚΛΑΣΗ PREDICTIONTABMANIPULATOR Η ΚΛΑΣΗ MESSAGESTORE Η ΚΛΑΣΗ STATUSBARCHANGER Η ΚΛΑΣΗ UPDATER ΚΕΦΑΛΑΙΟ 4: Η ΕΦΑΡΜΟΓΗ ΣΤΗΝ ΠΡΑΞΗ ΕΙΣΑΓΩΓΗ ΚΑΡΤΕΛΑ GAMES ΚΑΡΤΕΛΑ PREDICTION ΠΑΡΑΡΤΗΜΑ I: ΠΕΙΡΑΜΑΤΙΚΑ ΑΠΟΤΕΛΕΣΜΑΤΑ ΠΑΡΑΡΤΗΜΑ IΙ: ΒΙΒΛΙΟΓΡΑΦΙΑ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΚΑΙ ΠΡΟΒΛΕΨΗ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΑΓΩΝΩΝ ΠΟΔΟΣΦΑΙΡΟΥ XI

14

15 ΛΙΣΤΑ ΣΧΗΜΑΤΩΝ Λ ΙΣΤΑ Σ ΧΗΜΑΤΩΝ ΕΙΚΟΝΑ 2.1: ΣΤΑΔΙΟ ΜΑΘΗΣΗΣ ΕΙΚΟΝΑ 2.2: ΣΤΑΔΙΟ ΤΑΞΙΝΟΜΗΣΗΣ ΕΙΚΟΝΑ 2.3: ΑΛΓΟΡΙΘΜΟΣ C ΕΙΚΟΝΑ 2.4: ΔΕΝΔΡΟ ΑΠΟ ΤΗΝ ΕΚΤΕΛΕΣΗ ΤΟΥ C ΕΙΚΟΝΑ 2.5: BEST-FIRST TREE ΕΙΚΟΝΑ 2.6: ΑΛΓΟΡΙΘΜΟΣ BEST-FIRST ΕΙΚΟΝΑ 2.7: Η ΜΕΘΟΔΟΣ BOOSTING ΕΙΚΟΝΑ 2.8: ΑΛΗΟΡΙΘΜΟΣ ADTREE ΕΙΚΟΝΑ 2.9: ΓΡΑΜΜΙΚΩΣ ΔΙΑΧΩΡΙΣΙΜΑ ΔΕΔΟΜΕΝΑ ΕΙΚΟΝΑ 2.10: ΥΠΕΡ-ΕΠΙΠΕΔΑ ΣΤΟ SVM ΕΙΚΟΝΑ 2.11: SUPPORT VECTORS ΕΙΚΟΝΑ 2.12: ΔΙΑΧΩΡΙΣΜΟΣ ΣΤΙΓΜΙΟΤΥΠΩΝ ΑΠΟ ΤΟΝ METACOST ΕΙΚΟΝΑ 2.13: ΑΛΓΟΡΙΘΜΟΣ METACOST ΕΙΚΟΝΑ 2.14: SAMPLING LINE ΕΙΚΟΝΑ 2.15: ΑΛΓΟΡΙΘΜΟΣ CSROULETTE ΕΙΚΟΝΑ 2.16: ΔΥΟ ΣΗΜΕΙΑ ROC ΕΙΚΟΝΑ 2.17: ΕΥΘΕΙΕΣ ΠΟΥ ΑΝΤΙΣΤΟΙΧΟΥΝ ΣΤΑ ΣΗΜΕΙΑ ΤΗΣ ΕΙΚΟΝΑ 2.18: ΚΑΜΠΥΛΕΣ ROC ΔΥΟ ΑΛΓΟΡΙΘΜΩΝ ΤΑΞΙΝΟΜΗΣΗΣ ΕΙΚΟΝΑ 2.19: ΚΑΜΠΥΛΕΣ ΚΟΣΤΟΥΣ ΠΟΥ ΑΝΤΙΠΡΟΣΩΠΕΥΟΥΝ ΤΙΣ ΚΑΜΠΥΛΕΣ ΕΙΚΟΝΑ 3.1: ΑΡΧΙΤΕΚΤΟΝΙΚΗ ΤΟΥ ΣΥΣΤΗΜΑΤΟΣ ΕΙΚΟΝΑ 3.2: Ο ΠΙΝΑΚΑΣ COUPONINFO ΕΙΚΟΝΑ 3.3: ΠΑΡΑΔΕΙΓΜΑ ΓΡΑΦΗΜΑΤΟΣ ΕΙΚΟΝΑ 4.1: ΚΑΡΤΕΛΑ GAMES ΕΙΚΟΝΑ 4.2: ΕΠΙΛΟΓΗ ΗΜΕΡΟΜΗΝΙΑΣ ΕΙΚΟΝΑ 4.3: ΕΠΙΛΟΓΗ ΠΡΩΤΑΘΛΗΜΑΤΟΣ ΕΙΚΟΝΑ 4.4: ΕΠΙΛΟΓΗ ΟΜΑΔΑΣ ΕΙΚΟΝΑ 4.5: Η ΚΑΡΤΕΛΑ PREDICTION ΠΡΙΝ ΠΡΑΓΜΑΤΟΠΟΙΗΘΕΙ Η ΠΡΟΒΛΕΨΗ ΕΙΚΟΝΑ 4.6: Η ΚΑΡΤΕΛΑ PREDICTION ΜΕΤΑ ΤΗΝ ΠΡΑΓΜΑΤΟΠΟΙΗΣΗ ΤΗΣ ΠΡΟΒΛΕΨΗΣ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΚΑΙ ΠΡΟΒΛΕΨΗ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΑΓΩΝΩΝ ΠΟΔΟΣΦΑΙΡΟΥ XII

16

17 ΛΙΣΤΑ ΠΙΝΑΚΩΝ Λ ΙΣΤΑ Π ΙΝΑΚΩΝ ΠΙΝΑΚΑΣ 2.1: ΠΙΝΑΚΑΣ ΚΟΣΤΟΥΣ ΠΙΝΑΚΑΣ 2.2: ΑΠΛΟΠΟΙΗΜΕΝΟΣ : ΠΙΝΑΚΑΣ ΚΟΣΤΟΥΣ ΠΙΝΑΚΑΣ 2.3: ΠΑΡΑΔΕΙΓΜΑ ΠΙΝΑΚΑ ΚΟΣΤΟΥΣ ΠΙΝΑΚΑΣ 2.4: ΠΑΡΑΔΕΙΓΜΑ ΕΝΟΣ CONFUSION MATRIX ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΚΑΙ ΠΡΟΒΛΕΨΗ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΑΓΩΝΩΝ ΠΟΔΟΣΦΑΙΡΟΥ XIII

18

19 ΚΕΦΑΛΑΙΟ 1: Ε ΙΣΑΓΩΓΗ

20

21 ΚΕΦΑΛΑΙΟ 1: ΕΙΣΑΓΩΓΗ ΕΙΣΑΓΩΓΗ Η εξόρυξη δεδομένων είναι ένας κλάδος της επιστήμης της πληροφορικής, ο οποίος έχει αναπτυχθεί σημαντικά τα τελευταία χρόνια. Βασικός στόχος της εξόρυξης δεδομένων είναι η ανακάλυψη κρυφής γνώσης, χρησιμοποιώντας αλγορίθμους της μηχανικής μάθησης, μέσα από ένα μεγάλο σύνολο δεδομένων που είναι αποθηκευμένα σε βάσης ή αποθήκες δεδομένων.[1] Στη παρούσα πτυχιακή εργασία θα χρησιμοποιήσουμε την εξόρυξη δεδομένων, για να ανακαλύψουμε τη γνώση που κρύβεται μέσα στα δεδομένα που έχουμε συλλέξει και αφορούν αγώνες ποδοσφαίρου. Πιο συγκεκριμένα θα εφαρμόσουμε αλγορίθμους ταξινόμησης (classification algorithms) οι οποίοι θα προβλέψουν τα αποτελέσματα των αγώνων, που βρίσκονται στο κουπόνι στοιχήματος του ΟΠΑΠ. Θα εφαρμόσουμε διάφορους αλγορίθμους ταξινόμησης πάνω στα δεδομένα μας, ώστε να γίνει φανερό μετά από πειραματικές εκτελέσεις, ποίος επιτυγχάνει το μεγαλύτερο ποσοστό επιτυχημένης πρόβλεψης. Ονομαστικά, οι αλγόριθμοι που θα χρησιμοποιηθούν είναι : BFTree J48 J48Graft LADTree REPTree SimpleCart NaiveBayes NaiveBayesNominal NaiveBayesSimple Multinomial logistic regression SMO Linear logistic regression IB1 DecisionTable Οι κλασικοί αυτοί αλγόριθμοι ταξινόμησης[1,7] έχουν ως βασικό στόχο να κατατάξουν επιτυχώς το κάθε στιγμιότυπο σε μια κλάση από ένα διακριτό σύνολο κλάσεων. Στο πρόβλημα μας, τα στιγμιότυπα είναι οι αγώνες ποδοσφαίρου και οι κλάσεις ανήκουν στο εξής διακριτό σύνολο: {νίκη γηπεδούχο ομάδας, ισοπαλία, νίκη φιλοξενούμενης ομάδας}. Οι αλγόριθμοι αυτοί προσπαθούν να μειώσουν το ρυθμό σφάλματος (error rate) : το σύνολο των λανθασμένων προβλέψεων ή εναλλακτικά τη πιθανότητα της εξαγωγής λάθους πρόβλεψης, και ως εκ τούτου την αύξηση των επιτυχημένων προβλέψεων (που είναι ο βασικός στόχος). Το πρόβλημα έγκυται στο ότι ο αλγόριθμος θεωρεί ότι όλες οι λάθος πρόβλεψης επιφέρουν το ίδιο κόστος, στην πραγματικότητα όμως αυτό δεν ισχύει πάντα. Στο πρόβλημα μας, θα θέλαμε ο αλγόριθμος να προσπαθεί να προβλέψει σωστά την κλάση η οποία θα επιφέρει το μικρότερο κόστος ( ή ανάλογα το μεγαλύτερο κέρδος ) λαμβάνοντας υπ όψιν τις απόδοσης των σημείων. ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΚΑΙ ΠΡΟΒΛΕΨΗ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΑΓΩΝΩΝ ΠΟΔΟΣΦΑΙΡΟΥ 21

22 ΠΑΥΛΟΣ ΠΟΛΙΑΝΙΔΗΣ Για να συμπεριλάβουμε το κόστος της λανθασμένης πρόβλεψης, θα εφαρμόσουμε του επονομαζόμενους cost-sensitive αλγορίθμους[3,6,2,4]. Οι αλγόριθμοι αυτοί θα εφαρμοστούν ως «περιτύλιγμα» (wrapper) στους παραπάνω αλγορίθμους ταξινόμησης ώστε να εισαγάγουν την έννοια του κόστους στη διαδικασία της ταξινόμησης. Θα χρησιμοποιήσουμε τους εξής τρεις: MetaCost CostSensitiveClassifier CSRoullete 22 ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΚΑΙ ΠΡΟΒΛΕΨΗ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΑΓΩΝΩΝ ΠΟΔΟΣΦΑΙΡΟΥ

23 ΚΕΦΑΛΑΙΟ 2: ΑΛΓΟΡΙΘΜΟΙ ΜΗΧΑΝΙΚΗΣ ΜΑΘΗΣΗΣ

24

25 ΚΕΦΑΛΑΙΟ 2: ΑΛΓΟΡΙΘΜΟΙ ΜΗΧΑΝΙΚΗΣ ΜΑΘΗΣΗΣ ΑΛΓΟΡΙΘΜΟΙ ΜΗΧΑΝΙΚΗΣ ΜΑΘΗΣΗΣ Όπως αναφέρθηκε προηγουμένως, σκοπός του συστήματος είναι η πρόβλεψη αγώνων ποδοσφαίρου. Για να πετύχουμε το σκοπό μας, θα χρησιμοποιήσουμε ένα σύνολο αλγορίθμων της μηχανικής μάθησης. Πιο συγκεκριμένα, η διαδικασία της πρόβλεψης αναφέρεται ως πρόβλημα ταξινόμησης (classification problem) στην μηχανική μάθηση, ως εκ τούτου θα γίνει χρήση αλγορίθμων ταξινόμησης ή κατηγοριοποίησης. ΤΑΞΙΝΟΜΗΣΗ Βασικές έννοιες Σε αυτό το σημείο θα ήταν σκόπιμο να αναφερθούμε στη λειτουργία των αλγορίθμων ταξινόμησης. Αρχικά, θα εστιάσουμε την προσοχή μας, σε ορισμένες βασικές έννοιες που λαμβάνουν χώρα στη διαδικασία της ταξινόμησης και γενικότερα, της μηχανικής μάθησης. Μοντέλο ταξινόμησης ή ταξινομητής (classifier): μία δομή η οποία ερμηνεύει και περιγράφει το σύνολο των δεδομένων. Βάση του μοντέλου που σχηματίζεται, γίνεται η πρόβλεψη. Στιγμιότυπο ή αντικείμενο (instance): ένα αντικείμενο του κόσμου. Πολλά αντικείμενα μαζί σχηματίζουν το σύνολο στο οποίο θα στηριχθεί ο αλγόριθμος ταξινόμησης, για να σχηματίσει το μοντέλο της ταξινόμησης. Το στιγμιότυπο μπορεί επίσης να εφαρμοστεί πάνω στο μοντέλο, προκειμένου να γίνει η πρόβλεψη. Χαρακτηριστικά (attribute): μία ιδιότητα που περιγράφει ένα στιγμιότυπο. Το κάθε χαρακτηριστικό, έχει έναν τύπο. Κλάση: ανήκει σε ένα πεπερασμένο σύνολο από χαρακτηριστικά (τύπου nominal), και δηλώνει την τάξη στην οποία ανήκει ένα στιγμιότυπο. Είναι ουσιαστικά, το χαρακτηριστικό το οποίο καλείται να πρόβλεψη ο αλγόριθμός. Δεδομένα μάθησης ή σύνολο μάθησης (training set): ένα σύνολο από στιγμιότυπα, από το οποίο ο αλγόριθμος ταξινόμησης θα σχηματίσει τον ταξινομητή. Δεδομένα ελέγχου ή σύνολο ελέγχου (test set): ένα σύνολο από στιγμιότυπα, τα οποία ο αλγόριθμος θα προβλέψει, δηλαδή θα τα κατατάξει σε μια από τις δυνατές κλάσεις. Ακρίβεια πρόβλεψης (accuracy): ο λόγος των σωστών προβλέψεων προς το σύνολο όλων των προβλέψεων που έγιναν από τον ταξινομητή. # correctly _ predicted _ examples accuracy # predictions _ made ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΚΑΙ ΠΡΟΒΛΕΨΗ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΑΓΩΝΩΝ ΠΟΔΟΣΦΑΙΡΟΥ 25

26 ΠΑΥΛΟΣ ΠΟΛΙΑΝΙΔΗΣ Υπερπροσαργογή (overfitting): αφορά το φαινόμενο κατά το οποίο, το μοντέλο που κατασκευάζεται από τον αλγόριθμο, προσαρμόζεται σε υπερβολικό βαθμό στα δεδομένα του συνόλου εκπαίδευσης. Αυτό έχει ως αποτέλεσμα, να μειώνεται η ακρίβεια της πρόβλεψης δεδομένων, που δεν ανήκουν στο σύνολο εκπαίδευσης. Μάθηση με επίβλεψη: μάθηση κατά την οποία,οι κλάσεις των στιγμιότυπων του συνόλου εκπαίδευσης, είναι γνωστές. Οι αλγόριθμοι ταξινόμησης, ανήκουν σε αυτήν την κατηγορία. Στην παρούσα εργασία, θα ασχοληθούμε κυρίως με αυτό το είδος μάθησης. Μάθηση χωρίς επίβλεψη: μάθηση κατά την οποία, οι κλάσεις των στιγμιότυπων του συνόλου εκπαίδευσης δεν είναι γνωστές. Στην μάθηση αυτή, οι αλγόριθμοι προσπαθούν να βρουν συσχετίσεις και ομάδες δεδομένων από το σύνολο εκπαίδευσης. Παραδείγματα ομάδων αλγορίθμων που εφαρμόζουν αυτό το είδος μάθησης είναι: I. Αλγόριθμοι που εξάγουν κανόνες συσχετίσεις (association rules) π.χ. apriori. II. Αλγόριθμοι που χωρίζουν τα δεδομένα σε συστάδες ( clusters ) π.χ. k-means, DBScan. Έχοντας ξεκαθαρίσει ορισμένες βασικές έννοιες, μπορούμε πλέον να ορίσουμε την ταξινόμηση (classification) ως τη διαδικασία δημιουργίας ενός ταξινομητή ή μοντέλου ταξινόμησης από το σύνολο εκπαίδευσης, και η εφαρμογή του μοντέλου αυτού για την αντιστοίχηση των στιγμιότυπων του συνόλου ελέγχου, σε μια από δυνατές τάξης του διακριτού συνόλου κλάσεων[1,9] Βήματα εκτέλεσης Παρακάτω, περιγράφονται συνοπτικά τα δυο βασικά βήματα της εφαρμογής του αλγορίθμου ταξινόμησης που αναφέρονται στον παραπάνω ορισμό. 1. Στάδιο της μάθησης: αποτελεί το βήμα της διαδικασίας της ταξινόμησης, κατά το οποίο ο αλγόριθμος ταξινόμησης, κατασκευάζει τον ταξινομητή (classifier), αναλύοντας το σύνολο εκπαίδευσης (βλέπε εικόνα 2.1). Το σύνολο εκπαίδευσης όπως αναφέραμε, αποτελείται από στιγμιότυπα, που συνήθως αναπαρίστανται ως ένα διάνυσμα χαρακτηριστικών ( feature vector). Το διάνυσμα αυτό είναι της μορφής X = <x 1,x 2, x n >, όπου x i τα χαρακτηριστικά του στιγμιότυπου και ανήκει σε μία κλάση. ο συνδυασμός του διανύσματος και της κλάσης στην οποία ανήκει, αποτελεί την βασική ιδέα πίσω από την οποία κρύβεται η διαδικασία της κατασκευής του ταξινομητή. 26 ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΚΑΙ ΠΡΟΒΛΕΨΗ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΑΓΩΝΩΝ ΠΟΔΟΣΦΑΙΡΟΥ

27 ΚΕΦΑΛΑΙΟ 2: ΑΛΓΟΡΙΘΜΟΙ ΜΗΧΑΝΙΚΗΣ ΜΑΘΗΣΗΣ 2. Στάδιο της ταξινόμησης: στο δεύτερο βήμα, ο αλγόριθμος αρχικά κάνει μια εκτίμηση της ακρίβειας του μοντέλου που κατασκεύασε. Το μοντέλο εφαρμόζεται πάνω στο σύνολο εκπαίδευσης, όπου πλέον οι κλάσεις των στιγμιότυπων του συνόλου δεν είναι γνωστές και ο ταξινομητής καλείται να τις προβλέψει (βλέπε εικόνα 2.2). Υπάρχει πάντα η περίπτωση της αισιόδοξης εκτίμησης, η οποία δεν συμβαδίζει συνήθως με την πραγματικότητα. Αυτή η αισιοδοξία που παρουσιάζουν οι ταξινομητές οφείλεται στο φαινόμενο της υπερβολικής προσαρμογής (βλέπε φαινόμενο υπερπροσαρμογής). Έχουν προταθεί αρκετοί μέθοδοι για την αποτίμηση της ακρίβειας των ταξινομητών [7,9]. Θα αναφερθούμε σε ορισμένους από αυτούς, στην συνέχεια του κεφαλαίου. Εικόνα 2.1 Μάθηση: Ο αλγόριθμος ταξινόμησης αναλύει το σύνολο εκπαίδευση (training data). Σε αυτήν την περίπτωση, η κλάση του κάθε παραδείγματος, είναι η loan_decision, και το μοντέλο που κατασκευάζεται, αναπαριστάται από ένα σύνολο κανόνων ταξινόμησης (decision rules). ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΚΑΙ ΠΡΟΒΛΕΨΗ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΑΓΩΝΩΝ ΠΟΔΟΣΦΑΙΡΟΥ 27

28 ΠΑΥΛΟΣ ΠΟΛΙΑΝΙΔΗΣ Εικόνα 2.2 Ταξινόμηση: Πραγματοποιείται η αποτίμηση της ακρίβειας του μοντέλου που κατασκευάστηκε στο πρώτο βήμα, με την εφαρμογή του, πάνω σε ένα σύνολο ελέγχου (test data). Στην συνέχεια, γίνεται η κατηγοριοποίηση των παραδειγμάτων του συνόλου new data Αποτίμηση ακρίβειας Η αποτίμηση της ακρίβειας ενός ταξινομητή, είναι μια πολύ σημαντική εργασία, που λαμβάνει χώρα κατά την εκτέλεση της ταξινόμησης. Αφορά σε ένα είδος δοκιμής που εκτελεί ο αλγόριθμος, προκειμένου να συμπεράνει πόσο καλός είναι ο ταξινομητής που κατασκεύασε. Η ακρίβεια είναι μια σημαντική ποσότητα για εμάς, γιατί μας φανερώνει την ικανότητα του μοντέλου να κάνει σωστές προβλέψεις (κατάταξη των στιγμιότυπων στην κλάση στην οποία πραγματικά ανήκουν). Είναι προφανές, ότι όσα μεγαλύτερη είναι η ακρίβεια, τόσο περισσότερο μπορούμε να εμπιστευτούμε τον αλγόριθμο, για τις προβλέψεις που κάνει. Συνήθως υπάρχει ένα κάτω όριο ακρίβειας, κάτω από τον οποίο ο αλγόριθμος της ταξινόμησης έχει την δυνατότητα να απορρίψει ένα μοντέλο και να ξεκινήσει την διαδικασία από το πρώτο βήμα (βλέπε βήματα εκτέλεσης αλγορίθμου), κατασκευάζοντας ένα διαφορετικό μοντέλο[7]. 28 ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΚΑΙ ΠΡΟΒΛΕΨΗ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΑΓΩΝΩΝ ΠΟΔΟΣΦΑΙΡΟΥ

29 ΚΕΦΑΛΑΙΟ 2: ΑΛΓΟΡΙΘΜΟΙ ΜΗΧΑΝΙΚΗΣ ΜΑΘΗΣΗΣ Μέθοδοι αποτίμησης ακρίβειας hold-out Πρόκειται για την απλούστερη μέθοδο αποτίμησης της ακρίβειας ενός κατηγοριοποιητή. Η ιδέα που κρύβεται πίσω από την μέθοδο αυτή είναι απλή, χωρίζουμε το σύνολο των δεδομένων (data set) σε 2 τμήματα, το σύνολο εκπαίδευσης και το σύνολο ελέγχου, με κάποια αναλογία. Για παράδειγμα, τα 2/3 πρώτα στιγμιότυπα του συνόλου δεδομένων θα σχηματίσουν το σύνολο εκπαίδευσης, ενώ από το υπόλοιπο 1/3 του συνόλου δεδομένων θα σχηματιστεί το σύνολο ελέγχου. Το σύνολο εκπαίδευσης θα συμβάλει στην κατασκευή του κατηγοριοποιητή ο οποίος θα κατατάξει τα όλα τα στιγμιότυπα του συνόλου ελέγχου, σε μία από τις υπάρχουσες κλάσεις. Αν υποθέσουμε ότι το Χ είναι ο αριθμός των στιγμιότυπων του συνόλου ελέγχου που κατατάσσονται στη σωστή κλάση, και Ν ο συνολικός αριθμός στιγμιότυπων του συνόλου ελέγχου, τότε η ακρίβεια accuracy της μεθόδου hold-out ορίζεται ως εξής: X accuracy N Η μέθοδος hold-out είναι μια απλή μέθοδος η οποία είναι εύκολη στην υλοποίηση, παρόλα αυτά, έχει ένα σημαντικό πρόβλημα. Η ποιότητα του κατηγοριοποιητή που θα κατασκευαστεί, εξαρτάται από την κατανομή των στιγμιότυπων μέσα στο σύνολο δεδομένων. Υπάρχει η περίπτωση το σύνολο εκπαίδευσης να περιέχει λίγα στιγμιότυπα που ανήκουν σε μια κλάση, αυτό θα έχει ως αποτέλεσμα την δημιουργία ενός μοντέλου το οποίο δεν θα μπορεί να κατατάσσει εσφαλμένα τα στιγμιότυπα του συνόλου ελέγχου που πραγματικά ανήκουν στην κλάση αυτήν. Σε αυτήν την περίπτωση η ακρίβεια του μοντέλου θα είναι υποεκτιμημένη, λόγω του ότι δεν κατατάσσει ορθά τα στιγμιότυπα της συγκεκριμένης κλάσης Τυχαία δειγματοληψία (random subsampling) Η μέθοδος ακολουθεί παρόμοια λογική με την hold-out. Οι δυο μέθοδοι διαφέρουν στον τρόπο που διαμερίζουν το σύνολο δεδομένων στα δύο τμήματα (σύνολο εκπαίδευση και σύνολο ελέγχου), ώστε να λυθεί το πρόβλημα που εμφανίζει η holdout. Σε αυτήν την περίπτωση το σύνολο ελέγχου επιλέγεται ως τυχαίο δείγμα. Εφαρμόζουμε τυχαία δειγματοληψία χωρίς επανατοποθέτηση και επιλέγουμε Ν στιγμιότυπα για το σύνολο ελέγχου. Τα εναπομένοντα στιγμιότυπα σχηματίζουν το σύνολο εκπαίδευσης. Με αυτήν την ενέργεια μειώνεται η επιρροή που μπορεί να επιφέρει η κατανομή των στιγμιότυπων στο σύνολο δεδομένων. Η προηγούμενη διαδικασία επαναλαμβάνεται κ φορές ώστε νε επιτευχθεί η μεγαλύτερη δυνατή μείωση της επιρροής. Αν υποθέσουμε ότι X i είναι ο αριθμός των στιγμιότυπων που έχουν καταταχθεί σωστά στην i-οστη επανάληψη ( οπού 1 i k ), τότε η ακρίβεια της μεθόδου τυχαίας δειγματοληψίας ορίζεται ως εξής: 1 accuracy k i 1 X i N ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΚΑΙ ΠΡΟΒΛΕΨΗ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΑΓΩΝΩΝ ΠΟΔΟΣΦΑΙΡΟΥ 29

30 ΠΑΥΛΟΣ ΠΟΛΙΑΝΙΔΗΣ Πολλαπλή δια-εγκυροποίηση (k-fold cross-validation) Θεωρείται μια από τις πλέον αξιόπιστές μεθόδους για την αποτίμηση της ακρίβειας κατηγοριοποιητών. Στην περίπτωση αυτήν εφαρμόζεται ένας πιο συστηματικός τρόπος για να λαμβάνουμε τυχαία δείγματα για το σχηματισμό του συνόλου ελέγχου. Εάν το σύνολο δεδομένων αποτελείται από Μ στιγμιότυπα και έχουμε ορίσει ως αριθμό επαναλήψεων το k, τότε χωρίζουμε το σύνολο σε k ισομεγέθη τμήματα μεγέθους M/k το καθένα. Στην i-οστή επανάληψη, το i-οστό τμήμα λειτουργεί ως σύνολο ελέγχου, ενώ τα υπόλοιπα k 1 τμήματα αποτελούν το σύνολο εκπαίδευσης. Η συνηθέστερη τιμή για το k είναι το 10 (10-fold cross-validation ). Η μέθοδος της δια-εγυροποίησης για την ειδική περίπτωση οπού k =M, ονομάζεται άφησε-ένα-έξω (leave-one-out), γιατί το σύνολο ελέγχου σε κάθε επανάληψη, αποτελείται από ένα μόνο στιγμιότυπο. Η παραλλαγή αυτή χρησιμοποιείται μόνο σε μικρά σύνολα δεδομένων Bootstrap Αποτελεί εναλλακτική μέθοδο της τυχαίας υποδειγματοληψίας. Ενώ η τυχαία υποδειγματοληψία σχηματίζει το σύνολο ελέγχου εφαρμόζοντας τυχαία δειγματοληψία χωρίς επανατοποθέτηση στο σύνολο δεδομένων, ο bootstrap εφαρμόζει τυχαία δειγματοληψία με επανατοποθέτηση. Έστω M το πλήθος των στιγμιότυπων του συνόλου δεδομένων. Αποδεικνύεται ότι αν από το σύνολο αυτό πάρουμε ένα δείγμα M στιγμιότυπων, εξαιτίας της επανατοποθέτησης ο αριθμός των διακριτών στιγμιότυπων του δείγματος αυτού, αναμένεται να ισούται με το 63.2% του M. Απόδειξη: Για ένα αντικείμενο χ, η πιθανότητα είναι: P( x Δείγμα ) = 1 P( x Δείγμα). Σε κάθε μια από τις M προσπάθειες, το x έχει πιθανότητα 1/M να επιλεγεί, και 1 1/M πιθανότητα να μην επιλεγεί. Επομένως, μετά από M προσπάθειες, η πιθανότητα να μην επιλεγεί σε καμία από αυτές, δηλαδή να μην ανήκει στο δείγμα, ισούται με P( x Δείγμα) = ( 1 1/Μ ) Μ. Άρα, P( x Δείγμα ) = 1 - ( 1 1/Μ ) Μ. Για μεγάλες τιμές του M έχουμε lim (1 - ( 1 1/Μ ) Μ ) = 1 e -1 = M Η διαδικασία της δειγματοληψίας επαναλαμβάνεται k φορές. Αν υποθέσουμε ότι η ακρίβεια στην i-οστή επανάληψη είναι a i, τότε η ακρίβεια accuracy της μεθόδου ορίζεται ως εξής: accuracy 1 k k i 1 (0.632a i 0.368a) Όπου a είναι η ακρίβεια όταν το σύνολο δεδομένων χρησιμοποιείται και ως σύνολο ελέγχου και ως σύνολο εκπαίδευσης. 30 ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΚΑΙ ΠΡΟΒΛΕΨΗ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΑΓΩΝΩΝ ΠΟΔΟΣΦΑΙΡΟΥ

31 ΚΕΦΑΛΑΙΟ 2: ΑΛΓΟΡΙΘΜΟΙ ΜΗΧΑΝΙΚΗΣ ΜΑΘΗΣΗΣ ΑΛΓΟΡΙΘΜΟΙ ΤΑΞΙΝΟΜΗΣΗΣ Έχοντας αναφερθεί στις βασικές έννοιες γύρω από το πλαίσιο της ταξινόμησης, μπορούμε πλέον να συνεχίσουμε με την περιγραφεί συγκεκριμένων αλγορίθμων κατηγοριοποιήσεις. Ποίο συγκεκριμένα, στα πλαίσια της παρούσας εργασίας θα χρησιμοποιηθούν οι εξής αλγόριθμοι: BFTree J48 J48Graft LADTree REPTree SimpleCart NaiveBayes NaiveBayesNominal NaiveBayesSimple Multinomial logistic regression SMO Linear logistic regression IB1 DecisionTable Όπως αναφέρομαι και προηγουμένως, η ταξινόμηση εκτελείται σε 2 βήματα: 1. Δημιουργία του μοντέλου ταξινόμησης και, 2. Κατηγοριοποίηση των στιγμιότυπων του συνόλου ελέγχου. Οι διαφορετικότητα των αλγορίθμων που θα παρουσιάσουμε, έγκυται στο ότι δημιουργούν διαφορετικά μοντέλα ταξινόμησης, ενώ το δεύτερο βήμα είναι ίδιο για όλους. Ο κάθε αλγόριθμος αναλύει διαφορετικά το σύνολο εκπαίδευσης, βασιζόμενος σε ξεχωριστά ποσοτικά μέτρα ο κάθε ένας προκειμένου να αντλήσει την κρυφή γνώση που κρύβεται πίσω από τα δεδομένα. Γι αυτό τον λόγο κατασκευάζονται ανόμοια μοντέλα ταξινόμησης. Οι κατηγορίες στις οποίες ανήκουν τα μοντέλα αυτά είναι οι εξής: 1. Δένδρα απόφασης (decision trees classifiers). Οι κατηγοριοποιητές αυτοι έχουν δενδρική μορφή αναπαράστασης. Σε αυτήν τη κατηγορία ανήκουν τα μοντέλα που σχηματίζουν οι αλγόριθμοι BFTree, J48, J48Graft, LADTree, REPTree και SimpleCart. 2. Κανόνες ταξινόμησης (decision rule). Αποτελεί εναλλακτική αναπαράσταση των δένδρων απόφασης. Ο αλγόριθμός DecisionTable ανήκει σε αυτήν την κατηγορία. 3. Πιθανοκρατικοί κατηγοριοποιητές (probabilistic classifiers). Βασίζονται στην εξέταση κατανομών πιθανότητας στα δεδομένα του συνόλου εκπαίδευσης. Οι αλγόριθμοι, NaiveBayes, NaiveBayesNominal και NaivebayesSimple ανήκουν σε αυτή τη κατηγορία. ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΚΑΙ ΠΡΟΒΛΕΨΗ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΑΓΩΝΩΝ ΠΟΔΟΣΦΑΙΡΟΥ 31

32 ΠΑΥΛΟΣ ΠΟΛΙΑΝΙΔΗΣ 4. Διακριτικοί κατηγοριοποιητές (discriminative classifiers). Οι Multinomial logistic regression και linear logistic regression ανήκουν σε αυτή τη κατηγορία. 5. Γραμμικοί κατηγοριοποιητές (linear classifiers). Βασίζονται στο γραμμικό συνδυασμό των χαρακτηριστικών του διανύσματος χαρακτηριστικών (feature vector). Στην κατηγορία αυτή ανήκει ο SMO C4.5 Ο αλγόριθμος C4.5 [11,12] ανήκει στην μεγάλη κατηγορία αλγορίθμων ταξινόμησης οι οποίοι δημιουργούν δεντρικά μοντέλα ταξινομητών (δένδρα απόφασης). Αποτελεί απόγονο του αλγορίθμου ID3. Ένα δένδρο απόφασης αποτελείται από κόμβους που αντιστοιχούν σε κάποιο χαρακτηριστικό του συνόλου εκπαίδευσης ο κάθε ένας και διακρίνονται στους εξής: 1. Ρίζα (root): κόμβος ο οποίος βρίσκεται στην κορυφή του δένδρου και χωρίζει το σύνολο εκπαίδευσης σε 2 ή περισσότερα υποσύνολα. 2. Εσωτερικοί κόμβοι (internal node): ενδιάμεσοι κόμβοι οι οποίοι με την σειρά τους χωρίζουν το κάθε υποσύνολο του υποδένδρου σε μικρότερα υποσύνολα. 3. Φύλλα (leafs): αποτελεί τον τερματικό κόμβο και αντιπροσωπεύει μια κλάση από το διακριτό σύνολο κλάσεων του συνόλου εκπαίδευσης. Όλοι οι κόμβοι εκτός από τα φύλλα έχουν εξερχόμενες ακμές, οι οποίες αντιστοιχούν σε μια συνθήκη βάση της οποία γίνεται ο διάσπαση των δεδομένων. η συνθήκη αυτή ονομάζεται συνθήκη διάσπασης (split criteria). Εικόνα 2.3: Αλγόριθμος C ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΚΑΙ ΠΡΟΒΛΕΨΗ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΑΓΩΝΩΝ ΠΟΔΟΣΦΑΙΡΟΥ

33 ΚΕΦΑΛΑΙΟ 2: ΑΛΓΟΡΙΘΜΟΙ ΜΗΧΑΝΙΚΗΣ ΜΑΘΗΣΗΣ Στην εικόνα 2.2 περιγράφεται ο αλγόριθμος C4.5. όπως βλέπουμε η διαδικασία ξεκινάει από την επιλογή του αρχικού κόμβου (ρίζα) ο οποίος θα διασπάσει το αρχικό σύνολο εκπαίδευσης με βάση την συνθήκη διάσπασης (split criteria). Η επιλογή του κατάλληλου κόμβου διαχωριστή, επιτυγχάνεται μέσω ενός ποσοτικού μέτρου. το μέτρο αυτό υπολογίζεται για όλα τα χαρακτηριστικά του συνόλου εκπαίδευσης και επιλέγεται το χαρακτηριστικό που έχει την καλύτερη τιμή. Η διαδικασία αυτή επαναλαμβάνεται αναδρομικά, έως ότου όλα τα μικρότερα υποσύνολα να είναι αμιγείς, δηλαδή, όλα τα στιγμιότυπά του υποσυνόλου να ανήκουν σε μία κλάση. Με αυτόν τον τρόπο κατασκευάζεται το δένδρο απόφασης. (βλέπε εικόνα 2.4) Το βασικό ποσοτικό μέτρο που χρησιμοποιείται για επιλογή των διαχωριστών είναι το κέρδος πληροφορίας (information Gain) το οποίο βασίζεται στην εντροπία πληροφορίας (entropy ). Εικόνα 2.4: Παράδειγμα από Δένδρο που προκύπτει από την εκτέλεση του C4.5 Έχουν προταθεί αρκετές παραλλαγές του C4.5, όπως C4.5-no-pruning, C4.5-rules, οι οποίοι προσπαθούν να βελτιώσουν την επίδοση του αλγορίθμου, εκτελώντας διάφορες επιπρόσθετες λειτουργίες (π.χ. κλάδεμα δένδρου). ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΚΑΙ ΠΡΟΒΛΕΨΗ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΑΓΩΝΩΝ ΠΟΔΟΣΦΑΙΡΟΥ 33

34 ΠΑΥΛΟΣ ΠΟΛΙΑΝΙΔΗΣ Best-first decision trees Ο best-first αλγόριθμος ταξινόμησης [15], ανήκει στην μεγάλη κατηγορία των δένδρων απόφασης (decision trees). Τα δένδρα απόφασης είναι μια δημοφιλής κατηγορία κατηγοριοποιητών για τους εξής λόγους: 1. Είναι γρήγορα τόσο κατά την κατασκευή μοντέλων ταξινόμησης όσο και κατά την διάρκεια της κατηγοριοποίησης. 2. Κατασκευάζουν μοντέλα ταξινόμησης με πολύ καλή επίδοση. 3. Εφαρμόζουν καλά σε «θορυβώδη» σύνολα εκπαίδευσης. 4. Είναι ιδανικά για την δημιουργία κατηγοριοποιητών, όταν υπάρχουν στιγμιότυπα με χαρακτηριστικά για τα οποία απουσιάζει η τιμή (missing values). Τα best-first δένδρα συγκεντρώνουν όλες τις ιδιότητες των παραδοσιακών δένδρων απόφασης (π.χ. C4.5, ID3 κ.λπ.). Η μοναδική διαφορά είναι ότι, τα κλασσικά δένδρα απόφασης επεκτείνουν τους κόμβους (εσωτερικού κόμβους) με depth-first σειρά, ενώ ο best-first επεκτείνει πρώτα το «καλύτερο» κόμβο. Η εικόνα 2.5 παρουσιάζει ένα υποθετικό best-first δένδρο και ένα κλασικό δένδρο απόφασης. Διακρίνεται ότι ο best-first δημιουργεί ένα πλήρως-επεκταμένο δένδρο (εικόνα 2.5 (α)) που είναι ίδιος με το δένδρο που δημιουργούν οι παραδοσιακοί αλγόριθμοι δένδρων απόφασης. Παρόλα αυτά, αν είναι γνωστό εκ των προτέρων το πλήθος των επεκτάσεων που θα γίνουν στο δένδρο, ο best-first δημιουργεί σχεδόν πάντα διαφορετικά δένδρα (εικόνες 2.5 (c) και 2.5 (d) αντίστοιχα). Αυτό οφείλεται στον τρόπο που αναπτύσσει το δένδρο ο best-first. Εικόνα 2.5 (a) πλήρως-επεκταμένο best-first tree.(b)πλήρως επεκταμένο παραδοσιακό δένδρο απόφασης (c) best-first tree με τρείς επεκτάσεις.(d) παραδοσιακό δένδρο απόφασης με τρεις επεκτάσεις 34 ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΚΑΙ ΠΡΟΒΛΕΨΗ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΑΓΩΝΩΝ ΠΟΔΟΣΦΑΙΡΟΥ

35 ΚΕΦΑΛΑΙΟ 2: ΑΛΓΟΡΙΘΜΟΙ ΜΗΧΑΝΙΚΗΣ ΜΑΘΗΣΗΣ Εικόνα 2.6 Αλγόριθμος Best-first Όπως αναφέραμε παραπάνω, ο best-first αλγόριθμος επεκτείνει το δέντρο, επιλέγοντας να διαχωρίσει το «καλύτερο» κόμβο σε κάθε γύρω. Με το όρο «καλύτερο» εννοούμε τον κόμβο ο οποίος οδηγεί σε μεγαλύτερη μείωση της ανομοιογένειας των δεδομένων στους κόμβου. Ενώ τα παραδοσιακά δένδρα ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΚΑΙ ΠΡΟΒΛΕΨΗ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΑΓΩΝΩΝ ΠΟΔΟΣΦΑΙΡΟΥ 35

36 ΠΑΥΛΟΣ ΠΟΛΙΑΝΙΔΗΣ απόφασής, αναπτύσσουν το δέντρο πρώτα σε «βάθος», δηλαδή επεκτείνουν τους κόμβους ενός μονοπατιού, μέχρι να φτάσουν σε τερματικό κόμβο. Αυτό αποτελεί την βασική και μοναδική διαφορά των 2 προσεγγίσεων. Προκειμένου να επιλέγει γρήγορα τον «καλύτερο» κόμβο, ο best-first ταξινομεί την λίστα με τους κόμβους, κατά φθίνουσα σειρά ως προς το Gini gain ή το Information gain (ανάλογα με το ποίο ποσοτικό μέτρο χρησιμοποιείται για τον διαχωρισμό των κόμβων). Με αυτό τον τρόπο, κάθε φορά επιλέγεται για διαχωρισμό, ο πρώτος κόμβος τις ταξινομημένης ο οποίος ουσιαστικά είναι και ο «καλύτερος». Ένα επιπλέον χαρακτηριστικό του bestfirst είναι ότι, μπορούμε να καθορίσουμε το πλήθος των επεκτάσεων που θα γίνουν στο δένδρο. Ο αλγόριθμος παρουσιάζεται στην εικόνα LADTrees O LADTree [13] είναι αλγόριθμος ταξινόμησης ο οποίος δημιουργεί ένα εναλλακτικό δένδρο απόφασης (alternative decision tree). Εφαρμόζεται σε προβλήματα ταξινόμησης στα οποία έχουν πολλαπλές κλάσεις (multiclass). Βασίζεται στο αλγόριθμο LogitBoost ο οποίος ανήκει στην οικογένεια των Boosting αλγορίθμων. Προτού περιγράψουμε τα εναλλακτικά δένδρα, θα ήταν χρήσιμο να αναφερθούμε στην διαδικασία του Boosting [12] στην οποία στηρίζει την λειτουργία του o LogitBoost (logistic boosting) Boosting Υποθέτουμε ότι έχουμε ένα πρόβλημα δυαδικής ταξινόμησης, δηλαδή το κάθε στιγμιότυπο μπορεί να ανήκει σε μια από τις δυο εναλλακτικές κλάσεις. Όπως είναι γνωστό, σκοπός ενός αλγορίθμου ταξινόμησης είναι να κατασκευάσει ένα μοντέλο ταξινόμησης μέσα από το σύνολο εκπαίδευση, και στην συνέχεια να προσπαθήσει να κατατάξει όλα τα στιγμιότυπα του συνόλου ελέγχου. Μία εναλλακτική λύση θα μπορούσε να είναι, ο κατηγοροιοποιητής να κατατάσσει τα στιγμιότυπα με τυχαίο τρόπο χωρίς να χρειαστεί να αναλύσει τα δεδομένα. Έτσι θα είχε 50% απώλεια (αριθμός των λάθος κατατάξεων). Είναι προφανής ότι αυτή η λύση δεν μπορεί να είναι αποδεκτή. Υπάρχουν όμως περιπτώσεις στις οποίες οι κατηγοριοποιητές, παρόλη την ανάλυση που εκτελούν στα δεδομένα, δεν επιτυγχάνουν ποσοστό σωστής πρόβλεψης πολύ μεγαλύτερο από ότι αν εφαρμόζαμε τυχαία πρόβλεψη. Σε αυτές τις περιπτώσεις λέμε ότι ο κατηγοριοποιητής μας αποτελεί έναν αδύναμο κατηγοροιοποιητής ή μια αδύναμη υπόθεση (weak classifier ή weak hypothesis). Η λογική του Boosting στηρίζεται στο γεγονός ότι μπορούμε να συνδυάσουμε ένα σύνολο αδύναμων κατηγοροιοποιητών προκειμένου να σχηματίσουμε έναν δυνατό κατηγοροιοποιητή (strong classifier) ο οποίος θα έχει πολύ καλύτερα αποτελέσματα από την τυχαία πρόβλεψη. Αν θέσουμε έναν αδύναμο κατηγοροιοποιητή ως h1, τότε η διαδικασία του Boosting θα παράγει μια νέα κατανομή D των δεδομένων από την αρχική D προκειμένου να ελαττωθούν τα λάθη που εμφάνισε ο h1. Ουσιαστικά πρόκειται για μια αλλαγή που γίνεται στα βάρη των στιγμιότυπων. Συνήθως η νέα D εστιάζει την προσοχή στα στιγμιότυπα τα οποία ο h1 κατάταξε εσφαλμένα. Στην συνέχεια μέσα από την νέα 36 ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΚΑΙ ΠΡΟΒΛΕΨΗ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΑΓΩΝΩΝ ΠΟΔΟΣΦΑΙΡΟΥ

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Data Mining - Classification

ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ. Data Mining - Classification ΔΙΑΧΕΙΡΙΣΗ ΠΕΡΙΕΧΟΜΕΝΟΥ ΠΑΓΚΟΣΜΙΟΥ ΙΣΤΟΥ ΚΑΙ ΓΛΩΣΣΙΚΑ ΕΡΓΑΛΕΙΑ Data Mining - Classification Data Mining Ανακάλυψη προτύπων σε μεγάλο όγκο δεδομένων. Σαν πεδίο περιλαμβάνει κλάσεις εργασιών: Anomaly Detection:

Διαβάστε περισσότερα

HMY 795: Αναγνώριση Προτύπων

HMY 795: Αναγνώριση Προτύπων HMY 795: Αναγνώριση Προτύπων Διάλεξη 3 Επιλογή μοντέλου Επιλογή μοντέλου Θεωρία αποφάσεων Επιλογή μοντέλου δεδομένα επικύρωσης Η επιλογή του είδους του μοντέλου που θα χρησιμοποιηθεί σε ένα πρόβλημα (π.χ.

Διαβάστε περισσότερα

Μέθοδοι Μηχανών Μάθησης για Ευφυή Αναγνώριση και ιάγνωση Ιατρικών εδοµένων

Μέθοδοι Μηχανών Μάθησης για Ευφυή Αναγνώριση και ιάγνωση Ιατρικών εδοµένων Μέθοδοι Μηχανών Μάθησης για Ευφυή Αναγνώριση και ιάγνωση Ιατρικών εδοµένων Εισηγητής: ρ Ηλίας Ζαφειρόπουλος Εισαγωγή Ιατρικά δεδοµένα: Συλλογή Οργάνωση Αξιοποίηση Data Mining ιαχείριση εδοµένων Εκπαίδευση

Διαβάστε περισσότερα

Κατηγοριοποίηση βάσει διανύσματος χαρακτηριστικών

Κατηγοριοποίηση βάσει διανύσματος χαρακτηριστικών Κατηγοριοποίηση βάσει διανύσματος χαρακτηριστικών Αναπαράσταση των δεδομένων ως διανύσματα χαρακτηριστικών (feature vectors): Επιλογή ενός

Διαβάστε περισσότερα

Το μοντέλο Perceptron

Το μοντέλο Perceptron Το μοντέλο Perceptron Αποτελείται από έναν μόνο νευρώνα McCulloch-Pitts w j x x 1, x2,..., w x T 1 1 x 2 w 2 Σ u x n f(u) Άνυσμα Εισόδου s i x j x n w n -θ w w 1, w2,..., w n T Άνυσμα Βαρών 1 Το μοντέλο

Διαβάστε περισσότερα

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2 Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας Version 2 1 ΜΗ ΓΡΑΜΜΙΚΟΙ ΤΑΞΙΝΟΜΗΤΕΣ ΔΕΝΔΡΑ ΑΠΟΦΑΣΗΣ Πρόκειται για μια οικογένεια μη γραμμικών ταξινομητών Είναι συστήματα απόφασης πολλών σταδίων (multistage),

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 18. 18 Μηχανική Μάθηση

ΚΕΦΑΛΑΙΟ 18. 18 Μηχανική Μάθηση ΚΕΦΑΛΑΙΟ 18 18 Μηχανική Μάθηση Ένα φυσικό ή τεχνητό σύστηµα επεξεργασίας πληροφορίας συµπεριλαµβανοµένων εκείνων µε δυνατότητες αντίληψης, µάθησης, συλλογισµού, λήψης απόφασης, επικοινωνίας και δράσης

Διαβάστε περισσότερα

Τεχνητή Νοημοσύνη. 17η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

Τεχνητή Νοημοσύνη. 17η διάλεξη ( ) Ίων Ανδρουτσόπουλος. Τεχνητή Νοημοσύνη 17η διάλεξη (2016-17) Ίων Ανδρουτσόπουλος http://.aueb.gr/users/ion/ 1 Οι διαφάνειες αυτής της διάλεξης βασίζονται: στο βιβλίο Artificia Inteigence A Modern Approach των S. Russe και

Διαβάστε περισσότερα

Τεχνητή Νοημοσύνη. 16η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

Τεχνητή Νοημοσύνη. 16η διάλεξη ( ) Ίων Ανδρουτσόπουλος. Τεχνητή Νοημοσύνη 16η διάλεξη (2016-17) Ίων Ανδρουτσόπουλος http://www.aueb.gr/users/ion/ 1 Οι διαφάνειες αυτής της διάλεξης βασίζονται σε ύλη του βιβλίου Artificial Intelligence A Modern Approach των

Διαβάστε περισσότερα

Τεχνητή Νοημοσύνη. 18η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

Τεχνητή Νοημοσύνη. 18η διάλεξη ( ) Ίων Ανδρουτσόπουλος. Τεχνητή Νοημοσύνη 18η διάλεξη (2016-17) Ίων Ανδρουτσόπουλος http://www.aueb.gr/users/ion/ 1 Οι διαφάνειες αυτής της διάλεξης βασίζονται: στο βιβλίο Machine Learning του T. Mitchell, McGraw- Hill, 1997,

Διαβάστε περισσότερα

ΔΠΜΣ: ΕΦΑΡΜΟΣΜΕΝΕΣ ΜΑΘΗΜΑΤΙΚΕΣ ΕΠΙΣΤΗΜΕΣ ΡΟΗ: ΣΤΑΤΙΣΤΙΚΗ-ΠΙΘΑΝΟΤΗΤΕΣ ΜΑΘΗΜΑ: ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΤΕΛΙΚΗ ΕΡΓΑΣΙΑ ΔΗΜΗΤΡΑ ΤΑΤΣΙΟΥ

ΔΠΜΣ: ΕΦΑΡΜΟΣΜΕΝΕΣ ΜΑΘΗΜΑΤΙΚΕΣ ΕΠΙΣΤΗΜΕΣ ΡΟΗ: ΣΤΑΤΙΣΤΙΚΗ-ΠΙΘΑΝΟΤΗΤΕΣ ΜΑΘΗΜΑ: ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΤΕΛΙΚΗ ΕΡΓΑΣΙΑ ΔΗΜΗΤΡΑ ΤΑΤΣΙΟΥ ΔΠΜΣ: ΕΦΑΡΜΟΣΜΕΝΕΣ ΜΑΘΗΜΑΤΙΚΕΣ ΕΠΙΣΤΗΜΕΣ ΡΟΗ: ΣΤΑΤΙΣΤΙΚΗ-ΠΙΘΑΝΟΤΗΤΕΣ ΜΑΘΗΜΑ: ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΤΕΛΙΚΗ ΕΡΓΑΣΙΑ ΔΗΜΗΤΡΑ ΤΑΤΣΙΟΥ ΠΡΟΕΠΙΣΚΟΠΗΣΗ ΚΑΙ ΕΞΕΡΕΥΝΗΣΗ ΤΩΝ ΔΕΔΟΜΕΝΩΝ Τα προς επεξεργασία

Διαβάστε περισσότερα

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΚΑΙ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΠΛΗΡΟΦΟΡΙΑΣ ΠΑΡΟΥΣΙΑΣΗ ΤΕΛΙΚΗΣ ΕΡΓΑΣΙΑΣ ΛΙΝΑ ΜΑΣΣΟΥ

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΚΑΙ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΠΛΗΡΟΦΟΡΙΑΣ ΠΑΡΟΥΣΙΑΣΗ ΤΕΛΙΚΗΣ ΕΡΓΑΣΙΑΣ ΛΙΝΑ ΜΑΣΣΟΥ ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΚΑΙ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΠΑΡΟΥΣΙΑΣΗ ΤΕΛΙΚΗΣ ΕΡΓΑΣΙΑΣ ΛΙΝΑ ΜΑΣΣΟΥ Δ.Π.Μ.Σ: «Εφαρμοσμένες Μαθηματικές Επιστήμες» 2008

Διαβάστε περισσότερα

LOGO. Εξόρυξη Δεδομένων. Δειγματοληψία. Πίνακες συνάφειας. Καμπύλες ROC και AUC. Σύγκριση Μεθόδων Εξόρυξης

LOGO. Εξόρυξη Δεδομένων. Δειγματοληψία. Πίνακες συνάφειας. Καμπύλες ROC και AUC. Σύγκριση Μεθόδων Εξόρυξης Εξόρυξη Δεδομένων Δειγματοληψία Πίνακες συνάφειας Καμπύλες ROC και AUC Σύγκριση Μεθόδων Εξόρυξης Πασχάλης Θρήσκος PhD Λάρισα 2016-2017 pthriskos@mnec.gr LOGO Συμπερισματολογία - Τι σημαίνει ; Πληθυσμός

Διαβάστε περισσότερα

Αναγνώριση Προτύπων Ι

Αναγνώριση Προτύπων Ι Αναγνώριση Προτύπων Ι Ενότητα 1: Μέθοδοι Αναγνώρισης Προτύπων Αν. Καθηγητής Δερματάς Ευάγγελος Τμήμα Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται

Διαβάστε περισσότερα

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων Ενότητα 6: Κατηγοριοποίηση Μέρος Β Αναστάσιος Γούναρης, Επίκουρος Καθηγητής Άδειες Χρήσης Το

Διαβάστε περισσότερα

Μάθηση και Γενίκευση. "Τεχνητά Νευρωνικά Δίκτυα" (Διαφάνειες), Α. Λύκας, Παν. Ιωαννίνων

Μάθηση και Γενίκευση. Τεχνητά Νευρωνικά Δίκτυα (Διαφάνειες), Α. Λύκας, Παν. Ιωαννίνων Μάθηση και Γενίκευση Το Πολυεπίπεδο Perceptron (MultiLayer Perceptron (MLP)) Έστω σύνολο εκπαίδευσης D={(x n,t n )}, n=1,,n. x n =(x n1,, x nd ) T, t n =(t n1,, t np ) T Θα πρέπει το MLP να έχει d νευρώνες

Διαβάστε περισσότερα

ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΚΑΙ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ

ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΚΑΙ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΚΑΙ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΔΠΜΣ : ΕΦΑΡΜΟΣΜΕΝΕΣ ΜΑΘΗΜΑΤΙΚΕΣ ΕΠΙΣΤΗΜΕΣ ΡΟΗ ΠΙΘΑΝΟΝΤΗΤΕΣ ΚΑΙ ΣΤΑΤΙΣΤΙΚΗΣ ΕΡΓΑΣΙΑ 08: ΕΙΡΗΝΗ ΛΥΓΚΩΝΗ 1 Ο ΣΤΑΔΙΟ: Πριν εφαρμόσουμε οποιοδήποτε αλγόριθμο

Διαβάστε περισσότερα

Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500

Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500 Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500 Πληθυσμός Δείγμα Δείγμα Δείγμα Ο ρόλος της Οικονομετρίας Οικονομική Θεωρία Διατύπωση της

Διαβάστε περισσότερα

ΑΝΑΓΝΩΡΙΣΗ ΠΡΟΤΥΠΩΝ. Κατηγοριοποίηση. Αριστείδης Γ. Βραχάτης, Dipl-Ing, M.Sc, PhD

ΑΝΑΓΝΩΡΙΣΗ ΠΡΟΤΥΠΩΝ. Κατηγοριοποίηση. Αριστείδης Γ. Βραχάτης, Dipl-Ing, M.Sc, PhD Τμήμα Πληροφορικής με Εφαρμογές στη Βιοϊατρική Σχολή Θετικών Επιστημών Πανεπιστήμιο Θεσσαλίας ΑΝΑΓΝΩΡΙΣΗ ΠΡΟΤΥΠΩΝ Κατηγοριοποίηση Αριστείδης Γ. Βραχάτης, Dipl-Ing, M.Sc, PhD Κατηγοριοποιητής K πλησιέστερων

Διαβάστε περισσότερα

Υπερπροσαρμογή (Overfitting) (1)

Υπερπροσαρμογή (Overfitting) (1) Αλγόριθμος C4.5 Αποφυγή υπερπροσαρμογής (overfitting) Reduced error pruning Rule post-pruning Χειρισμός χαρακτηριστικών συνεχών τιμών Επιλογή κατάλληλης μετρικής για την επιλογή των χαρακτηριστικών διάσπασης

Διαβάστε περισσότερα

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2 Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας Verson ΧΑΡΤΟΓΡΑΦΗΣΗ ΤΟΥ ΧΩΡΟΥ ΤΩΝ ΤΑΞΙΝΟΜΗΤΩΝ Ταξινομητές Ταξινομητές συναρτ. διάκρισης Ταξινομητές επιφανειών απόφ. Παραμετρικοί ταξινομητές Μη παραμετρικοί

Διαβάστε περισσότερα

Συνδυασμός Ταξινομητών χρησιμοποιώντας Μήτρες Αποφάσεων (Decision Templates) με εφαρμογή στην Ταξινόμηση Καρκινικών Δεδομένων ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ

Συνδυασμός Ταξινομητών χρησιμοποιώντας Μήτρες Αποφάσεων (Decision Templates) με εφαρμογή στην Ταξινόμηση Καρκινικών Δεδομένων ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ Πολυτεχνείο Κρήτης Τμήμα Ηλεκτρονικών Μηχανικών και Μηχανικών Ηλεκτρονικών Υπολογιστών Τομέας Τηλεπικοινωνιών Συνδυασμός Ταξινομητών χρησιμοποιώντας Μήτρες Αποφάσεων (Decision Templates) με εφαρμογή στην

Διαβάστε περισσότερα

4.3. Γραµµικοί ταξινοµητές

4.3. Γραµµικοί ταξινοµητές Γραµµικοί ταξινοµητές Γραµµικός ταξινοµητής είναι ένα σύστηµα ταξινόµησης που χρησιµοποιεί γραµµικές διακριτικές συναρτήσεις Οι ταξινοµητές αυτοί αναπαρίστανται συχνά µε οµάδες κόµβων εντός των οποίων

Διαβάστε περισσότερα

Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης

Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης 1 Έλεγχος υποθέσεων και διαστήματα εμπιστοσύνης Όπως γνωρίζουμε από προηγούμενα κεφάλαια, στόχος των περισσότερων στατιστικών αναλύσεων, είναι η έγκυρη γενίκευση των συμπερασμάτων, που προέρχονται από

Διαβάστε περισσότερα

ΗΜΕΡΟΜΗΝΙΑ: 25/05/2009 TΕΛΙΚΗ ΕΡΓΑΣΙΑ ΝΙΚΗ ΜΟΣΧΟΥ

ΗΜΕΡΟΜΗΝΙΑ: 25/05/2009 TΕΛΙΚΗ ΕΡΓΑΣΙΑ ΝΙΚΗ ΜΟΣΧΟΥ DATA MINING ΗΜΕΡΟΜΗΝΙΑ: 25/05/2009 TΕΛΙΚΗ ΕΡΓΑΣΙΑ ΝΙΚΗ ΜΟΣΧΟΥ 1 ΠΡΟΕΠΕΞΕΡΓΑΣΙΑ ΔΕΔΟΜΕΝΩΝ Αφού δεν γνωρίζουμε κάποιο τρόπο για να επιλέξουμε εκ των προτέρων την πιο κατάλληλη και αποδοτική μέθοδο μάθησης

Διαβάστε περισσότερα

Ειδικά θέματα Αλγορίθμων και Δομών Δεδομένων (ΠΛΕ073) Απαντήσεις 1 ου Σετ Ασκήσεων

Ειδικά θέματα Αλγορίθμων και Δομών Δεδομένων (ΠΛΕ073) Απαντήσεις 1 ου Σετ Ασκήσεων Ειδικά θέματα Αλγορίθμων και Δομών Δεδομένων (ΠΛΕ073) Απαντήσεις 1 ου Σετ Ασκήσεων Άσκηση 1 α) Η δομή σταθμισμένης ένωσης με συμπίεση διαδρομής μπορεί να τροποποιηθεί πολύ εύκολα ώστε να υποστηρίζει τις

Διαβάστε περισσότερα

Εξόρυξη Γνώσης από Βιολογικά εδομένα

Εξόρυξη Γνώσης από Βιολογικά εδομένα Παρουσίαση Διπλωματικής Εργασίας Εξόρυξη Γνώσης από Βιολογικά εδομένα Καρυπίδης Γεώργιος (Μ27/03) Επιβλέπων Καθηγητής: Ιωάννης Βλαχάβας MIS Πανεπιστήμιο Μακεδονίας Φεβρουάριος 2005 Εξόρυξη Γνώσης από Βιολογικά

Διαβάστε περισσότερα

Ασκήσεις μελέτης της 16 ης διάλεξης

Ασκήσεις μελέτης της 16 ης διάλεξης Οικονομικό Πανεπιστήμιο Αθηνών, Τμήμα Πληροφορικής Μάθημα: Τεχνητή Νοημοσύνη, 016 17 Διδάσκων: Ι. Ανδρουτσόπουλος Ασκήσεις μελέτης της 16 ης διάλεξης 16.1. (α) Έστω ένα αντικείμενο προς κατάταξη το οποίο

Διαβάστε περισσότερα

Αποθήκες εδομένων και Εξόρυξη εδομένων:

Αποθήκες εδομένων και Εξόρυξη εδομένων: Αποθήκες εδομένων και Εξόρυξη εδομένων: Κατηγοριοποίηση: Μέρος Β http://delab.csd.auth.gr/~gounaris/courses/dwdm/ gounaris/courses/dwdm/ Ευχαριστίες Οι διαφάνειες του μαθήματος σε γενικές γραμμές ακολουθούν

Διαβάστε περισσότερα

Κεφάλαιο 5. Το Συμπτωτικό Πολυώνυμο

Κεφάλαιο 5. Το Συμπτωτικό Πολυώνυμο Κεφάλαιο 5. Το Συμπτωτικό Πολυώνυμο Σύνοψη Στο κεφάλαιο αυτό παρουσιάζεται η ιδέα του συμπτωτικού πολυωνύμου, του πολυωνύμου, δηλαδή, που είναι του μικρότερου δυνατού βαθμού και που, για συγκεκριμένες,

Διαβάστε περισσότερα

ΔΠΜΣ: ΕΦΑΡΜΟΣΜΕΝΕΣ ΜΑΘΗΜΑΤΙΚΕΣ ΕΠΙΣΤΗΜΕΣ ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΤΕΛΙΚΗ ΕΡΓΑΣΙΑ

ΔΠΜΣ: ΕΦΑΡΜΟΣΜΕΝΕΣ ΜΑΘΗΜΑΤΙΚΕΣ ΕΠΙΣΤΗΜΕΣ ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΤΕΛΙΚΗ ΕΡΓΑΣΙΑ Ε Θ Ν Ι Κ Ο Μ Ε Τ Σ Ο Β Ι Ο Π Ο Λ Υ Τ Ε Χ Ν Ε Ι Ο ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ & ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΔΠΜΣ: ΕΦΑΡΜΟΣΜΕΝΕΣ ΜΑΘΗΜΑΤΙΚΕΣ ΕΠΙΣΤΗΜΕΣ ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΤΕΛΙΚΗ ΕΡΓΑΣΙΑ ΟΝΟΜΑΤΕΠΩΝΥΜΟ:

Διαβάστε περισσότερα

ΔΙΑΧΩΡΙΣΜΟΣ ΚΑΙ ΤΑΞΙΝΟΜΗΣΗ ΚΡΗΤΙΚΟΥ ΚΑΤΕΡΙΝΑ NΙΚΑΚΗ ΚΑΤΕΡΙΝΑ NΙΚΟΛΑΪΔΟΥ ΧΡΥΣΑ

ΔΙΑΧΩΡΙΣΜΟΣ ΚΑΙ ΤΑΞΙΝΟΜΗΣΗ ΚΡΗΤΙΚΟΥ ΚΑΤΕΡΙΝΑ NΙΚΑΚΗ ΚΑΤΕΡΙΝΑ NΙΚΟΛΑΪΔΟΥ ΧΡΥΣΑ ΔΙΑΧΩΡΙΣΜΟΣ ΚΑΙ ΤΑΞΙΝΟΜΗΣΗ ΚΡΗΤΙΚΟΥ ΚΑΤΕΡΙΝΑ NΙΚΑΚΗ ΚΑΤΕΡΙΝΑ NΙΚΟΛΑΪΔΟΥ ΧΡΥΣΑ ΔΙΑΧΩΡΙΣΜΟΣ ΚΑΙ ΤΑΞΙΝΟΜΗΣΗ Είναι τεχνικές που έχουν σκοπό: τον εντοπισμό χαρακτηριστικών των οποίων οι αριθμητικές τιμές επιτυγχάνουν

Διαβάστε περισσότερα

Αναγνώριση Προτύπων Ι

Αναγνώριση Προτύπων Ι Αναγνώριση Προτύπων Ι Ενότητα 3: Στοχαστικά Συστήματα Αν. Καθηγητής Δερματάς Ευάγγελος Τμήμα Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες

Διαβάστε περισσότερα

Αριθμητική Ανάλυση και Εφαρμογές

Αριθμητική Ανάλυση και Εφαρμογές Αριθμητική Ανάλυση και Εφαρμογές Διδάσκων: Δημήτριος Ι. Φωτιάδης Τμήμα Μηχανικών Επιστήμης Υλικών Ιωάννινα 07-08 Αριθμητική Παραγώγιση Εισαγωγή Ορισμός 7. Αν y f x είναι μια συνάρτηση ορισμένη σε ένα διάστημα

Διαβάστε περισσότερα

Βασικές αρχές εκπαίδευσης ΤΝΔ: το perceptron. "Τεχνητά Νευρωνικά Δίκτυα" (Διαφάνειες), Α. Λύκας, Παν. Ιωαννίνων

Βασικές αρχές εκπαίδευσης ΤΝΔ: το perceptron. Τεχνητά Νευρωνικά Δίκτυα (Διαφάνειες), Α. Λύκας, Παν. Ιωαννίνων Βασικές αρχές εκπαίδευσης ΤΝΔ: το perceptron Βιολογικός Νευρώνας Δενδρίτες, που αποτελούν τις γραμμές εισόδου των ερεθισμάτων (βιολογικών σημάτων) Σώμα, στο οποίο γίνεται η συσσώρευση των ερεθισμάτων και

Διαβάστε περισσότερα

Ι. Preprocessing (Επεξεργασία train.arff):

Ι. Preprocessing (Επεξεργασία train.arff): Ονοματεπώνυμο: Κατερίνα Αργύρη Δ.Π.Μ.Σ: Εφαρμοσμένες Μαθηματικές Επιστήμες Ακαδ. Έτος: 2008-2009 1 Για την παρούσα εργασία διατίθενται τρία σύνολα δεδομένων: Δεδομένα Εκπαίδευσης (train set αρχείο train.arff):

Διαβάστε περισσότερα

Ασκήσεις μελέτης της 19 ης διάλεξης

Ασκήσεις μελέτης της 19 ης διάλεξης Οικονομικό Πανεπιστήμιο Αθηνών, Τμήμα Πληροφορικής Μάθημα: Τεχνητή Νοημοσύνη, 2016 17 Διδάσκων: Ι. Ανδρουτσόπουλος Ασκήσεις μελέτης της 19 ης διάλεξης 19.1. Δείξτε ότι το Perceptron με (α) συνάρτηση ενεργοποίησης

Διαβάστε περισσότερα

Διακριτικές Συναρτήσεις

Διακριτικές Συναρτήσεις Διακριτικές Συναρτήσεις Δρ. Δηµήτριος Τσέλιος Επίκουρος Καθηγητής ΤΕΙ Θεσσαλίας Τµήµα Διοίκησης Επιχειρήσεων Θερµικός χάρτης των XYZ ξενοδοχείων σε σχέση µε τη γεωγραφική περιοχή τους P. Adamopoulos New

Διαβάστε περισσότερα

Λήψη αποφάσεων κατά Bayes

Λήψη αποφάσεων κατά Bayes Λήψη αποφάσεων κατά Bayes Σημειώσεις μαθήματος Thomas Bayes (1701 1761) Στυλιανός Χατζηδάκης ECE 662 Άνοιξη 2014 1. Εισαγωγή Οι σημειώσεις αυτές βασίζονται στο μάθημα ECE662 του Πανεπιστημίου Purdue και

Διαβάστε περισσότερα

Διακριτά Μαθηματικά ΙΙ Χρήστος Νομικός Τμήμα Μηχανικών Η/Υ και Πληροφορικής Πανεπιστήμιο Ιωαννίνων 2018 Χρήστος Νομικός ( Τμήμα Μηχανικών Η/Υ Διακριτά

Διακριτά Μαθηματικά ΙΙ Χρήστος Νομικός Τμήμα Μηχανικών Η/Υ και Πληροφορικής Πανεπιστήμιο Ιωαννίνων 2018 Χρήστος Νομικός ( Τμήμα Μηχανικών Η/Υ Διακριτά Διακριτά Μαθηματικά ΙΙ Χρήστος Νομικός Τμήμα Μηχανικών Η/Υ και Πληροφορικής Πανεπιστήμιο Ιωαννίνων 2018 Χρήστος Νομικός ( Τμήμα Μηχανικών Η/Υ Διακριτά και Πληροφορικής Μαθηματικά Πανεπιστήμιο ΙΙ Ιωαννίνων

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 5. Κύκλος Ζωής Εφαρμογών ΕΝΟΤΗΤΑ 2. Εφαρμογές Πληροφορικής. Διδακτικές ενότητες 5.1 Πρόβλημα και υπολογιστής 5.2 Ανάπτυξη εφαρμογών

ΚΕΦΑΛΑΙΟ 5. Κύκλος Ζωής Εφαρμογών ΕΝΟΤΗΤΑ 2. Εφαρμογές Πληροφορικής. Διδακτικές ενότητες 5.1 Πρόβλημα και υπολογιστής 5.2 Ανάπτυξη εφαρμογών 44 Διδακτικές ενότητες 5.1 Πρόβλημα και υπολογιστής 5.2 Ανάπτυξη εφαρμογών Διδακτικοί στόχοι Σκοπός του κεφαλαίου είναι οι μαθητές να κατανοήσουν τα βήματα που ακολουθούνται κατά την ανάπτυξη μιας εφαρμογής.

Διαβάστε περισσότερα

ΙΑ ΟΧΙΚΕΣ ΒΕΛΤΙΩΣΕΙΣ

ΙΑ ΟΧΙΚΕΣ ΒΕΛΤΙΩΣΕΙΣ Tel.: +30 2310998051, Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης Σχολή Θετικών Επιστημών Τμήμα Φυσικής 541 24 Θεσσαλονίκη Καθηγητής Γεώργιος Θεοδώρου Ιστοσελίδα: http://users.auth.gr/theodoru ΙΑ ΟΧΙΚΕΣ ΒΕΛΤΙΩΣΕΙΣ

Διαβάστε περισσότερα

ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΤΕΙ Δυτικής Μακεδονίας ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ 2015-2016 Τεχνητή Νοημοσύνη Νευρώνας Perceptron Διδάσκων: Τσίπουρας Μάρκος Εκπαιδευτικό Υλικό: Τσίπουρας Μάρκος Τζώρτζης Γρηγόρης Περιεχόμενα Εισαγωγή

Διαβάστε περισσότερα

Μέθοδοι εκμάθησης ταξινομητών από θετικά παραδείγματα με αριθμητικά χαρακτηριστικά. Νικόλαος Α. Τρογκάνης Διπλωματική Εργασία

Μέθοδοι εκμάθησης ταξινομητών από θετικά παραδείγματα με αριθμητικά χαρακτηριστικά. Νικόλαος Α. Τρογκάνης Διπλωματική Εργασία Μέθοδοι εκμάθησης ταξινομητών από θετικά παραδείγματα με αριθμητικά χαρακτηριστικά Νικόλαος Α. Τρογκάνης Διπλωματική Εργασία Αντικείμενο Μελέτη και ανάπτυξη μεθόδων από τον χώρο της μηχανικής μάθησης για

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΔΙΚΤΥΑ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΔΙΚΤΥΑ ΘΕΜΑ 1 ο (2,5 μονάδες) ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΔΙΚΤΥΑ Τελικές εξετάσεις Πέμπτη 21 Ιουνίου 2012 16:30-19:30 Υποθέστε ότι θέλουμε

Διαβάστε περισσότερα

1 Αριθμητική κινητής υποδιαστολής και σφάλματα στρογγύλευσης

1 Αριθμητική κινητής υποδιαστολής και σφάλματα στρογγύλευσης 1 Αριθμητική κινητής υποδιαστολής και σφάλματα στρογγύλευσης Στη συγκεκριμένη ενότητα εξετάζουμε θέματα σχετικά με την αριθμητική πεπερασμένης ακρίβειας που χρησιμοποιούν οι σημερινοί υπολογιστές και τα

Διαβάστε περισσότερα

Εξόρυξη γνώμης πολιτών από ελεύθερο κείμενο

Εξόρυξη γνώμης πολιτών από ελεύθερο κείμενο Δίκαρος Νίκος Δ/νση Μηχανογράνωσης κ Η.Ε.Σ. Υπουργείο Εσωτερικών. Τελική εργασία Κ Εκπαιδευτικής Σειράς Ε.Σ.Δ.Δ. Επιβλέπων: Ηρακλής Βαρλάμης Εξόρυξη γνώμης πολιτών από ελεύθερο κείμενο Κεντρική ιδέα Προβληματισμοί

Διαβάστε περισσότερα

Αριθμητική Ανάλυση και Εφαρμογές

Αριθμητική Ανάλυση και Εφαρμογές Αριθμητική Ανάλυση και Εφαρμογές Διδάσκων: Δημήτριος Ι. Φωτιάδης Τμήμα Μηχανικών Επιστήμης Υλικών Ιωάννινα 07-08 Αριθμητική Ολοκλήρωση Εισαγωγή Έστω ότι η f είναι μία φραγμένη συνάρτηση στο πεπερασμένο

Διαβάστε περισσότερα

Υπολογιστική Νοημοσύνη. Μάθημα 9: Γενίκευση

Υπολογιστική Νοημοσύνη. Μάθημα 9: Γενίκευση Υπολογιστική Νοημοσύνη Μάθημα 9: Γενίκευση Υπερπροσαρμογή (Overfitting) Ένα από τα βασικά προβλήματα που μπορεί να εμφανιστεί κατά την εκπαίδευση νευρωνικών δικτύων είναι αυτό της υπερβολικής εκπαίδευσης.

Διαβάστε περισσότερα

Δειγματοληψία στην Ερευνα. Ετος

Δειγματοληψία στην Ερευνα. Ετος ΓΕΩΠΟΝΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ Τμήμα Αγροτικής Οικονομίας & Ανάπτυξης Μέθοδοι Γεωργοοικονομικής και Κοινωνιολογικής Ερευνας Δειγματοληψία στην Έρευνα (Μέθοδοι Δειγματοληψίας - Τρόποι Επιλογής Τυχαίου Δείγματος)

Διαβάστε περισσότερα

Κατανεμημένα Συστήματα Ι

Κατανεμημένα Συστήματα Ι Κατανεμημένα Συστήματα Ι Παναγιώτα Παναγοπούλου 11η Διάλεξη 12 Ιανουαρίου 2017 1 Ανεξάρτητο σύνολο Δοθέντος ενός μη κατευθυνόμενου γραφήματος G = (V, E), ένα ανεξάρτητο σύνολο (independent set) είναι ένα

Διαβάστε περισσότερα

Αναγνώριση Προτύπων Ι

Αναγνώριση Προτύπων Ι Αναγνώριση Προτύπων Ι Ενότητα 2: Δομικά Συστήματα Αν. Καθηγητής Δερματάς Ευάγγελος Τμήμα Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες

Διαβάστε περισσότερα

Αναγνώριση Προτύπων (Pattern Recognition) Μπεϋζιανή Θεωρία Αποφάσεων (Bayesian Decision Theory) Π. Τσακαλίδης

Αναγνώριση Προτύπων (Pattern Recognition) Μπεϋζιανή Θεωρία Αποφάσεων (Bayesian Decision Theory) Π. Τσακαλίδης Αναγνώριση Προτύπων (Pattern Recognton Μπεϋζιανή Θεωρία Αποφάσεων (Bayesan Decson Theory Π. Τσακαλίδης ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ ΤΜΗΜΑ ΕΠΙΣΤΗΜΗΣ ΥΠΟΛΟΓΙΣΤΩΝ Μπεϋζιανή Θεωρία Αποφάσεων (Bayes Decson theory Στατιστικά

Διαβάστε περισσότερα

Στατιστική Ι (ΨΥΧ-1202) ιάλεξη 3

Στατιστική Ι (ΨΥΧ-1202) ιάλεξη 3 (ΨΥΧ-1202) Λεωνίδας Α. Ζαμπετάκης Β.Sc., M.Env.Eng., M.Ind.Eng., D.Eng. Εmail: statisticsuoc@gmail.com ιαλέξεις: ftp://ftp.soc.uoc.gr/psycho/zampetakis/ ιάλεξη 3 ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ ΤΜΗΜΑ ΨΥΧΟΛΟΓΙΑΣ Ρέθυμνο,

Διαβάστε περισσότερα

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων

Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ Αποθήκες Δεδομένων και Εξόρυξη Δεδομένων Ενότητα 5: Κατηγοριοποίηση Μέρος Α Αναστάσιος Γούναρης, Επίκουρος Καθηγητής Άδειες Χρήσης Το

Διαβάστε περισσότερα

ΗΥ562 Προχωρημένα Θέματα Βάσεων Δεδομένων Efficient Query Evaluation over Temporally Correlated Probabilistic Streams

ΗΥ562 Προχωρημένα Θέματα Βάσεων Δεδομένων Efficient Query Evaluation over Temporally Correlated Probabilistic Streams ΗΥ562 Προχωρημένα Θέματα Βάσεων Δεδομένων Efficient Query Evaluation over Temporally Correlated Probabilistic Streams Αλέκα Σεληνιωτάκη Ηράκλειο, 26/06/12 aseliniotaki@csd.uoc.gr ΑΜ: 703 1. Περίληψη Συνεισφοράς

Διαβάστε περισσότερα

ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ

ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΚΑΙ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ Δ.Π.Μ.Σ. ΕΦΑΡΜΟΣΜΕΝΕΣ ΜΑΘΗΜΑΤΙΚΕΣ ΕΠΙΣΤΗΜΕΣ ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΤΕΛΙΚΗ ΕΡΓΑΣΙΑ ΧΟΥΧΟΥΜΗΣ ΙΩΑΝΝΗΣ Το σύνολο των

Διαβάστε περισσότερα

Θεώρημα Βolzano. Κατηγορία 1 η. 11.1 Δίνεται η συνάρτηση:

Θεώρημα Βolzano. Κατηγορία 1 η. 11.1 Δίνεται η συνάρτηση: Κατηγορία η Θεώρημα Βolzano Τρόπος αντιμετώπισης:. Όταν μας ζητούν να εξετάσουμε αν ισχύει το θεώρημα Bolzano για μια συνάρτηση f σε ένα διάστημα [, ] τότε: Εξετάζουμε την συνέχεια της f στο [, ] (αν η

Διαβάστε περισσότερα

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 22 Μαΐου /32

Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπισ τήμιο Κρήτης 22 Μαΐου /32 Εφαρμοσμένη Στατιστική Δημήτριος Μπάγκαβος Τμήμα Μαθηματικών και Εφαρμοσμένων Μαθηματικών Πανεπιστήμιο Κρήτης 22 Μαΐου 2017 1/32 Εισαγωγή: Τυπικό παράδειγμα στατιστικού ελέγχου υποθέσεων. Ενας νέος τύπος

Διαβάστε περισσότερα

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R, Επίκουρος Καθηγητής, Τομέας Μαθηματικών, Σχολή Εφαρμοσμένων Μαθηματικών και Φυσικών Επιστημών, Εθνικό Μετσόβιο Πολυτεχνείο. Περιεχόμενα Εισαγωγή στο

Διαβάστε περισσότερα

Αριθμητική εύρεση ριζών μη γραμμικών εξισώσεων

Αριθμητική εύρεση ριζών μη γραμμικών εξισώσεων Αριθμητική εύρεση ριζών μη γραμμικών εξισώσεων Με τον όρο μη γραμμικές εξισώσεις εννοούμε εξισώσεις της μορφής: f( ) 0 που προέρχονται από συναρτήσεις f () που είναι μη γραμμικές ως προς. Περιέχουν δηλαδή

Διαβάστε περισσότερα

Στάδιο Εκτέλεσης

Στάδιο Εκτέλεσης 16 ΚΕΦΑΛΑΙΟ 1Ο 1.4.2.2 Στάδιο Εκτέλεσης Το στάδιο της εκτέλεσης μίας έρευνας αποτελεί αυτό ακριβώς που υπονοεί η ονομασία του. Δηλαδή, περιλαμβάνει όλες εκείνες τις ενέργειες από τη στιγμή που η έρευνα

Διαβάστε περισσότερα

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2 Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας Verson 2 1 ΧΑΡΤΟΓΡΑΦΗΣΗ ΤΟΥ ΧΩΡΟΥ ΤΩΝ ΤΑΞΙΝΟΜΗΤΩΝ Ταξινομητές Ταξινομητές συναρτ. διάκρισης Ταξινομητές επιφανειών απόφ. Παραμετρικοί ταξινομητές Μη παραμετρικοί

Διαβάστε περισσότερα

Μαθηματικά. Ενότητα 2: Διαφορικός Λογισμός. Σαριαννίδης Νικόλαος Τμήμα Διοίκησης Επιχειρήσεων (Κοζάνη)

Μαθηματικά. Ενότητα 2: Διαφορικός Λογισμός. Σαριαννίδης Νικόλαος Τμήμα Διοίκησης Επιχειρήσεων (Κοζάνη) Μαθηματικά Ενότητα 2: Διαφορικός Λογισμός Σαριαννίδης Νικόλαος Τμήμα Διοίκησης Επιχειρήσεων (Κοζάνη) Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για εκπαιδευτικό

Διαβάστε περισσότερα

Αναγνώριση Προτύπων Εργασία 1η Classification

Αναγνώριση Προτύπων Εργασία 1η Classification ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΤΜΗΜΑ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ & ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ Αναγνώριση Προτύπων Εργασία 1η Classification Κιντσάκης Αθανάσιος 6667 Μόσχογλου Στυλιανός 6978 30 Νοεμβρίου,

Διαβάστε περισσότερα

Πανεπιστήµιο Κύπρου Πολυτεχνική Σχολή

Πανεπιστήµιο Κύπρου Πολυτεχνική Σχολή Πανεπιστήµιο Κύπρου Πολυτεχνική Σχολή Τµήµα Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών ΗΜΜΥ 795: ΑΝΑΓΝΩΡΙΣΗ ΠΡΟΤΥΠΩΝ Ακαδηµαϊκό έτος 2010-11 Χειµερινό Εξάµηνο Τελική εξέταση Τρίτη, 21 εκεµβρίου 2010,

Διαβάστε περισσότερα

Δρ. Βασίλειος Γ. Καμπουρλάζος Δρ. Ανέστης Γ. Χατζημιχαηλίδης

Δρ. Βασίλειος Γ. Καμπουρλάζος Δρ. Ανέστης Γ. Χατζημιχαηλίδης Μάθημα 5 ο Δρ. Ανέστης Γ. Χατζημιχαηλίδης Τμήμα Μηχανικών Πληροφορικής Τ.Ε. ΤΕΙ Ανατολικής Μακεδονίας και Θράκης 2016-2017 Διευρυμένη Υπολογιστική Νοημοσύνη (ΥΝ) Επεκτάσεις της Κλασικής ΥΝ. Μεθοδολογίες

Διαβάστε περισσότερα

Ασκήσεις Φροντιστηρίου «Υπολογιστική Νοημοσύνη Ι» 5 o Φροντιστήριο

Ασκήσεις Φροντιστηρίου «Υπολογιστική Νοημοσύνη Ι» 5 o Φροντιστήριο Πρόβλημα ο Ασκήσεις Φροντιστηρίου 5 o Φροντιστήριο Δίνεται το παρακάτω σύνολο εκπαίδευσης: # Είσοδος Κατηγορία 0 0 0 Α 2 0 0 Α 0 Β 4 0 0 Α 5 0 Β 6 0 0 Α 7 0 Β 8 Β α) Στον παρακάτω κύβο τοποθετείστε τα

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 6-7 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Λέκτορας v.koutras@fme.aegea.gr Τηλ: 735468 Σε αρκετές εφαρμογές

Διαβάστε περισσότερα

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

Σ ΤΑΤ Ι Σ Τ Ι Κ Η ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ Σ ΤΑΤ Ι Σ Τ Ι Κ Η i ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ Κατανομή Δειγματοληψίας του Δειγματικού Μέσου Ο Δειγματικός Μέσος X είναι μια Τυχαία Μεταβλητή. Καθώς η επιλογή και χρήση διαφορετικών δειγμάτων από έναν

Διαβάστε περισσότερα

Απλή Γραμμική Παλινδρόμηση I

Απλή Γραμμική Παλινδρόμηση I Απλή Γραμμική Παλινδρόμηση I. Εισαγωγή Έστω ότι θέλουμε να ερευνήσουμε εμπειρικά τη σχέση που υπάρχει ανάμεσα στις δαπάνες κατανάλωσης και στο διαθέσιμο εισόδημα, των οικογενειών. Σύμφωνα με την Κεϋνσιανή

Διαβάστε περισσότερα

Χαλκίδης Νέστωρας, Τσαγιοπούλου Μαρία, Παπακωνσταντίνου Νίκος, Μωυσιάδης Θεόδωρος. Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης 2016

Χαλκίδης Νέστωρας, Τσαγιοπούλου Μαρία, Παπακωνσταντίνου Νίκος, Μωυσιάδης Θεόδωρος. Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης 2016 Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης 2016 Χαλκίδης Νέστωρας, Τσαγιοπούλου Μαρία, Παπακωνσταντίνου Νίκος, Μωυσιάδης Θεόδωρος Η παρούσα εργασία έγινε στα πλαίσια της εκπόνησης της διπλωματικής διατριβής

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 08-09 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Επικ. Καθηγητής v.koutras@fme.aegea.gr Τηλ: 7035468 Εκτίμηση Διαστήματος

Διαβάστε περισσότερα

Ακαδημαϊκό Έτος , Χειμερινό Εξάμηνο Διδάσκων Καθ.: Νίκος Τσαπατσούλης

Ακαδημαϊκό Έτος , Χειμερινό Εξάμηνο Διδάσκων Καθ.: Νίκος Τσαπατσούλης ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΛΟΠΟΝΝΗΣΟΥ, ΤΜΗΜΑ ΤΕΧΝΟΛΟΓΙΑΣ ΤΗΛΕΠΙΚΟΙΝΩΝΙΩΝ ΚΕΣ 3: ΑΝΑΓΝΩΡΙΣΗ ΠΡΟΤΥΠΩΝ ΚΑΙ ΑΝΑΛΥΣΗ ΕΙΚΟΝΑΣ Ακαδημαϊκό Έτος 7 8, Χειμερινό Εξάμηνο Καθ.: Νίκος Τσαπατσούλης ΕΡΩΤΗΣΕΙΣ ΕΠΑΝΑΛΗΨΗΣ Το παρόν

Διαβάστε περισσότερα

Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 5: Εύρεση σημείων ισορροπίας σε παίγνια μηδενικού αθροίσματος. Ε. Μαρκάκης. Επικ. Καθηγητής

Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 5: Εύρεση σημείων ισορροπίας σε παίγνια μηδενικού αθροίσματος. Ε. Μαρκάκης. Επικ. Καθηγητής Θεωρία Παιγνίων και Αποφάσεων Ενότητα 5: Εύρεση σημείων ισορροπίας σε παίγνια μηδενικού αθροίσματος Ε. Μαρκάκης Επικ. Καθηγητής Περίληψη Παίγνια μηδενικού αθροίσματος PessimisIc play Αμιγείς max-min και

Διαβάστε περισσότερα

ΘΕΩΡΙΑ ΑΠΟΦΑΣΕΩΝ 3 ο ΦΡΟΝΤΙΣΤΗΡΙΟ ΛΥΣΕΙΣ ΤΩΝ ΑΣΚΗΣΕΩΝ

ΘΕΩΡΙΑ ΑΠΟΦΑΣΕΩΝ 3 ο ΦΡΟΝΤΙΣΤΗΡΙΟ ΛΥΣΕΙΣ ΤΩΝ ΑΣΚΗΣΕΩΝ ΘΕΩΡΙΑ ΑΠΟΦΑΣΕΩΝ 3 ο ΦΡΟΝΤΙΣΤΗΡΙΟ ΛΥΣΕΙΣ ΤΩΝ ΑΣΚΗΣΕΩΝ ΑΣΚΗΣΗ Σύμφωνα με στοιχεία από το Πανεπιστήμιο της Οξφόρδης η πιθανότητα ένας φοιτητής να αποφοιτήσει μέσα σε 5 χρόνια από την ημέρα εγγραφής του στο

Διαβάστε περισσότερα

Διαχρονικές δομές δεδομένων

Διαχρονικές δομές δεδομένων Διαχρονικές δομές δεδομένων Μια τυπική δομή δεδομένων μεταβάλλεται με πράξεις εισαγωγής ή διαγραφής Π.χ. κοκκινόμαυρο δένδρο εισαγωγή 0 18 0 5 39 73 1 46 6 80 Αποκατάσταση ισορροπίας 5 39 73 0 46 6 80

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ. 1. Εισαγωγή Συνεχής ποσοτική εξαρτημένη μεταβλητή...66 Ενδεικτική εφαρμογή...68 ΛΙΓΑ ΛΟΓΙΑ ΓΙΑ ΤΟΥΣ ΣΥΓΓΡΑΦΕΙΣ...

ΠΕΡΙΕΧΟΜΕΝΑ. 1. Εισαγωγή Συνεχής ποσοτική εξαρτημένη μεταβλητή...66 Ενδεικτική εφαρμογή...68 ΛΙΓΑ ΛΟΓΙΑ ΓΙΑ ΤΟΥΣ ΣΥΓΓΡΑΦΕΙΣ... ΠΕΡΙΕΧΟΜΕΝΑ ΛΙΓΑ ΛΟΓΙΑ ΓΙΑ ΤΟΥΣ ΣΥΓΓΡΑΦΕΙΣ...................................... 11 ΠΡΟΛΟΓΟΣ..........................................................15 1. ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΕΠΙΧΕΙΡΗΣΙΑΚΗ ΑΝΑΛΥΤΙΚΗ, ΣΤΑ ΠΟΣΟΤΙΚΑ

Διαβάστε περισσότερα

Λίγα λόγια για τους συγγραφείς 16 Πρόλογος 17

Λίγα λόγια για τους συγγραφείς 16 Πρόλογος 17 Περιεχόμενα Λίγα λόγια για τους συγγραφείς 16 Πρόλογος 17 1 Εισαγωγή 21 1.1 Γιατί χρησιμοποιούμε τη στατιστική; 21 1.2 Τι είναι η στατιστική; 22 1.3 Περισσότερα για την επαγωγική στατιστική 23 1.4 Τρεις

Διαβάστε περισσότερα

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2 Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας Verson ΜΙΑ ΣΥΜΒΑΣΗ: Προκειμένου να καταστήσουμε πιο συμπαγή το συμβολισμό H : ορίζουμε Ετσι έχουμε *=[ ] an *=[ ]. H : * * ΣΗΜΕΙΩΣΗ: Στη συνέχεια εκτός αν ορίζεται

Διαβάστε περισσότερα

Διακριτά Μαθηματικά ΙΙ Χρήστος Νομικός Τμήμα Μηχανικών Η/Υ και Πληροφορικής Πανεπιστήμιο Ιωαννίνων 2018 Χρήστος Νομικός ( Τμήμα Μηχανικών Η/Υ Διακριτά

Διακριτά Μαθηματικά ΙΙ Χρήστος Νομικός Τμήμα Μηχανικών Η/Υ και Πληροφορικής Πανεπιστήμιο Ιωαννίνων 2018 Χρήστος Νομικός ( Τμήμα Μηχανικών Η/Υ Διακριτά Διακριτά Μαθηματικά ΙΙ Χρήστος Νομικός Τμήμα Μηχανικών Η/Υ και Πληροφορικής Πανεπιστήμιο Ιωαννίνων 2018 Χρήστος Νομικός ( Τμήμα Μηχανικών Η/Υ Διακριτά και Πληροφορικής Μαθηματικά Πανεπιστήμιο ΙΙ Ιωαννίνων

Διαβάστε περισσότερα

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2 Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας Verson 2 1 M = 1 N = N prob k N k { k n ω wrongly classfed} = (1 ) N k 2 Η συνάρτηση πιθανοφάνειας L(p) μεγιστοποιείται όταν =k/n. 3 Αφού τα s είναι άγνωστα,

Διαβάστε περισσότερα

Διαίρει και Βασίλευε. πρόβλημα μεγέθους Ν. διάσπαση. πρόβλημα μεγέθους k. πρόβλημα μεγέθους Ν-k

Διαίρει και Βασίλευε. πρόβλημα μεγέθους Ν. διάσπαση. πρόβλημα μεγέθους k. πρόβλημα μεγέθους Ν-k Διαίρει και Βασίλευε πρόβλημα μεγέθους Ν διάσπαση πρόβλημα μεγέθους k πρόβλημα μεγέθους Ν-k Διαίρει και Βασίλευε πρόβλημα μεγέθους Ν διάσπαση επιλύουμε αναδρομικά τα υποπροβλήματα πρόβλημα μεγέθους k πρόβλημα

Διαβάστε περισσότερα

Μέρος Β /Στατιστική. Μέρος Β. Στατιστική. Γεωπονικό Πανεπιστήμιο Αθηνών Εργαστήριο Μαθηματικών&Στατιστικής/Γ. Παπαδόπουλος (www.aua.

Μέρος Β /Στατιστική. Μέρος Β. Στατιστική. Γεωπονικό Πανεπιστήμιο Αθηνών Εργαστήριο Μαθηματικών&Στατιστικής/Γ. Παπαδόπουλος (www.aua. Μέρος Β /Στατιστική Μέρος Β Στατιστική Γεωπονικό Πανεπιστήμιο Αθηνών Εργαστήριο Μαθηματικών&Στατιστικής/Γ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) Από τις Πιθανότητες στη Στατιστική Στα προηγούμενα, στο

Διαβάστε περισσότερα

Εισαγωγή στη Διαδικασία Ιεραρχικής Ανάλυσης. Ρόκου Έλενα Μεταδιδακτορική Ερευνήτρια ΕΜΠ Κηρυττόπουλος Κωνσταντίνος Επ.

Εισαγωγή στη Διαδικασία Ιεραρχικής Ανάλυσης. Ρόκου Έλενα Μεταδιδακτορική Ερευνήτρια ΕΜΠ Κηρυττόπουλος Κωνσταντίνος Επ. Εισαγωγή στη Διαδικασία Ιεραρχικής Ανάλυσης Ρόκου Έλενα Μεταδιδακτορική Ερευνήτρια ΕΜΠ Κηρυττόπουλος Κωνσταντίνος Επ. Καθηγητής ΕΜΠ Άδεια Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 06-07 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Λέκτορας v.koutras@fme.aegea.gr Τηλ: 7035468 Εκτίμηση Διαστήματος

Διαβάστε περισσότερα

Κεφάλαιο 10 Εισαγωγή στην Εκτίμηση

Κεφάλαιο 10 Εισαγωγή στην Εκτίμηση Κεφάλαιο 10 Εισαγωγή στην Εκτίμηση Εκεί που είμαστε Κεφάλαια 7 και 8: Οι διωνυμικές,κανονικές, εκθετικές κατανομές και κατανομές Poisson μας επιτρέπουν να κάνουμε διατυπώσεις πιθανοτήτων γύρω από το Χ

Διαβάστε περισσότερα

Διακριτά Μαθηματικά ΙΙ Χρήστος Νομικός Τμήμα Μηχανικών Η/Υ και Πληροφορικής Πανεπιστήμιο Ιωαννίνων 2018 Χρήστος Νομικός ( Τμήμα Μηχανικών Η/Υ Διακριτά

Διακριτά Μαθηματικά ΙΙ Χρήστος Νομικός Τμήμα Μηχανικών Η/Υ και Πληροφορικής Πανεπιστήμιο Ιωαννίνων 2018 Χρήστος Νομικός ( Τμήμα Μηχανικών Η/Υ Διακριτά Διακριτά Μαθηματικά ΙΙ Χρήστος Νομικός Τμήμα Μηχανικών Η/Υ και Πληροφορικής Πανεπιστήμιο Ιωαννίνων 2018 Χρήστος Νομικός ( Τμήμα Μηχανικών Η/Υ Διακριτά και Πληροφορικής Μαθηματικά Πανεπιστήμιο ΙΙ Ιωαννίνων

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΟΧΑΣΤΙΚΑ ΜΟΝΤΕΛΑ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΟΧΑΣΤΙΚΑ ΜΟΝΤΕΛΑ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΟΧΑΣΤΙΚΑ ΜΟΝΤΕΛΑ Ακαδ. Έτος 06-07 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Λέκτορας v.outras@fme.aegean.gr Τηλ: 7035468 σ-άλγεβρα

Διαβάστε περισσότερα

Αποθήκες εδομένων και Εξόρυξη εδομένων:

Αποθήκες εδομένων και Εξόρυξη εδομένων: Αποθήκες εδομένων και Εξόρυξη εδομένων: Κατηγοριοποίηση: Μέρος Α http://delab.csd.auth.gr/~gounaris/courses/dwdm/ gounaris/courses/dwdm/ Ευχαριστίες Οι διαφάνειες του μαθήματος σε γενικές γραμμές ακολουθούν

Διαβάστε περισσότερα

Κεφ. 6Β: Συνήθεις διαφορικές εξισώσεις (ΣΔΕ) - προβλήματα αρχικών τιμών

Κεφ. 6Β: Συνήθεις διαφορικές εξισώσεις (ΣΔΕ) - προβλήματα αρχικών τιμών Κεφ. 6Β: Συνήθεις διαφορικές εξισώσεις (ΣΔΕ) - προβλήματα αρχικών τιμών. Εισαγωγή (ορισμός προβλήματος, αριθμητική ολοκλήρωση ΣΔΕ, αντικατάσταση ΣΔΕ τάξης n με n εξισώσεις ης τάξης). Μέθοδος Euler 3. Μέθοδοι

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΣΧΟΛΗ ΕΠΙΣΤΗΜΩΝ ΤΗΣ ΔΙΟΙΚΗΣΗΣ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 5-6 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Λέκτορας v.koutras@fme.aegea.gr Τηλ: 735468 Σε αρκετές εφαρμογές

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 7-8 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Επικ. Καθηγητής v.koutras@fme.aegea.gr Τηλ: 735468 Σε αρκετές εφαρμογές

Διαβάστε περισσότερα

Πανεπιστήμιο Κύπρου Πολυτεχνική Σχολή

Πανεπιστήμιο Κύπρου Πολυτεχνική Σχολή Πανεπιστήμιο Κύπρου Πολυτεχνική Σχολή Τμήμα Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών ΗΜΜΥ 795: ΑΝΑΓΝΩΡΙΣΗ ΠΡΟΤΥΠΩΝ Ακαδημαϊκό έτος 2010-11 Χειμερινό Εξάμηνο Practice final exam 1. Έστω ότι για

Διαβάστε περισσότερα

ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ ΚΕΦΑΛΑΙΟ 17

ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ ΚΕΦΑΛΑΙΟ 17 ΚΕΦΑΛΑΙΟ 17 ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ Στο κεφάλαιο αυτό θα αναφερθούμε σε ένα άλλο πρόβλημα της Στατιστικής που έχει κυρίως (αλλά όχι μόνο) σχέση με τις παραμέτρους ενός πληθυσμού (τις παραμέτρους της κατανομής

Διαβάστε περισσότερα

Δέντρα Απόφασης (Decision(

Δέντρα Απόφασης (Decision( Δέντρα Απόφασης (Decision( Trees) Το μοντέλο που δημιουργείται είναι ένα δέντρο Χρήση της τεχνικής «διαίρει και βασίλευε» για διαίρεση του χώρου αναζήτησης σε υποσύνολα (ορθογώνιες περιοχές) Ένα παράδειγμα

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 2 ΑΝΑΣΚΟΠΗΣΗ ΑΠΑΡΑΙΤΗΤΩΝ ΓΝΩΣΕΩΝ: ΕΚΤΙΜΗΤΕΣ

ΚΕΦΑΛΑΙΟ 2 ΑΝΑΣΚΟΠΗΣΗ ΑΠΑΡΑΙΤΗΤΩΝ ΓΝΩΣΕΩΝ: ΕΚΤΙΜΗΤΕΣ ΚΕΦΑΛΑΙΟ ΑΝΑΣΚΟΠΗΣΗ ΑΠΑΡΑΙΤΗΤΩΝ ΓΝΩΣΕΩΝ: ΕΚΤΙΜΗΤΕΣ Ως γνωστό δείγμα είναι ένα σύνολο παρατηρήσεων από ένα πληθυσμό. Αν ο πληθυσμός αυτός θεωρηθεί μονοδιάστατος τότε μπορεί να εκφρασθεί με τη συνάρτηση

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΙΓΑΙΟΥ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΙΚΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΔΙΟΙΚΗΣΗΣ ΣΤΑΤΙΣΤΙΚΗ Ακαδ. Έτος 07-08 Διδάσκων: Βασίλης ΚΟΥΤΡΑΣ Επικ. Καθηγητής v.koutras@fme.aegea.gr Τηλ: 7035468 Θα μελετήσουμε

Διαβάστε περισσότερα

ΦΙΛΤΡΟ KALMAN ΔΙΑΚΡΙΤΟΥ ΧΡΟΝΟΥ

ΦΙΛΤΡΟ KALMAN ΔΙΑΚΡΙΤΟΥ ΧΡΟΝΟΥ 1 ΦΙΛΤΡΟ KALMAN ΔΙΑΚΡΙΤΟΥ ΧΡΟΝΟΥ Σε αυτό το μέρος της πτυχιακής θα ασχοληθούμε λεπτομερώς με το φίλτρο kalman και θα δούμε μια καινούρια έκδοση του φίλτρου πάνω στην εφαρμογή της γραμμικής εκτίμησης διακριτού

Διαβάστε περισσότερα

3. O ΑΛΓΟΡΙΘΜΟΣ ΤΟΥ PERCEPTRON

3. O ΑΛΓΟΡΙΘΜΟΣ ΤΟΥ PERCEPTRON 3. O ΑΛΓΟΡΙΘΜΟΣ ΤΟΥ PERCEPRON 3. ΕΙΣΑΓΩΓΗ: Το Perceptron είναι η απλούστερη μορφή Νευρωνικού δικτύου, το οποίο χρησιμοποιείται για την ταξινόμηση ενός ειδικού τύπου προτύπων, που είναι γραμμικά διαχωριζόμενα.

Διαβάστε περισσότερα