Π ΤΥΧΙΑΚΗ/ Δ ΙΠΛΩΜΑΤΙΚΗ Ε ΡΓΑΣΙΑ

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "Π ΤΥΧΙΑΚΗ/ Δ ΙΠΛΩΜΑΤΙΚΗ Ε ΡΓΑΣΙΑ"

Transcript

1 Α ΡΙΣΤΟΤΕΛΕΙΟ Π ΑΝΕΠΙΣΤΗΜΙΟ Θ ΕΣΣΑΛΟΝΙΚΗΣ ΣΧΟΛΗ ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Π ΤΥΧΙΑΚΗ/ Δ ΙΠΛΩΜΑΤΙΚΗ Ε ΡΓΑΣΙΑ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΚΑΙ ΠΡΟΒΛΕΨΗ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΑΓΩΝΩΝ ΠΟΔΟΣΦΑΙΡΟΥ ΠΑΥΛΟΣ ΠΟΛΙΑΝΙΔΗΣ Α.Ε.Μ: 1586 ΕΠΙΒΛΕΠΩΝ ΚΑΘΗΓΗΤΗΣ: Γρηγόριος Τσουμάκας, Λέκτορας ΘΕΣΣΑΛΟΝΙΚΗ ΙΟΥΛΙΟΣ 2010

2

3

4

5

6

7 ΠΕΡΙΛΗΨΗ Π ΕΡΙΛΗΨΗ Το αντικείμενο της παρούσας πτυχιακής εργασίας είναι η στατιστική ανάλυση καθώς και η πρόβλεψη αγώνων ποδοσφαίρου. Το πρώτο κομμάτι της εργασίας αφορά την συγκέντρωση πληροφοριών σχετικά με αγώνες ποδοσφαίρου από όλο τον κόσμο (όπως αποτελέσματα, ημερομηνία, σκορ ημιχρόνου, πρωτάθλημα κ.α. ) καθώς επίσης και τις αποδόσεις στοιχήματος στους αγώνες αυτούς. Τα δεδομένα συλλέγονται με αυτόματο τρόπο από αρχεία XML που είναι διαθέσιμα στον ιστότοπο του ΟΠΑΠ και αποθηκεύονται σε μια βάση δεδομένων. Στο δεύτερο κομμάτι της εργασίας γίνεται μια προσπάθεια πρόβλεψης των αποτελεσμάτων των αγώνων, χρησιμοποιώντας τις πληροφορίες που συγκεντρώσαμε και είναι αποθηκευμένες στην βάση δεδομένων. Πρόκειται ουσιαστικά, για εφαρμογή αλγορίθμων μηχανικής μάθησης και συγκεκριμένα αλγορίθμων ταξινόμησης (classification algorithms) ώστε να γίνει η κατάταξη των επικείμενων αγώνων ποδοσφαίρου σε μια από τις τρείς κατηγορίες ( νίκη γηπεδούχου ομάδας, ισοπαλία, νίκη φιλοξενούμενης ομάδας), σύμφωνα με την δυναμική των ομάδων. Το πρόβλημα αυτό ανήκει στην κατηγορία των προβλημάτων ταξινόμησης, στα οποία δεν μας ενδιαφέρει απλώς να κατατάξουμε ένα στιγμιότυπο (instance) σε κάποια από τις εναλλακτικές κλάσεις (classification labels), αλλά μας ενδιαφέρει και το κόστος ( ή ανάλογα το κέρδος ) που θα έχουμε από αυτήν την κατηγοριοποίηση. Οι αλγόριθμοι αυτή, λαμβάνουν υπ όψιν το κόστος της σωστής πρόβλεψης καθώς και το κόστος της λανθασμένης πρόβλεψης (misclassification cost) ώστε να πετύχουν όσο το δυνατόν πιο ιδανική πρόβλεψη. Το είδος αυτό της μάθησης, ονομάζεται costsensitive machine learning[5,3]. Το σύνολο των παραπάνω αλγορίθμων, ανήκει στην κατηγορία των λεγόμενων αλγορίθμων μάθησης που είναι ευαίσθητοι ως προς το κόστος (cost-sensitive learning algorithms). Αποτελεί έναν νέο τομέα της μηχανικής μάθησης γύρω από τον οποίο γίνεται πολύ έρευνα, γιατί καθίσταται όλο και πιο φανερό ότι οι περισσότερες εφαρμογές μηχανικής μάθησης, πλέον απαιτούν τη χρήση cost-sensitive αλγορίθμων, οι οποίοι θα εξετάζουν τον κίνδυνο που εγκυμονεί η πρόβλεψη που θα κάνουν. Στις σελίδες που ακολουθούν θα δείξουμε πώς θα εφαρμόσουμε cost-sensitive algorithms with different cost per instance (όπου το κόστος κατηγοριοποίησης είναι διαφορετικό για κάθε στιγμιότυπο ) πάνω στο δικό μας πρόβλημα. ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΚΑΙ ΠΡΟΒΛΕΨΗ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΑΓΩΝΩΝ ΠΟΔΟΣΦΑΙΡΟΥ VII

8

9 ΕΥΧΑΡΙΣΤΙΕΣ Ε ΥΧΑΡΙΣΤΙΕΣ Καταρχάς θα ήθελα να εκφράσω τις αληθινές μου ευχαριστίες στον επιβλέπων της πτυχιακής εργασίας κ. Τσουμάκα Γρηγόριο, Λέκτορα του τμήματος πληροφορικής του Αριστοτέλειου πανεπιστημίου, για την εμπιστοσύνη μου έδειξε κατά την ανάθεση της παρούσας πτυχιακής, αλλά και την αμέριστη συμπαράσταση καθ όλη τη διάρκεια της εκπόνησης της. Τέλος θα ήθελα να ευχαριστήσω του γονείς μου, για όλη τη βοήθεια τόσο ψυχολογική όσο και οικονομική, που μου προσέφεραν όλα αυτά τα χρόνια Πολιανίδης Παύλος ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΚΑΙ ΠΡΟΒΛΕΨΗ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΑΓΩΝΩΝ ΠΟΔΟΣΦΑΙΡΟΥ VIII

10

11 ΠΕΡΙΕΧΟΜΕΝΑ Π ΕΡΙΕΧΟΜΕΝΑ ΠΕΡΙΛΗΨΗ... VII ΕΥΧΑΡΙΣΤΙΕΣ... VIII ΠΕΡΙΕΧΟΜΕΝΑ... IX ΛΙΣΤΑ ΣΧΗΜΑΤΩΝ... XII ΛΙΣΤΑ ΠΙΝΑΚΩΝ... XIII ΚΕΦΑΛΑΙΟ 1: ΕΙΣΑΓΩΓΗ ΚΕΦΑΛΑΙΟ 2: ΑΛΓΟΡΙΘΜΟΙ ΜΗΑΧΑΝΙΚΗΣ ΜΑΘΗΣΗΣ ΤΑΞΙΝΟΜΗΣΗ ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ... ERROR! BOOKMARK NOT DEFINED ΒΗΜΑΤΑ ΕΚΤΕΛΕΣΗΣ ΑΠΟΤΙΜΗΣΗ ΑΚΡΙΒΕΙΑΣ ΜΕΘΟΔΟΙ ΑΠΟΤΙΜΗΣΗΣ ΑΚΡΙΒΕΙΑΣ HOLD-OUT ΤΥΧΑΙΑ ΔΕΙΓΜΑΤΟΛΗΨΙΑ(RANDOM SAMPLING) ΠΟΛΛΑΠΛΗ ΔΙΑ-ΕΓΚΥΡΟΠΟΙΗΣΗ BOOT-STRAP ΑΛΓΟΡΙΘΜΟΙ ΤΑΞΙΝΟΜΗΣΗΣ C BEST-FIRST DECISION TREES LADTREE BOOSTING BAYESIAN CLASSIFIER ΘΕΩΡΗΜΑ BAYES ΑΦΕΛΗΣ BAYES (NAÏVE BAYES) ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΚΑΙ ΠΡΟΒΛΕΨΗ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΑΓΩΝΩΝ ΠΟΔΟΣΦΑΙΡΟΥ IX

12 ΠΑΥΛΟΣ ΠΟΛΙΑΝΙΔΗΣ SUPPORT VECTOR MACHINES ΓΡΑΜΜΙΚΩΣ ΔΙΑΧΩΡΙΣΗΜΑ ΔΕΔΟΜΕΝΑ COST-SENSITIVE ΜΑΘΗΣΗ ΠΕΡΙΓΡΑΦΗ COST-SENSITIVE ΜΑΘΗΣΗΣ ΠΛΑΙΣΙΟ ΛΕΙΤΟΥΡΓΙΑΣ COST-SENSITIVE ΜΑΘΗΣΗΣ COST-SENSITIVE ΑΛΓΟΡΙΘΜΟΙ METACOST CSROULETTE ΑΞΙΟΛΟΓΗΣΗ COST-SENSITIVE ΚΑΤΗΓΟΡΙΟΠΟΙΗΤΩΝ ΚΕΦΑΛΑΙΟ 3: Η ΕΦΑΡΜΟΓΗ ΕΙΣΑΓΩΓΗ ΠΕΡΙΓΡΑΦΗ ΤΟΥ ΠΡΟΒΛΗΜΑΤΟΣ ΑΡΧΙΤΕΚΤΟΝΙΚΗ ΤΟΥ ΣΥΣΤΗΜΑΤΟΣ ΠΡΟΣΕΓΓΙΣΗ ΤΟΥ ΠΡΟΒΛΗΜΑΤΟΣ ΕΠΙΛΟΓΗ ΕΡΓΑΛΕΙΩΝ ΕΠΙΛΟΓΗ ΧΑΡΑΚΤΗΡΙΣΤΙΚΩΝ ΠΕΡΙΓΡΑΦΗ ΒΑΣΗΣ ΔΕΔΟΜΕΝΩΝ Ο ΠΙΝΑΚΑΣ COUPONINFO ΤΕΧΝΙΚΗ ΑΝΑΛΥΣΗ ΚΩΔΙΚΑ ΠΑΚΕΤΟ XMLPARSING Η ΚΛΑΣΗ DOMPARSER Η ΚΛΑΣΗ FOOTBALLMATCHINFO Η ΚΛΑΣΗ MATCHRESULTS Η ΚΛΑΣΗ METADATA ΠΑΚΕΤΟ EXCEPTIONS ΠΑΚΕΤΟ UTILS ΠΑΚΕΤΟ STATISTICS Η ΚΛΑΣΗ STATISTIC Η ΚΛΑΣΗ TEAM Η ΚΛΑΣΗ CHART ΠΑΚΕΤΟ DBMANIPULATION Η ΚΛΑΣΗ DBMANAGER ΠΑΚΕΤΟ MACHINELEARNING Η ΚΛΑΣΗ ARFFCREATOR Η ΚΛΑΣΗ EVALUATOR Η ΚΛΑΣΗ PREDICTOR ΠΑΚΕΤΟ MACHINELEARNING.ROULETTESAMPLING Η ΚΛΑΣΗ LINE Η ΚΛΑΣΗ SEGMENT X ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΚΑΙ ΠΡΟΒΛΕΨΗ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΑΓΩΝΩΝ ΠΟΔΟΣΦΑΙΡΟΥ

13 ΠΕΡΙΕΧΟΜΕΝΑ Η ΚΛΑΣΗ CPRS ΠΑΚΕΤΟ GUI Η ΚΛΑΣΗ SPLASH Η ΚΛΑΣΗ GAMESTABMANIPULATOR Η ΚΛΑΣΗ PREDICTIONTABMANIPULATOR Η ΚΛΑΣΗ MESSAGESTORE Η ΚΛΑΣΗ STATUSBARCHANGER Η ΚΛΑΣΗ UPDATER ΚΕΦΑΛΑΙΟ 4: Η ΕΦΑΡΜΟΓΗ ΣΤΗΝ ΠΡΑΞΗ ΕΙΣΑΓΩΓΗ ΚΑΡΤΕΛΑ GAMES ΚΑΡΤΕΛΑ PREDICTION ΠΑΡΑΡΤΗΜΑ I: ΠΕΙΡΑΜΑΤΙΚΑ ΑΠΟΤΕΛΕΣΜΑΤΑ ΠΑΡΑΡΤΗΜΑ IΙ: ΒΙΒΛΙΟΓΡΑΦΙΑ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΚΑΙ ΠΡΟΒΛΕΨΗ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΑΓΩΝΩΝ ΠΟΔΟΣΦΑΙΡΟΥ XI

14

15 ΛΙΣΤΑ ΣΧΗΜΑΤΩΝ Λ ΙΣΤΑ Σ ΧΗΜΑΤΩΝ ΕΙΚΟΝΑ 2.1: ΣΤΑΔΙΟ ΜΑΘΗΣΗΣ ΕΙΚΟΝΑ 2.2: ΣΤΑΔΙΟ ΤΑΞΙΝΟΜΗΣΗΣ ΕΙΚΟΝΑ 2.3: ΑΛΓΟΡΙΘΜΟΣ C ΕΙΚΟΝΑ 2.4: ΔΕΝΔΡΟ ΑΠΟ ΤΗΝ ΕΚΤΕΛΕΣΗ ΤΟΥ C ΕΙΚΟΝΑ 2.5: BEST-FIRST TREE ΕΙΚΟΝΑ 2.6: ΑΛΓΟΡΙΘΜΟΣ BEST-FIRST ΕΙΚΟΝΑ 2.7: Η ΜΕΘΟΔΟΣ BOOSTING ΕΙΚΟΝΑ 2.8: ΑΛΗΟΡΙΘΜΟΣ ADTREE ΕΙΚΟΝΑ 2.9: ΓΡΑΜΜΙΚΩΣ ΔΙΑΧΩΡΙΣΙΜΑ ΔΕΔΟΜΕΝΑ ΕΙΚΟΝΑ 2.10: ΥΠΕΡ-ΕΠΙΠΕΔΑ ΣΤΟ SVM ΕΙΚΟΝΑ 2.11: SUPPORT VECTORS ΕΙΚΟΝΑ 2.12: ΔΙΑΧΩΡΙΣΜΟΣ ΣΤΙΓΜΙΟΤΥΠΩΝ ΑΠΟ ΤΟΝ METACOST ΕΙΚΟΝΑ 2.13: ΑΛΓΟΡΙΘΜΟΣ METACOST ΕΙΚΟΝΑ 2.14: SAMPLING LINE ΕΙΚΟΝΑ 2.15: ΑΛΓΟΡΙΘΜΟΣ CSROULETTE ΕΙΚΟΝΑ 2.16: ΔΥΟ ΣΗΜΕΙΑ ROC ΕΙΚΟΝΑ 2.17: ΕΥΘΕΙΕΣ ΠΟΥ ΑΝΤΙΣΤΟΙΧΟΥΝ ΣΤΑ ΣΗΜΕΙΑ ΤΗΣ ΕΙΚΟΝΑ 2.18: ΚΑΜΠΥΛΕΣ ROC ΔΥΟ ΑΛΓΟΡΙΘΜΩΝ ΤΑΞΙΝΟΜΗΣΗΣ ΕΙΚΟΝΑ 2.19: ΚΑΜΠΥΛΕΣ ΚΟΣΤΟΥΣ ΠΟΥ ΑΝΤΙΠΡΟΣΩΠΕΥΟΥΝ ΤΙΣ ΚΑΜΠΥΛΕΣ ΕΙΚΟΝΑ 3.1: ΑΡΧΙΤΕΚΤΟΝΙΚΗ ΤΟΥ ΣΥΣΤΗΜΑΤΟΣ ΕΙΚΟΝΑ 3.2: Ο ΠΙΝΑΚΑΣ COUPONINFO ΕΙΚΟΝΑ 3.3: ΠΑΡΑΔΕΙΓΜΑ ΓΡΑΦΗΜΑΤΟΣ ΕΙΚΟΝΑ 4.1: ΚΑΡΤΕΛΑ GAMES ΕΙΚΟΝΑ 4.2: ΕΠΙΛΟΓΗ ΗΜΕΡΟΜΗΝΙΑΣ ΕΙΚΟΝΑ 4.3: ΕΠΙΛΟΓΗ ΠΡΩΤΑΘΛΗΜΑΤΟΣ ΕΙΚΟΝΑ 4.4: ΕΠΙΛΟΓΗ ΟΜΑΔΑΣ ΕΙΚΟΝΑ 4.5: Η ΚΑΡΤΕΛΑ PREDICTION ΠΡΙΝ ΠΡΑΓΜΑΤΟΠΟΙΗΘΕΙ Η ΠΡΟΒΛΕΨΗ ΕΙΚΟΝΑ 4.6: Η ΚΑΡΤΕΛΑ PREDICTION ΜΕΤΑ ΤΗΝ ΠΡΑΓΜΑΤΟΠΟΙΗΣΗ ΤΗΣ ΠΡΟΒΛΕΨΗΣ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΚΑΙ ΠΡΟΒΛΕΨΗ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΑΓΩΝΩΝ ΠΟΔΟΣΦΑΙΡΟΥ XII

16

17 ΛΙΣΤΑ ΠΙΝΑΚΩΝ Λ ΙΣΤΑ Π ΙΝΑΚΩΝ ΠΙΝΑΚΑΣ 2.1: ΠΙΝΑΚΑΣ ΚΟΣΤΟΥΣ ΠΙΝΑΚΑΣ 2.2: ΑΠΛΟΠΟΙΗΜΕΝΟΣ : ΠΙΝΑΚΑΣ ΚΟΣΤΟΥΣ ΠΙΝΑΚΑΣ 2.3: ΠΑΡΑΔΕΙΓΜΑ ΠΙΝΑΚΑ ΚΟΣΤΟΥΣ ΠΙΝΑΚΑΣ 2.4: ΠΑΡΑΔΕΙΓΜΑ ΕΝΟΣ CONFUSION MATRIX ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΚΑΙ ΠΡΟΒΛΕΨΗ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΑΓΩΝΩΝ ΠΟΔΟΣΦΑΙΡΟΥ XIII

18

19 ΚΕΦΑΛΑΙΟ 1: Ε ΙΣΑΓΩΓΗ

20

21 ΚΕΦΑΛΑΙΟ 1: ΕΙΣΑΓΩΓΗ ΕΙΣΑΓΩΓΗ Η εξόρυξη δεδομένων είναι ένας κλάδος της επιστήμης της πληροφορικής, ο οποίος έχει αναπτυχθεί σημαντικά τα τελευταία χρόνια. Βασικός στόχος της εξόρυξης δεδομένων είναι η ανακάλυψη κρυφής γνώσης, χρησιμοποιώντας αλγορίθμους της μηχανικής μάθησης, μέσα από ένα μεγάλο σύνολο δεδομένων που είναι αποθηκευμένα σε βάσης ή αποθήκες δεδομένων.[1] Στη παρούσα πτυχιακή εργασία θα χρησιμοποιήσουμε την εξόρυξη δεδομένων, για να ανακαλύψουμε τη γνώση που κρύβεται μέσα στα δεδομένα που έχουμε συλλέξει και αφορούν αγώνες ποδοσφαίρου. Πιο συγκεκριμένα θα εφαρμόσουμε αλγορίθμους ταξινόμησης (classification algorithms) οι οποίοι θα προβλέψουν τα αποτελέσματα των αγώνων, που βρίσκονται στο κουπόνι στοιχήματος του ΟΠΑΠ. Θα εφαρμόσουμε διάφορους αλγορίθμους ταξινόμησης πάνω στα δεδομένα μας, ώστε να γίνει φανερό μετά από πειραματικές εκτελέσεις, ποίος επιτυγχάνει το μεγαλύτερο ποσοστό επιτυχημένης πρόβλεψης. Ονομαστικά, οι αλγόριθμοι που θα χρησιμοποιηθούν είναι : BFTree J48 J48Graft LADTree REPTree SimpleCart NaiveBayes NaiveBayesNominal NaiveBayesSimple Multinomial logistic regression SMO Linear logistic regression IB1 DecisionTable Οι κλασικοί αυτοί αλγόριθμοι ταξινόμησης[1,7] έχουν ως βασικό στόχο να κατατάξουν επιτυχώς το κάθε στιγμιότυπο σε μια κλάση από ένα διακριτό σύνολο κλάσεων. Στο πρόβλημα μας, τα στιγμιότυπα είναι οι αγώνες ποδοσφαίρου και οι κλάσεις ανήκουν στο εξής διακριτό σύνολο: {νίκη γηπεδούχο ομάδας, ισοπαλία, νίκη φιλοξενούμενης ομάδας}. Οι αλγόριθμοι αυτοί προσπαθούν να μειώσουν το ρυθμό σφάλματος (error rate) : το σύνολο των λανθασμένων προβλέψεων ή εναλλακτικά τη πιθανότητα της εξαγωγής λάθους πρόβλεψης, και ως εκ τούτου την αύξηση των επιτυχημένων προβλέψεων (που είναι ο βασικός στόχος). Το πρόβλημα έγκυται στο ότι ο αλγόριθμος θεωρεί ότι όλες οι λάθος πρόβλεψης επιφέρουν το ίδιο κόστος, στην πραγματικότητα όμως αυτό δεν ισχύει πάντα. Στο πρόβλημα μας, θα θέλαμε ο αλγόριθμος να προσπαθεί να προβλέψει σωστά την κλάση η οποία θα επιφέρει το μικρότερο κόστος ( ή ανάλογα το μεγαλύτερο κέρδος ) λαμβάνοντας υπ όψιν τις απόδοσης των σημείων. ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΚΑΙ ΠΡΟΒΛΕΨΗ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΑΓΩΝΩΝ ΠΟΔΟΣΦΑΙΡΟΥ 21

22 ΠΑΥΛΟΣ ΠΟΛΙΑΝΙΔΗΣ Για να συμπεριλάβουμε το κόστος της λανθασμένης πρόβλεψης, θα εφαρμόσουμε του επονομαζόμενους cost-sensitive αλγορίθμους[3,6,2,4]. Οι αλγόριθμοι αυτοί θα εφαρμοστούν ως «περιτύλιγμα» (wrapper) στους παραπάνω αλγορίθμους ταξινόμησης ώστε να εισαγάγουν την έννοια του κόστους στη διαδικασία της ταξινόμησης. Θα χρησιμοποιήσουμε τους εξής τρεις: MetaCost CostSensitiveClassifier CSRoullete 22 ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΚΑΙ ΠΡΟΒΛΕΨΗ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΑΓΩΝΩΝ ΠΟΔΟΣΦΑΙΡΟΥ

23 ΚΕΦΑΛΑΙΟ 2: ΑΛΓΟΡΙΘΜΟΙ ΜΗΧΑΝΙΚΗΣ ΜΑΘΗΣΗΣ

24

25 ΚΕΦΑΛΑΙΟ 2: ΑΛΓΟΡΙΘΜΟΙ ΜΗΧΑΝΙΚΗΣ ΜΑΘΗΣΗΣ ΑΛΓΟΡΙΘΜΟΙ ΜΗΧΑΝΙΚΗΣ ΜΑΘΗΣΗΣ Όπως αναφέρθηκε προηγουμένως, σκοπός του συστήματος είναι η πρόβλεψη αγώνων ποδοσφαίρου. Για να πετύχουμε το σκοπό μας, θα χρησιμοποιήσουμε ένα σύνολο αλγορίθμων της μηχανικής μάθησης. Πιο συγκεκριμένα, η διαδικασία της πρόβλεψης αναφέρεται ως πρόβλημα ταξινόμησης (classification problem) στην μηχανική μάθηση, ως εκ τούτου θα γίνει χρήση αλγορίθμων ταξινόμησης ή κατηγοριοποίησης. ΤΑΞΙΝΟΜΗΣΗ Βασικές έννοιες Σε αυτό το σημείο θα ήταν σκόπιμο να αναφερθούμε στη λειτουργία των αλγορίθμων ταξινόμησης. Αρχικά, θα εστιάσουμε την προσοχή μας, σε ορισμένες βασικές έννοιες που λαμβάνουν χώρα στη διαδικασία της ταξινόμησης και γενικότερα, της μηχανικής μάθησης. Μοντέλο ταξινόμησης ή ταξινομητής (classifier): μία δομή η οποία ερμηνεύει και περιγράφει το σύνολο των δεδομένων. Βάση του μοντέλου που σχηματίζεται, γίνεται η πρόβλεψη. Στιγμιότυπο ή αντικείμενο (instance): ένα αντικείμενο του κόσμου. Πολλά αντικείμενα μαζί σχηματίζουν το σύνολο στο οποίο θα στηριχθεί ο αλγόριθμος ταξινόμησης, για να σχηματίσει το μοντέλο της ταξινόμησης. Το στιγμιότυπο μπορεί επίσης να εφαρμοστεί πάνω στο μοντέλο, προκειμένου να γίνει η πρόβλεψη. Χαρακτηριστικά (attribute): μία ιδιότητα που περιγράφει ένα στιγμιότυπο. Το κάθε χαρακτηριστικό, έχει έναν τύπο. Κλάση: ανήκει σε ένα πεπερασμένο σύνολο από χαρακτηριστικά (τύπου nominal), και δηλώνει την τάξη στην οποία ανήκει ένα στιγμιότυπο. Είναι ουσιαστικά, το χαρακτηριστικό το οποίο καλείται να πρόβλεψη ο αλγόριθμός. Δεδομένα μάθησης ή σύνολο μάθησης (training set): ένα σύνολο από στιγμιότυπα, από το οποίο ο αλγόριθμος ταξινόμησης θα σχηματίσει τον ταξινομητή. Δεδομένα ελέγχου ή σύνολο ελέγχου (test set): ένα σύνολο από στιγμιότυπα, τα οποία ο αλγόριθμος θα προβλέψει, δηλαδή θα τα κατατάξει σε μια από τις δυνατές κλάσεις. Ακρίβεια πρόβλεψης (accuracy): ο λόγος των σωστών προβλέψεων προς το σύνολο όλων των προβλέψεων που έγιναν από τον ταξινομητή. # correctly _ predicted _ examples accuracy # predictions _ made ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΚΑΙ ΠΡΟΒΛΕΨΗ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΑΓΩΝΩΝ ΠΟΔΟΣΦΑΙΡΟΥ 25

26 ΠΑΥΛΟΣ ΠΟΛΙΑΝΙΔΗΣ Υπερπροσαργογή (overfitting): αφορά το φαινόμενο κατά το οποίο, το μοντέλο που κατασκευάζεται από τον αλγόριθμο, προσαρμόζεται σε υπερβολικό βαθμό στα δεδομένα του συνόλου εκπαίδευσης. Αυτό έχει ως αποτέλεσμα, να μειώνεται η ακρίβεια της πρόβλεψης δεδομένων, που δεν ανήκουν στο σύνολο εκπαίδευσης. Μάθηση με επίβλεψη: μάθηση κατά την οποία,οι κλάσεις των στιγμιότυπων του συνόλου εκπαίδευσης, είναι γνωστές. Οι αλγόριθμοι ταξινόμησης, ανήκουν σε αυτήν την κατηγορία. Στην παρούσα εργασία, θα ασχοληθούμε κυρίως με αυτό το είδος μάθησης. Μάθηση χωρίς επίβλεψη: μάθηση κατά την οποία, οι κλάσεις των στιγμιότυπων του συνόλου εκπαίδευσης δεν είναι γνωστές. Στην μάθηση αυτή, οι αλγόριθμοι προσπαθούν να βρουν συσχετίσεις και ομάδες δεδομένων από το σύνολο εκπαίδευσης. Παραδείγματα ομάδων αλγορίθμων που εφαρμόζουν αυτό το είδος μάθησης είναι: I. Αλγόριθμοι που εξάγουν κανόνες συσχετίσεις (association rules) π.χ. apriori. II. Αλγόριθμοι που χωρίζουν τα δεδομένα σε συστάδες ( clusters ) π.χ. k-means, DBScan. Έχοντας ξεκαθαρίσει ορισμένες βασικές έννοιες, μπορούμε πλέον να ορίσουμε την ταξινόμηση (classification) ως τη διαδικασία δημιουργίας ενός ταξινομητή ή μοντέλου ταξινόμησης από το σύνολο εκπαίδευσης, και η εφαρμογή του μοντέλου αυτού για την αντιστοίχηση των στιγμιότυπων του συνόλου ελέγχου, σε μια από δυνατές τάξης του διακριτού συνόλου κλάσεων[1,9] Βήματα εκτέλεσης Παρακάτω, περιγράφονται συνοπτικά τα δυο βασικά βήματα της εφαρμογής του αλγορίθμου ταξινόμησης που αναφέρονται στον παραπάνω ορισμό. 1. Στάδιο της μάθησης: αποτελεί το βήμα της διαδικασίας της ταξινόμησης, κατά το οποίο ο αλγόριθμος ταξινόμησης, κατασκευάζει τον ταξινομητή (classifier), αναλύοντας το σύνολο εκπαίδευσης (βλέπε εικόνα 2.1). Το σύνολο εκπαίδευσης όπως αναφέραμε, αποτελείται από στιγμιότυπα, που συνήθως αναπαρίστανται ως ένα διάνυσμα χαρακτηριστικών ( feature vector). Το διάνυσμα αυτό είναι της μορφής X = <x 1,x 2, x n >, όπου x i τα χαρακτηριστικά του στιγμιότυπου και ανήκει σε μία κλάση. ο συνδυασμός του διανύσματος και της κλάσης στην οποία ανήκει, αποτελεί την βασική ιδέα πίσω από την οποία κρύβεται η διαδικασία της κατασκευής του ταξινομητή. 26 ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΚΑΙ ΠΡΟΒΛΕΨΗ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΑΓΩΝΩΝ ΠΟΔΟΣΦΑΙΡΟΥ

27 ΚΕΦΑΛΑΙΟ 2: ΑΛΓΟΡΙΘΜΟΙ ΜΗΧΑΝΙΚΗΣ ΜΑΘΗΣΗΣ 2. Στάδιο της ταξινόμησης: στο δεύτερο βήμα, ο αλγόριθμος αρχικά κάνει μια εκτίμηση της ακρίβειας του μοντέλου που κατασκεύασε. Το μοντέλο εφαρμόζεται πάνω στο σύνολο εκπαίδευσης, όπου πλέον οι κλάσεις των στιγμιότυπων του συνόλου δεν είναι γνωστές και ο ταξινομητής καλείται να τις προβλέψει (βλέπε εικόνα 2.2). Υπάρχει πάντα η περίπτωση της αισιόδοξης εκτίμησης, η οποία δεν συμβαδίζει συνήθως με την πραγματικότητα. Αυτή η αισιοδοξία που παρουσιάζουν οι ταξινομητές οφείλεται στο φαινόμενο της υπερβολικής προσαρμογής (βλέπε φαινόμενο υπερπροσαρμογής). Έχουν προταθεί αρκετοί μέθοδοι για την αποτίμηση της ακρίβειας των ταξινομητών [7,9]. Θα αναφερθούμε σε ορισμένους από αυτούς, στην συνέχεια του κεφαλαίου. Εικόνα 2.1 Μάθηση: Ο αλγόριθμος ταξινόμησης αναλύει το σύνολο εκπαίδευση (training data). Σε αυτήν την περίπτωση, η κλάση του κάθε παραδείγματος, είναι η loan_decision, και το μοντέλο που κατασκευάζεται, αναπαριστάται από ένα σύνολο κανόνων ταξινόμησης (decision rules). ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΚΑΙ ΠΡΟΒΛΕΨΗ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΑΓΩΝΩΝ ΠΟΔΟΣΦΑΙΡΟΥ 27

28 ΠΑΥΛΟΣ ΠΟΛΙΑΝΙΔΗΣ Εικόνα 2.2 Ταξινόμηση: Πραγματοποιείται η αποτίμηση της ακρίβειας του μοντέλου που κατασκευάστηκε στο πρώτο βήμα, με την εφαρμογή του, πάνω σε ένα σύνολο ελέγχου (test data). Στην συνέχεια, γίνεται η κατηγοριοποίηση των παραδειγμάτων του συνόλου new data Αποτίμηση ακρίβειας Η αποτίμηση της ακρίβειας ενός ταξινομητή, είναι μια πολύ σημαντική εργασία, που λαμβάνει χώρα κατά την εκτέλεση της ταξινόμησης. Αφορά σε ένα είδος δοκιμής που εκτελεί ο αλγόριθμος, προκειμένου να συμπεράνει πόσο καλός είναι ο ταξινομητής που κατασκεύασε. Η ακρίβεια είναι μια σημαντική ποσότητα για εμάς, γιατί μας φανερώνει την ικανότητα του μοντέλου να κάνει σωστές προβλέψεις (κατάταξη των στιγμιότυπων στην κλάση στην οποία πραγματικά ανήκουν). Είναι προφανές, ότι όσα μεγαλύτερη είναι η ακρίβεια, τόσο περισσότερο μπορούμε να εμπιστευτούμε τον αλγόριθμο, για τις προβλέψεις που κάνει. Συνήθως υπάρχει ένα κάτω όριο ακρίβειας, κάτω από τον οποίο ο αλγόριθμος της ταξινόμησης έχει την δυνατότητα να απορρίψει ένα μοντέλο και να ξεκινήσει την διαδικασία από το πρώτο βήμα (βλέπε βήματα εκτέλεσης αλγορίθμου), κατασκευάζοντας ένα διαφορετικό μοντέλο[7]. 28 ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΚΑΙ ΠΡΟΒΛΕΨΗ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΑΓΩΝΩΝ ΠΟΔΟΣΦΑΙΡΟΥ

29 ΚΕΦΑΛΑΙΟ 2: ΑΛΓΟΡΙΘΜΟΙ ΜΗΧΑΝΙΚΗΣ ΜΑΘΗΣΗΣ Μέθοδοι αποτίμησης ακρίβειας hold-out Πρόκειται για την απλούστερη μέθοδο αποτίμησης της ακρίβειας ενός κατηγοριοποιητή. Η ιδέα που κρύβεται πίσω από την μέθοδο αυτή είναι απλή, χωρίζουμε το σύνολο των δεδομένων (data set) σε 2 τμήματα, το σύνολο εκπαίδευσης και το σύνολο ελέγχου, με κάποια αναλογία. Για παράδειγμα, τα 2/3 πρώτα στιγμιότυπα του συνόλου δεδομένων θα σχηματίσουν το σύνολο εκπαίδευσης, ενώ από το υπόλοιπο 1/3 του συνόλου δεδομένων θα σχηματιστεί το σύνολο ελέγχου. Το σύνολο εκπαίδευσης θα συμβάλει στην κατασκευή του κατηγοριοποιητή ο οποίος θα κατατάξει τα όλα τα στιγμιότυπα του συνόλου ελέγχου, σε μία από τις υπάρχουσες κλάσεις. Αν υποθέσουμε ότι το Χ είναι ο αριθμός των στιγμιότυπων του συνόλου ελέγχου που κατατάσσονται στη σωστή κλάση, και Ν ο συνολικός αριθμός στιγμιότυπων του συνόλου ελέγχου, τότε η ακρίβεια accuracy της μεθόδου hold-out ορίζεται ως εξής: X accuracy N Η μέθοδος hold-out είναι μια απλή μέθοδος η οποία είναι εύκολη στην υλοποίηση, παρόλα αυτά, έχει ένα σημαντικό πρόβλημα. Η ποιότητα του κατηγοριοποιητή που θα κατασκευαστεί, εξαρτάται από την κατανομή των στιγμιότυπων μέσα στο σύνολο δεδομένων. Υπάρχει η περίπτωση το σύνολο εκπαίδευσης να περιέχει λίγα στιγμιότυπα που ανήκουν σε μια κλάση, αυτό θα έχει ως αποτέλεσμα την δημιουργία ενός μοντέλου το οποίο δεν θα μπορεί να κατατάσσει εσφαλμένα τα στιγμιότυπα του συνόλου ελέγχου που πραγματικά ανήκουν στην κλάση αυτήν. Σε αυτήν την περίπτωση η ακρίβεια του μοντέλου θα είναι υποεκτιμημένη, λόγω του ότι δεν κατατάσσει ορθά τα στιγμιότυπα της συγκεκριμένης κλάσης Τυχαία δειγματοληψία (random subsampling) Η μέθοδος ακολουθεί παρόμοια λογική με την hold-out. Οι δυο μέθοδοι διαφέρουν στον τρόπο που διαμερίζουν το σύνολο δεδομένων στα δύο τμήματα (σύνολο εκπαίδευση και σύνολο ελέγχου), ώστε να λυθεί το πρόβλημα που εμφανίζει η holdout. Σε αυτήν την περίπτωση το σύνολο ελέγχου επιλέγεται ως τυχαίο δείγμα. Εφαρμόζουμε τυχαία δειγματοληψία χωρίς επανατοποθέτηση και επιλέγουμε Ν στιγμιότυπα για το σύνολο ελέγχου. Τα εναπομένοντα στιγμιότυπα σχηματίζουν το σύνολο εκπαίδευσης. Με αυτήν την ενέργεια μειώνεται η επιρροή που μπορεί να επιφέρει η κατανομή των στιγμιότυπων στο σύνολο δεδομένων. Η προηγούμενη διαδικασία επαναλαμβάνεται κ φορές ώστε νε επιτευχθεί η μεγαλύτερη δυνατή μείωση της επιρροής. Αν υποθέσουμε ότι X i είναι ο αριθμός των στιγμιότυπων που έχουν καταταχθεί σωστά στην i-οστη επανάληψη ( οπού 1 i k ), τότε η ακρίβεια της μεθόδου τυχαίας δειγματοληψίας ορίζεται ως εξής: 1 accuracy k i 1 X i N ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΚΑΙ ΠΡΟΒΛΕΨΗ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΑΓΩΝΩΝ ΠΟΔΟΣΦΑΙΡΟΥ 29

30 ΠΑΥΛΟΣ ΠΟΛΙΑΝΙΔΗΣ Πολλαπλή δια-εγκυροποίηση (k-fold cross-validation) Θεωρείται μια από τις πλέον αξιόπιστές μεθόδους για την αποτίμηση της ακρίβειας κατηγοριοποιητών. Στην περίπτωση αυτήν εφαρμόζεται ένας πιο συστηματικός τρόπος για να λαμβάνουμε τυχαία δείγματα για το σχηματισμό του συνόλου ελέγχου. Εάν το σύνολο δεδομένων αποτελείται από Μ στιγμιότυπα και έχουμε ορίσει ως αριθμό επαναλήψεων το k, τότε χωρίζουμε το σύνολο σε k ισομεγέθη τμήματα μεγέθους M/k το καθένα. Στην i-οστή επανάληψη, το i-οστό τμήμα λειτουργεί ως σύνολο ελέγχου, ενώ τα υπόλοιπα k 1 τμήματα αποτελούν το σύνολο εκπαίδευσης. Η συνηθέστερη τιμή για το k είναι το 10 (10-fold cross-validation ). Η μέθοδος της δια-εγυροποίησης για την ειδική περίπτωση οπού k =M, ονομάζεται άφησε-ένα-έξω (leave-one-out), γιατί το σύνολο ελέγχου σε κάθε επανάληψη, αποτελείται από ένα μόνο στιγμιότυπο. Η παραλλαγή αυτή χρησιμοποιείται μόνο σε μικρά σύνολα δεδομένων Bootstrap Αποτελεί εναλλακτική μέθοδο της τυχαίας υποδειγματοληψίας. Ενώ η τυχαία υποδειγματοληψία σχηματίζει το σύνολο ελέγχου εφαρμόζοντας τυχαία δειγματοληψία χωρίς επανατοποθέτηση στο σύνολο δεδομένων, ο bootstrap εφαρμόζει τυχαία δειγματοληψία με επανατοποθέτηση. Έστω M το πλήθος των στιγμιότυπων του συνόλου δεδομένων. Αποδεικνύεται ότι αν από το σύνολο αυτό πάρουμε ένα δείγμα M στιγμιότυπων, εξαιτίας της επανατοποθέτησης ο αριθμός των διακριτών στιγμιότυπων του δείγματος αυτού, αναμένεται να ισούται με το 63.2% του M. Απόδειξη: Για ένα αντικείμενο χ, η πιθανότητα είναι: P( x Δείγμα ) = 1 P( x Δείγμα). Σε κάθε μια από τις M προσπάθειες, το x έχει πιθανότητα 1/M να επιλεγεί, και 1 1/M πιθανότητα να μην επιλεγεί. Επομένως, μετά από M προσπάθειες, η πιθανότητα να μην επιλεγεί σε καμία από αυτές, δηλαδή να μην ανήκει στο δείγμα, ισούται με P( x Δείγμα) = ( 1 1/Μ ) Μ. Άρα, P( x Δείγμα ) = 1 - ( 1 1/Μ ) Μ. Για μεγάλες τιμές του M έχουμε lim (1 - ( 1 1/Μ ) Μ ) = 1 e -1 = M Η διαδικασία της δειγματοληψίας επαναλαμβάνεται k φορές. Αν υποθέσουμε ότι η ακρίβεια στην i-οστή επανάληψη είναι a i, τότε η ακρίβεια accuracy της μεθόδου ορίζεται ως εξής: accuracy 1 k k i 1 (0.632a i 0.368a) Όπου a είναι η ακρίβεια όταν το σύνολο δεδομένων χρησιμοποιείται και ως σύνολο ελέγχου και ως σύνολο εκπαίδευσης. 30 ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΚΑΙ ΠΡΟΒΛΕΨΗ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΑΓΩΝΩΝ ΠΟΔΟΣΦΑΙΡΟΥ

31 ΚΕΦΑΛΑΙΟ 2: ΑΛΓΟΡΙΘΜΟΙ ΜΗΧΑΝΙΚΗΣ ΜΑΘΗΣΗΣ ΑΛΓΟΡΙΘΜΟΙ ΤΑΞΙΝΟΜΗΣΗΣ Έχοντας αναφερθεί στις βασικές έννοιες γύρω από το πλαίσιο της ταξινόμησης, μπορούμε πλέον να συνεχίσουμε με την περιγραφεί συγκεκριμένων αλγορίθμων κατηγοριοποιήσεις. Ποίο συγκεκριμένα, στα πλαίσια της παρούσας εργασίας θα χρησιμοποιηθούν οι εξής αλγόριθμοι: BFTree J48 J48Graft LADTree REPTree SimpleCart NaiveBayes NaiveBayesNominal NaiveBayesSimple Multinomial logistic regression SMO Linear logistic regression IB1 DecisionTable Όπως αναφέρομαι και προηγουμένως, η ταξινόμηση εκτελείται σε 2 βήματα: 1. Δημιουργία του μοντέλου ταξινόμησης και, 2. Κατηγοριοποίηση των στιγμιότυπων του συνόλου ελέγχου. Οι διαφορετικότητα των αλγορίθμων που θα παρουσιάσουμε, έγκυται στο ότι δημιουργούν διαφορετικά μοντέλα ταξινόμησης, ενώ το δεύτερο βήμα είναι ίδιο για όλους. Ο κάθε αλγόριθμος αναλύει διαφορετικά το σύνολο εκπαίδευσης, βασιζόμενος σε ξεχωριστά ποσοτικά μέτρα ο κάθε ένας προκειμένου να αντλήσει την κρυφή γνώση που κρύβεται πίσω από τα δεδομένα. Γι αυτό τον λόγο κατασκευάζονται ανόμοια μοντέλα ταξινόμησης. Οι κατηγορίες στις οποίες ανήκουν τα μοντέλα αυτά είναι οι εξής: 1. Δένδρα απόφασης (decision trees classifiers). Οι κατηγοριοποιητές αυτοι έχουν δενδρική μορφή αναπαράστασης. Σε αυτήν τη κατηγορία ανήκουν τα μοντέλα που σχηματίζουν οι αλγόριθμοι BFTree, J48, J48Graft, LADTree, REPTree και SimpleCart. 2. Κανόνες ταξινόμησης (decision rule). Αποτελεί εναλλακτική αναπαράσταση των δένδρων απόφασης. Ο αλγόριθμός DecisionTable ανήκει σε αυτήν την κατηγορία. 3. Πιθανοκρατικοί κατηγοριοποιητές (probabilistic classifiers). Βασίζονται στην εξέταση κατανομών πιθανότητας στα δεδομένα του συνόλου εκπαίδευσης. Οι αλγόριθμοι, NaiveBayes, NaiveBayesNominal και NaivebayesSimple ανήκουν σε αυτή τη κατηγορία. ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΚΑΙ ΠΡΟΒΛΕΨΗ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΑΓΩΝΩΝ ΠΟΔΟΣΦΑΙΡΟΥ 31

32 ΠΑΥΛΟΣ ΠΟΛΙΑΝΙΔΗΣ 4. Διακριτικοί κατηγοριοποιητές (discriminative classifiers). Οι Multinomial logistic regression και linear logistic regression ανήκουν σε αυτή τη κατηγορία. 5. Γραμμικοί κατηγοριοποιητές (linear classifiers). Βασίζονται στο γραμμικό συνδυασμό των χαρακτηριστικών του διανύσματος χαρακτηριστικών (feature vector). Στην κατηγορία αυτή ανήκει ο SMO C4.5 Ο αλγόριθμος C4.5 [11,12] ανήκει στην μεγάλη κατηγορία αλγορίθμων ταξινόμησης οι οποίοι δημιουργούν δεντρικά μοντέλα ταξινομητών (δένδρα απόφασης). Αποτελεί απόγονο του αλγορίθμου ID3. Ένα δένδρο απόφασης αποτελείται από κόμβους που αντιστοιχούν σε κάποιο χαρακτηριστικό του συνόλου εκπαίδευσης ο κάθε ένας και διακρίνονται στους εξής: 1. Ρίζα (root): κόμβος ο οποίος βρίσκεται στην κορυφή του δένδρου και χωρίζει το σύνολο εκπαίδευσης σε 2 ή περισσότερα υποσύνολα. 2. Εσωτερικοί κόμβοι (internal node): ενδιάμεσοι κόμβοι οι οποίοι με την σειρά τους χωρίζουν το κάθε υποσύνολο του υποδένδρου σε μικρότερα υποσύνολα. 3. Φύλλα (leafs): αποτελεί τον τερματικό κόμβο και αντιπροσωπεύει μια κλάση από το διακριτό σύνολο κλάσεων του συνόλου εκπαίδευσης. Όλοι οι κόμβοι εκτός από τα φύλλα έχουν εξερχόμενες ακμές, οι οποίες αντιστοιχούν σε μια συνθήκη βάση της οποία γίνεται ο διάσπαση των δεδομένων. η συνθήκη αυτή ονομάζεται συνθήκη διάσπασης (split criteria). Εικόνα 2.3: Αλγόριθμος C ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΚΑΙ ΠΡΟΒΛΕΨΗ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΑΓΩΝΩΝ ΠΟΔΟΣΦΑΙΡΟΥ

33 ΚΕΦΑΛΑΙΟ 2: ΑΛΓΟΡΙΘΜΟΙ ΜΗΧΑΝΙΚΗΣ ΜΑΘΗΣΗΣ Στην εικόνα 2.2 περιγράφεται ο αλγόριθμος C4.5. όπως βλέπουμε η διαδικασία ξεκινάει από την επιλογή του αρχικού κόμβου (ρίζα) ο οποίος θα διασπάσει το αρχικό σύνολο εκπαίδευσης με βάση την συνθήκη διάσπασης (split criteria). Η επιλογή του κατάλληλου κόμβου διαχωριστή, επιτυγχάνεται μέσω ενός ποσοτικού μέτρου. το μέτρο αυτό υπολογίζεται για όλα τα χαρακτηριστικά του συνόλου εκπαίδευσης και επιλέγεται το χαρακτηριστικό που έχει την καλύτερη τιμή. Η διαδικασία αυτή επαναλαμβάνεται αναδρομικά, έως ότου όλα τα μικρότερα υποσύνολα να είναι αμιγείς, δηλαδή, όλα τα στιγμιότυπά του υποσυνόλου να ανήκουν σε μία κλάση. Με αυτόν τον τρόπο κατασκευάζεται το δένδρο απόφασης. (βλέπε εικόνα 2.4) Το βασικό ποσοτικό μέτρο που χρησιμοποιείται για επιλογή των διαχωριστών είναι το κέρδος πληροφορίας (information Gain) το οποίο βασίζεται στην εντροπία πληροφορίας (entropy ). Εικόνα 2.4: Παράδειγμα από Δένδρο που προκύπτει από την εκτέλεση του C4.5 Έχουν προταθεί αρκετές παραλλαγές του C4.5, όπως C4.5-no-pruning, C4.5-rules, οι οποίοι προσπαθούν να βελτιώσουν την επίδοση του αλγορίθμου, εκτελώντας διάφορες επιπρόσθετες λειτουργίες (π.χ. κλάδεμα δένδρου). ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΚΑΙ ΠΡΟΒΛΕΨΗ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΑΓΩΝΩΝ ΠΟΔΟΣΦΑΙΡΟΥ 33

34 ΠΑΥΛΟΣ ΠΟΛΙΑΝΙΔΗΣ Best-first decision trees Ο best-first αλγόριθμος ταξινόμησης [15], ανήκει στην μεγάλη κατηγορία των δένδρων απόφασης (decision trees). Τα δένδρα απόφασης είναι μια δημοφιλής κατηγορία κατηγοριοποιητών για τους εξής λόγους: 1. Είναι γρήγορα τόσο κατά την κατασκευή μοντέλων ταξινόμησης όσο και κατά την διάρκεια της κατηγοριοποίησης. 2. Κατασκευάζουν μοντέλα ταξινόμησης με πολύ καλή επίδοση. 3. Εφαρμόζουν καλά σε «θορυβώδη» σύνολα εκπαίδευσης. 4. Είναι ιδανικά για την δημιουργία κατηγοριοποιητών, όταν υπάρχουν στιγμιότυπα με χαρακτηριστικά για τα οποία απουσιάζει η τιμή (missing values). Τα best-first δένδρα συγκεντρώνουν όλες τις ιδιότητες των παραδοσιακών δένδρων απόφασης (π.χ. C4.5, ID3 κ.λπ.). Η μοναδική διαφορά είναι ότι, τα κλασσικά δένδρα απόφασης επεκτείνουν τους κόμβους (εσωτερικού κόμβους) με depth-first σειρά, ενώ ο best-first επεκτείνει πρώτα το «καλύτερο» κόμβο. Η εικόνα 2.5 παρουσιάζει ένα υποθετικό best-first δένδρο και ένα κλασικό δένδρο απόφασης. Διακρίνεται ότι ο best-first δημιουργεί ένα πλήρως-επεκταμένο δένδρο (εικόνα 2.5 (α)) που είναι ίδιος με το δένδρο που δημιουργούν οι παραδοσιακοί αλγόριθμοι δένδρων απόφασης. Παρόλα αυτά, αν είναι γνωστό εκ των προτέρων το πλήθος των επεκτάσεων που θα γίνουν στο δένδρο, ο best-first δημιουργεί σχεδόν πάντα διαφορετικά δένδρα (εικόνες 2.5 (c) και 2.5 (d) αντίστοιχα). Αυτό οφείλεται στον τρόπο που αναπτύσσει το δένδρο ο best-first. Εικόνα 2.5 (a) πλήρως-επεκταμένο best-first tree.(b)πλήρως επεκταμένο παραδοσιακό δένδρο απόφασης (c) best-first tree με τρείς επεκτάσεις.(d) παραδοσιακό δένδρο απόφασης με τρεις επεκτάσεις 34 ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΚΑΙ ΠΡΟΒΛΕΨΗ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΑΓΩΝΩΝ ΠΟΔΟΣΦΑΙΡΟΥ

35 ΚΕΦΑΛΑΙΟ 2: ΑΛΓΟΡΙΘΜΟΙ ΜΗΧΑΝΙΚΗΣ ΜΑΘΗΣΗΣ Εικόνα 2.6 Αλγόριθμος Best-first Όπως αναφέραμε παραπάνω, ο best-first αλγόριθμος επεκτείνει το δέντρο, επιλέγοντας να διαχωρίσει το «καλύτερο» κόμβο σε κάθε γύρω. Με το όρο «καλύτερο» εννοούμε τον κόμβο ο οποίος οδηγεί σε μεγαλύτερη μείωση της ανομοιογένειας των δεδομένων στους κόμβου. Ενώ τα παραδοσιακά δένδρα ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΚΑΙ ΠΡΟΒΛΕΨΗ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΑΓΩΝΩΝ ΠΟΔΟΣΦΑΙΡΟΥ 35

36 ΠΑΥΛΟΣ ΠΟΛΙΑΝΙΔΗΣ απόφασής, αναπτύσσουν το δέντρο πρώτα σε «βάθος», δηλαδή επεκτείνουν τους κόμβους ενός μονοπατιού, μέχρι να φτάσουν σε τερματικό κόμβο. Αυτό αποτελεί την βασική και μοναδική διαφορά των 2 προσεγγίσεων. Προκειμένου να επιλέγει γρήγορα τον «καλύτερο» κόμβο, ο best-first ταξινομεί την λίστα με τους κόμβους, κατά φθίνουσα σειρά ως προς το Gini gain ή το Information gain (ανάλογα με το ποίο ποσοτικό μέτρο χρησιμοποιείται για τον διαχωρισμό των κόμβων). Με αυτό τον τρόπο, κάθε φορά επιλέγεται για διαχωρισμό, ο πρώτος κόμβος τις ταξινομημένης ο οποίος ουσιαστικά είναι και ο «καλύτερος». Ένα επιπλέον χαρακτηριστικό του bestfirst είναι ότι, μπορούμε να καθορίσουμε το πλήθος των επεκτάσεων που θα γίνουν στο δένδρο. Ο αλγόριθμος παρουσιάζεται στην εικόνα LADTrees O LADTree [13] είναι αλγόριθμος ταξινόμησης ο οποίος δημιουργεί ένα εναλλακτικό δένδρο απόφασης (alternative decision tree). Εφαρμόζεται σε προβλήματα ταξινόμησης στα οποία έχουν πολλαπλές κλάσεις (multiclass). Βασίζεται στο αλγόριθμο LogitBoost ο οποίος ανήκει στην οικογένεια των Boosting αλγορίθμων. Προτού περιγράψουμε τα εναλλακτικά δένδρα, θα ήταν χρήσιμο να αναφερθούμε στην διαδικασία του Boosting [12] στην οποία στηρίζει την λειτουργία του o LogitBoost (logistic boosting) Boosting Υποθέτουμε ότι έχουμε ένα πρόβλημα δυαδικής ταξινόμησης, δηλαδή το κάθε στιγμιότυπο μπορεί να ανήκει σε μια από τις δυο εναλλακτικές κλάσεις. Όπως είναι γνωστό, σκοπός ενός αλγορίθμου ταξινόμησης είναι να κατασκευάσει ένα μοντέλο ταξινόμησης μέσα από το σύνολο εκπαίδευση, και στην συνέχεια να προσπαθήσει να κατατάξει όλα τα στιγμιότυπα του συνόλου ελέγχου. Μία εναλλακτική λύση θα μπορούσε να είναι, ο κατηγοροιοποιητής να κατατάσσει τα στιγμιότυπα με τυχαίο τρόπο χωρίς να χρειαστεί να αναλύσει τα δεδομένα. Έτσι θα είχε 50% απώλεια (αριθμός των λάθος κατατάξεων). Είναι προφανής ότι αυτή η λύση δεν μπορεί να είναι αποδεκτή. Υπάρχουν όμως περιπτώσεις στις οποίες οι κατηγοριοποιητές, παρόλη την ανάλυση που εκτελούν στα δεδομένα, δεν επιτυγχάνουν ποσοστό σωστής πρόβλεψης πολύ μεγαλύτερο από ότι αν εφαρμόζαμε τυχαία πρόβλεψη. Σε αυτές τις περιπτώσεις λέμε ότι ο κατηγοριοποιητής μας αποτελεί έναν αδύναμο κατηγοροιοποιητής ή μια αδύναμη υπόθεση (weak classifier ή weak hypothesis). Η λογική του Boosting στηρίζεται στο γεγονός ότι μπορούμε να συνδυάσουμε ένα σύνολο αδύναμων κατηγοροιοποιητών προκειμένου να σχηματίσουμε έναν δυνατό κατηγοροιοποιητή (strong classifier) ο οποίος θα έχει πολύ καλύτερα αποτελέσματα από την τυχαία πρόβλεψη. Αν θέσουμε έναν αδύναμο κατηγοροιοποιητή ως h1, τότε η διαδικασία του Boosting θα παράγει μια νέα κατανομή D των δεδομένων από την αρχική D προκειμένου να ελαττωθούν τα λάθη που εμφάνισε ο h1. Ουσιαστικά πρόκειται για μια αλλαγή που γίνεται στα βάρη των στιγμιότυπων. Συνήθως η νέα D εστιάζει την προσοχή στα στιγμιότυπα τα οποία ο h1 κατάταξε εσφαλμένα. Στην συνέχεια μέσα από την νέα 36 ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΚΑΙ ΠΡΟΒΛΕΨΗ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΑΓΩΝΩΝ ΠΟΔΟΣΦΑΙΡΟΥ

HMY 795: Αναγνώριση Προτύπων

HMY 795: Αναγνώριση Προτύπων HMY 795: Αναγνώριση Προτύπων Διάλεξη 3 Επιλογή μοντέλου Επιλογή μοντέλου Θεωρία αποφάσεων Επιλογή μοντέλου δεδομένα επικύρωσης Η επιλογή του είδους του μοντέλου που θα χρησιμοποιηθεί σε ένα πρόβλημα (π.χ.

Διαβάστε περισσότερα

Μέθοδοι Μηχανών Μάθησης για Ευφυή Αναγνώριση και ιάγνωση Ιατρικών εδοµένων

Μέθοδοι Μηχανών Μάθησης για Ευφυή Αναγνώριση και ιάγνωση Ιατρικών εδοµένων Μέθοδοι Μηχανών Μάθησης για Ευφυή Αναγνώριση και ιάγνωση Ιατρικών εδοµένων Εισηγητής: ρ Ηλίας Ζαφειρόπουλος Εισαγωγή Ιατρικά δεδοµένα: Συλλογή Οργάνωση Αξιοποίηση Data Mining ιαχείριση εδοµένων Εκπαίδευση

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 18. 18 Μηχανική Μάθηση

ΚΕΦΑΛΑΙΟ 18. 18 Μηχανική Μάθηση ΚΕΦΑΛΑΙΟ 18 18 Μηχανική Μάθηση Ένα φυσικό ή τεχνητό σύστηµα επεξεργασίας πληροφορίας συµπεριλαµβανοµένων εκείνων µε δυνατότητες αντίληψης, µάθησης, συλλογισµού, λήψης απόφασης, επικοινωνίας και δράσης

Διαβάστε περισσότερα

ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΚΑΙ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ

ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΚΑΙ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΚΑΙ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΔΠΜΣ : ΕΦΑΡΜΟΣΜΕΝΕΣ ΜΑΘΗΜΑΤΙΚΕΣ ΕΠΙΣΤΗΜΕΣ ΡΟΗ ΠΙΘΑΝΟΝΤΗΤΕΣ ΚΑΙ ΣΤΑΤΙΣΤΙΚΗΣ ΕΡΓΑΣΙΑ 08: ΕΙΡΗΝΗ ΛΥΓΚΩΝΗ 1 Ο ΣΤΑΔΙΟ: Πριν εφαρμόσουμε οποιοδήποτε αλγόριθμο

Διαβάστε περισσότερα

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΚΑΙ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΠΛΗΡΟΦΟΡΙΑΣ ΠΑΡΟΥΣΙΑΣΗ ΤΕΛΙΚΗΣ ΕΡΓΑΣΙΑΣ ΛΙΝΑ ΜΑΣΣΟΥ

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΚΑΙ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΠΛΗΡΟΦΟΡΙΑΣ ΠΑΡΟΥΣΙΑΣΗ ΤΕΛΙΚΗΣ ΕΡΓΑΣΙΑΣ ΛΙΝΑ ΜΑΣΣΟΥ ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΚΑΙ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΠΑΡΟΥΣΙΑΣΗ ΤΕΛΙΚΗΣ ΕΡΓΑΣΙΑΣ ΛΙΝΑ ΜΑΣΣΟΥ Δ.Π.Μ.Σ: «Εφαρμοσμένες Μαθηματικές Επιστήμες» 2008

Διαβάστε περισσότερα

Μάθηση και Γενίκευση. "Τεχνητά Νευρωνικά Δίκτυα" (Διαφάνειες), Α. Λύκας, Παν. Ιωαννίνων

Μάθηση και Γενίκευση. Τεχνητά Νευρωνικά Δίκτυα (Διαφάνειες), Α. Λύκας, Παν. Ιωαννίνων Μάθηση και Γενίκευση Το Πολυεπίπεδο Perceptron (MultiLayer Perceptron (MLP)) Έστω σύνολο εκπαίδευσης D={(x n,t n )}, n=1,,n. x n =(x n1,, x nd ) T, t n =(t n1,, t np ) T Θα πρέπει το MLP να έχει d νευρώνες

Διαβάστε περισσότερα

Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500

Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500 Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500 Πληθυσμός Δείγμα Δείγμα Δείγμα Ο ρόλος της Οικονομετρίας Οικονομική Θεωρία Διατύπωση της

Διαβάστε περισσότερα

Υπερπροσαρμογή (Overfitting) (1)

Υπερπροσαρμογή (Overfitting) (1) Αλγόριθμος C4.5 Αποφυγή υπερπροσαρμογής (overfitting) Reduced error pruning Rule post-pruning Χειρισμός χαρακτηριστικών συνεχών τιμών Επιλογή κατάλληλης μετρικής για την επιλογή των χαρακτηριστικών διάσπασης

Διαβάστε περισσότερα

Λήψη αποφάσεων κατά Bayes

Λήψη αποφάσεων κατά Bayes Λήψη αποφάσεων κατά Bayes Σημειώσεις μαθήματος Thomas Bayes (1701 1761) Στυλιανός Χατζηδάκης ECE 662 Άνοιξη 2014 1. Εισαγωγή Οι σημειώσεις αυτές βασίζονται στο μάθημα ECE662 του Πανεπιστημίου Purdue και

Διαβάστε περισσότερα

Ι. Preprocessing (Επεξεργασία train.arff):

Ι. Preprocessing (Επεξεργασία train.arff): Ονοματεπώνυμο: Κατερίνα Αργύρη Δ.Π.Μ.Σ: Εφαρμοσμένες Μαθηματικές Επιστήμες Ακαδ. Έτος: 2008-2009 1 Για την παρούσα εργασία διατίθενται τρία σύνολα δεδομένων: Δεδομένα Εκπαίδευσης (train set αρχείο train.arff):

Διαβάστε περισσότερα

4.3. Γραµµικοί ταξινοµητές

4.3. Γραµµικοί ταξινοµητές Γραµµικοί ταξινοµητές Γραµµικός ταξινοµητής είναι ένα σύστηµα ταξινόµησης που χρησιµοποιεί γραµµικές διακριτικές συναρτήσεις Οι ταξινοµητές αυτοί αναπαρίστανται συχνά µε οµάδες κόµβων εντός των οποίων

Διαβάστε περισσότερα

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R, Επίκουρος Καθηγητής, Τομέας Μαθηματικών, Σχολή Εφαρμοσμένων Μαθηματικών και Φυσικών Επιστημών, Εθνικό Μετσόβιο Πολυτεχνείο. Περιεχόμενα Εισαγωγή στο

Διαβάστε περισσότερα

Μέθοδοι εκμάθησης ταξινομητών από θετικά παραδείγματα με αριθμητικά χαρακτηριστικά. Νικόλαος Α. Τρογκάνης Διπλωματική Εργασία

Μέθοδοι εκμάθησης ταξινομητών από θετικά παραδείγματα με αριθμητικά χαρακτηριστικά. Νικόλαος Α. Τρογκάνης Διπλωματική Εργασία Μέθοδοι εκμάθησης ταξινομητών από θετικά παραδείγματα με αριθμητικά χαρακτηριστικά Νικόλαος Α. Τρογκάνης Διπλωματική Εργασία Αντικείμενο Μελέτη και ανάπτυξη μεθόδων από τον χώρο της μηχανικής μάθησης για

Διαβάστε περισσότερα

Στάδιο Εκτέλεσης

Στάδιο Εκτέλεσης 16 ΚΕΦΑΛΑΙΟ 1Ο 1.4.2.2 Στάδιο Εκτέλεσης Το στάδιο της εκτέλεσης μίας έρευνας αποτελεί αυτό ακριβώς που υπονοεί η ονομασία του. Δηλαδή, περιλαμβάνει όλες εκείνες τις ενέργειες από τη στιγμή που η έρευνα

Διαβάστε περισσότερα

Αναγνώριση Προτύπων (Pattern Recognition) Μπεϋζιανή Θεωρία Αποφάσεων (Bayesian Decision Theory) Π. Τσακαλίδης

Αναγνώριση Προτύπων (Pattern Recognition) Μπεϋζιανή Θεωρία Αποφάσεων (Bayesian Decision Theory) Π. Τσακαλίδης Αναγνώριση Προτύπων (Pattern Recognton Μπεϋζιανή Θεωρία Αποφάσεων (Bayesan Decson Theory Π. Τσακαλίδης ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ ΤΜΗΜΑ ΕΠΙΣΤΗΜΗΣ ΥΠΟΛΟΓΙΣΤΩΝ Μπεϋζιανή Θεωρία Αποφάσεων (Bayes Decson theory Στατιστικά

Διαβάστε περισσότερα

Εξόρυξη γνώμης πολιτών από ελεύθερο κείμενο

Εξόρυξη γνώμης πολιτών από ελεύθερο κείμενο Δίκαρος Νίκος Δ/νση Μηχανογράνωσης κ Η.Ε.Σ. Υπουργείο Εσωτερικών. Τελική εργασία Κ Εκπαιδευτικής Σειράς Ε.Σ.Δ.Δ. Επιβλέπων: Ηρακλής Βαρλάμης Εξόρυξη γνώμης πολιτών από ελεύθερο κείμενο Κεντρική ιδέα Προβληματισμοί

Διαβάστε περισσότερα

Διπλωματική Εργασία Αναγνώριση και ταξινόμηση ιστολόγιων. Αναστασιάδης Αντώνιος

Διπλωματική Εργασία Αναγνώριση και ταξινόμηση ιστολόγιων. Αναστασιάδης Αντώνιος Αναστασιάδης Αντώνιος Τα ιστολόγια σήμερα Διπλωματική Εργασία Η σημασία των πληροφοριών των ιστολόγιων Μέθοδοι κατάτμησης ιστολόγιων Αξιολόγηση κατάτμησης Ταξινόμηση καταχωρήσεων Αξιολόγηση ταξινόμησης

Διαβάστε περισσότερα

ΔΕΣΜΕΥΜΕΝΕΣ Ή ΥΠΟ ΣΥΝΘΗΚΗ ΠΙΘΑΝΟΤΗΤΕΣ

ΔΕΣΜΕΥΜΕΝΕΣ Ή ΥΠΟ ΣΥΝΘΗΚΗ ΠΙΘΑΝΟΤΗΤΕΣ ΔΕΣΜΕΥΜΕΝΕΣ Ή ΥΠΟ ΣΥΝΘΗΚΗ ΠΙΘΑΝΟΤΗΤΕΣ Έστω ότι επιθυμούμε να μελετήσουμε ένα τυχαίο πείραμα με δειγματικό χώρο Ω και έστω η πιθανότητα να συμβεί ένα ενδεχόμενο Α Ω Υπάρχουν περιπτώσεις όπου ενώ δεν γνωρίζουμε

Διαβάστε περισσότερα

Δέντρα Απόφασης (Decision(

Δέντρα Απόφασης (Decision( Δέντρα Απόφασης (Decision( Trees) Το μοντέλο που δημιουργείται είναι ένα δέντρο Χρήση της τεχνικής «διαίρει και βασίλευε» για διαίρεση του χώρου αναζήτησης σε υποσύνολα (ορθογώνιες περιοχές) Ένα παράδειγμα

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 5. Κύκλος Ζωής Εφαρμογών ΕΝΟΤΗΤΑ 2. Εφαρμογές Πληροφορικής. Διδακτικές ενότητες 5.1 Πρόβλημα και υπολογιστής 5.2 Ανάπτυξη εφαρμογών

ΚΕΦΑΛΑΙΟ 5. Κύκλος Ζωής Εφαρμογών ΕΝΟΤΗΤΑ 2. Εφαρμογές Πληροφορικής. Διδακτικές ενότητες 5.1 Πρόβλημα και υπολογιστής 5.2 Ανάπτυξη εφαρμογών 44 Διδακτικές ενότητες 5.1 Πρόβλημα και υπολογιστής 5.2 Ανάπτυξη εφαρμογών Διδακτικοί στόχοι Σκοπός του κεφαλαίου είναι οι μαθητές να κατανοήσουν τα βήματα που ακολουθούνται κατά την ανάπτυξη μιας εφαρμογής.

Διαβάστε περισσότερα

Διαίρει και Βασίλευε. πρόβλημα μεγέθους Ν. διάσπαση. πρόβλημα μεγέθους k. πρόβλημα μεγέθους Ν-k

Διαίρει και Βασίλευε. πρόβλημα μεγέθους Ν. διάσπαση. πρόβλημα μεγέθους k. πρόβλημα μεγέθους Ν-k Διαίρει και Βασίλευε πρόβλημα μεγέθους Ν διάσπαση πρόβλημα μεγέθους k πρόβλημα μεγέθους Ν-k Διαίρει και Βασίλευε πρόβλημα μεγέθους Ν διάσπαση επιλύουμε αναδρομικά τα υποπροβλήματα πρόβλημα μεγέθους k πρόβλημα

Διαβάστε περισσότερα

Θεώρημα Βolzano. Κατηγορία 1 η. 11.1 Δίνεται η συνάρτηση:

Θεώρημα Βolzano. Κατηγορία 1 η. 11.1 Δίνεται η συνάρτηση: Κατηγορία η Θεώρημα Βolzano Τρόπος αντιμετώπισης:. Όταν μας ζητούν να εξετάσουμε αν ισχύει το θεώρημα Bolzano για μια συνάρτηση f σε ένα διάστημα [, ] τότε: Εξετάζουμε την συνέχεια της f στο [, ] (αν η

Διαβάστε περισσότερα

ΤΕΙ ΣΕΡΡΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΕΠΙΚΟΙΝΩΝΙΩΝ ΕΞΕΤΑΣΗ ΣΤΟ ΜΑΘΗΜΑ «ΑΝΑΓΝΩΡΙΣΗ ΠΡΟΤΥΠΩΝ ΝΕΥΡΩΝΙΚΑ ΔΙΚΤΥΑ» ΠΑ. 7 ΣΕΠΤΕΜΒΡΙΟΥ 2012

ΤΕΙ ΣΕΡΡΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΕΠΙΚΟΙΝΩΝΙΩΝ ΕΞΕΤΑΣΗ ΣΤΟ ΜΑΘΗΜΑ «ΑΝΑΓΝΩΡΙΣΗ ΠΡΟΤΥΠΩΝ ΝΕΥΡΩΝΙΚΑ ΔΙΚΤΥΑ» ΠΑ. 7 ΣΕΠΤΕΜΒΡΙΟΥ 2012 ΠΑ. 7 ΣΕΠΤΕΜΒΡΙΟΥ Δίνονται τα εξής πρότυπα: [ ] [ ] [ ] [ ] Άσκηση η (3 μονάδες) Χρησιμοποιώντας το κριτήριο της ομοιότητας να απορριφθεί ένα χαρακτηριστικό με βάση το συντελεστή συσχέτισης. (γράψτε ποιο

Διαβάστε περισσότερα

Κατηγοριοποίηση (classification) Το γενικό πρόβλημα της ανάθεσης ενός αντικειμένου σε μία ή περισσότερες προκαθορισμένες κατηγορίες (κλάσεις)

Κατηγοριοποίηση (classification) Το γενικό πρόβλημα της ανάθεσης ενός αντικειμένου σε μία ή περισσότερες προκαθορισμένες κατηγορίες (κλάσεις) Κατηγοριοποίηση ΙΙ Εξόρυξη Δεδομένων: Ακ. Έτος 200-20 ΚΑΤΗΓΟΡΙΟΠΟΙΗΣΗ II Κατηγοριοποίηση Κατηγοριοποίηση (classification) Το γενικό πρόβλημα της ανάθεσης ενός αντικειμένου σε μία ή περισσότερες προκαθορισμένες

Διαβάστε περισσότερα

Αριθμητική εύρεση ριζών μη γραμμικών εξισώσεων

Αριθμητική εύρεση ριζών μη γραμμικών εξισώσεων Αριθμητική εύρεση ριζών μη γραμμικών εξισώσεων Με τον όρο μη γραμμικές εξισώσεις εννοούμε εξισώσεις της μορφής: f( ) 0 που προέρχονται από συναρτήσεις f () που είναι μη γραμμικές ως προς. Περιέχουν δηλαδή

Διαβάστε περισσότερα

1 Αριθμητική κινητής υποδιαστολής και σφάλματα στρογγύλευσης

1 Αριθμητική κινητής υποδιαστολής και σφάλματα στρογγύλευσης 1 Αριθμητική κινητής υποδιαστολής και σφάλματα στρογγύλευσης Στη συγκεκριμένη ενότητα εξετάζουμε θέματα σχετικά με την αριθμητική πεπερασμένης ακρίβειας που χρησιμοποιούν οι σημερινοί υπολογιστές και τα

Διαβάστε περισσότερα

ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΚΕΝΤΡΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ ΣΧΟΛΗ ΤΜΗΜΑ. Μαθηματικά 2. Σταύρος Παπαϊωάννου

ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΚΕΝΤΡΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ ΣΧΟΛΗ ΤΜΗΜΑ. Μαθηματικά 2. Σταύρος Παπαϊωάννου ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΚΕΝΤΡΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ ΣΧΟΛΗ ΤΜΗΜΑ Μαθηματικά Σταύρος Παπαϊωάννου Ιούνιος 015 Τίτλος Μαθήματος Περιεχόμενα Χρηματοδότηση... Error! Bookmark not deined. Σκοποί Μαθήματος (Επικεφαλίδα

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ ΘΕΜΑ 1 ο (2.5 µονάδες) ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ Τελικές εξετάσεις 21 Σεπτεµβρίου 2004 ιάρκεια: 3 ώρες Το παρακάτω σύνολο

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 2 ΔΙΑΤΑΞΕΙΣ, ΜΕΤΑΘΕΣΕΙΣ, ΣΥΝΔΥΑΣΜΟΙ

ΚΕΦΑΛΑΙΟ 2 ΔΙΑΤΑΞΕΙΣ, ΜΕΤΑΘΕΣΕΙΣ, ΣΥΝΔΥΑΣΜΟΙ ΚΕΦΑΛΑΙΟ ΔΙΑΤΑΞΕΙΣ ΜΕΤΑΘΕΣΕΙΣ ΣΥΝΔΥΑΣΜΟΙ Εισαγωγή. Οι σχηματισμοί που προκύπτουν με την επιλογή ενός συγκεκριμένου αριθμού στοιχείων από το ίδιο σύνολο καλούνται διατάξεις αν μας ενδιαφέρει η σειρά καταγραφή

Διαβάστε περισσότερα

HMY 795: Αναγνώριση Προτύπων

HMY 795: Αναγνώριση Προτύπων HMY 795: Αναγνώριση Προτύπων Διάλεξη 5 Κατανομές πιθανότητας και εκτίμηση παραμέτρων δυαδικές τυχαίες μεταβλητές Bayesian decision Minimum misclassificaxon rate decision: διαλέγουμε την κατηγορία Ck για

Διαβάστε περισσότερα

Αλγόριθμοι και Πολυπλοκότητα

Αλγόριθμοι και Πολυπλοκότητα Αλγόριθμοι και Πολυπλοκότητα Ροή Δικτύου Δημήτρης Μιχαήλ Τμήμα Πληροφορικής και Τηλεματικής Χαροκόπειο Πανεπιστήμιο Μοντελοποίηση Δικτύων Μεταφοράς Τα γραφήματα χρησιμοποιούνται συχνά για την μοντελοποίηση

Διαβάστε περισσότερα

Τεχνητή Νοημοσύνη. 2η διάλεξη (2015-16) Ίων Ανδρουτσόπουλος. http://www.aueb.gr/users/ion/

Τεχνητή Νοημοσύνη. 2η διάλεξη (2015-16) Ίων Ανδρουτσόπουλος. http://www.aueb.gr/users/ion/ Τεχνητή Νοημοσύνη 2η διάλεξη (2015-16) Ίων Ανδρουτσόπουλος http://www.aueb.gr/users/ion/ 1 Οι διαφάνειες αυτής της διάλεξης βασίζονται στα βιβλία: Τεχνητή Νοημοσύνη των Βλαχάβα κ.ά., 3η έκδοση, Β. Γκιούρδας

Διαβάστε περισσότερα

Σημειώσεις Ανάλυσης Ι. Θεωρούμε γνωστούς τους φυσικούς αριθμούς

Σημειώσεις Ανάλυσης Ι. Θεωρούμε γνωστούς τους φυσικούς αριθμούς Σημειώσεις Ανάλυσης Ι 1. Οι ρητοί αριθμοί Θεωρούμε γνωστούς τους φυσικούς αριθμούς 1, 2, 3, και τις πράξεις (πρόσθεση - πολλαπλασιασμό)μεταξύ αυτών. Οι φυσικοί αριθμοί είναι επίσης διατεταγμένοι με κάποια

Διαβάστε περισσότερα

Ακαδημαϊκό Έτος , Χειμερινό Εξάμηνο Διδάσκων Καθ.: Νίκος Τσαπατσούλης

Ακαδημαϊκό Έτος , Χειμερινό Εξάμηνο Διδάσκων Καθ.: Νίκος Τσαπατσούλης ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΛΟΠΟΝΝΗΣΟΥ, ΤΜΗΜΑ ΤΕΧΝΟΛΟΓΙΑΣ ΤΗΛΕΠΙΚΟΙΝΩΝΙΩΝ ΚΕΣ 3: ΑΝΑΓΝΩΡΙΣΗ ΠΡΟΤΥΠΩΝ ΚΑΙ ΑΝΑΛΥΣΗ ΕΙΚΟΝΑΣ Ακαδημαϊκό Έτος 7 8, Χειμερινό Εξάμηνο Καθ.: Νίκος Τσαπατσούλης ΕΡΩΤΗΣΕΙΣ ΕΠΑΝΑΛΗΨΗΣ Το παρόν

Διαβάστε περισσότερα

ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ ΚΕΦΑΛΑΙΟ 17

ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ ΚΕΦΑΛΑΙΟ 17 ΚΕΦΑΛΑΙΟ 17 ΕΛΕΓΧΟΙ ΥΠΟΘΕΣΕΩΝ Στο κεφάλαιο αυτό θα αναφερθούμε σε ένα άλλο πρόβλημα της Στατιστικής που έχει κυρίως (αλλά όχι μόνο) σχέση με τις παραμέτρους ενός πληθυσμού (τις παραμέτρους της κατανομής

Διαβάστε περισσότερα

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 6. Πιθανότητες

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 6. Πιθανότητες ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΔΥΤΙΚΗΣ ΕΛΛΑΔΑΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΠΑΤΡΑΣ Εργαστήριο Λήψης Αποφάσεων & Επιχειρησιακού Προγραμματισμού Καθηγητής Ι. Μητρόπουλος ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ

Διαβάστε περισσότερα

2. Αν έχουμε μια συνάρτηση f η οποία είναι συνεχής σε ένα διάστημα Δ.

2. Αν έχουμε μια συνάρτηση f η οποία είναι συνεχής σε ένα διάστημα Δ. Κατηγορία η Εύρεση μονοτονίας Τρόπος αντιμετώπισης:. Αν έχουμε μια συνάρτηση f η οποία είναι συνεχής σε ένα διάστημα Δ. Αν f( ) σε κάθε εσωτερικό σημείο του Δ, τότε η f είναι γνησίως αύξουσα σε όλο το

Διαβάστε περισσότερα

Υπολογιστικό Πρόβληµα

Υπολογιστικό Πρόβληµα Υπολογιστικό Πρόβληµα Μετασχηµατισµός δεδοµένων εισόδου σε δεδοµένα εξόδου. Δοµή δεδοµένων εισόδου (έγκυρο στιγµιότυπο). Δοµή και ιδιότητες δεδοµένων εξόδου (απάντηση ή λύση). Τυπικά: διµελής σχέση στις

Διαβάστε περισσότερα

Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος

Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος Χιωτίδης Γεώργιος Τμήμα Λογιστικής και Χρηματοοικονομικής Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης

Διαβάστε περισσότερα

Κεφάλαιο 4: Διαφορικός Λογισμός

Κεφάλαιο 4: Διαφορικός Λογισμός ΣΥΓΧΡΟΝΗ ΠΑΙΔΕΙΑ ΦΡΟΝΤΙΣΤΗΡΙΟ ΜΕΣΗΣ ΕΚΠΑΙΔΕΥΣΗΣ Κεφάλαιο 4: Διαφορικός Λογισμός Μονοτονία Συνάρτησης Tζουβάλης Αθανάσιος Κεφάλαιο 4: Διαφορικός Λογισμός Περιεχόμενα Μονοτονία συνάρτησης... Λυμένα παραδείγματα...

Διαβάστε περισσότερα

Πανεπιστήμιο Κύπρου Πολυτεχνική Σχολή

Πανεπιστήμιο Κύπρου Πολυτεχνική Σχολή Πανεπιστήμιο Κύπρου Πολυτεχνική Σχολή Τμήμα Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών ΗΜΜΥ 795: ΑΝΑΓΝΩΡΙΣΗ ΠΡΟΤΥΠΩΝ Ακαδημαϊκό έτος 2010-11 Χειμερινό Εξάμηνο Practice final exam 1. Έστω ότι για

Διαβάστε περισσότερα

ΤΟΠΟΓΡΑΦΙΚΑ ΔΙΚΤΥΑ ΚΑΙ ΥΠΟΛΟΓΙΣΜΟΙ ΑΝΑΣΚΟΠΗΣΗ ΘΕΩΡΙΑΣ ΣΥΝΟΡΘΩΣΕΩΝ

ΤΟΠΟΓΡΑΦΙΚΑ ΔΙΚΤΥΑ ΚΑΙ ΥΠΟΛΟΓΙΣΜΟΙ ΑΝΑΣΚΟΠΗΣΗ ΘΕΩΡΙΑΣ ΣΥΝΟΡΘΩΣΕΩΝ ΤΟΠΟΓΡΑΦΙΚΑ ΔΙΚΤΥΑ ΚΑΙ ΥΠΟΛΟΓΙΣΜΟΙ ΑΝΑΣΚΟΠΗΣΗ ΘΕΩΡΙΑΣ ΣΥΝΟΡΘΩΣΕΩΝ Βασίλης Δ. Ανδριτσάνος Δρ. Αγρονόμος - Τοπογράφος Μηχανικός ΑΠΘ Επίκουρος Καθηγητής ΤΕΙ Αθήνας 3ο εξάμηνο http://eclass.teiath.gr Παρουσιάσεις,

Διαβάστε περισσότερα

Εισαγωγή ενός νέου στοιχείου. Επιλογή i-οστoύ στοιχείου : Εύρεση στοιχείου με το i-οστό μικρότερο κλειδί

Εισαγωγή ενός νέου στοιχείου. Επιλογή i-οστoύ στοιχείου : Εύρεση στοιχείου με το i-οστό μικρότερο κλειδί Δομές Αναζήτησης Χειριζόμαστε ένα σύνολο στοιχείων κλειδί από ολικά διατεταγμένο σύνολο όπου το κάθε στοιχείο έχει ένα Θέλουμε να υποστηρίξουμε δύο βασικές λειτουργίες: Εισαγωγή ενός νέου στοιχείου με

Διαβάστε περισσότερα

Περί της Ταξινόμησης των Ειδών

Περί της Ταξινόμησης των Ειδών Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης Σχολή Θετικών Επιστημών Τμήμα Φυσικής 541 24 Θεσσαλονίκη Καθηγητής Γεώργιος Θεοδώρου Tel.: +30 2310998051, Ιστοσελίδα: http://users.auth.gr/theodoru Περί της Ταξινόμησης

Διαβάστε περισσότερα

Πρόλογος... xv. Κεφάλαιο 1. Εισαγωγικές Έννοιες... 1

Πρόλογος... xv. Κεφάλαιο 1. Εισαγωγικές Έννοιες... 1 Πρόλογος... xv Κεφάλαιο 1. Εισαγωγικές Έννοιες... 1 1.1.Ιστορική Αναδρομή... 1 1.2.Βασικές Έννοιες... 5 1.3.Πλαίσιο ειγματοληψίας (Sampling Frame)... 9 1.4.Κατηγορίες Ιατρικών Μελετών.... 11 1.4.1.Πειραµατικές

Διαβάστε περισσότερα

3.7 Παραδείγματα Μεθόδου Simplex

3.7 Παραδείγματα Μεθόδου Simplex 3.7 Παραδείγματα Μεθόδου Simplex Παράδειγμα 1ο (Παράδειγμα 1ο - Κεφάλαιο 2ο - σελ. 10): Το πρόβλημα εκφράζεται από το μαθηματικό μοντέλο: max z = 600x T + 250x K + 750x Γ + 450x B 5x T + x K + 9x Γ + 12x

Διαβάστε περισσότερα

Θεωρία Υπολογισμού και Πολυπλοκότητα Μαθηματικό Υπόβαθρο

Θεωρία Υπολογισμού και Πολυπλοκότητα Μαθηματικό Υπόβαθρο Θεωρία Υπολογισμού και Πολυπλοκότητα Μαθηματικό Υπόβαθρο Στην ενότητα αυτή θα μελετηθούν τα εξής επιμέρους θέματα: Σύνολα Συναρτήσεις και Σχέσεις Γραφήματα Λέξεις και Γλώσσες Αποδείξεις ΕΠΛ 211 Θεωρία

Διαβάστε περισσότερα

Γραμμικός Προγραμματισμός Μέθοδος Simplex

Γραμμικός Προγραμματισμός Μέθοδος Simplex ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ Επιχειρησιακή Έρευνα Γραμμικός Προγραμματισμός Μέθοδος Simplex Η παρουσίαση προετοιμάστηκε από τον Ν.Α. Παναγιώτου Περιεχόμενα Παρουσίασης 1. Πρότυπη Μορφή ΓΠ 2. Πινακοποίηση

Διαβάστε περισσότερα

Δρ. Βασίλειος Γ. Καμπουρλάζος Δρ. Ανέστης Γ. Χατζημιχαηλίδης

Δρ. Βασίλειος Γ. Καμπουρλάζος Δρ. Ανέστης Γ. Χατζημιχαηλίδης Μάθημα 4 ο Δρ. Ανέστης Γ. Χατζημιχαηλίδης Τμήμα Μηχανικών Πληροφορικής Τ.Ε. ΤΕΙ Ανατολικής Μακεδονίας και Θράκης 2016-2017 Διευρυμένη Υπολογιστική Νοημοσύνη (ΥΝ) Επεκτάσεις της Κλασικής ΥΝ. Μεθοδολογίες

Διαβάστε περισσότερα

Μηχανική Μάθηση: γιατί;

Μηχανική Μάθηση: γιατί; Μηχανική Μάθηση Μηχανική Μάθηση: γιατί; Απαραίτητη για να μπορεί ο πράκτορας να ανταπεξέρχεται σε άγνωστα περιβάλλοντα Δεν είναι δυνατόν ο σχεδιαστής να προβλέψει όλα τα ενδεχόμενα περιβάλλοντα. Χρήσιμη

Διαβάστε περισσότερα

Κεφάλαιο 10 Εισαγωγή στην Εκτίμηση

Κεφάλαιο 10 Εισαγωγή στην Εκτίμηση Κεφάλαιο 10 Εισαγωγή στην Εκτίμηση Εκεί που είμαστε Κεφάλαια 7 και 8: Οι διωνυμικές,κανονικές, εκθετικές κατανομές και κατανομές Poisson μας επιτρέπουν να κάνουμε διατυπώσεις πιθανοτήτων γύρω από το Χ

Διαβάστε περισσότερα

Χρήστος Ι. Σχοινάς Αν. Καθηγητής ΔΠΘ. Συμπληρωματικές σημειώσεις για το μάθημα: «Επιχειρησιακή Έρευνα ΙΙ»

Χρήστος Ι. Σχοινάς Αν. Καθηγητής ΔΠΘ. Συμπληρωματικές σημειώσεις για το μάθημα: «Επιχειρησιακή Έρευνα ΙΙ» Χρήστος Ι. Σχοινάς Αν. Καθηγητής ΔΠΘ Συμπληρωματικές σημειώσεις για το μάθημα: «Επιχειρησιακή Έρευνα ΙΙ» 2 ΔΥΝΑΜΙΚΟΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ Προβλήματα ελάχιστης συνεκτικότητας δικτύου Το πρόβλημα της ελάχιστης

Διαβάστε περισσότερα

Τι είναι αλγόριθμος; Υποπρογράμματα (υποαλγόριθμοι) Βασικές αλγοριθμικές δομές

Τι είναι αλγόριθμος; Υποπρογράμματα (υποαλγόριθμοι) Βασικές αλγοριθμικές δομές Ιόνιο Πανεπιστήμιο Τμήμα Πληροφορικής Εισαγωγή στην Επιστήμη των Υπολογιστών 2015-16 Αλγόριθμοι και Δομές Δεδομένων (Ι) (εισαγωγικές έννοιες) http://di.ionio.gr/~mistral/tp/csintro/ Μ.Στεφανιδάκης Τι είναι

Διαβάστε περισσότερα

Συσχέτιση μεταξύ δύο συνόλων δεδομένων

Συσχέτιση μεταξύ δύο συνόλων δεδομένων Διαγράμματα διασποράς (scattergrams) Συσχέτιση μεταξύ δύο συνόλων δεδομένων Η οπτική απεικόνιση δύο συνόλων δεδομένων μπορεί να αποκαλύψει με παραστατικό τρόπο πιθανές τάσεις και μεταξύ τους συσχετίσεις,

Διαβάστε περισσότερα

ΑΝΑΛΥΣΗ ΚΑΤΗΓΟΡΙΚΩΝ ΔΕΔΟΜΕΝΩΝ. Σ. ΖΗΜΕΡΑΣ Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικών- Χρηματοοικονομικών Μαθηματικών Σάμος

ΑΝΑΛΥΣΗ ΚΑΤΗΓΟΡΙΚΩΝ ΔΕΔΟΜΕΝΩΝ. Σ. ΖΗΜΕΡΑΣ Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικών- Χρηματοοικονομικών Μαθηματικών Σάμος ΑΝΑΛΥΣΗ ΚΑΤΗΓΟΡΙΚΩΝ ΔΕΔΟΜΕΝΩΝ Σ. ΖΗΜΕΡΑΣ Τμήμα Μαθηματικών Κατεύθυνση Στατιστικής και Αναλογιστικών- Χρηματοοικονομικών Μαθηματικών Σάμος Εισαγωγή Αριθμητικά δεδομένα αντιστοιχούν σε πραγματοποιήσεις τυχαίων

Διαβάστε περισσότερα

Συνήθεις διαφορικές εξισώσεις προβλήματα οριακών τιμών

Συνήθεις διαφορικές εξισώσεις προβλήματα οριακών τιμών Συνήθεις διαφορικές εξισώσεις προβλήματα οριακών τιμών Οι παρούσες σημειώσεις αποτελούν βοήθημα στο μάθημα Αριθμητικές Μέθοδοι του 5 ου εξαμήνου του ΤΜΜ ημήτρης Βαλουγεώργης Καθηγητής Εργαστήριο Φυσικών

Διαβάστε περισσότερα

ΑΣΚΗΣΕΙΣ ΠΙΘΑΝΟΤΗΤΩΝ του Παν. Λ. Θεοδωρόπουλου 0

ΑΣΚΗΣΕΙΣ ΠΙΘΑΝΟΤΗΤΩΝ του Παν. Λ. Θεοδωρόπουλου 0 ΑΣΚΗΣΕΙΣ ΠΙΘΑΝΟΤΗΤΩΝ του Παν. Λ. Θεοδωρόπουλου 0 Η Θεωρία Πιθανοτήτων είναι ένας σχετικά νέος κλάδος των Μαθηματικών, ο οποίος παρουσιάζει πολλά ιδιαίτερα χαρακτηριστικά στοιχεία. Επειδή η ιδιαιτερότητα

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 2: ΟΡΙΖΟΥΣΕΣ

ΚΕΦΑΛΑΙΟ 2: ΟΡΙΖΟΥΣΕΣ ΚΕΦΑΛΑΙΟ ΚΕΦΑΛΑΙΟ :. ΕΙΣΑΓΩΓΗ Σε κάθε τετραγωνικό πίνακα ) τάξης n θα αντιστοιχίσουμε έναν πραγματικό ( ij αριθμό, τον οποίο θα ονομάσουμε ορίζουσα του πίνακα. Η ορίζουσα θα συμβολίζεται det ή Α ή n n

Διαβάστε περισσότερα

Κατηγοριοποίηση. 3 ο Φροντιστήριο. Ε Ξ Ό Ρ Υ Ξ Η Δ Ε Δ Ο Μ Έ Ν Ω Ν Κ Α Ι Α Λ Γ Ό Ρ Ι Θ Μ Ο Ι Μ Ά Θ Η Σ Η ς. Σκούρα Αγγελική

Κατηγοριοποίηση. 3 ο Φροντιστήριο. Ε Ξ Ό Ρ Υ Ξ Η Δ Ε Δ Ο Μ Έ Ν Ω Ν Κ Α Ι Α Λ Γ Ό Ρ Ι Θ Μ Ο Ι Μ Ά Θ Η Σ Η ς. Σκούρα Αγγελική Κατηγοριοποίηση Ε Ξ Ό Ρ Υ Ξ Η Δ Ε Δ Ο Μ Έ Ν Ω Ν Κ Α Ι Α Λ Γ Ό Ρ Ι Θ Μ Ο Ι Μ Ά Θ Η Σ Η ς 3 ο Φροντιστήριο Σκούρα Αγγελική skoura@ceid.upatras.gr Κατηγοριοποίηση (Classification) Σκοπός: Learn a method for

Διαβάστε περισσότερα

Υπολογιστική Νοημοσύνη. Μάθημα 12: Παραδείγματα Ασκήσεων 2

Υπολογιστική Νοημοσύνη. Μάθημα 12: Παραδείγματα Ασκήσεων 2 Υπολογιστική Νοημοσύνη Μάθημα 12: Παραδείγματα Ασκήσεων 2 Δίκτυα Πολλών Επιπέδων Με μη γραμμικούς νευρώνες Έστω ένα πρόβλημα κατηγοριοποίησης, με δύο βαθμούς ελευθερίας (x, y) και δύο κατηγορίες (A, B).

Διαβάστε περισσότερα

Υλοποιώντας λογικές πύλες χρησιμοποιώντας perceptrons

Υλοποιώντας λογικές πύλες χρησιμοποιώντας perceptrons Υλοποιώντας λογικές πύλες χρησιμοποιώντας perceptrons Ένας μικρός οδηγός Λευτέρης Ασλάνογλου Προπτυχιακός Φοιτητής Μηχανικών Η/Υ & Πληροφορικής Πάτρας Τρίτη, 5 Ιουνίου 2012 Το παρακάτω είναι ένα tutorial

Διαβάστε περισσότερα

Γραµµικοί Ταξινοµητές

Γραµµικοί Ταξινοµητές ΚΕΣ 3: Αναγνώριση Προτύπων και Ανάλυση Εικόνας KEΣ 3 Αναγνώριση Προτύπων και Ανάλυση Εικόνας Γραµµικοί Ταξινοµητές ΤµήµαΕπιστήµης και Τεχνολογίας Τηλεπικοινωνιών Πανεπιστήµιο Πελοποννήσου 7 Ncolas sapatsouls

Διαβάστε περισσότερα

ETY-202 ΤΑ ΜΑΘΗΜΑΤΙΚΑ ΕΡΓΑΛΕΙΑ ΤΗΣ ΚΒΑΝΤΟΜΗΧΑΝΙΚΗΣ ETY-202 ΎΛΗ & ΦΩΣ 02. ΜΑΘΗΜΑΤΙΚΑ ΕΡΓΑΛΕΙΑ. Στέλιος Τζωρτζάκης 1/11/2013

ETY-202 ΤΑ ΜΑΘΗΜΑΤΙΚΑ ΕΡΓΑΛΕΙΑ ΤΗΣ ΚΒΑΝΤΟΜΗΧΑΝΙΚΗΣ ETY-202 ΎΛΗ & ΦΩΣ 02. ΜΑΘΗΜΑΤΙΚΑ ΕΡΓΑΛΕΙΑ. Στέλιος Τζωρτζάκης 1/11/2013 stzortz@iesl.forth.gr 1396; office Δ013 ΙΤΕ 2 ΎΛΗ & ΦΩΣ 02. ΜΑΘΗΜΑΤΙΚΑ ΕΡΓΑΛΕΙΑ ΤΑ ΜΑΘΗΜΑΤΙΚΑ ΕΡΓΑΛΕΙΑ ΤΗΣ ΚΒΑΝΤΟΜΗΧΑΝΙΚΗΣ Στέλιος Τζωρτζάκης 1 3 4 Ο διανυσματικός χώρος των φυσικών καταστάσεων Η έννοια

Διαβάστε περισσότερα

Ασκήσεις μελέτης της 4 ης διάλεξης. ), για οποιοδήποτε μονοπάτι n 1

Ασκήσεις μελέτης της 4 ης διάλεξης. ), για οποιοδήποτε μονοπάτι n 1 Οικονομικό Πανεπιστήμιο Αθηνών, Τμήμα Πληροφορικής Μάθημα: Τεχνητή Νοημοσύνη, 2016 17 Διδάσκων: Ι. Ανδρουτσόπουλος Ασκήσεις μελέτης της 4 ης διάλεξης 4.1. (α) Αποδείξτε ότι αν η h είναι συνεπής, τότε h(n

Διαβάστε περισσότερα

5. ΣΥΣΤΗΜΑΤΙΚΗ ΔΕΙΓΜΑΤΟΛΗΨΙΑ (Systematic Sampling)

5. ΣΥΣΤΗΜΑΤΙΚΗ ΔΕΙΓΜΑΤΟΛΗΨΙΑ (Systematic Sampling) 5. ΣΥΣΤΗΜΑΤΙΚΗ ΔΕΙΓΜΑΤΟΛΗΨΙΑ (Systematic Sampling) Συχνά, είναι ταχύτερη και ευκολότερη η επιλογή των μονάδων του πληθυσμού, αν αυτή γίνεται από κάποιο κατάλογο ξεκινώντας από κάποιο τυχαίο αρχικό σημείο

Διαβάστε περισσότερα

Αριθμοθεωρητικοί Αλγόριθμοι

Αριθμοθεωρητικοί Αλγόριθμοι Αλγόριθμοι που επεξεργάζονται μεγάλους ακέραιους αριθμούς Μέγεθος εισόδου: Αριθμός bits που απαιτούνται για την αναπαράσταση των ακεραίων. Έστω ότι ένας αλγόριθμος λαμβάνει ως είσοδο έναν ακέραιο Ο αλγόριθμος

Διαβάστε περισσότερα

I. ΜΙΓΑΔΙΚΟΙ ΑΡΙΘΜΟΙ. math-gr

I. ΜΙΓΑΔΙΚΟΙ ΑΡΙΘΜΟΙ. math-gr I ΜΙΓΑΔΙΚΟΙ ΑΡΙΘΜΟΙ i e ΜΕΡΟΣ Ι ΟΡΙΣΜΟΣ - ΒΑΣΙΚΕΣ ΠΡΑΞΕΙΣ Α Ορισμός Ο ορισμός του συνόλου των Μιγαδικών αριθμών (C) βασίζεται στις εξής παραδοχές: Υπάρχει ένας αριθμός i για τον οποίο ισχύει i Το σύνολο

Διαβάστε περισσότερα

3. O ΑΛΓΟΡΙΘΜΟΣ ΤΟΥ PERCEPTRON

3. O ΑΛΓΟΡΙΘΜΟΣ ΤΟΥ PERCEPTRON 3. O ΑΛΓΟΡΙΘΜΟΣ ΤΟΥ PERCEPRON 3. ΕΙΣΑΓΩΓΗ: Το Perceptron είναι η απλούστερη μορφή Νευρωνικού δικτύου, το οποίο χρησιμοποιείται για την ταξινόμηση ενός ειδικού τύπου προτύπων, που είναι γραμμικά διαχωριζόμενα.

Διαβάστε περισσότερα

β) 3 n < n!, n > 6 i i! = (n + 1)! 1, n 1 i=1

β) 3 n < n!, n > 6 i i! = (n + 1)! 1, n 1 i=1 Κεφάλαιο 2: Στοιχεία Λογικής - Μέθοδοι Απόδειξης 1. Να αποδειχθεί ότι οι λογικοί τύποι: (p ( (( p) q))) (p q) και p είναι λογικά ισοδύναμοι. Θέλουμε να αποδείξουμε ότι: (p ( (( p) q))) (p q) p, ή με άλλα

Διαβάστε περισσότερα

ΕΛΕΓΧΟΣ ΠΑΡΑΓΩΓΙΚΩΝ ΔΙΕΡΓΑΣΙΩΝ

ΕΛΕΓΧΟΣ ΠΑΡΑΓΩΓΙΚΩΝ ΔΙΕΡΓΑΣΙΩΝ ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Ανώτατο Εκπαιδευτικό Ίδρυμα Πειραιά Τεχνολογικού Τομέα ΕΛΕΓΧΟΣ ΠΑΡΑΓΩΓΙΚΩΝ ΔΙΕΡΓΑΣΙΩΝ Ενότητα: Αναγνώριση Διεργασίας - Προσαρμοστικός Έλεγχος (Process Identification) Αλαφοδήμος Κωνσταντίνος

Διαβάστε περισσότερα

Δομές Δεδομένων και Αλγόριθμοι

Δομές Δεδομένων και Αλγόριθμοι Δομές Δεδομένων και Αλγόριθμοι Χρήστος Γκόγκος ΤΕΙ Ηπείρου Χειμερινό Εξάμηνο 2014-2015 Παρουσίαση 20 Huffman codes 1 / 12 Κωδικοποίηση σταθερού μήκους Αν χρησιμοποιηθεί κωδικοποίηση σταθερού μήκους δηλαδή

Διαβάστε περισσότερα

Στατιστική Ι. Ενότητα 8: Επαγωγική Στατιστική. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

Στατιστική Ι. Ενότητα 8: Επαγωγική Στατιστική. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών Στατιστική Ι Ενότητα 8: Επαγωγική Στατιστική. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για εκπαιδευτικό

Διαβάστε περισσότερα

Μέρος Β /Στατιστική. Μέρος Β. Στατιστική. Γεωπονικό Πανεπιστήμιο Αθηνών Εργαστήριο Μαθηματικών&Στατιστικής/Γ. Παπαδόπουλος (www.aua.

Μέρος Β /Στατιστική. Μέρος Β. Στατιστική. Γεωπονικό Πανεπιστήμιο Αθηνών Εργαστήριο Μαθηματικών&Στατιστικής/Γ. Παπαδόπουλος (www.aua. Μέρος Β /Στατιστική Μέρος Β Στατιστική Γεωπονικό Πανεπιστήμιο Αθηνών Εργαστήριο Μαθηματικών&Στατιστικής/Γ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) Από τις Πιθανότητες στη Στατιστική Στα προηγούμενα, στο

Διαβάστε περισσότερα

Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ. (Power of a Test) ΚΕΦΑΛΑΙΟ 21

Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ. (Power of a Test) ΚΕΦΑΛΑΙΟ 21 ΚΕΦΑΛΑΙΟ 21 Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ (Power of a Test) Όπως είδαμε προηγουμένως, στον Στατιστικό Έλεγχο Υποθέσεων, ορίζουμε δύο είδη πιθανών λαθών (κινδύνων) που μπορεί να συμβούν όταν παίρνουμε αποφάσεις

Διαβάστε περισσότερα

Επαναληπτικά θέματα στα Μαθηματικά προσανατολισμού-ψηφιακό σχολείο ΕΠΑΝΑΛΗΠΤΙΚΑ ΘΕΜΑΤΑ ΣΤΑ ΜΑΘΗΜΑΤΙΚΑ ΠΡΟΣΑΝΑΤΟΛΙΣΜΟΥ ΘΕΤΙΚΩΝ ΣΠΟΥΔΩΝ

Επαναληπτικά θέματα στα Μαθηματικά προσανατολισμού-ψηφιακό σχολείο ΕΠΑΝΑΛΗΠΤΙΚΑ ΘΕΜΑΤΑ ΣΤΑ ΜΑΘΗΜΑΤΙΚΑ ΠΡΟΣΑΝΑΤΟΛΙΣΜΟΥ ΘΕΤΙΚΩΝ ΣΠΟΥΔΩΝ ΕΠΑΝΑΛΗΠΤΙΚΑ ΘΕΜΑΤΑ ΣΤΑ ΜΑΘΗΜΑΤΙΚΑ ΠΡΟΣΑΝΑΤΟΛΙΣΜΟΥ ΚΕΦΑΛΑΙΟ 1 ο -ΣΥΝΑΡΤΗΣΕΙΣ ΘΕΤΙΚΩΝ ΣΠΟΥΔΩΝ ΣΠΟΥΔΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΠΛΗΡΟΦΟΡΙΚΗΣ Απο το Ψηφιακό Σχολείο του ΥΠΠΕΘ Επιμέλεια: Συντακτική Ομάδα mathpgr Συντονιστής:

Διαβάστε περισσότερα

Περιεχόμενα. Γιατί Ένας Manager Πρέπει να Ξέρει Στατιστική. Περιεχόμενα. Η Ανάπτυξη και Εξέλιξη της Σύγχρονης Στατιστικής

Περιεχόμενα. Γιατί Ένας Manager Πρέπει να Ξέρει Στατιστική. Περιεχόμενα. Η Ανάπτυξη και Εξέλιξη της Σύγχρονης Στατιστικής Chapter 1 Student Lecture Notes 1-1 Ανάλυση Δεδομένων και Στατιστική για Διοικήση Επιχειρήσεων [Basic Business Statistics (8 th Edition)] Κεφάλαιο 1 Εισαγωγή και Συλλογή Δεδομένων Περιεχόμενα Γιατί ένας

Διαβάστε περισσότερα

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium iv

Σ ΤΑΤ Ι Σ Τ Ι Κ Η. Statisticum collegium iv Σ ΤΑΤ Ι Σ Τ Ι Κ Η i Statisticum collegium iv Στατιστική Συμπερασματολογία Ι Σημειακές Εκτιμήσεις Διαστήματα Εμπιστοσύνης Στατιστική Συμπερασματολογία (Statistical Inference) Το πεδίο της Στατιστικής Συμπερασματολογία,

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ Ερωτήσεις πολλαπλής επιλογής Συντάκτης: Δημήτριος Κρέτσης 1. Ο κλάδος της περιγραφικής Στατιστικής: α. Ασχολείται με την επεξεργασία των δεδομένων και την ανάλυση

Διαβάστε περισσότερα

Ένα αναλογικό σήμα περιέχει άπειρες πιθανές τιμές. Για παράδειγμα ένας απλός ήχος αν τον βλέπαμε σε ένα παλμογράφο θα έμοιαζε με το παρακάτω:

Ένα αναλογικό σήμα περιέχει άπειρες πιθανές τιμές. Για παράδειγμα ένας απλός ήχος αν τον βλέπαμε σε ένα παλμογράφο θα έμοιαζε με το παρακάτω: Σημειώσεις Δικτύων Αναλογικά και ψηφιακά σήματα Ένα αναλογικό σήμα περιέχει άπειρες πιθανές τιμές. Για παράδειγμα ένας απλός ήχος αν τον βλέπαμε σε ένα παλμογράφο θα έμοιαζε με το παρακάτω: Χαρακτηριστικά

Διαβάστε περισσότερα

Σειρά Προβλημάτων 5 Λύσεις

Σειρά Προβλημάτων 5 Λύσεις Άσκηση 1 Σειρά Προβλημάτων 5 Λύσεις Να δείξετε ότι οι πιο κάτω γλώσσες είναι διαγνώσιμες. (α) { G,k η G είναι μια ασυμφραστική γραμματική η οποία παράγει κάποια λέξη 1 n όπου n k } (β) { Μ,k η Μ είναι

Διαβάστε περισσότερα

Μέθοδοι Μηχανικής Μάθησης στην επεξεργασία Τηλεπισκοπικών Δεδομένων. Δρ. Ε. Χάρου

Μέθοδοι Μηχανικής Μάθησης στην επεξεργασία Τηλεπισκοπικών Δεδομένων. Δρ. Ε. Χάρου Μέθοδοι Μηχανικής Μάθησης στην επεξεργασία Τηλεπισκοπικών Δεδομένων Δρ. Ε. Χάρου Πρόγραμμα υπολογιστικής ευφυίας Ινστιτούτο Πληροφορικής & Τηλεπικοινωνιών ΕΚΕΦΕ ΔΗΜΟΚΡΙΤΟΣ exarou@iit.demokritos.gr Μηχανική

Διαβάστε περισσότερα

ΔΕΙΓΜΑΤΟΛΗΨΙΑ. Ματσάγκος Ιωάννης-Μαθηματικός

ΔΕΙΓΜΑΤΟΛΗΨΙΑ. Ματσάγκος Ιωάννης-Μαθηματικός 1 ΔΕΙΓΜΑΤΟΛΗΨΙΑ -Είναι γνωστό, ότι στη Στατιστική, όταν χρησιμοποιούμε τον όρο πληθυσμός, δηλώνουμε, το σύνολο των ατόμων ή αντικειμένων, στα οποία αναφέρονται οι παρατηρήσεις μας Τα στοιχεία του συνόλου

Διαβάστε περισσότερα

Συνέχεια συνάρτησης σε κλειστό διάστημα

Συνέχεια συνάρτησης σε κλειστό διάστημα 8 Συνέχεια συνάρτησης σε κλειστό διάστημα Α ΑΠΑΡΑΙΤΗΤΕΣ ΓΝΩΣΕΙΣ ΘΕΩΡΙΑΣ 1 Μια συνάρτηση f θα λέμε ότι είναι: i Συνεχής σε ένα ανοιχτό διάστημα (α,β) όταν είναι συνεχής σε κάθε σημείο του διαστήματος (α,β)

Διαβάστε περισσότερα

E[ (x- ) ]= trace[(x-x)(x- ) ]

E[ (x- ) ]= trace[(x-x)(x- ) ] 1 ΦΙΛΤΡΟ KALMAN ΔΙΑΚΡΙΤΟΥ ΧΡΟΝΟΥ Σε αυτό το μέρος της πτυχιακής θα ασχοληθούμε λεπτομερώς με το φίλτρο kalman και θα δούμε μια καινούρια έκδοση του φίλτρου πάνω στην εφαρμογή της γραμμικής εκτίμησης διακριτού

Διαβάστε περισσότερα

ΣΥΝΕΚΤΙΚΟΤΗΤΑ ΓΡΑΦΗΜΑΤΩΝ

ΣΥΝΕΚΤΙΚΟΤΗΤΑ ΓΡΑΦΗΜΑΤΩΝ Συνεκτικότητα Γραφημάτων 123 ΚΕΦΑΛΑΙΟ 4 ΣΥΝΕΚΤΙΚΟΤΗΤΑ ΓΡΑΦΗΜΑΤΩΝ 4.1 Τοπική και Ολική Συνεκτικότητα Γραφημάτων 4.2 Συνεκτικότητα Μη-κατευθυνόμενων Γραφημάτων 4.3 Συνεκτικότητα Κατευθυνόμενων Γραφημάτων

Διαβάστε περισσότερα

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ Θ.Ε. ΠΛΗ31 (2004-5) ΓΡΑΠΤΗ ΕΡΓΑΣΙΑ #3 Στόχος Στόχος αυτής της εργασίας είναι η απόκτηση δεξιοτήτων σε θέματα που αφορούν τα Τεχνητά Νευρωνικά Δίκτυα και ποιο συγκεκριμένα θέματα εκπαίδευσης και υλοποίησης.

Διαβάστε περισσότερα

Η ΜΕΘΟΔΟΣ PCA (Principle Component Analysis)

Η ΜΕΘΟΔΟΣ PCA (Principle Component Analysis) Η ΜΕΘΟΔΟΣ PCA (Principle Component Analysis) Η μέθοδος PCA (Ανάλυση Κύριων Συνιστωσών), αποτελεί μία γραμμική μέθοδο συμπίεσης Δεδομένων η οποία συνίσταται από τον επαναπροσδιορισμό των συντεταγμένων ενός

Διαβάστε περισσότερα

Θεωρία Υπολογισμού και Πολυπλοκότητα Κανονικές Γλώσσες (2)

Θεωρία Υπολογισμού και Πολυπλοκότητα Κανονικές Γλώσσες (2) Θεωρία Υπολογισμού και Πολυπλοκότητα Κανονικές Γλώσσες (2) Στην ενότητα αυτή θα μελετηθούν τα εξής επιμέρους θέματα: Κανονικές Εκφράσεις (1.3) Τυπικός Ορισμός Ισοδυναμία με κανονικές γλώσσες Μη Κανονικές

Διαβάστε περισσότερα

ΜΟΝΤΕΛΟΠΟΙΗΣΗ ΔΙΑΚΡΙΤΩΝ ΕΝΑΛΛΑΚΤΙΚΩΝ ΣΕ ΠΡΟΒΛΗΜΑΤΑ ΣΧΕΔΙΑΣΜΟΥ ΚΑΙ ΣΥΝΘΕΣΗΣ ΔΙΕΡΓΑΣΙΩΝ

ΜΟΝΤΕΛΟΠΟΙΗΣΗ ΔΙΑΚΡΙΤΩΝ ΕΝΑΛΛΑΚΤΙΚΩΝ ΣΕ ΠΡΟΒΛΗΜΑΤΑ ΣΧΕΔΙΑΣΜΟΥ ΚΑΙ ΣΥΝΘΕΣΗΣ ΔΙΕΡΓΑΣΙΩΝ ΜΕΡΟΣ ΙΙ ΜΟΝΤΕΛΟΠΟΙΗΣΗ ΔΙΑΚΡΙΤΩΝ ΕΝΑΛΛΑΚΤΙΚΩΝ ΣΕ ΠΡΟΒΛΗΜΑΤΑ ΣΧΕΔΙΑΣΜΟΥ ΚΑΙ ΣΥΝΘΕΣΗΣ ΔΙΕΡΓΑΣΙΩΝ 36 ΜΟΝΤΕΛΟΠΟΙΗΣΗ ΔΙΑΚΡΙΤΩΝ ΕΝΑΛΛΑΚΤΙΚΩΝ ΣΕ ΠΡΟΒΛΗΜΑΤΑ ΣΧΕΔΙΑΣΜΟΥ ΚΑΙ ΣΥΝΘΕΣΗΣ ΔΙΕΡΓΑΣΙΩΝ Πολλές από τις αποφάσεις

Διαβάστε περισσότερα

Αλγόριθμοι για αυτόματα

Αλγόριθμοι για αυτόματα Κεφάλαιο 8 Αλγόριθμοι για αυτόματα Κύρια βιβλιογραφική αναφορά για αυτό το Κεφάλαιο είναι η Hopcroft, Motwani, and Ullman 2007. 8.1 Πότε ένα DFA αναγνωρίζει κενή ή άπειρη γλώσσα Δοθέντος ενός DFA M καλούμαστε

Διαβάστε περισσότερα

3. Προσομοίωση ενός Συστήματος Αναμονής.

3. Προσομοίωση ενός Συστήματος Αναμονής. 3. Προσομοίωση ενός Συστήματος Αναμονής. 3.1. Διατύπωση του Προβλήματος. Τα συστήματα αναμονής (queueing systems), βρίσκονται πίσω από τα περισσότερα μοντέλα μελέτης της απόδοσης υπολογιστικών συστημάτων,

Διαβάστε περισσότερα

ΠΑΡΑΔΕΙΓΜΑΤΑ ΘΕΜΑ Β. Να εξετάσετε αν ισχύουν οι υποθέσεις του Θ.Μ.Τ. για την συνάρτηση στο διάστημα [ 1,1] τέτοιο, ώστε: C στο σημείο (,f( ))

ΠΑΡΑΔΕΙΓΜΑΤΑ ΘΕΜΑ Β. Να εξετάσετε αν ισχύουν οι υποθέσεις του Θ.Μ.Τ. για την συνάρτηση στο διάστημα [ 1,1] τέτοιο, ώστε: C στο σημείο (,f( )) ΚΕΦΑΛΑΙΟ ο: ΔΙΑΦΟΡΙΚΟΣ ΛΟΓΙΣΜΟΣ ΕΝΟΤΗΤΑ 6: ΘΕΩΡΗΜΑ ΜΕΣΗΣ ΤΙΜΗΣ ΔΙΑΦΟΡΙΚΟΥ ΛΟΓΙΣΜΟΥ (Θ.Μ.Τ.) [Θεώρημα Μέσης Τιμής Διαφορικού Λογισμού του κεφ..5 Μέρος Β του σχολικού βιβλίου]. ΠΑΡΑΔΕΙΓΜΑΤΑ Παράδειγμα. ΘΕΜΑ

Διαβάστε περισσότερα

Αλεξάνδρειο ΣΕΙ Θεσσαλονίκης 1. Σμήμα Διοίκησης Επιχειρήσεων 2. Σμήμα Μηχανικών Πληροφορικής

Αλεξάνδρειο ΣΕΙ Θεσσαλονίκης 1. Σμήμα Διοίκησης Επιχειρήσεων 2. Σμήμα Μηχανικών Πληροφορικής Εξόρυξη γνώσης από σχόλια σε τουριστικές ιστοσελίδες και παραγοντική ανάλυση του αισθήματος ικανοποίησης των πελατών για το ξενοδοχείο τους Γιώργος ταλίδης 1, Παναγιώτης ταλίδης 2, Κώστας Διαμαντάρας 2

Διαβάστε περισσότερα

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ Ι Συμπληρωματικές Σημειώσεις Δημήτριος Παντελής

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ Ι Συμπληρωματικές Σημειώσεις Δημήτριος Παντελής ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ Ι Συμπληρωματικές Σημειώσεις Δημήτριος Παντελής ΣΤΑΤΙΣΤΙΚΕΣ ΕΚΤΙΜΗΣΕΙΣ Οι συναρτήσεις πιθανότητας ή πυκνότητας πιθανότητας των διαφόρων τυχαίων μεταβλητών χαρακτηρίζονται από κάποιες

Διαβάστε περισσότερα

Πινάκες συνάφειας. Βαρύτητα συμπτωμάτων. Φύλο Χαμηλή Υψηλή. Άνδρες. Γυναίκες

Πινάκες συνάφειας. Βαρύτητα συμπτωμάτων. Φύλο Χαμηλή Υψηλή. Άνδρες. Γυναίκες Πινάκες συνάφειας εξερεύνηση σχέσεων μεταξύ τυχαίων μεταβλητών. Είναι λογικό λοιπόν, στην ανάλυση των κατηγορικών δεδομένων να μας ενδιαφέρει η σχέση μεταξύ δύο ή περισσότερων κατηγορικών μεταβλητών. Έστω

Διαβάστε περισσότερα

Υπολογιστικά & Διακριτά Μαθηματικά

Υπολογιστικά & Διακριτά Μαθηματικά Υπολογιστικά & Διακριτά Μαθηματικά Ενότητα 3: Σύνολα Συνδυαστική Στεφανίδης Γεώργιος Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για εκπαιδευτικό υλικό, όπως

Διαβάστε περισσότερα

Σχεδίαση & Ανάλυση Αλγορίθμων

Σχεδίαση & Ανάλυση Αλγορίθμων Σχεδίαση & Ανάλυση Αλγορίθμων Ενότητα 3 Αλγόριθμοι Επιλογής Σταύρος Δ. Νικολόπουλος Τμήμα Μηχανικών Η/Υ & Πληροφορικής Πανεπιστήμιο Ιωαννίνων Webpage: www.cs.uoi.gr/~stavros Αλγόριθμοι Επιλογής Γνωρίζουμε

Διαβάστε περισσότερα

Βασικές έννοιες της Στατιστικής: Πληθυσμός - Δείγμα

Βασικές έννοιες της Στατιστικής: Πληθυσμός - Δείγμα Βασικές έννοιες της Στατιστικής: Πληθυσμός - Δείγμα Στατιστική είναι ο κλάδος των μαθηματικών που εμβαθύνει σε μεθόδους συλλογής δεδομένων, οργάνωσης, παρουσίασης των δεδομένων και εξαγωγής συμπερασμάτων

Διαβάστε περισσότερα

Μ Α Θ Η Μ Α Τ Α Γ Λ Υ Κ Ε Ι Ο Υ

Μ Α Θ Η Μ Α Τ Α Γ Λ Υ Κ Ε Ι Ο Υ Μ Α Θ Η Μ Α Τ Α Γ Λ Υ Κ Ε Ι Ο Υ ΜΑΘΗΜΑΤΙΚΑ ΠΡΟΣΑΝΑΤΟΛΙΣΜΟΥ ΘΕΤΙΚΩΝ ΣΠΟΥΔΩΝ ΚΑΙ ΣΠΟΥΔΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΠΛΗΡΟΦΟΡΙΚΗΣ (Α ΜΕΡΟΣ: ΣΥΝΑΡΤΗΣΕΙΣ) Επιμέλεια: Καραγιάννης Ιωάννης, Σχολικός Σύμβουλος Μαθηματικών

Διαβάστε περισσότερα

HMY 795: Αναγνώριση Προτύπων

HMY 795: Αναγνώριση Προτύπων HMY 795: Αναγνώριση Προτύπων Διάλεξη 2 Επισκόπηση θεωρίας πιθανοτήτων Τυχαίες μεταβλητές: Βασικές έννοιες Τυχαία μεταβλητή: Μεταβλητή της οποίας δε γνωρίζουμε με βεβαιότητα την τιμή (σε αντίθεση με τις

Διαβάστε περισσότερα