Π ΤΥΧΙΑΚΗ/ Δ ΙΠΛΩΜΑΤΙΚΗ Ε ΡΓΑΣΙΑ

Μέγεθος: px
Εμφάνιση ξεκινά από τη σελίδα:

Download "Π ΤΥΧΙΑΚΗ/ Δ ΙΠΛΩΜΑΤΙΚΗ Ε ΡΓΑΣΙΑ"

Transcript

1 Α ΡΙΣΤΟΤΕΛΕΙΟ Π ΑΝΕΠΙΣΤΗΜΙΟ Θ ΕΣΣΑΛΟΝΙΚΗΣ ΣΧΟΛΗ ΘΕΤΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Π ΤΥΧΙΑΚΗ/ Δ ΙΠΛΩΜΑΤΙΚΗ Ε ΡΓΑΣΙΑ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΚΑΙ ΠΡΟΒΛΕΨΗ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΑΓΩΝΩΝ ΠΟΔΟΣΦΑΙΡΟΥ ΠΑΥΛΟΣ ΠΟΛΙΑΝΙΔΗΣ Α.Ε.Μ: 1586 ΕΠΙΒΛΕΠΩΝ ΚΑΘΗΓΗΤΗΣ: Γρηγόριος Τσουμάκας, Λέκτορας ΘΕΣΣΑΛΟΝΙΚΗ ΙΟΥΛΙΟΣ 2010

2

3

4

5

6

7 ΠΕΡΙΛΗΨΗ Π ΕΡΙΛΗΨΗ Το αντικείμενο της παρούσας πτυχιακής εργασίας είναι η στατιστική ανάλυση καθώς και η πρόβλεψη αγώνων ποδοσφαίρου. Το πρώτο κομμάτι της εργασίας αφορά την συγκέντρωση πληροφοριών σχετικά με αγώνες ποδοσφαίρου από όλο τον κόσμο (όπως αποτελέσματα, ημερομηνία, σκορ ημιχρόνου, πρωτάθλημα κ.α. ) καθώς επίσης και τις αποδόσεις στοιχήματος στους αγώνες αυτούς. Τα δεδομένα συλλέγονται με αυτόματο τρόπο από αρχεία XML που είναι διαθέσιμα στον ιστότοπο του ΟΠΑΠ και αποθηκεύονται σε μια βάση δεδομένων. Στο δεύτερο κομμάτι της εργασίας γίνεται μια προσπάθεια πρόβλεψης των αποτελεσμάτων των αγώνων, χρησιμοποιώντας τις πληροφορίες που συγκεντρώσαμε και είναι αποθηκευμένες στην βάση δεδομένων. Πρόκειται ουσιαστικά, για εφαρμογή αλγορίθμων μηχανικής μάθησης και συγκεκριμένα αλγορίθμων ταξινόμησης (classification algorithms) ώστε να γίνει η κατάταξη των επικείμενων αγώνων ποδοσφαίρου σε μια από τις τρείς κατηγορίες ( νίκη γηπεδούχου ομάδας, ισοπαλία, νίκη φιλοξενούμενης ομάδας), σύμφωνα με την δυναμική των ομάδων. Το πρόβλημα αυτό ανήκει στην κατηγορία των προβλημάτων ταξινόμησης, στα οποία δεν μας ενδιαφέρει απλώς να κατατάξουμε ένα στιγμιότυπο (instance) σε κάποια από τις εναλλακτικές κλάσεις (classification labels), αλλά μας ενδιαφέρει και το κόστος ( ή ανάλογα το κέρδος ) που θα έχουμε από αυτήν την κατηγοριοποίηση. Οι αλγόριθμοι αυτή, λαμβάνουν υπ όψιν το κόστος της σωστής πρόβλεψης καθώς και το κόστος της λανθασμένης πρόβλεψης (misclassification cost) ώστε να πετύχουν όσο το δυνατόν πιο ιδανική πρόβλεψη. Το είδος αυτό της μάθησης, ονομάζεται costsensitive machine learning[5,3]. Το σύνολο των παραπάνω αλγορίθμων, ανήκει στην κατηγορία των λεγόμενων αλγορίθμων μάθησης που είναι ευαίσθητοι ως προς το κόστος (cost-sensitive learning algorithms). Αποτελεί έναν νέο τομέα της μηχανικής μάθησης γύρω από τον οποίο γίνεται πολύ έρευνα, γιατί καθίσταται όλο και πιο φανερό ότι οι περισσότερες εφαρμογές μηχανικής μάθησης, πλέον απαιτούν τη χρήση cost-sensitive αλγορίθμων, οι οποίοι θα εξετάζουν τον κίνδυνο που εγκυμονεί η πρόβλεψη που θα κάνουν. Στις σελίδες που ακολουθούν θα δείξουμε πώς θα εφαρμόσουμε cost-sensitive algorithms with different cost per instance (όπου το κόστος κατηγοριοποίησης είναι διαφορετικό για κάθε στιγμιότυπο ) πάνω στο δικό μας πρόβλημα. ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΚΑΙ ΠΡΟΒΛΕΨΗ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΑΓΩΝΩΝ ΠΟΔΟΣΦΑΙΡΟΥ VII

8

9 ΕΥΧΑΡΙΣΤΙΕΣ Ε ΥΧΑΡΙΣΤΙΕΣ Καταρχάς θα ήθελα να εκφράσω τις αληθινές μου ευχαριστίες στον επιβλέπων της πτυχιακής εργασίας κ. Τσουμάκα Γρηγόριο, Λέκτορα του τμήματος πληροφορικής του Αριστοτέλειου πανεπιστημίου, για την εμπιστοσύνη μου έδειξε κατά την ανάθεση της παρούσας πτυχιακής, αλλά και την αμέριστη συμπαράσταση καθ όλη τη διάρκεια της εκπόνησης της. Τέλος θα ήθελα να ευχαριστήσω του γονείς μου, για όλη τη βοήθεια τόσο ψυχολογική όσο και οικονομική, που μου προσέφεραν όλα αυτά τα χρόνια Πολιανίδης Παύλος ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΚΑΙ ΠΡΟΒΛΕΨΗ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΑΓΩΝΩΝ ΠΟΔΟΣΦΑΙΡΟΥ VIII

10

11 ΠΕΡΙΕΧΟΜΕΝΑ Π ΕΡΙΕΧΟΜΕΝΑ ΠΕΡΙΛΗΨΗ... VII ΕΥΧΑΡΙΣΤΙΕΣ... VIII ΠΕΡΙΕΧΟΜΕΝΑ... IX ΛΙΣΤΑ ΣΧΗΜΑΤΩΝ... XII ΛΙΣΤΑ ΠΙΝΑΚΩΝ... XIII ΚΕΦΑΛΑΙΟ 1: ΕΙΣΑΓΩΓΗ ΚΕΦΑΛΑΙΟ 2: ΑΛΓΟΡΙΘΜΟΙ ΜΗΑΧΑΝΙΚΗΣ ΜΑΘΗΣΗΣ ΤΑΞΙΝΟΜΗΣΗ ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ... ERROR! BOOKMARK NOT DEFINED ΒΗΜΑΤΑ ΕΚΤΕΛΕΣΗΣ ΑΠΟΤΙΜΗΣΗ ΑΚΡΙΒΕΙΑΣ ΜΕΘΟΔΟΙ ΑΠΟΤΙΜΗΣΗΣ ΑΚΡΙΒΕΙΑΣ HOLD-OUT ΤΥΧΑΙΑ ΔΕΙΓΜΑΤΟΛΗΨΙΑ(RANDOM SAMPLING) ΠΟΛΛΑΠΛΗ ΔΙΑ-ΕΓΚΥΡΟΠΟΙΗΣΗ BOOT-STRAP ΑΛΓΟΡΙΘΜΟΙ ΤΑΞΙΝΟΜΗΣΗΣ C BEST-FIRST DECISION TREES LADTREE BOOSTING BAYESIAN CLASSIFIER ΘΕΩΡΗΜΑ BAYES ΑΦΕΛΗΣ BAYES (NAÏVE BAYES) ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΚΑΙ ΠΡΟΒΛΕΨΗ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΑΓΩΝΩΝ ΠΟΔΟΣΦΑΙΡΟΥ IX

12 ΠΑΥΛΟΣ ΠΟΛΙΑΝΙΔΗΣ SUPPORT VECTOR MACHINES ΓΡΑΜΜΙΚΩΣ ΔΙΑΧΩΡΙΣΗΜΑ ΔΕΔΟΜΕΝΑ COST-SENSITIVE ΜΑΘΗΣΗ ΠΕΡΙΓΡΑΦΗ COST-SENSITIVE ΜΑΘΗΣΗΣ ΠΛΑΙΣΙΟ ΛΕΙΤΟΥΡΓΙΑΣ COST-SENSITIVE ΜΑΘΗΣΗΣ COST-SENSITIVE ΑΛΓΟΡΙΘΜΟΙ METACOST CSROULETTE ΑΞΙΟΛΟΓΗΣΗ COST-SENSITIVE ΚΑΤΗΓΟΡΙΟΠΟΙΗΤΩΝ ΚΕΦΑΛΑΙΟ 3: Η ΕΦΑΡΜΟΓΗ ΕΙΣΑΓΩΓΗ ΠΕΡΙΓΡΑΦΗ ΤΟΥ ΠΡΟΒΛΗΜΑΤΟΣ ΑΡΧΙΤΕΚΤΟΝΙΚΗ ΤΟΥ ΣΥΣΤΗΜΑΤΟΣ ΠΡΟΣΕΓΓΙΣΗ ΤΟΥ ΠΡΟΒΛΗΜΑΤΟΣ ΕΠΙΛΟΓΗ ΕΡΓΑΛΕΙΩΝ ΕΠΙΛΟΓΗ ΧΑΡΑΚΤΗΡΙΣΤΙΚΩΝ ΠΕΡΙΓΡΑΦΗ ΒΑΣΗΣ ΔΕΔΟΜΕΝΩΝ Ο ΠΙΝΑΚΑΣ COUPONINFO ΤΕΧΝΙΚΗ ΑΝΑΛΥΣΗ ΚΩΔΙΚΑ ΠΑΚΕΤΟ XMLPARSING Η ΚΛΑΣΗ DOMPARSER Η ΚΛΑΣΗ FOOTBALLMATCHINFO Η ΚΛΑΣΗ MATCHRESULTS Η ΚΛΑΣΗ METADATA ΠΑΚΕΤΟ EXCEPTIONS ΠΑΚΕΤΟ UTILS ΠΑΚΕΤΟ STATISTICS Η ΚΛΑΣΗ STATISTIC Η ΚΛΑΣΗ TEAM Η ΚΛΑΣΗ CHART ΠΑΚΕΤΟ DBMANIPULATION Η ΚΛΑΣΗ DBMANAGER ΠΑΚΕΤΟ MACHINELEARNING Η ΚΛΑΣΗ ARFFCREATOR Η ΚΛΑΣΗ EVALUATOR Η ΚΛΑΣΗ PREDICTOR ΠΑΚΕΤΟ MACHINELEARNING.ROULETTESAMPLING Η ΚΛΑΣΗ LINE Η ΚΛΑΣΗ SEGMENT X ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΚΑΙ ΠΡΟΒΛΕΨΗ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΑΓΩΝΩΝ ΠΟΔΟΣΦΑΙΡΟΥ

13 ΠΕΡΙΕΧΟΜΕΝΑ Η ΚΛΑΣΗ CPRS ΠΑΚΕΤΟ GUI Η ΚΛΑΣΗ SPLASH Η ΚΛΑΣΗ GAMESTABMANIPULATOR Η ΚΛΑΣΗ PREDICTIONTABMANIPULATOR Η ΚΛΑΣΗ MESSAGESTORE Η ΚΛΑΣΗ STATUSBARCHANGER Η ΚΛΑΣΗ UPDATER ΚΕΦΑΛΑΙΟ 4: Η ΕΦΑΡΜΟΓΗ ΣΤΗΝ ΠΡΑΞΗ ΕΙΣΑΓΩΓΗ ΚΑΡΤΕΛΑ GAMES ΚΑΡΤΕΛΑ PREDICTION ΠΑΡΑΡΤΗΜΑ I: ΠΕΙΡΑΜΑΤΙΚΑ ΑΠΟΤΕΛΕΣΜΑΤΑ ΠΑΡΑΡΤΗΜΑ IΙ: ΒΙΒΛΙΟΓΡΑΦΙΑ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΚΑΙ ΠΡΟΒΛΕΨΗ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΑΓΩΝΩΝ ΠΟΔΟΣΦΑΙΡΟΥ XI

14

15 ΛΙΣΤΑ ΣΧΗΜΑΤΩΝ Λ ΙΣΤΑ Σ ΧΗΜΑΤΩΝ ΕΙΚΟΝΑ 2.1: ΣΤΑΔΙΟ ΜΑΘΗΣΗΣ ΕΙΚΟΝΑ 2.2: ΣΤΑΔΙΟ ΤΑΞΙΝΟΜΗΣΗΣ ΕΙΚΟΝΑ 2.3: ΑΛΓΟΡΙΘΜΟΣ C ΕΙΚΟΝΑ 2.4: ΔΕΝΔΡΟ ΑΠΟ ΤΗΝ ΕΚΤΕΛΕΣΗ ΤΟΥ C ΕΙΚΟΝΑ 2.5: BEST-FIRST TREE ΕΙΚΟΝΑ 2.6: ΑΛΓΟΡΙΘΜΟΣ BEST-FIRST ΕΙΚΟΝΑ 2.7: Η ΜΕΘΟΔΟΣ BOOSTING ΕΙΚΟΝΑ 2.8: ΑΛΗΟΡΙΘΜΟΣ ADTREE ΕΙΚΟΝΑ 2.9: ΓΡΑΜΜΙΚΩΣ ΔΙΑΧΩΡΙΣΙΜΑ ΔΕΔΟΜΕΝΑ ΕΙΚΟΝΑ 2.10: ΥΠΕΡ-ΕΠΙΠΕΔΑ ΣΤΟ SVM ΕΙΚΟΝΑ 2.11: SUPPORT VECTORS ΕΙΚΟΝΑ 2.12: ΔΙΑΧΩΡΙΣΜΟΣ ΣΤΙΓΜΙΟΤΥΠΩΝ ΑΠΟ ΤΟΝ METACOST ΕΙΚΟΝΑ 2.13: ΑΛΓΟΡΙΘΜΟΣ METACOST ΕΙΚΟΝΑ 2.14: SAMPLING LINE ΕΙΚΟΝΑ 2.15: ΑΛΓΟΡΙΘΜΟΣ CSROULETTE ΕΙΚΟΝΑ 2.16: ΔΥΟ ΣΗΜΕΙΑ ROC ΕΙΚΟΝΑ 2.17: ΕΥΘΕΙΕΣ ΠΟΥ ΑΝΤΙΣΤΟΙΧΟΥΝ ΣΤΑ ΣΗΜΕΙΑ ΤΗΣ ΕΙΚΟΝΑ 2.18: ΚΑΜΠΥΛΕΣ ROC ΔΥΟ ΑΛΓΟΡΙΘΜΩΝ ΤΑΞΙΝΟΜΗΣΗΣ ΕΙΚΟΝΑ 2.19: ΚΑΜΠΥΛΕΣ ΚΟΣΤΟΥΣ ΠΟΥ ΑΝΤΙΠΡΟΣΩΠΕΥΟΥΝ ΤΙΣ ΚΑΜΠΥΛΕΣ ΕΙΚΟΝΑ 3.1: ΑΡΧΙΤΕΚΤΟΝΙΚΗ ΤΟΥ ΣΥΣΤΗΜΑΤΟΣ ΕΙΚΟΝΑ 3.2: Ο ΠΙΝΑΚΑΣ COUPONINFO ΕΙΚΟΝΑ 3.3: ΠΑΡΑΔΕΙΓΜΑ ΓΡΑΦΗΜΑΤΟΣ ΕΙΚΟΝΑ 4.1: ΚΑΡΤΕΛΑ GAMES ΕΙΚΟΝΑ 4.2: ΕΠΙΛΟΓΗ ΗΜΕΡΟΜΗΝΙΑΣ ΕΙΚΟΝΑ 4.3: ΕΠΙΛΟΓΗ ΠΡΩΤΑΘΛΗΜΑΤΟΣ ΕΙΚΟΝΑ 4.4: ΕΠΙΛΟΓΗ ΟΜΑΔΑΣ ΕΙΚΟΝΑ 4.5: Η ΚΑΡΤΕΛΑ PREDICTION ΠΡΙΝ ΠΡΑΓΜΑΤΟΠΟΙΗΘΕΙ Η ΠΡΟΒΛΕΨΗ ΕΙΚΟΝΑ 4.6: Η ΚΑΡΤΕΛΑ PREDICTION ΜΕΤΑ ΤΗΝ ΠΡΑΓΜΑΤΟΠΟΙΗΣΗ ΤΗΣ ΠΡΟΒΛΕΨΗΣ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΚΑΙ ΠΡΟΒΛΕΨΗ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΑΓΩΝΩΝ ΠΟΔΟΣΦΑΙΡΟΥ XII

16

17 ΛΙΣΤΑ ΠΙΝΑΚΩΝ Λ ΙΣΤΑ Π ΙΝΑΚΩΝ ΠΙΝΑΚΑΣ 2.1: ΠΙΝΑΚΑΣ ΚΟΣΤΟΥΣ ΠΙΝΑΚΑΣ 2.2: ΑΠΛΟΠΟΙΗΜΕΝΟΣ : ΠΙΝΑΚΑΣ ΚΟΣΤΟΥΣ ΠΙΝΑΚΑΣ 2.3: ΠΑΡΑΔΕΙΓΜΑ ΠΙΝΑΚΑ ΚΟΣΤΟΥΣ ΠΙΝΑΚΑΣ 2.4: ΠΑΡΑΔΕΙΓΜΑ ΕΝΟΣ CONFUSION MATRIX ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΚΑΙ ΠΡΟΒΛΕΨΗ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΑΓΩΝΩΝ ΠΟΔΟΣΦΑΙΡΟΥ XIII

18

19 ΚΕΦΑΛΑΙΟ 1: Ε ΙΣΑΓΩΓΗ

20

21 ΚΕΦΑΛΑΙΟ 1: ΕΙΣΑΓΩΓΗ ΕΙΣΑΓΩΓΗ Η εξόρυξη δεδομένων είναι ένας κλάδος της επιστήμης της πληροφορικής, ο οποίος έχει αναπτυχθεί σημαντικά τα τελευταία χρόνια. Βασικός στόχος της εξόρυξης δεδομένων είναι η ανακάλυψη κρυφής γνώσης, χρησιμοποιώντας αλγορίθμους της μηχανικής μάθησης, μέσα από ένα μεγάλο σύνολο δεδομένων που είναι αποθηκευμένα σε βάσης ή αποθήκες δεδομένων.[1] Στη παρούσα πτυχιακή εργασία θα χρησιμοποιήσουμε την εξόρυξη δεδομένων, για να ανακαλύψουμε τη γνώση που κρύβεται μέσα στα δεδομένα που έχουμε συλλέξει και αφορούν αγώνες ποδοσφαίρου. Πιο συγκεκριμένα θα εφαρμόσουμε αλγορίθμους ταξινόμησης (classification algorithms) οι οποίοι θα προβλέψουν τα αποτελέσματα των αγώνων, που βρίσκονται στο κουπόνι στοιχήματος του ΟΠΑΠ. Θα εφαρμόσουμε διάφορους αλγορίθμους ταξινόμησης πάνω στα δεδομένα μας, ώστε να γίνει φανερό μετά από πειραματικές εκτελέσεις, ποίος επιτυγχάνει το μεγαλύτερο ποσοστό επιτυχημένης πρόβλεψης. Ονομαστικά, οι αλγόριθμοι που θα χρησιμοποιηθούν είναι : BFTree J48 J48Graft LADTree REPTree SimpleCart NaiveBayes NaiveBayesNominal NaiveBayesSimple Multinomial logistic regression SMO Linear logistic regression IB1 DecisionTable Οι κλασικοί αυτοί αλγόριθμοι ταξινόμησης[1,7] έχουν ως βασικό στόχο να κατατάξουν επιτυχώς το κάθε στιγμιότυπο σε μια κλάση από ένα διακριτό σύνολο κλάσεων. Στο πρόβλημα μας, τα στιγμιότυπα είναι οι αγώνες ποδοσφαίρου και οι κλάσεις ανήκουν στο εξής διακριτό σύνολο: {νίκη γηπεδούχο ομάδας, ισοπαλία, νίκη φιλοξενούμενης ομάδας}. Οι αλγόριθμοι αυτοί προσπαθούν να μειώσουν το ρυθμό σφάλματος (error rate) : το σύνολο των λανθασμένων προβλέψεων ή εναλλακτικά τη πιθανότητα της εξαγωγής λάθους πρόβλεψης, και ως εκ τούτου την αύξηση των επιτυχημένων προβλέψεων (που είναι ο βασικός στόχος). Το πρόβλημα έγκυται στο ότι ο αλγόριθμος θεωρεί ότι όλες οι λάθος πρόβλεψης επιφέρουν το ίδιο κόστος, στην πραγματικότητα όμως αυτό δεν ισχύει πάντα. Στο πρόβλημα μας, θα θέλαμε ο αλγόριθμος να προσπαθεί να προβλέψει σωστά την κλάση η οποία θα επιφέρει το μικρότερο κόστος ( ή ανάλογα το μεγαλύτερο κέρδος ) λαμβάνοντας υπ όψιν τις απόδοσης των σημείων. ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΚΑΙ ΠΡΟΒΛΕΨΗ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΑΓΩΝΩΝ ΠΟΔΟΣΦΑΙΡΟΥ 21

22 ΠΑΥΛΟΣ ΠΟΛΙΑΝΙΔΗΣ Για να συμπεριλάβουμε το κόστος της λανθασμένης πρόβλεψης, θα εφαρμόσουμε του επονομαζόμενους cost-sensitive αλγορίθμους[3,6,2,4]. Οι αλγόριθμοι αυτοί θα εφαρμοστούν ως «περιτύλιγμα» (wrapper) στους παραπάνω αλγορίθμους ταξινόμησης ώστε να εισαγάγουν την έννοια του κόστους στη διαδικασία της ταξινόμησης. Θα χρησιμοποιήσουμε τους εξής τρεις: MetaCost CostSensitiveClassifier CSRoullete 22 ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΚΑΙ ΠΡΟΒΛΕΨΗ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΑΓΩΝΩΝ ΠΟΔΟΣΦΑΙΡΟΥ

23 ΚΕΦΑΛΑΙΟ 2: ΑΛΓΟΡΙΘΜΟΙ ΜΗΧΑΝΙΚΗΣ ΜΑΘΗΣΗΣ

24

25 ΚΕΦΑΛΑΙΟ 2: ΑΛΓΟΡΙΘΜΟΙ ΜΗΧΑΝΙΚΗΣ ΜΑΘΗΣΗΣ ΑΛΓΟΡΙΘΜΟΙ ΜΗΧΑΝΙΚΗΣ ΜΑΘΗΣΗΣ Όπως αναφέρθηκε προηγουμένως, σκοπός του συστήματος είναι η πρόβλεψη αγώνων ποδοσφαίρου. Για να πετύχουμε το σκοπό μας, θα χρησιμοποιήσουμε ένα σύνολο αλγορίθμων της μηχανικής μάθησης. Πιο συγκεκριμένα, η διαδικασία της πρόβλεψης αναφέρεται ως πρόβλημα ταξινόμησης (classification problem) στην μηχανική μάθηση, ως εκ τούτου θα γίνει χρήση αλγορίθμων ταξινόμησης ή κατηγοριοποίησης. ΤΑΞΙΝΟΜΗΣΗ Βασικές έννοιες Σε αυτό το σημείο θα ήταν σκόπιμο να αναφερθούμε στη λειτουργία των αλγορίθμων ταξινόμησης. Αρχικά, θα εστιάσουμε την προσοχή μας, σε ορισμένες βασικές έννοιες που λαμβάνουν χώρα στη διαδικασία της ταξινόμησης και γενικότερα, της μηχανικής μάθησης. Μοντέλο ταξινόμησης ή ταξινομητής (classifier): μία δομή η οποία ερμηνεύει και περιγράφει το σύνολο των δεδομένων. Βάση του μοντέλου που σχηματίζεται, γίνεται η πρόβλεψη. Στιγμιότυπο ή αντικείμενο (instance): ένα αντικείμενο του κόσμου. Πολλά αντικείμενα μαζί σχηματίζουν το σύνολο στο οποίο θα στηριχθεί ο αλγόριθμος ταξινόμησης, για να σχηματίσει το μοντέλο της ταξινόμησης. Το στιγμιότυπο μπορεί επίσης να εφαρμοστεί πάνω στο μοντέλο, προκειμένου να γίνει η πρόβλεψη. Χαρακτηριστικά (attribute): μία ιδιότητα που περιγράφει ένα στιγμιότυπο. Το κάθε χαρακτηριστικό, έχει έναν τύπο. Κλάση: ανήκει σε ένα πεπερασμένο σύνολο από χαρακτηριστικά (τύπου nominal), και δηλώνει την τάξη στην οποία ανήκει ένα στιγμιότυπο. Είναι ουσιαστικά, το χαρακτηριστικό το οποίο καλείται να πρόβλεψη ο αλγόριθμός. Δεδομένα μάθησης ή σύνολο μάθησης (training set): ένα σύνολο από στιγμιότυπα, από το οποίο ο αλγόριθμος ταξινόμησης θα σχηματίσει τον ταξινομητή. Δεδομένα ελέγχου ή σύνολο ελέγχου (test set): ένα σύνολο από στιγμιότυπα, τα οποία ο αλγόριθμος θα προβλέψει, δηλαδή θα τα κατατάξει σε μια από τις δυνατές κλάσεις. Ακρίβεια πρόβλεψης (accuracy): ο λόγος των σωστών προβλέψεων προς το σύνολο όλων των προβλέψεων που έγιναν από τον ταξινομητή. # correctly _ predicted _ examples accuracy # predictions _ made ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΚΑΙ ΠΡΟΒΛΕΨΗ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΑΓΩΝΩΝ ΠΟΔΟΣΦΑΙΡΟΥ 25

26 ΠΑΥΛΟΣ ΠΟΛΙΑΝΙΔΗΣ Υπερπροσαργογή (overfitting): αφορά το φαινόμενο κατά το οποίο, το μοντέλο που κατασκευάζεται από τον αλγόριθμο, προσαρμόζεται σε υπερβολικό βαθμό στα δεδομένα του συνόλου εκπαίδευσης. Αυτό έχει ως αποτέλεσμα, να μειώνεται η ακρίβεια της πρόβλεψης δεδομένων, που δεν ανήκουν στο σύνολο εκπαίδευσης. Μάθηση με επίβλεψη: μάθηση κατά την οποία,οι κλάσεις των στιγμιότυπων του συνόλου εκπαίδευσης, είναι γνωστές. Οι αλγόριθμοι ταξινόμησης, ανήκουν σε αυτήν την κατηγορία. Στην παρούσα εργασία, θα ασχοληθούμε κυρίως με αυτό το είδος μάθησης. Μάθηση χωρίς επίβλεψη: μάθηση κατά την οποία, οι κλάσεις των στιγμιότυπων του συνόλου εκπαίδευσης δεν είναι γνωστές. Στην μάθηση αυτή, οι αλγόριθμοι προσπαθούν να βρουν συσχετίσεις και ομάδες δεδομένων από το σύνολο εκπαίδευσης. Παραδείγματα ομάδων αλγορίθμων που εφαρμόζουν αυτό το είδος μάθησης είναι: I. Αλγόριθμοι που εξάγουν κανόνες συσχετίσεις (association rules) π.χ. apriori. II. Αλγόριθμοι που χωρίζουν τα δεδομένα σε συστάδες ( clusters ) π.χ. k-means, DBScan. Έχοντας ξεκαθαρίσει ορισμένες βασικές έννοιες, μπορούμε πλέον να ορίσουμε την ταξινόμηση (classification) ως τη διαδικασία δημιουργίας ενός ταξινομητή ή μοντέλου ταξινόμησης από το σύνολο εκπαίδευσης, και η εφαρμογή του μοντέλου αυτού για την αντιστοίχηση των στιγμιότυπων του συνόλου ελέγχου, σε μια από δυνατές τάξης του διακριτού συνόλου κλάσεων[1,9] Βήματα εκτέλεσης Παρακάτω, περιγράφονται συνοπτικά τα δυο βασικά βήματα της εφαρμογής του αλγορίθμου ταξινόμησης που αναφέρονται στον παραπάνω ορισμό. 1. Στάδιο της μάθησης: αποτελεί το βήμα της διαδικασίας της ταξινόμησης, κατά το οποίο ο αλγόριθμος ταξινόμησης, κατασκευάζει τον ταξινομητή (classifier), αναλύοντας το σύνολο εκπαίδευσης (βλέπε εικόνα 2.1). Το σύνολο εκπαίδευσης όπως αναφέραμε, αποτελείται από στιγμιότυπα, που συνήθως αναπαρίστανται ως ένα διάνυσμα χαρακτηριστικών ( feature vector). Το διάνυσμα αυτό είναι της μορφής X = <x 1,x 2, x n >, όπου x i τα χαρακτηριστικά του στιγμιότυπου και ανήκει σε μία κλάση. ο συνδυασμός του διανύσματος και της κλάσης στην οποία ανήκει, αποτελεί την βασική ιδέα πίσω από την οποία κρύβεται η διαδικασία της κατασκευής του ταξινομητή. 26 ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΚΑΙ ΠΡΟΒΛΕΨΗ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΑΓΩΝΩΝ ΠΟΔΟΣΦΑΙΡΟΥ

27 ΚΕΦΑΛΑΙΟ 2: ΑΛΓΟΡΙΘΜΟΙ ΜΗΧΑΝΙΚΗΣ ΜΑΘΗΣΗΣ 2. Στάδιο της ταξινόμησης: στο δεύτερο βήμα, ο αλγόριθμος αρχικά κάνει μια εκτίμηση της ακρίβειας του μοντέλου που κατασκεύασε. Το μοντέλο εφαρμόζεται πάνω στο σύνολο εκπαίδευσης, όπου πλέον οι κλάσεις των στιγμιότυπων του συνόλου δεν είναι γνωστές και ο ταξινομητής καλείται να τις προβλέψει (βλέπε εικόνα 2.2). Υπάρχει πάντα η περίπτωση της αισιόδοξης εκτίμησης, η οποία δεν συμβαδίζει συνήθως με την πραγματικότητα. Αυτή η αισιοδοξία που παρουσιάζουν οι ταξινομητές οφείλεται στο φαινόμενο της υπερβολικής προσαρμογής (βλέπε φαινόμενο υπερπροσαρμογής). Έχουν προταθεί αρκετοί μέθοδοι για την αποτίμηση της ακρίβειας των ταξινομητών [7,9]. Θα αναφερθούμε σε ορισμένους από αυτούς, στην συνέχεια του κεφαλαίου. Εικόνα 2.1 Μάθηση: Ο αλγόριθμος ταξινόμησης αναλύει το σύνολο εκπαίδευση (training data). Σε αυτήν την περίπτωση, η κλάση του κάθε παραδείγματος, είναι η loan_decision, και το μοντέλο που κατασκευάζεται, αναπαριστάται από ένα σύνολο κανόνων ταξινόμησης (decision rules). ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΚΑΙ ΠΡΟΒΛΕΨΗ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΑΓΩΝΩΝ ΠΟΔΟΣΦΑΙΡΟΥ 27

28 ΠΑΥΛΟΣ ΠΟΛΙΑΝΙΔΗΣ Εικόνα 2.2 Ταξινόμηση: Πραγματοποιείται η αποτίμηση της ακρίβειας του μοντέλου που κατασκευάστηκε στο πρώτο βήμα, με την εφαρμογή του, πάνω σε ένα σύνολο ελέγχου (test data). Στην συνέχεια, γίνεται η κατηγοριοποίηση των παραδειγμάτων του συνόλου new data Αποτίμηση ακρίβειας Η αποτίμηση της ακρίβειας ενός ταξινομητή, είναι μια πολύ σημαντική εργασία, που λαμβάνει χώρα κατά την εκτέλεση της ταξινόμησης. Αφορά σε ένα είδος δοκιμής που εκτελεί ο αλγόριθμος, προκειμένου να συμπεράνει πόσο καλός είναι ο ταξινομητής που κατασκεύασε. Η ακρίβεια είναι μια σημαντική ποσότητα για εμάς, γιατί μας φανερώνει την ικανότητα του μοντέλου να κάνει σωστές προβλέψεις (κατάταξη των στιγμιότυπων στην κλάση στην οποία πραγματικά ανήκουν). Είναι προφανές, ότι όσα μεγαλύτερη είναι η ακρίβεια, τόσο περισσότερο μπορούμε να εμπιστευτούμε τον αλγόριθμο, για τις προβλέψεις που κάνει. Συνήθως υπάρχει ένα κάτω όριο ακρίβειας, κάτω από τον οποίο ο αλγόριθμος της ταξινόμησης έχει την δυνατότητα να απορρίψει ένα μοντέλο και να ξεκινήσει την διαδικασία από το πρώτο βήμα (βλέπε βήματα εκτέλεσης αλγορίθμου), κατασκευάζοντας ένα διαφορετικό μοντέλο[7]. 28 ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΚΑΙ ΠΡΟΒΛΕΨΗ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΑΓΩΝΩΝ ΠΟΔΟΣΦΑΙΡΟΥ

29 ΚΕΦΑΛΑΙΟ 2: ΑΛΓΟΡΙΘΜΟΙ ΜΗΧΑΝΙΚΗΣ ΜΑΘΗΣΗΣ Μέθοδοι αποτίμησης ακρίβειας hold-out Πρόκειται για την απλούστερη μέθοδο αποτίμησης της ακρίβειας ενός κατηγοριοποιητή. Η ιδέα που κρύβεται πίσω από την μέθοδο αυτή είναι απλή, χωρίζουμε το σύνολο των δεδομένων (data set) σε 2 τμήματα, το σύνολο εκπαίδευσης και το σύνολο ελέγχου, με κάποια αναλογία. Για παράδειγμα, τα 2/3 πρώτα στιγμιότυπα του συνόλου δεδομένων θα σχηματίσουν το σύνολο εκπαίδευσης, ενώ από το υπόλοιπο 1/3 του συνόλου δεδομένων θα σχηματιστεί το σύνολο ελέγχου. Το σύνολο εκπαίδευσης θα συμβάλει στην κατασκευή του κατηγοριοποιητή ο οποίος θα κατατάξει τα όλα τα στιγμιότυπα του συνόλου ελέγχου, σε μία από τις υπάρχουσες κλάσεις. Αν υποθέσουμε ότι το Χ είναι ο αριθμός των στιγμιότυπων του συνόλου ελέγχου που κατατάσσονται στη σωστή κλάση, και Ν ο συνολικός αριθμός στιγμιότυπων του συνόλου ελέγχου, τότε η ακρίβεια accuracy της μεθόδου hold-out ορίζεται ως εξής: X accuracy N Η μέθοδος hold-out είναι μια απλή μέθοδος η οποία είναι εύκολη στην υλοποίηση, παρόλα αυτά, έχει ένα σημαντικό πρόβλημα. Η ποιότητα του κατηγοριοποιητή που θα κατασκευαστεί, εξαρτάται από την κατανομή των στιγμιότυπων μέσα στο σύνολο δεδομένων. Υπάρχει η περίπτωση το σύνολο εκπαίδευσης να περιέχει λίγα στιγμιότυπα που ανήκουν σε μια κλάση, αυτό θα έχει ως αποτέλεσμα την δημιουργία ενός μοντέλου το οποίο δεν θα μπορεί να κατατάσσει εσφαλμένα τα στιγμιότυπα του συνόλου ελέγχου που πραγματικά ανήκουν στην κλάση αυτήν. Σε αυτήν την περίπτωση η ακρίβεια του μοντέλου θα είναι υποεκτιμημένη, λόγω του ότι δεν κατατάσσει ορθά τα στιγμιότυπα της συγκεκριμένης κλάσης Τυχαία δειγματοληψία (random subsampling) Η μέθοδος ακολουθεί παρόμοια λογική με την hold-out. Οι δυο μέθοδοι διαφέρουν στον τρόπο που διαμερίζουν το σύνολο δεδομένων στα δύο τμήματα (σύνολο εκπαίδευση και σύνολο ελέγχου), ώστε να λυθεί το πρόβλημα που εμφανίζει η holdout. Σε αυτήν την περίπτωση το σύνολο ελέγχου επιλέγεται ως τυχαίο δείγμα. Εφαρμόζουμε τυχαία δειγματοληψία χωρίς επανατοποθέτηση και επιλέγουμε Ν στιγμιότυπα για το σύνολο ελέγχου. Τα εναπομένοντα στιγμιότυπα σχηματίζουν το σύνολο εκπαίδευσης. Με αυτήν την ενέργεια μειώνεται η επιρροή που μπορεί να επιφέρει η κατανομή των στιγμιότυπων στο σύνολο δεδομένων. Η προηγούμενη διαδικασία επαναλαμβάνεται κ φορές ώστε νε επιτευχθεί η μεγαλύτερη δυνατή μείωση της επιρροής. Αν υποθέσουμε ότι X i είναι ο αριθμός των στιγμιότυπων που έχουν καταταχθεί σωστά στην i-οστη επανάληψη ( οπού 1 i k ), τότε η ακρίβεια της μεθόδου τυχαίας δειγματοληψίας ορίζεται ως εξής: 1 accuracy k i 1 X i N ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΚΑΙ ΠΡΟΒΛΕΨΗ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΑΓΩΝΩΝ ΠΟΔΟΣΦΑΙΡΟΥ 29

30 ΠΑΥΛΟΣ ΠΟΛΙΑΝΙΔΗΣ Πολλαπλή δια-εγκυροποίηση (k-fold cross-validation) Θεωρείται μια από τις πλέον αξιόπιστές μεθόδους για την αποτίμηση της ακρίβειας κατηγοριοποιητών. Στην περίπτωση αυτήν εφαρμόζεται ένας πιο συστηματικός τρόπος για να λαμβάνουμε τυχαία δείγματα για το σχηματισμό του συνόλου ελέγχου. Εάν το σύνολο δεδομένων αποτελείται από Μ στιγμιότυπα και έχουμε ορίσει ως αριθμό επαναλήψεων το k, τότε χωρίζουμε το σύνολο σε k ισομεγέθη τμήματα μεγέθους M/k το καθένα. Στην i-οστή επανάληψη, το i-οστό τμήμα λειτουργεί ως σύνολο ελέγχου, ενώ τα υπόλοιπα k 1 τμήματα αποτελούν το σύνολο εκπαίδευσης. Η συνηθέστερη τιμή για το k είναι το 10 (10-fold cross-validation ). Η μέθοδος της δια-εγυροποίησης για την ειδική περίπτωση οπού k =M, ονομάζεται άφησε-ένα-έξω (leave-one-out), γιατί το σύνολο ελέγχου σε κάθε επανάληψη, αποτελείται από ένα μόνο στιγμιότυπο. Η παραλλαγή αυτή χρησιμοποιείται μόνο σε μικρά σύνολα δεδομένων Bootstrap Αποτελεί εναλλακτική μέθοδο της τυχαίας υποδειγματοληψίας. Ενώ η τυχαία υποδειγματοληψία σχηματίζει το σύνολο ελέγχου εφαρμόζοντας τυχαία δειγματοληψία χωρίς επανατοποθέτηση στο σύνολο δεδομένων, ο bootstrap εφαρμόζει τυχαία δειγματοληψία με επανατοποθέτηση. Έστω M το πλήθος των στιγμιότυπων του συνόλου δεδομένων. Αποδεικνύεται ότι αν από το σύνολο αυτό πάρουμε ένα δείγμα M στιγμιότυπων, εξαιτίας της επανατοποθέτησης ο αριθμός των διακριτών στιγμιότυπων του δείγματος αυτού, αναμένεται να ισούται με το 63.2% του M. Απόδειξη: Για ένα αντικείμενο χ, η πιθανότητα είναι: P( x Δείγμα ) = 1 P( x Δείγμα). Σε κάθε μια από τις M προσπάθειες, το x έχει πιθανότητα 1/M να επιλεγεί, και 1 1/M πιθανότητα να μην επιλεγεί. Επομένως, μετά από M προσπάθειες, η πιθανότητα να μην επιλεγεί σε καμία από αυτές, δηλαδή να μην ανήκει στο δείγμα, ισούται με P( x Δείγμα) = ( 1 1/Μ ) Μ. Άρα, P( x Δείγμα ) = 1 - ( 1 1/Μ ) Μ. Για μεγάλες τιμές του M έχουμε lim (1 - ( 1 1/Μ ) Μ ) = 1 e -1 = M Η διαδικασία της δειγματοληψίας επαναλαμβάνεται k φορές. Αν υποθέσουμε ότι η ακρίβεια στην i-οστή επανάληψη είναι a i, τότε η ακρίβεια accuracy της μεθόδου ορίζεται ως εξής: accuracy 1 k k i 1 (0.632a i 0.368a) Όπου a είναι η ακρίβεια όταν το σύνολο δεδομένων χρησιμοποιείται και ως σύνολο ελέγχου και ως σύνολο εκπαίδευσης. 30 ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΚΑΙ ΠΡΟΒΛΕΨΗ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΑΓΩΝΩΝ ΠΟΔΟΣΦΑΙΡΟΥ

31 ΚΕΦΑΛΑΙΟ 2: ΑΛΓΟΡΙΘΜΟΙ ΜΗΧΑΝΙΚΗΣ ΜΑΘΗΣΗΣ ΑΛΓΟΡΙΘΜΟΙ ΤΑΞΙΝΟΜΗΣΗΣ Έχοντας αναφερθεί στις βασικές έννοιες γύρω από το πλαίσιο της ταξινόμησης, μπορούμε πλέον να συνεχίσουμε με την περιγραφεί συγκεκριμένων αλγορίθμων κατηγοριοποιήσεις. Ποίο συγκεκριμένα, στα πλαίσια της παρούσας εργασίας θα χρησιμοποιηθούν οι εξής αλγόριθμοι: BFTree J48 J48Graft LADTree REPTree SimpleCart NaiveBayes NaiveBayesNominal NaiveBayesSimple Multinomial logistic regression SMO Linear logistic regression IB1 DecisionTable Όπως αναφέρομαι και προηγουμένως, η ταξινόμηση εκτελείται σε 2 βήματα: 1. Δημιουργία του μοντέλου ταξινόμησης και, 2. Κατηγοριοποίηση των στιγμιότυπων του συνόλου ελέγχου. Οι διαφορετικότητα των αλγορίθμων που θα παρουσιάσουμε, έγκυται στο ότι δημιουργούν διαφορετικά μοντέλα ταξινόμησης, ενώ το δεύτερο βήμα είναι ίδιο για όλους. Ο κάθε αλγόριθμος αναλύει διαφορετικά το σύνολο εκπαίδευσης, βασιζόμενος σε ξεχωριστά ποσοτικά μέτρα ο κάθε ένας προκειμένου να αντλήσει την κρυφή γνώση που κρύβεται πίσω από τα δεδομένα. Γι αυτό τον λόγο κατασκευάζονται ανόμοια μοντέλα ταξινόμησης. Οι κατηγορίες στις οποίες ανήκουν τα μοντέλα αυτά είναι οι εξής: 1. Δένδρα απόφασης (decision trees classifiers). Οι κατηγοριοποιητές αυτοι έχουν δενδρική μορφή αναπαράστασης. Σε αυτήν τη κατηγορία ανήκουν τα μοντέλα που σχηματίζουν οι αλγόριθμοι BFTree, J48, J48Graft, LADTree, REPTree και SimpleCart. 2. Κανόνες ταξινόμησης (decision rule). Αποτελεί εναλλακτική αναπαράσταση των δένδρων απόφασης. Ο αλγόριθμός DecisionTable ανήκει σε αυτήν την κατηγορία. 3. Πιθανοκρατικοί κατηγοριοποιητές (probabilistic classifiers). Βασίζονται στην εξέταση κατανομών πιθανότητας στα δεδομένα του συνόλου εκπαίδευσης. Οι αλγόριθμοι, NaiveBayes, NaiveBayesNominal και NaivebayesSimple ανήκουν σε αυτή τη κατηγορία. ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΚΑΙ ΠΡΟΒΛΕΨΗ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΑΓΩΝΩΝ ΠΟΔΟΣΦΑΙΡΟΥ 31

32 ΠΑΥΛΟΣ ΠΟΛΙΑΝΙΔΗΣ 4. Διακριτικοί κατηγοριοποιητές (discriminative classifiers). Οι Multinomial logistic regression και linear logistic regression ανήκουν σε αυτή τη κατηγορία. 5. Γραμμικοί κατηγοριοποιητές (linear classifiers). Βασίζονται στο γραμμικό συνδυασμό των χαρακτηριστικών του διανύσματος χαρακτηριστικών (feature vector). Στην κατηγορία αυτή ανήκει ο SMO C4.5 Ο αλγόριθμος C4.5 [11,12] ανήκει στην μεγάλη κατηγορία αλγορίθμων ταξινόμησης οι οποίοι δημιουργούν δεντρικά μοντέλα ταξινομητών (δένδρα απόφασης). Αποτελεί απόγονο του αλγορίθμου ID3. Ένα δένδρο απόφασης αποτελείται από κόμβους που αντιστοιχούν σε κάποιο χαρακτηριστικό του συνόλου εκπαίδευσης ο κάθε ένας και διακρίνονται στους εξής: 1. Ρίζα (root): κόμβος ο οποίος βρίσκεται στην κορυφή του δένδρου και χωρίζει το σύνολο εκπαίδευσης σε 2 ή περισσότερα υποσύνολα. 2. Εσωτερικοί κόμβοι (internal node): ενδιάμεσοι κόμβοι οι οποίοι με την σειρά τους χωρίζουν το κάθε υποσύνολο του υποδένδρου σε μικρότερα υποσύνολα. 3. Φύλλα (leafs): αποτελεί τον τερματικό κόμβο και αντιπροσωπεύει μια κλάση από το διακριτό σύνολο κλάσεων του συνόλου εκπαίδευσης. Όλοι οι κόμβοι εκτός από τα φύλλα έχουν εξερχόμενες ακμές, οι οποίες αντιστοιχούν σε μια συνθήκη βάση της οποία γίνεται ο διάσπαση των δεδομένων. η συνθήκη αυτή ονομάζεται συνθήκη διάσπασης (split criteria). Εικόνα 2.3: Αλγόριθμος C ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΚΑΙ ΠΡΟΒΛΕΨΗ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΑΓΩΝΩΝ ΠΟΔΟΣΦΑΙΡΟΥ

33 ΚΕΦΑΛΑΙΟ 2: ΑΛΓΟΡΙΘΜΟΙ ΜΗΧΑΝΙΚΗΣ ΜΑΘΗΣΗΣ Στην εικόνα 2.2 περιγράφεται ο αλγόριθμος C4.5. όπως βλέπουμε η διαδικασία ξεκινάει από την επιλογή του αρχικού κόμβου (ρίζα) ο οποίος θα διασπάσει το αρχικό σύνολο εκπαίδευσης με βάση την συνθήκη διάσπασης (split criteria). Η επιλογή του κατάλληλου κόμβου διαχωριστή, επιτυγχάνεται μέσω ενός ποσοτικού μέτρου. το μέτρο αυτό υπολογίζεται για όλα τα χαρακτηριστικά του συνόλου εκπαίδευσης και επιλέγεται το χαρακτηριστικό που έχει την καλύτερη τιμή. Η διαδικασία αυτή επαναλαμβάνεται αναδρομικά, έως ότου όλα τα μικρότερα υποσύνολα να είναι αμιγείς, δηλαδή, όλα τα στιγμιότυπά του υποσυνόλου να ανήκουν σε μία κλάση. Με αυτόν τον τρόπο κατασκευάζεται το δένδρο απόφασης. (βλέπε εικόνα 2.4) Το βασικό ποσοτικό μέτρο που χρησιμοποιείται για επιλογή των διαχωριστών είναι το κέρδος πληροφορίας (information Gain) το οποίο βασίζεται στην εντροπία πληροφορίας (entropy ). Εικόνα 2.4: Παράδειγμα από Δένδρο που προκύπτει από την εκτέλεση του C4.5 Έχουν προταθεί αρκετές παραλλαγές του C4.5, όπως C4.5-no-pruning, C4.5-rules, οι οποίοι προσπαθούν να βελτιώσουν την επίδοση του αλγορίθμου, εκτελώντας διάφορες επιπρόσθετες λειτουργίες (π.χ. κλάδεμα δένδρου). ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΚΑΙ ΠΡΟΒΛΕΨΗ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΑΓΩΝΩΝ ΠΟΔΟΣΦΑΙΡΟΥ 33

34 ΠΑΥΛΟΣ ΠΟΛΙΑΝΙΔΗΣ Best-first decision trees Ο best-first αλγόριθμος ταξινόμησης [15], ανήκει στην μεγάλη κατηγορία των δένδρων απόφασης (decision trees). Τα δένδρα απόφασης είναι μια δημοφιλής κατηγορία κατηγοριοποιητών για τους εξής λόγους: 1. Είναι γρήγορα τόσο κατά την κατασκευή μοντέλων ταξινόμησης όσο και κατά την διάρκεια της κατηγοριοποίησης. 2. Κατασκευάζουν μοντέλα ταξινόμησης με πολύ καλή επίδοση. 3. Εφαρμόζουν καλά σε «θορυβώδη» σύνολα εκπαίδευσης. 4. Είναι ιδανικά για την δημιουργία κατηγοριοποιητών, όταν υπάρχουν στιγμιότυπα με χαρακτηριστικά για τα οποία απουσιάζει η τιμή (missing values). Τα best-first δένδρα συγκεντρώνουν όλες τις ιδιότητες των παραδοσιακών δένδρων απόφασης (π.χ. C4.5, ID3 κ.λπ.). Η μοναδική διαφορά είναι ότι, τα κλασσικά δένδρα απόφασης επεκτείνουν τους κόμβους (εσωτερικού κόμβους) με depth-first σειρά, ενώ ο best-first επεκτείνει πρώτα το «καλύτερο» κόμβο. Η εικόνα 2.5 παρουσιάζει ένα υποθετικό best-first δένδρο και ένα κλασικό δένδρο απόφασης. Διακρίνεται ότι ο best-first δημιουργεί ένα πλήρως-επεκταμένο δένδρο (εικόνα 2.5 (α)) που είναι ίδιος με το δένδρο που δημιουργούν οι παραδοσιακοί αλγόριθμοι δένδρων απόφασης. Παρόλα αυτά, αν είναι γνωστό εκ των προτέρων το πλήθος των επεκτάσεων που θα γίνουν στο δένδρο, ο best-first δημιουργεί σχεδόν πάντα διαφορετικά δένδρα (εικόνες 2.5 (c) και 2.5 (d) αντίστοιχα). Αυτό οφείλεται στον τρόπο που αναπτύσσει το δένδρο ο best-first. Εικόνα 2.5 (a) πλήρως-επεκταμένο best-first tree.(b)πλήρως επεκταμένο παραδοσιακό δένδρο απόφασης (c) best-first tree με τρείς επεκτάσεις.(d) παραδοσιακό δένδρο απόφασης με τρεις επεκτάσεις 34 ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΚΑΙ ΠΡΟΒΛΕΨΗ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΑΓΩΝΩΝ ΠΟΔΟΣΦΑΙΡΟΥ

35 ΚΕΦΑΛΑΙΟ 2: ΑΛΓΟΡΙΘΜΟΙ ΜΗΧΑΝΙΚΗΣ ΜΑΘΗΣΗΣ Εικόνα 2.6 Αλγόριθμος Best-first Όπως αναφέραμε παραπάνω, ο best-first αλγόριθμος επεκτείνει το δέντρο, επιλέγοντας να διαχωρίσει το «καλύτερο» κόμβο σε κάθε γύρω. Με το όρο «καλύτερο» εννοούμε τον κόμβο ο οποίος οδηγεί σε μεγαλύτερη μείωση της ανομοιογένειας των δεδομένων στους κόμβου. Ενώ τα παραδοσιακά δένδρα ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΚΑΙ ΠΡΟΒΛΕΨΗ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΑΓΩΝΩΝ ΠΟΔΟΣΦΑΙΡΟΥ 35

36 ΠΑΥΛΟΣ ΠΟΛΙΑΝΙΔΗΣ απόφασής, αναπτύσσουν το δέντρο πρώτα σε «βάθος», δηλαδή επεκτείνουν τους κόμβους ενός μονοπατιού, μέχρι να φτάσουν σε τερματικό κόμβο. Αυτό αποτελεί την βασική και μοναδική διαφορά των 2 προσεγγίσεων. Προκειμένου να επιλέγει γρήγορα τον «καλύτερο» κόμβο, ο best-first ταξινομεί την λίστα με τους κόμβους, κατά φθίνουσα σειρά ως προς το Gini gain ή το Information gain (ανάλογα με το ποίο ποσοτικό μέτρο χρησιμοποιείται για τον διαχωρισμό των κόμβων). Με αυτό τον τρόπο, κάθε φορά επιλέγεται για διαχωρισμό, ο πρώτος κόμβος τις ταξινομημένης ο οποίος ουσιαστικά είναι και ο «καλύτερος». Ένα επιπλέον χαρακτηριστικό του bestfirst είναι ότι, μπορούμε να καθορίσουμε το πλήθος των επεκτάσεων που θα γίνουν στο δένδρο. Ο αλγόριθμος παρουσιάζεται στην εικόνα LADTrees O LADTree [13] είναι αλγόριθμος ταξινόμησης ο οποίος δημιουργεί ένα εναλλακτικό δένδρο απόφασης (alternative decision tree). Εφαρμόζεται σε προβλήματα ταξινόμησης στα οποία έχουν πολλαπλές κλάσεις (multiclass). Βασίζεται στο αλγόριθμο LogitBoost ο οποίος ανήκει στην οικογένεια των Boosting αλγορίθμων. Προτού περιγράψουμε τα εναλλακτικά δένδρα, θα ήταν χρήσιμο να αναφερθούμε στην διαδικασία του Boosting [12] στην οποία στηρίζει την λειτουργία του o LogitBoost (logistic boosting) Boosting Υποθέτουμε ότι έχουμε ένα πρόβλημα δυαδικής ταξινόμησης, δηλαδή το κάθε στιγμιότυπο μπορεί να ανήκει σε μια από τις δυο εναλλακτικές κλάσεις. Όπως είναι γνωστό, σκοπός ενός αλγορίθμου ταξινόμησης είναι να κατασκευάσει ένα μοντέλο ταξινόμησης μέσα από το σύνολο εκπαίδευση, και στην συνέχεια να προσπαθήσει να κατατάξει όλα τα στιγμιότυπα του συνόλου ελέγχου. Μία εναλλακτική λύση θα μπορούσε να είναι, ο κατηγοροιοποιητής να κατατάσσει τα στιγμιότυπα με τυχαίο τρόπο χωρίς να χρειαστεί να αναλύσει τα δεδομένα. Έτσι θα είχε 50% απώλεια (αριθμός των λάθος κατατάξεων). Είναι προφανής ότι αυτή η λύση δεν μπορεί να είναι αποδεκτή. Υπάρχουν όμως περιπτώσεις στις οποίες οι κατηγοριοποιητές, παρόλη την ανάλυση που εκτελούν στα δεδομένα, δεν επιτυγχάνουν ποσοστό σωστής πρόβλεψης πολύ μεγαλύτερο από ότι αν εφαρμόζαμε τυχαία πρόβλεψη. Σε αυτές τις περιπτώσεις λέμε ότι ο κατηγοριοποιητής μας αποτελεί έναν αδύναμο κατηγοροιοποιητής ή μια αδύναμη υπόθεση (weak classifier ή weak hypothesis). Η λογική του Boosting στηρίζεται στο γεγονός ότι μπορούμε να συνδυάσουμε ένα σύνολο αδύναμων κατηγοροιοποιητών προκειμένου να σχηματίσουμε έναν δυνατό κατηγοροιοποιητή (strong classifier) ο οποίος θα έχει πολύ καλύτερα αποτελέσματα από την τυχαία πρόβλεψη. Αν θέσουμε έναν αδύναμο κατηγοροιοποιητή ως h1, τότε η διαδικασία του Boosting θα παράγει μια νέα κατανομή D των δεδομένων από την αρχική D προκειμένου να ελαττωθούν τα λάθη που εμφάνισε ο h1. Ουσιαστικά πρόκειται για μια αλλαγή που γίνεται στα βάρη των στιγμιότυπων. Συνήθως η νέα D εστιάζει την προσοχή στα στιγμιότυπα τα οποία ο h1 κατάταξε εσφαλμένα. Στην συνέχεια μέσα από την νέα 36 ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΚΑΙ ΠΡΟΒΛΕΨΗ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΑΓΩΝΩΝ ΠΟΔΟΣΦΑΙΡΟΥ

HMY 795: Αναγνώριση Προτύπων

HMY 795: Αναγνώριση Προτύπων HMY 795: Αναγνώριση Προτύπων Διάλεξη 3 Επιλογή μοντέλου Επιλογή μοντέλου Θεωρία αποφάσεων Επιλογή μοντέλου δεδομένα επικύρωσης Η επιλογή του είδους του μοντέλου που θα χρησιμοποιηθεί σε ένα πρόβλημα (π.χ.

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 18. 18 Μηχανική Μάθηση

ΚΕΦΑΛΑΙΟ 18. 18 Μηχανική Μάθηση ΚΕΦΑΛΑΙΟ 18 18 Μηχανική Μάθηση Ένα φυσικό ή τεχνητό σύστηµα επεξεργασίας πληροφορίας συµπεριλαµβανοµένων εκείνων µε δυνατότητες αντίληψης, µάθησης, συλλογισµού, λήψης απόφασης, επικοινωνίας και δράσης

Διαβάστε περισσότερα

Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500

Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500 Εισόδημα Κατανάλωση 1500 500 1600 600 1300 450 1100 400 600 250 700 275 900 300 800 352 850 400 1100 500 Πληθυσμός Δείγμα Δείγμα Δείγμα Ο ρόλος της Οικονομετρίας Οικονομική Θεωρία Διατύπωση της

Διαβάστε περισσότερα

Μάθηση και Γενίκευση. "Τεχνητά Νευρωνικά Δίκτυα" (Διαφάνειες), Α. Λύκας, Παν. Ιωαννίνων

Μάθηση και Γενίκευση. Τεχνητά Νευρωνικά Δίκτυα (Διαφάνειες), Α. Λύκας, Παν. Ιωαννίνων Μάθηση και Γενίκευση Το Πολυεπίπεδο Perceptron (MultiLayer Perceptron (MLP)) Έστω σύνολο εκπαίδευσης D={(x n,t n )}, n=1,,n. x n =(x n1,, x nd ) T, t n =(t n1,, t np ) T Θα πρέπει το MLP να έχει d νευρώνες

Διαβάστε περισσότερα

ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΚΑΙ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ

ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΚΑΙ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΚΑΙ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΔΠΜΣ : ΕΦΑΡΜΟΣΜΕΝΕΣ ΜΑΘΗΜΑΤΙΚΕΣ ΕΠΙΣΤΗΜΕΣ ΡΟΗ ΠΙΘΑΝΟΝΤΗΤΕΣ ΚΑΙ ΣΤΑΤΙΣΤΙΚΗΣ ΕΡΓΑΣΙΑ 08: ΕΙΡΗΝΗ ΛΥΓΚΩΝΗ 1 Ο ΣΤΑΔΙΟ: Πριν εφαρμόσουμε οποιοδήποτε αλγόριθμο

Διαβάστε περισσότερα

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΚΑΙ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΠΛΗΡΟΦΟΡΙΑΣ ΠΑΡΟΥΣΙΑΣΗ ΤΕΛΙΚΗΣ ΕΡΓΑΣΙΑΣ ΛΙΝΑ ΜΑΣΣΟΥ

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΚΑΙ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΠΛΗΡΟΦΟΡΙΑΣ ΠΑΡΟΥΣΙΑΣΗ ΤΕΛΙΚΗΣ ΕΡΓΑΣΙΑΣ ΛΙΝΑ ΜΑΣΣΟΥ ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΕΦΑΡΜΟΣΜΕΝΩΝ ΜΑΘΗΜΑΤΙΚΩΝ ΚΑΙ ΦΥΣΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΑΛΓΟΡΙΘΜΟΙ ΕΞΟΡΥΞΗΣ ΠΛΗΡΟΦΟΡΙΑΣ ΠΑΡΟΥΣΙΑΣΗ ΤΕΛΙΚΗΣ ΕΡΓΑΣΙΑΣ ΛΙΝΑ ΜΑΣΣΟΥ Δ.Π.Μ.Σ: «Εφαρμοσμένες Μαθηματικές Επιστήμες» 2008

Διαβάστε περισσότερα

Λήψη αποφάσεων κατά Bayes

Λήψη αποφάσεων κατά Bayes Λήψη αποφάσεων κατά Bayes Σημειώσεις μαθήματος Thomas Bayes (1701 1761) Στυλιανός Χατζηδάκης ECE 662 Άνοιξη 2014 1. Εισαγωγή Οι σημειώσεις αυτές βασίζονται στο μάθημα ECE662 του Πανεπιστημίου Purdue και

Διαβάστε περισσότερα

Υπερπροσαρμογή (Overfitting) (1)

Υπερπροσαρμογή (Overfitting) (1) Αλγόριθμος C4.5 Αποφυγή υπερπροσαρμογής (overfitting) Reduced error pruning Rule post-pruning Χειρισμός χαρακτηριστικών συνεχών τιμών Επιλογή κατάλληλης μετρικής για την επιλογή των χαρακτηριστικών διάσπασης

Διαβάστε περισσότερα

4.3. Γραµµικοί ταξινοµητές

4.3. Γραµµικοί ταξινοµητές Γραµµικοί ταξινοµητές Γραµµικός ταξινοµητής είναι ένα σύστηµα ταξινόµησης που χρησιµοποιεί γραµµικές διακριτικές συναρτήσεις Οι ταξινοµητές αυτοί αναπαρίστανται συχνά µε οµάδες κόµβων εντός των οποίων

Διαβάστε περισσότερα

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R

Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R Ανάλυση Δεδομένων με χρήση του Στατιστικού Πακέτου R, Επίκουρος Καθηγητής, Τομέας Μαθηματικών, Σχολή Εφαρμοσμένων Μαθηματικών και Φυσικών Επιστημών, Εθνικό Μετσόβιο Πολυτεχνείο. Περιεχόμενα Εισαγωγή στο

Διαβάστε περισσότερα

ΤΕΙ ΣΕΡΡΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΕΠΙΚΟΙΝΩΝΙΩΝ ΕΞΕΤΑΣΗ ΣΤΟ ΜΑΘΗΜΑ «ΑΝΑΓΝΩΡΙΣΗ ΠΡΟΤΥΠΩΝ ΝΕΥΡΩΝΙΚΑ ΔΙΚΤΥΑ» ΠΑ. 7 ΣΕΠΤΕΜΒΡΙΟΥ 2012

ΤΕΙ ΣΕΡΡΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΚΑΙ ΕΠΙΚΟΙΝΩΝΙΩΝ ΕΞΕΤΑΣΗ ΣΤΟ ΜΑΘΗΜΑ «ΑΝΑΓΝΩΡΙΣΗ ΠΡΟΤΥΠΩΝ ΝΕΥΡΩΝΙΚΑ ΔΙΚΤΥΑ» ΠΑ. 7 ΣΕΠΤΕΜΒΡΙΟΥ 2012 ΠΑ. 7 ΣΕΠΤΕΜΒΡΙΟΥ Δίνονται τα εξής πρότυπα: [ ] [ ] [ ] [ ] Άσκηση η (3 μονάδες) Χρησιμοποιώντας το κριτήριο της ομοιότητας να απορριφθεί ένα χαρακτηριστικό με βάση το συντελεστή συσχέτισης. (γράψτε ποιο

Διαβάστε περισσότερα

Αναγνώριση Προτύπων (Pattern Recognition) Μπεϋζιανή Θεωρία Αποφάσεων (Bayesian Decision Theory) Π. Τσακαλίδης

Αναγνώριση Προτύπων (Pattern Recognition) Μπεϋζιανή Θεωρία Αποφάσεων (Bayesian Decision Theory) Π. Τσακαλίδης Αναγνώριση Προτύπων (Pattern Recognton Μπεϋζιανή Θεωρία Αποφάσεων (Bayesan Decson Theory Π. Τσακαλίδης ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΡΗΤΗΣ ΤΜΗΜΑ ΕΠΙΣΤΗΜΗΣ ΥΠΟΛΟΓΙΣΤΩΝ Μπεϋζιανή Θεωρία Αποφάσεων (Bayes Decson theory Στατιστικά

Διαβάστε περισσότερα

1 Αριθμητική κινητής υποδιαστολής και σφάλματα στρογγύλευσης

1 Αριθμητική κινητής υποδιαστολής και σφάλματα στρογγύλευσης 1 Αριθμητική κινητής υποδιαστολής και σφάλματα στρογγύλευσης Στη συγκεκριμένη ενότητα εξετάζουμε θέματα σχετικά με την αριθμητική πεπερασμένης ακρίβειας που χρησιμοποιούν οι σημερινοί υπολογιστές και τα

Διαβάστε περισσότερα

Θεώρημα Βolzano. Κατηγορία 1 η. 11.1 Δίνεται η συνάρτηση:

Θεώρημα Βolzano. Κατηγορία 1 η. 11.1 Δίνεται η συνάρτηση: Κατηγορία η Θεώρημα Βolzano Τρόπος αντιμετώπισης:. Όταν μας ζητούν να εξετάσουμε αν ισχύει το θεώρημα Bolzano για μια συνάρτηση f σε ένα διάστημα [, ] τότε: Εξετάζουμε την συνέχεια της f στο [, ] (αν η

Διαβάστε περισσότερα

Αριθμητική εύρεση ριζών μη γραμμικών εξισώσεων

Αριθμητική εύρεση ριζών μη γραμμικών εξισώσεων Αριθμητική εύρεση ριζών μη γραμμικών εξισώσεων Με τον όρο μη γραμμικές εξισώσεις εννοούμε εξισώσεις της μορφής: f( ) 0 που προέρχονται από συναρτήσεις f () που είναι μη γραμμικές ως προς. Περιέχουν δηλαδή

Διαβάστε περισσότερα

Εξόρυξη γνώμης πολιτών από ελεύθερο κείμενο

Εξόρυξη γνώμης πολιτών από ελεύθερο κείμενο Δίκαρος Νίκος Δ/νση Μηχανογράνωσης κ Η.Ε.Σ. Υπουργείο Εσωτερικών. Τελική εργασία Κ Εκπαιδευτικής Σειράς Ε.Σ.Δ.Δ. Επιβλέπων: Ηρακλής Βαρλάμης Εξόρυξη γνώμης πολιτών από ελεύθερο κείμενο Κεντρική ιδέα Προβληματισμοί

Διαβάστε περισσότερα

ΤΟΠΟΓΡΑΦΙΚΑ ΔΙΚΤΥΑ ΚΑΙ ΥΠΟΛΟΓΙΣΜΟΙ ΑΝΑΣΚΟΠΗΣΗ ΘΕΩΡΙΑΣ ΣΥΝΟΡΘΩΣΕΩΝ

ΤΟΠΟΓΡΑΦΙΚΑ ΔΙΚΤΥΑ ΚΑΙ ΥΠΟΛΟΓΙΣΜΟΙ ΑΝΑΣΚΟΠΗΣΗ ΘΕΩΡΙΑΣ ΣΥΝΟΡΘΩΣΕΩΝ ΤΟΠΟΓΡΑΦΙΚΑ ΔΙΚΤΥΑ ΚΑΙ ΥΠΟΛΟΓΙΣΜΟΙ ΑΝΑΣΚΟΠΗΣΗ ΘΕΩΡΙΑΣ ΣΥΝΟΡΘΩΣΕΩΝ Βασίλης Δ. Ανδριτσάνος Δρ. Αγρονόμος - Τοπογράφος Μηχανικός ΑΠΘ Επίκουρος Καθηγητής ΤΕΙ Αθήνας 3ο εξάμηνο http://eclass.teiath.gr Παρουσιάσεις,

Διαβάστε περισσότερα

HMY 795: Αναγνώριση Προτύπων

HMY 795: Αναγνώριση Προτύπων HMY 795: Αναγνώριση Προτύπων Διάλεξη 5 Κατανομές πιθανότητας και εκτίμηση παραμέτρων δυαδικές τυχαίες μεταβλητές Bayesian decision Minimum misclassificaxon rate decision: διαλέγουμε την κατηγορία Ck για

Διαβάστε περισσότερα

Δέντρα Απόφασης (Decision(

Δέντρα Απόφασης (Decision( Δέντρα Απόφασης (Decision( Trees) Το μοντέλο που δημιουργείται είναι ένα δέντρο Χρήση της τεχνικής «διαίρει και βασίλευε» για διαίρεση του χώρου αναζήτησης σε υποσύνολα (ορθογώνιες περιοχές) Ένα παράδειγμα

Διαβάστε περισσότερα

Κεφάλαιο 4: Διαφορικός Λογισμός

Κεφάλαιο 4: Διαφορικός Λογισμός ΣΥΓΧΡΟΝΗ ΠΑΙΔΕΙΑ ΦΡΟΝΤΙΣΤΗΡΙΟ ΜΕΣΗΣ ΕΚΠΑΙΔΕΥΣΗΣ Κεφάλαιο 4: Διαφορικός Λογισμός Μονοτονία Συνάρτησης Tζουβάλης Αθανάσιος Κεφάλαιο 4: Διαφορικός Λογισμός Περιεχόμενα Μονοτονία συνάρτησης... Λυμένα παραδείγματα...

Διαβάστε περισσότερα

Μέρος Β /Στατιστική. Μέρος Β. Στατιστική. Γεωπονικό Πανεπιστήμιο Αθηνών Εργαστήριο Μαθηματικών&Στατιστικής/Γ. Παπαδόπουλος (www.aua.

Μέρος Β /Στατιστική. Μέρος Β. Στατιστική. Γεωπονικό Πανεπιστήμιο Αθηνών Εργαστήριο Μαθηματικών&Στατιστικής/Γ. Παπαδόπουλος (www.aua. Μέρος Β /Στατιστική Μέρος Β Στατιστική Γεωπονικό Πανεπιστήμιο Αθηνών Εργαστήριο Μαθηματικών&Στατιστικής/Γ. Παπαδόπουλος (www.aua.gr/gpapadopoulos) Από τις Πιθανότητες στη Στατιστική Στα προηγούμενα, στο

Διαβάστε περισσότερα

ΔΕΣΜΕΥΜΕΝΕΣ Ή ΥΠΟ ΣΥΝΘΗΚΗ ΠΙΘΑΝΟΤΗΤΕΣ

ΔΕΣΜΕΥΜΕΝΕΣ Ή ΥΠΟ ΣΥΝΘΗΚΗ ΠΙΘΑΝΟΤΗΤΕΣ ΔΕΣΜΕΥΜΕΝΕΣ Ή ΥΠΟ ΣΥΝΘΗΚΗ ΠΙΘΑΝΟΤΗΤΕΣ Έστω ότι επιθυμούμε να μελετήσουμε ένα τυχαίο πείραμα με δειγματικό χώρο Ω και έστω η πιθανότητα να συμβεί ένα ενδεχόμενο Α Ω Υπάρχουν περιπτώσεις όπου ενώ δεν γνωρίζουμε

Διαβάστε περισσότερα

Τεχνητή Νοημοσύνη. 2η διάλεξη (2015-16) Ίων Ανδρουτσόπουλος. http://www.aueb.gr/users/ion/

Τεχνητή Νοημοσύνη. 2η διάλεξη (2015-16) Ίων Ανδρουτσόπουλος. http://www.aueb.gr/users/ion/ Τεχνητή Νοημοσύνη 2η διάλεξη (2015-16) Ίων Ανδρουτσόπουλος http://www.aueb.gr/users/ion/ 1 Οι διαφάνειες αυτής της διάλεξης βασίζονται στα βιβλία: Τεχνητή Νοημοσύνη των Βλαχάβα κ.ά., 3η έκδοση, Β. Γκιούρδας

Διαβάστε περισσότερα

Αλγόριθμοι και Πολυπλοκότητα

Αλγόριθμοι και Πολυπλοκότητα Αλγόριθμοι και Πολυπλοκότητα Ροή Δικτύου Δημήτρης Μιχαήλ Τμήμα Πληροφορικής και Τηλεματικής Χαροκόπειο Πανεπιστήμιο Μοντελοποίηση Δικτύων Μεταφοράς Τα γραφήματα χρησιμοποιούνται συχνά για την μοντελοποίηση

Διαβάστε περισσότερα

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 6. Πιθανότητες

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 6. Πιθανότητες ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΔΥΤΙΚΗΣ ΕΛΛΑΔΑΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΠΑΤΡΑΣ Εργαστήριο Λήψης Αποφάσεων & Επιχειρησιακού Προγραμματισμού Καθηγητής Ι. Μητρόπουλος ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ ΘΕΜΑ 1 ο (2.5 µονάδες) ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΝΕΥΡΩΝΙΚΑ ΙΚΤΥΑ Τελικές εξετάσεις 21 Σεπτεµβρίου 2004 ιάρκεια: 3 ώρες Το παρακάτω σύνολο

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 2 ΔΙΑΤΑΞΕΙΣ, ΜΕΤΑΘΕΣΕΙΣ, ΣΥΝΔΥΑΣΜΟΙ

ΚΕΦΑΛΑΙΟ 2 ΔΙΑΤΑΞΕΙΣ, ΜΕΤΑΘΕΣΕΙΣ, ΣΥΝΔΥΑΣΜΟΙ ΚΕΦΑΛΑΙΟ ΔΙΑΤΑΞΕΙΣ ΜΕΤΑΘΕΣΕΙΣ ΣΥΝΔΥΑΣΜΟΙ Εισαγωγή. Οι σχηματισμοί που προκύπτουν με την επιλογή ενός συγκεκριμένου αριθμού στοιχείων από το ίδιο σύνολο καλούνται διατάξεις αν μας ενδιαφέρει η σειρά καταγραφή

Διαβάστε περισσότερα

Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ. (Power of a Test) ΚΕΦΑΛΑΙΟ 21

Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ. (Power of a Test) ΚΕΦΑΛΑΙΟ 21 ΚΕΦΑΛΑΙΟ 21 Η ΙΣΧΥΣ ΕΝΟΣ ΕΛΕΓΧΟΥ (Power of a Test) Όπως είδαμε προηγουμένως, στον Στατιστικό Έλεγχο Υποθέσεων, ορίζουμε δύο είδη πιθανών λαθών (κινδύνων) που μπορεί να συμβούν όταν παίρνουμε αποφάσεις

Διαβάστε περισσότερα

I. ΜΙΓΑΔΙΚΟΙ ΑΡΙΘΜΟΙ. math-gr

I. ΜΙΓΑΔΙΚΟΙ ΑΡΙΘΜΟΙ. math-gr I ΜΙΓΑΔΙΚΟΙ ΑΡΙΘΜΟΙ i e ΜΕΡΟΣ Ι ΟΡΙΣΜΟΣ - ΒΑΣΙΚΕΣ ΠΡΑΞΕΙΣ Α Ορισμός Ο ορισμός του συνόλου των Μιγαδικών αριθμών (C) βασίζεται στις εξής παραδοχές: Υπάρχει ένας αριθμός i για τον οποίο ισχύει i Το σύνολο

Διαβάστε περισσότερα

ΑΣΚΗΣΕΙΣ ΠΙΘΑΝΟΤΗΤΩΝ του Παν. Λ. Θεοδωρόπουλου 0

ΑΣΚΗΣΕΙΣ ΠΙΘΑΝΟΤΗΤΩΝ του Παν. Λ. Θεοδωρόπουλου 0 ΑΣΚΗΣΕΙΣ ΠΙΘΑΝΟΤΗΤΩΝ του Παν. Λ. Θεοδωρόπουλου 0 Η Θεωρία Πιθανοτήτων είναι ένας σχετικά νέος κλάδος των Μαθηματικών, ο οποίος παρουσιάζει πολλά ιδιαίτερα χαρακτηριστικά στοιχεία. Επειδή η ιδιαιτερότητα

Διαβάστε περισσότερα

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ. Κεφάλαιο 10. Εισαγωγή στην εκτιμητική

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ. Κεφάλαιο 10. Εισαγωγή στην εκτιμητική ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΔΥΤΙΚΗΣ ΕΛΛΑΔΑΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΠΑΤΡΑΣ Εργαστήριο Λήψης Αποφάσεων & Επιχειρησιακού Προγραμματισμού Καθηγητής Ι. Μητρόπουλος ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ ΕΙΔΙΚΑ ΘΕΜΑΤΑ

Διαβάστε περισσότερα

iii ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος

iii ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος iii ΠΕΡΙΕΧΟΜΕΝΑ Πρόλογος xi 1 Αντικείμενα των Πιθανοτήτων και της Στατιστικής 1 1.1 Πιθανοτικά Πρότυπα και Αντικείμενο των Πιθανοτήτων, 1 1.2 Αντικείμενο της Στατιστικής, 3 1.3 Ο Ρόλος των Πιθανοτήτων

Διαβάστε περισσότερα

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ Θ.Ε. ΠΛΗ31 (2004-5) ΓΡΑΠΤΗ ΕΡΓΑΣΙΑ #3 Στόχος Στόχος αυτής της εργασίας είναι η απόκτηση δεξιοτήτων σε θέματα που αφορούν τα Τεχνητά Νευρωνικά Δίκτυα και ποιο συγκεκριμένα θέματα εκπαίδευσης και υλοποίησης.

Διαβάστε περισσότερα

Συνήθεις διαφορικές εξισώσεις προβλήματα οριακών τιμών

Συνήθεις διαφορικές εξισώσεις προβλήματα οριακών τιμών Συνήθεις διαφορικές εξισώσεις προβλήματα οριακών τιμών Οι παρούσες σημειώσεις αποτελούν βοήθημα στο μάθημα Αριθμητικές Μέθοδοι του 5 ου εξαμήνου του ΤΜΜ ημήτρης Βαλουγεώργης Καθηγητής Εργαστήριο Φυσικών

Διαβάστε περισσότερα

ΠΕΡΙΕΧΟΜΕΝΑ. ΠΡΟΛΟΓΟΣ... vii ΠΕΡΙΕΧΟΜΕΝΑ... ix ΓΕΝΙΚΗ ΒΙΒΛΙΟΓΡΑΦΙΑ... xv. Κεφάλαιο 1 ΓΕΝΙΚΕΣ ΕΝΝΟΙΕΣ ΑΠΟ ΤΗ ΣΤΑΤΙΣΤΙΚΗ

ΠΕΡΙΕΧΟΜΕΝΑ. ΠΡΟΛΟΓΟΣ... vii ΠΕΡΙΕΧΟΜΕΝΑ... ix ΓΕΝΙΚΗ ΒΙΒΛΙΟΓΡΑΦΙΑ... xv. Κεφάλαιο 1 ΓΕΝΙΚΕΣ ΕΝΝΟΙΕΣ ΑΠΟ ΤΗ ΣΤΑΤΙΣΤΙΚΗ ΠΡΟΛΟΓΟΣ... vii ΠΕΡΙΕΧΟΜΕΝΑ... ix ΓΕΝΙΚΗ ΒΙΒΛΙΟΓΡΑΦΙΑ... xv Κεφάλαιο 1 ΓΕΝΙΚΕΣ ΕΝΝΟΙΕΣ ΑΠΟ ΤΗ ΣΤΑΤΙΣΤΙΚΗ 1.1 Πίνακες, κατανομές, ιστογράμματα... 1 1.2 Πυκνότητα πιθανότητας, καμπύλη συχνοτήτων... 5 1.3

Διαβάστε περισσότερα

Πινάκες συνάφειας. Βαρύτητα συμπτωμάτων. Φύλο Χαμηλή Υψηλή. Άνδρες. Γυναίκες

Πινάκες συνάφειας. Βαρύτητα συμπτωμάτων. Φύλο Χαμηλή Υψηλή. Άνδρες. Γυναίκες Πινάκες συνάφειας εξερεύνηση σχέσεων μεταξύ τυχαίων μεταβλητών. Είναι λογικό λοιπόν, στην ανάλυση των κατηγορικών δεδομένων να μας ενδιαφέρει η σχέση μεταξύ δύο ή περισσότερων κατηγορικών μεταβλητών. Έστω

Διαβάστε περισσότερα

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 5 Συλλογή Δεδομένων & Δειγματοληψία

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ. Κεφάλαιο 5 Συλλογή Δεδομένων & Δειγματοληψία ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΔΥΤΙΚΗΣ ΕΛΛΑΔΑΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΠΑΤΡΑΣ Εργαστήριο Λήψης Αποφάσεων & Επιχειρησιακού Προγραμματισμού Καθηγητής Ι. Μητρόπουλος ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΣΤΑΤΙΣΤΙΚΗ ΤΩΝ ΕΠΙΧΕΙΡΗΣΕΩΝ

Διαβάστε περισσότερα

Θεωρία Υπολογισμού και Πολυπλοκότητα Μαθηματικό Υπόβαθρο

Θεωρία Υπολογισμού και Πολυπλοκότητα Μαθηματικό Υπόβαθρο Θεωρία Υπολογισμού και Πολυπλοκότητα Μαθηματικό Υπόβαθρο Στην ενότητα αυτή θα μελετηθούν τα εξής επιμέρους θέματα: Σύνολα Συναρτήσεις και Σχέσεις Γραφήματα Λέξεις και Γλώσσες Αποδείξεις ΕΠΛ 211 Θεωρία

Διαβάστε περισσότερα

Δομές Δεδομένων και Αλγόριθμοι

Δομές Δεδομένων και Αλγόριθμοι Δομές Δεδομένων και Αλγόριθμοι Χρήστος Γκόγκος ΤΕΙ Ηπείρου Χειμερινό Εξάμηνο 2014-2015 Παρουσίαση 20 Huffman codes 1 / 12 Κωδικοποίηση σταθερού μήκους Αν χρησιμοποιηθεί κωδικοποίηση σταθερού μήκους δηλαδή

Διαβάστε περισσότερα

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ Ι Συμπληρωματικές Σημειώσεις Δημήτριος Παντελής

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ Ι Συμπληρωματικές Σημειώσεις Δημήτριος Παντελής ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ Ι Συμπληρωματικές Σημειώσεις Δημήτριος Παντελής ΣΤΑΤΙΣΤΙΚΕΣ ΕΚΤΙΜΗΣΕΙΣ Οι συναρτήσεις πιθανότητας ή πυκνότητας πιθανότητας των διαφόρων τυχαίων μεταβλητών χαρακτηρίζονται από κάποιες

Διαβάστε περισσότερα

Το Κεντρικό Οριακό Θεώρημα

Το Κεντρικό Οριακό Θεώρημα Το Κεντρικό Οριακό Θεώρημα Όπως θα δούμε αργότερα στη Στατιστική Συμπερασματολογία, λέγοντας ότι «από έναν πληθυσμό παίρνουμε ένα τυχαίο δείγμα μεγέθους» εννοούμε ανεξάρτητες τυχαίες μεταβλητές,,..., που

Διαβάστε περισσότερα

ΠΑΡΑΔΕΙΓΜΑΤΑ ΘΕΜΑ Β. Να εξετάσετε αν ισχύουν οι υποθέσεις του Θ.Μ.Τ. για την συνάρτηση στο διάστημα [ 1,1] τέτοιο, ώστε: C στο σημείο (,f( ))

ΠΑΡΑΔΕΙΓΜΑΤΑ ΘΕΜΑ Β. Να εξετάσετε αν ισχύουν οι υποθέσεις του Θ.Μ.Τ. για την συνάρτηση στο διάστημα [ 1,1] τέτοιο, ώστε: C στο σημείο (,f( )) ΚΕΦΑΛΑΙΟ ο: ΔΙΑΦΟΡΙΚΟΣ ΛΟΓΙΣΜΟΣ ΕΝΟΤΗΤΑ 6: ΘΕΩΡΗΜΑ ΜΕΣΗΣ ΤΙΜΗΣ ΔΙΑΦΟΡΙΚΟΥ ΛΟΓΙΣΜΟΥ (Θ.Μ.Τ.) [Θεώρημα Μέσης Τιμής Διαφορικού Λογισμού του κεφ..5 Μέρος Β του σχολικού βιβλίου]. ΠΑΡΑΔΕΙΓΜΑΤΑ Παράδειγμα. ΘΕΜΑ

Διαβάστε περισσότερα

ΜΟΝΤΕΛΟΠΟΙΗΣΗ ΔΙΑΚΡΙΤΩΝ ΕΝΑΛΛΑΚΤΙΚΩΝ ΣΕ ΠΡΟΒΛΗΜΑΤΑ ΣΧΕΔΙΑΣΜΟΥ ΚΑΙ ΣΥΝΘΕΣΗΣ ΔΙΕΡΓΑΣΙΩΝ

ΜΟΝΤΕΛΟΠΟΙΗΣΗ ΔΙΑΚΡΙΤΩΝ ΕΝΑΛΛΑΚΤΙΚΩΝ ΣΕ ΠΡΟΒΛΗΜΑΤΑ ΣΧΕΔΙΑΣΜΟΥ ΚΑΙ ΣΥΝΘΕΣΗΣ ΔΙΕΡΓΑΣΙΩΝ ΜΕΡΟΣ ΙΙ ΜΟΝΤΕΛΟΠΟΙΗΣΗ ΔΙΑΚΡΙΤΩΝ ΕΝΑΛΛΑΚΤΙΚΩΝ ΣΕ ΠΡΟΒΛΗΜΑΤΑ ΣΧΕΔΙΑΣΜΟΥ ΚΑΙ ΣΥΝΘΕΣΗΣ ΔΙΕΡΓΑΣΙΩΝ 36 ΜΟΝΤΕΛΟΠΟΙΗΣΗ ΔΙΑΚΡΙΤΩΝ ΕΝΑΛΛΑΚΤΙΚΩΝ ΣΕ ΠΡΟΒΛΗΜΑΤΑ ΣΧΕΔΙΑΣΜΟΥ ΚΑΙ ΣΥΝΘΕΣΗΣ ΔΙΕΡΓΑΣΙΩΝ Πολλές από τις αποφάσεις

Διαβάστε περισσότερα

Επαναληπτικά θέματα στα Μαθηματικά προσανατολισμού-ψηφιακό σχολείο ΕΠΑΝΑΛΗΠΤΙΚΑ ΘΕΜΑΤΑ ΣΤΑ ΜΑΘΗΜΑΤΙΚΑ ΠΡΟΣΑΝΑΤΟΛΙΣΜΟΥ ΘΕΤΙΚΩΝ ΣΠΟΥΔΩΝ

Επαναληπτικά θέματα στα Μαθηματικά προσανατολισμού-ψηφιακό σχολείο ΕΠΑΝΑΛΗΠΤΙΚΑ ΘΕΜΑΤΑ ΣΤΑ ΜΑΘΗΜΑΤΙΚΑ ΠΡΟΣΑΝΑΤΟΛΙΣΜΟΥ ΘΕΤΙΚΩΝ ΣΠΟΥΔΩΝ ΕΠΑΝΑΛΗΠΤΙΚΑ ΘΕΜΑΤΑ ΣΤΑ ΜΑΘΗΜΑΤΙΚΑ ΠΡΟΣΑΝΑΤΟΛΙΣΜΟΥ ΚΕΦΑΛΑΙΟ 1 ο -ΣΥΝΑΡΤΗΣΕΙΣ ΘΕΤΙΚΩΝ ΣΠΟΥΔΩΝ ΣΠΟΥΔΩΝ ΟΙΚΟΝΟΜΙΑΣ ΚΑΙ ΠΛΗΡΟΦΟΡΙΚΗΣ Απο το Ψηφιακό Σχολείο του ΥΠΠΕΘ Επιμέλεια: Συντακτική Ομάδα mathpgr Συντονιστής:

Διαβάστε περισσότερα

Στατιστική Ι (ΨΥΧ-1202) Διάλεξη 7. Στατιστικός έλεγχος υποθέσεων

Στατιστική Ι (ΨΥΧ-1202) Διάλεξη 7. Στατιστικός έλεγχος υποθέσεων (ΨΥΧ-1202) Λεωνίδας Α. Ζαμπετάκης Β.Sc., M.Env.Eng., M.Ind.Eng., D.Eng. Εmail: statisticsuoc@gmail.com Διαλέξεις: ftp://ftp.soc.uoc.gr/psycho/zampetakis/ Διάλεξη 7 Στατιστικός έλεγχος υποθέσεων ΠΑΝΕΠΙΣΤΗΜΙΟ

Διαβάστε περισσότερα

Συσχέτιση μεταξύ δύο συνόλων δεδομένων

Συσχέτιση μεταξύ δύο συνόλων δεδομένων Διαγράμματα διασποράς (scattergrams) Συσχέτιση μεταξύ δύο συνόλων δεδομένων Η οπτική απεικόνιση δύο συνόλων δεδομένων μπορεί να αποκαλύψει με παραστατικό τρόπο πιθανές τάσεις και μεταξύ τους συσχετίσεις,

Διαβάστε περισσότερα

Διάλεξη 1 Βασικές έννοιες

Διάλεξη 1 Βασικές έννοιες Εργαστήριο SPSS Ψ-4201 (ΕΡΓ) Λεωνίδας Α. Ζαμπετάκης Β.Sc., M.Env.Eng., M.Ind.Eng., D.Eng. Εmail: statisticsuoc@gmail.com Διαλέξεις αναρτημένες στο: Διαλέξεις: ftp://ftp.soc.uoc.gr/psycho/zampetakis/ Διάλεξη

Διαβάστε περισσότερα

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης

ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ. Ερωτήσεις πολλαπλής επιλογής. Συντάκτης: Δημήτριος Κρέτσης ΠΑΝΕΠΙΣΤΗΜΙΑΚΑ ΦΡΟΝΤΙΣΤΗΡΙΑ ΚΟΛΛΙΝΤΖΑ Ερωτήσεις πολλαπλής επιλογής Συντάκτης: Δημήτριος Κρέτσης 1. Ο κλάδος της περιγραφικής Στατιστικής: α. Ασχολείται με την επεξεργασία των δεδομένων και την ανάλυση

Διαβάστε περισσότερα

Βασικές έννοιες της Στατιστικής: Πληθυσμός - Δείγμα

Βασικές έννοιες της Στατιστικής: Πληθυσμός - Δείγμα Βασικές έννοιες της Στατιστικής: Πληθυσμός - Δείγμα Στατιστική είναι ο κλάδος των μαθηματικών που εμβαθύνει σε μεθόδους συλλογής δεδομένων, οργάνωσης, παρουσίασης των δεδομένων και εξαγωγής συμπερασμάτων

Διαβάστε περισσότερα

Περιγραφική Στατιστική. Ακαδ. Έτος 2012-2013 1 ο εξάμηνο. Κ. Πολίτης

Περιγραφική Στατιστική. Ακαδ. Έτος 2012-2013 1 ο εξάμηνο. Κ. Πολίτης Περιγραφική Στατιστική Ακαδ. Έτος 2012-2013 1 ο εξάμηνο Κ. Πολίτης 1 2 Η στατιστική ασχολείται με τη συλλογή, οργάνωση, παρουσίαση και ανάλυση πληροφοριών. Οι πληροφορίες αυτές, πολύ συχνά αριθμητικές,

Διαβάστε περισσότερα

3. ΣΤΡΩΜΑΤΟΠΟΙΗΜΕΝΗ ΤΥΧΑΙΑ ΔΕΙΓΜΑΤΟΛΗΨΙΑ (Stratified Random Sampling)

3. ΣΤΡΩΜΑΤΟΠΟΙΗΜΕΝΗ ΤΥΧΑΙΑ ΔΕΙΓΜΑΤΟΛΗΨΙΑ (Stratified Random Sampling) 3 ΣΤΡΩΜΑΤΟΠΟΙΗΜΕΝΗ ΤΥΧΑΙΑ ΔΕΙΓΜΑΤΟΛΗΨΙΑ (Stratfed Radom Samplg) Είναι προφανές από τα τυπικά σφάλματα των εκτιμητριών των προηγούμενων παραγράφων, ότι ένας τρόπος να αυξηθεί η ακρίβεια τους είναι να αυξηθεί

Διαβάστε περισσότερα

Η ΜΕΘΟΔΟΣ PCA (Principle Component Analysis)

Η ΜΕΘΟΔΟΣ PCA (Principle Component Analysis) Η ΜΕΘΟΔΟΣ PCA (Principle Component Analysis) Η μέθοδος PCA (Ανάλυση Κύριων Συνιστωσών), αποτελεί μία γραμμική μέθοδο συμπίεσης Δεδομένων η οποία συνίσταται από τον επαναπροσδιορισμό των συντεταγμένων ενός

Διαβάστε περισσότερα

ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ ΠΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ ΠΕΡΙΒΑΛΛΟΝ ΕΠΙΜΕΛΕΙΑ: ΜΑΡΙΑ Σ. ΖΙΩΓΑ ΚΑΘΗΓΗΤΡΙΑ ΠΛΗΡΟΦΟΡΙΚΗΣ 1 ΟΥ ΚΕΦΑΛΑΙΟΥ ΑΝΑΛΥΣΗ ΠΡΟΒΛΗΜΑΤΟΣ

ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ ΠΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ ΠΕΡΙΒΑΛΛΟΝ ΕΠΙΜΕΛΕΙΑ: ΜΑΡΙΑ Σ. ΖΙΩΓΑ ΚΑΘΗΓΗΤΡΙΑ ΠΛΗΡΟΦΟΡΙΚΗΣ 1 ΟΥ ΚΕΦΑΛΑΙΟΥ ΑΝΑΛΥΣΗ ΠΡΟΒΛΗΜΑΤΟΣ ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ ΠΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ ΠΕΡΙΒΑΛΛΟΝ ΕΠΙΜΕΛΕΙΑ: ΜΑΡΙΑ Σ. ΖΙΩΓΑ ΚΑΘΗΓΗΤΡΙΑ ΠΛΗΡΟΦΟΡΙΚΗΣ ΘΕΩΡΙΑ 1 ΟΥ ΚΕΦΑΛΑΙΟΥ ΑΝΑΛΥΣΗ ΠΡΟΒΛΗΜΑΤΟΣ 1.1 Να δοθεί ο ορισμός του προβλήματος καθώς και τρία παραδείγματα

Διαβάστε περισσότερα

Μοντέλα Παλινδρόμησης. Άγγελος Μάρκος, Λέκτορας ΠΤ Ε, ΠΘ

Μοντέλα Παλινδρόμησης. Άγγελος Μάρκος, Λέκτορας ΠΤ Ε, ΠΘ Μοντέλα Παλινδρόμησης Άγγελος Μάρκος, Λέκτορας ΠΤ Ε, ΠΘ Εισαγωγή (1) Σε αρκετές περιπτώσεις επίλυσης προβλημάτων ενδιαφέρει η ταυτόχρονη μελέτη δύο ή περισσότερων μεταβλητών, για να προσδιορίσουμε με ποιο

Διαβάστε περισσότερα

ΠΡΟΓΝΩΣΤΙΚA ΣΥΣTHΜΑΤΑ

ΠΡΟΓΝΩΣΤΙΚA ΣΥΣTHΜΑΤΑ ΠΡΟΓΝΩΣΤΙΚA ΣΥΣTHΜΑΤΑ Ιωάννα Τζουλάκη Κώστας Τσιλίδης Ιωαννίδης: κεφάλαιο 2 Guyatt: κεφάλαιο 18 ΕΠΙςΤΗΜΟΝΙΚΗ ΙΑΤΡΙΚΗ Επιστήμη (θεωρία) Πράξη (φροντίδα υγείας) Γνωστικό μέρος Αιτιό-γνωση Διά-γνωση Πρό-γνωση

Διαβάστε περισσότερα

ΚΕΦΑΛΑΙΟ 3ο ΤΥΧΑΙΟΙ ΑΡΙΘΜΟΙ ΕΛΕΓΧΟΣ ΤΥΧΑΙΟΤΗΤΑΣ

ΚΕΦΑΛΑΙΟ 3ο ΤΥΧΑΙΟΙ ΑΡΙΘΜΟΙ ΕΛΕΓΧΟΣ ΤΥΧΑΙΟΤΗΤΑΣ ΚΕΦΑΛΑΙΟ 3ο ΤΥΧΑΙΟΙ ΑΡΙΘΜΟΙ ΕΛΕΓΧΟΣ ΤΥΧΑΙΟΤΗΤΑΣ 3.1 Τυχαίοι αριθμοί Στην προσομοίωση διακριτών γεγονότων γίνεται χρήση ακολουθίας τυχαίων αριθμών στις περιπτώσεις που απαιτείται η δημιουργία στοχαστικών

Διαβάστε περισσότερα

Από το Γυμνάσιο στο Λύκειο... 7. 3. Δειγματικός χώρος Ενδεχόμενα... 42 Εύρεση δειγματικού χώρου... 46

Από το Γυμνάσιο στο Λύκειο... 7. 3. Δειγματικός χώρος Ενδεχόμενα... 42 Εύρεση δειγματικού χώρου... 46 ΠEΡΙΕΧΟΜΕΝΑ Από το Γυμνάσιο στο Λύκειο................................................ 7 1. Το Λεξιλόγιο της Λογικής.............................................. 11. Σύνολα..............................................................

Διαβάστε περισσότερα

Συνέχεια συνάρτησης σε κλειστό διάστημα

Συνέχεια συνάρτησης σε κλειστό διάστημα 8 Συνέχεια συνάρτησης σε κλειστό διάστημα Α ΑΠΑΡΑΙΤΗΤΕΣ ΓΝΩΣΕΙΣ ΘΕΩΡΙΑΣ 1 Μια συνάρτηση f θα λέμε ότι είναι: i Συνεχής σε ένα ανοιχτό διάστημα (α,β) όταν είναι συνεχής σε κάθε σημείο του διαστήματος (α,β)

Διαβάστε περισσότερα

Στατιστική Ι. Ενότητα 8: Επαγωγική Στατιστική. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών

Στατιστική Ι. Ενότητα 8: Επαγωγική Στατιστική. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών Στατιστική Ι Ενότητα 8: Επαγωγική Στατιστική. Δρ. Γεώργιος Κοντέος Τμήμα Διοίκησης Επιχειρήσεων Γρεβενών Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για εκπαιδευτικό

Διαβάστε περισσότερα

1.8 ΣΥΝΕΧΕΙΑ ΣΥΝΑΡΤΗΣΗΣ ΘΕΩΡΗΜΑ BOLZANO A. ΣΥΝΕΧΕΙΑ ΣΥΝΑΡΤΗΣΗΣ

1.8 ΣΥΝΕΧΕΙΑ ΣΥΝΑΡΤΗΣΗΣ ΘΕΩΡΗΜΑ BOLZANO A. ΣΥΝΕΧΕΙΑ ΣΥΝΑΡΤΗΣΗΣ .8 ΣΥΝΕΧΕΙΑ ΣΥΝΑΡΤΗΣΗΣ ΘΕΩΡΗΜΑ BOLZANO A. ΣΥΝΕΧΕΙΑ ΣΥΝΑΡΤΗΣΗΣ ΜΕΘΟΔΟΛΟΓΙΑ : ΣΥΝΕΧΗΣ ΣΥΝΑΡΤΗΣΗ - ΟΡΙΣΜΟΣ Όταν θέλουμε να εξετάσουμε ως προς τη συνέχεια μια συνάρτηση πολλαπλού τύπου, εργαζόμαστε ως εξής

Διαβάστε περισσότερα

Η οικολογία μάθησης για τους υπολογιστές ΙII: Η δική σας οικολογία μάθησης

Η οικολογία μάθησης για τους υπολογιστές ΙII: Η δική σας οικολογία μάθησης Η οικολογία μάθησης για τους υπολογιστές ΙII: Η δική σας οικολογία μάθησης Παλαιγεωργίου Γιώργος Τμήμα Μηχανικών Η/Υ, Τηλεπικοινωνιών και Δικτύων Πανεπιστήμιο Θεσσαλίας Ιανουάριος 2011 Ψυχομετρία Η κατασκευή

Διαβάστε περισσότερα

3. ΣΕΙΡΙΑΚΟΣ ΣΥΝΤΕΛΕΣΤΗΣ ΣΥΣΧΕΤΙΣΗΣ

3. ΣΕΙΡΙΑΚΟΣ ΣΥΝΤΕΛΕΣΤΗΣ ΣΥΣΧΕΤΙΣΗΣ 3. ΣΕΙΡΙΑΚΟΣ ΣΥΝΤΕΛΕΣΤΗΣ ΣΥΣΧΕΤΙΣΗΣ Πρόβλημα: Ένας ραδιοφωνικός σταθμός ενδιαφέρεται να κάνει μια ανάλυση για τους πελάτες του που διαφημίζονται σ αυτόν για να εξετάσει την ποσοστιαία μεταβολή των πωλήσεων

Διαβάστε περισσότερα

Κεφάλαιο 2: Θεωρία Απόφασης του Bayes 2.1 Εισαγωγή

Κεφάλαιο 2: Θεωρία Απόφασης του Bayes 2.1 Εισαγωγή Κεφάλαιο : Θεωρία Απόφασης του Bayes. Εισαγωγή Η θεωρία απόφασης του Bayes αποτελεί μια από τις σημαντικότερες στατιστικές προσεγγίσεις για το πρόβλημα της ταξινόμησης προτύπων. Βασίζεται στη σύγκριση

Διαβάστε περισσότερα

IV. Συνέχεια Συνάρτησης. math-gr

IV. Συνέχεια Συνάρτησης. math-gr IV Συνέχεια Συνάρτησης mth-gr mth-gr Παντελής Μπουμπούλης, MSc, PhD σελ mth-grblogspotcom, bouboulismyschgr ΜΕΡΟΣ Συνέχεια Συνάρτησης Α Ορισμός Συνέχεια σε σημείο: Θα λέμε ότι μια συνάρτηση είναι συνεχής

Διαβάστε περισσότερα

ΠΡΟΔΙΑΓΡΑΦΕΣ - ΟΔΗΓΙΕΣ ΔΙΑΜΟΡΦΩΣΗΣ ΘΕΜΑΤΩΝ ΓΙΑ ΤΟ ΜΑΘΗΜΑ

ΠΡΟΔΙΑΓΡΑΦΕΣ - ΟΔΗΓΙΕΣ ΔΙΑΜΟΡΦΩΣΗΣ ΘΕΜΑΤΩΝ ΓΙΑ ΤΟ ΜΑΘΗΜΑ ΠΡΟΔΙΑΓΡΑΦΕΣ - ΟΔΗΓΙΕΣ ΔΙΑΜΟΡΦΩΣΗΣ ΘΕΜΑΤΩΝ ΓΙΑ ΤΟ ΜΑΘΗΜΑ Μαθηματικά (Άλγεβρα - Γεωμετρία) Α ΤΑΞΗ ΗΜΕΡΗΣΙΟΥ και Α, Β ΤΑΞΕΙΣ ΕΣΠΕΡΙΝΟΥ ΓΕΝΙΚΟΥ ΛΥΚΕΙΟΥ Α ΤΑΞΗ ΗΜΕΡΗΣΙΟΥ και Α ΤΑΞΗ ΕΣΠΕΡΙΝΟΥ ΕΠΑΛ ΚΕΝΤΡΙΚΗ

Διαβάστε περισσότερα

Δισδιάστατη ανάλυση. Για παράδειγμα, έστω ότι 11 άτομα δήλωσαν ότι είναι άγαμοι (Α), 26 έγγαμοι (Ε), 12 χήροι (Χ) και 9 διαζευγμένοι (Δ).

Δισδιάστατη ανάλυση. Για παράδειγμα, έστω ότι 11 άτομα δήλωσαν ότι είναι άγαμοι (Α), 26 έγγαμοι (Ε), 12 χήροι (Χ) και 9 διαζευγμένοι (Δ). Δισδιάστατη ανάλυση Πίνακες διπλής εισόδου Σε πολλές περιπτώσεις μελετάμε περισσότερες από μία μεταβλητές ταυτόχρονα. Π.χ. μία έρευνα που έγινε σε ένα δείγμα 58 ατόμων περιείχε τις ερωτήσεις «ποια είναι

Διαβάστε περισσότερα

2. ΑΝΑΛΥΣΗ ΣΦΑΛΜΑΤΩΝ

2. ΑΝΑΛΥΣΗ ΣΦΑΛΜΑΤΩΝ 1. ΑΝΑΛΥΣΗ ΣΦΑΛΜΑΤΩΝ 1. Σφάλματα Κάθε μέτρηση ενός φυσικού μεγέθους χαρακτηρίζεται από μία αβεβαιότητα που ονομάζουμε σφάλμα, το οποίο αναγράφεται με τη μορφή Τιμή ± αβεβαιότητα π.χ έστω ότι σε ένα πείραμα

Διαβάστε περισσότερα

2. ΕΠΙΛΟΓΗ ΜΟΝΤΕΛΟΥ ΜΕ ΤΗ ΜΕΘΟΔΟ ΤΟΥ ΑΠΟΚΛΕΙΣΜΟΥ ΜΕΤΑΒΛΗΤΩΝ (Backward Elimination Procedure) Στην στατιστική βιβλιογραφία υπάρχουν πολλές μέθοδοι για

2. ΕΠΙΛΟΓΗ ΜΟΝΤΕΛΟΥ ΜΕ ΤΗ ΜΕΘΟΔΟ ΤΟΥ ΑΠΟΚΛΕΙΣΜΟΥ ΜΕΤΑΒΛΗΤΩΝ (Backward Elimination Procedure) Στην στατιστική βιβλιογραφία υπάρχουν πολλές μέθοδοι για 2. ΕΠΙΛΟΓΗ ΜΟΝΤΕΛΟΥ ΜΕ ΤΗ ΜΕΘΟΔΟ ΤΟΥ ΑΠΟΚΛΕΙΣΜΟΥ ΜΕΤΑΒΛΗΤΩΝ (Backward Elimination Procedure) Στην στατιστική βιβλιογραφία υπάρχουν πολλές μέθοδοι για τον καθορισμό του καλύτερου υποσυνόλου από ένα σύνολο

Διαβάστε περισσότερα

Επαναληπτικέ ς Ασκη σέις ΑΕΠΠ

Επαναληπτικέ ς Ασκη σέις ΑΕΠΠ Επαναληπτικέ ς Ασκη σέις ΑΕΠΠ Επιμέλεια: Σ. Ασημέλλης 1. Σε ένα ποδοσφαιρικό πρωτάθλημα μετέχουν 16 ομάδες. Κάθε ομάδα παίζει με όλες τις υπόλοιπες ως γηπεδούχος και ως φιλοξενούμενη. Νίκη μιας ομάδας

Διαβάστε περισσότερα

6. ΔΕΙΓΜΑΤΟΛΗΨΙΑ ΚΑΤΑ ΟΜΑΔΕΣ (Cluster Sampling)

6. ΔΕΙΓΜΑΤΟΛΗΨΙΑ ΚΑΤΑ ΟΜΑΔΕΣ (Cluster Sampling) 6. ΔΕΙΓΜΑΤΟΛΗΨΙΑ ΚΑΤΑ ΟΜΑΔΕΣ (Cluster Sampling) Από την θεωρία που αναπτύχθηκε στα προηγούμενα κεφάλαια, φαίνεται ότι μια αλλαγή στον σχεδιασμό της δειγματοληψίας και, κατά συνέπεια, στην μέθοδο εκτίμησης

Διαβάστε περισσότερα

ΔΙΑΦΟΡΙΚΟΣ ΛΟΓΙΣΜΟΣ ΣΥΝΟΠΤΙΚΗ ΘΕΩΡΕΙΑ ΜΕΘΟΔΟΛΟΓΙΑ ΛΥΜΕΝΑ ΠΑΡΑΔΕΙΓΜΑΤΑ

ΔΙΑΦΟΡΙΚΟΣ ΛΟΓΙΣΜΟΣ ΣΥΝΟΠΤΙΚΗ ΘΕΩΡΕΙΑ ΜΕΘΟΔΟΛΟΓΙΑ ΛΥΜΕΝΑ ΠΑΡΑΔΕΙΓΜΑΤΑ ΔΙΑΦΟΡΙΚΟΣ ΛΟΓΙΣΜΟΣ ΣΥΝΟΠΤΙΚΗ ΘΕΩΡΕΙΑ ΜΕΘΟΔΟΛΟΓΙΑ ΛΥΜΕΝΑ ΠΑΡΑΔΕΙΓΜΑΤΑ Φροντιστήριο Μ.Ε. «ΑΙΧΜΗ» Κ.Καρτάλη 8 Βόλος Τηλ. 43598 ΠΊΝΑΚΑΣ ΠΕΡΙΕΧΟΜΈΝΩΝ 3. Η ΕΝΝΟΙΑ ΤΗΣ ΠΑΡΑΓΩΓΟΥ... 5 ΜΕΘΟΔΟΛΟΓΙΑ ΛΥΜΕΝΑ ΠΑΡΑΔΕΙΓΜΑΤΑ...

Διαβάστε περισσότερα

Αναγνώριση Προτύπων. Baysian Θεωρία Αποφάσεων ΕΠΙΣΚΟΠΗΣΗ-ΑΣΚΗΣΕΙΣ

Αναγνώριση Προτύπων. Baysian Θεωρία Αποφάσεων ΕΠΙΣΚΟΠΗΣΗ-ΑΣΚΗΣΕΙΣ Αναγνώριση Προτύπων Baysian Θεωρία Αποφάσεων ΕΠΙΣΚΟΠΗΣΗ-ΑΣΚΗΣΕΙΣ Χριστόδουλος Χαμζάς Τα περιεχόμενο της παρουσίασης βασίζεται στο βιβλίο: Introduction to Pattern Recognition A Matlab Approach, S. Theodoridis,

Διαβάστε περισσότερα

Μέθοδοι Μηχανικής Μάθησης στην επεξεργασία Τηλεπισκοπικών Δεδομένων. Δρ. Ε. Χάρου

Μέθοδοι Μηχανικής Μάθησης στην επεξεργασία Τηλεπισκοπικών Δεδομένων. Δρ. Ε. Χάρου Μέθοδοι Μηχανικής Μάθησης στην επεξεργασία Τηλεπισκοπικών Δεδομένων Δρ. Ε. Χάρου Πρόγραμμα υπολογιστικής ευφυίας Ινστιτούτο Πληροφορικής & Τηλεπικοινωνιών ΕΚΕΦΕ ΔΗΜΟΚΡΙΤΟΣ exarou@iit.demokritos.gr Μηχανική

Διαβάστε περισσότερα

ΤΕΧΝΙΚΕΣ ΔΕΙΓΜΑΤΟΛΗΨΙΑΣ ΓΕΩΡΓΙΟΣ ΛΑΓΟΥΜΙΝΤΖΗΣ, ΒΙΟΧΗΜΙΚΟΣ, PHD ΙΑΤΡΙΚΗΣ

ΤΕΧΝΙΚΕΣ ΔΕΙΓΜΑΤΟΛΗΨΙΑΣ ΓΕΩΡΓΙΟΣ ΛΑΓΟΥΜΙΝΤΖΗΣ, ΒΙΟΧΗΜΙΚΟΣ, PHD ΙΑΤΡΙΚΗΣ ΤΕΧΝΙΚΕΣ ΔΕΙΓΜΑΤΟΛΗΨΙΑΣ ΓΕΩΡΓΙΟΣ ΛΑΓΟΥΜΙΝΤΖΗΣ, ΒΙΟΧΗΜΙΚΟΣ, PHD ΙΑΤΡΙΚΗΣ ΤΕΧΝΙΚΕΣ ΔΕΙΓΜΑΤΟΛΗΨΙΑΣ Οι τεχνικές δειγματοληψίας είναι ένα σύνολο μεθόδων που επιτρέπει να μειώσουμε το μέγεθος των δεδομένων που

Διαβάστε περισσότερα

ΔΙΟΙΚΗΣΗ ΠΑΡΑΓΩΓΗΣ. ΕΝΟΤΗΤΑ 4η ΠΡΟΒΛΕΨΗ ΖΗΤΗΣΗΣ

ΔΙΟΙΚΗΣΗ ΠΑΡΑΓΩΓΗΣ. ΕΝΟΤΗΤΑ 4η ΠΡΟΒΛΕΨΗ ΖΗΤΗΣΗΣ ΤΕΙ ΚΡΗΤΗΣ ΣΧΟΛΗ ΔΙΟΙΚΗΣΗΣ ΚΑΙ ΟΙΚΟΝΟΜΙΑΣ ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ ΔΙΟΙΚΗΣΗ ΠΑΡΑΓΩΓΗΣ ΕΝΟΤΗΤΑ 4η ΠΡΟΒΛΕΨΗ ΖΗΤΗΣΗΣ ΓΙΑΝΝΗΣ ΦΑΝΟΥΡΓΙΑΚΗΣ ΕΠΙΣΤΗΜΟΝΙΚΟΣ ΣΥΝΕΡΓΑΤΗΣ ΤΕΙ ΚΡΗΤΗΣ ΔΟΜΗ ΠΑΡΟΥΣΙΑΣΗΣ 1. Εισαγωγή

Διαβάστε περισσότερα

Σ Τ Α Τ Ι Σ Τ Ι Κ Η 2. 1. Β Α Σ Ι Κ Ε Σ Ε Ν Ν Ο Ι Ε Σ.

Σ Τ Α Τ Ι Σ Τ Ι Κ Η 2. 1. Β Α Σ Ι Κ Ε Σ Ε Ν Ν Ο Ι Ε Σ. Σ Τ Α Τ Ι Σ Τ Ι Κ Η Στατιστική έρευνα : Πρόκειται για ένα σύνολο αρχών και μεθοδολογιών με αντικείμενο : 1) το σχεδιασμό της διαδικασίας συλλογής δεδομένων. Κλάδος της στατιστικής που ασχολείται : Σχεδιασμός

Διαβάστε περισσότερα

Στατιστική Ι (ΨΥΧ-122) Διάλεξη 1 Εισαγωγή

Στατιστική Ι (ΨΥΧ-122) Διάλεξη 1 Εισαγωγή (ΨΥΧ-122) Λεωνίδας Α. Ζαμπετάκης Β.Sc., M.Env.Eng., M.Ind.Eng., D.Eng. Εmail: statisticsuoc@gmail.com Διαλέξεις αναρτημένες στο: ftp://ftp.soc.uoc.gr/psycho/zampetakis/ Διάλεξη 1 Εισαγωγή ΠΑΝΕΠΙΣΤΗΜΙΟ

Διαβάστε περισσότερα

Δυαδικό Σύστημα Αρίθμησης

Δυαδικό Σύστημα Αρίθμησης Δυαδικό Σύστημα Αρίθμησης Το δυαδικό σύστημα αρίθμησης χρησιμοποιεί δύο ψηφία. Το 0 και το 1. Τα ψηφία ενός αριθμού στο δυαδικό σύστημα αρίθμησης αντιστοιχίζονται σε δυνάμεις του 2. Μονάδες, δυάδες, τετράδες,

Διαβάστε περισσότερα

ΘΕΩΡΙΑ ΟΙΚΟΝΟΜΕΤΡΙΑΣ ΣΥΝΟΠΤΙΚΕΣ ΣΗΜΕΙΩΣΕΙΣ

ΘΕΩΡΙΑ ΟΙΚΟΝΟΜΕΤΡΙΑΣ ΣΥΝΟΠΤΙΚΕΣ ΣΗΜΕΙΩΣΕΙΣ ΘΕΩΡΙΑ ΟΙΚΟΝΟΜΕΤΡΙΑΣ ΣΥΝΟΠΤΙΚΕΣ ΣΗΜΕΙΩΣΕΙΣ ΑΠΛΟ ΓΡΑΜΜΙΚΟ ΥΠΟΔΕΙΓΜΑ Συντελεστής συσχέτισης (εκτιμητής Person: r, Y ( ( Y Y xy ( ( Y Y x y, όπου r, Y (ισχυρή θετική γραμμική συσχέτιση όταν, ισχυρή αρνητική

Διαβάστε περισσότερα

f f x f x = x x x f x f x0 x

f f x f x = x x x f x f x0 x 1 Παράγωγος 1. για να βρω την παράγωγο της f σε διάστηµα χρησιµοποιώ βασικές παραγώγους και κανόνες παραγωγισης. για να βρω την παράγωγο σε σηµείο αλλαγής τύπου η σε άκρο διαστήµατος δουλεύω µε ορισµό

Διαβάστε περισσότερα

1.1 ΔΕΙΓΜΑΤΙΚΟΙ ΧΩΡΟΙ ΕΝΔΕΧΟΜΕΝΑ

1.1 ΔΕΙΓΜΑΤΙΚΟΙ ΧΩΡΟΙ ΕΝΔΕΧΟΜΕΝΑ ΚΕΦΑΛΑΙΟ : ΠΙΘΑΝΟΤΗΤΕΣ. ΔΕΙΓΜΑΤΙΚΟΙ ΧΩΡΟΙ ΕΝΔΕΧΟΜΕΝΑ Αιτιοκρατικό πείραμα ονομάζουμε κάθε πείραμα για το οποίο, όταν ξέρουμε τις συνθήκες κάτω από τις οποίες πραγματοποιείται, μπορούμε να προβλέψουμε με

Διαβάστε περισσότερα

ΑΣΚΗΣΗ 1 Για τις ερωτήσεις 1-4 θεωρήσατε τον ακόλουθο γράφο. Ποιές από τις παρακάτω προτάσεις αληθεύουν και ποιές όχι;

ΑΣΚΗΣΗ 1 Για τις ερωτήσεις 1-4 θεωρήσατε τον ακόλουθο γράφο. Ποιές από τις παρακάτω προτάσεις αληθεύουν και ποιές όχι; ΘΕΜΑΤΑ ΔΕΝΔΡΩΝ ΓΙΑ ΤΙΣ ΕΞΕΤΑΣΕΙΣ ΠΛΗ0 ΑΣΚΗΣΗ Για τις ερωτήσεις - θεωρήσατε τον ακόλουθο γράφο. Ποιές από τις παρακάτω προτάσεις αληθεύουν και ποιές όχι; Β Ε Α 6 Δ 5 9 8 0 Γ 7 Ζ Η. Σ/Λ Δυο από τα συνδετικά

Διαβάστε περισσότερα

Αλγοριθμικές Τεχνικές. Brute Force. Διαίρει και Βασίλευε. Παράδειγμα MergeSort. Παράδειγμα. Τεχνικές Σχεδιασμού Αλγορίθμων

Αλγοριθμικές Τεχνικές. Brute Force. Διαίρει και Βασίλευε. Παράδειγμα MergeSort. Παράδειγμα. Τεχνικές Σχεδιασμού Αλγορίθμων Τεχνικές Σχεδιασμού Αλγορίθμων Αλγοριθμικές Τεχνικές Παύλος Εφραιμίδης, Λέκτορας http://pericles.ee.duth.gr Ορισμένες γενικές αρχές για τον σχεδιασμό αλγορίθμων είναι: Διαίρει και Βασίλευε (Divide and

Διαβάστε περισσότερα

Σ ΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΚΑΙ ΕΡΜΗΝΕΙΑ ΑΠΟΤΕΛΕΣΜΑΤΩΝ

Σ ΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΚΑΙ ΕΡΜΗΝΕΙΑ ΑΠΟΤΕΛΕΣΜΑΤΩΝ Σ ΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΚΑΙ ΕΡΜΗΝΕΙΑ ΑΠΟΤΕΛΕΣΜΑΤΩΝ ΤΩΝ ΕΞΕΤΑΣΕΩΝ Μ ΑΪΟΥ 2002 2004 Δ ΕΥΤΕΡΟ ΜΕΡΟΣ Π ΕΡΙΛΗΨΗ: Η μελέτη αυτή έχει σκοπό να παρουσιάσει και να ερμηνεύσει τα ευρήματα που προέκυψαν από τη στατιστική

Διαβάστε περισσότερα

Αναδρομή. Τι γνωρίζετε για τη δυνατότητα «κλήσης» αλγορίθμων; Τι νόημα έχει;

Αναδρομή. Τι γνωρίζετε για τη δυνατότητα «κλήσης» αλγορίθμων; Τι νόημα έχει; ΜΑΘΗΜΑ 7 Κλήση αλγορίθμου από αλγόριθμο Αναδρομή Σ χ ο λ ι κ ο Β ι β λ ι ο ΥΠΟΚΕΦΑΛΑΙΟ 2.2.7: ΕΝΤΟΛΕΣ ΚΑΙ ΔΟΜΕΣ ΑΛΓΟΡΙΘΜΟΥ ΠΑΡΑΓΡΑΦΟI 2.2.7.5: Κλήση αλγορίθμου από αλγόριθμο 2.2.7.6: Αναδρομή εισαγωγη

Διαβάστε περισσότερα

Αριθμητικές μέθοδοι σε ταλαντώσεις μηχανολογικών συστημάτων

Αριθμητικές μέθοδοι σε ταλαντώσεις μηχανολογικών συστημάτων ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΤΜΗΜΑ ΜΗΧΑΝΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ Καθηγητής κ. Σ. Νατσιάβας Αριθμητικές μέθοδοι σε ταλαντώσεις μηχανολογικών συστημάτων Στοιχεία Φοιτητή Ονοματεπώνυμο: Νατσάκης Αναστάσιος Αριθμός Ειδικού Μητρώου:

Διαβάστε περισσότερα

Στατιστική είναι το σύνολο των μεθόδων και θεωριών που εφαρμόζονται σε αριθμητικά δεδομένα προκειμένου να ληφθεί κάποια απόφαση σε συνθήκες

Στατιστική είναι το σύνολο των μεθόδων και θεωριών που εφαρμόζονται σε αριθμητικά δεδομένα προκειμένου να ληφθεί κάποια απόφαση σε συνθήκες Ορισμός Στατιστική είναι το σύνολο των μεθόδων και θεωριών που εφαρμόζονται σε αριθμητικά δεδομένα προκειμένου να ληφθεί κάποια απόφαση σε συνθήκες αβεβαιότητας. Βασικές έννοιες Η μελέτη ενός πληθυσμού

Διαβάστε περισσότερα

Εισαγωγή στην επιστήμη των υπολογιστών

Εισαγωγή στην επιστήμη των υπολογιστών Εισαγωγή στην επιστήμη των υπολογιστών Υπολογιστές και Δεδομένα Κεφάλαιο 3ο Αναπαράσταση Αριθμών www.di.uoa.gr/~organosi 1 Δεκαδικό και Δυαδικό Δεκαδικό σύστημα 2 3 Δεκαδικό και Δυαδικό Δυαδικό Σύστημα

Διαβάστε περισσότερα

Τεχνικές Μείωσης Διαστάσεων. Ειδικά θέματα ψηφιακής επεξεργασίας σήματος και εικόνας Σ. Φωτόπουλος- Α. Μακεδόνας

Τεχνικές Μείωσης Διαστάσεων. Ειδικά θέματα ψηφιακής επεξεργασίας σήματος και εικόνας Σ. Φωτόπουλος- Α. Μακεδόνας Τεχνικές Μείωσης Διαστάσεων Ειδικά θέματα ψηφιακής επεξεργασίας σήματος και εικόνας Σ. Φωτόπουλος- Α. Μακεδόνας 1 Εισαγωγή Το μεγαλύτερο μέρος των δεδομένων που καλούμαστε να επεξεργαστούμε είναι πολυδιάστατα.

Διαβάστε περισσότερα

ΣΥΣΧΕΤΙΣΗ και ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ

ΣΥΣΧΕΤΙΣΗ και ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ Αλεξάνδρειο Τεχνολογικό Εκπαιδευτικό Ίδρυμα Θεσσαλονίκης Τμήμα Πληροφορικής Εργαστήριο «Θεωρία Πιθανοτήτων και Στατιστική» ΣΥΣΧΕΤΙΣΗ και ΓΡΑΜΜΙΚΗ ΠΑΛΙΝΔΡΟΜΗΣΗ Περιεχόμενα 1. Συσχέτιση μεταξύ δύο ποσοτικών

Διαβάστε περισσότερα

2.6 ΣΥΝΕΠΕΙΕΣ ΤΟΥ ΘΕΩΡΗΜΑΤΟΣ ΜΕΣΗΣ ΤΙΜΗΣ

2.6 ΣΥΝΕΠΕΙΕΣ ΤΟΥ ΘΕΩΡΗΜΑΤΟΣ ΜΕΣΗΣ ΤΙΜΗΣ 6 ΣΥΝΕΠΕΙΕΣ ΤΟΥ ΘΕΩΡΗΜΑΤΟΣ ΜΕΣΗΣ ΤΙΜΗΣ ΜΕΘΟΔΟΛΟΓΙΑ : ΣΤΑΘΕΡΗ ΣΥΝΑΡΤΗΣΗ Αν θέλουμε να δείξουμε ότι μια συνάρτηση είναι σταθερή σε ένα διάστημα Δ αποδεικνύουμε ότι η είναι συνεχής στο Δ και ότι για κάθε

Διαβάστε περισσότερα

HY213. ΑΡΙΘΜΗΤΙΚΗ ΑΝΑΛΥΣΗ ΕΛΑΧΙΣΤΑ ΤΕΤΡΑΓΩΝΑ AΝΑΛΥΣΗ ΙΔΙΑΖΟΥΣΩΝ ΤΙΜΩΝ

HY213. ΑΡΙΘΜΗΤΙΚΗ ΑΝΑΛΥΣΗ ΕΛΑΧΙΣΤΑ ΤΕΤΡΑΓΩΝΑ AΝΑΛΥΣΗ ΙΔΙΑΖΟΥΣΩΝ ΤΙΜΩΝ HY3. ΑΡΙΘΜΗΤΙΚΗ ΑΝΑΛΥΣΗ ΕΛΑΧΙΣΤΑ ΤΕΤΡΑΓΩΝΑ AΝΑΛΥΣΗ ΙΔΙΑΖΟΥΣΩΝ ΤΙΜΩΝ Π. ΤΣΟΜΠΑΝΟΠΟΥΛΟΥ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΙΑΣ ΤΜΗΜΑ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ & ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ Μέθοδος ελαχίστων τετραγώνων Τα σφάλματα

Διαβάστε περισσότερα

ΑΡΧΗ 2ΗΣ ΣΕΛΙΔΑΣ Γ Α... Β

ΑΡΧΗ 2ΗΣ ΣΕΛΙΔΑΣ Γ Α... Β ΘΕΜΑ Α ΑΡΧΗ 1ΗΣ ΣΕΛΙΔΑΣ ΠΡΟΣΟΜΟΙΩΣΗ ΑΠΟΛΥΤΗΡΙΩΝ ΕΞΕΤΑΣΕΩΝ Γ' ΤΑΞΗΣ ΗΜΕΡΗΣΙΟΥ ΓΕΝΙΚΟΥ ΛΥΚΕΙΟΥ ΔΕΥΤΕΡΑ 11 ΑΠΡΙΛΙΟΥ 2011 ΕΞΕΤΑΖΟΜΕΝΟ ΜΑΘΗΜΑ: ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ ΠΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ ΠΕΡΙΒΑΛΛΟΝ ΤΕΧΝΟΛΟΓΙΚΗΣ

Διαβάστε περισσότερα

Κατασκευή Μαθησιακών Στόχων και Κριτηρίων Επιτυχίας: Αξιολόγηση για Μάθηση στην Πράξη

Κατασκευή Μαθησιακών Στόχων και Κριτηρίων Επιτυχίας: Αξιολόγηση για Μάθηση στην Πράξη Κατασκευή Μαθησιακών Στόχων και Κριτηρίων Επιτυχίας: Αξιολόγηση για Μάθηση στην Πράξη Μαργαρίτα Χριστοφορίδου 25 Απριλίου 2015 ΕΚΠΑΙΔΕΥΤΙΚΗ ΗΜΕΡΙΔΑ «ΑΞΙΟΛΟΓΗΣΗ ΤΟΥ ΜΑΘΗΤΗ- ΣΥΓΧΡΟΝΕΣ ΤΑΣΕΙΣ-ΠΡΑΚΤΙΚΕΣ ΕΦΑΡΜΟΓΕΣ»

Διαβάστε περισσότερα

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ ΣΤΗΝ ΠΛΗΡΟΦΟΡΙΚΗ ΜΑΘΗΜΑΤΙΚΑ Ι (ΘΕ ΠΛΗ ) ΕΡΓΑΣΙΑ 4 η Ημερομηνία Αποστολής στον Φοιτητή: 5 Φεβρουαρίου 008 Ημερομηνία παράδοσης της Εργασίας: 4 Μαρτίου 008

Διαβάστε περισσότερα

ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΣΤΗΝ ΕΝΟΡΓΑΝΗ ΑΝΑΛΥΣΗ

ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΣΤΗΝ ΕΝΟΡΓΑΝΗ ΑΝΑΛΥΣΗ ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ ΣΤΗΝ ΕΝΟΡΓΑΝΗ ΑΝΑΛΥΣΗ Αναλυτική Μέθοδος- Αναλυτικό Πρόβλημα. Ανάλυση, Προσδιορισμός και Μέτρηση. Πρωτόκολλο. Ευαισθησία Μεθόδου. Εκλεκτικότητα. Όριο ανίχνευσης (limit of detection, LOD).

Διαβάστε περισσότερα

Γεώργιος Φίλιππας 23/8/2015

Γεώργιος Φίλιππας 23/8/2015 MACROWEB Προβλήματα Γεώργιος Φίλιππας 23/8/2015 Παραδείγματα Προβλημάτων. Πως ορίζεται η έννοια πρόβλημα; Από ποιους παράγοντες εξαρτάται η κατανόηση ενός προβλήματος; Τι εννοούμε λέγοντας χώρο ενός προβλήματος;

Διαβάστε περισσότερα

ΜΑΘΗΜΑΤΙΚΑ Θετικής & Τεχνολογικής Κατεύθυνσης Β ΜΕΡΟΣ (ΑΝΑΛΥΣΗ) ΚΕΦ 1 ο : Όριο Συνέχεια Συνάρτησης

ΜΑΘΗΜΑΤΙΚΑ Θετικής & Τεχνολογικής Κατεύθυνσης Β ΜΕΡΟΣ (ΑΝΑΛΥΣΗ) ΚΕΦ 1 ο : Όριο Συνέχεια Συνάρτησης ΜΑΘΗΜΑΤΙΚΑ Θετικής & Τεχνολογικής Κατεύθυνσης Β ΜΕΡΟΣ (ΑΝΑΛΥΣΗ) ΚΕΦ ο : Όριο Συνέχεια Συνάρτησης Φυλλάδιο Φυλλάδι555 4 ο ο.α) ΕΝΝΟΙΑ ΣΥΝΑΡΤΗΣΗΣ - ΓΡΑΦΙΚΗ ΠΑΡΑΣΤΑΣΗ.α) ΕΝΝΟΙΑ ΣΥΝΑΡΤΗΣΗΣ - ΓΡΑΦΙΚΗ ΠΑΡΑΣΤΑΣΗ

Διαβάστε περισσότερα

4.3 Δραστηριότητα: Θεώρημα Fermat

4.3 Δραστηριότητα: Θεώρημα Fermat 4.3 Δραστηριότητα: Θεώρημα Fermat Θέμα της δραστηριότητας Η δραστηριότητα αυτή εισάγει το Θεώρημα Fermat και στη συνέχεια την απόδειξή του. Ακολούθως εξετάζεται η χρήση του στον εντοπισμό πιθανών τοπικών

Διαβάστε περισσότερα