Πρόβλεψη αποτελεσμάτων ποδοσφαιρικών αγώνων βάσει του ιστορικού των αναμετρήσεων



Σχετικά έγγραφα
Το χειρόγραφο του Νοστράδαμου ΑΓΓΛΙΑ ΠΡΕΜΙΕΡ ΛΙΓΚ 2015/2016 ΑΝΑΛΥΣΗ ΤΟΥ ΑΓΩΝΑ VS. 14/02/2016

Το χειρόγραφο του Νοστράδαμου ΕΛΛΑΔΑ ΣΟΥΠΕΡ ΛΙΓΚ 2015/2016 ΑΝΑΛΥΣΗ ΤΟΥ ΑΓΩΝΑ VS. ΠΑΟΚ ΗΡΑΚΛΗΣ /02/2016

Το χειρόγραφο του Νοστράδαμου ΙΤΑΛΙΑ ΣΕΡΙΕ Α 2015/2016 ΑΝΑΛΥΣΗ ΤΟΥ ΑΓΩΝΑ VS. 13/02/2016

Τα φαβορί ορίζουν το παιχνίδι στα προγνωστικά στοιχήματος

Προτάσεις στοιχήματος βάση στατιστικών

Λίγες επιλογές την Δευτέρα

Δύο αναμετρήσεις στην Primera Division την Παρασκευή

Παιχνίδια στην μέση της βαθμολογίας στην Super League

Προβλέψεις στο πάμε στοίχημα Παρασκευής

Φαβορί και κίνητρο στα σημερινα προγνωστικα

Με τις έδρες και τα γκολ στα προγνωστικα

Παιχνίδι με τα γκολ για άλλη μία Παρασκευή

Ημέρα φαβορί στην Serie A

Σε αγωνιστική άνοδο Πανιώνιος και Λαμία

Κάνουμε παιχνίδι με Ρόμα και Μονακό

Με δύο αναμετρήσεις ξεκινά η αγωνιστική στην Λα Λιγκα

Φαβορί μακριά από την έδρα του με αρκετή τύχη

Φαβορί με αξία στις προβλέψεις στοίχημα

Παιχνίδια με μικρή βαθμολογική σημασία

Τέλος πρώτου γύρου στην Γαλλία

Όλα τα βλέμματα των φιλάθλων στο Μάντσεστερ

Αφού έχετε μπει στη σελίδα pamestoixima.gr, πατάτε πάνω αριστερά, την επιλογή

Να φύγει με διπλό από την Λαμία

Η φόρμα δίνει σημεία στην Σέριε Α

Προγνωστικά: Για την πρόκριση η ΑΕΚ στην Βιέννη

Εμβόλιμες αγωνιστικές σε Αγγλία και Γαλλία

Γρηγόρης Θ. Παπανίκος Αντιπρόεδρος του ΠΣΑΟΣ & Επίτιμος Καθηγητής Οικονομικών Επιστημών Πανεπιστήμιο Στέρλιγκ (University of Stirling), Η.Β.

Μεγάλα παιχνίδια σε Ιταλία και Μπουντεσλίγκα

Με Νάπολι μέχρι το ντέρμπι στην Κωνταντινούπολη

Περιορισμένες επιλογές την Δευτέρα

Επανέναρξη με γκολ και ταμεία

Προβλεψεις στοιχηματος: Μάχη τετράδας το Άρσεναλ Λίβερπουλ

Ντέρμπι δικεφάλων με έντονο βαθμολογικό ενδιαφέρον

Μεγάλα ματς σε Παρίσι και Λονδίνο

Στοίχημα με Serie A και La Liga

Non Stop Bet προγνωστικα στην Πρέμιερ Λιγκ

Ασκήσεις μελέτης της 6 ης διάλεξης

Προγνωστικα από όλη την Ευρώπη

Από εκεί που μείναμε στα προγνωστικά

Πάμε στοίχημα με Τσέλσι και γκολ στην Μπουντεσλίγκα

Για να μείνει στην κορυφή η ΑΕΚ

Η ανάγκη βαθμών καθορίζουν τα αποτελέσματα στο παμε στοιχημα

Σε Κρήτη και Ξάνθη ολοκληρώνεται η εμβόλιμη η Super League

Κλείνουν οι αγωνιστικές την Δευτέρα

Δυνατές μάχες στον 2ο όμιλο για τη πρόκριση

Κλείνουν οι αγωνιστικές με σημεία την Πέμπτη στα προγνωστικα

Μικρό αγωνιστικό πρόγραμμα με προοπτικές

Μεγάλα παιχνίδια παντού στην Ευρώπη

Επιτέλους ποδόσφαιρο πρωταθλημάτων

Πάλι με τα μεγάλα πρωταθλήματα

Χωρίς τους μεγάλους το Σάββατο στην Super League

Με γκολ ανοίγει το γεμάτο τριήμερο

Προγνωστικά στοιχήματος Serie A στην εμβόλιμη αγωνιστική

Προγνωστικά στοιχήματος Γερμανίας και Ιταλίας

Εκτιμησεις ποδοσφαιρου από Αγγλία και Γαλλία

Με ενδιαφέρον το πρόγραμμα της Δευτέρας

Εγχειρίδιο αγορών Πάμε Στοίχημα

Με εθνικές και Σεγούντα Ντιβιζιόν την Παρασκευή

Προτάσεις στοιχήματος Κυριακής 11/12/2016

Boxing Day με Premier League στο πάμε στοίχημα

Τελειώνουν οι εμβόλιμες αγωνιστικές στο παμε στοιχημα

Μονομαχίες παντού για την Ευρώπη

Τον πρώτο λόγο τα φαβορί της Δευτέρας

Προγνωστικά στο πάμε στοίχημα

ΕΛΛΗΝΙΚΗ ΦΙΛΑΘΛΟΣ ΟΜΟΣΠΟΝΔΙΑ (ΕΦΟΑ) ΔΙΑΣΥΛΛΟΓΙΚΟ ΠΡΩΤΑΘΛΗΜΑ Α και Β ΕΘΝΙΚΗΣ ΑΝΔΡΩΝ ΓΥΝΑΙΚΩΝ 2017

Τελευταίο βήμα πριν τον τελικό

Ματς για όλα τα γούστα στην Σούπερ Λιγκ

Προτελευταία αγωνιστική στην Serie A

Μάχες παντού για μία θέση στο Μουντιάλ

Φινάλε για το 2018 με Πρέμιερ, Καμπιονάτο και Σκωτία

Προβλέψεις στο στοίχημα την Παρασκευή

Φόρμα και γκολ στο δρόμο για το ταμείο

Τσάμπιονς Λιγκ Βασιλεία Μάντσεστερ Σίτι και Γιουβέντους Τότεναμ

Τα φαβορί καθορίζουν το παιχνίδι μας στο Τσάμπιονς Λιγκ

Ένα παιχνίδι του Stefan Feld ΣΧΕΤΙΚΑ ΜΕ ΤΟ ΠΑΙΧΝΙΔΙ ΠΕΡΙΕΧΟΜΕΝΑ

Νάπολι Άρσεναλ για μία θέση στα ημιτελικά

Κερδίζει και περιμένει το ΟΑΚΑ ο Ολυμπιακός

Τα φαβορί κρίνουν τις προβλέψεις στοιχήματος

Σημεία και γκολ στο στοίχημα την Δευτέρα

Απαιτείται σοβαρότητα από τον Ολυμπιακό

Προγνωστικά πρωταθλημάτων και κυπέλλου Αγγλίας

Ευκαιρία να ανέβει πάλι στην κορυφή ο ΠΑΟΚ

Αρχή με δυνατά ματς την Παρασκευή

Ανοικτά μέτωπα στην τελευταία αγωνιστική

Τον πρώτο λόγο η Αγγλία με την Σουηδία

Με τρία ματς ξεκινά η αγωνιστική στην Super League

Κλειδώνουν θέσεις στην βαθμολογία

«Ζέσταμα» με τα πρωταθλήματα της Παρασκευής

Μάχες σε όλα τα ανοικτά μέτωπα στα πρωταθλήματα

ΕΙΣΑΓΩΓΗ. Η Ο.Π.Α.Π. Α.Ε. εισήγαγε στην Ελλάδα τα παιχνίδια στοιχημάτων προκαθορισμένης απόδοσης το έτος 2000, με μεγάλη επιτυχία.

ΜΑΘΗΜΑ / ΤΑΞΗ : ΔΟΜΗΜΕΝΟΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ / ΕΠΑΛ ΣΕΙΡΑ: ΗΜΕΡΟΜΗΝΙΑ: 02/11/2014 ΕΠΙΜΕΛΕΙΑ ΔΙΑΓΩΝΙΣΜΑΤΟΣ: Ι. ΜΙΧΑΛΕΑΚΟΣ Α. ΙΛΕΡΗ

Περιορισμένης ποιότητας το σημερινή κουπόνι στοιχήματος

Επανέναρξη με γκολ στο στοίχημα

Προβλέψεις στοιχήματος με τους φιλοξενούμενους

Κίνητρο, φόρμα και γκολ οδηγός μας για το στοιχημα

Προγνωστικα στοιχημα με φτωχό πρόγραμμα

Από τις τελευταίες ευκαιρίες για τον Απόλλων Σμύρνης

Για την υπέρβαση στο Μιλάνο η ΑΕΚ με Μίλαν

Νέα δεδομένα στα Πλεϊ Οφ της Super League

Παρασκευή χωρίς μεγάλο ματς και ξεκάθαρα φαβορί

Transcript:

Πολυτεχνείο Κρήτης Αυτόνομοι Πράκτορες 2012-2013 Πρόβλεψη αποτελεσμάτων ποδοσφαιρικών αγώνων βάσει του ιστορικού των αναμετρήσεων Δουγιάκης Λάζαρος 13

Πρόβλεψη αποτελεσμάτων ποδοσφαιρικών αγώνων βάσει του ιστορικού των αναμετρήσεων Σκοπός της εργασίας είναι η πρόβλεψη των αποτελεσμάτων ποδοσφαιρικών αγώνων βάσει του ιστορικού των αναμετρήσεων μεταξύ τους. Σαν αποτέλεσμα η εργασία θα πρέπει να μας δίνει μια πιθανότητα για τα τρία πιθανά αποτελέσματα : P(H) πιθανότητα εντός έδρας νίκης P(D) πιθανότητα ισοπαλίας P(A) πιθανότητα εκτός έδρας νίκης P(U) πιθανότητα under P(O) πιθανότητα over Η ανάγκη να συνδέσουμε την εκτίμηση του τελικού αποτελέσματος με βάση τις εξαρτήσεις μεταξύ του ιστορικού των αποτελεσμάτων των ομάδων και της τωρινής κατάστασης των ομάδων μας οδήγησε στη χρήση Bayesian Networks. Ένα Bayesian network αναπαριστά σε μορφή πιθανοτηκού γράφου τις υπό συνθήκης εξαρτήσεις μεταξύ των μεταβλητών. Στο παράδειγμα μας για παράδειγμα η τελική πρόβλεψη θα δίνετε με βάση τη συνθήκη (. Δηλαδή η εκτίμηση για το τελικό αποτέλεσμα γίνεται δεδομένου των δυο ομάδων που αναμετρώνται,έχοντας λάβει υπόψη και την προϊστορία των αναμετρήσεων μεταξύ τους. Παρακάτω παρατίθενται με τη σειρά, αναλυτικά, όλα τα στάδια για την ολοκλήρωση της εργασίας. Τα στάδια αυτά είναι Περιεχόμενα Δεδομένα... 2 Το μοντέλο - Πρώτη σκέψη (όχι αποδοτική)... 3 Το μοντέλο... 3 Αναλυτικά... 4 Τα πλεονεκτήματα αυτής της μεθόδου :... 5 Εκτίμηση δυναμικότητας... 5 Επόμενη αναμέτρηση... 7 Το δίκτυο... 8 Αποτελέσματα... 11 Συμπεράσματα... 13 Βελτιώσεις... 14 GUI... 15

Δεδομένα Αρχικά θα πρέπει να βρεθούν τα datasets από οποία θα μπορούν να εξαχθούν όλα τα απαραίτητα στοιχεία που θα χρειαστούν για την ολοκλήρωση της εργασίας. Τα δεδομένα αυτά υπάρχουν στη σελίδα http://www.football-data.co.uk/data.php. Υπάρχουν συγκεντρωμένα αναλυτικά όλα τα δεδομένα για τα σημαντικότερα ποδοσφαιρικά πρωταθλήματα της Ευρώπης. Περιέχονται, για κάθε ένα από τα πρωταθλήματα, ιστορικά των τελευταίων 19 season, συγκεκριμένα από 1993-1994 έως και σήμερα. Για την εργασία χρησιμοποιήθηκαν τα δεδομένα για τα πρωταθλήματα της Αγγλίας, της Ισπανίας, Ιταλίας και της Γαλλίας. Στην εικόνα φαίνεται η μορφή του excel που περιέχει τα δεδομένα ένα μικρό μέρος των δεδομένων της season 2011-2012 για το αγγλικό πρωτάθλημα. Από εδώ μπορεί σχετικά εύκολα να γίνει επεξεργασία του αρχείου και να πάρουμε τα στοιχεία που χρειάζονται. Για παράδειγμα συνολικές νίκες-ισοπαλίες-ήττες κάθε ομάδας εντός και εκτός έδρας, αριθμός τερμάτων, συνολική συγκομιδή σε πόντους (εντός και εκτός έδρας) κ.ο.κ Ένα παράδειγμα του dataset για μια season στο Αγγλικό Πρωτάθλημα

Το μοντέλο - Πρώτη σκέψη (όχι αποδοτική) Αρχικά το σκεπτικό της εργασίας ήταν να κάνουμε μία εκτίμηση αποτελέσματος βάσει της προϊστορίας των δυο ομάδων στις μεταξύ τους αναμετρήσεις. Για παράδειγμα μια εκτίμηση του αποτελέσματος του αγώνα Manchester United vs Liverpool δεδομένης της προϊστορίας των αναμετρήσεων τους. Αυτή η αρχική ιδέα όπως φάνηκε έχει προβλήματα. Για τη συγκεκριμένη αναμέτρηση μπορεί να είναι εύκολα να εξαχθούν αρκετά στοιχεία ώστε να έχουμε μια καλή εκτίμηση αλλά δε συμβαίνει το ίδιο για όλες τις αναμετρήσεις. Για παράδειγμα έστω ότι θα πρέπει να εκτιμηθεί το αποτέλεσμα του αποτέλεσμα του αγώνα Norwich vs Stoke. Αυτές οι δύο ομάδες δεν ήταν όλες τις χρονιές στη πρώτη κατηγορία, και ακόμα χειρότερα μπορεί όταν βρισκόταν στη πρώτη κατηγορία η μία να μη βρισκόταν η άλλη. Έτσι μπορεί για παράδειγμα η προϊστορία μεταξύ τους να είναι μία ή δύο season. Με τόσο λίγα δεδομένα παίρνουμε αποτελέσματα της μορφής : 100% νίκη της εντός έδρας ομάδας 0% ισοπαλία 0% νίκη της εκτός έδρας ομάδας Όπως φαίνεται δε μπορεί να γίνει σε καμία περίπτωση σωστή εκτίμηση του αποτελέσματος σε τέτοιες περιπτώσεις. Ακόμα χειρότερα μπορεί να υπάρχει ομάδα η οποία είναι νεοφώτιστη στη πρώτη κατηγορία (πχ η ομάδα του πλατανιά τη season 2012-2013). Σε αυτή τη περίπτωση δεν έχουμε καμία προϊστορία των αγώνων! Τα παραπάνω σημαντικά προβλήματα μας έκαναν να απορρίψουμε αυτή την αρχική ιδέα και να καταλήξουμε σε μια πιο αποδοτική και ευέλικτη «στρατηγική» η οποία εξηγείται αναλυτικά παρακάτω. Το μοντέλο Όπως αναφέρθηκε και πριν ένα πολύ σημαντικό πρόβλημα ήταν να βρούμε ένα τρόπο ώστε να γίνεται να εκτίμηση με βάση το ιστορικό χωρίς να υπάρχουν τα παραπάνω προβλήματα. Η ιδέα (τελική) είναι γίνει η εκτίμηση βάσει της δυναμικότητας κάθε ομάδας και όχι βάσει του ονόματος.

Αναλυτικά Έστω ότι θέλουμε να κάνουμε την παραπάνω εκτίμηση του αγώνα Manchester United vs Liverpool. Σε αυτή τη μέθοδο δε κοιτάμε τη προϊστορία των αναμετρήσεων μεταξύ των δύο ομάδων σαν ονόματα (Manchester United, Liverpool) αλλά την προϊστορία μεταξύ ομάδων με την ίδια δυναμικότητα. Συγκεκριμένα έστω ότι η Manchester United βρίσκετε στην πρώτη θέση της βαθμολογίας έχοντας δυναμικότητα 1, και αντίστοιχα η Liverpool βρίσκετε στη 5 θέση της βαθμολογίας έχοντας δυναμικότητα 4. Η εκτίμηση για τον αγώνα βάσει της προϊστορίας που είχαν στις αναμετρήσεις τους οι αγώνα 1 vs 4 αντί για Manchester United vs Liverpool. Παρακάτω φαίνεται αριστερά η τελική βαθμολογία του αγγλικού πρωταθλήματος τη season 2011-2012 και δεξιά η τελική βαθμολογία της ίδιας χρονιάς που περιέχει ακόμα δίπλα από τη βαθμολογία και τη δυναμικότητα των ομάδων. Δηλαδή σαν συνέχεια του παραδείγματος σε αυτή τη χρονιά η Manchester United έχει δυναμική ίση με 1 και αντίστοιχα η Liverpool ίση με 2.

Για να εξαχθούν τώρα τα ποσοστά των αναμετρήσεων για κάθε χρονιά (από τις 19 που υπάρχουν για κάθε πρωτάθλημα) υπολογίζεται αντίστοιχα η δυναμικότητα κάθε ομάδας και έπειτα από εξάγονται το ποσοστό των αποτελεσμάτων (νίκη ισοπαλία - ήττα) για κάθε αγώνα μεταξύ μιας ομάδας με δυναμικότητα x εναντίων μιας ομάδας με δυναμικότητα y. Τα πλεονεκτήματα αυτής της μεθόδου : Μπορούμε να κάνουμε εκτίμηση για το αποτέλεσμα ενός αγώνα μιας ομάδας που έχουμε πολύ λίγα ή καθόλου ιστορικά δεδομένα χρησιμοποιώντας τα αποτελέσματα των ομάδων με ίδια δυναμικότητα. Παράδειγμα έστω ότι για τη Norwich δεν υπάρχουν πολλά ιστορικά δεδομένα, με αυτή τη μέθοδο δε μας ενδιαφέρει η προϊστορία των αναμετρήσεων της Norwich αλλά η προϊστορία των αναμετρήσεων των ομάδων με δυναμικότητα 8 (όπως δείχνει ο πάνω πίνακας). Το σύστημα μπορεί εύκολα να υπολογίσει τα αποτελέσματα των αναμετρήσεων αγώνων διαφορετικού πρωταθλήματος. Αφού δε κοιτάμε τα ονόματα των ομάδων μπορεί εύκολα να γίνει για παράδειγμα εκτίμηση των αποτελεσμάτων πχ του ελληνικού πρωταθλήματος ΧΩΡΙΣ να απαιτείται ιστορικό του ελληνικού πρωταθλήματος. Εκτίμηση δυναμικότητας Πολύ σημαντικό σε αυτή τη μέθοδο όπως είναι λογικό είναι να βρεθεί ένας τρόπος που να υπολογίζει δίκαια τις δυναμικότητες των ομάδων. Ένας απλός και δίκαιος τρόπος που χρησιμοποιείται σε αυτή τη εργασία είναι ο εξής : Για κάθε season κρατάμε τη τελική βαθμολογία Επιλέγουμε σαν max τιμή τη βαθμολογία της πρώτης ομάδας και σαν min τη τελική βαθμολογία της τελευταίας Διαιρούμε το σε x ίσα διαστήματα (για το παραπάνω πίνακα σε (89-25)/x διαστήματα) Ανάλογα με το διάστημα στο οποίο βρίσκεται κάθε ομάδα βάσει της τελικής της βαθμολογίας παίρνει μια τιμή δυναμικότητας (για x πειραματικά φάνηκε ότι καλύτερα αποτελέσματα παίρνουμε για τιμές 13-16 (εξαρτάται και από το πρωτάθλημα))

Τέλος αφού για κάθε season για όλα τα πρωταθλήματα του dataset έχει υπολογιστή η δυναμικότητα κάθε ομάδας,έπειτα υπολογίζετε το ποσοστό νικών/ισοπαλιών/ηττών που έχει μια ομάδα με δυναμικότητα X όταν παίζει εναντίων μιας ομάδας με δυναμικότητα Y. Για να γίνει αυτό από τα δεδομένα αθροίζονται όλα τα αποτελέσματα που έχουν οι ομάδες ανάλογα με τη δυναμικότητα τους και έπειτα διαιρούνται προς τον συνολικό αριθμό τον μεταξύ τους αγώνων. Δηλαδή ( ( ( Έτσι καταλήγουμε στη τελική πρόβλεψη για κάθε αγώνα που είναι όπως αναφέρθηκε και στην αρχή Όπου ( result παίρνει τις τιμές Home win / draw / Away win A είναι η δυναμικότητα της εντός έδρας ομάδας Και Β η δυναμικότητα της εκτός έδρας ομάδας Και για τα under/over αντίστοιχα θα είναι : ( ( Έτσι καταλήγουμε στη πρόβλεψη για Under/Over που είναι Όπου ( result παίρνει τις τιμές U ή O A είναι η δυναμικότητα της εντός έδρας ομάδας Και Β η δυναμικότητα της εκτός έδρας ομάδας

Επόμενη αναμέτρηση Αφού έχουν υπολογιστεί όλες οι πιθανότητες για ένα αγώνα μεταξύ μιας ομάδας δυναμικότητας X εναντίων μιας ομάδας με δυναμικότητα Y, πρέπει να γίνει η πρόβλεψη για ένα νέο αγώνα μεταξύ δυο ομάδων. Οι επόμενες αναμετρήσεις κατεβαίνουν αυτόματα κάθε φορά που εκτελείται το πρόγραμμα από τη σελίδα http://www.football-data.co.uk/fixtures.csv, και έχουν την εξής μορφή : Η πρώτη στήλη δείχνει το πρωτάθλημα (π.χ. F1 πρώτη κατηγορία Γαλλίας, G1 πρώτη κατηγορία Ελλάδας κτλ), η δεύτερη την ημερομηνία διεξαγωγής της αναμέτρησης και οι επόμενες 2 τις ομάδες που αναμετρώνται.

Το δίκτυο Τα αναλυτικά βήματα για την πρόβλεψη του τελικού αποτελέσματος ενός αγώνα αναπαριστώνται στο παρακάτω δίκτυο. Όπως φαίνεται για να την εκτίμηση του αποτελέσματος μιας αναμέτρησης (όπως παίρνεται από το προηγούμενο βήμα) πρέπει να βρούμε τη δυναμικότητα των δύο ομάδων. Η δυναμικότητα δίνεται συναρτήσει 2 παραγόντων, όπως φαίνεται και στο σχήμα. Βάσει της δυναμικότητας της την προηγούμενη season και βάσει της μέχρι στιγμή δυναμικότητας της την τρέχουσα season (αναλόγως της βαθμολογίας). Η γνώση της προηγούμενης season είναι απαραίτητα για την αρχή κυρίως του πρωταθλήματος. Αυτό συμβαίνει επειδή στην αρχή της κάθε season χωρίς να έχουν παιχτεί πολλά παιχνίδια δε μπορεί να γίνει εκτίμηση της δυναμικότητας των ομάδων, ώστε να γίνει εκτίμηση του αποτελέσματος.

Η παρακάτω εκθετική κατανομή μας δείχνει σε τι ποσοστό λαμβάνεται υπόψη η κατάσταση των ομάδων τη προηγούμενη season σε σχέση με τη νέα. Όπως φαίνεται στην αρχή της season χωρίς κανένα παιχνίδι για να υπολογιστεί η δυναμικότητα των ομάδων λαμβάνεται εξολοκλήρου πληροφορία μόνο από τη περσινή season, δηλαδή για τη πρώτη αγωνιστική υποθέτουμε ότι οι ομάδες έχουν την ίδια δυναμικότητα με πέρσι (οι ομάδες που έχουν προβιβαστεί έχουν δυναμικότητα ίση με αυτή των ομάδων που ήταν στο τέλος της βαθμολογίας τη περσινή season ). Όσο προχωρούν οι αγωνιστικές λαμβάνεται όλο και λιγότερο υπόψη η περσινή χρονιά και η εκτίμηση γίνετε με βάσει τη φόρμα των ομάδων τη φετινή χρονιά. (Ο λόγος που γίνεται αυτό το βήμα είναι γιατί με το συγκεκριμένο dataset δε μπορούμε να κάνουμε διαφορετικά εκτίμηση για τη δυναμικότητα των ομάδων. Αν για παράδειγμα είχαμε πληροφορία όπως οι μεταγραφές που έγιναν τη περίοδο του καλοκαιρού θα μπορούσαμε να γνωρίζουμε καλυτέρα αν μια ομάδα έχει χάσει η κερδίσει σε δυναμικότητα.)

Αφού έχει γίνει η εκτίμηση της δυναμικότητας των ομάδων έπειτα γίνεται η τελική πρόβλεψη βάσει των τύπων (όπως αναφέρθηκε στην εισαγωγή) ( για τη πρόβλεψη του τελικού αποτελέσματος, και ( για τα under/over. Το τελικό αποτέλεσμα έχει την μορφή (για μια αγωνιστική του αγγλικού πρωταθλήματος) Και αντίστοιχα για under/over

Αποτελέσματα Για να δούμε το τελικού συνολικό επιτυχίας των προβλέψεων του μοντέλου τεστάρουμε το μοντέλο για προηγούμενες χρονιές. Όπως έχει αναφερθεί παραπάνω το dataset περιέχει ιστορικά δεδομένα των πρωταθλημάτων της Αγγλίας της Ισπανίας, της Ιταλίας και της Γαλλίας. Μερικά αποτελέσματα χρησιμοποιώντας τα συνολικά ιστορικά δεδομένα όλων αυτών των πρωταθλημάτων φαίνεται παρακάτω. English Premier League results Year 2011-2012 απόδοση = 49.21% Year 2010-2011 -- απόδοση = 50.10% Spanish Primera Division results Year 2011-2012 -- απόδοση = 52.63% Year 2010-2011 -- απόδοση = 59.21% Italian Serie A results Year 2011-2012 απόδοση = 48.68% Year 2010-2011 -- απόδοση = 49.21% Επίσης τα αποτελέσματα με χρήση του ιστορικού για κάθε πρωτάθλημα ξεχωριστά φαίνονται παρακάτω. (παράδειγμα για το αγγλικό πρωτάθλημα κάνουμε χρήση μόνο του ιστορικού του αγγλικού πρωταθλήματος και όχι του συνολικού ιστορικού και των άλλων πρωταθλημάτων) English Premier League results Year 2011-2012 απόδοση = 50.52% Year 2010-2011 -- απόδοση = 48.68% Spanish Primera Division results Year 2011-2012 -- απόδοση = 59.21% Year 2010-2011 -- απόδοση = 60.00% Italian Serie A results Year 2011-2012 απόδοση = 47.10% Year 2010-2011 -- απόδοση = 49.47%

Επίσης όπως αναφέρθηκε και στα προηγούμενα βήματα ένα πολύ μεγάλο πλεονέκτημα αυτού του μοντέλου είναι μπορεί να γίνει πρόβλεψη και για πρωταθλήματα για τα οποία ΔΕΝ έχουμε το ιστορικό τους. Μερικά αποτελέσματα για αυτά τα πρωταθλήματα φαίνονται παρακάτω. Greek Super League results Year 2010-2011 -- απόδοση = 45.83% Year 2009-2010 -- απόδοση = 50.41% Portugal Primeira Liga results Year 2010-2011 -- απόδοση = 52.83% Year 2009-2010 -- απόδοση = 52.50% Τέλος υπάρχει και πρόβλεψη για τα under και τα over σε κάθε αγώνα Αποτελέσματα για τα πρωταθλήματα εντός dataset φαίνονται παρακάτω. English Premier League results Year 2011-2012 -- απόδοση under/over= 50.26% Year 2010-2011 -- απόδοση under/over= 48.42% Spanish Primera Division results Year 2011-2012 -- απόδοση under/over= 55.26% Year 2010-2011 -- απόδοση under/over= 51.31% Italian Serie A results Year 2011-2012 -- απόδοση under/over= 53.42% Year 2010-2011 -- απόδοση under/over= 54.21%

Επίσης τα αποτελέσματα για under over με χρήση του ιστορικού για κάθε πρωτάθλημα ξεχωριστά φαίνονται παρακάτω. English Premier League results Year 2011-2012 απόδοση = 43.15% Year 2010-2011 -- απόδοση = 48.42% Spanish Primera Division results Year 2011-2012 -- απόδοση = 46.84% Year 2010-2011 -- απόδοση = 41.57% Italian Serie A results Year 2011-2012 απόδοση = 54.21% Year 2010-2011 -- απόδοση = 55.78% Αντίστοιχα τα αποτελέσματα για πρωταθλήματα που δεν υπάρχει το ιστορικό τους στο dataset φαίνονται παρακάτω. Greek Super League results Year 2010-2011 -- απόδοση under/over= 59.58% Year 2009-2010 -- efficiency under/over= 50.83% Portugal Primeira Liga results Year 2010-2011 -- απόδοση under/over= 56.25% Year 2009-2010 -- απόδοση under/over= 53.75% Συμπεράσματα Αν και τα αποτελέσματα για τη πρόβλεψη του τελικού αποτελέσματος των αγώνων φαίνεται σχετικά μικρό (κατά μέσο όρο 50%-55%) αρκεί να αναλογιστούμε δυσκολία της πρόβλεψης. Γενικά το ποδόσφαιρο είναι ένα παιχνίδι που παίζουν ρόλο για την τελική έκβαση ενός αποτελέσματος πάρα πολύ παράγοντες, τόσο πριν την έναρξη της αναμέτρησης (κούραση, απουσίες κτλ) όσο και κατά τη διάρκεια (κάρτες, διαιτητικές αποφάσεις κτλ).

Στην παρούσα εργασία έγινα μια προσπάθεια προβλέψεις του τελικού αποτελέσματος ΜΟΝΟ βάσει του ιστορικού και καταφέραμε αποτελέσματα από 50% μέχρι και 60%.Αν αναλογιστεί κανείς όλα τα παραπάνω τα αποτελέσματα αυτά μπορούν να θεωρηθούν αρκετά ικανοποιητικά. Τέλος πολύ σημαντικό είναι ότι αυτή η απόδοση μπορεί να επιτευχθεί και σε πρωταθλήματα για τα οποία δεν έχουμε καθόλου ιστορικό!!! Αντίθετα για τα αποτελέσματα για το under over τα αποτελέσματα είναι μάλλον απογοητευτικά. Βλέπουμε ότι κυμαίνεται κοντά στο 50% τη στιγμή που η επιλογή στη τύχη θα μας έδινε 50% ποσοστό επιτυχίας. Αν αναλογιστούμε πόσοι παράγοντες επηρεάζουν των αριθμό των τερμάτων που μπορεί να σημειωθούν τα αποτέλεσμα αυτό είναι μάλλον αναμενόμενο. Σαν γενικό συμπέρασμα, τέλος,της εργασίας παρατηρούμε ότι το ιστορικό των αναμετρήσεων μας δίνει από μόνο του μια σημαντική πληροφορία για την έκβαση του αγώνα. Αντίθετα για των αριθμό των goal που θα σημειωθούν βλέπουμε ότι μεγαλύτερο ρόλο παίζουν άλλοι παράγοντες. [References] pi - football : A Bayesian network model for forecasting Association Football match outcomes Βελτιώσεις Όπως αναφέρθηκε και παραπάνω το τελικό αποτέλεσμα ενός αγώνα επηρεάζουν πάρα πολύ παράγοντες εκτός από το ιστορικό. Για να βελτιωθεί ακόμα περισσότερο το αποτέλεσμα θα μπορούσαν να προστεθούν μελλοντικά αρκετοί ακόμα παράγοντες όπως για παράδειγμα : Απουσίες βασικών παικτών για κάθε ομάδα Κούραση των ομάδων (δλδ διάστημα ξεκούρασης από το προηγούμενο παιχνίδι ) Σημαντικότητα αγώνα για τις δύο ομάδες Ψυχολογικοί παράγοντες (φόρμα τελευταίων αγώνων, τραυματισμοί κτλ) Βέβαια για όλα αυτά θα πρέπει να υπάρχει και το αντίστοιχο dataset που να περιέχει όλες αυτές τη πληροφορίες ώστε να γίνει πρόβλεψη

GUI Το γραφικό περιβάλλον του προγράμματος Πάνω φαίνονται οι σημαίες για κάθε χώρα ώστε ο χρήστης να μπορεί να επιλέξει το πρωτάθλημα που θέλει. Αριστερά είναι ο πίνακας με τη μέχρι τώρα βαθμολογία. Οι άλλοι δύο πίνακες περιέχουν τις προβλέψεις για τα τελικά αποτελέσματα και τα Under/over για τις αναμετρήσεις κάθε πρωταθλήματος. Τέλος το κουμπί update κάνει ανανέωση αυτόματα από το web τη τελική βαθμολογία της προηγούμενης χρονιάς των πρωταθλημάτων για να γίνει η εκτίμηση της δυναμικότητας όπως εξηγήσαμε στο δίκτυο που παρουσιάσαμε παραπάνω.