Κεφάλαιο 5. Αλγόριθµοι Αναζήτησης σε Παίγνια ύο Αντιπάλων. Τεχνητή Νοηµοσύνη - Β' Έκδοση



Σχετικά έγγραφα
Τεχνητή Νοημοσύνη (ΥΠ23) 6 ο εξάμηνο Τμήμα Πληροφορικής και Τηλεματικής Χαροκόπειο Πανεπιστήμιο Ουρανία Χατζή

Αλγόριθμοι Αναζήτησης σε Παίγνια Δύο Αντιπάλων

Επίλυση Προβλημάτων 1

Επίλυση προβληµάτων. Περιγραφή προβληµάτων Αλγόριθµοι αναζήτησης Αλγόριθµοι τυφλής αναζήτησης Αλγόριθµοι ευρετικής αναζήτησης

Αλγόριθµοι Ευριστικής Αναζήτησης

ΧΑΡΟΚΟΠΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ & ΤΗΛΕΜΑΤΙΚΗΣ

Τεχνητή Νοημοσύνη. 6η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

Τεχνητή Νοημοσύνη. 3η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

Επίλυση προβληµάτων. Αλγόριθµοι Αναζήτησης

Ασκήσεις μελέτης της 6 ης διάλεξης

ΔΙΑΝΥΣΜΑΤΑ. Ακολουθίες. Στην ενότητα αυτή θα μάθουμε: Να ορίζουμε το διάνυσμα.

Θεωρία Παιγνίων Δρ. Τασσόπουλος Ιωάννης

Ε ανάληψη. Προβλήµατα ικανο οίησης εριορισµών. ορισµός και χαρακτηριστικά Ε ίλυση ροβληµάτων ικανο οίησης εριορισµών

Θεωρία Λήψης Αποφάσεων

Τεχνητή Νοημοσύνη (ΥΠ23) 6 ο εξάμηνο Τμήμα Πληροφορικής και Τηλεματικής Χαροκόπειο Πανεπιστήμιο Ουρανία Χατζή

Κεφ. 9 Ανάλυση αποφάσεων

Αυτόνομοι Πράκτορες. Εργασία εξαμήνου. Μάθηση του παιχνιδιού British square με χρήση Temporal Difference(TD) Κωνσταντάκης Γιώργος

Κεφάλαιο 2. Περιγραφή Προβληµάτων και Αναζήτηση Λύσης. Τεχνητή Νοηµοσύνη - Β' Έκδοση

Περιγραφή Προβλημάτων

ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ

ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΤΕΧΝΗΤΗ ΝΟΗΜΟΣΥΝΗ

Chess Academy Free Lessons Ακαδημία Σκάκι Δωρεάν Μαθήματα. Οι κινήσεις των κομματιών Σκοπός της παρτίδας, το Ματ Πατ Επιμέλεια: Γιάννης Κατσίρης

Πληροφοριακά Συστήματα Διοίκησης (ΜΒΑ) Ενότητα 8: Παίγνια πλήρους και ελλιπούς πληροφόρησης

Τεχνητή Νοημοσύνη. 2η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Βfi 1 2 Αfl 1 1, 2 0, 1 2 2, 1 1, 0

ΘΕΩΡΙΑ ΤΩΝ ΠΑΙΓΝΙΩΝ I.

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΤΕΧΝΗΤΗ ΝΟΗΜΟΣΥΝΗ. Τελικές εξετάσεις Παρασκευή 4 Ιουλίου 2014, 18:00-21:00

ΠΑΙΓΝΙΑ Παιχνίδια Γενική Θεώρηση μεγιστοποιήσει την πιθανότητά

Επίλυση Προβλημάτων 1

Τσάπελη Φανή ΑΜ: Ενισχυτική Μάθηση για το παιχνίδι dots. Τελική Αναφορά

Τεχνητή Νοημοσύνη (ΥΠ23) 6 ο εξάμηνο Τμήμα Πληροφορικής και Τηλεματικής Χαροκόπειο Πανεπιστήμιο Ουρανία Χατζή

Κεφάλαιο 3. Αλγόριθµοι Τυφλής Αναζήτησης. Τεχνητή Νοηµοσύνη - Β' Έκδοση. Ι. Βλαχάβας, Π. Κεφαλάς, Ν. Βασιλειάδης, Φ. Κόκκορας, Η.

Ε ανάληψη. Παιχνίδια παιχνίδια ως αναζήτηση. Βέλτιστες στρατηγικές στρατηγική minimax. Βελτιώσεις κλάδεµα α-β

Τεχνητή Νοημοσύνη (ΥΠ23) 6 ο εξάμηνο Τμήμα Πληροφορικής και Τηλεματικής Χαροκόπειο Πανεπιστήμιο Ουρανία Χατζή

Εφαρμόζονται σε προβλήματα στα οποία δεν υπάρχει πληροφορία που να επιτρέπει την αξιολόγηση των καταστάσεων του χώρου αναζήτησης.

Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 5: Εύρεση σημείων ισορροπίας σε παίγνια μηδενικού αθροίσματος. Ε. Μαρκάκης. Επικ. Καθηγητής

Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 3: Παίγνια με περισσότερους παίκτες και μέθοδοι απλοποίησης παιγνίων. Ε. Μαρκάκης. Επικ.

ΑΣΚΗΣΕΙΣ ΓΙΑ ΤΟ ΕΡΓΑΣΤΗΡΙΟ 3

Επιπεδοπόλεµος(Flatwar)

Τεχνητή Νοημοσύνη (ΥΠ23) 6 ο εξάμηνο Τμήμα Πληροφορικής και Τηλεματικής Χαροκόπειο Πανεπιστήμιο Ουρανία Χατζή

Τεχνητή Νοημοσύνη Ι. Ενότητα 6: Αναζήτηση με Αντιπαλότητα

Μαθαίνοντας σκάκι. Εγχειρίδιο για προπονητές. Τρίτο βήμα

Γνωριμία με τον Εξοπλισμό

Αλγόριθµοι Ευριστικής Αναζήτησης

Γιώργος Γκούμας. Τα πρώτα σκακιστικά βήματα του παιδιού

ΠΛΗ 405 Τεχνητή Νοηµοσύνη Ε ανάληψη. Προβλήµατα ικανο οίησης εριορισµών ορισµός και χαρακτηριστικά


Chess Academy Free Lessons Ακαδημία Σκάκι Δωρεάν Μαθήματα. Ματ με δύο βαριά κομμάτια Ματ με Βασίλισσα Επιμέλεια: Γιάννης Κατσίρης

Λήψη απόφασης σε πολυπρακτορικό περιβάλλον. Θεωρία Παιγνίων

[ΠΛΗ 417] Τεχνητή Νοημοσύνη. Project Εξαμήνου ΠΟΛΥΤΕΧΝΕΙΟ ΚΡΗΤΗΣ

ΕΠΙΧΕΙΡΗΣΙΑΚΑ ΠΑΙΓΝΙΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ ΠΕΜΠΤΟ ΥΝΑΜΙΚΑ ΠΑΙΓΝΙΑ ΠΛΗΡΟΥΣ ΠΛΗΡΟΦΟΡΗΣΗΣ ΑΚΑ ΗΜΑΙΚΟ ΕΤΟΣ

ΚΕΦΑΛΑΙΟ Μηχανική Μάθηση

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ

ΑΥΤΟΝΟΜΟΙ ΠΡΑΚΤΟΡΕΣ. ΑΝΑΦΟΡΑ ΕΡΓΑΣΙΑΣ Othello-TD Learning. Βόλτσης Βαγγέλης Α.Μ

Κεφάλαιο 2ο (α) Αµιγείς Στρατηγικές (β) Μεικτές Στρατηγικές (α) Αµιγείς Στρατηγικές. Επαναλαµβάνουµε:

Μαθαίνοντας σκάκι. Εγχειρίδιο για προπονητές. εύτερο βήμα

Τεχνητή Νοημοσύνη (ΥΠ23) 6 ο εξάμηνο Τμήμα Πληροφορικής και Τηλεματικής Χαροκόπειο Πανεπιστήμιο Ουρανία Χατζή

Αναζήτηση με αντιπαλότητα (Adversarial Search)

Συστηματική Αναζήτηση και Ενισχυτική Μάθηση για το Επιτραπέζιο Παιχνίδι Backgammon

Δραστηριότητα: Εγκλεισμός

Τεχνητή Νοημοσύνη (ΥΠ23) 6 ο εξάμηνο Τμήμα Πληροφορικής και Τηλεματικής Χαροκόπειο Πανεπιστήμιο Ουρανία Χατζή

ΑΛΓΟΡΙΘΜΙΚΗ ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ Πανεπιστήµιο Αθηνών Εαρινό Εξάµηνο 2007 ιδάσκων : Ηλίας Κουτσουπιάς

Language: English / Greek

Κεφάλαιο 20. Ανακάλυψη Γνώσης σε Βάσεις δεδοµένων. Τεχνητή Νοηµοσύνη - Β' Έκδοση Ι. Βλαχάβας, Π. Κεφαλάς, Ν. Βασιλειάδης, Φ. Κόκκορας, Η.

Αναζήτηση με Αντιπαλότητα

A) Να γράψετε στο τετράδιό σας τον αριθµό καθεµιάς από τις παρακάτω προτάσεις 1-10 και δίπλα τη λέξη Σωστό, αν είναι σωστή, ή τη λέξη Λάθος, αν είναι

Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 2: Έννοιες λύσεων σε παίγνια κανονικής μορφής. Ε. Μαρκάκης. Επικ. Καθηγητής

Εκτεταμένα Παίγνια (Extensive Games)

Εργαστήριο 9 Συναρτήσεις στη PASCAL. Η έννοια του κατακερματισμού. Συναρτήσεις. Σκοπός

Μικτές Στρατηγικές σε Παίγνια και σημεία Ισορροπίας Nash. Τµήµα Μηχανικών Πληροφορικής και Υπολογιστών 1

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ. ΤΕΧΝΗΤΗ ΝΟΗΜΟΣΥΝΗ Τελικές εξετάσεις 24 Ιουνίου 2004

Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 4: Μεικτές Στρατηγικές. Ε. Μαρκάκης. Επικ. Καθηγητής

ΗΥ 252 Αντικειμενοστρεφής Προγραμματισμός Προγραμματιστική Εργασία Χειμερινού Εξαμήνου Σκάκι

1. Να αναφέρετε ονοµαστικά τις λειτουργίες µε τις οποίες ο υπολογιστής µπορεί να επιτελέσει µε επιτυχία οποιαδήποτε επεξεργασία. Ï.Å.Ö.Å.

Extensive Games with Imperfect Information

ΚΥΠΡΙΑΚΗ ΜΑΘΗΜΑΤΙΚΗ ΕΤΑΙΡΕΙΑ. Ημερομηνία: 29/04/2017 Ώρα εξέτασης: 10:00-14:30

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Θεωρία Παιγνίων και Αποφάσεων Διδάσκων: Ε. Μαρκάκης, Εαρινό εξάμηνο 2015

Τεχνητή Νοημοσύνη. 4η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

Αλγόριθμοι Τυφλής Αναζήτησης

Αυτόνομοι Πράκτορες. Εργασία εξαμήνου. Value Iteration και Q- Learning για Peg Solitaire

Β. Βασιλειάδης Αν. Καθηγητής. Επιχειρησιακή Ερευνα Διάλεξη 6 η - Θεωρεία Παιγνίων

Θεωρία Παιγνίων Δρ. Τασσόπουλος Ιωάννης

Θέματα Υπολογισμού στον Πολιτισμό - Δένδρα. Δένδρα

Μαθηματικά των Υπολογιστών και των Αποφάσεων Τεχνητή Νοημοσύνη 1η Σειρά Ασκήσεων

Κεφάλαιο 6. Ικανοποίηση Περιορισµών. Τεχνητή Νοηµοσύνη - Β' Έκδοση. Ι. Βλαχάβας, Π. Κεφαλάς, Ν. Βασιλειάδης, Φ. Κόκκορας, Η.

Κεφάλαιο 29 Θεωρία παιγνίων

EMOJITO! 7 Δίσκοι Ψηφοφορίας. 100 Κάρτες Συναισθημάτων. 1 Ταμπλό. 7 Πιόνια παικτών. 2-7 Παίκτες

ΠΤΥΧΙΑΚΗ/ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ

ΠΛΗ 405 Τεχνητή Νοηµοσύνη Ε ανάληψη. πεπερασµένα χρονικά περιθώρια ανά κίνηση. απευθείας αξιολόγηση σε ενδιάµεσους κόµβους

Χρήστος Ι. Σχοινάς Αν. Καθηγητής ΔΠΘ. Συμπληρωματικές σημειώσεις για το μάθημα: «Επιχειρησιακή Έρευνα ΙΙ»

PROJECT ΣΤΟ ΜΑΘΗΜΑ ΕΙΣΑΓΩΓΗ ΣΤΙΣ ΕΥΡΕΤΙΚΕΣ ΜΕΘΟ ΟΥΣ

Συνδυαστικά Παίγνια. ιαµόρφωση Παιγνίων. Θέµατα σε Πάιγνια Μηδενικού Αθροίσµατος

ÔÏÕËÁ ÓÁÑÑÇ ÊÏÌÏÔÇÍÇ

ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ ΠΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ ΠΕΡΙΒΑΛΛΟΝ ΕΠΑΝΑΛΗΠΤΙΚΟ ΔΙΑΓΩΝΙΣΜΑ ΣΧΟΛΙΚΟΥ ΕΤΟΥΣ

Βασικές Αρχές της Θεωρίας Παιγνίων

1. Πάντα να μπλοκάρετε τα προωθημένα πιόνια του αντιπάλου

Σκοπός του παιχνιδιού Σκοπός του παιχνιδιού είναι να τοποθετήσει πρώτος ο παίκτης όλα τα πλακίδιά του στο τραπέζι.

ΕΠΙΧΕΙΡΗΣΙΑΚΑ ΠΑΙΓΝΙΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ ΕΥΤΕΡΟ- ΚΥΡΙΑΡΧΟΥΜΕΝΗ ΣΤΡΑΤΗΓΙΚΗ- PRISONER S DILLEMA ΑΚΑ ΗΜΑΙΚΟ ΕΤΟΣ

ΘΕΜΑ 1ο Α. 1-5 ΣΩΣΤΟ, ΛΑΘΟΣ Για κ από 4 µέχρι 3 ΚΑΙ Β.1 ΣΩΣΤΟ ΛΑΘΟΣ, Β.2 Γ.1

Transcript:

Κεφάλαιο 5 Αλγόριθµοι Αναζήτησης σε Παίγνια ύο Αντιπάλων Τεχνητή Νοηµοσύνη - Β' Έκδοση Ι. Βλαχάβας, Π. Κεφαλάς, Ν. Βασιλειάδης, Φ. Κόκκορας, Η. Σακελλαρίου

Αλγόριθµοι Αναζήτησης σε Παίγνια ύο Αντιπάλων Εισαγωγικά (1/3) Τα προβλήµατα όπου η εξέλιξη των καταστάσεων εξαρτάται από δύο διαφορετικά σύνολα τελεστών µετάβασης που εφαρµόζονται εναλλάξ αναφέρονται και ως ανταγωνιστικά παίγνια ή παίγνια δύο αντιπάλων (adversary ή two-person games) όρος "παίγνιο" αφορά την περιγραφή του τρόπου µε τον οποίο παίζεται το παιχνίδι και περιλαµβάνει: τα αντικείµενα που υπάρχουν (για παράδειγµα, τα πούλια, το ταµπλώ, κτλ.) καθώς και το σύνολο των κανόνων που το διέπουν. Αντίθετα, µε τον όρο "παιχνίδι" χαρακτηρίζεται µία συγκεκριµένη παρτίδα του παιγνίου. Τεχνητή Νοηµοσύνη, B' Έκδοση 2

Αλγόριθµοι Αναζήτησης σε Παίγνια ύο Αντιπάλων Εισαγωγικά (2/3) Το πρόβληµα ορίζεται ως εξής: Μια κατάσταση παριστάνει τη διάταξη των πιονιών σε κάποια χρονική στιγµή. χώρος καταστάσεων αποτελείται από όλες αυτές τις πιθανές επιτρεπτές καταστάσεις. ι τελεστές µετάβασης είναι οι επιτρεπτές κινήσεις (κανόνες του παιχνιδιού). ι τελικές καταστάσεις έχουν γνωστά χαρακτηριστικά (π.χ. µατ στο σκάκι). Έστω ότι κάποιος είναι η σειρά του να κάνει µία κίνηση. Αν θέλει να κερδίσει, θα επιδιώξει να κάνει την καλύτερη κίνηση για αυτόν, η οποία αντίστοιχα θα είναι και η χειρότερη για τον αντίπαλο. τρόπος που σκέφτεται είναι ο εξής: "Αν κάνω αυτή την κίνηση, τότε ο αντίπαλος θα κάνει εκείνη, αν όµως κάνω την άλλη κίνηση, τότε θα κάνει αυτήν,..." κ.ο.κ. συλλογισµός αυτός αντιστοιχεί στη δηµιουργία ενός δένδρου (δένδρο του παιχνιδιού game). Τεχνητή Νοηµοσύνη, B' Έκδοση 3

Αλγόριθµοι Αναζήτησης σε Παίγνια ύο Αντιπάλων Εισαγωγικά (3/3) Το χαρακτηριστικό του είναι ότι οι κινήσεις δύο διαδοχικών επιπέδων ανήκουν σε διαφορετικό παίκτη, γιατί οι παίκτες παίζουν εναλλάξ. Έστω ότι ένας από τους δύο αντιπάλους είναι ο υπολογιστής. Το πρόγραµµα αναζήτησης πρέπει να εξετάσει όλες τις πιθανές κινήσεις που παράγονται από µία (αρχική) κατάσταση. Ένα τέτοιο πρόγραµµα µπορεί να προβλέψει την έκβαση του παιχνιδιού µετά από 10 κινήσεις (ο άνθρωπος σταµατά συνήθως µετά την πρόβλεψη 2 ή 3 κινήσεων). Παραδόξως, οι διαφορές αυτές δεν κάνουν κάποιο πρόγραµµα κυρίαρχο οποιουδήποτε παιχνιδιού έναντι του ανθρώπου. Η ανωτερότητα των ανθρώπων έγκειται στους εξής παράγοντες: ι άνθρωποι επιλέγουν µε κάποιον ευριστικό τρόπο τις εναλλακτικές κινήσεις. ι άνθρωποι διαθέτουν κάποια διαίσθηση για την κατάληξη του παιχνιδιού. Με την εµπειρία που αποκτούν, µπορούν να σκέφτονται πολλές φορές εντελώς µηχανικά, ιδίως στα πρώτα και τελευταία στάδια του παιχνιδιού. Τεχνητή Νοηµοσύνη, B' Έκδοση 4

Αλγόριθµος Mini (1/3) εδοµένης µίας κατάστασης του παιχνιδιού, ο αλγόριθµος αναζήτησης µεγίστουελαχίστου (Mini) καλείται να αποφασίσει ποια θα είναι η επόµενη κίνησή του έναντι του αντιπάλου. Η εξαντλητική αναζήτηση των δένδρων αναζήτησης είναι ανέφικτη. Το ζητούµενο είναι: Να χτιστεί το δένδρο µέχρι κάποιο βάθος Να βρεθεί η καλύτερη κίνηση από την παρούσα κατάσταση. Το µέτρο της υπεροχής του ενός ή του άλλου αντιπάλου δίνεται από µία συνάρτηση αξιολόγησης (evaluation function) και η οποία εφαρµόζεται στα φύλλα του δένδρου του παιχνιδιού. ένας παίκτης (πρόγραµµα) ονοµάζεται και ο άλλος (άλλο πρόγραµµα ή άνθρωπος) ονοµάζεται min. Τεχνητή Νοηµοσύνη, B' Έκδοση 5

Αλγόριθµος Mini Ψευδογλώσσα 1. Εφάρµοσε τη συνάρτηση αξιολόγησης σε όλους τους κόµβους-φύλλα του δένδρου. 2. Έως ότου η ρίζα του δένδρου αποκτήσει τιµή, επανέλαβε: 3. Αρχίζοντας από τα φύλλα του δένδρου και προχωρώντας προς τη ρίζα, µετέφερε τις τιµές προς τους ενδιάµεσους κόµβους του δένδρου ως εξής: i. Η τιµή κάθε κόµβου Max είναι η µέγιστη (imum) των τιµών των κόµβων-παιδιών του. ii. Η τιµή κάθε κόµβου Min είναι η ελάχιστη (minimum) των τιµών των κόµβων-παιδιών του. 4. Καλύτερη κίνηση είναι η κίνηση που οδηγεί στον κόµβο που έδωσε την πιο συµφέρουσα στη ρίζα τιµή (µέγιστη για το Max, ελάχιστη για το Min). αλγόριθµος εγγυάται την πιο συµφέρουσα εξέλιξη µετά από κάποιες κινήσεις, έστω και αν ο αντίπαλος διαλέγει τις καλύτερες για αυτόν κινήσεις. Τεχνητή Νοηµοσύνη, B' Έκδοση 6

Αλγόριθµος Mini (2/3) Κατά σύµβαση, ο παίκτης που βρίσκεται στη ρίζα θεωρείται πως είναι ο Max. ι καταστάσεις-φύλλα ονοµάζονται τερµατικές καταστάσεις, όµως δεν είναι απαραίτητα τελικές καταστάσεις. ι τιµές των τερµατικών καταστάσεων υπολογίζονται από τη συνάρτηση αξιολόγησης ενώ οι άλλες προκύπτουν από τη διάδοση αυτών. Τεχνητή Νοηµοσύνη, B' Έκδοση 7

Αλγόριθµος Mini (3/3) Αξιολόγηση τερµατικών καταστάσεων min 2-3 20-100 -95 18 95 5-1 -3-7 100 ιάδοση τιµών για τον min 2 20 95 5 2-3 20-100 -95 18 95 5-1 100-1 -3-7 100 (-7, 100) ιάδοση τιµών για τον min 2 5-1 min 2 20 95 5-1 100 min (-1, 100) 2-3 20-100 -95 18 95 5-1 -3-7 100 ιάδοση τιµών για τον 5 Απόφαση για την καλύτερη κίνηση 2 5-1 min (2, 5, -1) 2 20 95 5-1 100 Η προτεινόµενη (καλύτερη) κίνηση του 2-3 20-100 -95 18 95 5-1 -3-7 100 Τεχνητή Νοηµοσύνη, B' Έκδοση 8

Αλγόριθµος Mini στην Τρίλιζα (1/2) Η τρίλιζα έχει µικρό χώρο αναζήτησης (9! καταστάσεις). min Τεχνητή Νοηµοσύνη, B' Έκδοση 9

Αλγόριθµος Mini στην Τρίλιζα (2/2) Μία συνάρτηση αξιολόγησης στην τρίλιζα θα µπορούσε να είναι η: 3 2 + 1 (3 2 + 1 ) 2 ο αριθµός γραµµών, στηλών ή διαγωνίων µε δύο και χωρίς κανένα. 1 ο αριθµός γραµµών, στηλών ή διαγωνίων µε ένα και χωρίς κανένα. 2 ο αριθµός γραµµών, στηλών ή διαγωνίων µε δύο και χωρίς κανένα. 1 ο αριθµός γραµµών, στηλών ή διαγωνίων µε ένα και χωρίς κανένα. Ένα σε σειρά ύο σε διαγώνιο ύο σε στήλη ύο σε στήλη 3 2 + 1 (3 2 + 1 ) = 3 2+1 (3 1+0) = 4 Τεχνητή Νοηµοσύνη, B' Έκδοση 10

Εφαρµογή αλγορίθµου Mini στο σκάκι Το κύριο µέληµα των προγραµµάτων σκάκι είναι να αναζητήσουν το δένδρο του παιχνιδιού σε όσο το δυνατόν µεγαλύτερο βάθος. Μία συνάρτηση αξιολόγησης στο σκάκι Υπεροχή κοµµατιών: π.χ. Βασιλιάς=10, Άλογο=5, Πιόνι=1 κλπ. Η αξία όλων των κοµµατιών κάθε χρώµατος προστίθεται. Υπεροχή θέσης: Κάθε κοµµάτι που βρίσκεται στα 4 κεντρικά τετράγωνα παίρνει επιπλέον 2 πόντους. Απειλές: Για κάθε απειλή που προβάλει ένας παίκτης παίρνει 3 επιπλέον πόντους, εκτός αν απειλεί το βασιλιά του άλλου παίκτη, οπότε παίρνει 20 πόντους. Βασιλιάς Άλογο Πιόνι Τεχνητή Νοηµοσύνη, B' Έκδοση 11

Αλγόριθµος Mini στο Σκάκι Max Min Τερµατικές καταστάσεις Max Min 8 6 10 7 4 9 1 12-8 3 5 6-2 9 10 13 17 3 1 6 Αξιολόγηση Τερµατικών Καταστάσεων Max Καλύτερη κίνηση 4 Min 4-8 -2 1 8 6 10 7 4 9 1 12-8 3 5 6-2 9 10 13 17 3 1 6 Μετατόπιση τιµών προς τη ρίζα του δένδρου Τεχνητή Νοηµοσύνη, B' Έκδοση 12

Αλγόριθµος Alpha-Beta Άλφα-Βήτα (Alpha-Beta - ΑΒ) αποφεύγει την αξιολόγηση καταστάσεων. ΑΒ είναι όµοιος µε τον Mini, αλλά µε κλάδεµα υποδένδρων. Τεχνητή Νοηµοσύνη, B' Έκδοση 13

Σύγκριση του AB µε τον Mini (1/2) Παράδειγµα Mini Max Min 4 4-1 -7-8 4 10 7 5-1 2 15-7 3-5 -8 1 Παράδειγµα Alpha-Beta Max Min 4 4-1 -7-5 4 10 7 5-1 2 15-7 3-5 -8 1 Τεχνητή Νοηµοσύνη, B' Έκδοση 14

Σύγκριση του AB µε τον Mini (2/2) ΑΒ εξετάζει περίπου N τερµατικούς κόµβους, όπου Ν είναι οι τερµατικοί κόµβοι που εξετάζει ο αλγόριθµος Mini. Η απόδοσή του βελτιώνεται µε διάφορες µεθόδους, όπως: Ευριστικό κλάδεµα του δένδρου παιχνιδιού. υναµική αντί στατικής συνάρτησης αξιολόγησης. Αποθήκευση τιµών των τερµατικών καταστάσεων (transposition tables). Προκαθορισµένες κινήσεις (χωρίς αναζήτηση) σε αρχικές και τελικές φάσεις του παιγνιδιού (Openings, End Game moves). Τεχνητή Νοηµοσύνη, B' Έκδοση 15

Το Πρόβληµα του ρίζοντα Το φαινόµενο του ορίζοντα (horizon effect) αντιµετωπίζεται µε ανιχνευτές (scouts). Τεχνητή Νοηµοσύνη, B' Έκδοση 16