Τεχνητή Νοημοσύνη (ΥΠ23) 6 ο εξάμηνο Τμήμα Πληροφορικής και Τηλεματικής Χαροκόπειο Πανεπιστήμιο Ουρανία Χατζή

Σχετικά έγγραφα
Κεφάλαιο 5. Αλγόριθµοι Αναζήτησης σε Παίγνια ύο Αντιπάλων. Τεχνητή Νοηµοσύνη - Β' Έκδοση

Επίλυση Προβλημάτων 1

Αλγόριθμοι Αναζήτησης σε Παίγνια Δύο Αντιπάλων

Επίλυση προβληµάτων. Περιγραφή προβληµάτων Αλγόριθµοι αναζήτησης Αλγόριθµοι τυφλής αναζήτησης Αλγόριθµοι ευρετικής αναζήτησης

Τεχνητή Νοημοσύνη. 6η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

Τεχνητή Νοημοσύνη (ΥΠ23) 6 ο εξάμηνο Τμήμα Πληροφορικής και Τηλεματικής Χαροκόπειο Πανεπιστήμιο Ουρανία Χατζή

ΧΑΡΟΚΟΠΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ & ΤΗΛΕΜΑΤΙΚΗΣ

Τεχνητή Νοημοσύνη (ΥΠ23) 6 ο εξάμηνο Τμήμα Πληροφορικής και Τηλεματικής Χαροκόπειο Πανεπιστήμιο Ουρανία Χατζή

Τεχνητή Νοημοσύνη. 3η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

Ασκήσεις μελέτης της 6 ης διάλεξης

Τεχνητή Νοημοσύνη (ΥΠ23) 6 ο εξάμηνο Τμήμα Πληροφορικής και Τηλεματικής Χαροκόπειο Πανεπιστήμιο Ουρανία Χατζή

Τεχνητή Νοημοσύνη (ΥΠ23) 6 ο εξάμηνο Τμήμα Πληροφορικής και Τηλεματικής Χαροκόπειο Πανεπιστήμιο Ουρανία Χατζή

Αυτόνομοι Πράκτορες. Εργασία εξαμήνου. Μάθηση του παιχνιδιού British square με χρήση Temporal Difference(TD) Κωνσταντάκης Γιώργος

Τεχνητή Νοημοσύνη (ΥΠ23) 6 ο εξάμηνο Τμήμα Πληροφορικής και Τηλεματικής Χαροκόπειο Πανεπιστήμιο Ουρανία Χατζή

Τεχνητή Νοημοσύνη (ΥΠ23) 6 ο εξάμηνο Τμήμα Πληροφορικής και Τηλεματικής Χαροκόπειο Πανεπιστήμιο Ουρανία Χατζή

Αλγόριθµοι Ευριστικής Αναζήτησης

Κεφ. 9 Ανάλυση αποφάσεων

Τεχνητή Νοημοσύνη (ΥΠ23) 6 ο εξάμηνο Τμήμα Πληροφορικής και Τηλεματικής Χαροκόπειο Πανεπιστήμιο Ουρανία Χατζή

Θεωρία Λήψης Αποφάσεων

Τεχνητή Νοημοσύνη. 2η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

Θεωρία Παιγνίων Δρ. Τασσόπουλος Ιωάννης

ΔΙΑΝΥΣΜΑΤΑ. Ακολουθίες. Στην ενότητα αυτή θα μάθουμε: Να ορίζουμε το διάνυσμα.

[ΠΛΗ 417] Τεχνητή Νοημοσύνη. Project Εξαμήνου ΠΟΛΥΤΕΧΝΕΙΟ ΚΡΗΤΗΣ

ΠΑΙΓΝΙΑ Παιχνίδια Γενική Θεώρηση μεγιστοποιήσει την πιθανότητά

Chess Academy Free Lessons Ακαδημία Σκάκι Δωρεάν Μαθήματα. Οι κινήσεις των κομματιών Σκοπός της παρτίδας, το Ματ Πατ Επιμέλεια: Γιάννης Κατσίρης

ΑΥΤΟΝΟΜΟΙ ΠΡΑΚΤΟΡΕΣ. ΑΝΑΦΟΡΑ ΕΡΓΑΣΙΑΣ Othello-TD Learning. Βόλτσης Βαγγέλης Α.Μ

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ

ΘΕΩΡΙΑ ΤΩΝ ΠΑΙΓΝΙΩΝ I.

ΑΣΚΗΣΕΙΣ ΓΙΑ ΤΟ ΕΡΓΑΣΤΗΡΙΟ 3

Ε ανάληψη. Προβλήµατα ικανο οίησης εριορισµών. ορισµός και χαρακτηριστικά Ε ίλυση ροβληµάτων ικανο οίησης εριορισµών

Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 3: Παίγνια με περισσότερους παίκτες και μέθοδοι απλοποίησης παιγνίων. Ε. Μαρκάκης. Επικ.

Β. Βασιλειάδης Αν. Καθηγητής. Επιχειρησιακή Ερευνα Διάλεξη 6 η - Θεωρεία Παιγνίων

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΤΕΧΝΗΤΗ ΝΟΗΜΟΣΥΝΗ

ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ

Πληροφοριακά Συστήματα Διοίκησης (ΜΒΑ) Ενότητα 8: Παίγνια πλήρους και ελλιπούς πληροφόρησης

Περιγραφή Προβλημάτων

Λήψη απόφασης σε πολυπρακτορικό περιβάλλον. Θεωρία Παιγνίων


Επίλυση προβληµάτων. Αλγόριθµοι Αναζήτησης

PROJECT ΣΤΟ ΜΑΘΗΜΑ "ΕΙΣΑΓΩΓΗ ΣΤΙΣ ΕΥΡΕΤΙΚΕΣ ΜΕΘΟΔΟΥΣ"

PROJECT ΣΤΟ ΜΑΘΗΜΑ ΕΙΣΑΓΩΓΗ ΣΤΙΣ ΕΥΡΕΤΙΚΕΣ ΜΕΘΟ ΟΥΣ

Εφαρμόζονται σε προβλήματα στα οποία δεν υπάρχει πληροφορία που να επιτρέπει την αξιολόγηση των καταστάσεων του χώρου αναζήτησης.

Αλγόριθµοι Ευριστικής Αναζήτησης

Language: English / Greek

Γιώργος Γκούμας. Τα πρώτα σκακιστικά βήματα του παιδιού

Ε Π Ι Χ Ε Ι Ρ Η Σ Ι Α Κ Η Ε Ρ Ε Υ Ν Α

Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 5: Εύρεση σημείων ισορροπίας σε παίγνια μηδενικού αθροίσματος. Ε. Μαρκάκης. Επικ. Καθηγητής

Ε ανάληψη. Παιχνίδια παιχνίδια ως αναζήτηση. Βέλτιστες στρατηγικές στρατηγική minimax. Βελτιώσεις κλάδεµα α-β

ΑΛΓΟΡΙΘΜΙΚΗ ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ Πανεπιστήµιο Αθηνών Εαρινό Εξάµηνο 2007 ιδάσκων : Ηλίας Κουτσουπιάς

Θεωρία Παιγνίων Δρ. Τασσόπουλος Ιωάννης

Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 2: Έννοιες λύσεων σε παίγνια κανονικής μορφής. Ε. Μαρκάκης. Επικ. Καθηγητής

Chess Academy Free Lessons Ακαδημία Σκάκι Δωρεάν Μαθήματα. Ματ με δύο βαριά κομμάτια Ματ με Βασίλισσα Επιμέλεια: Γιάννης Κατσίρης

ΕΠΙΧΕΙΡΗΣΙΑΚΑ ΠΑΙΓΝΙΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ ΕΥΤΕΡΟ- ΚΥΡΙΑΡΧΟΥΜΕΝΗ ΣΤΡΑΤΗΓΙΚΗ- PRISONER S DILLEMA ΑΚΑ ΗΜΑΙΚΟ ΕΤΟΣ

Μαθαίνοντας σκάκι. Εγχειρίδιο για προπονητές. Τρίτο βήμα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΤΕΧΝΗΤΗ ΝΟΗΜΟΣΥΝΗ. Τελικές εξετάσεις Παρασκευή 4 Ιουλίου 2014, 18:00-21:00

Μαθηματικά των Υπολογιστών και των Αποφάσεων Τεχνητή Νοημοσύνη 1η Σειρά Ασκήσεων

Μικτές Στρατηγικές σε Παίγνια και σημεία Ισορροπίας Nash. Τµήµα Μηχανικών Πληροφορικής και Υπολογιστών 1

Τεχνητή Νοημοσύνη. 4η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

ΕΠΙΧΕΙΡΗΣΙΑΚΑ ΠΑΙΓΝΙΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ ΠΕΜΠΤΟ ΥΝΑΜΙΚΑ ΠΑΙΓΝΙΑ ΠΛΗΡΟΥΣ ΠΛΗΡΟΦΟΡΗΣΗΣ ΑΚΑ ΗΜΑΙΚΟ ΕΤΟΣ

Εργαστήριο 9 Συναρτήσεις στη PASCAL. Η έννοια του κατακερματισμού. Συναρτήσεις. Σκοπός

Γνωριμία με τον Εξοπλισμό

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Βfi 1 2 Αfl 1 1, 2 0, 1 2 2, 1 1, 0

Επίλυση προβλημάτων με αναζήτηση

Συστηματική Αναζήτηση και Ενισχυτική Μάθηση για το Επιτραπέζιο Παιχνίδι Backgammon

Δραστηριότητα: Εγκλεισμός

Επιπεδοπόλεµος(Flatwar)

Αναζήτηση με Αντιπαλότητα

Επίλυση Προβλημάτων 1

Εκτεταμένα Παίγνια (Extensive Games)

Δεύτερο πακέτο ασκήσεων

Κεφάλαιο 2. Περιγραφή Προβληµάτων και Αναζήτηση Λύσης. Τεχνητή Νοηµοσύνη - Β' Έκδοση

Τσάπελη Φανή ΑΜ: Ενισχυτική Μάθηση για το παιχνίδι dots. Τελική Αναφορά

1. Πάντα να μπλοκάρετε τα προωθημένα πιόνια του αντιπάλου

Χρήστος Ι. Σχοινάς Αν. Καθηγητής ΔΠΘ. Συμπληρωματικές σημειώσεις για το μάθημα: «Επιχειρησιακή Έρευνα ΙΙ»

EMOJITO! 7 Δίσκοι Ψηφοφορίας. 100 Κάρτες Συναισθημάτων. 1 Ταμπλό. 7 Πιόνια παικτών. 2-7 Παίκτες

ΔΙΑΓΩΝΙΣΜΑ ΣΤΗΝ ΠΛΗΡΟΦΟΡΙΚΗ

Ασκήσεις μελέτης της 4 ης διάλεξης. ), για οποιοδήποτε μονοπάτι n 1

Κεφάλαιο 2ο (α) Αµιγείς Στρατηγικές (β) Μεικτές Στρατηγικές (α) Αµιγείς Στρατηγικές. Επαναλαµβάνουµε:

Τεχνητή Νοημοσύνη Ι. Ενότητα 6: Αναζήτηση με Αντιπαλότητα

Τεχνητή Νοημοσύνη (ΥΠ23) 6 ο εξάμηνο Τμήμα Πληροφορικής και Τηλεματικής Χαροκόπειο Πανεπιστήμιο Ουρανία Χατζή

Περιεχόμενα του Παιχνιδιού

Τεχνητή Νοημοσύνη. 7η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ

Θεωρία Παιγνίων και Αποφάσεων. Ενότητα 4: Μεικτές Στρατηγικές. Ε. Μαρκάκης. Επικ. Καθηγητής

Μαθαίνοντας σκάκι. Εγχειρίδιο για προπονητές. εύτερο βήμα

δημιουργία: επεξεργασία: Ν.Τσάντας

Αλγόριθμοι και πολυπλοκότητα: 4 η σειρά ασκήσεων ΣΗΜΜΥ - Ε.Μ.Π.

ΠΛΗ 405 Τεχνητή Νοηµοσύνη Ε ανάληψη. Προβλήµατα ικανο οίησης εριορισµών ορισµός και χαρακτηριστικά

Επίλυση Προβλημάτων 1

Extensive Games with Imperfect Information

Αυτόνομοι Πράκτορες. Εργασία εξαμήνου. Value Iteration και Q- Learning για Peg Solitaire

ΟΙΚΟΝΟΜΙΚΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ - ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ Θεωρία Παιγνίων και Αποφάσεων Διδάσκων: Ε. Μαρκάκης, Εαρινό εξάμηνο 2015

1.2 Κομμάτια Μικρής Εμβέλειας Το άλογο

2. ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ

Αναζήτηση με αντιπαλότητα (Adversarial Search)

Επίλυση Προβλημάτων. Αποτελεί ένα από τα βασικά χαρακτηριστικά γνωρίσματα της νοημοσύνης.

ΗΥ 252 Αντικειμενοστρεφής Προγραμματισμός Προγραμματιστική Εργασία Χειμερινού Εξαμήνου Σκάκι

Λήψη αποφάσεων υπό αβεβαιότητα. Παίγνια Αποφάσεων 9 ο Εξάμηνο

Κεφάλαιο 29 Θεωρία παιγνίων

ΠΤΥΧΙΑΚΗ/ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ

Transcript:

Τεχνητή Νοημοσύνη (ΥΠ23) 6 ο εξάμηνο Τμήμα Πληροφορικής και Τηλεματικής Χαροκόπειο Πανεπιστήμιο Ουρανία Χατζή raniah@hua.gr 1

Παίγνια Δύο Αντιπάλων Τα προβλήματα όπου η εξέλιξη των καταστάσεων εξαρτάται από δύο διαφορετικά σύνολα τελεστών μετάβασης που εφαρμόζονται εναλλάξ αναφέρονται ως ανταγωνιστικά παίγνια ή παίγνια δύο αντιπάλων (adversary ή two-person games). Ο όρος «παίγνιο» αφορά την περιγραφή του τρόπου με τον οποίον παίζεται το παιχνίδι και περιλαμβάνει: Τα αντικείμενα που υπάρχουν (για παράδειγμα τα πούλια, το ταμπλώ κτλ) Το σύνολο των κανόνων που το διέπουν Αντίθετα με τον όρο «παιχνίδι» χαρακτηρίζεται μια συγκεκριμένη παρτίδα του παιγνίου. 2

Παίγνια Δύο Αντιπάλων Το πρόβλημα ορίζεται ως εξής: Μια κατάσταση παριστάνει τη διάταξη των πιονιών σε κάποια χρονική στιγμή Ο χώρος καταστάσεων αποτελείται από όλες αυτές τις πιθανές επιτρεπτές καταστάσεις Οι τελεστές μετάβασης είναι οι επιτρεπτές κινήσεις (κανόνες του παιχνιδιού) Οι τελικές καταστάσεις έχουν γνωστά χαρακτηριστικά (π.χ. ματ στο σκάκι) Έστω ότι κάποιος έχει σειρά να κάνει κίνηση Αν θέλει να κερδίσει, θα επιδιώξει να κάνει τη καλύτερη κίνηση για αυτόν, η οποία θα είναι και η χειρότερη για τον αντίπαλο Ο τρόπος που σκέφτεται είναι «αν κάνω αυτή τη κίνηση, ο αντίπαλος θα κάνει εκείνη, αν όμως κάνω την άλλη κίνηση, τότε θα κάνει αυτήν κ.ο.κ» Ο συλλογισμός αυτός αντιστοιχεί στη δημιουργία ενός δέντρου (δέντρο παιχνιδιού game tree) 3

Παίγνια Δύο Αντιπάλων Το χαρακτηριστικό ενός τέτοιου δέντρου είναι ότι οι κινήσεις δύο διαδοχικών επιπέδων ανήκουν σε διαφορετικό παίκτη, αφού οι παίκτες παίζουν εναλλάξ. Έστω ότι ένας από τους δύο αντίπαλους είναι ο υπολογιστής Το πρόγραμμα αναζήτησης πρέπει να εξετάσει όλες τις πιθανές κινήσεις που παράγονται από μία (αρχική) κατάσταση Ένα τέτοιο πρόγραμμα είναι σε θέση να προβλέψει την έκβαση του παιχνιδιού μετά από 10 ή 15 κινήσεις όταν ο άνθρωπος σταματά συνήθως μετά από 2 ή 3. Παραδόξως, οι διαφορές αυτές δεν κάνουν απαραίτητα κάποιο πρόγραμμα κυρίαρχο οποιουδήποτε παιχνιδιού έναντι του ανθρώπου. Η ανωτερότητα των ανθρώπων έγκειται στους εξής παράγοντες: Διαθέτουν διαίσθηση για την έκβαση του παιχνιδιού Επιλέγουν με ευριστικό τρόπο τις εναλλακτικές κινήσεις Με την εμπειρία που αποκτούν, μπορούν να σκέφτονται εντελώς μηχανικά, ιδίως στα πρώτα και τελευταία στάδια του παιχνιδιού 4

Minimax Ο αλγόριθμος μεγίστου-ελαχίστου, δεδομένης μιας κατάστασης του παιχνιδιού, καλείται να αποφασίσει ποιά θα είναι η επόμενη κίνηση του έναντι του αντιπάλου. Η εξαντλητική αναζήτηση των δέντρων είναι ανέφικτη. Το ζητούμενο είναι να καταστευαστεί ένα δέντρο μέχρι κάποιο βάθος και να βρεθεί η καλύτερη κίνηση από την παρούσα κατάσταση. Το μέτρο της υπεροχής του ενός ή του άλλου παίκτη δίνεται από μια συνάρτηση αξιολόγησης (evaluation function) η οποία εφαρμόζεται στα φύλλα του δέντρου του παιχνιδιού. Ο ένας παίκτης (υπολογιστής) ονομάζεται max και ο άλλος (υπολογιστής ή άνθρωπος) ονομάζεται min. 5

Minimax 1. Εφάρμοσε τη συνάρτηση αξιολόγησης σε όλους τους κόμβουςφύλλα του δέντρου. 2. Έως ότου η ρίζα αποκτήσει τιμή, επανέλαβε: 3. Αρχίζοντας από τα φύλλα του δέντρου και προχωρώντας προς τη ρίζα, μετέφερε τις τιμές προς τους ενδιάμεσους κόμβους του δέντρου ως εξής: i. Η τιμή κάθε κόμβου Max είναι η μέγιστη των τιμών των κόμβων-παιδιών του. ii. Η τιμή κάθε κόμβου Min είναι η ελάχιστη των τιμών των κόμβων-παιδιών του. 4. Καλύτερη κίνηση είναι η κίνηση που οδηγεί στον κόμβο που έδωσε την πιο συμφέρουσα τιμή στη ρίζα (μέγιστη για το Max, ελάχιστη για το Min). 6

Minimax - Σχόλια Ο αλγόριθμος εγγυάται την πιο συμφέρουσα εξέλιξη μετά από κάποιες κινήσεις, έστω και αν ο αντίπαλος διαλέγει τις καλύτερες για αυτόν κινήσεις. Κατά σύμβαση, ο παίκτης που βρίσκεται στη ρίζα θεωρείται πως είναι ο Max. Οι καταστάσεις-φύλλα ονομάζονται τερματικές καταστάσεις όμως δεν είναι απαραίτητα τελικές καταστάσεις. Οι τιμές των τερματικών καταστάσεων υπολογίζονται από τη συνάρτηση αξιολόγησης ενώ οι άλλες προκύπτουν από τη διάδοση αυτών. 7

Διάδοση τιμών στον Minimax 8

O Minimax στην Τρίλιζα (1/2) Η τρίλιζα έχει μικρό χώρο αναζήτησης που αποτελείται από 9 καταστάσεις. 9

O Minimax στην Τρίλιζα (2/2) Μια συνάρτηση αξιολόγησης στην Τρίλιζα θα μπορούσε να είναι η 3*Χ 2 +Χ 1 -(3*Ο 2 +Ο 1 ) Χ 2 ο αριθμός γραμμών, στηλών ή διαγωνίων με δύο Χ και κανένα Ο Χ 1 ο αριθμός γραμμών, στηλών ή διαγωνίων με ένα Χ και κανένα Ο Ο 2 ο αριθμός γραμμών, στηλών ή διαγωνίων με δύο Ο και κανένα Χ Ο 1 ο αριθμός γραμμών, στηλών ή διαγωνίων με ένα Ο και κανένα Χ 10

O Minimax στο Σκάκι (1/2) Το ζητούμενο στα προγράμματα που παίζουν σκάκι είναι να υπολογίσουν το δέντρο αναζήτησης σε όσο το δυνατόν μεγαλύτερο βάθος (πρόβλεψη μακρύτερα στο μέλλον). Μια συνάρτηση αξιολόγησης θα μπορούσε να λαμβάνει υπόψη: Υπεροχή κομματιών: π.χ. Βασιλιάς=10, Άλογο=5, Πιόνι=1 κτλ. Η αξία όλων των κομματιών κάθε χρώματος προστίθεται. Υπεροχή θέσης: Κάθε κομμάτι που βρίσκεται στα 4 κεντρικά τετράγωνα παίρνει επιπλέον 2 πόντους. Απειλές: Για κάθε απειλή που προβάλλει ένας παίκτης παίρνει 3 επιπλέον πόντους, εκτός αν απειλεί τον βασιλιά του άλλου παίκτη, οπότε παίρνει 20 πόντους. 11

O Minimax στο Σκάκι (2/2) 12

Ενδεικτική Βιβλιογραφία Ενότητες 5.1 και 5.2 του βιβλίου «Τεχνητή Νοημοσύνη», Ι. Βλαχάβας, Π. Κεφαλάς, Ν. Βασιλειάδης, Φ. Κόκκορας και Η. Σακελλαρίου. 13