Ε ανάληψη. Παιχνίδια παιχνίδια ως αναζήτηση. Βέλτιστες στρατηγικές στρατηγική minimax. Βελτιώσεις κλάδεµα α-β



Σχετικά έγγραφα
ΠΛΗ 405 Τεχνητή Νοηµοσύνη Ε ανάληψη. πεπερασµένα χρονικά περιθώρια ανά κίνηση. απευθείας αξιολόγηση σε ενδιάµεσους κόµβους

Ε ανάληψη. Προβλήµατα ικανο οίησης εριορισµών. ορισµός και χαρακτηριστικά Ε ίλυση ροβληµάτων ικανο οίησης εριορισµών

ΠΛΗ 405 Τεχνητή Νοηµοσύνη Ε ανάληψη. Προβλήµατα ικανο οίησης εριορισµών ορισµός και χαρακτηριστικά

Θεωρία Λήψης Αποφάσεων

Τεχνητή Νοημοσύνη. 6η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

Αναζήτηση με Αντιπαλότητα

Επίλυση Προβλημάτων 1

Ε ανάληψη. Ορισµοί της Τεχνητής Νοηµοσύνης (ΤΝ) Καταβολές. Ιστορική αναδροµή. Πράκτορες. Περιβάλλοντα. κριτήρια νοηµοσύνης

ΠΛΗ 405 Τεχνητή Νοηµοσύνη

ΑΣΚΗΣΕΙΣ ΓΙΑ ΤΟ ΕΡΓΑΣΤΗΡΙΟ 3

Συστηματική Αναζήτηση και Ενισχυτική Μάθηση για το Επιτραπέζιο Παιχνίδι Backgammon

Επίλυση προβληµάτων. Περιγραφή προβληµάτων Αλγόριθµοι αναζήτησης Αλγόριθµοι τυφλής αναζήτησης Αλγόριθµοι ευρετικής αναζήτησης

Τεχνητή Νοημοσύνη (ΥΠ23) 6 ο εξάμηνο Τμήμα Πληροφορικής και Τηλεματικής Χαροκόπειο Πανεπιστήμιο Ουρανία Χατζή

ΠΛΗ 405 Τεχνητή Νοηµοσύνη

Κεφάλαιο 5. Αλγόριθµοι Αναζήτησης σε Παίγνια ύο Αντιπάλων. Τεχνητή Νοηµοσύνη - Β' Έκδοση

ΠΛΗ 405 Τεχνητή Νοηµοσύνη

ΕΚΠ 413 / ΕΚΠ 606 Αυτόνοµοι (Ροµ οτικοί) Πράκτορες

ΠΛΗ 405 Τεχνητή Νοηµοσύνη

ΕΚΠ 413 / ΕΚΠ 606 Αυτόνοµοι (Ροµ οτικοί) Πράκτορες

Ε ανάληψη. Α ληροφόρητη αναζήτηση

Ε ανάληψη. Καταβολές. Ιστορική αναδροµή. Πράκτορες. Περιβάλλοντα. συνεισφορά άλλων επιστηµών στην ΤΝ σήµερα

ΠΛΗ 405 Τεχνητή Νοηµοσύνη Ε ανάληψη. δοµή δεδοµένων για κατασκευή ευρετικών συναρτήσεων Ο αλγόριθµος GraphPlan

Extensive Games with Imperfect Information

ΕΚΠ 413 / ΕΚΠ 606 Αυτόνοµοι (Ροµ οτικοί) Πράκτορες

ΕΚΠ 413 / ΕΚΠ 606 Αυτόνοµοι (Ροµ οτικοί) Πράκτορες

Τεχνητή Νοημοσύνη Ι. Ενότητα 6: Αναζήτηση με Αντιπαλότητα

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΤΕΧΝΗΤΗ ΝΟΗΜΟΣΥΝΗ

ΠΛΗ 405 Τεχνητή Νοηµοσύνη

ΠΛΗ 405 Τεχνητή Νοηµοσύνη

Πληροφοριακά Συστήματα Διοίκησης (ΜΒΑ) Ενότητα 8: Παίγνια πλήρους και ελλιπούς πληροφόρησης

Επίλυση προβληµάτων. Αλγόριθµοι Αναζήτησης

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΤΕΧΝΗΤΗ ΝΟΗΜΟΣΥΝΗ. Τελικές εξετάσεις Παρασκευή 4 Ιουλίου 2014, 18:00-21:00

[ΠΛΗ 417] Τεχνητή Νοημοσύνη. Project Εξαμήνου ΠΟΛΥΤΕΧΝΕΙΟ ΚΡΗΤΗΣ

ΕΚΠ 413 / ΕΚΠ 606 Αυτόνοµοι (Ροµ οτικοί) Πράκτορες

Αλγόριθμοι Αναζήτησης σε Παίγνια Δύο Αντιπάλων

ΠΛΗ 405 Τεχνητή Νοηµοσύνη

ΕΚΠ 413 / ΕΚΠ 606 Αυτόνοµοι (Ροµ οτικοί) Πράκτορες

Στοχαστικές Στρατηγικές

Ασκήσεις μελέτης της 6 ης διάλεξης

ΑΥΤΟΝΟΜΟΙ ΠΡΑΚΤΟΡΕΣ. ΑΝΑΦΟΡΑ ΕΡΓΑΣΙΑΣ Othello-TD Learning. Βόλτσης Βαγγέλης Α.Μ

Συστήματα Υποστήριξης Αποφάσεων Διάλεξη Νο2 και 3. Ενισχυτικές διαφάνειες

Κεφάλαιο 29 Θεωρία παιγνίων

Branch and Bound. Branch and Bound

ΕΚΠ 413 / ΕΚΠ 606 Αυτόνοµοι (Ροµ οτικοί) Πράκτορες

ΕΠΙΧΕΙΡΗΣΙΑΚΑ ΠΑΙΓΝΙΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ ΠΕΜΠΤΟ ΥΝΑΜΙΚΑ ΠΑΙΓΝΙΑ ΠΛΗΡΟΥΣ ΠΛΗΡΟΦΟΡΗΣΗΣ ΑΚΑ ΗΜΑΙΚΟ ΕΤΟΣ

ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ

Μοντελοποίηση προβληµάτων

Κεφ. 9 Ανάλυση αποφάσεων

ΠΤΥΧΙΑΚΗ/ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ

Α) Κριτήριο Προσδοκώμενης Χρηματικής Αξίας Expected Monetary Value (EMV)

Αλγόριθµοι Ευριστικής Αναζήτησης

ΕΚΠ 413 / ΕΚΠ 606 Αυτόνοµοι (Ροµ οτικοί) Πράκτορες

Ασκήσεις. Ιωάννα Καντζάβελου. Τµήµα Μηχανικών Πληροφορικής και Υπολογιστών 1

ΑΛΓΟΡΙΘΜΟΙ. Ενότητα 12: Αντιμετώπιση Περιορισμών Αλγοριθμικής Ισχύος

Δέντρα Απόφασης (Decision(

Ασκήσεις στις κατανομές και ειδικά στην διωνυμική κατανομή και κανονική κατανομή

66 Κάρτες. 1 εξάπλευρο ζάρι 1 εγχειρίδιο κανόνων. φύλλα κίνησης μαθητευόμενων. το ταμπλό. 16 δείκτες θορύβου / εξαφάνισης. δείκτες σύλληψης & γύρου

Θεωρία Παιγνίων Δρ. Τασσόπουλος Ιωάννης

ΕΛΛΗΝΙΚΟ ΑΝΟΙΚΤΟ ΠΑΝΕΠΙΣΤΗΜΙΟ

ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΙ ΜΕΤΑΒΛΗΤΩΝ

Σηματοδοτικά Παίγνια και Τέλεια Μπεϊζιανή Ισορροπία

ΚΕΦΑΛΑΙΟ Μηχανική Μάθηση

Τσάπελη Φανή ΑΜ: Ενισχυτική Μάθηση για το παιχνίδι dots. Τελική Αναφορά

Ε ανάληψη. Παιχνίδια τύχης. Παιχνίδια ατελούς ληροφόρησης. Λογικοί ράκτορες. ΠΛΗ 405 Τεχνητή Νοηµοσύνη αναζήτηση expectiminimax

ΠΑΙΓΝΙΑ Παιχνίδια Γενική Θεώρηση μεγιστοποιήσει την πιθανότητά

Αλγόριθµοι Ευριστικής Αναζήτησης

Βιβλιογραφικές και ιστορικές σηµειώσεις Ασκήσεις Προβλήµατα Ικανοποίησης Περιορισµών

Επίλυση Προβλημάτων 1

Λήψη αποφάσεων υπό αβεβαιότητα. Παίγνια Αποφάσεων 9 ο Εξάμηνο

Επίλυση προβλημάτων με αναζήτηση

Λήψη αποφάσεων υπό αβεβαιότητα

Αναζήτηση σε Γράφους. Μανόλης Κουμπαράκης. ΥΣ02 Τεχνητή Νοημοσύνη 1

ΕΠΙΧΕΙΡΗΣΙΑΚΑ ΠΑΙΓΝΙΑ ΕΡΓΑΣΤΗΡΙΟ ΜΑΘΗΜΑ ΕΥΤΕΡΟ- ΚΥΡΙΑΡΧΟΥΜΕΝΗ ΣΤΡΑΤΗΓΙΚΗ- PRISONER S DILLEMA ΑΚΑ ΗΜΑΙΚΟ ΕΤΟΣ

Κεφάλαιο 2. Περιγραφή Προβληµάτων και Αναζήτηση Λύσης. Τεχνητή Νοηµοσύνη - Β' Έκδοση

Ασκήσεις στην διωνυμική κατανομή

Τεχνητή Νοημοσύνη. 16η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

B 1 A 1 B 2 A 2. t 1. t 3 w. t 2 A 3 B 3. t 4. t 5

Διακριτικές Συναρτήσεις

Ε ανάληψη. Ε αναλαµβανόµενες καταστάσεις. Αναζήτηση µε µερική ληροφόρηση. Πληροφορηµένη αναζήτηση. µέθοδοι αποφυγής

Systematic Search and Reinforcement Learning for the Board Game Turning Points. Diploma Thesis

Ασκήσεις ανακεφαλαίωσης στο μάθημα Τεχνητή Νοημοσύνη

Περιεχόμενα ΕΝΟΤΗΤΑ I. ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΤΕΧΝΗΤΗ ΝΟΗΜΟΣΥΝΗ. Πρόλογος 15

ΒΑΣΙΚΕΣ ΜΕΘΟΔΟΙ ΑΠΑΡΙΘΜΗΣΗΣ

ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ

επιστρέφει το αμέσως μεγαλύτερο από το x στοιχείο του S επιστρέφει το αμέσως μικρότερο από το x στοιχείο του S

Τεχνητή Νοημοσύνη (ΥΠ23) 6 ο εξάμηνο Τμήμα Πληροφορικής και Τηλεματικής Χαροκόπειο Πανεπιστήμιο Ουρανία Χατζή

Σχεδίαση & Ανάλυση Αλγορίθμων

Σέργιος Θεοδωρίδης Κωνσταντίνος Κουτρούμπας. Version 2

ΠΕΡΙΕΧΟΜΕΝΑ ΔΙΟΙΚΗΣΗ ΛΕΙΤΟΥΡΓΙΩΝ. Διοίκηση και Προγραμματισμός Έργων

Πιθανότητες. Κώστας Γλυκός ΜΑΘΗΜΑΤΙΚΟΣ. Γενικής κεφάλαιο 3 94 ασκήσεις. Kglykos.gr. εκδόσεις. Καλό πήξιμο. Ι δ ι α ί τ ε ρ α μ α θ ή μ α τ α

Μεγίστου Σφάλµατος. Παναγιώτης Καρράς. Αθήνα, 26 Αυγούστου 2005

ΕΝΟΤΗΤΑ 6 ΛΙΣΤΕΣ ΠΑΡΑΛΕΙΨΗΣ (SKIP LISTS)

Αυτόνομοι Πράκτορες. Εργασία εξαμήνου. Μάθηση του παιχνιδιού British square με χρήση Temporal Difference(TD) Κωνσταντάκης Γιώργος

ΕΦΑΡΜΟΣΜΕΝΗ ΣΤΑΤΙΣΤΙΚΗ I Παντελής Δημήτριος Τμήμα Μηχανολόγων Μηχανικών

Λήψη αποφάσεων υπό αβεβαιότητα

ΠΑΙΧΝΙΔΙ PACMAN 3D ΜΕ ΜΕΘΟΔΟΥΣ ΕΝΙΣΧΗΤΙΚΗΣ ΜΑΘΗΣΗΣ

ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ ΠΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ ΠΕΡΙΒΑΛΛΟΝ ΕΠΑΝΑΛΗΠΤΙΚΟ ΔΙΑΓΩΝΙΣΜΑ ΣΧΟΛΙΚΟΥ ΕΤΟΥΣ

ΠΛΗ 405 Τεχνητή Νοηµοσύνη

Πληροφοριακά Συστήματα Διοίκησης (ΜΒΑ) Ενότητα 7: Εισαγωγή στη Θεωρία Αποφάσεων Δέντρα Αποφάσεων

Μελετάμε την περίπτωση όπου αποθηκεύουμε ένα (δυναμικό) σύνολο στοιχειών. Ένα στοιχείο γράφεται ως, όπου κάθε.

Transcript:

ΠΛΗ 405 Τεχνητή Νοηµοσύνη Παιχνίδια Τύχης Παιχνίδια Ατελούς Πληροφόρησης Τµήµα Ηλεκτρονικών Μηχανικών και Μηχανικών Υ ολογιστών Πολυτεχνείο Κρήτης

Παιχνίδια παιχνίδια ως αναζήτηση Βέλτιστες στρατηγικές στρατηγική minimax Βελτιώσεις κλάδεµα α-β Ατελείς α οφάσεις περιορισµοί χρόνου συναρτήσεις αξιολόγησης έλεγχος αποκοπής πρώιµο κλάδεµα Ε ανάληψη Μ. Γ. Λαγουδάκης Τµήµα ΗΜΜΥ Πολυτεχνείο Κρήτης Σελίδα 2

Σήµερα Παιχνίδια τύχης αναζήτηση expectiminimax Παιχνίδια ατελούς ληροφόρησης εξέταση διαθέσιµης πληροφορίας Μ. Γ. Λαγουδάκης Τµήµα ΗΜΜΥ Πολυτεχνείο Κρήτης Σελίδα 3

Παιχνίδια Τύχης Chance Games

Παιχνίδια Τύχης (Chance Games) Παιχνίδια τύχης παιχνίδια µε στοιχείο τύχης Στοιχείο τύχης απρόβλεπτα ενδεχόµενα καθορίζει νόµιµες κινήσεις ζάρια, κέρµα, νέα κάρτα,... Α όδοση ικανότητα και τύχη Παράδειγµα: Τάβλι ζαριά νόµιµες κινήσεις Μ. Γ. Λαγουδάκης Τµήµα ΗΜΜΥ Πολυτεχνείο Κρήτης Σελίδα 5

Κόµβοι Τύχης (Chance Nodes) Κόµβοι τύχης σηµεία τυχαιότητας στο δένδρο απόγονοι: πιθανά συµβάντα βάρος: πιθανότητα συµβάντος τρίτος «παίκτης» Υ ολογισµός αναµενόµενη τιµή Τάβλι 36 ζαριές, 21 διακριτές Ρ(διπλή)=1/36, Ρ(απλή)=1/18 3 Μ. Γ. Λαγουδάκης Τµήµα ΗΜΜΥ Πολυτεχνείο Κρήτης Σελίδα 6

ένδρο Αναζήτησης µε Κόµβους Τύχης Μ. Γ. Λαγουδάκης Τµήµα ΗΜΜΥ Πολυτεχνείο Κρήτης Σελίδα 7

Βέλτιστη Στρατηγική ExpectiMinimax Περι τωσιακή στρατηγική για κάθε δυνατή κίνηση του αντιπάλου, για κάθε πιθανό ενδεχόµενο ExpectiMinimax EXP-MINIMAX-VALUE(n)= UTILITY(n) max s successors(n) EXP-MINIMAX-VALUE(s) min s successors(n) EXP-MINIMAX-VALUE(s) If n is a terminal If n is a max node If n is a max node s successors(n) P(s) EXP-MINIMAX-VALUE(s) If n is a chance node Παραδοχές ο αντίπαλος είναι αλάνθαστος, παίζει πάντα τη βέλτιστη κίνηση η πιθανότητα κάθε τυχαίου συµβάντος είναι γνωστή Μ. Γ. Λαγουδάκης Τµήµα ΗΜΜΥ Πολυτεχνείο Κρήτης Σελίδα 8

Συναρτήσεις Αξιολόγησης παρεκλίσεις από πραγµατικές τιµές πιθανόν να αποβούν µοιραίες διατήρηση: θετικός γραµµικός µετασχηµατισµός της πιθανότητας νίκης Μ. Γ. Λαγουδάκης Τµήµα ΗΜΜΥ Πολυτεχνείο Κρήτης Σελίδα 9

Χαρακτηριστικά Αλγορίθµου ExpectiMinimax Πολυ λοκότητα b νόµιµες κινήσες, n τυχαία ενδεχόµενα, m στρώσεις χρονική πολυπλοκότητα: O( (bn) m ) τάβλι: b 20, n = 21 bn 420 αναζήτηση µέχρι m 3 Κλάδεµα α-β δεν µπορεί να κλαδέψει κόµβους τύχης η τυχαιότητα «σπάει» πιθανές ακολουθίες κινήσεων πολύ περιορισµένη βελτίωση Κλάδεµα α-β για ExpectiMinimax άνω ή κάτω φράγµα για την τιµή κόµβου τύχης προϋπόθεση: φράγµατα για τις τιµές των τερµατικών κόµβων Μ. Γ. Λαγουδάκης Τµήµα ΗΜΜΥ Πολυτεχνείο Κρήτης Σελίδα 10

Παιχνίδια Ατελούς Πληροφόρησης Games with Incomplete Information

Παιχνίδια Ατελούς Πληροφόρησης Ατελής ληροφόρηση ατελής γνώση της κατάστασης και των κινήσεων του αντιπάλου παραδείγµατα: χαρτοπαίγνια, ναυµαχία, stratego, scrabble,... Μέση τιµή α ό εικασίες (averaging over clairvoyancy) υπολογισµός τιµής για όλες τις πιθανές πλήρεις καταστάσεις υπολογισµός αναµενόµενης τιµής µε αντίστοιχες πιθανότητες Πρόβληµα λανθασµένη θεώρηση: η πλήρης κατάσταση θα γίνει γνωστή, δηλαδή η µελλοντική αβεβαιότητα θα επιλυθεί όταν χρειαστεί! Παράδειγµα: πόρτα Α: 100, πόρτα Β: 1.000.000 ή πηγάδι Μ. Γ. Λαγουδάκης Τµήµα ΗΜΜΥ Πολυτεχνείο Κρήτης Σελίδα 12

Στρατηγική υ ό Ατελή Πληροφόρηση Πληροφορία εξέταση της διαθέσιµης ληροφορίας σε κάθε σηµείο του παιχνιδιού αναζήτηση στο χώρο των πεποιθήσεων ή καταστάσεων πληροφορίας Στόχοι εξασφάλιση περισσότερης πληροφορίας για τον παίκτη αποκάλυψη λιγότερης πληροφορίας στον αντίπαλο Ορθολογιστική συµ εριφορά ενέργειες που αποσκοπούν στη συλλογή πληροφοριών ενέργειες που αποσκοπούν στη µετάδοση πληροφοριών ενέργειες που αποσκοπούν στη σύγχυση πληροφοριών Μ. Γ. Λαγουδάκης Τµήµα ΗΜΜΥ Πολυτεχνείο Κρήτης Σελίδα 13

Σύνοψη Παιχνίδια προκλητικά, διασκεδαστικά, αλλά και επικίνδυνα! ιδάγµατα η τελειότητα είναι ουτοπία, «επιτυγχάνεται» µόνο προσεγγιστικά η αβεβαιότητα παρεµποδίζει την ακριβή αξιολόγηση καταστάσεων αξίζει να σκέφτεται κανείς για τι πρέπει να σκέφτεται (µετα-σκέψη) βέλτιστες αποφάσεις εξαρτώνται από την κατάσταση πληροφορίας Παιχνίδια και Τεχνητή Νοηµοσύνη τα παιχνίδια για την ΤΝ είναι ό,τι το grand prix για τα αυτοκίνητα Μ. Γ. Λαγουδάκης Τµήµα ΗΜΜΥ Πολυτεχνείο Κρήτης Σελίδα 14

Μελέτη Σύγγραµµα Ενότητες 6.5 6.6 Μ. Γ. Λαγουδάκης Τµήµα ΗΜΜΥ Πολυτεχνείο Κρήτης Σελίδα 15