Ε ανάληψη. Παιχνίδια παιχνίδια ως αναζήτηση. Βέλτιστες στρατηγικές στρατηγική minimax. Βελτιώσεις κλάδεµα α-β

ΠΛΗ 405 Τεχνητή Νοηµοσύνη Παιχνίδια Τύχης Παιχνίδια Ατελούς Πληροφόρησης Τµήµα Ηλεκτρονικών Μηχανικών και Μηχανικών Υ ολογιστών Πολυτεχνείο Κρήτης

Παιχνίδια παιχνίδια ως αναζήτηση Βέλτιστες στρατηγικές στρατηγική minimax Βελτιώσεις κλάδεµα α-β Ατελείς α οφάσεις περιορισµοί χρόνου συναρτήσεις αξιολόγησης έλεγχος αποκοπής πρώιµο κλάδεµα Ε ανάληψη Μ. Γ. Λαγουδάκης Τµήµα ΗΜΜΥ Πολυτεχνείο Κρήτης Σελίδα 2

Σήµερα Παιχνίδια τύχης αναζήτηση expectiminimax Παιχνίδια ατελούς ληροφόρησης εξέταση διαθέσιµης πληροφορίας Μ. Γ. Λαγουδάκης Τµήµα ΗΜΜΥ Πολυτεχνείο Κρήτης Σελίδα 3

Παιχνίδια Τύχης Chance Games

Παιχνίδια Τύχης (Chance Games) Παιχνίδια τύχης παιχνίδια µε στοιχείο τύχης Στοιχείο τύχης απρόβλεπτα ενδεχόµενα καθορίζει νόµιµες κινήσεις ζάρια, κέρµα, νέα κάρτα,... Α όδοση ικανότητα και τύχη Παράδειγµα: Τάβλι ζαριά νόµιµες κινήσεις Μ. Γ. Λαγουδάκης Τµήµα ΗΜΜΥ Πολυτεχνείο Κρήτης Σελίδα 5

Κόµβοι Τύχης (Chance Nodes) Κόµβοι τύχης σηµεία τυχαιότητας στο δένδρο απόγονοι: πιθανά συµβάντα βάρος: πιθανότητα συµβάντος τρίτος «παίκτης» Υ ολογισµός αναµενόµενη τιµή Τάβλι 36 ζαριές, 21 διακριτές Ρ(διπλή)=1/36, Ρ(απλή)=1/18 3 Μ. Γ. Λαγουδάκης Τµήµα ΗΜΜΥ Πολυτεχνείο Κρήτης Σελίδα 6

ένδρο Αναζήτησης µε Κόµβους Τύχης Μ. Γ. Λαγουδάκης Τµήµα ΗΜΜΥ Πολυτεχνείο Κρήτης Σελίδα 7

Βέλτιστη Στρατηγική ExpectiMinimax Περι τωσιακή στρατηγική για κάθε δυνατή κίνηση του αντιπάλου, για κάθε πιθανό ενδεχόµενο ExpectiMinimax EXP-MINIMAX-VALUE(n)= UTILITY(n) max s successors(n) EXP-MINIMAX-VALUE(s) min s successors(n) EXP-MINIMAX-VALUE(s) If n is a terminal If n is a max node If n is a max node s successors(n) P(s) EXP-MINIMAX-VALUE(s) If n is a chance node Παραδοχές ο αντίπαλος είναι αλάνθαστος, παίζει πάντα τη βέλτιστη κίνηση η πιθανότητα κάθε τυχαίου συµβάντος είναι γνωστή Μ. Γ. Λαγουδάκης Τµήµα ΗΜΜΥ Πολυτεχνείο Κρήτης Σελίδα 8

Συναρτήσεις Αξιολόγησης παρεκλίσεις από πραγµατικές τιµές πιθανόν να αποβούν µοιραίες διατήρηση: θετικός γραµµικός µετασχηµατισµός της πιθανότητας νίκης Μ. Γ. Λαγουδάκης Τµήµα ΗΜΜΥ Πολυτεχνείο Κρήτης Σελίδα 9

Χαρακτηριστικά Αλγορίθµου ExpectiMinimax Πολυ λοκότητα b νόµιµες κινήσες, n τυχαία ενδεχόµενα, m στρώσεις χρονική πολυπλοκότητα: O( (bn) m ) τάβλι: b 20, n = 21 bn 420 αναζήτηση µέχρι m 3 Κλάδεµα α-β δεν µπορεί να κλαδέψει κόµβους τύχης η τυχαιότητα «σπάει» πιθανές ακολουθίες κινήσεων πολύ περιορισµένη βελτίωση Κλάδεµα α-β για ExpectiMinimax άνω ή κάτω φράγµα για την τιµή κόµβου τύχης προϋπόθεση: φράγµατα για τις τιµές των τερµατικών κόµβων Μ. Γ. Λαγουδάκης Τµήµα ΗΜΜΥ Πολυτεχνείο Κρήτης Σελίδα 10

Παιχνίδια Ατελούς Πληροφόρησης Games with Incomplete Information

Παιχνίδια Ατελούς Πληροφόρησης Ατελής ληροφόρηση ατελής γνώση της κατάστασης και των κινήσεων του αντιπάλου παραδείγµατα: χαρτοπαίγνια, ναυµαχία, stratego, scrabble,... Μέση τιµή α ό εικασίες (averaging over clairvoyancy) υπολογισµός τιµής για όλες τις πιθανές πλήρεις καταστάσεις υπολογισµός αναµενόµενης τιµής µε αντίστοιχες πιθανότητες Πρόβληµα λανθασµένη θεώρηση: η πλήρης κατάσταση θα γίνει γνωστή, δηλαδή η µελλοντική αβεβαιότητα θα επιλυθεί όταν χρειαστεί! Παράδειγµα: πόρτα Α: 100, πόρτα Β: 1.000.000 ή πηγάδι Μ. Γ. Λαγουδάκης Τµήµα ΗΜΜΥ Πολυτεχνείο Κρήτης Σελίδα 12

Στρατηγική υ ό Ατελή Πληροφόρηση Πληροφορία εξέταση της διαθέσιµης ληροφορίας σε κάθε σηµείο του παιχνιδιού αναζήτηση στο χώρο των πεποιθήσεων ή καταστάσεων πληροφορίας Στόχοι εξασφάλιση περισσότερης πληροφορίας για τον παίκτη αποκάλυψη λιγότερης πληροφορίας στον αντίπαλο Ορθολογιστική συµ εριφορά ενέργειες που αποσκοπούν στη συλλογή πληροφοριών ενέργειες που αποσκοπούν στη µετάδοση πληροφοριών ενέργειες που αποσκοπούν στη σύγχυση πληροφοριών Μ. Γ. Λαγουδάκης Τµήµα ΗΜΜΥ Πολυτεχνείο Κρήτης Σελίδα 13

Σύνοψη Παιχνίδια προκλητικά, διασκεδαστικά, αλλά και επικίνδυνα! ιδάγµατα η τελειότητα είναι ουτοπία, «επιτυγχάνεται» µόνο προσεγγιστικά η αβεβαιότητα παρεµποδίζει την ακριβή αξιολόγηση καταστάσεων αξίζει να σκέφτεται κανείς για τι πρέπει να σκέφτεται (µετα-σκέψη) βέλτιστες αποφάσεις εξαρτώνται από την κατάσταση πληροφορίας Παιχνίδια και Τεχνητή Νοηµοσύνη τα παιχνίδια για την ΤΝ είναι ό,τι το grand prix για τα αυτοκίνητα Μ. Γ. Λαγουδάκης Τµήµα ΗΜΜΥ Πολυτεχνείο Κρήτης Σελίδα 14

Μελέτη Σύγγραµµα Ενότητες 6.5 6.6 Μ. Γ. Λαγουδάκης Τµήµα ΗΜΜΥ Πολυτεχνείο Κρήτης Σελίδα 15