ΠΛΗ 405 Τεχνητή Νοηµοσύνη Παιχνίδια Τύχης Λογικοί Πράκτορες Τµήµα Ηλεκτρονικών Μηχανικών και Μηχανικών Υ ολογιστών Πολυτεχνείο Κρήτης
Ε ανάληψη Περιορισµοί χρόνου πεπερασµένα χρονικά περιθώρια ανά κίνηση Συναρτήσεις αξιολόγησης απευθείας αξιολόγηση σε ενδιάµεσους κόµβους Έλεγχος α οκο ής απόφαση τερµατισµού εκβάθυνσης Μ. Γ. Λαγουδάκης Πρώιµο κλάδεµα Τµήµα ΗΜΜΥ Πολυτεχνείο Κρήτης Σελίδα 2 κλάδεµα επιλεγµένων κινήσεων
Σήµερα Παιχνίδια τύχης αναζήτηση expectiminimax Παιχνίδια ατελούς ληροφόρησης εξέταση διαθέσιµης πληροφορίας Λογικοί ράκτορες πράκτορες βασισµένοι στη λογική Μ. Γ. Λαγουδάκης Τµήµα ΗΜΜΥ Πολυτεχνείο Κρήτης Σελίδα 3
Παιχνίδια Τύχης Chance Games
Παιχνίδια Τύχης (Chance Games) Παιχνίδια τύχης παιχνίδια µε στοιχείο τύχης Στοιχείο τύχης απρόβλεπτα ενδεχόµενα καθορίζει νόµιµες κινήσεις ζάρια, κέρµα, νέα κάρτα,... Μ. Α όδοση Γ. Λαγουδάκης Τµήµα ΗΜΜΥ Πολυτεχνείο Κρήτης Σελίδα 5 ικανότητα και τύχη Παράδειγµα: Τάβλι ζαριά νόµιµες κινήσεις
3 Κόµβοι τύχης σηµεία τυχαιότητας στο δένδρο απόγονοι: πιθανά συµβάντα βάρος: πιθανότητα συµβάντος τρίτος «παίκτης» Υ ολογισµός Μ. Γ. Λαγουδάκης αναµενόµενη τιµή Τµήµα ΗΜΜΥ Πολυτεχνείο Κρήτης Σελίδα 6 Τάβλι 36 ζαριές, 21 διακριτές Ρ(διπλή)=1/36, Ρ(απλή)=1/18 Κόµβοι Τύχης (Chance Nodes)
ένδρο Αναζήτησης µε Κόµβους Τύχης Μ. Γ. Λαγουδάκης Τµήµα ΗΜΜΥ Πολυτεχνείο Κρήτης Σελίδα 7
EXP-MINIMAX-VALUE(n)= UTILITY(n) maxs successors(n)exp-minimax-value(s) mins successors(n)exp-minimax-value(s) s successors(n)p(s) EXP-MINIMAX-VALUE(s) If nis a chance terminal max node node Μ. Γ. Λαγουδάκης Τµήµα ΗΜΜΥ Πολυτεχνείο Κρήτης Σελίδα 8 Βέλτιστη Στρατηγική ExpectiMinimax Περι τωσιακή στρατηγική για κάθε δυνατή κίνηση του αντιπάλου, για κάθε πιθανό ενδεχόµενο ExpectiMinimax Παραδοχές ο αντίπαλος είναι αλάνθαστος, παίζει πάντα τη βέλτιστη κίνηση η πιθανότητα κάθε τυχαίου συµβάντος είναι γνωστή
Συναρτήσεις Αξιολόγησης Μ. Γ. Λαγουδάκης Τµήµα ΗΜΜΥ Πολυτεχνείο Κρήτης Σελίδα 9 παρεκλίσεις από πραγµατικές τιµές πιθανόν να αποβούν µοιραίες διατήρηση: θετικός γραµµικός µετασχηµατισµός πιθανότητας νίκης
O( (bn)m) Πολυ λοκότητα b νόµιµες κινήσες, n τυχαία ενδεχόµενα, m στρώσεις χρονική πολυπλοκότητα: τάβλι: b 20, n = 21 bn 420 αναζήτηση µέχρι m 3 Χαρακτηριστικά Αλγορίθµου ExpectiMinimax Κλάδεµα α-β δεν µπορεί να κλαδέψει κόµβους τύχης Μ. Γ. Λαγουδάκης η τυχαιότητα Τµήµα «σπάει» ΗΜΜΥ πιθανές Πολυτεχνείο ακολουθίες κινήσεων Κρήτης Σελίδα 10 πολύ περιορισµένη βελτίωση Κλάδεµα α-β για ExpectiMinimax άνω ή κάτω φράγµα για την τιµή κόµβου τύχης προϋπόθεση: φράγµατα για τις τιµές των τερµατικών κόµβων
Παιχνίδια Ατελούς Πληροφόρησης Games with Incomplete Information
Παιχνίδια Ατελούς Πληροφόρησης Ατελής ληροφόρηση ατελής γνώση της κατάστασης και των κινήσεων του αντιπάλου παραδείγµατα: χαρτοπαίγνια, ναυµαχία, stratego, scrabble,... Μέση τιµή α ό εικασίες (averaging over clairvoyancy) υπολογισµός τιµής για όλες τις πιθανές πλήρεις καταστάσεις υπολογισµός αναµενόµενης τιµής µε αντίστοιχες πιθανότητες Μ. Γ. Λαγουδάκης Πρόβληµα Τµήµα ΗΜΜΥ Πολυτεχνείο Κρήτης Σελίδα 12 λανθασµένη θεώρηση: η πλήρης κατάσταση θα γίνει γνωστή, δηλαδή η µελλοντική αβεβαιότητα θα επιλυθεί όταν χρειαστεί! Παράδειγµα: πόρτα Α: 100, πόρτα Β: 1.000.000 ή πηγάδι
Στρατηγική υ ό Ατελή Πληροφόρηση Πληροφορία εξέταση της διαθέσιµης ληροφορίας σε κάθε σηµείο του παιχνιδιού αναζήτηση στο χώρο των πεποιθήσεων ή καταστάσεων πληροφορίας Στόχοι εξασφάλιση περισσότερης πληροφορίας για τον παίκτη αποκάλυψη λιγότερης πληροφορίας στον αντίπαλο Μ. Γ. Ορθολογιστική Λαγουδάκης Τµήµα συµ εριφορά ΗΜΜΥ Πολυτεχνείο Κρήτης Σελίδα 13 ενέργειες που αποσκοπούν στη συλλογή πληροφοριών ενέργειες που αποσκοπούν στη µετάδοση πληροφοριών ενέργειες που αποσκοπούν στη σύγχυση πληροφοριών
Σύνοψη Παιχνίδια προκλητικά, διασκεδαστικά, αλλά και επικίνδυνα! ιδάγµατα η τελειότητα είναι ουτοπία, «επιτυγχάνεται» µόνο προσεγγιστικά η αβεβαιότητα παρεµποδίζει την ακριβή αξιολόγηση καταστάσεων αξίζει να σκέφτεται κανείς για τι πρέπει να σκέφτεται (µετα-σκέψη) Μ. Γ. Λαγουδάκης βέλτιστες αποφάσεις Τµήµα ΗΜΜΥ εξαρτώνται Πολυτεχνείο από την κατάσταση Κρήτης πληροφορίας Σελίδα 14 Παιχνίδια και Τεχνητή Νοηµοσύνη τα παιχνίδια για την ΤΝ είναι ό,τι το grand prix για τα αυτοκίνητα
Λογικοί ράκτορες Logical Agents
Πράκτορες Βασισµένοι στη Γνώση (Knowledge-Based Agents) Λογικοί ράκτορες αναπαράσταση γνώσης (knowledge representation) διαδικασίες συµπερασµού (inference procedures) βασικό όχηµα: λογική (logic) Πλεονεκτήµατα αναπαράσταση γενικής χρήσης ευελιξία, προσαρµογή Μ. Γ. Λαγουδάκης συνδυασµός Τµήµα πληροφοριών ΗΜΜΥ Πολυτεχνείο «ανακάλυψη» Κρήτης νέας γνώσης Σελίδα 16 συνδυασµός γνώσης και αντίληψης αποκάλυψη κατάστασης Μειονεκτήµατα οριστική (definite) γνώση, έλλειψη χειρισµού αβεβαιότητας
Βάση Γνώσης (Knowledge Base) Βάση γνώσης ένα σύνολο προτάσεων (sentences) αρχικοποίηση: γνωστικό υπόβαθρο (background knowledge) Πρόταση ισχυρισµός για τον κόσµο του πράκτορα γλώσσα αναπαράστασης: τυπική γλώσσα Μ. Γ. Λαγουδάκης Βασικές διεργασίες Τµήµα ΗΜΜΥ Πολυτεχνείο Κρήτης Σελίδα 17 Tell: ενηµέρωση της βάσης γνώσης Ask: εξαγωγή συµπερασµάτων από βάση γνώσης
Α λός Λογικός Πράκτορας Μ. Γ. Λαγουδάκης στόχοι, σε αντίθεση µεταβολές Τµήµα τη διαδικαστική ηλωτική (declarative) ΗΜΜΥ καταστάσεων, ροσέγγιση Πολυτεχνείο (procedural) αµετάβλητοι Κρήτης προσέγγιση ισχυρισµοί,... Σελίδα 18 ο πράκτορας αποφασίζει πώς πρέπει να ενεργήσει δίνουµε στον πράκτορα την απαραίτητη γνώση για τον κόσµο
+1000 1000 ΠΛΗ 405 Τεχνητή Νοηµοσύνη 2006 για wumpus, χρυσόγούβα Ο Κόσµος του Wumpus Μέτρο πλέγµα για για κάθε χρήση βήµα βέλους α όδοσης µετακίνηση στροφή 4x4, P(γούβα)=0.2 αρπαγή Περιβάλλον εξακόντιση +90οή εµπρός 90ο Ε ενεργητές Μ. Γ. Λαγουδάκης [δυσοσµία, χρυσού αύρα, βέλους Τµήµα λάµψη, γδούπος, ΗΜΜΥ κραυγή] Πολυτεχνείο Κρήτης Σελίδα 19 Αισθητήρες
Παράδειγµα Μ. Γ. Λαγουδάκης Τµήµα ΗΜΜΥ Πολυτεχνείο Κρήτης Σελίδα 20
Παράδειγµα Μ. Γ. Λαγουδάκης Τµήµα ΗΜΜΥ Πολυτεχνείο Κρήτης Σελίδα 21
Μελέτη Σύγγραµµα Ενότητες 6.5, 7.1, 7.2 Μ. Γ. Λαγουδάκης Τµήµα ΗΜΜΥ Πολυτεχνείο Κρήτης Σελίδα 22