Ευφυείς Πράκτορες
Περίγραµµα Πράκτορες και περιβάλλοντα Λογική PEAS (Performance measure, Environment, Actuators, Sensors) Τύποι περιβάλλοντος Τύποι πρακτόρων
Πράκτορες Ένας πράκτορας είναι µια οντότητα που αντιλαµβάνεται το περιβάλλον µέσω αισθητήρων και δρα στο περιβάλλον µε τους µηχανισµούς δράσης Άνθρωπος: µάτια, αυτιά και άλλα όργανα ως αισθητήρες χέρια, πόδια, στόµα και άλλα µέλη του σώµατος ως µηχανισµοί δράσης Ροµπότ: κάµερες και υπέρυθρες ακτίνες ως αισθητήρες διάφορα µοτέρ ως µηχανισµοί δράσης
Πράκτορες και περιβάλλοντα Η συνάρτηση του πράκτορα αντιστοιχεί τα όσα γίνονται αντιληπτά σε ενέργειες: [f: P* A] Το πρόγραµµα του πράκτορα τρέχει για την υλοποίηση της f πράκτορας = αρχιτεκτονική + πρόγραµµα
Ηλεκτρική σκούπα Αντίληψη: αίσθηση του χώρου και περιεχόµενα, π.χ., [A,Βρώµικος] Ενέργειες: Αριστερά, εξιά, Απορρόφηση σκόνης, Καµία ενέργεια
Λογικοί πράκτορες Ένας πράκτορας αγωνίζεται να «κάνει το σωστό» βάσει των όσων µπορεί να αντιληφθεί και τις ενέργειες που µπορεί να κάνει Η σωστή ενέργεια είναι αυτή που θα κάνει τον πράκτορα επιτυχηµένο Μέτρο απόδοσης: Αντικειµενικό κριτήριο για την επιτυχία της συµπεριφοράς του πράκτορα Π.χ. µέτρο απόδοσης της ηλεκτρικής σκούπας µπορεί να είναι η ποσότητα της σκόνης που καθαρίστηκε, ο απαιτούµενος χρόνος καθαρισµού, ποσότητα ηλεκτρικής ενέργειας που καταναλώθηκε, θόρυβος, κλπ.
Λογικοί πράκτορες Λογικός πράκτορας: Για κάθε πιθανή ακολουθία των όσων αντιλαµβάνεται πρέπει να επιλέξει µια ενέργεια που αναµένεται ότι θα µεγιστοποιήσει το µέτρο απόδοσής του βάσει της γνώσης που διαθέτει.
Λογικοί πράκτορες ιάκριση από παντογνωσία (άπειρη γνώση) Πραγµατοποίηση ενεργειών για την τροποποίηση των όσων θα αντιληφθούν στο µέλλον µε στόχο την απόκτηση χρήσιµων πληροφοριών (συλλογή πληροφοριών, εξερεύνηση) Αυτονοµία αν η συµπεριφορά καθορίζεται από τη δική τους εµπειρία (µε ικανότητα µάθησης και προσαρµογής)
PEAS PEAS: Performance measure, Environment, Actuators, Sensors Στο στάδιο σχεδιασµού του πράκτορα πρέπει να καθοριστούν οι συγκεκριµένες παράµετροι Π.χ. σχεδιασµός ενός αυτόµατου οδηγού ταξί: Μέτρο απόδοσης: ασφάλεια, ταχύτητα, ΚΟΚ, άνετο ταξίδι, µεγιστοποίηση κερδών Περιβάλλον: ρόµοι, κυκλοφορία, πεζοί, επιβάτες Μηχανισµοί δράσης: τιµόνι, γκάζι, φρένο, φλας, κόρνα Αισθητήρες: Κάµερες, αισθητήρας ήχου, µετρητής ταχύτητας, GPS, αισθητήρες µηχανής, πληκτρολόγιο
PEAS Πράκτορας: Ιατρικό διαγνωστικό σύστηµα Μέτρο απόδοσης: Υγιής ασθενής, ελαχιστοποίηση κόστους, µηνύσεις Περιβάλλον: Ασθενής, νοσοκοµείο, προσωπικό Μηχανισµοί δράσης: Οθόνη (ερωτήσεις, εξετάσεις, διαγνώσεις, θεραπείες, αναφορές) Αισθητήρες: Πληκτρολόγιο (εισαγωγή συµπτωµάτων, ευρηµάτων, απαντήσεων ασθενή)
PEAS Πράκτορας: Εκπαιδευτής αγγλικών Μέτρο απόδοσης: Μεγιστοποίηση του βαθµού του µαθητή στην εξέταση Περιβάλλον: Το σύνολο των µαθητών Μηχανισµοί δράσης: Οθόνη (ασκήσεις, υποδείξεις, διορθώσεις) Αισθητήρες: Πληκτρολόγιο
Τύποι περιβάλλοντος Πλήρως αισθητό/µερικώς αισθητό: Οι αισθητήρες ενός πράκτορα του δίνουν πρόσβαση στην ολική/µερική κατάσταση του περιβάλλοντος σε κάθε χρονική στιγµή. Ντετερµινιστικό/στοχαστικό: Η επόµενη κατάσταση του περιβάλλοντος προσδιορίζεται πλήρως από την τωρινή κατάσταση και την ενέργεια που εκτελεί ο πράκτορας. Επεισοδιακό/ακολουθιακό: Η εµπειρία του πράκτορα διαιρείται σε ατοµικά «επεισόδια» (σε κάθε επεισόδιο ο πράκτορας αντιλαµβάνεται και δρα) και η επιλογή της ενέργειας σε κάθε επεισόδιο εξαρτάται µόνο από το συγκεκριµένο επεισόδιο.
Τύποι περιβάλλοντος Στατικό/δυναµικό: Το περιβάλλον µένει αµετάβλητο όσο ο πράκτορας «σκέφτεται». (Το περιβάλλον είναι ηµιδυναµικό αν το ίδιο δεν µεταβάλλεται αλλά µεταβάλλεται το µέτρο απόδοσης του πράκτορα) ιακριτό/συνεχές: Περιορισµένος αριθµός διακριτών, ευδιάκριτων αντιλήψεων και ενεργειών Μονοπρακτορικό/πολυπρακτορικό: Ένας πράκτορας που λειτουργεί µόνος του στο περιβάλλον.
Τύποι περιβάλλοντος Σκάκι µε ρολόι Σκάκι χωρίς ρολόι Οδήγηση Ταξί Πλήρως αισθητό Ναι Ναι Όχι Ντετερµινιστικό Στρατηγικό Στρατηγικό Όχι Επεισοδιακό Όχι Όχι Όχι Στατικό Ηµι Ναι Όχι ιακριτό Ναι Ναι Όχι Μονοπρακτορικό Όχι Όχι Όχι Ο τύπος του περιβάλλοντος καθορίζει σε µεγάλο βαθµό τη σχεδίαση του πράκτορα Ο πραγµατικός κόσµος είναι µερικώς αισθητός, στοχαστικός, ακολουθιακός, δυναµικός, συνεχής, πολυπρακτορικός
Συναρτήσεις πράκτορα και προγράµµατα Ένας πράκτορας προσδιορίζεται πλήρως από τη συνάρτηση πράκτορα που αντιστοιχεί της ακολουθίες αντιλήψεων σε ενέργειες Η συνάρτηση πράκτορα είναι λογική Σκοπός: βρες έναν τρόπο για την σαφή υλοποίηση της συνάρτησης πράκτορα
Τύποι πρακτόρων Τέσσερις βασικοί τύποι (σε αύξουσα σειρά γενικότητας): Απλοί ανακλαστικοί πράκτορες Model-based ανακλαστικοί πράκτορες Πράκτορες βασισµένοι στο στόχο Πράκτορες βασισµένοι στην ωφελιµότητα Πράκτορες µάθησης
Απλοί ανακλαστικοί πράκτορες
Model-based ανακλαστικοί πράκτορες
Πράκτορες βασισµένοι στο στόχο
Πράκτορες βασισµένοι στην ωφελιµότητα
Πράκτορες µάθησης