ΠΛΗ 405 Τεχνητή Νοηµοσύνη

ΠΛΗ 405 Τεχνητή Νοηµοσύνη Πληροφορηµένη Αναζήτηση Τµήµα Ηλεκτρονικών Μηχανικών και Μηχανικών Υ ολογιστών Πολυτεχνείο Κρήτης

Ε ανάληψη Πράκτορας ε ίλυσης ροβληµάτων πράκτορας µε στόχο Αναζήτηση διατύπωση προβλήµατος και στόχου Στρατηγικές α ληροφόρητης αναζήτησης αναζήτηση σε πλάτος αναζήτηση οµοιόµορφου κόστους αναζήτηση σε βάθος αναζήτηση περιορισµένου βάθους επαναληπτική εκβάθυνση αµφίδροµη αναζήτηση

Σήµερα Ε αναλαµβανόµενες καταστάσεις µέθοδοι αποφυγής Αναζήτηση µε µερική ληροφόρηση προβλήµατα χωρίς αισθητήρες προβλήµατα ενδεχοµένων Πληροφορηµένη αναζήτηση άπληστη αναζήτηση πρώτα στο καλύτερο αναζήτηση Α*

Ε αναλαµβανόµενες Καταστάσεις Repeated States

Ε αναλαµβανόµενες Καταστάσεις πρόβληµα: ένας γραµµικός χώρος φαίνεται εκθετικός συνήθως σε προβλήµατα µε αναστρέψιµες ενέργειες απλή σύγκριση µε τους κόµβους προς επέκταση δεν αρκεί οι αλγόριθµοι ου ξεχνούν την ιστορία τους είναι καταδικασµένοι να την ε αναλαµβάνουν

Α οφυγή Ε αναλαµβανόµενων Καταστάσεων Α οµνηµόνευση κλειστή λίστα (closed list): επεκταµένοι κόµβοι ανοικτή λίστα (open list): κόµβοι προς επέκταση σύνορο Πλεονεκτήµατα απαιτήσεις χώρου και χρόνου ανάλογες µε το χώρο κατάστασης όλοι οι αλγόριθµοι γίνονται πλήρεις για πεπερασµένους χώρους γρήγορος έλεγχος για κλειστή λίστα µε πίνακα hash Μειονεκτήµατα κανείς αλγόριθµος δεν έχει πλέον γραµµικές απαιτήσεις χώρου χρειάζεται προσοχή στην επιλογή εναλλακτικών διαδροµών

Αλγόριθµος Αναζήτησης µε Α οφυγή Ε αναλαµβανόµενων Καταστάσεων

Αναζήτηση µε Μερική Πληροφόρηση Search with Partial Information

Προβλήµατα µε Ατελή Γνώση Προβλήµατα χωρίς αισθητήρες (sensorless problems) ο πράκτορας δεν µπορεί να αντιληφθεί την κατάσταση Προβλήµατα ενδεχοµένων (contingency problems) µερικώς παρατηρήσιµα περιβάλλοντα ή αβέβαιες ενέργειες οι αντιλήψεις παρέχουν πληροφορίες και ορίζουν ενδεχόµενα Προβλήµατα αντι αλότητας (adversarial problems) η αβεβαιότητα προκαλείται από κάποιο άλλο πράκτορα Προβλήµατα εξερεύνησης (exploration problems) άγνωστος χώρος κατάστασης και άγνωστες ενέργειες ακραία περίπτωση προβληµάτων ενδεχοµένων

Προβλήµατα χωρίς Αισθητήρες Χαρακτηριστικά γνωστός ο χώρος κατάστασης και τα αποτελέσµατα των ενεργειών άγνωστη η τρέχουσα (αρχική, ενδιάµεση, τελική) κατάσταση Αντιµετώ ιση συλλογισµός µε σύνολα καταστάσεων, όχι µε απλές καταστάσεις χώρος πεποιθήσεων (beliefs): δυναµοσύνολο χώρου καταστάσεων πεποίθηση: το υποσύνολο των καταστάσεων όπου µπορεί να βρίσκεται ενέργειες: µεταβάσεις µεταξύ πεποιθήσεων (ένωση ατοµικών µεταβάσεων) αρχικοποίηση: πεποίθηση µε όλες τις πιθανές καταστάσεις επίλυση: αναζήτηση στο χώρο των πεποιθήσεων στόχος: πεποίθηση όπου όλες οι καταστάσεις είναι στόχοι

Ενέργειες χωρίς Αισθητήρες Εξαναγκασµός επιλογή κάποιας ενέργειας για αποκλεισµό κάποιων καταστάσεων Παράδειγµα µικρόκοσµου αρχική πεποίθηση {1,2,3,4,5,6,7,8} ενέργεια: εξιά επόµενη πεποίθηση: {2,4,6,8} ενέργεια: Αναρρόφηση επόµενη πεποίθηση: {4,8}... Γενίκευση µη αιτιοκρατικές ενέργειες µε αβέβαια αποτελέσµατα

Μικρόκοσµος Σκού ας χωρίς Αισθητήρες

Προβλήµατα Ενδεχοµένων Χαρακτηριστικά µερικώς παρατηρήσιµο περιβάλλον ή/και στοχαστικές ενέργειες Αντιµετώ ιση χρήση των αντιλήψεων για εξακρίβωση κατάστασης (ενδεχόµενα) λύση: δένδρο ενεργειών µε συνθήκες, όχι ακολουθία ενεργειών επιλογή κατάλληλου κλαδιού µε βάση τις αντιλήψεις (ενδεχόµενα) διαπλοκή (interleaving) αναζήτησης και εκτέλεσης Μικρόκοσµος σκού ας (µε εριορισµούς) αρχική αντίληψη: [Αριστερό, Σκονισµένο] Λύση: Αναρρόφηση, εξιά, if [ εξιό, Σκονισµένο] then Αναρρόφηση

Πληροφορηµένη Αναζήτηση Informed Search

Αναζήτηση Πρώτα στο Καλύτερο Πληροφορηµένη αναζήτηση (informed search) χρήση ειδική γνώσης για το πρόβληµα, όχι µόνο ορισµός απληροφόρητη αναζήτηση: βάθος, κόστος, επανάληψη, κλπ. πληροφορηµένη αναζήτηση: εξαγωγή πληροφορίας από κατάσταση Αναζήτηση ρώτα στο καλύτερο (best-first search) συνάρτηση αξιολόγησης (evaluation function) «καλύτερου» αξιολόγηση κάθε κόµβου n µε τη συνάρτηση αξιολόγησης f(n) επέκταση του κόµβου µε τη µικρότερη τιµή αξιολόγησης υλοποίηση µε ουρά προτεραιότητας

Ά ληστη Αναζήτηση Πρώτα στο Καλύτερο (greedy best-first search) Συνάρτηση αξιολόγησης ευρετική συνάρτηση (heuristic function) h(n), h(g)=0 εκτιµώµενο κόστος φθηνότερης διαδροµής από n σε στόχο η εκτίµηση εξαρτάται µόνο από τον κόµβο n και το στόχο αξιολόγηση: f(n) = h(n) Παράδειγµα: ιαδροµές στη Ρουµανία h SLD (n) : Straight-Line Distance heuristic (ευθύγραµµη απόσταση) ευθύγραµµη απόσταση πόλης n από το Βουκουρέστι δεν µπορεί να προκύψει µόνο από τον ορισµό του προβλήµατος

ιαδροµές στη Ρουµανία h SLD Πόλη h SLD Πόλη 374 Zerind 244 Lugoj 199 Vaslui 226 Iasi 80 Urziceni 151 Hirsova 329 Timisoara 77 Giurgiu 253 Sibiu 176 Fagaras 193 Rimnisc Vilcea 161 Eforie 100 Pitesti 242 Dobreta 380 Oradea 160 Craiova 234 Neamt 0 Bucharest 241 Mehadia 366 Arad

ιαδροµές στη Ρουµανία

ιαδροµές στη Ρουµανία Η διαδροµή που βρέθηκε δεν είναι η συντοµότερη!

Ά ληστη Αναζήτηση Πρώτα στο Καλύτερο Πληρότητα γενικά όχι, µπορεί να µπλέξει σε ατέρµονα κλαδιά (Iasi Faradas) πλήρης σε πεπερασµένους χώρους µε αποφυγή επανάληψης Βελτιστότητα όχι, επιρρεπής σε λανθασµένες εκτιµήσεις (Sibiu Bucharest) Χρονική και χωρική ολυ λοκότητα εκθετική Ο(b m ), όπου m είναι το µέγιστο βάθος του χώρου Γενικά οµοιάζει µε την αναζήτηση πρώτα κατά βάθος

Αναζήτηση Α* Συνάρτηση αξιολόγησης εκτιµώµενο κόστος h(n) φθηνότερης διαδροµής από n σε στόχο πραγµατικό κόστος g(n) τρέχουσας διαδροµής από αρχική έως n αξιολόγηση: f(n) = g(n) + h(n) συνολικό κόστος µέσω κόµβου n Παραδεκτός ευρετικός µηχανισµός (admissible heuristic) κάνει πάντα αισιόδοξες εκτιµήσεις δεν κάνει υπερεκτιµήσεις του κόστους (για ελαχιστοποίηση) δεν κάνει υποεκτιµήσεις του κόστους (για µεγιστοποίηση) Θεώρηµα η αναζήτηση A* χωρίς κλάδεµα επαναλαµβανόµενων καταστάσεων είναι βέλτιστη αν η h(n) είναι παραδεκτή

ιαδροµές στη Ρουµανία (Α*)

Συνε είς Ευρετικές Συναρτήσεις Συνέ εια (consistency) συνεπής (consistent) ή µονοτονική (monotonic) ευρετική συνάρτηση γενικευµένη τριγωνική ανισότητα: h(n) c(n, a, n') + h(n') Θεώρηµα η αναζήτηση A* µε κλάδεµα επαναλαµβανόµενων καταστάσεων, χωρίς να λαµβάνεται υπόψη εάν η νέα κατάσταση έχει µικρότερη τιµή f(n) από την παλιά, είναι βέλτιστη αν η h(n) είναι συνεπής Πορίσµατα µια συνεπής ευρετική συνάρτηση είναι και παραδεκτή οι περισσότερες παραδεκτές ευρετικές συναρτήσεις είναι και συνεπείς h(n) συνεπής η f(n) σε οποιαδήποτε διαδροµή είναι µη φθίνουσα

Ισοϋψείς Καµ ύλες Κόστους

Α οδοτικότητα Α* Πληρότητα ναι, εκτός αν υπάρχουν άπειροι κόµβοι µε f f(g) = C * Βελτιστότητα ναι, µε παραδεκτή ή συνεπή ευριστική συνάρτηση επέκταση: όλοι µε f(n)<c *, µερικοί µε f(n)=c * κανένας µε f(n)>c * Πολυ λοκότητα εκθετικές απαιτήσεις σε χρόνο και (κυρίως) σε µνήµη Βέλτιστα α οδοτικός για το ίδιο πρόβληµα εξερευνά τις λιγότερες καταστάσεις από όλους τους βέλτιστους και πλήρεις αλγορίθµους αναζήτησης

Μελέτη Σύγγραµµα Ενότητα 3.5 3.7, 4.1 4.2