ΠΛΗ 405 Τεχνητή Νοηµοσύνη Α ληροφόρητη και Πληροφορηµένη Αναζήτηση Τµήµα Ηλεκτρονικών Μηχανικών και Μηχανικών Υ ολογιστών Πολυτεχνείο Κρήτης
Ε ανάληψη Πράκτορες χαρακτηριστικά στοιχεία και είδη πρακτόρων Περιβάλλοντα χαρακτηρισµοί και ιδιότητες Πράκτορας ε ίλυσης ροβληµάτων πράκτορας µε στόχο Αναζήτηση διατύπωση δένδρο αναζήτησης γενικός αλγόριθµος µετρικές απόδοσης Μ. Γ. Λαγουδάκης Τµήµα ΗΜΜΥ Πολυτεχνείο Κρήτης Σελίδα 2
Σήµερα Α ληροφόρητη αναζήτηση σε πλάτος, οµοιόµορφου κόστους, σε βάθος, περιορισµένου βάθους, επαναληπτική εκβάθυνση, αµφίδροµη αναζήτηση επαναλαµβανόµενες καταστάσεις Αναζήτηση µε µερική ληροφόρηση προβλήµατα χωρίς αισθητήρες και προβλήµατα ενδεχοµένων Πληροφορηµένη αναζήτηση άπληστη αναζήτηση πρώτα στο καλύτερο, αναζήτηση Α* Πληροφορηµένη αναζήτηση µε εριορισµό µνήµης Μ. Γ. Λαγουδάκης Τµήµα ΗΜΜΥ Πολυτεχνείο Κρήτης Σελίδα 3
Α ληροφόρητη Αναζήτηση Uninformed or Blind Search
Αναζήτηση σε Πλάτος (Breadth-First) επέκταση του κόµβου µε το µικρότερο βάθος στο τρέχον σύνορο υλοποίηση µε ουρά FIFO (First In, First Out) πλήρης, βέλτιστη (υπό προϋποθέσεις), εκθετική πολυπλοκότητα O(b d+1 ) Βάθος (d) 2 4 6 8 10 12 14 Κόµβοι (b=10) 1100 111.100 10 7 10 9 10 11 10 13 10 15 Χρόνος (10000 κόµβοι/sec) 0.11 11 19 31 129 35 3.523 δευτερόλε τα δευτερόλε τα λε τά ηµέρες χρόνια χρόνια exabyte Μ. Γ. Λαγουδάκης Τµήµα ΗΜΜΥ Πολυτεχνείο Κρήτης Σελίδα 5 ώρες Μνήµη (1000 bytes/κόµβο) 1 106 10 1 101 10 1 megabyte megabytes gigabytes terabyte terabytes petabytes
Αναζήτηση Οµοιόµορφου Κόστους (uniform cost search) παραλλαγή της αναζήτησης κατά πλάτος επέκταση του κόµβου µε το µικρότερο κόστος διαδροµής σύνορο: κόµβοι µε (περίπου) οµοιόµορφο κόστος πλήρης, εάν το κόστος βήµατος είναι πάντα θετικό βέλτιστη, εάν το κόστος βήµατος είναι πάντα θετικό εκθετική πολυπλοκότητα εξαρτώµενη από το βέλτιστο κόστος εξαρτώµενη από το ελάχιστο κόστος βήµατος πιθανόν καλύτερη, πιθανόν χειρότερη απόδοση Μ. Γ. Λαγουδάκης Τµήµα ΗΜΜΥ Πολυτεχνείο Κρήτης Σελίδα 6
Αναζήτηση σε Βάθος (Depth-First) επέκταση του κόµβου µε το µεγαλύτερο βάθος στο τρέχον σύνορο οπισθοχώρηση στον αµέσως προηγούµενο κόµβο υλοποίηση µε ουρά LIFO (Last In, First Out) ή στοίβα (stack) δεν είναι πλήρης (διαδροµές απείρου µήκους) δεν είναι βέλτιστη (προχωράει σε βάθος ανεξάρτητα από κόστος) γραµµική χωρική πολυπλοκότητα βελτίωση µε υπαναχώρηση (backtracking) βελτίωση µε µεταβολή κατάστασης (προϋποθέτει δυνατότητα αναίρεσης) εκθετική χρονική πολυπλοκότητα Μ. Γ. Λαγουδάκης Τµήµα ΗΜΜΥ Πολυτεχνείο Κρήτης Σελίδα 7
Αναζήτηση κατά Βάθος Μ. Γ. Λαγουδάκης Τµήµα ΗΜΜΥ Πολυτεχνείο Κρήτης Σελίδα 8
Αναζήτηση Περιοσµένου Βάθους (Depth-Limited Search) παραλλαγή της αναζήτησης κατά βάθος διακοπή της επέκτασης πέρα από κάποιο προκαθορισµένο βάθος ευρετικός προσδιορισµός ορίου βάθους (διάµετρος γράφου) πλεονέκτηµα: αποφυγή άπειρων διαδροµών µειονέκτηµα: πρόβληµα πληρότητας η λύση µπορεί να βρίσκεται χαµηλότερα µειονέκτηµα: πρόβληµα βελτιστότητας µια βέλτιστη λύση µπορεί να βρίσκεται χαµηλότερα Μ. Γ. Λαγουδάκης Τµήµα ΗΜΜΥ Πολυτεχνείο Κρήτης Σελίδα 9
Ε αναλη τική Εκβάθυνση (Iterative-Deepening Search) έξυπνος χειρισµός αναζήτησης περιορισµένου βάθους σταδιακή αύξηση του ορίου βάθους (L = 0, 1, 2, 3,...) συνδυάζει τα πλεονεκτήµατα των αναζητήσεων σε βάθος και πλάτος πλήρης βέλτιστη (υπό προϋποθέσεις) χωρική πολυπλοκότητα Ο(bd) µικρότερη από τη χωρική πολυπλοκότητα της αναζήτησης σε πλάτος! χρονική πολυπλοκότητα εκθετική, αλλά όχι µεγαλύτερη (d)b + (d 1)b 2 + + (1)b d = O(b d )!!!! παραλλαγή: αναζήτηση επαναληπτικής επιµήκυνσης Μ. Γ. Λαγουδάκης Τµήµα ΗΜΜΥ Πολυτεχνείο Κρήτης Σελίδα 10
Ε αναλη τική Εκβάθυνση Μ. Γ. Λαγουδάκης Τµήµα ΗΜΜΥ Πολυτεχνείο Κρήτης Σελίδα 11
Ε αναλη τική Εκβάθυνση Μ. Γ. Λαγουδάκης Τµήµα ΗΜΜΥ Πολυτεχνείο Κρήτης Σελίδα 12
Αµφίδροµη Αναζήτηση (Bidirectional Search) b d/2 +b d/2 << b d Μ. Γ. Λαγουδάκης Τµήµα ΗΜΜΥ Πολυτεχνείο Κρήτης Σελίδα 13
Σύγκριση Α ληροφόρητων Στρατηγικών Μ. Γ. Λαγουδάκης Τµήµα ΗΜΜΥ Πολυτεχνείο Κρήτης Σελίδα 14
Ε αναλαµβανόµενες Καταστάσεις Repeated States
Ε αναλαµβανόµενες Καταστάσεις πρόβληµα: ένας γραµµικός χώρος φαίνεται εκθετικός συνήθως σε προβλήµατα µε αναστρέψιµες ενέργειες απλή σύγκριση µε τους κόµβους προς επέκταση δεν αρκεί οι αλγόριθµοι ου ξεχνούν την ιστορία τους είναι καταδικασµένοι να την ε αναλαµβάνουν Μ. Γ. Λαγουδάκης Τµήµα ΗΜΜΥ Πολυτεχνείο Κρήτης Σελίδα 16
Α οφυγή Ε αναλαµβανόµενων Καταστάσεων Α οµνηµόνευση κλειστή λίστα (closed list): επεκταµένοι κόµβοι ανοικτή λίστα (open list): κόµβοι προς επέκταση σύνορο Πλεονεκτήµατα απαιτήσεις χώρου και χρόνου ανάλογες µε το χώρο κατάστασης όλοι οι αλγόριθµοι γίνονται πλήρεις για πεπερασµένους χώρους γρήγορος έλεγχος για κλειστή λίστα µε πίνακα hash Μειονεκτήµατα κανείς αλγόριθµος δεν έχει πλέον γραµµικές απαιτήσεις χώρου χρειάζεται προσοχή στην επιλογή εναλλακτικών διαδροµών Μ. Γ. Λαγουδάκης Τµήµα ΗΜΜΥ Πολυτεχνείο Κρήτης Σελίδα 17
Αλγόριθµος Αναζήτησης µε Α οφυγή Ε αναλαµβανόµενων Καταστάσεων Μ. Γ. Λαγουδάκης Τµήµα ΗΜΜΥ Πολυτεχνείο Κρήτης Σελίδα 18
Αναζήτηση µε Μερική Πληροφόρηση Search with Partial Information
Προβλήµατα µε Ατελή Γνώση Προβλήµατα χωρίς αισθητήρες (sensorless problems) ο πράκτορας δεν µπορεί να αντιληφθεί την κατάσταση Προβλήµατα ενδεχοµένων (contingency problems) µερικώς παρατηρήσιµα περιβάλλοντα ή αβέβαιες ενέργειες οι αντιλήψεις παρέχουν πληροφορίες και ορίζουν ενδεχόµενα Προβλήµατα αντι αλότητας (adversarial problems) η αβεβαιότητα προκαλείται από κάποιο άλλο πράκτορα Προβλήµατα εξερεύνησης (exploration problems) άγνωστος χώρος κατάστασης και άγνωστες ενέργειες ακραία περίπτωση προβληµάτων ενδεχοµένων Μ. Γ. Λαγουδάκης Τµήµα ΗΜΜΥ Πολυτεχνείο Κρήτης Σελίδα 20
Προβλήµατα χωρίς Αισθητήρες Χαρακτηριστικά γνωστός ο χώρος κατάστασης και τα αποτελέσµατα των ενεργειών άγνωστη η τρέχουσα (αρχική, ενδιάµεση, τελική) κατάσταση Αντιµετώ ιση συλλογισµός µε σύνολα καταστάσεων, όχι µε απλές καταστάσεις χώρος πεποιθήσεων (beliefs): δυναµοσύνολο χώρου καταστάσεων πεποίθηση: το υποσύνολο των καταστάσεων όπου µπορεί να βρίσκεται ενέργειες: µεταβάσεις µεταξύ πεποιθήσεων (ένωση ατοµικών µεταβάσεων) αρχικοποίηση: πεποίθηση µε όλες τις πιθανές καταστάσεις επίλυση: αναζήτηση στο χώρο των πεποιθήσεων στόχος: πεποίθηση όπου όλες οι καταστάσεις είναι στόχοι Μ. Γ. Λαγουδάκης Τµήµα ΗΜΜΥ Πολυτεχνείο Κρήτης Σελίδα 21
Ενέργειες χωρίς Αισθητήρες Εξαναγκασµός επιλογή κάποιας ενέργειας για αποκλεισµό κάποιων καταστάσεων Παράδειγµα µικρόκοσµου αρχική πεποίθηση {1,2,3,4,5,6,7,8} ενέργεια: εξιά επόµενη πεποίθηση: {2,4,6,8} ενέργεια: Αναρρόφηση επόµενη πεποίθηση: {4,8}... Γενίκευση µη αιτιοκρατικές ενέργειες µε αβέβαια αποτελέσµατα Μ. Γ. Λαγουδάκης Τµήµα ΗΜΜΥ Πολυτεχνείο Κρήτης Σελίδα 22
Μικρόκοσµος Σκού ας χωρίς Αισθητήρες Μ. Γ. Λαγουδάκης Τµήµα ΗΜΜΥ Πολυτεχνείο Κρήτης Σελίδα 23
Πληροφορηµένη Αναζήτηση Informed Search
Αναζήτηση Πρώτα στο Καλύτερο Πληροφορηµένη αναζήτηση (informed search) χρήση ειδικής γνώσης για το πρόβληµα, όχι µόνο ο ορισµός απληροφόρητη αναζήτηση: βάθος, κόστος, επανάληψη, κλπ. πληροφορηµένη αναζήτηση: εξαγωγή πληροφορίας από κατάσταση Αναζήτηση ρώτα στο καλύτερο (best-first search) συνάρτηση αξιολόγησης (evaluation function) «καλύτερου» αξιολόγηση κάθε κόµβου n µε τη συνάρτηση αξιολόγησης f(n) επέκταση του κόµβου µε τη µικρότερη τιµή αξιολόγησης υλοποίηση µε ουρά προτεραιότητας Μ. Γ. Λαγουδάκης Τµήµα ΗΜΜΥ Πολυτεχνείο Κρήτης Σελίδα 25
Ά ληστη Αναζήτηση Πρώτα στο Καλύτερο (greedy best-first search) Συνάρτηση αξιολόγησης ευρετική συνάρτηση (heuristic function) h(n), h(g)=0 εκτιµώµενο κόστος φθηνότερης διαδροµής από n σε στόχο η εκτίµηση εξαρτάται µόνο από τον κόµβο n και το στόχο αξιολόγηση: f(n) = h(n) Παράδειγµα: ιαδροµές στη Ρουµανία h SLD (n) : Straight-Line Distance heuristic (ευθύγραµµη απόσταση) ευθύγραµµη απόσταση πόλης n από το Βουκουρέστι δεν µπορεί να προκύψει µόνο από τον ορισµό του προβλήµατος Μ. Γ. Λαγουδάκης Τµήµα ΗΜΜΥ Πολυτεχνείο Κρήτης Σελίδα 26
ιαδροµές στη Ρουµανία Πόλη h SLD Πόλη h SLD Arad 366 Mehadia 241 Bucharest 0 Neamt 234 Craiova 160 Oradea 380 Dobreta 242 Pitesti 100 Eforie 161 Rimnisc Vilcea 193 Fagaras 176 Sibiu 253 Giurgiu 77 Timisoara 329 Hirsova 151 Urziceni 80 Iasi 226 Vaslui 199 Lugoj 244 Zerind 374 Μ. Γ. Λαγουδάκης Τµήµα ΗΜΜΥ Πολυτεχνείο Κρήτης Σελίδα 27
ιαδροµές στη Ρουµανία Μ. Γ. Λαγουδάκης Τµήµα ΗΜΜΥ Πολυτεχνείο Κρήτης Σελίδα 28
ιαδροµές στη Ρουµανία Η διαδροµή που βρέθηκε δεν είναι η συντοµότερη! Μ. Γ. Λαγουδάκης Τµήµα ΗΜΜΥ Πολυτεχνείο Κρήτης Σελίδα 29
Ά ληστη Αναζήτηση Πρώτα στο Καλύτερο Πληρότητα γενικά όχι, µπορεί να µπλέξει σε ατέρµονα κλαδιά (Iasi Fagaras) πλήρης σε πεπερασµένους χώρους µε αποφυγή επανάληψης Βελτιστότητα όχι, επιρρεπής σε λανθασµένες εκτιµήσεις (Sibiu Bucharest) Χρονική και χωρική ολυ λοκότητα εκθετική Ο(b m ), όπου m είναι το µέγιστο βάθος του χώρου Γενικά οµοιάζει µε την αναζήτηση πρώτα κατά βάθος Μ. Γ. Λαγουδάκης Τµήµα ΗΜΜΥ Πολυτεχνείο Κρήτης Σελίδα 30
Αναζήτηση Α* Συνάρτηση αξιολόγησης εκτιµώµενο κόστος h(n) φθηνότερης διαδροµής από n σε στόχο πραγµατικό κόστος g(n) τρέχουσας διαδροµής από αρχική έως n αξιολόγηση: f(n) = g(n) + h(n) συνολικό κόστος µέσω κόµβου n Παραδεκτός ευρετικός µηχανισµός (admissible heuristic) κάνει πάντα αισιόδοξες εκτιµήσεις δεν κάνει υπερεκτιµήσεις του κόστους (για ελαχιστοποίηση) δεν κάνει υποεκτιµήσεις του κόστους (για µεγιστοποίηση) Θεώρηµα η αναζήτηση A* χωρίς κλάδεµα επαναλαµβανόµενων καταστάσεων είναι βέλτιστη αν η h(n) είναι παραδεκτή Μ. Γ. Λαγουδάκης Τµήµα ΗΜΜΥ Πολυτεχνείο Κρήτης Σελίδα 31
ιαδροµές στη Ρουµανία (Α*) Μ. Γ. Λαγουδάκης Τµήµα ΗΜΜΥ Πολυτεχνείο Κρήτης Σελίδα 32
ιαδροµές στη Ρουµανία (Α*) Μ. Γ. Λαγουδάκης Τµήµα ΗΜΜΥ Πολυτεχνείο Κρήτης Σελίδα 33
Συνε είς Ευρετικές Συναρτήσεις Συνέ εια (consistency) συνεπής (consistent) ή µονοτονική (monotonic) ευρετική συνάρτηση γενικευµένη τριγωνική ανισότητα: h(n) c(n, a, n') + h(n') Θεώρηµα η αναζήτηση A* µε κλάδεµα επαναλαµβανόµενων καταστάσεων, χωρίς να λαµβάνεται υπόψη εάν η νέα κατάσταση έχει µικρότερη τιµή f(n) από την παλιά, είναι βέλτιστη αν η h(n) είναι συνεπής Πορίσµατα µια συνεπής ευρετική συνάρτηση είναι και παραδεκτή οι περισσότερες παραδεκτές ευρετικές συναρτήσεις είναι και συνεπείς h(n) συνεπής η f(n) σε οποιαδήποτε διαδροµή είναι µη φθίνουσα Μ. Γ. Λαγουδάκης Τµήµα ΗΜΜΥ Πολυτεχνείο Κρήτης Σελίδα 34
Ισοϋψείς Καµ ύλες Κόστους Μ. Γ. Λαγουδάκης Τµήµα ΗΜΜΥ Πολυτεχνείο Κρήτης Σελίδα 35
Α οδοτικότητα Α* Πληρότητα ναι, εκτός αν υπάρχουν άπειροι κόµβοι µε f f(g) = C * Βελτιστότητα ναι, µε παραδεκτή ή συνεπή ευριστική συνάρτηση επέκταση: όλοι µε f(n)<c *, µερικοί µε f(n)=c *, κανένας µε f(n)>c * Πολυ λοκότητα εκθετικές απαιτήσεις σε χρόνο και (κυρίως) σε µνήµη Βέλτιστα α οδοτικός για το ίδιο πρόβληµα εξερευνά τις λιγότερες καταστάσεις από όλους τους βέλτιστους και πλήρεις αλγορίθµους αναζήτησης Μ. Γ. Λαγουδάκης Τµήµα ΗΜΜΥ Πολυτεχνείο Κρήτης Σελίδα 36
Πληροφορηµένη Αναζήτηση µε Περιορισµένη Μνήµη Informed Search with Bounded Memory
A* µε Ε αναλη τική Εκβάθυνση (Iterative-Deepening A* - IDA*) Μεθοδολογία ανάλογη µέθοδος µε την αναζήτηση επαναληπτικής επιµήκυνσης αναζήτηση πρώτα κατά βάθος µε περιορισµένο κόστος g(n) + h(n) σταδιακή αύξηση του ορίου αποκοπής 0, f 1 (n), f 2 (n), f 3 (n),... νέο όριο: το µικρότερο f(n) πάνω από το όριο στο προηγούµενο στάδιο πλήρης και βέλτιστη µε παραδεκτή h γραµµική χωρική πολυπλοκότητα Ο(bd) εκθετική χρονική πολυπλοκότητα O(b d ) Μειονεκτήµατα πιθανόν, αργή αύξηση του ορίου αποκοπής αργή πρόοδος δεν ανιχνεύει επαναλαµβανόµενες καταστάσεις Μ. Γ. Λαγουδάκης Τµήµα ΗΜΜΥ Πολυτεχνείο Κρήτης Σελίδα 38
Α* - Σύνορο Αναζήτησης Μ. Γ. Λαγουδάκης Τµήµα ΗΜΜΥ Πολυτεχνείο Κρήτης Σελίδα 39
Α* - Ε έκταση Ορίου Α οκο ής Μ. Γ. Λαγουδάκης Τµήµα ΗΜΜΥ Πολυτεχνείο Κρήτης Σελίδα 40
Στάδια Αναζήτησης IDA* Μ. Γ. Λαγουδάκης Τµήµα ΗΜΜΥ Πολυτεχνείο Κρήτης Σελίδα 41
Αναδροµική Αναζήτηση Πρώτα στο Καλύτερο (Recursive Best-First Search, RBFS) Μεθοδολογία αναζήτηση πρώτα στο καλύτερο µε γραµµικό χώρο ουσιαστικά, αναζήτηση κατά βάθος, όχι όµως τυφλά θυµάται το καλύτερο κόστος f* γειτόνων κατά µήκος του µονοπατιού επέκταση κατά βάθος αν f f*, αλλιώς οπισθοχώρηση οπισθοδρόµηση πίσω στο καλύτερο εναλλακτικό µονοπάτι (f*) αλλαγή του f κάθε κόµβου µε το καλύτερο f των παιδιών του πλήρης και βέλτιστη µε παραδεκτή h γραµµική χωρική, εκθετική χρονική πολυπλοκότητα Μειονεκτήµατα πιθανόν, υπερβολική επαναπαραγωγή κόµβων αργή πρόοδος δεν ανιχνεύει επαναλαµβανόµενες καταστάσεις Μ. Γ. Λαγουδάκης Τµήµα ΗΜΜΥ Πολυτεχνείο Κρήτης Σελίδα 42
Αναζήτηση RBFS Μ. Γ. Λαγουδάκης Τµήµα ΗΜΜΥ Πολυτεχνείο Κρήτης Σελίδα 43
Αναζήτηση RBFS Μ. Γ. Λαγουδάκης Τµήµα ΗΜΜΥ Πολυτεχνείο Κρήτης Σελίδα 44
Αναζήτηση SMA* (Simple Memory-bounded A*) Μεθοδολογία αναζήτηση A* µε περιορισµένο χώρο όταν γεµίσει η µνήµη, διαγράφει ένα παλιό κόµβο για κάθε νέο διαγράφεται ο χειρότερος κόµβος (αυτός µε το µεγαλύτερο f) και τα αδέλφια του και εισάγεται ο γονικός κόµβος η καλύτερη τιµή f των διαγραφόµενων κόµβων µεταφέρεται στον γονέα διαγράφεται ο παλαιότερος κόµβος, σε περίπτωση ισοτιµίας τιµών f πλήρης (υπό προϋποθέσεις) και βέλτιστη µε παραδεκτή h περιορισµένη χωρική, εκθετική χρονική πολυπλοκότητα Χαρακτηριστικά γενικά, ο καλύτερος αλγόριθµος αναζήτησης γενικής χρήσης περιορισµός µνήµης, πιθανόν επιφέρει απαγορευτικό χρόνο Μ. Γ. Λαγουδάκης Τµήµα ΗΜΜΥ Πολυτεχνείο Κρήτης Σελίδα 45
Μελέτη Σύγγραµµα Ενότητες 3.4 3.7, 4.1 Μ. Γ. Λαγουδάκης Τµήµα ΗΜΜΥ Πολυτεχνείο Κρήτης Σελίδα 46