Πληροφορηµένη αναζήτηση και εξερεύνηση

Σχετικά έγγραφα
ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

ΤΕΧΝΗΤΗ ΝΟΗΜΟΣΥΝΗ. Ενότητα 3: Αλγόριθμοι πληροφορημένης αναζήτησης. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής

ΤΕΧΝΗΤΗ ΝΟΗΜΟΣΥΝΗ. Ενότητα 5: Παραδείγματα. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής

Θεωρία Λήψης Αποφάσεων

ΠΛΗ 405 Τεχνητή Νοηµοσύνη

Ε ανάληψη. Ε αναλαµβανόµενες καταστάσεις. Αναζήτηση µε µερική ληροφόρηση. Πληροφορηµένη αναζήτηση. µέθοδοι αποφυγής

Θεωρία Λήψης Αποφάσεων

ΠΛΗ 405 Τεχνητή Νοηµοσύνη

Ε ανάληψη. Α ληροφόρητη αναζήτηση

ΠΛΗ 405 Τεχνητή Νοηµοσύνη

Επίλυση Προβλημάτων. Περιγραφή Προβλημάτων Αλγόριθμοι αναζήτησης Αλγόριθμοι τυφλής αναζήτησης. Αλγόριθμοι ευρετικής αναζήτησης Παιχνίδια δύο αντιπάλων

Τεχνητή Νοημοσύνη. 4η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

ΚΑΙ ΕΞΕΡΕΥΝΗΣΗ 4.1 ΣΤΡΑΤΗΓΙΚΕΣ ΠΛΗΡΟΦΟΡΗΜΕΝΗΣ (ΕΥΡΕΤΙΚΗΣ) ΑΝΑΖΗΤΗΣΗΣ

Επίλυση προβληµάτων. Περιγραφή προβληµάτων Αλγόριθµοι αναζήτησης

Τεχνητή Νοημοσύνη (ΥΠ23) 6 ο εξάμηνο Τμήμα Πληροφορικής και Τηλεματικής Χαροκόπειο Πανεπιστήμιο Ουρανία Χατζή

ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ

Τεχνητή Νοημοσύνη. 3η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

ΤΥΦΛΗ ΑΝΑΖΗΤΗΣΗ (1) ΣΤΡΑΤΗΓΙΚΗ Ή ΑΛΓΟΡΙΘΜΟΣ ΑΝΑΖΗΤΗΣΗΣ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΤΕΧΝΗΤΗ ΝΟΗΜΟΣΥΝΗ. Τελικές εξετάσεις Παρασκευή 4 Ιουλίου 2014, 18:00-21:00

6 η Διάλεξη. Ενδεικτικές λύσεις ασκήσεων

Ασκήσεις μελέτης της 4 ης διάλεξης. ), για οποιοδήποτε μονοπάτι n 1

Πανεπιστήμιο Δυτικής Μακεδονίας. Τμήμα Μηχανικών Πληροφορικής & Τηλεπικοινωνιών. Τεχνητή Νοημοσύνη. Ενότητα 3: Αναζήτηση

Επίλυση προβλημάτων με αναζήτηση

Αναζήτηση (Search) συνέχεια. Τµήµα Ψηφιακών Συστηµάτων Πανεπιστήµιο Πειραιώς

Τεχνητή Νοημοσύνη (ΥΠ23) 6 ο εξάμηνο Τμήμα Πληροφορικής και Τηλεματικής Χαροκόπειο Πανεπιστήμιο Ουρανία Χατζή

Εφαρμόζονται σε προβλήματα στα οποία δεν υπάρχει πληροφορία που να επιτρέπει την αξιολόγηση των καταστάσεων του χώρου αναζήτησης.

ΥΣ02 Τεχνητή Νοημοσύνη Χειμερινό Εξάμηνο

Επίλυση Προβλημάτων και Τεχνικές Αναζήτησης Εισαγωγή

Τεχνητή Νοημοσύνη. 5η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

Επίλυση Προβλημάτων 1

ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

Για παράδειγμα η αρχική και η τελική κατάσταση αναπαριστώνται ως εξής: (ένα λίτρο)

Θεωρία Λήψης Αποφάσεων

Θεωρήστε ένα puzzle (παιχνίδι σπαζοκεφαλιάς) με την ακόλουθη αρχική διαμόρφωση : b b b w w w e

Επίλυση προβληµάτων µε αναζήτηση

Τεχνητή Νοημοσύνη (ΥΠ23) 6 ο εξάμηνο Τμήμα Πληροφορικής και Τηλεματικής Χαροκόπειο Πανεπιστήμιο Ουρανία Χατζή

Επίλυση προβληµάτων. Περιγραφή προβληµάτων Αλγόριθµοι αναζήτησης Αλγόριθµοι τυφλής αναζήτησης Αλγόριθµοι ευρετικής αναζήτησης

Αλγόριθμοι Τυφλής Αναζήτησης

Επίλυση Προβλημάτων 1

ΑΛΓΟΡΙΘΜΙΚΕΣ ΜΕΘΟΔΟΙ ΒΕΛΤΙΣΤΟΠΟΙΗΣΗΣ

Πρόβληµα ικανοποίησης περιορισµών

ΤΕΧΝΗΤΗ ΝΟΗΜΟΣΥΝΗ. Ενότητα 2: Δένδρο αναζήτησης. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής

ΤΕΧΝΗΤΗ ΝΟΗΜΟΣΥΝΗ. Ενότητα 6: Προβλήματα ικανοποίησης περιορισμών. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής

Τεχνητή Νοημοσύνη Ι. Εργαστηριακή Άσκηση 4-6. Σγάρμπας Κυριάκος. Τμήμα Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστων

Μαθηματικά των Υπολογιστών και των Αποφάσεων Τεχνητή Νοημοσύνη 1η Σειρά Ασκήσεων

ΧΑΡΟΚΟΠΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ & ΤΗΛΕΜΑΤΙΚΗΣ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΙΑΤΜΗΜΑΤΙΚΟ ΠΜΣ «ΜΑΘΗΜΑΤΙΚΑ ΤΩΝ ΥΠΟΛΟΓΙΣΤΩΝ & ΤΩΝ ΑΠΟΦΑΣΕΩΝ ΤΕΧΝΗΤΗ ΝΟΗΜΟΣΥΝΗ η Σειρά Ασκήσεων ΑΠΑΝΤΗΣΕΙΣ

Επίλυση Προβλημάτων 1

PROJECT ΣΤΟ ΜΑΘΗΜΑ ΕΙΣΑΓΩΓΗ ΣΤΙΣ ΕΥΡΕΤΙΚΕΣ ΜΕΘΟ ΟΥΣ

Αναζήτηση σε Γράφους. Μανόλης Κουμπαράκης. ΥΣ02 Τεχνητή Νοημοσύνη 1

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΤΕΧΝΗΤΗ ΝΟΗΜΟΣΥΝΗ

Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος

PROJECT ΣΤΟ ΜΑΘΗΜΑ "ΕΙΣΑΓΩΓΗ ΣΤΙΣ ΕΥΡΕΤΙΚΕΣ ΜΕΘΟΔΟΥΣ"

Τεχνητή Νοημοσύνη. 2η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

Αλγόριθµοι Ευριστικής Αναζήτησης

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ Τμήμα Πληροφορικής

Συστήματα Επιχειρηματικής Ευφυίας. Οι αλγόριθμοι Hill Climbing, Simulated Annealing, Great Deluge, VNS, Tabu Search

ΑΛΓΟΡΙΘΜΟΙ ΑΝΟΠΤΗΣΗΣ: Ο ΑΛΓΟΡΙΘΜΟΣ ΤΗΣ ΑΠΟ ΟΧΗΣ ΚΑΤΩΦΛΙΟΥ (THRESHOLD ACCEPTING)

Τεχνητή Νοημοσύνη. 5η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

ΕΡΩΤΗΜΑΤΑ σε ΑΝΑΖΗΤΗΣΗ

Επίλυση προβληµάτων. Αλγόριθµοι Αναζήτησης

Βασίλειος Μαχαιράς Πολιτικός Μηχανικός Ph.D.

Κεφάλαιο 3. Αλγόριθµοι Τυφλής Αναζήτησης. Τεχνητή Νοηµοσύνη - Β' Έκδοση. Ι. Βλαχάβας, Π. Κεφαλάς, Ν. Βασιλειάδης, Φ. Κόκκορας, Η.

ΠΛΗ 405 Τεχνητή Νοηµοσύνη

ΑΛΓΟΡΙΘΜΙΚΕΣ ΜΕΘΟΔΟΙ ΒΕΛΤΙΣΤΟΠΟΙΗΣΗΣ

Αλγόριθµοι Ευριστικής Αναζήτησης

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΤΕΧΝΗΤΗ ΝΟΗΜΟΣΥΝΗ

ΥΣ02 Τεχνητή Νοημοσύνη Χειμερινό Εξάμηνο

ΠΛΗ 405 Τεχνητή Νοηµοσύνη

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ

Θεωρία Λήψης Αποφάσεων

Ε ανάληψη. Καταβολές. Ιστορική αναδροµή. Πράκτορες. Περιβάλλοντα. συνεισφορά άλλων επιστηµών στην ΤΝ σήµερα

Ε ανάληψη. Ορισµοί της Τεχνητής Νοηµοσύνης (ΤΝ) Καταβολές. Ιστορική αναδροµή. Πράκτορες. Περιβάλλοντα. κριτήρια νοηµοσύνης

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ

Τεχνητή Νοημοσύνη. 6η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

ΕΦΑΡΜΟΓΕΣ ΔΙΟΙΚΗΤΙΚΗΣ ΕΠΙΣΤΗΜΗΣ

Αλγόριθμοι και Δομές Δεδομένων (Ι) (εισαγωγικές έννοιες)

ιαµέριση - Partitioning

Α Ν Α Λ Τ Η Α Λ Γ Ο Ρ Ι Θ Μ Ω Ν Κ Ε Υ Α Λ Α Ι Ο 5. Πως υπολογίζεται ο χρόνος εκτέλεσης ενός αλγορίθμου;

Δομές Δεδομένων & Αλγόριθμοι

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΑΝΑΛΥΣΗ ΑΛΓΟΡΙΘΜΩΝ

Τεχνητή Νοημοσύνη. 17η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

Επίλυση Προβλημάτων. Αποτελεί ένα από τα βασικά χαρακτηριστικά γνωρίσματα της νοημοσύνης.

Τι είναι αλγόριθμος; Υποπρογράμματα (υποαλγόριθμοι) Βασικές αλγοριθμικές δομές

Περιεχόμενα. Εισαγωγή του επιμελητή, Γιάννης Σταματίου 15 Πρόλογος 17 Εισαγωγή 23. Μέρος I. ΕΠΑΝΑΛΗΠΤΙΚΟΙ ΑΛΓΟΡΙΘΜΟΙ ΚΑΙ ΑΝΑΛΛΟΙΩΤΕΣ ΣΥΝΘΗΚΕΣ

Εισαγωγή στους Αλγόριθμους. Παύλος Εφραιμίδης, Λέκτορας

Τεχνητή Νοημοσύνη (ΥΠ23) 6 ο εξάμηνο Τμήμα Πληροφορικής και Τηλεματικής Χαροκόπειο Πανεπιστήμιο Ουρανία Χατζή

Μέθοδοι μονοδιάστατης ελαχιστοποίησης

5. Απλή Ταξινόμηση. ομές εδομένων. Χρήστος ουλκερίδης. Πανεπιστήμιο Πειραιώς Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών Τμήμα Ψηφιακών Συστημάτων

Βασίλειος Μαχαιράς Πολιτικός Μηχανικός Ph.D.

Μη γράφετε στο πίσω μέρος της σελίδας

Ασκήσεις μελέτης της 8 ης διάλεξης

καθ. Βασίλης Μάγκλαρης

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ. ΤΕΧΝΗΤΗ ΝΟΗΜΟΣΥΝΗ Τελικές εξετάσεις 24 Ιουνίου 2004

Γ. Κορίλη Αλγόριθµοι ροµολόγησης

ΑΝΑΠΤΥΞΗ ΕΦΑΡΜΟΓΩΝ ΣΕ ΠΡΟΓΡΑΜΜΑΤΙΣΤΙΚΟ ΠΕΡΙΒΑΛΛΟΝ ΕΠΑΝΑΛΗΠΤΙΚΟ ΔΙΑΓΩΝΙΣΜΑ ΣΧΟΛΙΚΟΥ ΕΤΟΥΣ

Ε..Ε. ΙI ΑΠΑΓΟΡΕΥΜΕΝΗΕΡΕΥΝΑ TABU SEARCH ΧΡΗΣΤΟΣ. ΤΑΡΑΝΤΙΛΗΣ MANAGEMENT SCIENCE IN PRACTICE II

ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

Υπολογιστικό Πρόβληµα

Δυναµικός Προγραµµατισµός (ΔΠ)

Transcript:

Πληροφορηµένη αναζήτηση και εξερεύνηση Στρατηγικές πληροφορηµένης αναζήτησης Πληροφορηµένη αναζήτηση (informed search) Συνάρτηση αξιολόγησης (evaluation function), f(n) Προτιµώνται οι µικρότερες τιµές Ευρετική συνάρτηση (heuristic function), h(n) Συνήθως εκτίµηση απόστασης από στόχο 4-2

Αναζήτηση πρώτα στο καλύτερο (1/5) f(n)=h(n) h SLD : Straight-Line Distance heuristic (ευθύγραµµη απόσταση) 4-3 Αναζήτηση πρώτα στο καλύτερο (2/5) Τιµές h SLD για απόσταση από Βουκουρέστι Arad 366 Mehadia 241 Bucharest 0 Neamt 234 Craiova 160 Oradea 380 Dobreta 242 Pitesti 100 Eforie 161 Rimniscu Vilcea 193 Fagaras 176 Sibiu 253 Giurgiu 77 Timisoara 329 Hirsova 151 Urziceni 80 Iasi 226 Vaslui 199 Lugoj 244 Zerind 374 4-4

Αναζήτηση πρώτα στο καλύτερο (3/5) Μετάβαση από το Arad στο Βουκουρέστι 4-5 Αναζήτηση πρώτα στο καλύτερο (4/5) Η διαδροµή που βρέθηκε δεν είναι η συντοµότερη. 4-6

Αναζήτηση πρώτα στο καλύτερο (5/5) Επιρρεπής σε λανθασµένες εκτιµήσεις: Μετάβαση από Iasi σε Fagaras Έχει οµοιότητα µε την αναζήτηση πρώτα κατά βάθος. Μπορεί να µπλέξει σε ατέρµονα κλαδιά. Χρονική, χωρική πολυπλοκότητα χειρότερης περίπτωσης: Ο(b m ) 4-7 Αναζήτηση Α* (1/3) f(n)=g(n)+h(n) Παραδεκτός ευρετικός µηχανισµός h(n): εν κάνει υπερκτιµήσεις. π.χ. h SLD Η αναζήτηση A* χωρίς κλάδεµα επαναλαµβανόµενων καταστάσεων είναι βέλτιστη αν η h(n) είναι παραδεκτή. 4-8

Αναζήτηση Α* (2/3) 4-9 Αναζήτηση Α* (3/3) 4-10

Συνεπείς ευρετικές συναρτήσεις Μια ευρετική συνάρτηση λέγεται συνεπής (consistent) ή µονοτονική, εάν ισχύει: h(n) c(n, a, n') + h(n') ΗαναζήτησηA* µε κλάδεµα επαναλαµβανόµενων καταστάσεων, χωρίς να λαµβάνεται υπόψη εάν η νέα κατάσταση έχει µικρότερη τιµή f(n) από την παλιά, είναι βέλτιστη αν η h(n) είναι συνεπής. Μια συνεπής ευρετική συνάρτηση είναι και παραδεκτή. Οι περισσότερες παραδεκτές ευρετικές συναρτήσεις είναι και συνεπείς (π.χ. h SLD ) 4-11 Ισοϋψείς καµπύλες Αν η h(n) είναι συνεπής, τότε οι τιµές της f(n) πάνω σε οποιαδήποτε διαδροµή είναιµη φθίνουσες. Ισοϋψείς καµπύλες 4-12

Αποδοτικότητα Α* Βέλτιστος και πλήρης Βέλτιστα αποδοτικός: Εξερευνά τις λιγότερες καταστάσεις από όλους τους βέλτιστους και πλήρεις αλγορίθµους. Μεγάλες (εκθετικές) απαιτήσεις σε χρόνο και (κυρίως) σε µνήµη. 4-13 Παράδειγµα: Μη-Παραδεκτή Συνάρτηση A h=4 F=0+4=4 Αρχική h=2 Β 4 F=4+2=6 3 3 Γ h=5 F=3+5=8 3 h=0 F1=7+0=7 F2=6+0=6 Τελική Μέτωπο αναζήτησης Κλειστό σύνολο Τρέχουσα κατάσταση Παιδιά Α 4 Α ΑΒ 6, ΑΓ 8 ΑΒ 6, ΑΓ 8 ΑΒ 7, ΑΓ 8 Α Α, ΑΒ ΑΒ 6 ΑΒ 7 ΑΒ 7 4-14 Λύση

Παράδειγµα: Παραδεκτή Συνάρτηση A h=4 F=0+4=4 Αρχική h=2 Β 4 F=4+2=6 3 3 Γ h=3 F=3+3=6 3 h=0 F1=7+0=7 F2=6+0=6 Τελική Μέτωπο αναζήτησης Κλειστό σύνολο Τρέχουσα κατάσταση Παιδιά Α 4 Α ΑΒ 6, ΑΓ 6 ΑΒ 6, ΑΓ 6 A ΑΒ 6 ΑΒ 7 ΑΓ 6, ΑΒ 7 ΑΓ 6, ΑΒ 7 Α, ΑΒ Α, ΑΓ, ΑΒ ΑΓ 6 ΑΓ 6 ΑΓ 6 4-15 Λύση Παράδειγµα: Σύγκριση BestFS και A* A Αρχική h=4 4 h=2 Β 3 3 Γ 3 h=3 h=0 Τελική Λύση στο προηγούµενο παράδειγµα µε χρήση BestFS: Μέτωπο αναζήτησης Κλειστό σύνολο Τρέχουσα κατάσταση Παιδιά Α Α ΑΒ, ΑΓ ΑΒ, ΑΓ ΑΒ, ΑΓ Α Α, ΑΒ ΑΒ ΑΒ ΑΒ 4-16 Λύση

Ευρετική αναζήτηση περιορισµένης µνήµης Α* µε επαναληπτική εκβάθυνση Iterative Deepening A* (IDA*) Επέκταση των κλαδιών πρώτα κατά βάθος. Όριο αποκοπής στη συνάρτηση f(n) = g(n)+h(n) Αν δεν βρεθεί λύση σε κάποιο κόστος, αυξάνεταιτοόριοαποκοπής στο κόστος του «φθηνότερου» κόµβου που κλαδεύτηκε. εν ανιχνεύει επαναλαµβανόµενες καταστάσεις. 4-18

Αναδροµική αναζήτηση πρώτα στο καλύτερο (1/3) Recursive best-first search (RBFS) Σε κάθε κόµβο που επιλέγει να επεκτείνει, θυµάται την καλύτερη τιµή f των γειτονικών του κόµβων. Εάν δεν υπάρχει παιδί µε τιµή f καλύτερη του βέλτιστου γειτονικού κόµβου, η αναζήτηση συνεχίζει από τον βέλτιστο γειτονικό, ενηµερώνοντας τον τρέχοντα κόµβο µε την τιµή του καλύτερου παιδιού του. Γραµµικές απαιτήσεις σε µνήµη. εν ανιχνεύει επαναλαµβανόµενες καταστάσεις. 4-19 Αναδροµική αναζήτηση πρώτα στο καλύτερο (2/3) 4-20

Αναδροµική αναζήτηση πρώτα στο καλύτερο (3/3) 4-21 Απλουστευµένος Α* περιορισµένης µνήµης Simplified memory-bounded A* (SMA*) Ίδιος καταρχήν µε µε τον Α*. Όταν γεµίσει η µνήµη, για κάθε νέο κόµβο διαγράφει έναν παλιό. ιαγράφει πάντα τον κόµβο µε το χειρότερο f(n). Οκόµβος αυτός θα είναι πάντα ένας κόµβος-φύλλο, µιας και για συνεπείς ευρετικούς µηχανισµούς τα παιδιά έχουν πάντα µεγαλύτερη τιµή f από τους γονείς. Σε περίπτωση ισοβαθµίας, διαγράφεται ο παλαιότερος κόµβος. Ητιµή f(n) του κόµβου που διαγράφηκε διατηρείται στον γονικό κόµβο. Πλήρης αλγόριθµος, εκτός και αν η βέλτιστη λύση δεν χωρά στη µνήµη! 4-22

Ευρετικές συναρτήσεις Παζλ των 8 πλακιδίων h 1 =8 h 2 =18 h*=26 h 1 = οαριθµός των πλακιδίων που δεν είναι στη θέση τους. h 2 = το άθροισµα των αποστάσεων των πλακιδίων από τις θέσεις προορισµού τους. Απόσταση Manhattan Παραδεκτέςκαιοιδύο. H h 2 κυριαρχεί της h 1 (χωρίς να υπερεκτιµά) Η h 2 επεκτείνει λιγότερους κόµβους 4-24

ραστικός παράγοντας διακλάδωσης N + 1 = 1 + b* + (b*) 2 + + (b*) d Κόστος αναζήτησης ραστικός παράγοντας διακλάδωσης d IDS A*(h 1 ) A*(h 2 ) IDS A*(h 1 ) A*(h 2 ) 2 10 6 6 2,45 1,79 1,79 4 112 13 12 2,87 1,48 1,45 6 680 20 18 2,73 1,34 1,30 8 6384 39 25 2,80 1,33 1,24 10 47127 93 39 2,79 1,38 1,22 12 3644035 227 73 2,78 1,42 1,24 14 539 113 1,44 1,23 16 1301 211 1,45 1,25 18 3056 363 1,46 1,26 20 7276 676 1,47 1,27 22 24 18094 39135 1219 1641 1,48 1,48 1,28 4-25 1,26 Επινόηση παραδεκτών µηχανισµών: Χαλαρά προβλήµατα Χαλαρά προβλήµατα (relexed problems): Απλοποίηση των κανόνων του προβλήµατος. Το κόστος µιας βέλτιστης λύσης για ένα χαλαρό πρόβληµα είναι ένας παραδεκτός ευρετικός µηχανισµός για το αρχικό πρόβληµα. Κανόνας: Ένα πλακίδιο µπορεί να µετακινηθεί από το τετράγωνο A στο τετράγωνο B αν το A συνορεύει οριζόντια ή κάθετα µε τοb και το B είναι κενό Χαλαροί κανόνες: Ένα πλακίδιο µπορεί να µετακινηθεί από το τετράγωνο A στο τετράγωνο B αν το A συνορεύει µε τοb. ( h 2 ) Ένα πλακίδιο µπορεί να µετακινηθεί από το τετράγωνο A στο τετράγωνο B αν το B είναι κενό. Ένα πλακίδιο µπορεί να µετακινηθεί από το τετράγωνο A στο τετράγωνο B. ( h 1 ) 4-26

Επινόηση παραδεκτών µηχανισµών: Υποπροβλήµατα Βάσεις δεδοµένων προτύπων (pattern databases) Αποθήκευση λύσεων υποπροβληµάτων. Βάσεις δεδοµένων ξένων προτύπων (disjoint pattern databases) Ξεχωριστέςβάσειςδεδοµένων, πρόσθεση των εκτιµήσεών τους, αφαίρεση (πλήρης) τωνκοινώνκινήσεων. 4-27 Αλγόριθµοι τοπικής αναζήτησης και προβλήµατα βελτιστοποίησης

Τοπική αναζήτηση Προβλήµατα βελτιστοποίησης, αντικειµενική συνάρτηση Τοπίο χώρου καταστάσεων 4-29 Αναρρίχηση λόφων Μετακινείται συνεχώς στην καλύτερη γειτονική κατάσταση. Συνήθως διατύπωση µε πλήρεις καταστάσεις Τρέχουσα τιµή h=17 Τοπικό ελάχιστο µε h=1 4-30

Παράδειγµα µε 4 βασίλισσες (1/2) Σε κάθε στήλη θα υπάρχει µία µόνο βασίλισσα. Ξεκινάµε µε όλες τις βασίλισσες στην κάτω γραµµή. Σε κάθε βήµα µπορούµε να µετακινήσουµε µια βασίλισσα σέ µια άλλη θέση στη στήλη της, άρα οι δυνατές κινήσεις είναι 4x3=12. Χρησιμοποιούμε ως ευρετική συνάρτηση το πόσες απειλές υπάρχουν κάθε φορά (όλες οι απειλές είναι διπλές, εμείςτιςμετράμεωςμία απειλή κάθε φορά). 4-31 Παράδειγµα µε 4 βασίλισσες (2/2) 6 3 1 0 Στο συγκεκριµένο παράδειγµα είµασταν τυχεροί, µιας και όλες οι επιλογές µας βγήκαν σωστές. 4-32

Προβλήµατα αναρρίχησης λόφων Προβλήµατα: Τοπικά µέγιστα Κορυφογραµµές Αντιµετώπιση: Πλάγιες κινήσεις Στοχαστική αναζήτηση Επιλέγει τυχαία από τις «καλές» κινήσεις Αναρρίχηση λόφων µε την πρώτη επιλογή Τυχαίες επανεκκινήσεις (πλήρης αλγόριθµος) Οροπέδια 4-33 Προσοµοιωµένη ανόπτηση (Simulated annealing) Προ-επιλέγει τυχαία µια κίνηση. Αν αυτή βελτιώνει τα πράγµατα, γίνεται αποδεκτή. Αν τα χειροτερεύει, γίνεται αποδεκτή µε πιθανότηταp=e Ε/Τ, Ε<0, η χειροτέρευση Τ>0, «θερµοκρασία» Η θερµοκρασία µειώνεται µε την πάροδο του χρόνου. 4-34

Τοπική ακτινική αναζήτηση (local beam search) Επιλέγονται k τυχαίες αρχικές καταστάσεις. Εκτελούνται k αναζητήσεις παράλληλα. Σε κάθε βήµα επιλέγονται τα k καλύτερα παιδιά από όλα τα παιδιά του προηγούµενου βήµατος. Κίνδυνος συγκέντρωσης όλων των αναζητήσεων γύρω από το ίδιο κλαδί. Αντιµετώπιση: Στοχαστική επιλογή των k παιδιών. 4-35 Γενετικοί αλγόριθµοι (1/2) Οι διάδοχες καταστάσεις παράγονται µε το συνδυασµό δύο γονικών καταστάσεων, και όχι µε την τροποποίηση µιας µεµονωµένης κατάστασης. Αρχικός πληθυσµός. Στοχαστική επιλογή γονέων. Συνάρτηση καταλληλότητας = Ευρετική συνάρτηση 4-36

Γενετικοί αλγόριθµοι (2/2) 4-37 Τοπική αναζήτηση σε συνεχείς χώρους

Συνεχείς χώροι Άπειρος αριθµών διάδοχων καταστάσεων Παράδειγµα: Τοποθέτηση 3 αεροδροµίων στη Ρουµανία µε ελαχιστοποίηση του αθροίσµατος των αποστάσεων των πόλεων. Χώρος 6 διαστάσεων Αντικειµενική συνάρτηση: f(x 1,y 1,x 2,y 2,x 3,y 3 ) ιακριτοποίηση, βήµα ±δ 4-39 Πλέον απότοµη ανάβαση (steapest-ascent hill climbing) Κλίση: f f = ( x f, y f, x f, y f, x f, 1 1 2 2 3 y3 ) Πλέον απότοµη ανάβαση: x x + α f(x) Εµπειρική κλίση Ευθύγραµµη αναζήτηση 4-40

Πράκτορες online αναζήτησης και άγνωστα περιβάλλοντα Online αναζήτηση Επεξεργασία δεδοµένων πριν γίνει διαθέσιµο το σύνολό τους ιαπλοκή (interleaving) υπολογισµών και ενεργειών Κατάλληλη για πεδία: υναµικά Ηµιδυναµικά Στοχαστικά Μια offline αναζήτηση θα έπρεπε να καταστρώνει ένα εκθετικά µεγάλο πλάνο ενδεχοµένων που να παίρνει υπόψη όλα όσα είναι δυνατό να συµβούν. Προβλήµατα εξερεύνησης: Οι καταστάσεις του κόσµου και τα αποτελέσµατα των ενεργειών είναι άγνωστα. 4-42

Προβλήµατα online αναζήτησης (1/2) Ο πράκτορας πρέπει να εκτελέσει τις ενέργειες για να µάθει τα αποτελέσµατά τους! Γνώση πράκτορα: Ξέρει ποιες είναι οι ενέργειές του Γνωρίζει το κόστος κάθε βήµατος Μπορεί να καταλάβει εάν πέτυχε το στόχο 4-43 Προβλήµατα online αναζήτησης (2/2) Παραδοχές (απλουστευτικές): Θυµάται τις καταστάσεις που επισκέφθηκε Αιτιοκρατικές ενέργειες Γνωρίζει µια παραδεκτή ευρετική συνάρτηση (π.χ. απόσταση Manhattan) Στόχος: Να φθάσει στον προορισµό Κόστος: Τα βήµατα που εκτέλεσε Ανταγωνιστικός λόγος (competitive ratio): Πραγµατικό κόστος / βέλτιστο κόστος 4-44

Αδιέξοδα Εάνοιενέργειεςδεναντιστρέφονται, ο πράκτοραςµπορεί να παγιδευτεί. Κανένας αλγόριθµος δεν µπορεί να αποφεύγει τα αδιέξοδα σε όλους τους χώρους καταστάσεων. 4-45 Ασφαλώς εξερευνήσιµοι χώροι Από κάθε προσπελάσιµη κατάσταση είναι προσπελάσιµη κάποια κατάσταση στόχου. Ωστόσο το κόστος µπορεί να είναι µη-φραγµένο. 4-46

Πράκτορες online αναζήτησης Έπειτα από κάθε ενέργεια, ένας πράκτορας online προσλαµβάνει µια αντίληψη που του λέει σε ποια κατάσταση έχει φτάσει. Μπορεί να βελτιώσει το χάρτη του περιβάλλοντος που έχει. Επέκταση κόµβων µε τοπική προτεραιότητα. εν µπορούν να χρησιµοποιηθούν αλγόριθµοι που εκτελούν άλµατα (όπως π.χ. ο Α*). Εξερεύνηση πρώτα κατά βάθος Πρόβληµα οιεπιστροφές, αναστρέψιµες ενέργειες Επαναληπτική εκβάθυνση 4-47 Τοπική online αναζήτηση Τοπική αναζήτηση αναρρίχησης λόφων Πρόβληµα µε τα οροπέδια, δεν µπορούµε να εκτελέσουµε τυχαίες επανεκκινήσεις. Τυχαίος περίπατος (random walk) Τυχαία επιλογή βηµάτων, αποφυγή επανάληψης Στο παρακάτω σχήµα, η επιστροφή προς το S είναι πάντα 2 φορές πιο πιθανή από την πορεία προς το G. Εκθετικό κόστος. 4-48

Α* πραγµατικού χρόνου που µαθαίνει (1/3) (Learning real-time A*, LRTA*) Οπράκτοραςµεταβαίνει πάντα στην καλύτερη γειτονική κατάσταση. Εάν πρόκειται για κατάσταση που επισκέπτεται ο πράκτορας για πρώτη φορά, αυτή βαθµολογείται µε την ευρετική συνάρτηση, αλλιώς διατηρεί την όποια βαθµολογία της. Αισιοδοξία υπό αβεβαιότητα Η κατάσταση από την οποία έγινε η µετάβαση βαθµολογείται µε το άθροισµα του κόστους µετάβασης και της βαθµολογίας της νέας κατάστασης. Ο πράκτορας πρέπει να θυµάται τις νέες βαθµολογίες, γιατί αυτές δεν προκύπτουν πλέον από την ευρετική συνάρτηση. 4-49 Α* πραγµατικού χρόνου που µαθαίνει (2/3) (Learning real-time A*, LRTA*) 4-50

Α* πραγµατικού χρόνου που µαθαίνει (3/3) (Learning real-time A*, LRTA*) Είναι πλήρης για πεπερασµένα, ασφαλώς εξερευνήσιµα περιβάλλοντα. εν είναι πλήρης για άπειρους χώρους καταστάσεων. Πολυπλοκότητα: Ο(n 2 ), όπου n το πλήθος των καταστάσεων. 4-51