ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

Σχετικά έγγραφα
ΤΕΧΝΗΤΗ ΝΟΗΜΟΣΥΝΗ. Ενότητα 3: Αλγόριθμοι πληροφορημένης αναζήτησης. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής

Πληροφορηµένη αναζήτηση και εξερεύνηση

ΤΕΧΝΗΤΗ ΝΟΗΜΟΣΥΝΗ. Ενότητα 5: Παραδείγματα. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής

Θεωρία Λήψης Αποφάσεων

ΠΛΗ 405 Τεχνητή Νοηµοσύνη

Θεωρία Λήψης Αποφάσεων

Ε ανάληψη. Ε αναλαµβανόµενες καταστάσεις. Αναζήτηση µε µερική ληροφόρηση. Πληροφορηµένη αναζήτηση. µέθοδοι αποφυγής

ΠΛΗ 405 Τεχνητή Νοηµοσύνη

Ε ανάληψη. Α ληροφόρητη αναζήτηση

Τεχνητή Νοημοσύνη. 4η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

ΠΛΗ 405 Τεχνητή Νοηµοσύνη

Επίλυση Προβλημάτων. Περιγραφή Προβλημάτων Αλγόριθμοι αναζήτησης Αλγόριθμοι τυφλής αναζήτησης. Αλγόριθμοι ευρετικής αναζήτησης Παιχνίδια δύο αντιπάλων

Τεχνητή Νοημοσύνη (ΥΠ23) 6 ο εξάμηνο Τμήμα Πληροφορικής και Τηλεματικής Χαροκόπειο Πανεπιστήμιο Ουρανία Χατζή

ΚΑΙ ΕΞΕΡΕΥΝΗΣΗ 4.1 ΣΤΡΑΤΗΓΙΚΕΣ ΠΛΗΡΟΦΟΡΗΜΕΝΗΣ (ΕΥΡΕΤΙΚΗΣ) ΑΝΑΖΗΤΗΣΗΣ

ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ

Επίλυση προβληµάτων. Περιγραφή προβληµάτων Αλγόριθµοι αναζήτησης

Τεχνητή Νοημοσύνη. 3η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΤΕΧΝΗΤΗ ΝΟΗΜΟΣΥΝΗ. Τελικές εξετάσεις Παρασκευή 4 Ιουλίου 2014, 18:00-21:00

Ασκήσεις μελέτης της 4 ης διάλεξης. ), για οποιοδήποτε μονοπάτι n 1

6 η Διάλεξη. Ενδεικτικές λύσεις ασκήσεων

ΤΥΦΛΗ ΑΝΑΖΗΤΗΣΗ (1) ΣΤΡΑΤΗΓΙΚΗ Ή ΑΛΓΟΡΙΘΜΟΣ ΑΝΑΖΗΤΗΣΗΣ

Πανεπιστήμιο Δυτικής Μακεδονίας. Τμήμα Μηχανικών Πληροφορικής & Τηλεπικοινωνιών. Τεχνητή Νοημοσύνη. Ενότητα 3: Αναζήτηση

Επίλυση προβλημάτων με αναζήτηση

Τεχνητή Νοημοσύνη (ΥΠ23) 6 ο εξάμηνο Τμήμα Πληροφορικής και Τηλεματικής Χαροκόπειο Πανεπιστήμιο Ουρανία Χατζή

ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

Αναζήτηση (Search) συνέχεια. Τµήµα Ψηφιακών Συστηµάτων Πανεπιστήµιο Πειραιώς

Τεχνητή Νοημοσύνη. 5η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

ΥΣ02 Τεχνητή Νοημοσύνη Χειμερινό Εξάμηνο

Αλγόριθμοι Τυφλής Αναζήτησης

Τεχνητή Νοημοσύνη (ΥΠ23) 6 ο εξάμηνο Τμήμα Πληροφορικής και Τηλεματικής Χαροκόπειο Πανεπιστήμιο Ουρανία Χατζή

Για παράδειγμα η αρχική και η τελική κατάσταση αναπαριστώνται ως εξής: (ένα λίτρο)

Εφαρμόζονται σε προβλήματα στα οποία δεν υπάρχει πληροφορία που να επιτρέπει την αξιολόγηση των καταστάσεων του χώρου αναζήτησης.

ΤΕΧΝΗΤΗ ΝΟΗΜΟΣΥΝΗ. Ενότητα 2: Δένδρο αναζήτησης. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής

Επίλυση Προβλημάτων και Τεχνικές Αναζήτησης Εισαγωγή

Θεωρία Λήψης Αποφάσεων

Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος

Επίλυση Προβλημάτων 1

Μαθηματικά των Υπολογιστών και των Αποφάσεων Τεχνητή Νοημοσύνη 1η Σειρά Ασκήσεων

ΤΕΧΝΗΤΗ ΝΟΗΜΟΣΥΝΗ. Ενότητα 6: Προβλήματα ικανοποίησης περιορισμών. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής

Αναζήτηση σε Γράφους. Μανόλης Κουμπαράκης. ΥΣ02 Τεχνητή Νοημοσύνη 1

Θεωρήστε ένα puzzle (παιχνίδι σπαζοκεφαλιάς) με την ακόλουθη αρχική διαμόρφωση : b b b w w w e

ΑΛΓΟΡΙΘΜΙΚΕΣ ΜΕΘΟΔΟΙ ΒΕΛΤΙΣΤΟΠΟΙΗΣΗΣ

ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕΔΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΤΕΧΝΗΤΗ ΝΟΗΜΟΣΥΝΗ

Επίλυση Προβλημάτων 1

Τεχνητή Νοημοσύνη. 5η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

Τεχνητή Νοημοσύνη Ι. Εργαστηριακή Άσκηση 4-6. Σγάρμπας Κυριάκος. Τμήμα Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστων

ΧΑΡΟΚΟΠΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΘΗΝΩΝ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ & ΤΗΛΕΜΑΤΙΚΗΣ

Κεφάλαιο 3. Αλγόριθµοι Τυφλής Αναζήτησης. Τεχνητή Νοηµοσύνη - Β' Έκδοση. Ι. Βλαχάβας, Π. Κεφαλάς, Ν. Βασιλειάδης, Φ. Κόκκορας, Η.

Τεχνητή Νοημοσύνη. 2η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

Τεχνητή Νοημοσύνη. 6η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

Θεωρία Λήψης Αποφάσεων

Συστήματα Επιχειρηματικής Ευφυίας. Οι αλγόριθμοι Hill Climbing, Simulated Annealing, Great Deluge, VNS, Tabu Search

Επίλυση προβληµάτων. Αλγόριθµοι Αναζήτησης

Επίλυση Προβλημάτων 1

ΠΛΗ 405 Τεχνητή Νοηµοσύνη

Τεχνητή Νοημοσύνη. 17η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

Ασκήσεις μελέτης της 8 ης διάλεξης

Επίλυση προβληµάτων. Περιγραφή προβληµάτων Αλγόριθµοι αναζήτησης Αλγόριθµοι τυφλής αναζήτησης Αλγόριθµοι ευρετικής αναζήτησης

Δομές Δεδομένων & Αλγόριθμοι

ΥΣ02 Τεχνητή Νοημοσύνη Χειμερινό Εξάμηνο

Ε ανάληψη. Ορισµοί της Τεχνητής Νοηµοσύνης (ΤΝ) Καταβολές. Ιστορική αναδροµή. Πράκτορες. Περιβάλλοντα. κριτήρια νοηµοσύνης

ΠΛΗ 405 Τεχνητή Νοηµοσύνη

Επίλυση προβληµάτων µε αναζήτηση

Αλγόριθμοι και Δομές Δεδομένων (Ι) (εισαγωγικές έννοιες)

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΑΝΑΛΥΣΗ ΑΛΓΟΡΙΘΜΩΝ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ Τμήμα Πληροφορικής

PROJECT ΣΤΟ ΜΑΘΗΜΑ ΕΙΣΑΓΩΓΗ ΣΤΙΣ ΕΥΡΕΤΙΚΕΣ ΜΕΘΟ ΟΥΣ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΜΑΚΕ ΟΝΙΑΣ ΟΙΚΟΝΟΜΙΚΩΝ ΚΑΙ ΚΟΙΝΩΝΙΚΩΝ ΕΠΙΣΤΗΜΩΝ ΤΜΗΜΑ ΕΦΑΡΜΟΣΜΕΝΗΣ ΠΛΗΡΟΦΟΡΙΚΗΣ ΤΕΧΝΗΤΗ ΝΟΗΜΟΣΥΝΗ

Βασίλειος Μαχαιράς Πολιτικός Μηχανικός Ph.D.

Τι είναι αλγόριθμος; Υποπρογράμματα (υποαλγόριθμοι) Βασικές αλγοριθμικές δομές

Επίλυση Προβλημάτων. Αποτελεί ένα από τα βασικά χαρακτηριστικά γνωρίσματα της νοημοσύνης.

Τεχνητή Νοημοσύνη (ΥΠ23) 6 ο εξάμηνο Τμήμα Πληροφορικής και Τηλεματικής Χαροκόπειο Πανεπιστήμιο Ουρανία Χατζή

ΑΛΓΟΡΙΘΜΟΙ ΑΝΟΠΤΗΣΗΣ: Ο ΑΛΓΟΡΙΘΜΟΣ ΤΗΣ ΑΠΟ ΟΧΗΣ ΚΑΤΩΦΛΙΟΥ (THRESHOLD ACCEPTING)

PROJECT ΣΤΟ ΜΑΘΗΜΑ "ΕΙΣΑΓΩΓΗ ΣΤΙΣ ΕΥΡΕΤΙΚΕΣ ΜΕΘΟΔΟΥΣ"

Περιεχόμενα. Εισαγωγή του επιμελητή, Γιάννης Σταματίου 15 Πρόλογος 17 Εισαγωγή 23. Μέρος I. ΕΠΑΝΑΛΗΠΤΙΚΟΙ ΑΛΓΟΡΙΘΜΟΙ ΚΑΙ ΑΝΑΛΛΟΙΩΤΕΣ ΣΥΝΘΗΚΕΣ

Τεχνητή Νοημοσύνη. 16η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

Στοχαστικές Στρατηγικές. διαδρομής (3)

Πρόβληµα ικανοποίησης περιορισµών

On line αλγόριθμοι δρομολόγησης για στοχαστικά δίκτυα σε πραγματικό χρόνο

ΑΛΓΟΡΙΘΜΙΚΕΣ ΜΕΘΟΔΟΙ ΒΕΛΤΙΣΤΟΠΟΙΗΣΗΣ

ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

ΕΦΑΡΜΟΓΕΣ ΔΙΟΙΚΗΤΙΚΗΣ ΕΠΙΣΤΗΜΗΣ

Τεχνητή Νοημοσύνη ( )

Ασκήσεις ανακεφαλαίωσης στο μάθημα Τεχνητή Νοημοσύνη

Εισαγωγή στους Αλγόριθμους. Παύλος Εφραιμίδης, Λέκτορας

Τμήμα Μηχανικών Πληροφορικής ΤΕ Η μέθοδος Simplex. Γκόγκος Χρήστος ΤΕΙ Ηπείρου Επιχειρησιακή Έρευνα. τελευταία ενημέρωση: 19/01/2017

Αλγόριθµοι Ευριστικής Αναζήτησης

Όρια Αλγόριθμων Ταξινόμησης. Εισαγωγή στην Ανάλυση Αλγορίθμων Μάγια Σατρατζέμη

Ε ανάληψη. Καταβολές. Ιστορική αναδροµή. Πράκτορες. Περιβάλλοντα. συνεισφορά άλλων επιστηµών στην ΤΝ σήµερα

Ειδικά θέματα Αλγορίθμων και Δομών Δεδομένων (ΠΛΕ073) Απαντήσεις 1 ου Σετ Ασκήσεων

Αλγόριθµοι Ευριστικής Αναζήτησης

Κεφάλαιο 5: Στρατηγική χωροταξικής διάταξης

Κεφάλαιο 5 Ανάλυση Αλγορίθμων

Μη γράφετε στο πίσω μέρος της σελίδας

Η μέθοδος Simplex. Γεωργία Φουτσιτζή-Γκόγκος Χρήστος ΤΕΙ Ηπείρου Επιχειρησιακή Έρευνα. Τμήμα Μηχανικών Πληροφορικής ΤΕ

Ασκήσεις μελέτης της 6 ης διάλεξης

5. Απλή Ταξινόμηση. ομές εδομένων. Χρήστος ουλκερίδης. Πανεπιστήμιο Πειραιώς Σχολή Τεχνολογιών Πληροφορικής και Επικοινωνιών Τμήμα Ψηφιακών Συστημάτων

Α Ν Α Λ Τ Η Α Λ Γ Ο Ρ Ι Θ Μ Ω Ν Κ Ε Υ Α Λ Α Ι Ο 5. Πως υπολογίζεται ο χρόνος εκτέλεσης ενός αλγορίθμου;

Βασίλειος Μαχαιράς Πολιτικός Μηχανικός Ph.D.

Transcript:

ΤΕΙ Δυτικής Μακεδονίας ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ 2014-2015 Τεχνητή Νοημοσύνη Πληροφορημένη αναζήτηση και εξερεύνηση Διδάσκων: Τσίπουρας Μάρκος Εκπαιδευτικό Υλικό: Τσίπουρας Μάρκος http://ai.uom.gr/aima/

2 Στρατηγικές πληροφορημένης αναζήτησης Πληροφορημένη αναζήτηση (informed search) Συνάρτηση αξιολόγησης (evaluation function), f(n) Προτιμώνται οι μικρότερες τιμές Ευρετική συνάρτηση (heuristic function), h(n) Συνήθως εκτίμηση απόστασης από στόχο

3 Αναζήτηση πρώτα στο καλύτερο (1/5) f(n)=h(n) h SLD : Straight-Line Distance heuristic (ευθύγραμμη απόσταση)

4 Αναζήτηση πρώτα στο καλύτερο (2/5) Τιμές h SLD για απόσταση από Βουκουρέστι Arad 366 Mehadia 241 Bucharest 0 Neamt 234 Craiova 160 Oradea 380 Dobreta 242 Pitesti 100 Eforie 161 Rimniscu Vilcea 193 Fagaras 176 Sibiu 253 Giurgiu 77 Timisoara 329 Hirsova 151 Urziceni 80 Iasi 226 Vaslui 199 Lugoj 244 Zerind 374

5 Αναζήτηση πρώτα στο καλύτερο (3/5) Μετάβαση από το Arad στο Βουκουρέστι

6 Αναζήτηση πρώτα στο καλύτερο (4/5) Η διαδρομή που βρέθηκε δεν είναι η συντομότερη.

7 Αναζήτηση πρώτα στο καλύτερο (5/5) Επιρρεπής σε λανθασμένες εκτιμήσεις: Μετάβαση από Iasi σε Fagaras Έχει ομοιότητα με την αναζήτηση πρώτα κατά βάθος. Μπορεί να μπλέξει σε ατέρμονα κλαδιά. Χρονική, χωρική πολυπλοκότητα χειρότερης περίπτωσης: Ο(b m )

8 Αναζήτηση Α* (1/3) f(n)=g(n)+h(n) Παραδεκτός ευρετικός μηχανισμός h(n): Δεν κάνει υπερκτιμήσεις. π.χ. h SLD Η αναζήτηση A* χωρίς κλάδεμα επαναλαμβανόμενων καταστάσεων είναι βέλτιστη αν η h(n) είναι παραδεκτή.

Αναζήτηση Α* (2/3) 9

Αναζήτηση Α* (3/3) 10

11 Συνεπείς ευρετικές συναρτήσεις Μια ευρετική συνάρτηση λέγεται συνεπής (consistent) ή μονοτονική, εάν ισχύει: h(n) c(n, a, n') + h(n') Η αναζήτηση A* με κλάδεμα επαναλαμβανόμενων καταστάσεων, χωρίς να λαμβάνεται υπόψη εάν η νέα κατάσταση έχει μικρότερη τιμή f(n) από την παλιά, είναι βέλτιστη αν η h(n) είναι συνεπής. Μια συνεπής ευρετική συνάρτηση είναι και παραδεκτή. Οι περισσότερες παραδεκτές ευρετικές συναρτήσεις είναι και συνεπείς (π.χ. h SLD )

12 Ισοϋψείς καμπύλες Αν η h(n) είναι συνεπής, τότε οι τιμές της f(n) πάνω σε οποιαδήποτε διαδρομή είναι μη φθίνουσες. Ισοϋψείς καμπύλες

13 Αποδοτικότητα Α* Βέλτιστος και πλήρης Βέλτιστα αποδοτικός: Εξερευνά τις λιγότερες καταστάσεις από όλους τους βέλτιστους και πλήρεις αλγορίθμους. Μεγάλες (εκθετικές) απαιτήσεις σε χρόνο και (κυρίως) σε μνήμη.

Παράδειγμα: Μη-Παραδεκτή Συνάρτηση 14 A h=4 F=0+4=4 Αρχική h=2 Β 4 F=4+2=6 3 3 h=5 F=3+5=8 Γ 3 Δ h=0 F1=7+0=7 F2=6+0=6 Τελική Μέτωπο αναζήτησης Κλειστό σύνολο Τρέχουσα κατάσταση Παιδιά Α 4 Α ΑΒ 6, ΑΓ 8 ΑΒ 6, ΑΓ 8 Α ΑΒ 6 ΑΒΔ 7 ΑΒΔ 7, ΑΓ 8 Α, ΑΒ ΑΒΔ 7 Λύση 4-14

Παράδειγμα: Παραδεκτή Συνάρτηση 15 A h=4 F=0+4=4 Αρχική h=2 Β 4 F=4+2=6 3 3 h=3 F=3+3=6 Γ 3 Δ h=0 F1=7+0=7 F2=6+0=6 Τελική Μέτωπο αναζήτησης Κλειστό σύνολο Τρέχουσα κατάσταση Παιδιά Α 4 Α ΑΒ 6, ΑΓ 6 ΑΒ 6, ΑΓ 6 A ΑΒ 6 ΑΒΔ 7 ΑΓ 6, ΑΒΔ 7 Α, ΑΒ ΑΓ 6 ΑΓΔ 6 ΑΓΔ 6, ΑΒΔ 7 Α, ΑΓ, ΑΒ ΑΓΔ 6 Λύση 4-15

Παράδειγμα: Σύγκριση BestFS και A* 16 A Αρχική h=4 4 h=2 Β 3 3 Γ 3 h=3 h=0 Δ Τελική Λύση στο προηγούμενο παράδειγμα με χρήση BestFS: Μέτωπο αναζήτησης Κλειστό σύνολο Τρέχουσα κατάσταση Παιδιά Α Α ΑΒ, ΑΓ ΑΒ, ΑΓ Α ΑΒ ΑΒΔ ΑΒΔ, ΑΓ Α, ΑΒ ΑΒΔ Λύση 4-16

Ευρετική αναζήτηση περιορισμένης μνήμης

18 Α* με επαναληπτική εκβάθυνση Iterative Deepening A* (IDA*) Επέκταση των κλαδιών πρώτα κατά βάθος. Όριο αποκοπής στη συνάρτηση f(n) = g(n)+h(n) Αν δεν βρεθεί λύση σε κάποιο κόστος, αυξάνεται το όριο αποκοπής στο κόστος του «φθηνότερου» κόμβου που κλαδεύτηκε. Δεν ανιχνεύει επαναλαμβανόμενες καταστάσεις.

19 Αναδρομική αναζήτηση πρώτα στο καλύτερο (1/3) Recursive best-first search (RBFS) Σε κάθε κόμβο που επιλέγει να επεκτείνει, θυμάται την καλύτερη τιμή f των γειτονικών του κόμβων. Εάν δεν υπάρχει παιδί με τιμή f καλύτερη του βέλτιστου γειτονικού κόμβου, η αναζήτηση συνεχίζει από τον βέλτιστο γειτονικό, ενημερώνοντας τον τρέχοντα κόμβο με την τιμή του καλύτερου παιδιού του. Γραμμικές απαιτήσεις σε μνήμη. Δεν ανιχνεύει επαναλαμβανόμενες καταστάσεις.

Αναδρομική αναζήτηση πρώτα στο καλύτερο (2/3) 20

Αναδρομική αναζήτηση πρώτα στο καλύτερο (3/3) 21

22 Απλουστευμένος Α* περιορισμένης μνήμης Simplified memory-bounded A* (SMA*) Ίδιος καταρχήν με με τον Α*. Όταν γεμίσει η μνήμη, για κάθε νέο κόμβο διαγράφει έναν παλιό. Διαγράφει πάντα τον κόμβο με το χειρότερο f(n). Ο κόμβος αυτός θα είναι πάντα ένας κόμβος-φύλλο, μιας και για συνεπείς ευρετικούς μηχανισμούς τα παιδιά έχουν πάντα μεγαλύτερη τιμή f από τους γονείς. Σε περίπτωση ισοβαθμίας, διαγράφεται ο παλαιότερος κόμβος. Η τιμή f(n) του κόμβου που διαγράφηκε διατηρείται στον γονικό κόμβο. Πλήρης αλγόριθμος, εκτός και αν η βέλτιστη λύση δεν χωρά στη μνήμη!

Ευρετικές συναρτήσεις

24 Παζλ των 8 πλακιδίων h 1 =8 h 2 =18 h*=26 h 1 = ο αριθμός των πλακιδίων που δεν είναι στη θέση τους. h 2 = το άθροισμα των αποστάσεων των πλακιδίων από τις θέσεις προορισμού τους. Απόσταση Manhattan Παραδεκτές και οι δύο. H h 2 κυριαρχεί της h 1 (χωρίς να υπερεκτιμά) Η h 2 επεκτείνει λιγότερους κόμβους

25 Δραστικός παράγοντας διακλάδωσης N + 1 = 1 + b* + (b*) 2 + + (b*) d Κόστος αναζήτησης Δραστικός παράγοντας διακλάδωσης d IDS A*(h 1 ) A*(h 2 ) IDS A*(h 1 ) A*(h 2 ) 2 10 6 6 2,45 1,79 1,79 4 112 13 12 2,87 1,48 1,45 6 680 20 18 2,73 1,34 1,30 8 6384 39 25 2,80 1,33 1,24 10 47127 93 39 2,79 1,38 1,22 12 3644035 227 73 2,78 1,42 1,24 14 539 113 1,44 1,23 16 1301 211 1,45 1,25 18 3056 363 1,46 1,26 20 7276 676 1,47 1,27 22 18094 1219 1,48 1,28 24 39135 1641 1,48 1,26 4-25

26 Επινόηση παραδεκτών μηχανισμών: Χαλαρά προβλήματα Χαλαρά προβλήματα (relexed problems): Απλοποίηση των κανόνων του προβλήματος. Το κόστος μιας βέλτιστης λύσης για ένα χαλαρό πρόβλημα είναι ένας παραδεκτός ευρετικός μηχανισμός για το αρχικό πρόβλημα. Κανόνας: Ένα πλακίδιο μπορεί να μετακινηθεί από το τετράγωνο A στο τετράγωνο B αν το A συνορεύει οριζόντια ή κάθετα με το B και το B είναι κενό Χαλαροί κανόνες: Ένα πλακίδιο μπορεί να μετακινηθεί από το τετράγωνο A στο τετράγωνο B αν το A συνορεύει με το B. ( h 2 ) Ένα πλακίδιο μπορεί να μετακινηθεί από το τετράγωνο A στο τετράγωνο B αν το B είναι κενό. Ένα πλακίδιο μπορεί να μετακινηθεί από το τετράγωνο A στο τετράγωνο B. ( h 1 )

27 Επινόηση παραδεκτών μηχανισμών: Υποπροβλήματα Βάσεις δεδομένων προτύπων (pattern databases) Αποθήκευση λύσεων υποπροβλημάτων. Βάσεις δεδομένων ξένων προτύπων (disjoint pattern databases) Ξεχωριστές βάσεις δεδομένων, πρόσθεση των εκτιμήσεών τους, αφαίρεση (πλήρης) των κοινών κινήσεων.

Αλγόριθμοι τοπικής αναζήτησης και προβλήματα βελτιστοποίησης

29 Τοπική αναζήτηση Προβλήματα βελτιστοποίησης, αντικειμενική συνάρτηση Τοπίο χώρου καταστάσεων

30 Αναρρίχηση λόφων Μετακινείται συνεχώς στην καλύτερη γειτονική κατάσταση. Συνήθως διατύπωση με πλήρεις καταστάσεις Τρέχουσα τιμή h=17 Τοπικό ελάχιστο με h=1

31 Παράδειγμα με 4 βασίλισσες (1/2) Σε κάθε στήλη θα υπάρχει μία μόνο βασίλισσα. Ξεκινάμε με όλες τις βασίλισσες στην κάτω γραμμή. Σε κάθε βήμα μπορούμε να μετακινήσουμε μια βασίλισσα σέ μια άλλη θέση στη στήλη της, άρα οι δυνατές κινήσεις είναι 4x3=12. Χρησιμοποιούμε ως ευρετική συνάρτηση το πόσες απειλές υπάρχουν κάθε φορά (όλες οι απειλές είναι διπλές, εμείς τις μετράμε ως μία απειλή κάθε φορά).

32 Παράδειγμα με 4 βασίλισσες (2/2) 6 3 1 0 Στο συγκεκριμένο παράδειγμα είμασταν τυχεροί, μιας και όλες οι επιλογές μας βγήκαν σωστές.

33 Προβλήματα αναρρίχησης λόφων Προβλήματα: Τοπικά μέγιστα Κορυφογραμμές Αντιμετώπιση: Πλάγιες κινήσεις Στοχαστική αναζήτηση Επιλέγει τυχαία από τις «καλές» κινήσεις Αναρρίχηση λόφων με την πρώτη επιλογή Τυχαίες επανεκκινήσεις (πλήρης αλγόριθμος) Οροπέδια

34 Προσομοιωμένη ανόπτηση (Simulated annealing) Προ-επιλέγει τυχαία μια κίνηση. Αν αυτή βελτιώνει τα πράγματα, γίνεται αποδεκτή. Αν τα χειροτερεύει, γίνεται αποδεκτή με πιθανότητα P=e ΔΕ/Τ, ΔΕ<0, η χειροτέρευση Τ>0, «θερμοκρασία» Η θερμοκρασία μειώνεται με την πάροδο του χρόνου.

35 Τοπική ακτινική αναζήτηση (local beam search) Επιλέγονται k τυχαίες αρχικές καταστάσεις. Εκτελούνται k αναζητήσεις παράλληλα. Σε κάθε βήμα επιλέγονται τα k καλύτερα παιδιά από όλα τα παιδιά του προηγούμενου βήματος. Κίνδυνος συγκέντρωσης όλων των αναζητήσεων γύρω από το ίδιο κλαδί. Αντιμετώπιση: Στοχαστική επιλογή των k παιδιών.

36 Γενετικοί αλγόριθμοι (1/2) Οι διάδοχες καταστάσεις παράγονται με το συνδυασμό δύο γονικών καταστάσεων, και όχι με την τροποποίηση μιας μεμονωμένης κατάστασης. Αρχικός πληθυσμός. Στοχαστική επιλογή γονέων. Συνάρτηση καταλληλότητας = Ευρετική συνάρτηση

Γενετικοί αλγόριθμοι (2/2) 37

Τοπική αναζήτηση σε συνεχείς χώρους

39 Συνεχείς χώροι Άπειρος αριθμών διάδοχων καταστάσεων Παράδειγμα: Τοποθέτηση 3 αεροδρομίων στη Ρουμανία με ελαχιστοποίηση του αθροίσματος των αποστάσεων των πόλεων. Χώρος 6 διαστάσεων Αντικειμενική συνάρτηση: f(x 1,y 1,x 2,y 2,x 3,y 3 ) Διακριτοποίηση, βήμα ±δ 4-39

Πλέον απότομη ανάβαση (steapest-ascent hill climbing) ),,,,, ( 3 3 2 2 1 1 y f x f y f x f y f x f f 40 Κλίση: Πλέον απότομη ανάβαση: x x + α f(x) Εμπειρική κλίση Ευθύγραμμη αναζήτηση

Πράκτορες online αναζήτησης και άγνωστα περιβάλλοντα

42 Online αναζήτηση Επεξεργασία δεδομένων πριν γίνει διαθέσιμο το σύνολό τους Διαπλοκή (interleaving) υπολογισμών και ενεργειών Κατάλληλη για πεδία: Δυναμικά Ημιδυναμικά Στοχαστικά Μια offline αναζήτηση θα έπρεπε να καταστρώνει ένα εκθετικά μεγάλο πλάνο ενδεχομένων που να παίρνει υπόψη όλα όσα είναι δυνατό να συμβούν. Προβλήματα εξερεύνησης: Οι καταστάσεις του κόσμου και τα αποτελέσματα των ενεργειών είναι άγνωστα.

43 Προβλήματα online αναζήτησης (1/2) Ο πράκτορας πρέπει να εκτελέσει τις ενέργειες για να μάθει τα αποτελέσματά τους! Γνώση πράκτορα: Ξέρει ποιες είναι οι ενέργειές του Γνωρίζει το κόστος κάθε βήματος Μπορεί να καταλάβει εάν πέτυχε το στόχο

44 Προβλήματα online αναζήτησης (2/2) Παραδοχές (απλουστευτικές): Θυμάται τις καταστάσεις που επισκέφθηκε Αιτιοκρατικές ενέργειες Γνωρίζει μια παραδεκτή ευρετική συνάρτηση (π.χ. απόσταση Manhattan) Στόχος: Να φθάσει στον προορισμό Κόστος: Τα βήματα που εκτέλεσε Ανταγωνιστικός λόγος (competitive ratio): Πραγματικό κόστος / βέλτιστο κόστος

45 Αδιέξοδα Εάν οι ενέργειες δεν αντιστρέφονται, ο πράκτορας μπορεί να παγιδευτεί. Κανένας αλγόριθμος δεν μπορεί να αποφεύγει τα αδιέξοδα σε όλους τους χώρους καταστάσεων.

46 Ασφαλώς εξερευνήσιμοι χώροι Από κάθε προσπελάσιμη κατάσταση είναι προσπελάσιμη κάποια κατάσταση στόχου. Ωστόσο το κόστος μπορεί να είναι μη-φραγμένο.

47 Πράκτορες online αναζήτησης Έπειτα από κάθε ενέργεια, ένας πράκτορας online προσλαμβάνει μια αντίληψη που του λέει σε ποια κατάσταση έχει φτάσει. Μπορεί να βελτιώσει το χάρτη του περιβάλλοντος που έχει. Επέκταση κόμβων με τοπική προτεραιότητα. Δεν μπορούν να χρησιμοποιηθούν αλγόριθμοι που εκτελούν άλματα (όπως π.χ. ο Α*). Εξερεύνηση πρώτα κατά βάθος Πρόβλημα οι επιστροφές, αναστρέψιμες ενέργειες Επαναληπτική εκβάθυνση

48 Τοπική online αναζήτηση Τοπική αναζήτηση αναρρίχησης λόφων Πρόβλημα με τα οροπέδια, δεν μπορούμε να εκτελέσουμε τυχαίες επανεκκινήσεις. Τυχαίος περίπατος (random walk) Τυχαία επιλογή βημάτων, αποφυγή επανάληψης Στο παρακάτω σχήμα, η επιστροφή προς το S είναι πάντα 2 φορές πιο πιθανή από την πορεία προς το G. Εκθετικό κόστος.

49 Α* πραγματικού χρόνου που μαθαίνει (1/3) (Learning real-time A*, LRTA*) Ο πράκτορας μεταβαίνει πάντα στην καλύτερη γειτονική κατάσταση. Εάν πρόκειται για κατάσταση που επισκέπτεται ο πράκτορας για πρώτη φορά, αυτή βαθμολογείται με την ευρετική συνάρτηση, αλλιώς διατηρεί την όποια βαθμολογία της. Αισιοδοξία υπό αβεβαιότητα Η κατάσταση από την οποία έγινε η μετάβαση βαθμολογείται με το άθροισμα του κόστους μετάβασης και της βαθμολογίας της νέας κατάστασης. Ο πράκτορας πρέπει να θυμάται τις νέες βαθμολογίες, γιατί αυτές δεν προκύπτουν πλέον από την ευρετική συνάρτηση.

Α* πραγματικού χρόνου που μαθαίνει (2/3) (Learning real-time A*, LRTA*) 50

51 Α* πραγματικού χρόνου που μαθαίνει (3/3) (Learning real-time A*, LRTA*) Είναι πλήρης για πεπερασμένα, ασφαλώς εξερευνήσιμα περιβάλλοντα. Δεν είναι πλήρης για άπειρους χώρους καταστάσεων. Πολυπλοκότητα: Ο(n 2 ), όπου n το πλήθος των καταστάσεων.