ΤΕΧΝΗΤΗ ΝΟΗΜΟΣΥΝΗ. Ενότητα 5: Παραδείγματα. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής

Σχετικά έγγραφα
ΤΜΗΜΑ ΔΙΟΙΚΗΣΗΣ ΕΠΙΧΕΙΡΗΣΕΩΝ

Πληροφορηµένη αναζήτηση και εξερεύνηση

Θεωρία Λήψης Αποφάσεων

6 η Διάλεξη. Ενδεικτικές λύσεις ασκήσεων

Ε ανάληψη. Α ληροφόρητη αναζήτηση

Ποσοτικές Μέθοδοι στη Διοίκηση Επιχειρήσεων ΙΙ Σύνολο- Περιεχόμενο Μαθήματος

ΤΕΧΝΗΤΗ ΝΟΗΜΟΣΥΝΗ. Ενότητα 2: Δένδρο αναζήτησης. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής

Μοντελοποίηση Λογικών Κυκλωμάτων

ΤΕΧΝΗΤΗ ΝΟΗΜΟΣΥΝΗ. Ενότητα 3: Αλγόριθμοι πληροφορημένης αναζήτησης. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Ανώτατο Εκπαιδευτικό Ίδρυμα Πειραιά Τεχνολογικού Τομέα. Συστήματα Αυτομάτου Ελέγχου. Ενότητα Α: Γραμμικά Συστήματα

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΑΝΑΛΥΣΗ ΑΛΓΟΡΙΘΜΩΝ

Μαθηματικά. Ενότητα 7: Μη Πεπερασμένα Όρια. Σαριαννίδης Νικόλαος Τμήμα Λογιστικής και Χρηματοοικονομικής

ΤΕΧΝΗΤΗ ΝΟΗΜΟΣΥΝΗ. Ενότητα 6: Προβλήματα ικανοποίησης περιορισμών. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής

ΔΙΑΧΕΙΡΙΣΗ ΥΔΑΤΙΚΩΝ ΠΟΡΩΝ

Αυτοματοποιημένη χαρτογραφία

Εφαρμογές Συστημάτων Γεωγραφικών Πληροφοριών

ΓΡΑΜΜΙΚΟΣ & ΔΙΚΤΥΑΚΟΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ

ΒΟΗΘΗΤΙΚΕΣ ΣΗΜΕΙΩΣΕΙΣ

ΜΑΘΗΜΑΤΙΚΑ ΓΙΑ ΟΙΚΟΝΟΜΟΛΟΓΟΥΣ

Θεωρία Πιθανοτήτων & Στατιστική

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ

Υπολογιστικά & Διακριτά Μαθηματικά

Τίτλος Μαθήματος: ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΑΝΑΛΥΣΗ ΑΛΓΟΡΙΘΜΩΝ

Ε ανάληψη. Ε αναλαµβανόµενες καταστάσεις. Αναζήτηση µε µερική ληροφόρηση. Πληροφορηµένη αναζήτηση. µέθοδοι αποφυγής

Εισαγωγικές Έννοιες. ημήτρης Φωτάκης. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Εθνικό Μετσόβιο Πολυτεχνείο

ΕΠΙΧΕΙΡΗΣΙΑΚΗ ΕΡΕΥΝΑ ΠΕΡΣΕΦΟΝΗ ΠΟΛΥΧΡΟΝΙΔΟΥ ΤΜΗΜΑ ΛΟΓΙΣΤΙΚΗΣ ΤΕ

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΑΝΑΛΥΣΗ ΑΛΓΟΡΙΘΜΩΝ

ΜΑΘΗΜΑΤΙΚΑ ΓΙΑ ΟΙΚΟΝΟΜΟΛΟΓΟΥΣ

Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για εκπαιδευτικό υλικό, όπως εικόνες, που υπόκειται σε άλλου τύ

Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για εκπαιδευτικό υλικό, όπως εικόνες, που υπόκειται σε άλλου τύ

Τμήμα Μηχανικών Πληροφορικής και Τηλεπικοινωνιών

ΓΡΑΜΜΙΚΟΣ & ΔΙΚΤΥΑΚΟΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΑΝΑΛΥΣΗ ΑΛΓΟΡΙΘΜΩΝ

ΓΡΑΜΜΙΚΟΣ & ΔΙΚΤΥΑΚΟΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ

Διαδικασίες Markov Υπενθύμιση

Λογιστικές Εφαρμογές Εργαστήριο

ΜΑΘΗΜΑΤΙΚΑ ΓΙΑ ΟΙΚΟΝΟΜΟΛΟΓΟΥΣ

Στατιστική Επιχειρήσεων Ι

Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για εκπαιδευτικό υλικό, όπως εικόνες, που υπόκειται σε άλλου τύ

ΤΕΧΝΟΛΟΓΙΑ, ΚΑΙΝΟΤΟΜΙΑ ΚΑΙ ΕΠΙΧΕΙΡΗΜΑΤΙΚΟΤΗΤΑ 9 Ο εξάμηνο Χημικών Μηχανικών

ΤΕΧΝΟΛΟΓΙΑ ΛΟΓΙΣΜΙΚΟΥ Ι

Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για εκπαιδευτικό υλικό, όπως εικόνες, που υπόκειται σε άλλου τύ

Εισαγωγή στους Αλγορίθμους Ενότητα 9η Άσκηση - Αλγόριθμος Prim

ΣΤΑΤΙΣΤΙΚΗ ΕΠΙΧΕΙΡΗΣΕΩΝ

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Ενότητα 7: Τέλεια ισορροπία Nash για υποπαίγνια. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής

Θεωρία Πιθανοτήτων & Στατιστική

ΓΡΑΜΜΙΚΟΣ & ΔΙΚΤΥΑΚΟΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ

Υπολογιστικά & Διακριτά Μαθηματικά

6 η ΕΝΟΤΗΤΑ ΔΥΝΑΜΙΚΟΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ

Επιχειρησιακή Έρευνα

Διαδικαστικός Προγραμματισμός

Το Πρόβλημα του Περιοδεύοντος Πωλητή - The Travelling Salesman Problem

Θεωρία Πιθανοτήτων & Στατιστική

Θεωρία Πιθανοτήτων & Στατιστική

4 η Διάλεξη. Ενδεικτικές λύσεις ασκήσεων

ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΜΕ ΧΡΗΣΗ Η/Υ

Θερμοδυναμική - Εργαστήριο

Ανάλυση ευαισθησίας Ανάλυση ρίσκου. Μαυρωτά Γιώργου Αναπλ. Καθηγητή ΕΜΠ

Υπολογιστικά & Διακριτά Μαθηματικά

Διαχείριση Χρόνου & Δίκτυα στη Διοίκηση Έργων. Κηρυττόπουλος Κωνσταντίνος Επ. Καθηγητής ΕΜΠ

ΤΕΧΝΗΤΗ ΝΟΗΜΟΣΥΝΗ. Ενότητα 11: Λογική πρώτης τάξης. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής

Μαθηματικά. Ενότητα 9: Όριο Συνάρτησης στο Διηνεκές. Σαριαννίδης Νικόλαος Τμήμα Λογιστικής και Χρηματοοικονομικής

Υπολογιστικά & Διακριτά Μαθηματικά

ΠΛΗ 405 Τεχνητή Νοηµοσύνη

Θεωρία Λήψης Αποφάσεων

Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για εκπαιδευτικό υλικό, όπως εικόνες, που υπόκειται σε άλλου τύ

Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για εκπαιδευτικό υλικό, όπως εικόνες, που υπόκειται σε άλλου τύ

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΑΝΑΛΥΣΗ ΑΛΓΟΡΙΘΜΩΝ

Οργανωσιακή Συμπεριφορά Ενότητα 10: Διαδικασίες για τη λήψη αποφάσεων στην οργάνωση

ΓΡΑΜΜΙΚΟΣ & ΔΙΚΤΥΑΚΟΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ

ΓΡΑΜΜΙΚΟΣ & ΔΙΚΤΥΑΚΟΣ ΠΡΟΓΡΑΜΜΑΤΙΣΜΟΣ

Λογισμός 3. Ενότητα 19: Θεώρημα Πεπλεγμένων (γενική μορφή) Μιχ. Γ. Μαριάς Τμήμα Μαθηματικών ΑΝΟΙΚΤΑ ΑΚΑ ΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ

Βιομηχανικοί Ελεγκτές

Αναγνώριση Προτύπων Ι

Ευρετικές Μέθοδοι. Ενότητα 6: Αναζήτηση μεταβλητής γειτνίασης. Άγγελος Σιφαλέρας. Μεταπτυχιακό Εφαρμοσμένης Πληροφορικής ΕΥΡΕΤΙΚΕΣ ΜΕΘΟΔΟΙ

ΑΝΑΓΝΩΡΙΣΗ ΠΡΟΤΥΠΩΝ. ΕΝΟΤΗΤΑ: Γραμμικές Συναρτήσεις Διάκρισης. ΔΙΔΑΣΚΟΝΤΕΣ: Βλάμος Π. Αυλωνίτης Μ. ΙΟΝΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΤΜΗΜΑ ΠΛΗΡΟΦΟΡΙΚΗΣ

Οικονομικά Μαθηματικά

Επιχειρησιακή Έρευνα

Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για εκπαιδευτικό υλικό, όπως εικόνες, που υπόκειται σε άλλου τύ

ΕΙΣΑΓΩΓΗ ΣΤΗΝ ΑΝΑΛΥΣΗ ΑΛΓΟΡΙΘΜΩΝ

Οικονομικά Μαθηματικά

ΕΠΙΧΕΙΡΗΣΙΑΚΗ ΕΡΕΥΝΑ ΠΕΡΣΕΦΟΝΗ ΠΟΛΥΧΡΟΝΙΔΟΥ ΤΜΗΜΑ ΛΟΓΙΣΤΙΚΗΣ ΤΕ

Μαθηματικά Ενότητα 11: Θεώρημα Μέσης Τιμής Μονοτονία Συνάρτησης

ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ ΜΕ ΧΡΗΣΗ Η/Υ

Τεχνητή Νοημοσύνη. 4η διάλεξη ( ) Ίων Ανδρουτσόπουλος.

Πρόβλημα συντομότερης διαδρομής - Shortest path problem. Κηρυττόπουλος Κωνσταντίνος Επ. Καθηγητής ΕΜΠ

Ψηφιακή Τεχνολογία σε Ακαδημαϊκό Περιβάλλον

Οικονομικά Μαθηματικά

ΠΑΝΕΠΙΣΤΗΜΙΟ ΙΩΑΝΝΙΝΩΝ ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ. Πιθανότητες. Συναρτήσεις πολλών μεταβλητών Διδάσκων: Επίκουρος Καθηγητής Κωνσταντίνος Μπλέκας

ΤΕΧΝΗΤΗ ΝΟΗΜΟΣΥΝΗ. Ενότητα 9: Προτασιακή λογική. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής

Συστήματα Αναμονής. Ενότητα 3: Στοχαστικές Ανελίξεις. Αγγελική Σγώρα Τμήμα Μηχανικών Πληροφορικής ΤΕ

Θερμοδυναμική - Εργαστήριο

Γενικά Μαθηματικά Ι. Ενότητα 15: Ολοκληρώματα Με Ρητές Και Τριγωνομετρικές Συναρτήσεις Λουκάς Βλάχος Τμήμα Φυσικής

Ιστορία της μετάφρασης

ΤΕΧΝΟΛΟΓΙΑ ΛΟΓΙΣΜΙΚΟΥ Ι

Πληροφοριακά Συστήματα & Περιβάλλον Ασκήσεις

ΘΕΩΡΙΑ ΠΑΙΓΝΙΩΝ. Ενότητα 9: Απείρως επαναλαμβανόμενα παίγνια. Ρεφανίδης Ιωάννης Τμήμα Εφαρμοσμένης Πληροφορικής

Σχολή Εφαρµοσµένων Μαθηµατικών και Φυσικών Επιστηµών Εθνικό Μετσόβιο Πολυτεχνείο. Στοχαστικές Ανελίξεις. Ασκήσεις Κεφαλαίου 2. Κοκολάκης Γεώργιος

Υπολογιστικά & Διακριτά Μαθηματικά

Transcript:

Ενότητα 5: Παραδείγματα Ρεφανίδης Ιωάννης

Άδειες Χρήσης Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για εκπαιδευτικό υλικό, όπως εικόνες, που υπόκειται σε άλλου τύπου άδειας χρήσης, η άδεια χρήσης αναφέρεται ρητώς. 2

Χρηματοδότηση Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα. Το έργο «Ανοικτά Ακαδημαϊκά Μαθήματα στο Πανεπιστήμιο Μακεδονίας» έχει χρηματοδοτήσει μόνο τη αναδιαμόρφωση του εκπαιδευτικού υλικού. Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος «Εκπαίδευση και Δια Βίου Μάθηση» και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους. 3

Τοπική ακτινική αναζήτηση (local beam search) Επιλέγονται k τυχαίες αρχικές καταστάσεις. Εκτελούνται k αναζητήσεις παράλληλα. Σε κάθε βήμα επιλέγονται τα k καλύτερα παιδιά από όλα τα παιδιά του προηγούμενου βήματος. Κίνδυνος συγκέντρωσης όλων των αναζητήσεων γύρω από το ίδιο κλαδί. Αντιμετώπιση: Στοχαστική επιλογή των k παιδιών. 4

Γενετικοί αλγόριθμοι (1/2) Οι διάδοχες καταστάσεις παράγονται με το συνδυασμό δύο γονικών καταστάσεων, και όχι με την τροποποίηση μιας μεμονωμένης κατάστασης. Αρχικός πληθυσμός. Στοχαστική επιλογή γονέων. Συνάρτηση καταλληλότητας = Ευρετική συνάρτηση 5

Γενετικοί αλγόριθμοι (2/2) 6

Τοπική αναζήτηση σε συνεχείς χώρους

Συνεχείς χώροι Άπειρος αριθμών διάδοχων καταστάσεων Παράδειγμα: Τοποθέτηση 3 αεροδρομίων στη Ρουμανία με ελαχιστοποίηση του αθροίσματος των αποστάσεων των πόλεων. Χώρος 6 διαστάσεων Αντικειμενική συνάρτηση: f(x 1,y 1,x 2,y 2,x 3,y 3 ) Διακριτοποίηση, βήμα ±δ 8

Πλέον απότομη ανάβαση (steapest-ascent hill climbing) Κλίση: f f ( x f, y f, x f, y f, x f, 1 1 2 2 3 y3 ) Πλέον απότομη ανάβαση: x x + α f(x) Εμπειρική κλίση Ευθύγραμμη αναζήτηση 9

Πράκτορες online αναζήτησης και άγνωστα περιβάλλοντα

Online αναζήτηση Επεξεργασία δεδομένων πριν γίνει διαθέσιμο το σύνολό τους Διαπλοκή (interleaving) υπολογισμών και ενεργειών Κατάλληλη για πεδία: Δυναμικά Ημιδυναμικά Στοχαστικά Μια offline αναζήτηση θα έπρεπε να καταστρώνει ένα εκθετικά μεγάλο πλάνο ενδεχομένων που να παίρνει υπόψη όλα όσα είναι δυνατό να συμβούν. Προβλήματα εξερεύνησης: Οι καταστάσεις του κόσμου και τα αποτελέσματα των ενεργειών είναι άγνωστα. 11

Προβλήματα online αναζήτησης (1/2) Ο πράκτορας πρέπει να εκτελέσει τις ενέργειες για να μάθει τα αποτελέσματά τους! Γνώση πράκτορα: Ξέρει ποιες είναι οι ενέργειές του Γνωρίζει το κόστος κάθε βήματος Μπορεί να καταλάβει εάν πέτυχε το στόχο 12

Προβλήματα online αναζήτησης (2/2) Παραδοχές (απλουστευτικές): Θυμάται τις καταστάσεις που επισκέφθηκε Αιτιοκρατικές ενέργειες Γνωρίζει μια παραδεκτή ευρετική συνάρτηση (π.χ. απόσταση Manhattan) Στόχος: Να φθάσει στον προορισμό Κόστος: Τα βήματα που εκτέλεσε Ανταγωνιστικός λόγος (competitive ratio): Πραγματικό κόστος / βέλτιστο κόστος 13

Αδιέξοδα Εάν οι ενέργειες δεν αντιστρέφονται, ο πράκτορας μπορεί να παγιδευτεί. Κανένας αλγόριθμος δεν μπορεί να αποφεύγει τα αδιέξοδα σε όλους τους χώρους καταστάσεων. 14

Ασφαλώς εξερευνήσιμοι χώροι Από κάθε προσπελάσιμη κατάσταση είναι προσπελάσιμη κάποια κατάσταση στόχου. Ωστόσο το κόστος μπορεί να είναι μη-φραγμένο. 15

Πράκτορες online αναζήτησης Έπειτα από κάθε ενέργεια, ένας πράκτορας online προσλαμβάνει μια αντίληψη που του λέει σε ποια κατάσταση έχει φτάσει. Μπορεί να βελτιώσει το χάρτη του περιβάλλοντος που έχει. Επέκταση κόμβων με τοπική προτεραιότητα. Δεν μπορούν να χρησιμοποιηθούν αλγόριθμοι που εκτελούν άλματα (όπως π.χ. ο Α*). Εξερεύνηση πρώτα κατά βάθος Πρόβλημα οι επιστροφές, αναστρέψιμες ενέργειες Επαναληπτική εκβάθυνση 16

Τοπική online αναζήτηση Τοπική αναζήτηση αναρρίχησης λόφων Πρόβλημα με τα οροπέδια, δεν μπορούμε να εκτελέσουμε τυχαίες επανεκκινήσεις. Τυχαίος περίπατος (random walk) Τυχαία επιλογή βημάτων, αποφυγή επανάληψης Στο παρακάτω σχήμα, η επιστροφή προς το S είναι πάντα 2 φορές πιο πιθανή από την πορεία προς το G. Εκθετικό κόστος. 17

Α* πραγματικού χρόνου που μαθαίνει (1/3) (Learning real-time A*, LRTA*) Ο πράκτορας μεταβαίνει πάντα στην καλύτερη γειτονική κατάσταση. Εάν πρόκειται για κατάσταση που επισκέπτεται ο πράκτορας για πρώτη φορά, αυτή βαθμολογείται με την ευρετική συνάρτηση, αλλιώς διατηρεί την όποια βαθμολογία της. Αισιοδοξία υπό αβεβαιότητα Η κατάσταση από την οποία έγινε η μετάβαση βαθμολογείται με το άθροισμα του κόστους μετάβασης και της βαθμολογίας της νέας κατάστασης. Ο πράκτορας πρέπει να θυμάται τις νέες βαθμολογίες, γιατί αυτές δεν προκύπτουν πλέον από την ευρετική συνάρτηση. 18

Α* πραγματικού χρόνου που μαθαίνει (2/3) (Learning real-time A*, LRTA*) 19

Α* πραγματικού χρόνου που μαθαίνει (3/3) (Learning real-time A*, LRTA*) Είναι πλήρης για πεπερασμένα, ασφαλώς εξερευνήσιμα περιβάλλοντα. Δεν είναι πλήρης για άπειρους χώρους καταστάσεων. Πολυπλοκότητα: Ο(n 2 ), όπου n το πλήθος των καταστάσεων. 20

Τέλος Ενότητας