Ρομποτική II. Περιεχόμενα Μαθήματος



Σχετικά έγγραφα
ΕΝΟΤΗΤΑ 2: Αυτόνομα Ευφυή Κινούμενα Ρομποτικά Συστήματα

Ρομποτική II. Περιεχόμενα Μαθήματος

Συνόρθωση κατά στάδια και αναδρομικοί αλγόριθμοι βέλτιστης εκτίμησης

HMY 795: Αναγνώριση Προτύπων. Διάλεξη 2

Ρομποτικά Συστήματα Ελέγχου: Διαφορική Κινηματική Ανάλυση

Υλοποίηση localization στα Nao robots

Βασική Κατηγοριοποίηση Αισθητήρων Γιώργος Βασιλείου

Συνόρθωση κατά στάδια και αναδρομικοί αλγόριθμοι βέλτιστης εκτίμησης

Συνόρθωση κατά στάδια και αναδρομικοί αλγόριθμοι βέλτιστης εκτίμησης

HMY 795: Αναγνώριση Προτύπων

Ρομποτικός Έλεγχος Δύναμης / Μηχανικής Αντίστασης

Υλοποίηση εντοπισμού στα Nao robots μέσω προσέγγισης του φίλτρου Kalman

HMY 429: Εισαγωγή στην Επεξεργασία Ψηφιακών. Χρόνου (Ι)

Ρομποτική Ι: Διαφορική Κινηματική Ανάλυση

Σχολή Ηλεκτρολόγων Μηχ/κών και Μηχ/κών Υπολογιστών, Ε.Μ.Π., Ακαδημαϊκό Έτος , 8ο Εξάμηνο. Ρομποτική II. Ευφυή και Επιδέξια Ρομποτικά Συστήματα

Αυτόνομοι Πράκτορες(ΠΛΗ513)

Εισαγωγή στις Ηλεκτρικές Μετρήσεις

Εισαγωγή. Κατηγοριοποίηση αισθητήρων. Χαρακτηριστικά αισθητήρων. Κυκλώματα διασύνδεσης αισθητήρων

ΕΚΠ 413 / ΕΚΠ 606 Αυτόνοµοι (Ροµ οτικοί) Πράκτορες

ΚΙΝΗΜΑΤΙΚΟΣ ΕΝΤΟΠΙΣΜΟΣ GNSS/INS: ΑΠΟ ΤΑ ΕΛΑΧΙΣΤΑ

Ευφυή Κινούμενα Ρομπότ

ΕΝΤΟΠΙΣΜΟΣ ΘΕΣΗΣ ΚΑΙ ΧΑΡΤΗΓΡΑΦΗΣΗ

HMY 799 1: Αναγνώριση Συστημάτων

E [ -x ^2 z] = E[x z]

Robot Stadium Nao Controller

Ρομποτική II. Περιεχόμενα Μαθήματος

L-SLAM: Μείωση διαστάσεων στην οικογένεια αλγορίθµων FastSLAM

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Ανώτατο Εκπαιδευτικό Ίδρυμα Πειραιά Τεχνολογικού Τομέα ΕΠΕΞΕΡΓΑΣΙΑ ΕΙΚΟΝΑΣ. Ενότητα 4: Δειγματοληψία και Κβάντιση Εικόνας

Ψηφιακός Έλεγχος. 11 η διάλεξη Ασκήσεις. Ψηφιακός Έλεγχος 1

Μελέτη και Υλοποίηση Ελεγκτών Ρομποτικών Συστημάτων με χρήση Αλγορίθμων Ενισχυτικής Μάθησης

Μάθημα: Ρομποτικός Έλεγχος

Αυτόματη προσγείωση τετρακόπτερου με χρήση κάμερας

Βέλτιστος Έλεγχος Συστημάτων

27-Ιαν-2009 ΗΜΥ (ι) Βασική στατιστική (ιι) Μετατροπές: αναλογικό-σεψηφιακό και ψηφιακό-σε-αναλογικό

ΕΙΣΑΓΩΓΗ ΣΤΗ ΣΤΑΤΙΣΤΙΚΗ ΑΝΑΛΥΣΗ

ΕΛΕΓΧΟΣ ΠΑΡΑΓΩΓΙΚΩΝ ΔΙΕΡΓΑΣΙΩΝ

Κεφάλαιο M4. Κίνηση σε δύο διαστάσεις

ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΕΛΟΠΟΝΝΗΣΟΥ

E[ (x- ) ]= trace[(x-x)(x- ) ]

HMY 429: Εισαγωγή στην Επεξεργασία Ψηφιακών

Στοχαστικά Σήματα και Τηλεπικοινωνιές

Εισαγωγή στον Αυτόματο Έλεγχο Συστήματα, Εφαρμογές, Αισθητήρια

1 Η ΕΝΟΣΗΣΑ ΕΙΣΑΓΩΓH ΣΤΟΥΣ ΑΙΣΘΗΤΗΡΕΣ

Κινητά Δίκτυα Επικοινωνιών. Συμπληρωματικό υλικό. Προσαρμοστική Ισοστάθμιση Καναλιού

Ανασκόπηση θεωρίας ελαχίστων τετραγώνων και βέλτιστης εκτίμησης παραμέτρων

Διπλωματική Εργασία: «Συγκριτική Μελέτη Μηχανισμών Εκτίμησης Ελλιπούς Πληροφορίας σε Ασύρματα Δίκτυα Αισθητήρων»

Οι νέες τεχνολογικές τάσεις που θα μετασχηματίσουν την κινητικότητα Συνεργατικά συστήματα, αυτόνομα οχήματα και ηλεκτροκίνηση

ΣΤΟΧΑΣΤΙΚΑ ΣΥΣΤΗΜΑΤΑ & ΕΠΙΚΟΙΝΩΝΙΕΣ 1o Τμήμα (Α - Κ): Αμφιθέατρο 3, Νέα Κτίρια ΣΗΜΜΥ Θεωρία Πιθανοτήτων & Στοχαστικές Ανελίξεις - 1

Ευφυείς Τεχνολογίες ----Πράκτορες

ΠΡΟΓΡΑΜΜΑ ΕΠΑΝΑΛΗΠΤΙΚΩΝ ΕΞΕΤΑΣΕΩΝ ΟΡΘΗ ΕΠΑΝΑΛΗΨΗ

Βέλτιστη παρεμβολή και πρόγνωση άγνωστης συνάρτησης με τη μέθοδο της σημειακής προσαρμογής

Ρομποτική Ι: Ανάλυση, Έλεγχος, Εργαστήριο Κινηματική/Στατική/Δυναμική Ανάλυση και Έλεγχος Ρομποτικών Χειριστών

Kalman Filter Γιατί ο όρος φίλτρο;

Δυναμική Μηχανών I. Διάλεξη 3. Χειμερινό Εξάμηνο 2013 Τμήμα Μηχανολόγων Μηχ., ΕΜΠ

Παρεμβολή & πρόγνωση άγνωστης συνάρτησης μέσω σημειακής προσαρμογής

Ανασκόπηση θεωρίας ελαχίστων τετραγώνων και βέλτιστης εκτίμησης παραμέτρων

ΠΡΟΓΡΑΜΜΑ ΕΠΑΝΑΛΗΠΤΙΚΩΝ ΕΞΕΤΑΣΕΩΝ

Probability and Random Processes (Part II)

ΠΡΟΓΡΑΜΜΑ ΕΠΑΝΑΛΗΠΤΙΚΩΝ ΕΞΕΤΑΣΕΩΝ

Ηλεκτρικό & Ηλεκτρονικό Υποσύστηµα ενός Ροµπότ. Επενεργητές Αισθητήρες Σύστηµα Ελέγχου

ΠΡΟΓΡΑΜΜΑ ΕΞΕΤΑΣΕΩΝ. Εργαστηριακή και Βιομηχανική Ηλεκτρονική Ηλ. Αμφ. 2, 3. Γλώσσες Προγραμματισμού Ι. Ηλ. Αμφ. 1, 2, 3, 4, 5

ΠΡΟΓΡΑΜΜΑ ΕΠΑΝΑΛΗΠΤΙΚΩΝ ΕΞΕΤΑΣΕΩΝ

ΕΝΟΤΗΤΑ 2: Αυτόνομα Ευφυή Κινούμενα Ρομποτικά Συστήματα

Ενότητα 2: Εισαγωγή στη Θεωρία Βέλτιστου Ελέγχου. Νίκος Καραμπετάκης Τμήμα Μαθηματικών

Συστήματα Επικοινωνιών ΙI

Η Βασική Δομή Συστημάτων Ελέγχου Κίνησης

ΔΠΜΣ «ΣΥΣΤΗΜΑΤΑ ΑΥΤΟΜΑΤΙΣΜΟΥ» «ΕΡΓΑΣΤΗΡΙΟ ΡΟΜΠΟΤΙΚΗΣ» Άσκηση 2. Έλεγχος Pendubot

ΣΤΟΧΑΣΤΙΚΑ ΣΥΣΤΗΜΑΤΑ & ΕΠΙΚΟΙΝΩΝΙΕΣ 1o Τμήμα (Α - Κ): Αμφιθέατρο 3, Νέα Κτίρια ΣΗΜΜΥ Θεωρία Πιθανοτήτων & Στοχαστικές Ανελίξεις - 3

ΠΡΟΓΡΑΜΜΑ ΕΞΕΤΑΣΕΩΝ. Ηλ. Αιθ. 003, 004 Ηλεκτρονική ΙΙΙ Ηλ. αιθ. 003, 004

Συλλογή μεταφορά και. Κεφάλαιο 2 ο ΜΕΤΡΗΣΕΙΣ - ΑΙΣΘΗΤΗΡΙΑ

ΕΚΠ 413 / ΕΚΠ 606 Αυτόνοµοι (Ροµ οτικοί) Πράκτορες

καθ. Βασίλης Μάγκλαρης

Συμπίεση Δεδομένων

Δομή της παρουσίασης

ΠΡΟΓΡΑΜΜΑ ΕΞΕΤΑΣΕΩΝ. Στοχαστικά Συστήματα & Επικοινωνίες Ηλ. Αμφ. 1, 2 Ηλ. Αιθ. 001, 002. Γλώσσες Προγραμματισμού Ι Ηλ. Αμφ.

Μάθημα: Ειδικά Συστήματα Ελέγχου Πλοίου( ) Κεφάλαιο: Συστήματα Ελέγχου Πλοίου

Εισαγωγή στη Ροµποτική

ΣΤΟΧΑΣΤΙΚΑ ΣΥΣΤΗΜΑΤΑ & ΕΠΙΚΟΙΝΩΝΙΕΣ 1o Τμήμα (Α - Κ): Αμφιθέατρο 3, Νέα Κτίρια ΣΗΜΜΥ Θεωρία Πιθανοτήτων & Στοχαστικές Ανελίξεις - 5

Ποιότητα Ακτινοδιαγνωστικής Εικόνας

ΦΙΛΤΡΟ KALMAN ΔΙΑΚΡΙΤΟΥ ΧΡΟΝΟΥ

Μοντέρνα Θεωρία Ελέγχου

RobotArmy Περίληψη έργου

Αυτόνομοι Πράκτορες. Εργασία εξαμήνου. Monte Carlo Localization Simulator. Κάργας Νικόλαος :

Σύστημα (system) είναι ένα σύνολο φυσικών στοιχείων, πραγμάτων ατόμων, μεγεθών ή εννοιών, που σχηματίζουν μιαν ενότητα και δρα σαν μια ενότητα.

ΣΤΟΧΑΣΤΙΚΑ ΣΥΣΤΗΜΑΤΑ & ΕΠΙΚΟΙΝΩΝΙΕΣ 1o Τμήμα (Α - Κ): Αμφιθέατρο 4, Νέα Κτίρια ΣΗΜΜΥ Θεωρία Πιθανοτήτων & Στοχαστικές Ανελίξεις - 4

Πανεπιστήμιο Πατρών Τμήμα Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών. Διδάσκων: Αντώνιος Τζές

Ακαδηµαϊκό Έτος , Εαρινό Εξάµηνο ιδάσκων Καθ.: Νίκος Τσαπατσούλης

Σχολή E.Μ.Φ.Ε ΦΥΣΙΚΗ ΙΙΙ (ΚΥΜΑΤΙΚΗ) Κανονικές Εξετάσεις Χειµερινού εξαµήνου t (α) Αν το παραπάνω σύστηµα, ( m, s,

ΠΡΟΓΡΑΜΜΑ ΕΞΕΤΑΣΕΩΝ. Αρχιτεκτονική Υπολογιστών Ηλ. Αιθ. 001, 002. Ηλ. Αιθ. 003, 004 Ηλεκτρονική ΙΙΙ Ηλ. αιθ. 003, 004. Θεωρία Δικτύων & Κυκλωμάτων

ΣΥΝΟΨΗ 1 ου Μαθήματος

Οι τύποι της εκτίμησης, οι οποίοι παρουσιάζονται στον Πίνακα 1.1, προσδιορίζονται από τη σχέση των χρονικών στιγμών και k :

ΕΘΝΙΚΟ ΜΕΤΣΟΒΙΟ ΠΟΛΥΤΕΧΝΕΙΟ ΣΧΟΛΗ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧ/ΚΩΝ & ΜΗΧ/ΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ

ΔΥΝΑΜΙΚΗ ΚΑΙ ΕΛΕΓΧΟΣ ΠΤΗΣΗΣ 3A: ΔΥΝΑΜΙΚΕΣ ΕΞΙΣΩΣΕΙΣ ΚΙΝΗΣΗΣ ΓΕΝΙΚΕΣ ΕΞΙΣΩΣΕΙΣ

HMY 795: Αναγνώριση Προτύπων

Στοχαστικά Σήματα και Τηλεπικοινωνιές

HMY 799 1: Αναγνώριση Συστημάτων

Αναγνώριση Προτύπων Ι

ΕΚΠ 413 / ΕΚΠ 606 Αυτόνοµοι (Ροµ οτικοί) Πράκτορες

Δυναμική Μηχανών I. Διάλεξη 11. Χειμερινό Εξάμηνο 2013 Τμήμα Μηχανολόγων Μηχ., ΕΜΠ

Χρήστος Ξενάκης. Πανεπιστήμιο Πειραιώς, Τμήμα Ψηφιακών Συστημάτων

Transcript:

Σχολή Ηλεκτρολόγων Μηχ/κών και Μηχ/κών Υπολογιστών, Ε.Μ.Π., Ακαδημαϊκό Έτος 007-08, 8ο Εξάμηνο Ρομποτική II Ευφυή και Επιδέξια Ρομποτικά Συστήματα Διδάσκων: Κων/νος Τζαφέστας Τομέας Σημάτων, Ελέγχου & Ρομποτικής Σχολή Ηλεκτρ. Μηχ/κών & Μηχ/κών Υπολ., Ε.Μ.Π. Τηλ.: 0 77-687, (Κτήριο Ηλεκτρ., Γραφείο.6) Email: ktzaf@softlab.ntua.gr Web: http://www.softlab.ntua.gr/~ktzaf/ Περιεχόμενα Μαθήματος ΕΝΟΤΗΤΑ-: Επιδέξιος Ρομποτικός Χειρισμός Έλεγχος Ρομπότ με πλεονάζοντες β.ε. (redundant robots) Έλεγχος Δύναμης / Μηχανικής Αντίστασης Μοντελοποίηση και έλεγχος επιδέξιου χειρισμού (Συνεργαζόμενα ρομπότ, Ρομποτικά χέρια) ΕΝΟΤΗΤΑ-: Αυτόνομα Ευφυή Κινούμενα Ρομπότ Μηχανισμοί Κίνησης / Αισθητήρες (H/W: locomotion / sensors) Σύνθεση αισθητηρίων πληροφοριών (sensor fusion) Αρχιτεκτονικές Ελέγχου Κινούμενων Ρομπότ Σχεδιασμός δρόμου Αποφυγή εμποδίων (path planning) Αυτοεντοπισμός θέσης Χαρτογράφηση χώρου κίνησης (localization / map building)

Ε.Μ.Π., ΣΗΜΜΥ, Ακαδημαϊκό Έτος 007-08, 8ο Εξάμηνο Μάθημα: Ρομποτική ΙΙ. Διδάσκων: Κ.Τζαφέστας ΕΝΟΤΗΤΑ : Αυτόνομα Ευφυή Κινούμενα Ρομποτικά Συστήματα.- Εισαγωγικά Στοιχεία Μηχανισμοί κίνησης (locomotion) / Αισθητήριες Διατάξεις (sensors) Κινούμενα Ρομπότ - Εισαγωγή Βιομηχανικά Ρομπότ Ρομποτικοί Χειριστές: Σταθερή βάση περιορισμένος χώρος εργασίας Κινούμενα ρομπότ: δυνατότητες μεταφοράς στο χώρο εργασίας, αυτόνομη (ή τηλεχειριζόμενη) κίνηση Αυτόνομη κίνηση: δυνατότητες χαρτογράφησης και αντίληψης θέσης στο χώρο, καθώς και σχεδιασμού δρόμου Εργασία σε «μη φιλικό» προς τον άνθρωπο περιβάλλον, ή αλληλεπίδραση με τον άνθρωπο στο περιβάλλον εργασίας Μηχανισμοί δημιουργίας κίνησης και αισθητήριες διατάξεις

Κινούμενα ρομπότ: Βασική Δομή Ελέγχου Βάση Γνώσης Περιγραφή Αποστολής Αντίληψη θέσης και Χαρτογράφηση Χώρου Συνολικό Μοντέλο Περιβάλλοντος, Θέση Ρομπότ «Συλλογισμός» - Σχεδιασμός Δρόμου Τοπικό Μοντέλο Περιβάλλοντος Εξαγωγή και Ερμηνεία Χαρακτηριστικών Αισθητηριακά Δεδομένα Αίσθηση Σχέδιο Κίνησης / Δρόμος Έλεγχος Κίνησης και Δράσης στο Περιβάλλον Εντολές Κίνησης Μηχανισμοί Κίνησης Χώρος Κίνησης Περιβάλλον Δράσης 5 Κινούμενα Ρομπότ Μηχανισμοί Κίνησης Τροχοί: Τροχοφόρα ρομποτικά οχήματα. Κατάλληλα για επίπεδο έδαφος, οδικό δίκτυο κλπ. Πόδια: Βαδίζοντα ρομποτικά οχήματα. Φυσικό εξωτερικό περιβάλλον κίνησης, δύσβατο έδαφος Υβριδικά συστήματα... Locomotion vs Manipulation: contact types, stability Επίδοση: ευστάθεια (στατική/δυναμική, χαρακτηριστικά εδάφους), πολυπλοκότητα ελέγχου (μηχανισμός δημιουργίας κίνησης), ταχύτητα μετακίνησης, κατανάλωση ισχύος 6

Κινούμενα Ρομπότ Εισαγωγή () Ευφυή τροχοφόρα κινούμενα ρομπότ Laser Range Finder Μικρός Gripper Σύστημα Όρασης Ασύρματο Ethernet Αισθητήρες Υπέρυθρων PowerBot ActiveMedia Robots RWI IS Robotics Αισθητήρες Υπερήχων Video- Video- 7 Κινούμενα Ρομπότ Εισαγωγή () Βαδίζοντα ρομπότ Σύστημα Κατευθυνόμενης Στερεοσκοπικής Όρασης Edutainement Sample movie (Johnnie) Research SONY - Aibo (e.g. adaptive behaviors) Johnnie, Πολυτεχνείο Μονάχου (TUM) Sample movie Genghis 6-legged robot (AI lab / MIT) 8

Αυτόνομα Ευφυή Κινούμενα Ρομπότ Θεματικές Περιοχές Μηχανισμοί Κίνησης στο χώρο (locomotion) Αισθητήριες Διατάξεις (sensing) Proprioception (internal state ) / Exteroception etc. Σύνθεση αισθητηρίων πληροφοριών (sensor fusion) Αρχιτεκτονικές ελέγχου (mobile robot control architectures) Αυτοεντοπισμός θέσης / Χαρτογράφηση (self-localisation / map-building) Σχεδιασμός Δρόμου - Πλοήγηση (path planning / navigation) perception action motion control sensing reasoning 9 Μηχανισμοί κίνησης αυτόνομων κινούμενων ρομπότ (robot locomotion) 0

Μηχανισμοί κίνησης (locomotion) Μηχανισμοί κίνησης ρομπότ στο χώρο: κινηματική (ορθή/ανάστροφη), δυναμική ανάλυση, σχεδίαση και έλεγχος της κίνησης Βασικές κατηγορίες κινούμενων ρομπότ: Επίγεια (terrestrial) τροχοφόρα (wheeled) ρομπότ με πόδια (βαδίζοντα, αναριχώμενα, κλπ.) (legged robots: walking, climbing etc.) Υποβρύχια κλπ... (aquatic, underwater robotics) Ιπτάμενα (αεροπλάνα, ελικόπτερα κλπ.) (airborne) Διάστημα Μικρο/Νανο-Ρομποτική Τροχοφόρα Ρομπότ: Τύποι Τροχών (a) Τυπικός τροχός (σταθερού ή περιστρεφόμενου κατακόρυφου άξονα), (b) Castor (caster) wheel (προσανατολιζόμενος τροχός) (c) omnidirectional (Swedish) wheel (πανκατευθυντικός τροχός)

Τροχοφόρα Αυτοκινούμενα Ρομπότ (Wheeled mobile robots) Τροχοί Fixed wheel Centered orientable wheel Είδη Τροχών Castor wheel Swedish wheel: omnidirectional property Διάταξη Τροχών σε Κινούμενα Ρομποτικά Οχήματα τροχοί τροχοί τροχοί

Τροχοφόρα Αυτοκινούμενα Ρομπότ Βασικές Αρχές Κινηματικής Κινηματική Ανάλυση Ορθή: Εντολές Ελέγχου κίνηση ρομπότ Ανάστροφη: Επιθυμητή κίνηση εντολές ελέγχου Κύλιση (rolling) / Οδομετρία Κύλιση (roll) ω z axis v x axis y axis x axis v Instantaneous Center of Curvature (rotation) ICC ICC 5 Διαφορική Οδήγηση (differential drive) ICC R ω r=l/ v l (x,y) y axis v θ x axis v r v l : ταχύτητα αριστερού τροχού v r : ταχύτητα δεξιού τροχού ω(r + r) = v r ω(r r) = v l ( v + v ) = l ( v v) ( v vl) r r R = r l, r ( vr vl ) r r = l ω = l ( v r) = l + v v Εαν v l = v r v=0 και ω=v r /r () Εαν v l = v r ω=0 και v=v l =v r Khepera robot 6

Διαφορική Οδήγηση (συνέχεια) () ICC y axis R x axis δθ=ωδt θ(t+δt) δθ P(t+δt) θ P(t)=[x,y] [P(t),θ(t)] [P(t+δt),θ(t+δt)] δθ=ωδt (στροφή γύρω από το ICC) όπου: P(t)=[x(t),y(t)] Είναι: C x =ICC x = x R sin(θ) C y =ICC y = y + R cos(θ) Εξίσωση κίνησης (χρονική μεταβολή της διάταξης του ρομπότ): xt ( + δ t) yt ( + δ t) θ( t+ δt) cos( ωδt) sin( ωδ t) 0 xt () C x C x = sin( ωδ t) cos( ωδ t) 0 yt ( ) Cy + C y 0 0 θ() t ωδ t () 7 Διαφορική Οδήγηση (συνέχεια) () Ορθό κινηματικό μοντέλο Γενικά: Διαφορική Οδήγηση: x() t = x + v()cos t θ () t dt 0 0 t 0 0 t 0 0 yt () = y + vt ()sin θ () t dt θ() t = θ + ω() t dt t x() t = x + v () t + v()cos t () t dt t 0 r 0 l θ t 0 r 0 l θ t 0 r 0 l yt () = y + v() t+ v()sin t () t dt θ() t = θ + v () t v() t dt l Μη-ολονομικοί (μη-ολοκληρώσιμοι) κινηματικοί περιορισμοί Ανάστροφο κινηματικό μοντέλο Εαν v l (t)=v l και v r (t)=v r (με v l v r ) είναι (όταν [x,y,θ] t=0 =[0,0,0]) : () l vr + v x t = l sin t v v vr v l l ( r l ) () l v cos r + v yt = l v v vr v l t ( r l ) () t και θ t = ( vr vl ) l l... () 8

Διαφορική Οδήγηση (συνέχεια) () Ανάστροφο κινηματικό μοντέλο (συνέχεια) Δοσμένου x(t)=x και y(t)=y, μπορούμε να επιλύσουμε ως προς v l και v r. Έστω α=v r +v l και β=v r v l. Έχουμε: x sin l α l t = β β y cos l α l α l t = β β β ^ x + y l α l α β = β l l α vr + v = x + y β vr v = l y R y axis ICC R-y x + ( R y) = R [x(t),y(t)] R = x + y y x axis Απειρία λύσεων v r και v l, όπου όλες διατρέχουν κυκλική τροχιά η οποία περνά από τα σημεία [x(0),y(0)]=[0,0] και [x(t),y(t)]=[x,y] ακτίνα R=(x +y )/y 9 Σύγχρονη Οδήγηση (synchronous drive) y Κάθε τροχός οδηγείται με v(t) (drive) και κατευθύνεται με ω(t) (steering) (x,y) θ v(t) x ω(t) Ορθό κινηματικό μοντέλο t= 0 t 0 t= 0 t 0 t t= 0 0 x() t = x + v()cos t θ () t dt yt () = y + vt ()sin θ () t dt θ() t = θ + ω() t dt Nomadics 00 RWI B 0

Ρομπότ με Σύστημα Διεύθυνσης () y (x,y) d θ α v R = d/tanα ω=v/(d +R ) / x R ICC Bicycle (δίκυκλο) Tricycle (τρίκυκλο) Ρομπότ με Σύστημα Διεύθυνσης () Ορθό κινηματικό μοντέλο R=d/tanα=d tan(π/ α) και ω=v/(d +R ) / = vsinα d Θέτοντας τα R και ω στη σχέση (), παίρνουμε μια έκφραση για το ορθό κινηματικό μοντέλο xt ( + δ t) yt ( + δ t) θ( t+ δt) cos( ωδt) sin( ωδ t) 0 xt () C x C x = sin( ωδ t) cos( ωδ t) 0 yt ( ) Cy + C y 0 0 θ() t ωδ t όπου: C x =ICC x = x R sin(θ), και C y =ICC y = y + R cos(θ) μεταβλητές ελέγχου: v, α y (x,y) Ανάστροφο κινηματικό μοντέλο (επίλυση σε ειδικές περιπτώσεις) Εαν α=0: x( t+ δ t) xt () + ( vcos θ ) δ t Εαν α=±90 ο : x( t+ δ t) xt () yt ( + δ t) = yt () + ( vsin θ ) δ t θ( t δt) θ () t + d θ R α v x ICC yt ( + δ t) = yt () θ( t δt) θ () t ( v/ d) δ t + ±

Ρομπότ με Σύστημα Διεύθυνσης () Σύστημα Διεύθυνσης Ackerman y α Ορθό κινηματικό μοντέλο l π R+ = dtan α l π R = dtan α d v θ (x,y) l R ICC α x Omnidirectional -wheels robot Carnegie Mellon «Uranus» robot

Τροχοφόρα αυτοκινούμενα ρομπότ με σύνθετο σύστημα οδήγησης τροχών 5 «Υβριδικό» Ρομποτικό Όχημα Ρομπότ «Shrimp» (EPFL) 6

Βαδίζοντα συστήματα με πόδια Θηλαστικά ( ή πόδια) Ερπετά ( πόδια) Έντομα (6+ πόδια) Διάταξη ποδιών για βάδιση σε διάφορα βιολογικά συστήματα στη φύση 7 Αυτοκινούμενα ρομπότ με πόδια (Legged/walking robots) Παραδείγματα Εξάποδο ρομπότ Dante (NASA) Εξάποδο ρομπότ Ambler (Robotics Institute, CMU) 8

Σχεδίαση ρομποτικών σκελών για βάδιση (robotic limb design) P-R-R P-R-P P-P-R P-P-P R-R-R R-R-P R-P-R R-P-P (P: prismatic, R: rotational joint) (a)-(d): πρισματική άρθρωση στη διασύνδεση με το ρομπότ (e)-(h): στροφική άρθρωση στη διασύνδεση με το «σώμα» του ρομπότ 9 Αυτοκινούμενα ρομπότ με πόδια Ευστάθεια ρομποτικού οχήματος Σημεία στήριξης:,,..., n c Προβολή των σημείων στήριξης σε οριζόντο επίπεδο: Εαν η προβολή του κέντρου μάζας ανήκει στον κυρτό φλοιό (convex hull) τότε στατική ευστάθεια βάδισης 0

Έλεγχος ρομποτικού βηματισμού (gait control) Βηματισμός ή διασκελισμός (gait): πρότυπο συγχρονισμένης αλληλουχίας βημάτων (steps) Κάθε βήμα: φάση στήριξης (support) και μεταφοράς (transfer) Muybridge (878) Έλεγχος ρομποτικού βηματισμού Τρόποι «διασκελισμού» τετραπόδου Crawl («έρπειν», ή αργή βάδιση «με τα τέσσερα») Στατικά ευσταθής τρόπος βηματισμού

Τύποι «Βηματισμού» Τετράποδου Changeover walking Free-Fly Gaiting patterns Δυναμικός ρομποτικός βηματισμός D One-Leg Hopper (98-98) D Biped (989-995) Quadruped (98-987) ΜΙΤ Legged-Lab. Mark Raibert, Legged Robots that Balance, MIT Press, 986.

Humanoid Bipeds (/) Ανθρωπόμορφα ρομποτικά δίποδα (/) Sony Dream Robots (SDR): motion / communication entertainment (total 8 DOF) Sony SDR-X II Sony Corporation 5 Humanoid Bipeds (/) Ανθρωπόμορφα ρομποτικά δίποδα (/) Honda P Humanoid Robot Honda Motor Corporation 6

Biologically-inspired legged robots Uniroo (99-99) Troody 7 Αισθητήριες διατάξεις αυτόνομων ευφυών κινούμενων ρομπότ (mobile robot sensors) 8

Αισθητήριες διατάξεις για κινούμενα ρομπότ (mobile robot sensors) Στοιχεία κατηγοριοποίησης αισθητήρων Εσωτερική κατάσταση (διάταξη) ρομπότ (internal-state sensors proprioception) Κατάσταση/Δομή εξωτερικού περιβάλλοντος (external-state sensors exteroception) Contact vs. non-contact sensors Active vs. passive sensors (make observations by emitting or not emitting energy, e.g. laser range-finding vs. passive stereo-vision) Visual / non-visual sensors 9 Κατηγοριοποίηση Αισθητήρων () Κατηγορίες / Τύποι Αισθητήρων Αισθητήρες απόστασης (range sensors) laser range-finders, ultrasonic, infrared detectors Αισθητήρες θέσης (απόλυτης ή σχετικής) (absolute or relative positioning sensors) GPS, gyroscopes, inclinometers, compass, odometry, beacons Αδρανειακοί αισθητήρες (inertial sensors) accelerometers, etc. Αισθητήρες περιβάλλοντος (environmental sensors) ambient properties: temperature, light etc. pointwise/local properties: color of a point in front etc. 0

Κατηγοριοποίηση Αισθητήρων () Classification / Type Tactile sensors (detection of contact or proximity) Wheel/motor sensors Heading Sensors Beacons Active Ranging Motion/Speed sensors Vision-based sensors Sensor System Contact switches, Bumpers Non-contact proximity sensors Optical encoders; potentiometers etc. Compass; Gyroscopes; Inclinometers Optical or RF beacons; GPS Ultrasonic; Laser rangefinder Doppler radar / Doppler sound CCD / CMOS cameras EC ( PC) / Passive ( Active) EC / P EC /A PC / A;P EC;PC;EC / P EC / A( P);A EC / A EC / A EC / P (από: [Siegwart, Nourbakhsh, 00, MIT Press] ) Αισθητήριες διατάξεις κινούμενων ρομπότ Εισαγωγή () Βασικές Παρατηρήσεις Σφάλματα Μετρήσεων Θόρυβος (Real sensors are noisy!) Στοχαστική συνιστώσα σφαλμάτων Μετρήσεις ελλειπής πληροφορία (incomplete information returned) Μοντελοποιημένα σφάλματα μετρήσεων Αβεβαιότητες/ανακρίβειες στο μοντέλο αισθητήρα (uncertainties / inaccuracies) Επαναληπτικά σφάλματα μετρήσεων Filtering, interpolation, extrapolation Recovering/reconstructing

Αισθητήριες διατάξεις κινούμενων ρομπότ Εισαγωγή () Βασικές Ιδιότητες/Χαρακτηριστικά Αισθητήρων Ταχύτητα Μετρήσεων (speed of operation) time-delays, sensor dynamic response, etc. Μέγεθος,τύπος & συχνότητα σφαλμάτων (error rate) mean error & variance, rate of missed measurements, etc. Ευρωστία/ανθεκτικότητα σε μεταβολές Sensor robustness to physical disturbances, deviations from ideal operating conditions etc. Υπολογιστικές απαιτήσεις (computational requirements) Power, weight, size requirements Κόστος (cost) Χαρακτηριστικά Επίδοσης Αισθητήρων () Δυναμικό Εύρος (db) (Dynamic Range: measures spread between the lower and upper limits of sensor input values) 0log 0 (x max /x max ) Π.χ.: μετρήσεις τάσης mv-0v dynamic_range=0log(0/0.00)=86db Ανάλυση (Resolution): π.χ. 8bit A/D μετατροπή 0-5V 0mV resolution Γραμμικότητα (Linearity): Έστω sensor_output = y = f(x=input) inputs {x, x } {f(x ), f(x )} input [a x +b x ] [a f(x )+b f(x )] ευκολία στη βαθμονόμηση (calibration) του αισθητήρα Εύρος ζώνης (Bandwidth): «ταχύτητα» ροής σημάτων από αισθητήρα Ευαισθησία (Sensitivity): λόγος (output_change) / (input_change) Σφάλματα μετρήσεων (errors): measured value (m) true value (v) Ακρίβεια μετρήσεων (accuracy): accuracy= error / v

Χαρακτηριστικά Επίδοσης Αισθητήρων () Σφάλματα μετρήσεων (measurement errors) Συστηματικά Σφάλματα (systematic errors): μπορούν να μοντελοποιηθούν με βάση «ντετερμινιστικούς» μηχανισμούς δημιουργίας Τυχαία Σφάλματα (random errors): δεν μπορούν να μοντελοποιηθούν, θόρυβος, στοχαστικές διαδικασίες δημιουργίας (πιθανοτικά μοντέλα) Έστω σφάλμα μέτρησης ~ N(μ,σ ) Επαναληψιμότητα (αξιοπιστία) μετρήσεων = range / σ (reproducibility, precision): επαναληψιμότητα διαδοχικών μετρήσεων (ανεξαρτήτως ακρίβειας ως προς το πραγματικό μετρούμενο μέγεθος) Ακρίβεια (accuracy) μετρήσεων = μ / value Χαρακτηρισμός και Διαχείριση σφαλμάτων μέτρησης: η βασική «πρόκληση» στον έλεγχο κινούμενων ρομπότ Προβλήματα: υπέρθεση συστηματικών και τυχαίων σφαλμάτων, πολυτροπικές κατανομές σφάλματος... 5 Αισθητήρες επαφής (contact sensors) Bumpers: μικροδιακόπτες binary on/off signal Tactile-array sensors: μετατροπείς μηχανικής παραμόρφωσης (e.g. force sensitive resistors) continuous force measuring signal Διαχείριση σημάτων από αισθητήρες επαφής trigger emergency-stop circuitry initiate collision-avoidance procedures 6

Αισθητήρες εσωτερικής κατάστασης (internal sensors) Inertial sensors (αδρανειακοί αισθητήρες): Accelerometers (επιταχυνσιόμετρα) Σύστημα αναρτημένης μάζας σε ελατήρια μέτρηση γραμμικής επιτάχυνσης από μετατόπιση δx = και F = K ( x xm) F mx m δx K δx x = m 7 Αισθητήρες εσωτερικής κατάστασης (internal sensors) (συνέχεια) Inertial sensors (αδρανειακοί αισθητήρες) (cont d) Gyroscopes (γυροσκόπια) μέτρηση σχετικής γωνιακής απόκλισης δθ (robot heading) ως προς σταθερό πλαίσιο αναφοράς. Optical gyroscope. Μηχανική αρχή λειτουργίας: περιστεφόμενος τροχός αναρτημένος μέσω gimbal joints 8

Αισθητήρες εσωτερικής κατάστασης (internal sensors) (συνέχεια) Inertial sensors (αδρανειακοί αισθητήρες) (cont d) Gyroscopes (γυροσκόπια) μέτρηση σχετικής γωνιακής απόκλισης δθ (robot heading) ως προς σταθερό πλαίσιο αναφοράς Μηχανική αρχή λειτουργίας: περιστεφόμενος τροχός αναρτημένος μέσω gimbal joints 9 Αισθητήρες εσωτερικής κατάστασης internal sensors (συνέχεια) Absolute position sensors: Compass & Inclinometers Πυξίδα απόλυτη διεύθυνση κίνησης σε οριζόντιο επίπεδο (absolute heading) - Hall-effect digital compass (χαμηλή ανάλυση, biases, low-bandwidth) - Fluxgate magnetometers (καλύτερη ανάλυση & εύρος ζώνης, κόστος ) Αισθητήρες κλίσης απόλυτη γωνία κλίσης τηςρομποτικήςπλατφόρμαςωςπροςτοοριζόντιοεπίπεδο (pitch/roll angles) 50

Εξωτερικοί αισθητήρες απόστασης (active ranging sensors) () Infrared proximity sensors (IR detectors) Αισθητήρες υπερύθρων μέτρηση εγγύτητας Sensus 00 IR ring (Nomadic Technologies) Αρχή Λειτουργίας: Εκπομπή ενός υπέρυθρου σήματος (IR led signal) και ανίχνευση αντανακλώμενου σήματος (IR detector, e.g. phototransistor) απόσταση = f (ισχύς ανακλώμενου φωτεινού σήματος) Υπέρυθρο σήμα κωδικοποιημένο για την αποφυγή σύγχισης με άλλες φωτεινές πηγές (ambient light etc.) 5 Εξωτερικοί αισθητήρες απόστασης (active ranging sensors) () Sonar (ultrasonic) sensors (sound navigation and ranging) Αισθητήρες υπερύχων μέτρηση απόστασης Sensus 00 ultrasonic ring (Nomadic Technologies) d = c Δt c: ταχύτητα ήχου στον αέρα Δt: μετρήσιμο time-delay d: εκτιμούμενη απόσταση Αρχή Λειτουργίας: Εκπομπή ενός ηχητικού σήματος, και ανίχνευση του ανακλώμενου σήματος (ηχώ) Μέτρηση: (α) χρονικής καθυστέρησης (time-of-flight) (β) διαφοράς φάσης (phase-shift), ή (γ) έντασης του ανακλώμενου σήματος Ισχύει: c (c 0 +0.6T) m/sec, όπου c 0 = m/s και Τ: θερμοκρασία αέρα ( ο C) 5

Εξωτερικοί αισθητήρες απόστασης (active ranging sensors) () Sonar amplitude profile (Polaroid sonar sensor) Παρατήρηση: όχι ομοιόμορφη κατανομή ενέργειας σε διαφορετικές γωνίες μετάδοσης του ηχητικού σήματος ( κώνος μετάδοσης, πολλαπλά μέγιστα) Τυπική συχνότητα μεταδιδόμενου ηχητικού σήματος: 0-50KHz. Συχνότητα γρηγορότερη απόσβεση, αλλά καλύτερη διακριτική ικανότητα (resolution) Δυσκολίες/Προβλήματα: μία μέτρηση δεν αρκεί για το μοναδικό προσδιορισμό της θέσης ενός εμποδίου (μέσα στον κώνο μετάδοσης) κατοπτρική ανάκλαση (specular reflections) πιθανόν η «ηχώ» να προέρχεται από πολλαπλές ανακλάσεις κλπ. (ray-tracing sonar simulation algorithm) 5 Εξωτερικοί αισθητήρες απόστασης (active ranging sensors) () Μετρήσεις sonar ομαδοποιημένες σε πιθανές δομές «τείχων» (walls) Παρατήρηση: Sonar artifacts: illusory walls etc. Μέτρηση από αισθητήρα Sonar: Region of Constant Distance (RCD) 5

Εξωτερικοί αισθητήρες απόστασης (active ranging sensors) (5) ω d f φ d x tan φ = z/ d = f / x z= fd / x ( ) z ( ) tan ω = z/ d d d = d zcotω φ Laser Rangefinders (Sick Laser sensor) Αρχή Λειτουργίας: (α) time-of-flight (χρονική καθυστέρηση) (β) phase-based (διαφοράς φάσης) (γ) triangulation (τριγωνοποίηση) Triangulation: z = f fd cotω + x Light source ω d x z f z 55 Εξωτερικοί αισθητήρες απόστασης (active ranging sensors) (6) Laser-scans alignment 56

Ε.Μ.Π., ΣΗΜΜΥ, Ακαδημαϊκό Έτος 007-08, 8ο Εξάμηνο Μάθημα: Ρομποτική ΙΙ. Διδάσκων: Κ.Τζαφέστας ΕΝΟΤΗΤΑ : Αυτόνομα Ευφυή Κινούμενα Ρομποτικά Συστήματα Σύνθεση αισθητηρίων πληροφοριών (data / sensor fusion) Αυτόνομα Ευφυή Κινούμενα Ρομπότ Περιεχόμενα Ενότητας Μηχανισμοί Κίνησης στο χώρο (locomotion) Αισθητήριες Διατάξεις (sensing) Proprioception (internal state ) / Exteroception etc. Σύνθεση αισθητηρίων πληροφοριών (sensor fusion) Αρχιτεκτονικές ελέγχου (mobile robot control architectures) Αυτοεντοπισμός θέσης / Χαρτογράφηση (self-localisation / map-building) Σχεδιασμός Δρόμου - Πλοήγηση (path planning / navigation) perception action motion control sensing reasoning

Σύνθεση αισθητηρίων πληροφοριών (sensor fusion) Εισαγωγή () Βασικό Πρόβλημα: Εκτίμηση ενός φυσικού μεγέθους (π.χ. θέση x του ρομπότ) συνδυάζοντας n διαφορετικές ενδείξεις {z i } (i=,...,n) (π.χ. από διαφορετικούς αισθητήρες) Έστω ότι όλες οι μετρήσεις z i έχουν την ίδια «αξιοπιστία», και έστω ότι κάθε μέτρηση είναι το αποτέλεσμα μιας στοχαστικής (Gaussian) διαδικασίας με μέση τιμή z i και διασπορά σ i = σταθ. για όλα τα i. Τότε έχουμε πολύ απλά για την «συνολική εκτίμηση» της μεταβλητής x: (unweighted averaging) ˆ σ = i και () x ˆ = z i n σ n Σύνθεση αισθητηρίων πληροφοριών (sensor fusion) Εισαγωγή () Έστω ότι όλες οι μετρήσεις z i δεν έχουν την ίδια «αξιοπιστία», δηλαδή ότι για κάθε μέτρηση z i αντιστοιχεί διαφορετική διασπορά (variance) σ i Τότε για την «συνολική εκτίμηση» ˆx της μεταβλητής x: πρέπει κάθε μέτρηση να ληφθεί υπ όψη με διαφορετική βαρύτητα, δηλ. να αθροιστεί με κατάλληλο βάρος, για τον υπολογισμό μιας «ανισοβαρούς βέλτιστης μέσης τιμής» (weighted mean σταθμισμένος μέσος). Απλό Παράδειγμα Έστω ότι αποκτούμε σειριακά δύο μετρήσεις, z (τη χρονική στιγμή t ) και z (τη χρονική στιγμή t t ) με τυπική απόκλιση σ z και σ z αντίστοιχα. Έχουμε: x ˆ t = E( x z ) = z και ˆ σ t = σ z Με την υπόθεση της Gaussian κατανομής, μπορούμε να υπολογίσουμε μια συνολική βέλτιστη εκτίμηση, με δεδομένη και τη μέτρηση z, ως εξής: σ σ x ˆ t z z = σz+ σ z + z σz+ σ z z και = + σ σ σ ( t ) ˆ z z ()

Σύνθεση αισθητηρίων πληροφοριών (sensor fusion) Εισαγωγή () Απλό Παράδειγμα (συνέχεια) Η παραπάνω σχέση () γράφεται επίσης ως εξής x ˆ t = z : ˆ σ t σ t t K t = + t xˆ xˆ z xˆ όπου: Kt σ = σ + z z σ z () = z και: t t K t t = ˆ σ ˆ σ ˆ σ 5 Σύνθεση αισθητηρίων πληροφοριών (sensor fusion) Εισαγωγή () Απλό Παράδειγμα (συνέχεια) Γραφική απεικόνιση Συνδυασμός δύο μετρήσεων z και z μ z K z, z xˆ = = + ( ) z z όπου: K( z z ) σ z, = σ z+ σ z και: ˆ σ = ˆ σ K( ) ˆ σ z z, z z 6

Σύνθεση αισθητηρίων πληροφοριών (sensor fusion) Εισαγωγή (5) Απλό Παράδειγμα (συνέχεια) Εισάγουμε τώρα μια απλή δυναμική συμπεριφορά (πεδίο του χρόνου) στο σύστημα: dx/dt = u + w όπου u σήμα ελέγχου που αντιστοιχεί στην ονομαστική ταχύτητα του ρομπότ, και w σήμα θορύβου που οφείλεται στην ύπαρξη αβεβαιότητας (διαταραχών) στην πραγματική κίνηση του ρομποτικού συστήματος. Υποθέτουμε συνήθως ότι το w μοντελοποιείται ως «λευκός Γκαουσσιανός θόρυβος»: (0,σ w ). xˆ t = xˆ t + u t t t t = + t t ˆ σ ˆ σ σw 7 Σύνθεση αισθητηρίων πληροφοριών (sensor fusion) Εισαγωγή (6) t=t : xˆ t = xˆ t + u t t t t = + t t ˆ σ ˆ σ σw Αρχική πρόβλεψη στη χρονική στιγμή t ˆ σ, t xˆ t Νέα μέτρηση z t=t : () t t K t = + t xˆ xˆ z xˆ t t K t = t ˆ σ ˆ σ ˆ σ όπου: ˆ σ t = ˆ σ t + σ z Kt Βασική δομή αναδρομικού φίλτρου Kalman στο διακριτό χρόνο, για τον αναδρομικό υπολογισμό σε κάθε χρονική στιγμή της νέας «βέλτιστης» εκτίμησης, και των στοχαστικών ιδιοτήτων αυτής (διασπορά) 8

Σύνθεση αισθητηρίων πληροφοριών Φίλτρο Kalman Εισαγωγή () Φίλτρο Kalman: αναδρομικός αλγόριθμος εκτίμησης της κατάστασης ενός συστήματος (recursive state-estimation), χρησιμοποιώντας γραμμικό δυναμικό μοντέλο της συμπεριφοράς του συστήματος (linear plant model) καθώς και μοντέλο της λειτουργίας των αισθητήρων (sensor/measurement model). Συμβολισμοί/Ορολογία xˆ ( kk ) : εκτίμηση κατάστασης στη χρονική στιγμή k, χρησιμοποιώντας δεδομένα μετρήσεων μέχρι και τη χρονική στιγμή k x() k ηή xˆ() k = x ˆ( k k ) : πρόβλεψη κατάστασης τη στιγμή k, χρησιμοποιώντας δεδομένα μετρήσεων μέχρι και τη χρονική στιγμή k- (prediction) xˆ( k) ηή xˆ( k + ) = xˆ( k k) (updated estimate) : νέα (ανανεωμένη) εκτίμηση κατάστασης τη στιγμή k, χρησιμοποιώντας δεδομένα μετρήσεων μέχρι και τη χρονική στιγμή k 9 Σύνθεση αισθητηρίων πληροφοριών Φίλτρο Kalman Εισαγωγή () Μοντέλο μετρήσεων (ή μοντέλο αισθητήρων): [ ξ] z( k) = hx( k), + v ( k) (measurement/sensor model) noise function, with covariance matrix C v model of the environment Γραμμικό μοντέλο μετρήσεων: z( k) = H x( k) + v( k) (5) Μοντέλο συστήματος (plant model): [ ] x( k+ ) = Φ x( k), u( k) + w( k) state transition function noise function, covariance matrix C w control input Γραμμικό μοντέλο συστήματος: x( k+ ) = A x( k) + B u( k) + w( k) (6) 0

Σύνθεση αισθητηρίων πληροφοριών: Deterministic Least-Squares estimation z = H x+ v (z: διάνυσμα l x, x: διάνυσμα n x ) Εαν l n τότε: T ( ) T xˆ = H H H z least-squares estimate T mini = z H xˆ z H xˆ ( ) ( ) (7) ( HRH) T - T - xˆ = HR z weighted least-squares estimate T mini = z H xˆ R z H xˆ (8) ( ) ( ) Deterministic optimal (in the least-squared sense) solutions: no probability density function associated with x and z Σύνθεση αισθητηρίων πληροφοριών: Maximum-Likelihood Estimation z = H x+ v p(z x) ακολουθεί την κατανομή πιθανότητας p(v) Maximum-likelihood estimate ˆx ˆx : μεγιστοποιεί την πιθανότητα p(z x), δεδομένων των στατιστικών ιδιοτήτων του σήματος θορύβου v στις μετρήσεις των αισθητήρων Εαν υποθέσουμε κανονική (Gaussian) κατανομή για το θόρυβο v, με μηδενική μέση τιμή και μήτρα διακύμανσης (covariance) R, τότε: p( z x) = e / / ( π ) l R T ( z H x ) R ( z H x) T [ p z x ] ( z H x) R ( z H x) max ( ) min Άρα εδώ: maximum-likelihood estimate weighted least-squares estimate (8)

Σύνθεση αισθητηρίων πληροφοριών: Minimum-Variance Bayesian Estimate p( xz ) = p( z x) p( x) p( z) : Bayes theorem (a-posteriori conditional density function) ( p(x), p(z) : a-priori probability density functions ) Minimum-variance Bayes estimate ˆx ˆx : ελαχιστοποιεί το συναρτησιακό: T min I=... x xˆ x xˆ p( x z) dxdx... dxn S ( ) ( ) E {( ) T x ˆ S( ˆ) } δηλαδή: I= variance( xz ) = x x x x z (διακύμανση) (S: θετικά ορισμένη μήτρα nxn) απ όπου παίρνουμε: xˆ =... x p( x z) dxdx dx n = Ex ( x z) και εάν x και v ακολουθούν κανονική (Gaussian) κατανομή, έχουμε: T ( ) T (9) xˆ = P 0 + H R H H R z όπου P 0 : a-priori covariance matrix of x = cov(x) Σύνθεση αισθητηρίων πληροφοριών: Αναδρομικά φίλτρα (recursive linear filters) Απλό Παράδειγμα-: Εκτίμηση του βαθμωτού μεγέθους x στη βάση k μετρήσεων: z i =h x+v i (i=,,k) k z k i i= xˆ( k) = h νέα μέτρηση z k+ ˆ( ) h k+ k x k z ˆ( ) k i x k k h h + = + z k i z + + = i k k = + + i k = + xˆ( k+ ) = k xˆ( k) + h z k k+ k+ + ˆ( k ) ˆ( k) h ή x + = x + zk h xˆ( k) k + + Γενικεύοντας για διανυσματικά μεγέθη z i, x: z i =H i x+v i (i=,,k) και εισάγοντας και δυναμική στο χώρο κατάστασης: x k+ = Ax k + Bu k + w k xˆ( k+ ) = xˆ( k+ k) + K z H xˆ( k+ k) k+ k+ k+ όπου: xˆ( k+ k) = A xˆ( k) + B uk (0)

Σύνθεση αισθητηρίων πληροφοριών Φίλτρο Kalman () Φίλτρο Kalman Υποθέσεις (assumptions). Γραμμικό μοντέλο συστήματος: x( k+ ) = A x( k) + B u( k) + w( k). Γραμμικό μοντέλο μετρήσεων: z( k) = H x( k) + v( k). Θόρυβος συστήματος: Γκαουσιανός, λευκός, με μηδενική μέση τιμή E[w k ]=0, T και ασυσχέτιστος (uncorrelated) covariance matrix: C ( k ) = E[( w )( w ) ] k w k k T. Αντίστοιχα για το θόρυβο μετρήσεων v(k), E[v k ]=0, C ( k ) = R = E[( v )( v ) ] v k k k xˆ( k+ k) = A xˆ( k) + B uk (linear plant model) (K-) Έστω: T ( k) E P = e( k) e ( k) (state covariance matrix) όπου: e( k) = x( k) xˆ ( k) (K-) T Ποιό το: ( k k) E P + = e( k+ k) e ( k+ k) όπου: e( k+ k) = x( k+ ) xˆ ( k+ k) 5 Σύνθεση αισθητηρίων πληροφοριών Φίλτρο Kalman () Είναι: T ˆ ˆ P( k+ k) = E x( k+ ) x( k+ k) x( k+ ) x( k+ k) όπου: x( k+ ) = A x( k) + B uk + wk και: xˆ( k+ k) = A xˆ( k) + B uk Άρα: T ˆ k ˆ x x w x x wk P( k+ k) = E A ( k) ( k) + A ( k) ( k) + T + = + P( k k) A P( k) A C ( k) (state covariance matrix) (K-) : Μήτρα συνδιακύμανσης της πρόβλεψης w υποδηλώνει πώς εξελίσσεται χρονικά η διακύμανση της μεταβλητής κατάστασης του συστήματος, δηλαδή πώς μεταβάλλεται η «αξιοπιστία» της εκτίμησης την οποία έχουμε σε κάθε k για την τρέχουσα κατάσταση x k του συστήματος, χωρίς νέα δεδομένα ανάδρασης z k (corrective feedback). 6

Σύνθεση αισθητηρίων πληροφοριών Φίλτρο Kalman () Νέα ανανεωμένη εκτίμηση της κατάστασης (updated estimate) χρησιμοποιώντας δεδομένα ανάδρασης (μετρήσεις) και από τη χρονική στιγμή k+: xˆ( k+ ) = xˆ( k+ k) + K z H xˆ( k+ k) k+ k+ k+ r(k+) r(k+): innovation, difference between actual sensor reading : and predicted sensor data : z k+ (K-) Hk xˆ ( k k) + + Εύρεση βέλτιστου κέρδους ανάδρασης του φίλτρου (Kalman gain) K k+ Υπολογισμός της νέας μήτρας διακύμανσης P(k+) για την ανανεωμένη εκτίμηση xˆ ( k + ) της κατάστασης του συστήματος 7 Σύνθεση αισθητηρίων πληροφοριών Φίλτρο Kalman () Εύρεση βέλτιστου κέρδους ανάδρασης του φίλτρου (Kalman gain) K k+ [ ] min I = E e e = trace P T k+ k+ k+ k+ Είναι: P( k+ ) = e( k+ ) e ( k+ ) όπου: e( k+ ) = x( k+ ) xˆ ( k+ ) E Δεδομένου ότι από την (Κ): xˆ( k+ ) = ( I K H ) xˆ( k+ k) + K έχουμε: e( k+ ) = ( I Kk+ Hk+ ) e( k+ k) + Kk+ ( Hk+ x( k+ ) zk+ ) Άρα: T k+ k+ k+ k+ vk + T T k+ k+ k+ k+ k+ k+ k+ P( k+ ) = I K H P( k+ k) I K H + K R K z (K-) Ισχύει όμως: A ABA AB, όταν: BT =B (δηλ.: B συμμετρική μήτρα) T = 8

Σύνθεση αισθητηρίων πληροφοριών Φίλτρο Kalman (5) Εύρεση βέλτιστου κέρδους ανάδρασης του φίλτρου Kalman (συνέχεια) T min I k+ = E ek+ ek+ = trace[ Pk+ ] Άρα πρέπει: { trace [ ( k ) ] } k+ K P + = 0 Ik+ ( ) ( k k) ( ) και από τη σχέση (Κ-): T k + k + k + k + k + I K H P + H + K R = 0 T T k+ = ( k+ k) k+ k+ ( k+ k) k+ + k + K P H H P H R (K-5) Bέλτιστο κέρδος ανάδρασης (optimal Kalman gain) 9 Σύνθεση αισθητηρίων πληροφοριών Φίλτρο Kalman (6) Υπολογισμός της νέας μήτρας διακύμανσης P(k+) για την ανανεωμένη εκτίμηση xˆ ( k + ) της κατάστασης του συστήματος Από τη σχέση (Κ-): T T k+ k+ k+ k+ k+ k+ k+ P( k+ ) = I K H P( k+ k) I K H + K R K Αντικαθιστώντας την (Κ-5): P ( k + ) = I K H P ( k + k) (K-) k+ k+ 0

Σύνθεση αισθητηρίων πληροφοριών Φίλτρο Kalman: Σύνοψη Αρχική εκτίμηση x ˆ( k = 0) με C w ( k) και C ( k ) = R, ( =, ) v k k xˆ( k+ k) = A xˆ( k) + B u k (linear plant model) (K-) T P( k+ k) = A P( k) A + C w( k) (state covariance matrix) (K-) μέ Νέα ανανεωμένη εκτίμηση κατάστασης και μήτρα διακύμανσης xˆ( k+ ) = xˆ( k+ k) + K z H x ˆ( k+ k) (K-) k+ k+ k+ k+ k+ P ( k + ) = I K H P ( k + k) (K-) όπου, βέλτιστο κέρδος ανάδρασης (optimal Kalman gain) T T k+ = ( k+ k) k+ k+ ( k+ k) k k + + + K P H H P H R (K-5) Σύνθεση αισθητηρίων πληροφοριών Παραδείγματα Παράδειγμα Έστω ολονομικό (omni-directional) ρομπότ πάνω στο επίπεδο -xy Το διάνυσμα κατάστασης του ρομπότ είναι: x(k) = [ x(k), y(k) ] T Το διάνυσμα σημάτων ελέγχου είναι: u(k) = [ Δx(k), Δy(k)] T x( k) +Δ x( k) + wx ( k) Η εξίσωση κατάστασης είναι: x( k + ) = yk ( ) +Δ yk ( ) + wy ( k) (δηλαδή, Α=Ι) (Π.-) Έστω ότι το ρομπότ διαθέτει αισθητήρα που παρέχει μια μέτρηση της θέσης [x(k),y(k)] του ρομπότ από ένα σημείο αναφοράς [0,0] x( k) + vx( k) 0 xk ( ) vx( k) ( k) = Δηλαδή: z = + yk ( ) + vy( k) 0 yk ( ) vy( k) (Π.-) Hk x( k ) v( k )

Σύνθεση αισθητηρίων πληροφοριών Παραδείγματα (συνέχεια) () Παράδειγμα (συνέχεια) Έστω C w (k)= C w =σταθ. και C v (k)=r=c v =σταθ. Έχουμε, εφαρμόζοντας το αναδρομικό φίλτρο Kalman: με xˆ( k) + Δx( k) xˆ( k+ k) = yk ˆ( ) +Δyk ( ) (Π.-) P( k+ k) A P( k) A C ( k) = P( k) C T = + w + Βέλτιστο κέρδος ανάδρασης φίλτρου Kalman (H=I): K = P( ) P( ) + R k k k + + k+ k w (Π.-5) (Π.-) Νέα ανανεωμένη εκτίμηση κατάστασης και νέα μήτρα διακύμανσης = + πρόβλεψη/εκτίμηση κατάστασης (a-priori) αβεβαιότητα πρόβλεψης Kalman (optimal) feedback gain xˆ( k+ ) xˆ( k+ k) Kk+ zk ˆ( k k) + x + και = k+ (Π.-6) P( k+ ) I K P( k+ k) Σύνθεση αισθητηρίων πληροφοριών Παραδείγματα (συνέχεια) () Παράδειγμα (συνέχεια) Έστω, π.χ.: Cw = diag [ σw ( k), σ ( )] x w k y Έχουμε, εφαρμόζοντας το αναδρομικό φίλτρο Kalman: Pk ( + k) = Pk ( ) + C diag [( ( ) ( )),( ( ) w = σx k + σw k σ ( ))] x y k + σw k y Βέλτιστο κέρδος ανάδρασης φίλτρου Kalman (H=I): Kk ( + ) = Pk ( + k) [ Pk ( + k) + R] - = σx + σw 0 σ 0 x x + σw + σ x v x = 0 σy + σw 0 σ y y + σw + σ y vy ( σx + σw ) ( σ ) 0 x x + σw + σ x v x = 0 ( σy + σw ) ( σ ) y y + σw + σ y vy Νέα ανανεωμένη εκτίμηση κατάστασης σ σ σx + σw x xˆ = x + ( z ) x x σx + σw + σ y + wy yˆ = y + ( z ) y y x v σ x y + σw + σ y vy -

Σύνθεση αισθητηρίων πληροφοριών Παραδείγματα (συνέχεια) () Παράδειγμα Επεκταμένο Φίλτρο Kalman (Extended KF) Έστω κινούμενο ρομπότ διαφορικής οδήγησης (differential drive) Το διάνυσμα κατάστασης του ρομπότ είναι: x(k) = [ x(k), y(k), θ(k) ] T Το διάνυσμα σημάτων ελέγχου είναι: u(k) = [ D(k), Δθ(k) ] T Το μή-γραμμικό μοντέλο του συστήματος στο χώρο κατάστασης: x( k+ ) = Φ[ x( k), u( k) ] + w( k) με Φ[ x u ] ( θ ) ( θ ) k x( k) + D( k)cos ( k) ( k), ( k) = y( k) + D( k)sin ( k) θ( k) +Δθ( ) C w (k): μήτρα διακύμανσης (covariance matrix) της τυχαία διαταραχής w(k) σ T x 0 0 Cw( k) = E ( wk)( wk) = 0 σ y 0 και [ w k ] 0 0 σθ E = 0 (Π.-) (Π.-) 5 Σύνθεση αισθητηρίων πληροφοριών Παραδείγματα (συνέχεια) () Παράδειγμα (συνέχεια) Έστω τώρα ότι το κινούμενο ρομπότ διαθέτει αισθητήριο σύστημα που δίνει την απόσταση d του ρομπότ από κάποια συγκεκριμένη θέση αναφοράς (ορόσημο, landmark): [x b, y b ] (π.χ. special signal-emitting beacon) Το μή-γραμμικό μοντέλο μετρήσεων για το σύστημα, είναι τώρα: k = h[ k ξ] + v k [ x( ), ] = = ( ( ) b) + ( ( ) b) z( ) x( ), ( ) με ξ h k d x k x y k y και γνωστή μήτρα διακύμανσης C v (k)= C v για το θόρυβο v(k) (Π.-) 6

Σύνθεση αισθητηρίων πληροφοριών Παραδείγματα (συνέχεια) (5) Παράδειγμα (συνέχεια) ( ˆ θ ) ( ˆ θ ) k xˆ( k) + D( k)cos ( k) x ˆ( k+ k) = yk ˆ( ) + Dk ( )sin ( k) ˆ( θ k ) +Δθ ( ) ( ˆ θ k) ( ˆ θ k) (Π.-) 0 Dk ( )sin ( ) Ak = Φ = 0 Dk ( )cos ( ) (Π.-5) x= xˆ ( k) 0 0 T P( k+ k) = A P( k) A + C w( k) (Π.-6) πρόβλεψη/εκτίμηση κατάστασης (a-priori) γραμμικοποίηση χώρου κατάστασης αβεβαιότητα πρόβλεψης 7 Σύνθεση αισθητηρίων πληροφοριών Παραδείγματα (συνέχεια) (6) Παράδειγμα (συνέχεια) T ( xk ˆ( ) xb ) H k+ = h x= xˆ ( k) = ( yk ˆ( ) yb) (Π.-7) 0 Βέλτιστο κέρδος ανάδρασης φίλτρου Kalman: T T k+ = ( k+ k) k+ k+ ( k+ k) k v + + K P H H P H C (Π.-8) γραμμικοποίηση μοντέλου μέτρησης Kalman (optimal) feedback gain Νέα ανανεωμένη εκτίμηση κατάστασης και νέα μήτρα διακύμανσης xˆ( k+ ) = xˆ( k+ k) +Kk r( k+ ) + με r( k+ ) = z xˆ ( k+ k) k+ (Π.-9) και P ( k + ) = I K H P ( k + k) k+ k+ (Π.-0) 8

Σύνθεση αισθητηρίων πληροφοριών Παραδείγματα (συνέχεια) (7) xˆ( k) xˆ( k+ k) xˆ( k + ) Παράδειγμα : p x= p θ r z= b x y (range) (bearing) Αρχική Εκτίμηση Δράση / Κίνηση Μέτρηση D u= δθ x( k+ ) =Φ ((),()) x k u k + w() k x + Φ( x( k), u( k) ) = y + θ h( x( k), u( k) ) = z( k+ ) = h((),()) x k u k + v() k ( θ ) ( θ ) + δθ k p ( k) D( k)cos ( k) p ( k) D( k)sin ( k) ( k) ( ) ( λx px) + ( λy py) λy p y arc tan θ λx px 9 Σύνθεση αισθητηρίων πληροφοριών Παραδείγματα (συνέχεια) (8) Παράδειγμα (συνέχεια): Πρόβλεψη Μοντέλο κίνησης A k ( ˆ θ ) ( ˆ θ ) pˆ x ( k) + D( k)cos ( k) xˆ( k+ k) = pˆ y ( k) + D( k)sin ( k) ˆ( θ k ) +Δθ ( k ) x= xˆ ( k) = Φ = ( ˆ θ k) ( ˆ θ k) 0 Dk ( )sin ( ) 0 Dk ( )cos ( ) 0 0 P( k+ k) = A P( k) A + C ( k) T k k w H Μοντέλο μέτρησης k+ = h = x= xˆ ( k) ( pˆx λx) ( pˆ y λy) 0 r r = ( y pˆ y) ( x pˆ λ λ x ) r r k+ ( k+ ) xˆ( k+ ) = xˆ( k+ k) + K z xˆ( k+ k) P ( k + ) = I K H P ( k + k) k+ k+ ( tan ) = ( + ) d a x x dx T T k+ = ( k+ k) k+ k+ ( k+ k) k+ + v K P H H P H C 0

Σύνθεση αισθητηρίων πληροφοριών Χαρτογράφηση χώρου Τροχιά ρομπότ Sensor map Σύνθεση αισθητηρίων πληροφοριών Αυτοεντοπισμός Θέσης () Open loop no odometry With odometry Robot kinematic uncertainties Τροχιά ρομπότ ρομπότ With odometry Precise robot kinematics (stochastic errors) Εκτίμηση θέσης ρομπότ Εκτίμηση θέσης ρομπότ

Σύνθεση αισθητηρίων πληροφοριών Αυτοεντοπισμός Θέσης () Εκτίμηση θέσης ρομπότ Τρέχουσα θέση ρομπότ οδομετρία βελτιωμένη εκτίμηση θέσης : Πραγματική τροχιά ρομπότ ο : Εκτίμηση θέσης ρομπότ με χρήση οδομετρίας (odometry readings) + : Βελτιωμένη εκτίμηση θέσης ρομπότ (IR readings geometric landmarks ) Particle Filters Sequential Monte Carlo Οι μέθοδοι Monte Carlo περιγράφουν, γενικά, κατανομές πιθανότητας ως σύνολα «σταθμισμένων δειγμάτων» (weighted samples) στο χώρο κατάστασης. Μελετώντας τα στατιστικά χαρακτηριστικά των δειγμάτων, καθώς εξελίσσονται μέσω της δυναμικής του συστήματος και της Bayesian λογικής, μπορεί να εκτιμηθεί, μέσω προσομοίωσης, η κατάσταση ενός στοχαστικού συστήματος. Particle Filters («φίλτρα σωματίων»): sequential Markov Chain Monte Carlo (MCMC) μέθοδοι, βάσει importance sampling («δειγματοληψία σημαντικότητας») Πρόβλημα: Η εκτίμηση της «εκ των υστέρων» (posterior) κατανομής πιθανότητας ( k k (i=,,n) P xk Z, U, x0 ) (w i : βάρη δειγμάτων) η οποία προσεγγίζεται μέσω της κατανομής ενός συνόλου δειγμάτων {x i,w i } N i i P( x) wδ ( x x ) (όπου i w i = ) i=

Particle Filters - Εισαγωγή Έστω: x k : διάνυσμα κατάστασης προς εκτίμηση τη χρονική στιγμή k u k : διάνυσμα σημάτων ελέγχου, εφαρμοζόμενο τη χρονική στιγμή k, οδηγώντας την κατάσταση από το x k- στο x k. z k : διάνυσμα μετρήσεων (παρατήρησης) που λαμβάνεται τη χρονική στιγμή k k k Το ιστορικό των διανυσμάτων κατάστασης: X = { x } { 0, x,, xk = X, xk} k k Το ιστορικό των διανυσμάτων ελέγχου: U = { u } {, u,, uk = U, uk} k k Το ιστορικό των διανυσμάτων παρατήρησης: Z = z, z,, x = Z, z { k} { k} Μοντέλο Παρατήρησης (μέτρησης) Ανανέωση Εκτίμησης (Bayes rule) k k k k P( zk xk) P( xk Z, U, x0 ) P( xk Z, U, x0 ) = k k P z Z, U ( k ) Μοντέλο Πρόβλεψης Μετάβασης Κατάστασης (Markov assumption) P x Z k, U k, x = P x x, u P x Z k, U k, x dx ( ) ( ) ( ) k 0 k k k k 0 k 5 Δειγματοληψία Importance Sampling Περιγραφή κατανομής πιθανότητας μέσω σταθμισμένων δειγμάτων: N i i P( x) wδ ( x x ) (όπου i w i = ) i= Επιλογή βαρών (weights), ώστε να προκύψει «πιστή» αναπαράσταση της εκτιμούμενης κατανομής πιθανότητας P(x): Importance Density («πιθανότητα σημαντικότητας») q(x) Δειγματοληψία της q(x), και στάθμιση των δειγμάτων ως: i P w q ( x i ) i ( x ) (α) Εαν q(x) ομοιόμορφη κατανομή πυκνότητας πιθανότητας σε όλο το χώρο i i κατάστασης, τότε: w P x (regular grid model) ( ) (β) Εαν q(x)=p(x), τότε w i (x)=(/n) (particle distribution, with equal weights) 6

Δειγματοληψία Κατανομών () Προσέγγιση συναρτήσεων πυκνότητας πιθανότητας μέσω συνόλου δειγμάτων (approximating particle sets) Όσο μεγαλύτερος αριθμός δειγμάτων σε ένα διάστημα, τόσο μεγαλύτερη πιθανότητα Πώς μπορεί να γίνει η εξαγωγή δειγμάτων από μια συνάρτηση πιθανότητας; 7 Δειγματοληψία Κατανομών () (α) Δειγματοληψία μέσω «Rejection Sampling» Έστω ότι f(x)< for all x Sample x from a uniform distribution Sample c from [0,] if f(x) > c keep the sample otherwise reject the sampe 8

Δειγματοληψία Κατανομών () (α) Δειγματοληψία μέσω «Importance Sampling» Χρήση διαφορετικής κατανομής q για την εξαγωγή δειγμάτων από την f Εισάγοντας ένα βάρος «σημαντικότητας» μπορούμε να σταθμίσουμε τα δείγματα, ισοσταθμίζοντας τις «διαφορές μεταξύ των q και f» w = f / g Η f είναι η συνάρτηση «στόχος» Η q καλείται συνάρτηση «σημαντικότητας» (importance or proposal) 9 Particle Filters Εισαγωγή () Στατιστική μέθοδος που βασίζεται στον κανόνα του Bayes και έχει χρησιμοποιηθεί σε πολλά συστήματα παρακολούθησης (tracking) αντικειμένων. Η βασική ιδέα της μεθόδου είναι η χρήση δειγμάτων (particles) για την αναπαράσταση του μοντέλου του συστήματος (αντί Gaussian κατανομών ή οποιουδήποτε άλλου μοντέλου) και η διάδοση μόνο των επικρατέστερων δειγμάτων. ( Survival of the fittest ) Βασικά Βήματα Αλγορίθμων που χρησιμοποιούν particle filtering: Τοποθέτηση Ν δειγμάτων (particles) στο χώρο κατάστασης του συστήματος Ανάθεση βαρών (w i ) στα δείγματα με βάση τις παρατηρήσεις (μετρήσεις) που είναι διαθέσιμες για το σύστημα Επαναδειγματοληψία (resampling): δίνεται περισσότερη βαρύτητα στα δείγματα που έχουν μεγαλύτερο βάρος και "ακυρώνονται" τα δείγματα με μικρά βάρη Εξέλιξη δειγμάτων (με βάση το μοντέλο μετάβασης κατάστασης του συστήματος) Επανάληψη των παραπάνω από το δεύτερο βήμα. 0

Particle Filters Εισαγωγή () Particle Filters () Βασικές Σχέσεις Αρχική Κατάσταση: η προγενέστερη εκ των υστέρων (posterior) κατανομή {δείγματα, βάρη} N k P i i N k { x, w } k k- k i= ( x i ) = ( x i x i ) q P k k k k P k i i ( xk Z ) = wk-δ ( xk xk ) Δειγματοληψία Importance Sampling: Μοντέλο μετάβασης κατάστασης Πρόβλεψη: N k i= Νέα Δείγματα k i i ( xk Z ) = wk-δ ( xk xk) i= i i xk x k i i από τα με wk = wk (importance sampling based on the transition prior) Ανανέωση Βαρών Μοντέλο Παρατήρησης Βελτιωμένη Εκτίμηση: P N k k i i ( xk Z ) = wkδ ( xk xk) i= (updated posterior) όπου w i k = i ( = ) j P( = ) w P z x x i k- k k k Nk j wk- zk xk xk j= πιθανοφάνεια μέτρησης

Particle Filters () - Υλοποίηση Μετάβαση Κατάστασης: i i N k { x, w } k k- k i= (,, ) i i i k = k k k x f x n Draw N k samples from P(n k- ) Ανανέωση Παρατήρησης: zk = h( xk, vk, k) ( v k : noise sequence with known P(v k ) ) i i { x, w } N k k kk i= ( n k : noise sequence with known P(n k ) ) i i { x, w } N k k kk i= με w = w i k i k Υπολογισμός «πιθανοφάνειας» (likelihoood) μέτρησης για κάθε δείγμα: i i Λ x = P z x = x ( k) ( k k k) i i { x, w } ( ) P( ) i i i i i kk kk Λ k = kk k k w w x w z x Επαναδειγματοληψία (resampling): N k k kk i= Για την αποφυγή προβλημάτων «εκφυλισμού» των δειγμάτων (δηλαδή καταστάσεων όπου όλα τα βάρη πλην ενός τείνουν στο μηδέν) επιχειρείται «επαναδειγματοληψία» των δειγμάτων σε τακτά διαστήματα ώστε τα δείγματα να παραμένουν σχετικών ισοσταθμισμένα Particle Filters () - Resampling Sequential Importance Resampling (Σειριακή Επαναδειγματοληψία σημαντικότητας) Υπολογισμός κανονικοποιημένων βαρών (normalized importance weights): i i i wk P( zk xk) wk = N i i w P z x i= Υπολογισμός ενεργούς αριθμού δειγμάτων (effective number of particles): N eff = w i ( ) k i ( ) k k k Έλεγχος επαναδειγματοληψίας με βάση τον ενεργό αριθμό δειγμάτων: Εαν N eff <N thr (π.χ. N thr =(N/)) τότε παίρνουμε νέα δείγματα (i=,,n) από το τρέχον σύνολο i i N {, } x w, με πιθανότητα ανάλογη των βαρών k k i= («εξασθένησης» δειγμάτων) (αποφυγή sample impoverishment) i i Παίρνουμε τελικά Ν ισοσταθμισμένα δείγματα xk με βάρη wk = ( / N) i=,..., N i w k

Εφαρμογή Particle Filtering (-). Οπτική Παρακολούθηση Χειρονομιών (visual hand gesture tracking) Πιθανότητα χρώματος ( (, ) (, )) w = λ p x y + λ diff x y w i i k i i i i k Πιθανότητα κίνησης 5 Εφαρμογή Particle Filtering (-). Οπτική Παρακολούθηση Χειρονομιών (συνέχεια) 6

Εφαρμογή Particle Filtering (-). Αυτοεντοπισμός Θέσης Κινούμενου Ρομπότ (localisation) Κάθε δείγμα (particle) αντιστοιχεί σε μια δυνατή κατάσταση (θέση ή διάταξη) του ρομπότ στο χώρο Η εξέλιξη των δειγμάτων γίνεται με βάση την πιθανότητα (σφάλματα) που εισάγει το μοντέλο κίνησης (importance or proposal distribution prediction step) To μοντέλο παρατήρησης (μετρήσεων) χρησιμοποιείται για τον υπολογισμό νέων βαρών για τη στάθμιση των δειγμάτων και την επαναδειγματοληψία (correction step) 7 Εφαρμογή Particle Filtering (-). Αυτοεντοπισμός Θέσης Κινούμενου Ρομπότ (συνέχεια) Μοντέλο Κίνησης 8

Εφαρμογή Particle Filtering (-). Αυτοεντοπισμός Θέσης Κινούμενου Ρομπότ (συνέχεια) Μοντέλο Παρατήρησης (active ranging sensors) 9 Εφαρμογή Particle Filtering (-). Αυτοεντοπισμός Θέσης Κινούμενου Ρομπότ (συνέχεια) 50

Εφαρμογή Particle Filtering (-5). Αυτοεντοπισμός Θέσης Κινούμενου Ρομπότ (συνέχεια) 5 Εφαρμογή Particle Filtering (-6). Αυτοεντοπισμός Θέσης Κινούμενου Ρομπότ (συνέχεια) 5

Εφαρμογή Particle Filtering (-7). Αυτοεντοπισμός Θέσης Κινούμενου Ρομπότ (συνέχεια) 5 Εφαρμογή Particle Filtering (-8). Αυτοεντοπισμός Θέσης Κινούμενου Ρομπότ (συνέχεια) 5

Εφαρμογή Particle Filtering (-9). Αυτοεντοπισμός Θέσης Κινούμενου Ρομπότ (συνέχεια) 55 Εφαρμογή Particle Filtering (-0). Αυτοεντοπισμός Θέσης Κινούμενου Ρομπότ (συνέχεια) 56

Εφαρμογή Particle Filtering (-). Αυτοεντοπισμός Θέσης Κινούμενου Ρομπότ (συνέχεια) 57 Εφαρμογή Particle Filtering (-). Αυτοεντοπισμός Θέσης Κινούμενου Ρομπότ (συνέχεια) 58

Εφαρμογή Particle Filtering (-). Αυτοεντοπισμός Θέσης Κινούμενου Ρομπότ (συνέχεια) 59 Εφαρμογή Particle Filtering (-). Αυτοεντοπισμός Θέσης Κινούμενου Ρομπότ (συνέχεια) 60

Εφαρμογή Particle Filtering (-5). Αυτοεντοπισμός Θέσης Κινούμενου Ρομπότ (συνέχεια) 6 Εφαρμογή Particle Filtering (-6). Αυτοεντοπισμός Θέσης Κινούμενου Ρομπότ (συνέχεια) 6

Εφαρμογή Particle Filtering (-7). Αυτοεντοπισμός Θέσης Κινούμενου Ρομπότ με sonars 6 Εφαρμογή Particle Filtering (-8). Αυτοεντοπισμός Θέσης Κινούμενου Ρομπότ με sonars Αρχική Κατανομή 6

Εφαρμογή Particle Filtering (-9). Αυτοεντοπισμός Θέσης Κινούμενου Ρομπότ με sonars Κατανομή μετά την ενσωμάτωση 0 scans 65 Εφαρμογή Particle Filtering (-0). Αυτοεντοπισμός Θέσης Κινούμενου Ρομπότ με sonars Κατανομή μετά την ενσωμάτωση 65 scans 66

Εφαρμογή Particle Filtering (-). Αυτοεντοπισμός Θέσης Κινούμενου Ρομπότ με sonars Εκτιμούμενη Διαδρομή του ρομπότ 67 Βιβλιογραφία A. Gelb (editor), Applied Optimal Estimation, The MIT Press, 986. D. Bertsekas, Dynamic Programming and Control, Athena Scientific: Mass., USA, 995. F. Lewis, Optimal Estimation, John Wiley, 986. B. Anderson, J. Moore, Optimal Filtering, Prentice Hall, 979. G. Dudek, M. Jenkin, Computational Principles of Mobile Robotics, Cambridge University Press, 000. R. Siegwart, I. R. Nourbakhsh, Introduction to Autonomous Mobile Robots, The MIT Press, Cambridge, MA, 00 Michael Montemerlo, Sebastian Thrun, FastSLAM A Scalable Method for the Simultaneous Localization and Mapping Problem in Robotics, Springer Tracts in Advanced Robotics, 007. Siciliano, Bruno; Khatib, Oussama (Eds.), Springer Handbook of Robotics, Part C: Sensing and Perception, Springer 008. 68

Ε.Μ.Π., ΣΗΜΜΥ, Ακαδημαϊκό Έτος 007-08, 8ο Εξάμηνο Μάθημα: Ρομποτική ΙΙ. Διδάσκων: Κ.Τζαφέστας ΕΝΟΤΗΤΑ : Αυτόνομα Ευφυή Κινούμενα Ρομποτικά Συστήματα Αρχιτεκτονικές Ελέγχου (mobile robot control architectures) Αυτόνομα Ευφυή Κινούμενα Ρομπότ Περιεχόμενα Ενότητας Μηχανισμοί Κίνησης στο χώρο (locomotion) Αισθητήριες Διατάξεις (sensing) Proprioception (internal state ) / Exteroception etc. Σύνθεση αισθητηρίων πληροφοριών (sensor fusion) Αρχιτεκτονικές ελέγχου (mobile robot control architectures) Αυτοεντοπισμός θέσης / Χαρτογράφηση (self-localisation / map-building) Σχεδιασμός Δρόμου - Πλοήγηση (path planning / navigation) perception action motion control sensing reasoning

Αρχιτεκτονικές Ελέγχου Κινούμενων Ρομποτικών Συστημάτων «Οριζόντια» αρχιτεκτονική σε «εν-σειρά» λειτουργικές υπολογιστικές μονάδες (top-down decomposition) Ιεραρχικό μοντέλο (hierarchical) Μοντέλο «μαυροπίνακα» (blackboard model) Συμπεριφορικά / «αντιδραστικά» μοντέλα (behaviour-based, reactive architectures) Subsumption architecture etc. Υβριδικά μοντέλα (hybrid, layered architectures) Κλασσική Ιεραρχική Αρχιτεκτονική Sense Plan Act

Οριζόντια/Ιεραρχική Αρχιτεκτονική Horizontal (top-down) functional decomposition Αντίληψη (Perception) Μοντελοποίηση (Model) Σχεδιασμός Δράσης (Plan) Εκτέλεση εργασίας (Execute) Έλεγχος (Motor Control) Αίσθηση (sensing) Περιβάλλον (environment) Δράση (action) 5 Παράδειγμα Ιεραρχικού Μοντέλου Αισθητήρες (sensors) Controls Όραση Data (vision) Visual Cues Scene Model Συλλογιστική (Reasoning) Βάση Γνώσης Τροχιά Queries Model Σήματα Ελέγχου Πλοήγηση (Pilot) (ALV: Autonomous Land Vehicle) 6

Παράδειγμα Μοντέλου Blackboard GSR: Ground Surveillance Robot, blackboard architecture S.Harmon, IEEE Journal on Robotics and Automation, Vol. RA-, June 987. 7 Reactive Behaviour based Sense Act Δεν υπάρχει «μοντέλο»: Απ ευθείας αλληλεπίδραση με τον κόσμο Πλεονεκτήματα (robustness, modularity, ) / περιορισμοί Βιολογικά συστήματα, κατανεμημένα, συμπεριφορικά... 8

Συμπεριφορική Αρχιτεκτονική Vertical Decomposition 9 «Συμπεριφορικά» Μοντέλα Behavior-based / reactive models () Levels of competence: behaviors (e.g. motion control skills etc.) Complex behaviors emerging from simple ones Build maps (χαρτογράφηση) sensors Explore (στοχοθετημένη εξερεύνηση) Wander (τυχαία περιπλάνηση) Avoid obstacles (περιπλάνηση) Actuators Distributed intelligence models Multiple active goals Multiple different sensors Robustness, and extensibility Παράδειγμα συμπεριφορικού μοντέλου: Subsumption architecture (συμπεριφορικό μοντέλο «υπαγωγής») (R. Brooks, AI Lab, MIT, 987) 0

«Συμπεριφορικά» Μοντέλα Behavior-based / reactive models () Ρομποτικές «συμπεριφορές» (robot behaviors) Βασικά (απλά στην υλοποίηση) «δομικά στοιχεία» ρομποτικής δράσης Άμεση διασύνδεση {αίσθηση} {απόκριση} (stimulus response) Άμεση «αντιδραστική» απόκριση στο περιβάλλον (reactive systems) «Τοπική αίσθηση»: behavior-specific sensing (ego-centric representation) «Kατανεμημένη (τοπική) ευφυία»: no explicit abstract modeling, no global planning, no explicit shared knowledge and global memory Σχεδίαση με βάση ιδέες από βιολογικά μοντέλα συμπεριφοράς «Επεκτασιμότητα» αρχιτεκτονικών ελέγχου (modular control systems) Emergent complex behaviors and skills from the interconnection of simple behavioral patterns «Συμπεριφορικά» Μοντέλα Behavior-based / reactive models () Παράδειγμα: Subsumption architecture (R. Brooks, AI Lab, MIT, 987) arbitration / (αρχιτεκτονική «υπαγωγής») coordination level level level Διαφορετικά επίπεδα ικανότητας / συμπεριφοράς (skill-levels) sensors level 0 actuators Augmented Finite-State Machine (AFSM) AFSM Επικοινωνία/αλληλεπίδραση μεταξύ διαφορετικών μονάδων (modules) από διαφορετικά επίπεδα συμπεριφοράς Inhibitor: αναστολή (ακύρωση) εξόδου Suppressor: καταστολή (υποκατάσταση) εισόδου

«Συμπεριφορικά» Μοντέλα Behavior-based / reactive models () Παράδειγμα Subsumption architecture (συνέχεια) [Brooks, 87] επίπεδο-0 επίπεδο- «Συμπεριφορικά» Μοντέλα Behavior-based / reactive models (5) Παράδειγμα Subsumption architecture (συνέχεια) επίπεδο-0... επίπεδο- επίπεδο-

Υβριδικές Αρχιτεκτονικές Ελέγχου Hybrid (layered) mobile robot control architectures Mission/Task planning layer Strategic Control / Mission-Planner Navigator control layer Sensors Tactical Communication Pilot / Execution control layer Skill/Behavior Skill/Behavior Actuators Example of hybrid (deliberative/behavioral) control architecture for autonomous robot vehicle control 5 Υβριδικές Αρχιτεκτονικές Ελέγχου Hybrid robot control architectures (συνέχεια) Παράδειγμα: Autonomous highway/roadway vehicle control. Execution (or reactive) low-level control layer: Motion-control skills (continuous): e.g. line following, lateral control within a lane, maintenance of headway, speed/cruise control Reactive-safety behaviors: collision avoidance, e-stop etc.. Tactical control layer: Navigator / Path-planner Proactive-safety and roadway-oriented deliberation: e.g. line following, lateral control within a lane, maintenance of headway, speed/cruise control sequences and conditional sets of commands (e.g. overtake a vehicle : change-lane-left accelerate change-lane-right). Strategic or task control layer: High-level mission planning Route planning and global guidance (e.g. choose route to avoid traffic and reach target location) 6

Βιβλιογραφία G. Dudek, M.Jenkin, Computational Principles of Mobile Robotics, Cambridge University Press, 000. R. Arkin, Behavioral-Based Robotics, The MIT Press, 998. 7

Ε.Μ.Π., ΣΗΜΜΥ, Ακαδημαϊκό Έτος 007-08, 8ο Εξάμηνο Μάθημα: Ρομποτική ΙΙ. Διδάσκων: Κ.Τζαφέστας ΕΝΟΤΗΤΑ : Αυτόνομα Ευφυή Κινούμενα Ρομποτικά Συστήματα Σχεδιασμός Δρόμου Πλοήγηση (path-planning, navigation) Αυτόνομα Ευφυή Κινούμενα Ρομπότ Περιεχόμενα Ενότητας Μηχανισμοί Κίνησης στο χώρο (locomotion) Αισθητήριες Διατάξεις (sensing) Proprioception (internal state ) / Exteroception etc. Σύνθεση αισθητηρίων πληροφοριών (sensor fusion) Αρχιτεκτονικές ελέγχου (mobile robot control architectures) Αυτοεντοπισμός θέσης / Χαρτογράφηση (self-localisation / map-building) Σχεδιασμός Δρόμου - Πλοήγηση (path planning / navigation) perception action motion control sensing reasoning

Βασικό Σχήμα Αρχιτεκτονικής Ελέγχου Αντίληψη (Perception) Μοντελοποίηση (Model) Σχεδιασμός Δράσης (Plan) Εκτέλεση εργασίας (Execute) Έλεγχος (Motor Control) Αίσθηση (sensing) Περιβάλλον (environment) Δράση (action) Σχεδιασμός Κίνησης / Δρόμου (motion / path planning) Motion / Path Planner Ενδιάμεσοι στόχοι Trajectory Generator Ομαλή τροχιά Controller Σήματα ελέγχου (to joint controllers/drivers) Motors / sensors / hardware