Σχολή Ηλεκτρολόγων Μηχ/κών και Μηχ/κών Υπολογιστών, Ε.Μ.Π., Ακαδημαϊκό Έτος , 8ο Εξάμηνο. Ρομποτική II. Ευφυή και Επιδέξια Ρομποτικά Συστήματα

Σχολή Ηλεκτρολόγων Μηχ/κών και Μηχ/κών Υπολογιστών, Ε.Μ.Π., Ακαδημαϊκό Έτος 009-0, 8ο Εξάμηνο Ρομποτική II Ευφυή και Επιδέξια Ρομποτικά Συστήματα Κων/νος Τζαφέστας Τομέας Σημάτων, Ελέγχου & Ρομποτικής Σχολή Ηλεκτρ. Μηχ/κών & Μηχ/κών Υπολ., Ε.Μ.Π. Τηλ.: 0 77-3687, (Κτήριο Ηλεκτρ., Γραφείο.) Eail: ktzaf@cs.ntua.gr Web: http://www.softlab.ntua.gr/~ktzaf/ Ε.Μ.Π., ΣΗΜΜΥ, Ακαδημαϊκό Έτος 009-0, 8ο Εξάμηνο Μάθημα: Ρομποτική ΙΙ. Διδάσκων: Κ.Τζαφέστας Προσαρμοστικός Ρομποτικός Έλεγχος

Εισαγωγή Κατηγορίες Ελέγχου Προσαρμοστικός έλεγχος: περιέχει έναν αλγόριθμο εκτίμησης (αναγνώρισης) των μεταβαλλόμενων άγνωστων παραμέτρων του συστήματος σε πραγματικό χρόνο Μεθοδολογία προσαρμοστικού ελέγχου μοντέλου αναφοράς (ΠΕΜΑ) (Model-Reference Adaptive Control - MRAC) Μεθοδολογία αυτοσυντονιζόμενου ελέγχου (ΑΣΕ) (Self-uning Control) 3 Self-uning Adaptive Control Αρχιτεκτονική συστήματος αυτοσυντονιζόμενου ελέγχου Νόμος Ελέγχου (π.χ. PD, PID κλπ.): κέρδη ελέγχου σχεδιάζονται με βάση τις παραμέτρους του υπό έλεγχο φυσικού συστήματος. Εδώ, τα κέρδη ελέγχου ρυθμίζονται on-line παράλληλα με τον έλεγχο του συστήματος, μέσω κάποιου αλγορίθμου έμμεσης προσαρμογής των κερδών ελέγχου από τις εκτιμούμενες παραμέτρους του συστήματος 4

Model-Reference Adaptive Control Αρχιτεκτονική συστήματος προσαρμοστικού ελέγχου μοντέλου αναφοράς (ΠΕΜΑ MRAC) () επιθυμητή (ιδανική) συμπεριφορά κλειστού βρόχου συστήματος 5 Model-Reference Adaptive Control Αρχιτεκτονική συστήματος ΠΕΜΑ (MRAC) (συνέχεια) Μοντέλο αναφοράς: αντικατοπτρίζει τις προδιαγραφές σχεδίασης του συστήματος (εύρος ζώνης, συντ. απόσβεσης), και ικανοποιεί ενδογενείς περιορισμούς μοντέλου Νόμος Ελέγχου: Παραμετροποιείται με έναν αριθμό προσαρμόσιμων παραμέτρων, ώστε να επιτυγχάνεται -μέσω του μηχανισμού προσαρμογής- ασυμπτωτική σύγκλιση στην επιθυμητή συμπεριφορά Μηχανισμός Προσαρμογής: Υπολογίζει μεταβολές στις τιμές των προσαρμόσιμων παραμέτρων του ελεγκτή, με στόχο την ελαχιστοποίηση κάποιου κριτηρίου του σφάλματος παρακολούθησης, και τελικά την ασυμπτωτική σύγκλιση της συμπεριφοράς του συστήματος στην επιθυμητή-ιδεατή () 6

Model-Reference Adaptive Control. Μέθοδος της «πλέον απότομης κατάβασης» (steepest-descent) Κριτήριο Σφάλματος: I( φ ) = e όπου: φ διάνυσμα παραμέτρων e σφάλμα παρακολούθησης Μηχανισμός Προσαρμογής (ανανέωσης) Παραμέτρων: dφ di ( φ) = γ = γ e e dt dφ φ γ: κέρδος μηχανισμού προσαρμογής (adaptation gain) «βαθμίδα» (κλίση) (gradient) φ I( φ) «ευαισθησία» συστήματος 7 Model-Reference Adaptive Control Παράδειγμα προσαρμοστικού ελέγχου μοντέλου αναφοράς (/) Υπό έλεγχο σύστημα: y = ay+ bu () Επιθυμητό Μοντέλο Αναφοράς: y = ay+ bur () Νόμος Ελέγχου: ut () = k0 ur () t k yt () Εαν k0 = b b και k = ( a a) b (u r :είσοδος συστήματος αναφοράς) φ=[k 0, k ] Διάνυσμα προσαρμόσιμων παραμέτρων ελέγχου επιτυγχάνεται η ιδεατή συμπεριφορά κλειστού βρόχου που περιγράφεται, από την () (αλλά, b και a άγνωστες πραγματικές τιμές παραμέτρων συστήματος) 8

Model-Reference Adaptive Control Παράδειγμα προσαρμοστικού ελέγχου μοντέλου αναφοράς (/) (5) Θέτουμε: e= y y b () y = ur D+ a και (), bk0 b Παίρνουμε άρα: e= ( ) D+ a+ bk D+ a bk0 y= ur D+ a+ bk u r όπου D = d dt Παράγωγοι «ευαισθησίας»: bk e = b u e r = 0 u r = b k0 D+ a+ bk k ( D+ a+ bk) ( D+ a+ bk) y Αλλά: D+ a+ bk = D+ a, bk0 = b και έστω: γb γ 0 ur y Άρα: = γ ( ) e και γ + ( ) dt D a = e dt D + a (Ε-) Μηχανισμός προσαρμογής παραμέτρων ελέγχου 9 Model-Reference Adaptive Control. Μέθοδος σχεδίασης με θεωρία ευστάθειας κατά Lyapunov Παράδειγμα προσαρμοστικού ελέγχου μοντέλου αναφοράς (/) Έστω και πάλι: Υπό έλεγχο σύστημα: y = ay+ bu () Επιθυμητό Μοντέλο Αναφοράς: y = ay+ bur () Νόμος Ελέγχου: ut () = k0 ur () t k yt () Σφάλμα παρακολούθησης: e= y y (),() Δυναμική εξίσωση σφάλματος: e = y y = ay+ bu ( a y + b u ) (6) (u r :είσοδος συστήματος αναφοράς) r y = y e 0 r r = + 0 r e = ay+ b( k u k y) ( a y + b u ) e ( a a bk) y ( bk b ) u a e (5) Εαν t k0 = b b και k = ( a a) b e = ae et () 0 ιδεατή συμπεριφορά κλειστού βρόχου 0

Model-Reference Adaptive Control. Μέθοδος σχεδίασης με θεωρία ευστάθειας κατά Lyapunov Παράδειγμα προσαρμοστικού ελέγχου μοντέλου αναφοράς (/) Ορίζουμε την εξής συνάρτηση Lyapunov (V=0, όταν e =0,και k 0, k όπως στην ): V(, e k0, k ) = e + ( bk0 b ) + ( bk+ a a) (6) bγ bγ 0 0 ( 0 ) V (, e k, k) = dv e de bk b ( bk a a) dt = dt + γ dt + γ + dt (5) dv [( ) ( ) ] 0 0 ( 0 ) e a a bk y bk b u r a e bk b ( bk a a ) dt = + + γ dt + γ + dt ( 0 )( γ ) ( )( γ ) dv 0 ae bk b ue r bk a a ye dt = + γ dt + + γ + dt Συνεπώς, εαν: 0 = γ ur e = γ ye dv τότε: ae 0 dt dt dt = < Ασυμπτ.... ευσταθές (Ε-) (εφόσον e 0) Μηχανισμός προσαρμογής παραμέτρων ελέγχου (7) Model-Reference Adaptive Control (8) Απλό Παράδειγμα ης τάξης, σχεδίασης προσαρμοστικού ελέγχου μοντέλου αναφοράς με: () μέθοδο κλίσης, και () μέθοδο Lyapunov Μηχανισμός προσαρμογής παραμέτρων ελέγχου: dϕ = γ ψ e dt (Ε-), (Ε-) όπου γ: κέρδος μηχανισμού προσαρμογής (adaptation gain) e: σφάλμα παρακολούθησης μοντέλου, και φ: διάνυσμα προσαρμόσιμων παραμέτρων συστήματος ϕ = [ k k] 0 () ur ψ = D+ a y () u r ψ = y

Εφαρμογή σε Ρομποτικό Βραχίονα Υπενθύμιση Έλεγχος Υπολογιζόμενης Ροπής () Ρομποτικό Δυναμικό Μοντέλο : τ = Dq ( ) q + Cqq (, ) q + gq ( ) Coputed-orque Controller τ = Dq ˆ ( ) u+ Cqq ˆ(, ) q + gq ˆ( ) (έλεγχος υπολογιζόμενης ροπής) (στο χώρο των αρθρώσεων) u= q d + KD q d q + KP qd q e e όπου e: σφάλμα παρακολούθησης τροχιάς (στις αρθρώσεις) ( ) ( ) () (-) (-) Μπορούμε να γράψουμε τη δυναμική εξίσωση () ως γραμμική συνάρτηση για ένα σύνολο παραμέτρων φ, το οποίο περιέχει τις άγνωστες παραμέτρους αδρανείας του ρομπότ: Dq (, ϕ) q + Cqq (,, ϕ) q + gq (, ϕ) = K( qqq,, ) ϕ (Το φ περιέχει τις άγνωστες παραμέτρους: i, I i, i d i για i= n ) Εαν ˆϕ το διάνυσμα των «εκτιμούμενων» δυναμικών παραμέτρων του ρομπότ, τότε (-) τ = Dq ˆ (, ˆ ϕ) u+ Cqq ˆ(,, ˆ ϕ) q + gq ˆ(, ˆ ϕ) = K( qqu,, ) ˆ ϕ 3 Εφαρμογή σε Ρομποτικό Βραχίονα Έστω: ϕ = ϕ ˆ ϕ το σφάλμα εκτίμησης παραμέτρων (paraeter estiation error) H, θέτοντας q = u γράφεται: Du + Cq + g= K( qqu,, ) ϕ (5-) () H (), με το νόμο ελέγχου (-) και αντικαθιστώντας την δίνει: Dq + Cq + g= K( qqu,, ) ˆ ϕ (5-) Από τις σχέσεις (5-) και (5-), παίρνουμε για το σφάλμα εκτίμησης παραμέτρων: ϕ = K ( ϕ ˆ ϕ) = ( ) K( qqu,, ) ( qqu,, ) Dq ( ) u q (6) ξ e = u q = q q + K q q + K q q = e + K e + K e Εαν ορίσουμε: ( ) ( ) ( ) ( ) q d D d P d q D q P q σφάλμα παρακολούθησης μοντέλου αναφοράς ( q = u) Δυναμική του σφάλματος παρακολούθησης μοντέλου αναφοράς (σε σχέση με το σφάλμα εκτίμησης παραμέτρων): K( qqu,, ) ϕ = Dq ( ) ξ (8) (7) 4

Εφαρμογή σε Ρομποτικό Βραχίονα Ας ορίσουμε μια νέα συνάρτηση του σφάλματος παρακολούθησης μοντέλου: s = s( ξ () e ) ( θα ορισθεί επακριβώς σε σχέση με το ξ(e q ) στη συνέχεια...) Ορίζουμε μια συνάρτηση Lyapunov: V( ϕ, s ) = [ ϕ Γ ϕ+ s D s] (9) V=0, όταν ϕ = 0 (δηλαδή: ˆϕ = ϕ ) και s(ξ)=0 ( Γ: μήτρα κερδών μηχανισμού προσαρμογής παραμέτρων ) Έχουμε: V = ˆ ϕ Γ ϕ+ s D s + [ s D (συμμετρική και θετικά ορισμένη) s] Θέτοντας, άρα: ˆ ϕ = Γ K ( qqu,, ) s (0) Μηχανισμός Προσαρμογής παίρνουμε: V = s K( q, q, u) ϕ + s D s + [ s D s] Εαν ορίσουμε τη συνάρτηση σφάλματος: s + Λ s = ξ () (8) V = s D( q) ξ + s D ( ξ Λ s) + [ s D s] = s ( D Λ D ) s 0 έχουμε: V = s K( q, q, u) ϕ+ s D ( ξ Λ s) + [ s D s] με «κατάλληλη» σχεδίαση του Λ 5 Εφαρμογή σε Ρομποτικό Βραχίονα Θέτοντας, π.χ.: Λ=diag[λ, λ ], με λ, λ > 0 και τέτοια ώστε: D Λ D > 0 (θετικά ορισμένη) παίρνουμε: V ( ϕ, s) 0 με ( V = 0) ( s 0) ξ = 0 Άρα, το σύστημα με κατάλληλη σχεδίαση του νόμου προσαρμογής παραμέτρων (σχέση (0) μαζί με τις () και (7) ), είναι ασυμπτωτικά ευσταθές (dv/dt<0) και συγκλίνει ασυμπτωτικά στην κατάσταση ισορροπίας (dv/dt=0) όπου s=0 (ήτοι ξ=0), δηλαδή, όπου το σφάλμα παρακολούθησης μοντέλου αναφοράς γίνεται μηδέν: ξ ( e ) = e + K e + K e = 0 ( δηλ. q = u) q q D q P q t και τότε: e 0 q Νόμος προσαρμογής: (adaptation law) ˆ ϕ( t + ) = ˆ ϕ( t ) + Γ K ( q, q, u) s( t ) k k k integral paraeter adaptation law όπου: s ( t ) = e + K e+ Integral( t ) και k D k δεδομένου ότι από τις (), (7): Integral( t + ) = Integral( t ) + ( K e Λ s( t )) Δt t t s() t = s(0) Λ s() t dt+ e + K e+ K edt k k P k D 0 0 Γ: κέρδη προσαρμογής, π.χ. Γ=diag[γ i ] ταχύτητα σύγκλισης του μηχανισμού προσαρμογής P 6

Προσαρμοστικός Έλεγχος Ρομπότ τ = Dq ( ) q + Cqq (, ) q + gq ( ) = Y( qqq,, ) ϕ () (/) τ = Dq ˆ ( ) q + Cqq ˆ(, ) q + gq ˆ( ) + Kσ = Y( qqq,,, q ) ˆ ϕ+ Kσ r r σ r r q r = q d +Λ ( qd q) = q d +Λ q q r = q d +Λ ( q d q ) = q d +Λ q σ = q r q = q +Λq σ = q r q = q +Λq σ () () & () Dq ( ) σ + Cqq (, ) σ + Kσ = Dq ( ) q + Cqq (, ) q gq ( ) = Y( qqq,,, q ) ϕ όπου: D= Dˆ D σ r r r r... φ = ˆ φ φ 7 Προσαρμοστικός Έλεγχος Ρομπότ (/) (,, ) ( ) V σ q φ = σ D q σ + q Λ K q σ + φ Κ φ φ & = Λ Λ + φ Κ φ σ ( Y (,, r, r) ) V q Kσq q Kσ q φ q q q q Θέτοντας: φ ˆ = Kσ Y ( qqq,, r, q r) V = q Kσq q ΛKσΛq σ < 0 προσαρμοστικός νόμος 8