Έλεγχος «Ελάχιστης Ενέργειας» Σε πολλές εφαρµογές, τόσο της αεροδιαστηµικής όσο και άλλων µορφών της τεχνολογίας µεταφορών κλπ, η βελτιστοποίηση επικεντρώνεται στο ζήτηµα της ενέργειας κατά την επίτευξη δράσεων ενός συστήµατος. Έτσι, θεωρούµε : διάταξη που περιγράφεται από ένα ΓΧΑΣ: = + xt! Axt But λειτουργικές προδιαγραφές που απαιτούν δεδοµένες αρχική & τελική κατάσταση όπως και χρόνο: δείκτη λειτουργικής απόδωσης που αφορά «ενέργεια»: xt = x xt = x 0 0 f f t f 1 2 J = u( t) dt 2 t 0 Αρα ζητείται η σύνθετη διανυσµατική συνάρτηση : zt = x t u t... της οποίας τα 2 τµήµατα ΔΕΝ είναι ανεξάρτητα ΑΛΛΑ αλληλοεξαρτώνται µέσω της ΔΕ του συστήµατος, η οποία λαµβάνεται ως ισοτικός περιορισµός: Kostas J. Kyriakopoulos - Σ.Α.Ε. ΙΙ 65
Για να εφαρµοσθεί η προηγηθείσα ανάλυση, πρέπει να θεωρήσουµε την «αποδεκτή διεύθυνση µεταβολής» κατ αντιστοιχία προς τη συνάρτηση Επειδή συνάγεται ότι: Έλεγχος «Ελάχιστης Ενέργειας»: ( t0) = ( tf ) = ( t0) ( tf ) ξ ξ 0, µ, µ : ελεύθερα t = ( t) ( t) υ ξ µ zt = x t u t ( 0) 0 ( 0), ( 0) ( 0) 0 ( 0) ( 0), = + υ = + µ f = f f, ( f ) + υ ( f ) = f ( f ) + µ ( f ) zt x u t zt t x u t t zt x u t zt t x u t t Εισάγοντας τον πολλαπλασιαστή Lagrange λ( t) = λ1 ( t)! λn ( t) ο επαυξηµένος ΔΛΑ είναι Η Δ.Ε. της Δυναμικής του Συστήματος ως Ισοτικός Περιορισμός Kostas J. Kyriakopoulos - Σ.Α.Ε. ΙΙ 66
Για να εξετάσουµε την κυρτότητά του ΔΛΑ!J z, θεωρούµε την µεταβολή Gateaux υπενθυµίζοντας οτι δ!j ( z;υ ) = J! ( z + ε υ) ε ε=0 Οπότε επειδή Έλεγχος «Ελάχιστης Ενέργειας» : Τ Τ Τ Τ Τ Τ Τ Τ Τ Η µεταβολή Gateaux είναι Θα χρησιμοποιηθούν παρακάτω Οπότε J! ( z):κυρτή Kostas J. Kyriakopoulos - Σ.Α.Ε. ΙΙ 67
Από προηγουµένως Έλεγχος «Ελάχιστης Ενέργειας» : Η ισότητα ισχύει για µ(t) = 0, δηλαδή µόνο γιά την κλάση «αποδεκτών διευθύνσεων µεταβολής» του τύπου Δεν ισχύει δηλαδη για κάθε «αποδεκτή διεύθυνση µεταβολής» Άρα η J! z ΔΕΝ είναι αυστηρά κυρτή???? Έστω zt, υ t = ξ t 0. Για να είναι η υ(t) «αποδεκτή διεύθυνση µεταβολής» πρέπει: ξ. t0 = ξ t f = 0 για να ικανοποιούνται οι αρχικές & τελικές συνθήκες: zt., zt+υ t Ικανοποιούνται οι ισοτικοί περιορισµοί: = 0 ( ) 0 ξ t = e ξ t0 ξ t 0 t t0, t f Kostas J. Kyriakopoulos - Σ.Α.Ε. ΙΙ 68 At t
Έλεγχος «Ελάχιστης Ενέργειας» : Άρα αν η z*(t) ίκανοποιεί δj! z; υ = 0 την γιά όλες τις «αποδεκτές κατευθύνσεις µεταβολής» υ(t), και τον ισοτικό περιορισµό = 0 τότε η z * (t) = [ x * (t) u * (t) ] ελαχιστοποιεί τον ΔΛΑ J(z) επι όλου του συνόλου των «ποδεκτών συνρτήσεων» z(t), αυτών δηλαδή που ικανοποιούν τις οριακές συνθήκες: xt = x xt = x, και 0 0 f f Την ΔΕ του συστήµατος (ισοτικός περιορισµός): = + xt! Axt But 1 2 Εν προκειµένω, δεδοµένου ότι ο ΔΛΑ είναι J( u) =, τότε 2 u t dt u * t (t) είναι η λύση ελάχιστης ενέργειας, και 0 x * (t) είναι η αντίστοιχη (βέλτιστη) πορεία του συστήµατος από το x 0 στο x f. t f Kostas J. Kyriakopoulos - Σ.Α.Ε. ΙΙ 69
Έλεγχος «Ελάχιστης Ενέργειας»: Ευρεση Νόμου Ελέγχου Για την ανεύρεση της µορφής των λύσεων στρεφόµαστε προς τις αναγκαίες συνθήκες, αρχικά στις Εξισώσεις Euler-Lagrange:! f d! f Τ Τ Τ Τ Τ = 0 t t0, t f z dt z " z= z Τ Τ Τ Τ Τ Τ Δομή Βέλτιστης Συνάρτησης Ελέγχου Kostas J. Kyriakopoulos - Σ.Α.Ε. ΙΙ 70
Έλεγχος «Ελάχιστης Ενέργειας» : Ευρεση Νόμου Ελέγχου Θεωρούµε την Δ.Ε. Εξίσωση του συστήµατος και τη λύση της: = + xt! Axt But Αν ληφθεί υπόψη η µορφή της βέλτιστης εισόδου: Αν «θυµηθούµε» την Controllability Grammian η οποία, επειδή το σύστηµα είναι πλήρως ελέγξιµο, είναι αντιστρέψιµη γιά t f > t 0 τότε Αυτό µαζι µε την Συνάρτηση Βέλτιστου Ελέγχου (ανοικτού βρόχου) Kostas J. Kyriakopoulos - Σ.Α.Ε. ΙΙ 71
Έλεγχος «Ελάχιστης Ενέργειας» : Ευρεση Νόμου Ελέγχου Τέλος, θεωρούµε από τις αναγκαίες συνθήκες, τις οριακές συνθήκες (transversality conditions):! f! f υ υ = 0 z" z " z= z, t z= z, t Παρατηρείστε ότι τα, 0 f είναι καθορισµένα και τα ελεύθερα, που οδηγεί στις f xt xt ut, 0 ut ( f ) 0 Αυτές ισχύουν πάντοτε όµως γιατί η ΔΕΝ εξαρτάται από το. u! Παρατηρούµε επίσης ότι η τιµή του βελτιστου ΔΛΑ είναι: u ( t) u( t) = = Kostas J. Kyriakopoulos - Σ.Α.Ε. ΙΙ 72
Έλεγχος «Ελάχιστης Ενέργειας»: Παράδειγμα Αναζητώντας την λύση ελάχιστης ενέργειας, αρχικά θεωρούµε τον πίνακα µεταβατικής απόκρίσης: Η Controllability Grammian είναι Ο έλεγχος ελάχιστης ενέργειας είναι Δηλαδή = ( ) At ( τ ) ( τ) At t0 x t = e x + e Bu d 0 t t 0 τ Kostas J. Kyriakopoulos - Σ.Α.Ε. ΙΙ 73
Έλεγχος «Ελάχιστης Ενέργειας»: Παράδειγμα = 4 6 u t t 2 x2 t = 3t + 4t 3 2 = + x t t t 1 2 Kostas J. Kyriakopoulos - Σ.Α.Ε. ΙΙ 74
Ο Γραμμικός Τετραγωνικός Ρυθμιστής Σε πολλές εφαρµογές επιθυµούµε η βελτιστοποίηση να περιλαµβάνει : Στο Δείκτη Λειτουργικής Απόδωσης (ΔΛΑ) την ενέργεια (όπως και προηγουµένως) και µία µορφή «επιβάρυνσης» µεγάλων καταστάσεων, επιζητώντας την «σταθεροποίηση» του συστήµατος. Μια µορφή επιβάρυνσης της τελική κατάστασης, που δεν απαιτείται να είναι δεδοµένη αλλά απλά επιβαρύνεται το «µέγεθός» της. Έτσι οδηγούµαστε στο γνωστό πρόβληµα του Γραµµικού Τετραγωνικού Ρυθµιστή (Linear Quadratic Regulator LQR) θεωρόντας: Διάταξη που περιγράφεται από ένα ΓΧΑΣ: xt! = Axt+ But Δείκτη Λειτουργικής Απόδωσης: t f 1 1 J( u) = x ( tf ) S x( tf ) + 2 2 x t Q x t + u t R u t dt t0 Q= Q 0, R= R > 0, S = S 0 Λειτουργικές προδιαγραφές που απαιτούν δεδοµένη αρχική κατάσταση: xt = x 0 0 Kostas J. Kyriakopoulos - Σ.Α.Ε. ΙΙ 75
Ο Γραμμικός Τετραγωνικός Ρυθμιστής: Η ανάλυση ξεκινάει µε τη θεώριση µιάς νέας συνάρτησης, της Χαµιλτονιανής (Hamiltonian Function) : (,, ) = (,, ) + λ ( + ) htxu f txu t Ax Bu Υπενθυµίζοντας (από sl. 53) ότι η επαυξηµένη συνάρτηση ολοκλήρωσης είναι!f t, x,u = 0 = f ( t, x,u) + λ G( t, x,u) µε G t, x,u τον ισοτικό περιορισµό, δηλαδή G( t, x,u) = 0 = A x + B u!x Κατα συνέπεια, η επαυξηµένη συνάρτηση ολοκλήρωσης µπορεί να γραφεί ως Ειδικά για την περιπτωση του LQR, δεδοµένου ότι η Χαµιλτονιανή γίνεται: f ( t, x,u) = 1 ( 2 x Qx + u Ru) Kostas J. Kyriakopoulos - Σ.Α.Ε. ΙΙ 76
Δεδοµένου ότι Ο Γραμμικός Τετραγωνικός Ρυθμιστής: και Για να εξετάσουµε την κυρτότητα του ΔΛΑ!J ( z), πρέπει: Να ορίσουµε το σύνθετο διάνυσµα απόφασης zt = x t u t, και να θεωρήσουµε τη µεταβολής Gateaux δj! ( z; υ) του ΔΛΑ, επί του z(t) ως προς την «κατεύθυνση» υ(t) C 1 [t 0, t f ] δηλαδή Οπότε χρειαζόµαστε τα δ! J z;υ = ε! J z + ε υ ε=0 Τ Τ Τ Τ Τ Τ Τ Τ Τ Θα χρησιμοποιηθούν & παρακάτω Kostas J. Kyriakopoulos - Σ.Α.Ε. ΙΙ 77
Ο Γραμμικός Τετραγωνικός Ρυθμιστής: Εποµένως, θεωροντας την «αποδεκτή διεύθυνση µεταβολής» C 1 [t 0, t f ], η µεταβολή Gateaux είναι t ( t) ( t) υ = ξ µ = Οπότε + - = Kostas J. Kyriakopoulos - Σ.Α.Ε. ΙΙ 78
Ο Γραμμικός Τετραγωνικός Ρυθμιστής: Από προηγουµένως Εποµένως: Η J! ( z) είναι (προς το παρόν, απλα) κυρτή, και Ισότητα ισχύει όταν και µόνο όταν t [t 0, t f ] Από τον ορισµό του προβλήµατος... Q= Q 0, R= R > 0, S = S 0 0 µ t 0 t t, t f ξ ( t) Προφανώς δεν µπορούµε να βγάλουµε παρόµοιο συµπέρασµα για το οπότε ισότητα ισχύει για οιαδήποτε «κατεύθυνση» υ( t) = 0 ξ t που ικανοποιεί τις ξ ( t) Q ξ( t) = 0 t t0, t f, ξ ( tf ) S ξ( tf ) = 0. Εποµένως δεν έχει αποδειχθεί (ακόµη) η αυστηρή κυρτότητα της J! z... Kostas J. Kyriakopoulos - Σ.Α.Ε. ΙΙ 79
Ο Γραμμικός Τετραγωνικός Ρυθμιστής: H προηγηθείσα ανάλυση, Εµπεριέχει την «αποδεκτή διεύθυνση µεταβολής» υ t = ξ t µ t για την οποία µόλις αποδείξαµε ότι πρέπει: µ ( t) 0 t t0, t f υ( t) = ξ ( t) 0 κατ αντιστοιχία προς τη συνάρτηση απόφασης zt = x( t) u( t) Επειδή =, + υ = + µ zt 0 x0 u t 0 zt0 t 0 x0 u t0 t 0 Προφανώς ξ ( t 0 ) = 0 Τα zt, zt+ υ t ικανοποιούν την = 0 = Υπενθυµίζεται ότι ( ) 0 ξ t = e ξ t0 ξ t 0 t t0, t f Kostas J. Kyriakopoulos - Σ.Α.Ε. ΙΙ 80 At t
Ο Γραμμικός Τετραγωνικός Ρυθμιστής: Άρα αν η z*(t) ίκανοποιεί την δj! ( z; υ ) = 0 γιά όλες τις «αποδεκτές κατευθύνσεις µεταβολής» υ(t), και τον ισοτικό περιορισµό = 0 τότε η z * (t) = [ x * (t) u * (t) ] ελαχιστοποιεί την J(z) επι όλου του συνόλου των «αποδεκτών συναρτήσεν» z(t), αυτών δηλαδή που ικανοποιούν την οριακή συνθήκη: xt ( 0) = x0 και την ΔΕ του συστήµατος (ισοτικός περιορισµός): xt! = Axt+ But Εν προκειµένω η u * (t) είναι η λύση του LQR, δηλ ελαχιστοποιεί τον ΔΛΑ η x * (t) είναι η αντίστοιχη (βέλτιστη) πορεία του συστήµατος που ξεκινάει από το xt = x 0 0 Kostas J. Kyriakopoulos - Σ.Α.Ε. ΙΙ 81