Ενότητα 10: Γραμμικό Τετραγωνικό Πρόβλημα. Νίκος Καραμπετάκης Τμήμα Μαθηματικών

ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΧΤΑ ΑΚΑΔΗΜΑΙΚΑ ΜΑΘΗΜΑΤΑ Ενότητα 10: Γραμμικό Τετραγωνικό Πρόβλημα Νίκος Καραμπετάκης

Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για εκπαιδευτικό υλικό, όπως εικόνες, που υπόκειται σε άλλου τύπου άδειας χρήσης, η άδεια χρήσης αναφέρεται ρητώς. 2

Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα. Το έργο «Ανοικτά Ακαδημαϊκά Μαθήματα στο» έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού. Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος «Εκπαίδευση και Δια Βίου Μάθηση» και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους. 3

Επίλυση Γραμμικού Τετραγωνικού Προβλήματος (Linear Quadratic Regulator Problem (LQR)) με πεπερασμένο/άπειρο χρονικό ορίζοντα. Επίλυση του προβλήματος ανίχνευσης (tracking problem). 4

Επίλυση του γραμμικού τετραγωνικού προβλήματος με πεπερασμένο χρονικό ορίζοντα : με επίλυση του συστήματος στον χώρο των καταστάσεων που προκύπτει από τις Χαμιλτονιανές εξισώσεις (αναγκαίες συνθήκες ακροτάτου) με επίλυση των διαφορικών εξισώσεων πινάκων Riccati. Επίλυση του γραμμικού τετραγωνικού προβλήματος με άπειρο χρονικό ορίζοντα : Με επίλυση του συστήματος στον χώρο των καταστάσεων που προκύπτει από τις Χαμιλτονιανές εξισώσεις (αναγκαίες συνθήκες ακροτάτου). Με επίλυση των αλγεβρικών εξισώσεων πινάκων Riccati. Ικανές και αναγκαίες συνθήκες επίλυσης του προβλήματος. Επίλυση του προβλήματος ανίχνευσης (tracking problem). 5

Θεωρούμε ένα γραμμικό σύστημα διαφορικών εξισώσεων x t = A t x t + B t u(t) και ζητούμε να ελαχιστοποιήσουμε τον δείκτη απόδοσης J = 1 2 xt t f Hx t f + 1 t f x T t Q t x t + u T t R t u(t) dt 2 t0 Απόδειξη: Θεωρώ την Hamiltonian H x, u, p, t = 1 2 xt Qx + 1 2 ut Ru + p T (A t x t + B t u(t)) 6

p t x t = H p = A t x t + B t u t = H x = Q t x t AT t p t 0 = H u = R t u t + BT t p t u t = R 1 (t)b T (t)p (t) και άρα: x (t) p (t) = A(t) B(t)R 1 (t)b T (t) Q(t) A T (t) x (t) p (t) 7

Η λύση των παραπάνω εξισώσεων είναι της μορφής x (t f ) p (t f ) = φ 11(t f, t) φ 12 (t f, t) φ 21 (t f, t) φ 22 (t f, t) x (t) p (t) (A) πινακας μεταβασης h x x, t f p Τ δx f + F x, u, t f + p t T x t f + h t x, t f δt f = 0 Επειδή το x(t f ) είναι ελεύθερο και το t f συγκεκριμένο, θα πρέπει h x x (t f ) p t f = 0 Hx t f p t f = 0 p t f = Hx (t f ) (B) 8

(A)+(B) x t f = φ 11 t f, t x t + φ 12 t f, t p t p t f = Hx t f = φ 21 t f, t x t + φ 22 t f, t p t Hφ 11 t f, t x t + Hφ 12 t f, t p t = φ 21 t f, t x t + φ 22 t f, t p t p t = Hφ 12 t f, t φ 22 t f, t 1 φ21 t f, t Hφ 11 t f, t x t Kalman 1960 αντιστροφος Άρα p t K t x t u t = R 1 t B T t K t x(t) F(t) 9

u t = R 1 t B T t K t x(t) F(t) 10

p t = K t x t p t = K t x t + K t x t p t = K t x t + K t A t x t B t R 1 t B T t K t x t p t = K t + K t A t K t B t R 1 t B T t K t x(t) p t = Q t x t A T t p t p=kx p t = Q t A T t K t x(t) (2) (1) (1)+(2) K t + K t A t K t B t R 1 t B T t K t = Q t A T t K t Διαφορική εξίσωση Riccati 11

K t + K t A t K t B t R 1 t B T t K t = Q t A T t K t Παρατήρηση 1: K t συμμετρικός n(n+1) 2 διαφορικές εξισώσεις. Παρατήρηση 2: Eπειδή p t f = Hx(t f ) K t f x(t f ) τελική συνθήκη K t f = H (θετικά ορισμένος) Η λύση προκύπτει με προς τα πίσω διαφόριση K t f = K t f K(t f Δt) Δt 12

Π = 2 H x 2 2 H u x 2 H x u 2 H u 2 H = 1 2 xt Qx + 1 2 ut Ru + p T Ax + Bu H x = Qx + AT p, 2 H x 2 = Q, 2 H u x = 0, 13

Π = 2 H x 2 2 H 2 H x u 2 H u x u 2 H u = Ru + BT p, 2 H u 2 = R, 2 H x u = 0. Π = Q 0 0 R > 0 0 14

Ποιά είναι η ελάχιστη τιμή του δείκτη απόδοσης? J = 1 2 xt t f Hx t f + 1 2 t0 t f x T t Q t x t + u T t R t u(t) dt = = 1 2 xt t f K t f x t f + 1 2 t0 t f x T t Q t x t + u T t R t u t dt = = 1 2 xt t 0 K t 0 x t 0 + 1 2 t0 t f x T Qx + u T Ru + d dt xt K t x dt = = 1 2 xt t 0 K t 0 x t 0 + 1 2 t0 t f x T Qx + u T Ru + x T Kx + x T Kx + x T K x dt 15

Όμως u = R 1 B T Kx = 1 2 xt t 0 K t 0 x t 0 + 1 2 t0 t f x T Q + KBR 1 RR 1 B T K + A BR 1 B T K T K + K 16

Έστω το σύστημα διαφορικών εξισώσεων x = 1 x + u 2 και J x, u = 1 2 xt Sx + 1 t f 2x 2 + u 2 dt, με t 2 0 f = 1. A = 1, B = 1, H = S, Q = 2, R = 1 2 Άρα ο βέλτιστος έλεγχος u = K t x. K t + K t A t K t B t R 1 t B T t K t = Q t A T t K(t) με οριακή συνθήκη K t K t = K 2 t + K t 2 = s. 17

K t = K 2 t + K t 2 Αν s = 0 εφαρμόζουμε προς τα πίσω διαφόριση: K t K(t δt) K t = δt t = 1.0 K 1 = s = 0 K 0.8 K 1 = K 2 1 + K 1 2 = 2 = K 1 Δt + K 1 = 2 0.2 + 0 = 0.4 t = 0.8 K 0.8 = 0.4 K 0.8 = K 2 0.8 + K 0.8 2 = 1.44 18

K 0.6 = K 0.8 Δt + K 0.8 = 1.44 0.2 + 0.4 = 0.69 t = 0.6 K 0.4 = 0.92 t = 0.4 K 0.2 = 0.97 t = 0.2 K 0 = 1 19

Ο χρόνος J x, u t f x t = A t x t + B t u t = 1 2 t0 x T t Q(t)x t + u T t R t u(t) dt Επίλυση με τον ίδιο τρόπο: u t όπου lim K t = t f K(t) = R 1 (t)b T (t) K(t)x (t) και η K(t) ικανοποιεί την δ.ε. Riccati με τελικές συνθήκες K t = 0 lim t h x x t f, t f p t f δt f lim t f p t f = 0 20

J x, u x t = Ax t + Bu t = 1 x T t Q(t)x t + u T t R t u(t) dt 2 t0 Συνθήκες Ύπαρξης Λύσης Αν το σύστημα είναι ελέγξιμο και H = 0 στην δ.ε. Riccati, τότε lim t f K t f = K > 0 συμμετρικός δηλαδή η λύση της δ.ε. είναι σταθ. Θετ. Συμ. Πίνακας και άρα έχουμε να λύσουμε την αλγεβρική εξίσωση Riccati. 21

Το κλειστό σύστημα είναι ευσταθές αν (A, C T ) παρατηρήσιμο όπου CC T = Q Cholesky Decomposition. Μπορώ να περιορίσω ακόμη πιο πολύ τις συνθήκες ύπαρξης λύσης i. (A, B) stabilizable ii. K t A t K t B t R 1 t B T t K t + Q t + A T t K t =0 Αλγεβρική εξίσωση Riccati (A, C T ) detectable 22

Έχουμε το σύστημα των διαφορικών εξισώσεων x = ax + bu και J x, u = 1 2 0 qx 2 + pu 2 dt Άρα A = a, B = b, Q = q, R = p. Ο βέλτιστος έλεγχος είναι u = R 1 B T Kx = p 1 bkx K t + K t A t K t B t R 1 t B T t K t = Q t A T t K(t) KA KBR 1 B T K = Q A T K 23

Ka Kbp 1 bk + q + a T K = 0 K>0 και άρα K = a + a 2 + q p b2 b 2 p a + u = και το σύστημα δ.ε. γίνεται x = a 2 + q p b2 b a 2 + q p b2 x x 24

Συμπέρασμα: b 0(μη ελέγξιμο) u α > 0 (αρχ. Συστ. ασταθές) κλ. Συστ. Ευσταθ. 25

Έστω x = Ax + Bu y = Cx J x, u = 1 2 0 ελέγξιμο, παρατηρήσιμο y T Qy + u T Ru dt y T = x T C T J x, u = 1 2 0 x T C T QC Q x + u T R u dt R 26

(Α) x t = A t x t + B t u t J= 1 2 x t f r t f T H x tf r t f + 1 2 t 0 t f (x t 27

(B) p = H x = Qx A T p + Qr (Γ) 0 = H = u Ru + B T p u = R 1 B T p Από (Α)+(Β)+(Γ) x p = A BR 1 B T x Q A T p + 0 Qr t f p t f = φ t f, t x = φ 11 t f, t φ 12 t f, t φ 21 t f, t φ 22 t f, t x t (t) f p (t) + φ tf, τ t x (t) p (t) + f 1(t) f 2 (t) 0 Q τ r τ dτ 28

1) x t f = φ 11 t f, t x t + φ 12 t f, t p t + f 1 (t) 2) p t f = φ 21 t f, t x t + φ 22 t f, t p t + f 2 (t) Αλλά από τις συνοριακές συνθήκες: h x x t f, t f p t f δx f p t f = Hx t f Hr t f (1), (2) φ 21 t f, t x t + φ 22 t f, t p t + f 2 t = = Hφ 11 t f, t x t + Hφ 12 t f, t p t + Hf 1 (t) Hr t f 29

p t = φ 22 t f, t Hφ 12 t f, t 1 Hφ11 t f, t φ 212 t f, t x t + φ 22 t f, t Hφ 12 t f, t 1 Hf1 t Hr t f = = F t x t + v(t) 30

Ας υποθέσουμε ότι p t = K t x t + s t p t = K t x t + K t x t + s t Q t x t A T (t) K t x t + s(t) = = K t x t + +K t A t x t B t R 1 t B T t K t x t + s t + s t K t = K t A t A T t K t Q t + K t B(t)R 1 t B T t K(t) s t = A T t K t B t R 1 t B T t s t + Q t r(t) 31

Με συνοριακές συνθήκες h x x t f, t f p t f = 0 p t f = Hx t f Hr t f K t f x t f + s t f x t f, r t f K t f = H s t f = Hr t f 32

Παράδειγμα: (Ν. Κρικέλης 1996) F 1 y 1 y 1 v y F m s s Δύναμη απο από προφυλ. προφυλ. Δύναμη Επιτάχ. Ταχύτ. Θέση m Επιταχ. 1 s v Ταχυτ. 1 s v Θέση Μοντέλο κατάστασης: x 1 = y, x 2 = y Εξισώσεις κατάστασης: x 1 = x 2, x 2 = F = u m 33

Επαφή προφυλακτήρα με τοίχο: (χρόνος 0) y 0 = 0, y 0 = 4 Μετά από 1 sec ο προφυλακτήρας φέρει την ταχύτητα του αυτοκ. στο μηδέν: y 1 = 0 y 1 ελεύθερο a) Προστασία επιβατών Ελαχιστοποίηση y J x, u = 1 1 y 2 dt = 1 1u 2 dt 2 0 2 0 b) x 1 x 2 = 0 1 0 0 x 1 x 2 + 0 1 u, y = 1 0 x 1 x 2 34

J = 1 2 0 y 2 + pu 2 dt = 1 2 0 x 1 2 + pu 2 dt = = 1 2 0 x1 x 2 T 1 0 0 0 Λύση: Η συνάρτηση Pontryagin είναι x 1 x 2 + pu 2 dt H = 1 2 u2 + λ 1 x 2 + λ 2 u Η θ = 0 u + λ 2 = 0 u = λ 2 H = 1 2 λ 2 2 + λ 1 x 2 + λ 2 λ 2 = 1 2 λ 2 2 + λ 1 x 2 35

H = 1 2 λ 2 2 + λ 1 x 2 + λ 2 λ 2 = 1 2 λ 2 2 + λ 1 x 2 x = H λ λ = Η x x 1 = H λ 1 x 2 = H λ 2 λ 1 = H x 1 λ 2 = H x 2 x 1 = x 2 x 2 = λ 2 λ 1 = 0 λ 2 = λ 1 36

λ 1 = c 1 λ 2 = c 1 t + c 2 t 3 x 1 = c 1 6 c t 2 2 2 + c 3t + c 4 t 2 x 2 = c 1 2 c 2t + c 3 t = 0, x 1 0 = 0 c 4 = 0 t = 0, x 2 0 = 4 c 3 = 4 t = 1, λ 1 1 = 0 c 1 = 0 t = 1, x 2 1 = 0 c 2 = 4 λ 2 =4 Άρα u = 4 Συμπέρασμα: Ελαχιστοποίηση επιτάχυνσης σταθερή δύναμη 37

Να υπολογιστεί το ακρότατο του συναρτησιακού J x, u, t = 1 2 xt t f Hx t f + 1 2 t0 t f x T u T Q S S T R x u dt υπό τις συνθήκες x t = Ax t + Bu(t). 38

Νικόλαος Καραμπετάκης, 2009, Βέλτιστος Έλεγχος Συστημάτων, Εκδόσεις Ζήτη. D.E. Kirk, 1970, Optimal Control Theory, Prentice Hall, Englewood Cliffs, NJ. D. S. Naidu, 2002, Optimal Control Systems, CRC Press LLC. 39

Copyright, Νικόλαος Καραμπετάκης. «. Ενότητα 10: Γραμμικό Τετραγωνικό Πρόβλημα». Έκδοση: 1.0. Θεσσαλονίκη 2014. Διαθέσιμο από τη δικτυακή διεύθυνση: http://eclass.auth.gr/courses/ocrs288/

Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά - Παρόμοια Διανομή [1] ή μεταγενέστερη, Διεθνής Έκδοση. Εξαιρούνται τα αυτοτελή έργα τρίτων π.χ. φωτογραφίες, διαγράμματα κ.λ.π., τα οποία εμπεριέχονται σε αυτό και τα οποία αναφέρονται μαζί με τους όρους χρήσης τους στο «Σημείωμα Χρήσης Έργων Τρίτων». Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση, εφόσον αυτό του ζητηθεί. [1] http://creativecommons.org/licenses/by-sa/4.0/

Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει: το Σημείωμα Αναφοράς το Σημείωμα Αδειοδότησης τη δήλωση Διατήρησης Σημειωμάτων το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει) μαζί με τους συνοδευόμενους υπερσυνδέσμους.

ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΧΤΑ ΑΚΑΔΗΜΑΙΚΑ ΜΑΘΗΜΑΤΑ Επεξεργασία: Αναστασία Γ. Γρηγοριάδου Θεσσαλονίκη, Εαρινό εξάμηνο 2013-2014