Ενότητα 11: Βέλτιστος Έλεγχος με φραγμένη είσοδο - Αρχή ελαχίστου του Pontryagin. Νίκος Καραμπετάκης Τμήμα Μαθηματικών

ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΧΤΑ ΑΚΑΔΗΜΑΙΚΑ ΜΑΘΗΜΑΤΑ Ενότητα 11: Βέλτιστος Έλεγχος με φραγμένη είσοδο - Αρχή ελαχίστου του Pontryagin Νίκος Καραμπετάκης

Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για εκπαιδευτικό υλικό, όπως εικόνες, που υπόκειται σε άλλου τύπου άδειας χρήσης, η άδεια χρήσης αναφέρεται ρητώς. 2

Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα. Το έργο «Ανοικτά Ακαδημαϊκά Μαθήματα στο» έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού. Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος «Εκπαίδευση και Δια Βίου Μάθηση» και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους. 3

Αρχή ελαχίστου του Pontryagin. Πρόβλημα ελαχίστου χρόνου (time optimal control problem). Πρόβλημα ελαχίστων καυσίμων (fuel optimal control problem). Πρόβλημα ελάχιστης ενέργειας (energy optimal control problem). 4

Επίλυση του προβλήματος Bolza με την παραδοχή ότι η είσοδος είναι φραγμένη. Αντικατάσταση της συνθήκης στατικότητας με την αρχή ελαχίστου του Pontryagin για την επίλυση του παραπάνω προβλήματος. Εφαρμογή του παραπάνω προβλήματος στα παρακάτω ειδικά προβλήματα : Πρόβλημα ελαχίστου χρόνου (time optimal control problem) Πρόβλημα ελαχίστων καυσίμων (fuel optimal control problem) Πρόβλημα ελάχιστης ενέργειας (energy optimal control problem) 5

Άσκηση: Να υπολογιστεί το ακρότατο του συναρτησιακού J x, u, t = 1 2 xt t f Hx t f + 1 t f x 2 T u T Q S x t0 S T R u dt υπό τις συνθήκες x t = Ax t + Bu(t) Απάντηση: Ορίζουμε την H x, u, p, t = 1 2 xt u T Q S x S T R u + pt t Ax t + Bu(t) = 1 2 xt Qx + 1 2 ut S T x + 1 2 xt Su + 1 2 ut Ru + p T Ax + p T Bu (1) x t = Ax t + Bu(t), x = H p 6

(2) p t = H x = Qx + 1 2 Su + 1 2 Su T + A T p p t = Qx 1 2 Su + Su T A T p p t = Qx Su A T p (3) H u = 0 1 2 ST x + 1 2 xt S + Ru + B T p = 0 1 2 ST x T + S T x + Ru + B T p = 0 S T x + Ru + B T p = 0 u = R 1 S T x R 1 B T p 7

x t = Ax t + B R 1 S T x(t) R 1 B T p t x t = A BR 1 S T x t BR 1 B T p(t) p t = Qx t S R 1 S T x t R 1 B T p t A T p t p t = Q + SR 1 S T x t + SR 1 B T A T p t x t p t = A BR 1 S T BR 1 B T x t Q + SR 1 S T SR 1 B T A T p t 8

p t = p t = K t x t K t x t + K(t) x(t) Q + SR 1 S T x t + SR 1 B T A T p t = K t x t + K(t) A BR 1 S T x t BR 1 B T p(t) Q + SR 1 S T x t + SR 1 B T A T K t x t = p t = Kx t = K t x t + K(t) A BR 1 S T x t K t BR 1 B T K t x t 9

= Q + SR 1 S T Q K t + K t Διαφορική εξίσωση Riccati J x, u, t = 1 2 t0 + SR 1 B T A T A T A BR 1 S T A K t K t B R 1 B R x T u T Q S S T R x u dt Stabilizable+detectable K t = K (άρα K t = 0) Αλγεβρική εξίσωση Riccati K(t) 10

Παράδειγμα: Να ελαχιστοποιήσετε την H = u 2 6u + 7 αν u 2 2 u 2. Λύση: Αν δεν υπήρχαν περιορισμοί H = 0 2u 6 = 0 u = 3 u Όμως u = 3 είναι μη επιτρεπτή λύση, επομένως θέλω H u H u, u 2 Παρατηρώ ότι για u = 2 έχω ελάχιστο H = 2 2 6 2 + 7 = 1 11

Πρόβλημα (μη φραγμένη είσοδο) x t = f x t, u t, t t fv J = h x t f, t f + x t, u t, t dt 1. Δημιουργία της Χαμιλτονιανής (συν.pontryagin ): H x, u, p, t = v x, u, t + p T (t) f(x, u, t) 2. H u = 0, H x =, p H p =. x 3. Συνοριακές Συνθήκες: t 0 h p δx x f + H + h δt t f t f = 0 tf 12

Συνήθως όμως έχουμε περιορισμούς στο εύρος τιμών: a) Της εισόδου u(t). b) Του διανύσματος κατάστασης x(t). c) Της εξόδου y(t). Στον υπολογισμό του σχετικού ακρότατου της J πήραμε μια μικρή αυθαίρετη μεταβολή δx (δu στα γραμ. συστήματα). Αυτό όμως δεν είναι εφικτό πάντα όταν η u(t) υπόκειται σε περιορισμούς. J u, δu = J u J u 0 (ελαχιστο) = δj u, δu + όροι υψηλότερης ταξης J u δu 13

Αν η u δεν είχε περιορισμούς, τότε είχαμε δείξει ότι αναγκαία συνθήκη για ακρότατο είναι δj u, δu = 0 Αν όμως η u υπόκειται σε περιορισμούς τότε η αναγκαία συνθήκη για να έχουμε ελάχιστο είναι δj u, δu 0 14

δj u, δu t f H = x + t 0 T + h x p t f p T δx + H u δx f + H + h t tf δt f T δu + H p + x T δp dt Τα βέλτιστα x (t) ικανοποιούν τη διαφορική εξίσωση του συστήματος και συνεπώς x = H (μηδεν. ο συντελ. του δp) p Ζητώ να ικανοποιούνται οι οριακές συνθήκες Τ h x p δx f + H + h t δt f = 0 15

και καταλήγω σε αλλά δj u, δu = T t 0 t f H u T δu dt H u x, u, p, t δu = = H x, u + δu, p, t H(x, u, p, t) (Επειδή στο σχήμα υποθέσαμε δu μη επιτρεπτή. Διαφορετικά θα έπαιρνα H x, u δu, p, t H(x, u, p, t) αν +δu ήταν μη επιτρεπτή). 16

ΆΡΑ για να έχω ελάχιστο θα πρέπει t f δj u, δu = H x, u + δu, p, t H(x, u, p, t) dt 0 t 0 H x, u + δu u Ή διαφορετικά H x, u, p, t =, p, t H(x, u, p, t) min u(t) u H(x, u, p, t). Θα πρέπει δηλαδή η είσοδος u(t) να ελαχιστοποιεί την Hamiltonian (κάτι που ίσχυε με την H περιορισμούς στην u t ). u = 0 όταν δεν είχαμε 17

ΣΥΜΠΕΡΑΣΜΑ (Pontryagin Minimum Principle) Οι συνθήκες παραμένουν ίδιες εκτός από την H = 0 που u αντικαθίσταται από την πιο γενική H x, u, p, t = min u(t) u H(x, u, p, t) Επιπλέον αναγκαίες συνθήκες Αν ο τελικός χρόνος t f είναι γνωστός και επιπλέον η Χαμιλτονιανή H είναι ανεξάρτητη του t, τότε η H θα πρέπει να είναι σταθερή όταν υπολογιστεί για τις βέλτιστες τιμές των x, u, p H x, u, p t = c R t t 0, t f 18

Επιπλέον αναγκαίες συνθήκες Αν ο τελικός χρόνος t f είναι ελεύθερος ή δεν έχει καθοριστεί και επιπλέον η Χαμιλτονιανή Η είναι ανεξάρτητη του t, τότε η H θα πρέπει να είναι μηδέν για τις βέλτιστες τιμές των x, u, p. H x, u, p t = 0 t t 0, t f x t = Ax t + Bu t controllable u u t u + u t u u(t) 1, B B = Bu 19

Πρόβλημα: Να βρεθεί είσοδος u t που ικανοποιεί τις συνοριακές συνθήκες και που οδηγεί το διάνυσμα κατάστασης x t στο μηδέν στον ελάχιστο δυνατό χρόνο. t Δείκτης απόδοσης: J u = f t0 1 dt = t f t 0 v(x,u,t) H x, p, u = 1 + p T t Ax t + Bu t = 1 + p T t Ax t + p T t Bu t x t = H p = Ax t + Bu t 20

p t = H x = AT p t x t 0 = x t 0 x t f = 0 Αρχή ελάχιστου του Pontryagin: H x, u, p H x, u, p 1 + p T Ax + p T Bu 1 + p T Ax + p T Bu 21

p T B q (t) T u p T B q t T u, u t 1 q (t) T u t q t T u t q t θετικό u t πρέπει να είναι ελάχιστη άρα u t = 1. q t αρνητικό u t πρέπει να είναι μέγιστη άρα u t = 1. u t = +1 q t < 0 1 q t > 0 οποιαδηποτε q t = 0 u t = Sgn q t u J t = Sgn q J t = Sgn b J T p t 22

Συνθήκη για να έχω ένα normal (κανονικό) TOCP (controllable) p t = A T p t p t = e ATt p 0 u J t = Sgn b J T e ATt p 0 Αν ήταν ιδιόμορφο T 1, T 2 : q J t = 0 t T 1, T 2 q J t = b J T e ATt p 0 = 0 q J t = b J T A T e ATt p 0 = 0 q J (n 1) t = bj T A T(n 1) e ATt p 0 = 0 b J Ab J A n 1 b J T e A T t nonsign p (0) 0 = 0 Επομένως B AB A n 1 B singular. 24

Θεώρημα 1: Ικανή και αναγκαία συνθήκη ώστε το TOCP να είναι κανονικό είναι το σύστημα ελέγξιμο (και το αντίστοιχο για μη ελέγξιμο ιδιόμορφο TOCP). Στην περίπτωση που το σύστημα είναι κανονικό τότε ο βέλτιστος έλεγχος είναι μοναδικός. Θεώρημα 2: Εάν το TOCP είναι κανονικό και το σύστημα έχει n πραγματικές ιδιοτιμές (και υπάρχει βέλτιστος έλεγχος), τότε ο βέλτιστος έλεγχος μπορεί να αλλάξει από -1 σε 1 και αντίστροφα n-1 φορές. Θεώρημα 3: (Ύπαρξη βέλτιστου ελέγχου) Εάν όλες οι ιδιοτιμές του Α είναι μη θετικές, τότε υπάρχει βέλτιστος έλεγχος που μεταφέρει το state στο 0. Θεώρημα 4: (Μοναδικότητα) Εάν υπάρχει βέλτιστος έλεγχος τότε είναι μοναδικός. 25

Άσκηση: m y = f t x 1 t = y(t) x 2 t = y(t) u t = f t m x 1 t = x 2 t x 2 t = u t (ελέγξιμο) J u = t 0 t f1dt H x, u, p = 1 + p 1 t x 2 t + p 2 t u(t) H x, u, p H x, u, p u 1 1 + p 1 t x 2 t + p 2 t u t 1 + p 1 t x 2 t + p 2 t u t 26

p 2 t u t p 2 t u t u t = Sgn p 2 (t) p t = H p 1 t = H = 0 x x 1 p 2 t = H = p x 1 t 2 p 1 t = p 1 (0) p 2 t = p 2 0 p 1 0 t 27

Βέλτιστοι έλεγχοι {+1} {-1} {+1,-1} {-1,+1} Βέλτιστοι Έλεγχοι +1, 1, +1, 1, 1, +1 28

U = u t = ±1 t = x 2 t x 2 0 U, x t = H p x 1 = x 2 x 2 = u x 1 t = x 1 0 + x 2 0 t + 1 2 Ut2 x 2 t = x 2 0 + Ut x 1 t = x 1 0 1 2 Ux 2 2 0 + 1 2 Ux 2 2 (t) u = +1 t = x 2 t x 2 0 x 1 t = x 1 0 1 2 x 2 2 0 c 1 + 1 2 x 2 2 t u = 1 t = x 2 0 x 2 t x 1 t = x 1 0 + 1 2 x 2 2 0 c 2 1 2 x 2 2 t 29

Παράδειγμα 1 (5) 30

x 1 t f = 0 x 2 t f = 0 x 1 t = x 1 0 1 2 Ux 2 2 0 + 1 x 1 0 1 2 Ux 2 Ux 2 2 0 = 0 2 2 (t) x 1 t = 1 2 Ux 2 2 (t) 31

γ + = x 1, x 2 : x 1 = 1 2 x 2 2, x 2 0 γ = x 1, x 2 : x 1 = 1 2 x 2 2, x 2 0 γ = γ + γ = x 1, x 2 : x 1 = 1 2 x 2 x 2 R = x 1, x 2 : x 1 > 1 2 x 2 x 2 u = 1 R + = x 1, x 2 : x 1 < 1 2 x 2 x 2 u = +1 32

i. x 1, x 2 γ ii. x 1, x 2 γ + iii. x 1, x 2 R + iv. x 1, x 2 R 33

Άσκηση: x 1 t = x 2 t u 1 x 2 t = 6x 1 t x 2 t + u t x 1 0 = x 2 0 = 2 J x, u = TOCP t f1dt H x, u, p = 1 + p 1 t x 2 t + p 2 (t) 6x 1 t x 2 t + u(t) Συνεπώς από την αρχή ελάχιστου του Pontryagin: H x, u, p H x, u, p u: u(t) 1 1 + p 1 x 2 + p 2 6x 1 x 2 + u 1 + p 1 x 2 + p 2 6x 1 x 2 + u p 2 u p 2 u u: u(t) 1 0 34

l = B AB = 0 1 u t = 1 p 2 t > 0 +1 p 2 t < 0 αυθ. p 2 t = 0 0 1 0 = 0 1 6 1 1 1 1, rank Rl = 1 Normal TOCP p t = H p 1 t = H = 6p x x 2 (t) 1 p 2 t = H = p x 1 t + p 2 (t) 2 35

p 1 t p 1 t = 0 6 1 1 A T p 1 (t) p 2 (t) Ιδιοτιμές του A T : det si + A T = s 6 1 s 1 = s2 s 6 Οπότε η λύση: Πιο συγκεκριμένα: p 2 t = Le 2t + Me 3t (Ιδιοτιμές 3,-2) p 2 t = 1 2 p 1 0 + 2p 2 (0) e 2t 1 2 p 1 0 3p 2 0 και συνεπώς τέμνει τον x x το πολύ σε ένα σημείο. e 3t 36

Υπολογίζουμε τα ιδιόμορφα σημεία x 1 t = x 2 t = 0 x 1 t = c 1, x 2 t = c 2 u = +1 u = 1 x 2 = 0 6x 1 x 2 + 1 = 0 x 2 = 0 x 1 = 1/6 x 2 = 0 6x 1 x 2 1 = 0 x 2 = 0 x 1 = 1/6 Σχεδιάζω τις τροχιές x 1 x 2 για u = ±1. 39

u=+1 u=-1 40

Άσκηση (εξετάσεις 2003) x 1 t x 2 t = 1 3 1 1 x 1 t x 2 t Ιδιοτιμές {-2,2} ασταθές & ελέγξιμο. + 0 1 u(t) Θέλουμε να μεταφέρουμε το σύστημά μας από οποιαδήποτε αρχική κατάσταση x 0 = x 1 0 x 2 (0) T στην μηδενική κατάσταση στον ελάχιστο δυνατό χρόνο a) όταν η είσοδος δεν είναι φραγμένη. b) όταν u t 1. 42

Fuel Optimal Control Problem (FOCP) (1) x t = Ax t + Bu(t) u(t) 1 ή u J t 1 J u = 0 t f r j=1 u j t Πρόβλημα ελάχιστων καυσίμων: Να βρεθεί είσοδος u t που να οδηγεί το σύστημα (1) από κάθε αρχική συνθήκη x 0 σε οποιαδήποτε δεδομένη τελική συνθήκη x t f (συνήθως x t f = 0 ) και η οποία θα ελαχιστοποιεί το συναρτησιακό J(u). Ορίζουμε την Χαμιλτονιανή: H x, u, p = r j=1 u j t dt + p T t Ax t + p T t Bu t 43

H x, u, p H x, u, p u: u(t) 1 r j=1 u j t + p T t Ax t + p T t Bu t r j=1 u j t + p T t Ax t + p T t Bu t u: u(t) 1 r j=1 u j t + p T t Bu t r j=1 u j t + p T t Bu t r j=1 u j t + u T t B T p t q (t) r j=1 u j t + u T t B T p t q (t) 44

r j=1 u j t + u T t B T p t q (t) r j=1 u j t + u T t B T p t q (t) q t = B T p (t) r j=1 u j t + u j t q j t r j=1 u j t + u j t q j t u j t = u j t u j t 0 u j t u j t 0 45

min u j t + u j t q j t = u j t 1 min u j t 1 min u j t 1 1 + q j t u j (t) u j (t) 0 1 + q j t u j (t) u j (t) 0 Πιθανές τιμές για q j (t) Τιμές για u j (t) Ελάχιστη τιμή u j t + u j t q j t q j t > 1 q j t < 1 q j t = 1 q j t = 1 u j t = 1 u j t = +1 1 u j (t) 0 0 u j (t) 1 1 q j t 1 + q j t 1 < q j t < 1 u j t = 0 0 0 0 46

u j t = 0 q j (t) < 1 Sgn q j t q j (t) > 1 απροσ. q j (t) = 1 Αν τώρα ορίσουμε την συνάρτηση (dead zone function) f 0 = dez f i = 0 f i < 1 Sgn f i f i > 1 u j t = dez q j t = dez b j T p t 47

q j t = 1 t t 0, t 1 q j t = b j T p t = 1 p t = H x = AT p t p t = e ATt p(0) d b T j e ATt dt p 0 = ±1 T bj A T e ATt p 0 = 0 d dt T bj A T 2 e ATt p 0 = 0 d dt T bj A T n e ATt p 0 = 0 49

b j Ab j A n 1 T b j A T p t = 0 t t 0, t 1 Αλλά p t 0 (διαφορετικά q j t = b T j 0 = 0 1) και συνεπώς θα πρέπει b j Ab j A n 1 T b j A T = 0 Συμπέρασμα: a) Αν το σύστημα είναι ελέγξιμο. b) Αν ο Α είναι αντιστρέψιμος. τότε έχω ένα κανονικό (normal) βέλτιστο πρόβλημα καυσίμων. 50

Έστω το σύστημα x 1 t = x 2 t x 2 t = u t, u(t) 1 J u = t 0 x 1 x 2 = 0 1 0 0 A t f u(t) dt x 1 x 2 + 0 1 B l = B AB = 0 1 1 0 Δημιουργούμε την Χαμιλτονιανή: H x, u, p = u(t) + p 1 t x 2 t + p 2 t u (t) u 51

και εφαρμόζουμε την αρχή ελαχίστου του Pontryagin H x, u, p H x, u, p u: u t 1 u (t) + p 1 t x 2 t + p 2 t u (t) u(t) + p 1 t x 2 t + p 2 t u (t) u (t) + p 2 t u t = min u t + p 2 t u (t) u(t) 1 u t = u t, u t 0 u t, u t 0 min u t + p 2 t u (t) = u t 1 min u t 1 1 + p 2 t u (t), u (t) 0 min u t 1 1 + p 2 t u (t), u (t) 0 52

Περιπτώσεις για p 2 t Τιμές για u (t) Ελάχιστη τιμή min u t + p 2 t u t p 2 t > 1 u t = 1 1 p 2 t p 2 t < 1 p 2 t = 1 p 2 t = 1 1 < p 2 t < 1 ή p 2 t < 1 u t = +1 1 u (t) 0 0 u (t) 1 u t = 0 1 + p 2 t 0 0 0 u t = 0, p 2 t < 1 Sgn p 2 t, p 2 t > 1 οποιαδ. σε 1,0 η 0,1, p 2 t = 1 u t = dez p 2 t 53

p t = H x p 1 t = H x 1 = 0 p 2 t = H x 2 = p 1 t p 1 t = p 1 (0) p 2 t = p 1 0 t + p 2 (0) 54

x 1 t = x 2 (t) x 2 t = U R t = x 2 t x 2 0 U x 1 t = x 1 0 1 2 Ux 2 2 (0) + 1 2 Ux 2 2 (t) 56

γ + = x 1, x 2 : x 1 = 1 2 x 2 2, x 2 0 γ = x 1, x 2 : x 1 = 1 2 x 2 2, x 2 0 γ = γ + γ = x 1, x 2 : x 1 = 1 2 x 2 x 2 R = x 1, x 2 : x 1 < 1 2 x 2 x 2 R + = x 1, x 2 : x 1 > 1 2 x 2 x 2 58

Επιπλέον εκτός από U = ±1 έχουμε και U = 0, για την οποία έχουμε: x 1 t = x 2 (t) x 2 t = 0 x 1 t = x 2 0 t + x 1 (0) x 2 t = x 2 (0) t = x 1 t x 1 (0) x 2 (0) 59

Συμπεράσματα: u t = +1, x 1, x 2 γ + 1, x 1, x 2 γ 0, x 1, x 2 R 2 R 4 60

Για τη μετακίνηση από το σημείο A 1 x 10, x 20 στο A 4 x 10, ε 2 σε χρόνο t 1 θα έχουμε από τις εξισώσεις κατάστασης x 2 t = x 2 0 + Ut U= 1,x 2 t 1 = ε 2 ε 2 = x 2 0 t 1 t 1 = x 2 0 + ε 2 και άρα ο δείκτης απόδοσης για αυτή τη διαδρομή θα είναι: J 1 u = 0 t 1 u t dt = 0x2 0 +ε2 1 dt = x2 0 + ε 2 Για τη μετακίνηση από το σημείο A 4 x 10, ε 2 στο B x 10, ε 2 61

δε δαπανούμε είσοδο (χρόνος t 2 ), επειδή η είσοδος που χρησιμοποιούμε είναι u = 0, και άρα J 2 u = 0. Για τη μετακίνηση από το σημείο B x 10, ε στο O 0,0 σε 2 χρόνο t 3 θα έχουμε από τις εξισώσεις κατάστασης x 2 t = x 2 0 + Ut U=+1,x 2 t 3 =0 ε 0 = 2 + t 3 t 3 = ε 2 και άρα ο δείκτης απόδοσης για αυτή την διαδρομή θα είναι: ε t 3 2 ε J 3 u = u t dt = +1 dt = 0 0 2 Ο συνολικός δείκτης απόδοσης θα είναι: J u = J 1 u + J 2 u + J 3 u = x 2 0 + ε 62

u t = +1 x 1 0, x 2 0 γ + 1 x 1 0, x 2 0 γ 0 x 1 0, x 2 0 R 2 R 4 δεν υπαρχει x 1 0, x 2 0 R 1 R 3 Στην περίπτωση που x 1 0, x 2 0 ε-βέλτιστη λύση. R 1 R 3 υπάρχει 63

Έστω x t = Ax t + Bu t u j t 1, j = 1,2,, m Έστω επίσης ότι οι αρχικές συνθήκες είναι x(t 0 ), ενώ το τελικό διάνυσμα κατάστασης είναι x(t f ) (συνήθως x(t f ) = 0). Το πρόβλημα ελάχιστης ενέργειας (energy-optimal control problem) έχει ως στόχο την εύρεση της βέλτιστης εισόδου u η οποία : a) Ικανοποιεί τον περιορισμό που δόθηκε παραπάνω. b) Οδηγεί το σύστημα από την αρχική κατάσταση x t 0 σε οποιαδήποτε επιθυμητή τελική κατάσταση π.χ. x(t f ) = 0 με t f σταθερό ή ελευθερο, και 64

c) Ελαχιστοποιεί το συναρτησιακό: J u = 1 2 t0 t fu T t Ru t dt όπου ο πίνακας R R m m είναι συμμετρικός θετικά ορισμένος. H x t, u t, p t = 1 2 ut t Ru t + p t T Ax t + p t T Bu t Σύμφωνα με την αρχή ελαχίστου του Pontryagin H x t, u t, p t H x t, u t, p t u j (t) 1 65

1 2 u T t Ru t + p t T Ax t + p t T Bu t 1 2 ut t Ru t + p t T Ax t + p t T Bu t 1 2 u T t Ru t + p t T Bu t 1 2 ut t Ru t + p t T Bu t 1 2 u T t Ru t + u t T B T p t 1 2 ut t Ru t + u t T B T p t 1 q t = R 1 B T p t Rq t = B T p (t) 2 u T t Ru t + u t T Rq t 1 2 ut t Ru t + u t T Rq t u j (t) 1 u j (t) 1 66

1 2 q T t Rq t = 1 2 R 1 B T p (t) T R R 1 B T p t = 1 2 p t T BR 1 RR 1 B T p t = 1 2 p t T BR 1 B T p t u t + q t u t + q t Ή ισοδύναμα: T R u t + q t T R u t + q t u j (t) 1 w t T Rw t = min w t T Rw(t) w t T Rw(t) u j (t) 1 w t = u t + q t = u t + R 1 B T p (t) w t = u t + q t = u t + R 1 B T p (t) 67

R = M d 1 0 0 0 d 2 0 0 0 d m D M T w t T Rw t = w t T MDM T w t = M T w(t) T = m i=1 d i v i (t) 2 MM T = I v(t) T D M T w(t) v(t) = 68

v t T v t = M T w t = w t T w t min w t T Rw(t) = u j (t) 1 T M T w t = w t T MM T w t = min u j (t) 1 m i=1 d i v i (t) 2 d i>0 min w t T Rw(t) = u j (t) 1 m i=1 min v i(t) 2 = u i (t) m i=1 min w i(t) 2 u i (t) = m i=1 min u i t + q u i (t) i (t) 2 69

min w t T Rw t = min u i t 1 m i=1 u j (t) 1 min w i(t) 2 = u i (t) m i=1 m d i v i (t) 2 d i > 0 i=1 m = i=1 min u i t + q u i (t) i (t) 2 min v i(t) 2 = u i (t) u i t = q i t q i t 1 +1 q i t < 1 1 q i t > +1 Αν τώρα ορίσουμε την συνάρτηση (saturation function) f 0 = sat f i = f i f i 1 sgn{f i } f i > 1 u i t = sat{q i (t)} 70

f 0-1 +1 +1 f -1 u t = sat q t = sat{r 1 B T p t } 71

Έστω x t = x t + u t u t 1 t t 0, t f Θέλουμε να υπολογίσουμε την είσοδο u t που θα οδηγήσει το σύστημα από την αρχική κατάσταση x 0 στην κατάσταση x t f = 0, ελαχιστοποιώντας τον δείκτη απόδοσης: t f J u = 2 + u 2 t dt 0 H x t, u t, p t = 2 + u 2 t + p(t) x t + u(t) 72

H x t, u t, p t = 2 + u 2 t + p(t) x t + u(t) H x t, u t, p t H x t, u t, p t u(t) 1 2 + u t 2 + p t x t + u (t) 2 + u 2 t + p t x t + u (t) u t 2 + p t u t u 2 t + p t u t u(t) 1 q t = 1 2 p t 73

u t 2 + u t 2q t u 2 t + u t 2q t u(t) 1 +q t 2 u t + q t 2 u t + q t 2 u(t) 1 u t = q t q t 1 +1 q t < 1 1 q t > +1 q t = 1 2 p t 74

u t = 1 2 p t p t 2 +1 p t < 2 1 p t > +2 u t = sat q t = sat{ 1 2 p t } 75

p t = H x p t = p t p t = e t p (0) Η συνάρτηση p (t) δεν μπορεί να πάρει την τιμή 0, γιατί στην περίπτωση αυτή η είσοδος θα γίνει 0 δηλαδή u t = sat 1 2 0 = 0 και η κατάσταση του συστήματος x t = e t x(0) ποτέ δεν θα φτάσει στην αρχή των αξόνων για πεπερασμένο χρόνο t f. Είναι γνωστό από τις αναγκαίες συνθήκες του Θεωρήματος Pontryagin ότι αν ο τελικός χρόνος t f είναι ελεύθερος ή δεν έχει καθοριστεί και επιπλέον 76

η συνάρτηση Ρontryagin H είναι ανεξάρτητη του t, τότε η H θα πρέπει να είναι μηδέν όταν υπολογιστεί για τις βέλτιστες τιμές των x, u, p H x t, u t, p t = 0 t t 0, t f 2 + u t 2 + p t x t + u (t) = 0 x t = 2 + u t 2 + p t u t p t 77

p t = e t p(0) u t = 1 2 p t p t 2 +1 p t < 2 1 p t > +2 * p t (a) (b) +2 0 t c t b t -2 (c) (d) 78

Περίπτωση 1 η : p 0 > 2. Για την περίπτωση αυτή θα έχουμε (από το σχήμα (a)) u t = 1. Περίπτωση 2 η : 0 < p 0 < 2. Για την περίπτωση αυτή θα έχουμε (από το σχήμα (b)) u t = 1 2 p t ή u t = 1 2 p t, 1 το οποίο εξαρτάται από το αν το σύστημα θα οδηγήθεί στο 0 πριν τη χρονική στιγμή t b ή μετά. Περίπτωση 3 η : 2 < p 0 < 0. Για την περίπτωση αυτή θα έχουμε (από το σχήμα (c)) 79

u t = 1 2 p t ή u t = 1 2 p t, +1 το οποίο εξαρτάται από το αν το σύστημα θα οδηγήθεί στο 0 πριν τη χρονική στιγμή t c ή μετά. Περίπτωση 4 η : p 0 < 2. Για την περίπτωση αυτή θα έχουμε (από το σχήμα (d)) u t = +1. 0 = x t f = e t f t x t + e t f t x t = t t t f e t f τ u τ dτ, t 0, t f t f e t f τ u τ dτ 80

e t fe t x t = e t f t t fe τ u τ dτ et f e t x t = t t fe τ u τ dτ Όταν η είσοδος u τ είναι μη αρνητική σε όλο το διάστημα t, t f, τότε το ολοκλήρωμα t t f e τ u τ dτ θα είναι θετικό και εφόσον η συνάρτηση e t είναι θετική στο διάστημα αυτό θα πρέπει η κατάσταση x t να είναι αρνητική ώστε να ισχύει η παραπάνω ισότητα. Αν η είσοδος u τ είναι μη θετική σε όλο το διάστημα t, t f τότε θα πρέπει η κατάσταση x t να είναι θετική. 81

Η κατάσταση x t και η είσοδος u τ θα πρέπει να διατηρούν αντίθετα πρόσημα. p t = e t p 0 u t = 1 2 p t p t 2 +1 p t < 2 1 p t > +2 * p t +2 0 t c t b (a) (b) t -2 (c) (d) 82

1. Κορεσμένη Περιοχή (Saturated region) a) Στην περίπτωση που t = t b p t b = 2, u t b = 1 και συνεπώς x t b = 2 + u t 2 b + p t b u t b p = 2 + 1 2 + 2 1 t b 2 Στη συνέχεια για t t b, t f, p t > 2, u t = 1 και συνεπώς x t = 2 + u t 2 + p t u t p t = 3 p (t) p < 1 (t) 2 = x t b = 2 + 1 2 + p t 1 p t Επειδή όμως η u t είναι αρνητική, θα πρέπει η x t να είναι θετική και άρα 0 < x t < 1 2 = x t b όταν u t = 1. = 1 2 > 0 83

b) Στην περίπτωση που t = t c θα έχουμε p t c = 2, u t c = +1 και συνεπώς x t c = 1 2 < 0 = 2 + u t 2 c + p t c u t c p = 2 + +1 2 + ( 2) +1 t c ( 2) Στη συνέχεια για t t c, t f, p t < 2, u t = +1 και συνεπώς x t = 2 + u t 2 + p t u t p = 2 + +1 2 + p t +1 t p t = 3 + p (t) p > 1 (t) 2 = x t c Επειδή όμως η u t είναι θετική, θα πρέπει η x t να είναι αρνητική και άρα x t c = 1 2 < x t < 0 όταν u t = +1. 84

2. Μη κορεσμένη περιοχή (Unsaturated region) * p t (a) (b) Στη μη κορεσμένη περιοχή έχουμε +2 p t 2 και u t = 1 2 p t 0 t c t b t Η x t, u t, p t = 0 t t 0, t f -2 (d) (c) 2 + u t 2 + p t x t + u (t) = 0 2 2 + 1 2 p t + p t x t + 1 2 p t = 0 1 4 p t 2 p t x t + 2 = 0 p t 2 + 4p t x t 8 = 0 85

4x t ± 4x t 2 + 32 p t = 2 = 2x t ± x t 2 + 2 = u t = 1 2 p t = 1 2 2x t ± 2 x t 2 + 2 = x t x t 2 + 2 x t > 1 2 u t = x t x t 2 + 2 x t < 1 2 u t = x t + x t 2 + 2 86

x t + x t 2 + 2 x t < 1 2 u t = 1 1 2 x t < 0 0 x t = 0 1 0 x t 1 2 x t x t 2 + 2 x t > 1 2 x t + x t 2 + 2 x t < 1 2 u t = x t x t 2 + 2 x t > 1 2 sgn x t x t 1 2, 1 2 87

Νικόλαος Καραμπετάκης, 2009, Βέλτιστος Έλεγχος Συστημάτων, Εκδόσεις Ζήτη. D.E. Kirk, 1970, Optimal Control Theory, Prentice Hall, Englewood Cliffs, NJ. D. S. Naidu, 2002, Optimal Control Systems, CRC Press LLC. 88

Copyright, Νικόλαος Καραμπετάκης. «. Ενότητα 11: Βέλτιστος Έλεγχος με φραγμένη είσοδο-αρχή ελαχίστου του Pontryagin». Έκδοση: 1.0. Θεσσαλονίκη 2014. Διαθέσιμο από τη δικτυακή διεύθυνση: http://eclass.auth.gr/courses/ocrs288/

Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά - Παρόμοια Διανομή [1] ή μεταγενέστερη, Διεθνής Έκδοση. Εξαιρούνται τα αυτοτελή έργα τρίτων π.χ. φωτογραφίες, διαγράμματα κ.λ.π., τα οποία εμπεριέχονται σε αυτό και τα οποία αναφέρονται μαζί με τους όρους χρήσης τους στο «Σημείωμα Χρήσης Έργων Τρίτων». Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση, εφόσον αυτό του ζητηθεί. [1] http://creativecommons.org/licenses/by-sa/4.0/

Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει: το Σημείωμα Αναφοράς το Σημείωμα Αδειοδότησης τη δήλωση Διατήρησης Σημειωμάτων το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει) μαζί με τους συνοδευόμενους υπερσυνδέσμους.

ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΧΤΑ ΑΚΑΔΗΜΑΙΚΑ ΜΑΘΗΜΑΤΑ Επεξεργασία: Αναστασία Γ. Γρηγοριάδου Θεσσαλονίκη, Εαρινό εξάμηνο 2013-2014