Ενότητα 2: Εισαγωγή στη Θεωρία Βέλτιστου Ελέγχου. Νίκος Καραμπετάκης Τμήμα Μαθηματικών

Σχετικά έγγραφα
Ενότητα 10: Γραμμικό Τετραγωνικό Πρόβλημα. Νίκος Καραμπετάκης Τμήμα Μαθηματικών

Ενότητα 8: Συναρτησιακά καμπύλων οι οποίες υπόκεινται σε δεσμούς. Νίκος Καραμπετάκης Τμήμα Μαθηματικών

Ενότητα 11: Βέλτιστος Έλεγχος με φραγμένη είσοδο - Αρχή ελαχίστου του Pontryagin. Νίκος Καραμπετάκης Τμήμα Μαθηματικών

Μοντέρνα Θεωρία Ελέγχου

Ενότητα 6: Ακρότατα συναρτησιακών διανυσματικών συναρτήσεων. Νίκος Καραμπετάκης Τμήμα Μαθηματικών

Γενικά Μαθηματικά Ι. Ενότητα 12: Κριτήρια Σύγκλισης Σειρών. Λουκάς Βλάχος Τμήμα Φυσικής ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ

Κλασσική Θεωρία Ελέγχου

Μοντέρνα Θεωρία Ελέγχου

Ενότητα 4: Εισαγωγή στο Λογισμό Μεταβολών. Νίκος Καραμπετάκης Τμήμα Μαθηματικών

Μοντέρνα Θεωρία Ελέγχου

Λογισμός 3. Ενότητα 19: Θεώρημα Πεπλεγμένων (γενική μορφή) Μιχ. Γ. Μαριάς Τμήμα Μαθηματικών ΑΝΟΙΚΤΑ ΑΚΑ ΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ

Μοντέρνα Θεωρία Ελέγχου

Βέλτιστος Έλεγχος Συστημάτων

Γενικά Μαθηματικά Ι. Ενότητα 7: Σειρές Taylor, Maclaurin. Λουκάς Βλάχος Τμήμα Φυσικής ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ

Μοντέρνα Θεωρία Ελέγχου

Λογισμός 3. Ενότητα 18: Θεώρημα Πεπλεγμένων (Ειδική περίπτωση) Μιχ. Γ. Μαριάς Τμήμα Μαθηματικών ΑΝΟΙΚΤΑ ΑΚΑ ΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ

Μοντέρνα Θεωρία Ελέγχου

Βέλτιστος Έλεγχος Συστημάτων

Γενικά Μαθηματικά Ι. Ενότητα 5: Παράγωγος Πεπλεγμένης Συνάρτησης, Κατασκευή Διαφορικής Εξίσωσης. Λουκάς Βλάχος Τμήμα Φυσικής

Βέλτιστος Έλεγχος Συστημάτων

Μοντέρνα Θεωρία Ελέγχου

Μοντέρνα Θεωρία Ελέγχου

Μοντέρνα Θεωρία Ελέγχου

Γενικά Μαθηματικά Ι. Ενότητα 1: Συναρτήσεις και Γραφικές Παραστάσεις. Λουκάς Βλάχος Τμήμα Φυσικής ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ

Μοντέρνα Θεωρία Ελέγχου

Μοντέρνα Θεωρία Ελέγχου

Γενικά Μαθηματικά Ι. Ενότητα 9: Κίνηση Σε Πολικές Συντεταγμένες. Λουκάς Βλάχος Τμήμα Φυσικής ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ

Μοντέρνα Θεωρία Ελέγχου

ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ. Γενικά Μαθηματικά Ι. Ενότητα 6: Ακρότατα Συνάρτησης. Λουκάς Βλάχος Τμήμα Φυσικής

Γενικά Μαθηματικά Ι. Ενότητα 15: Ολοκληρώματα Με Ρητές Και Τριγωνομετρικές Συναρτήσεις Λουκάς Βλάχος Τμήμα Φυσικής

Μοντέρνα Θεωρία Ελέγχου

Γραμμική Άλγεβρα και Μαθηματικός Λογισμός για Οικονομικά και Επιχειρησιακά Προβλήματα

Εκκλησιαστικό Δίκαιο. Ενότητα 10η: Ιερά Σύνοδος της Ιεραρχίας και Διαρκής Ιερά Σύνοδος Κυριάκος Κυριαζόπουλος Τμήμα Νομικής Α.Π.Θ.

Βέλτιστος Έλεγχος Συστημάτων

Μοντέρνα Θεωρία Ελέγχου

Γενικά Μαθηματικά Ι. Ενότητα 17: Αριθμητική Ολοκλήρωση, Υπολογισμός Μήκους Καμπύλης Λουκάς Βλάχος Τμήμα Φυσικής ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ

Μοντέρνα Θεωρία Ελέγχου

Ιστορία της μετάφρασης

Ενότητα 7: Συναρτησιακά καμπύλων με ασυνέχεια στις παραγώγους. Νίκος Καραμπετάκης Τμήμα Μαθηματικών

Εφαρμοσμένη Βελτιστοποίηση

Γενικά Μαθηματικά Ι. Ενότητα 14: Ολοκλήρωση Κατά Παράγοντες, Ολοκλήρωση Ρητών Συναρτήσεων Λουκάς Βλάχος Τμήμα Φυσικής

Κλασσική Θεωρία Ελέγχου

Βέλτιστος Έλεγχος Συστημάτων

Μαθηματική Ανάλυση ΙI

Βέλτιστος Έλεγχος Συστημάτων

Θεσμοί Ευρωπαϊκών Λαών Ι 19 ος -20 ος αιώνας

Γενικά Μαθηματικά Ι. Ενότητα 19: Υπολογισμός Εμβαδού και Όγκου Από Περιστροφή (2 ο Μέρος) Λουκάς Βλάχος Τμήμα Φυσικής

Βέλτιστος Έλεγχος Συστημάτων

Εκκλησιαστικό Δίκαιο

ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ. Λογισμός 4. Ενότητα 5: Το Θεώρημα του Fubini. Μιχ. Γ. Μαριάς Τμήμα Μαθηματικών

ΣΥΣΤΗΜΑΤΑ ΗΛΕΚΤΡΙΚΗΣ ΕΝΕΡΓΕΙΑΣ ΙIΙ

ΣΥΣΤΗΜΑΤΑ ΗΛΕΚΤΡΙΚΗΣ ΕΝΕΡΓΕΙΑΣ ΙIΙ

Γενικά Μαθηματικά Ι. Ενότητα 16: Ολοκλήρωση Τριγωνομετρικών Συναρτήσεων, Γενικευμένα Ολοκληρώματα Λουκάς Βλάχος Τμήμα Φυσικής

ΣΥΣΤΗΜΑΤΑ ΗΛΕΚΤΡΙΚΗΣ ΕΝΕΡΓΕΙΑΣ ΙIΙ

Μαθηματική Ανάλυση ΙI

Γραμμική Άλγεβρα και Μαθηματικός Λογισμός για Οικονομικά και Επιχειρησιακά Προβλήματα

Μηχανολογικό Σχέδιο Ι

Θεσμοί Ευρωπαϊκών Λαών Ι 19 ος -20 ος αιώνας

Γραμμική Άλγεβρα και Μαθηματικός Λογισμός για Οικονομικά και Επιχειρησιακά Προβλήματα

Δυναμική και Έλεγχος E-L Ηλεκτρομηχανικών Συστημάτων

Ενότητα 5: Ακρότατα συναρτησιακών μιας συνάρτησης. Νίκος Καραμπετάκης Τμήμα Μαθηματικών

Γραμμική Άλγεβρα και Μαθηματικός Λογισμός για Οικονομικά και Επιχειρησιακά Προβλήματα

ΑΝΟΙΚΤΑ ΑΚΑ ΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ. Λογισμός 3. Ενότητα 13: Τύπος του Taylor. Μιχ. Γ. Μαριάς Τμήμα Μαθηματικών

Μοντέρνα Θεωρία Ελέγχου

Εκκλησιαστικό Δίκαιο

ΑΝΟΙΚΤΑ ΑΚΑ ΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ. Λογισμός 3. Ενότητα 14: Τοπικά ακρότατα. Μιχ. Γ. Μαριάς Τμήμα Μαθηματικών

Βέλτιστος Έλεγχος Συστημάτων

Λογισμός 4 Ενότητα 12

Γενικά Μαθηματικά Ι. Ενότητα 13: Ακτίνα Σύγκλισης, Αριθμητική Ολοκλήρωση, Ολοκλήρωση Κατά Παράγοντες. Λουκάς Βλάχος Τμήμα Φυσικής

Γενική Φυσική Ενότητα: Κινητική

Θεωρία Βέλτιστου Ελέγχου Ασκήσεις

Κλασσική Θεωρία Ελέγχου

Τίτλος Μαθήματος: Μαθηματική Ανάλυση Ενότητα Β. Διαφορικός Λογισμός

Κλασσική Θεωρία Ελέγχου

ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ. Λογισμός 4. Ενότητα 6: Εφαρμογές του Fubini. Μιχ. Γ. Μαριάς Τμήμα Μαθηματικών

Παράκτια Τεχνικά Έργα

Γενικά Μαθηματικά Ι. Ενότητα 2: Τριγωνομετρικές, Εκθετικές και Σύνθετες Συναρτήσεις. Λουκάς Βλάχος Τμήμα Φυσικής ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ

Λογιστική Κόστους Ενότητα 12: Λογισμός Κόστους (2)

ΓΕΝΙΚΗ ΚΑΙ ΑΝΟΡΓΑΝΗ ΧΗΜΕΙΑ

Λογισμός 3. Ενότητα 15: Τοπικά ακρότατα υπό συνθήκες. Μιχ. Γ. Μαριάς Τμήμα Μαθηματικών ΑΝΟΙΚΤΑ ΑΚΑ ΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ

Μοντέρνα Θεωρία Ελέγχου

Τίτλος Μαθήματος: Μαθηματική Ανάλυση Ενότητα Γ. Ολοκληρωτικός Λογισμός

Αξιολόγηση και ανάλυση της μυϊκής δύναμης και ισχύος

Κλασσική Θεωρία Ελέγχου

Κλασική Θεωρία Ελέγχου

ΑΡΙΣΤΟΤΕΛΕΙΟ ΑΝΟΙΚΤΑ ΠΑΝΕΠΙΣΤΗΜΙΟ ΑΚΑΔΗΜΑΪΚΑ ΘΕΣΣΑΛΟΝΙΚΗΣ ΜΑΘΗΜΑΤΑ Γενικά Μαθηματικά Ι Ενότητα 11 : Ακολουθίες και Σειρές Λουκάς Βλάχος Τμήμα Φυσικής

Κλασσική Θεωρία Ελέγχου

Λογισμός 4. Ενότητα 9: Παραδείγματα από άλλες αλλαγές. Μιχ. Γ. Μαριάς Τμήμα Μαθηματικών ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ

Ιστορία της μετάφρασης

Οικονομία των ΜΜΕ. Ενότητα 7: Μορφές αγοράς και συγκέντρωση των ΜΜΕ

Γενικά Μαθηματικά Ι. Ενότητα 8: Εφαρμογές Σειρών Taylor. Λουκάς Βλάχος Τμήμα Φυσικής ΑΝΟΙΚΤΑ ΑΚΑΔΗΜΑΪΚΑ ΜΑΘΗΜΑΤΑ

Υπόγεια Υδραυλική και Υδρολογία

Βέλτιστος Έλεγχος Συστημάτων

Βέλτιστος Έλεγχος Συστημάτων

Εισαγωγή στους Αλγορίθμους

Εισαγωγικές έννοιες θεωρίας Συστημάτων Αυτομάτου Ελέγχου Ενότητα 2 η : ΠΕΡΙΓΡΑΦΗ ΣΥΣΤΗΜΑΤΩΝ ΜΕ ΜΑΘΗΜΑΤΙΚΑ ΜΟΝΤΕΛΑ

Μαθηματική Ανάλυση Ι

Εργαστήριο Χημείας Ενώσεων Συναρμογής

Κλασσική Θεωρία Ελέγχου

Τίτλος Μαθήματος: Μαθηματική Ανάλυση Ενότητα Γ. Ολοκληρωτικός Λογισμός

Transcript:

ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΧΤΑ ΑΚΑΔΗΜΑΙΚΑ ΜΑΘΗΜΑΤΑ Ενότητα 2: Εισαγωγή στη Θεωρία Βέλτιστου Ελέγχου Νίκος Καραμπετάκης

Το παρόν εκπαιδευτικό υλικό υπόκειται σε άδειες χρήσης Creative Commons. Για εκπαιδευτικό υλικό, όπως εικόνες, που υπόκειται σε άλλου τύπου άδειας χρήσης, η άδεια χρήσης αναφέρεται ρητώς. 2

Το παρόν εκπαιδευτικό υλικό έχει αναπτυχθεί στα πλαίσια του εκπαιδευτικού έργου του διδάσκοντα. Το έργο «Ανοικτά Ακαδημαϊκά Μαθήματα στο» έχει χρηματοδοτήσει μόνο την αναδιαμόρφωση του εκπαιδευτικού υλικού. Το έργο υλοποιείται στο πλαίσιο του Επιχειρησιακού Προγράμματος «Εκπαίδευση και Δια Βίου Μάθηση» και συγχρηματοδοτείται από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο) και από εθνικούς πόρους. 3

Βασικές έννοιες μαθηματικών. Βασικές έννοιες συστημάτων. Το γενικό πρόβλημα της Θεωρίας Βέλτιστου Ελέγχου. 4

Η εξοικείωση με μαθηματικά εργαλεία τα οποία είναι χρήσιμα για την μελέτη των ενοτήτων που ακολουθούν όπως: Βελτιστοποίηση συναρτήσεων μιας ή περισσοτέρων μεταβλητών. Ανάλυση συστημάτων στον χώρο των καταστάσεων. Η παρουσίαση προβλημάτων της Θεωρίας Βέλτιστου Ελέγχου. 5

1. Θετικά και αρνητικά ορισμένοι πίνακες. 2. Διαφορικός λογισμός πολλών μεταβλητών. 3. Βελτιστοποίηση συναρτήσεων με ή χωρίς συνθήκες. 6

Ορισμός Έστω P, S δύο πραγματικοί συμμετρικοί πίνακες. Εάν y T Py > 0 y 0 τότε ο P ονομάζεται θετικά ορισμένος (positive definite matrix). Εάν y T Sy 0 y 0 τότε ο S ονομάζεται θετικά ημιορισμένος (positive semidefinite matrix). 7

Παρατηρήσεις (όμοια για αρνητικούς πίνακες) Αν ο S είναι θετικά ορισμένος τότε υπάρχει αντίστροφος. Αν ο P είναι θετικά ορισμένος και ο S είναι θετικά ημιορισμένος τότε ο P + S είναι θετικά ορισμένος (αποδείξτε το). Ο πραγματικός συμμετρικός πίνακας A είναι θετικά ορισμένος (συμμετρικά θετικά ημι-ορισμένος) ακριβώς όταν όλες οι ιδιοτιμές του A είναι θετικές (μη αρνητικές.) 8

Ο πίνακας P P = είναι θετικά ορισμένος αν p 11 p 12 p 13 p 21 p 22 p 23 p 31 p 32 p 33 p p 11 p 11 p 12 p 13 12 p 11 > 0, p 21 p > 0, p 21 p 22 p 23 > 0 22 p 31 p 32 p 33 Τα πρόσημα αλλάζουν αντίστοιχα για θετικά ημιορισμένους πίνακες ή αρνητικά ορισμένους ή ημιορισμένους πίνακες. 9

Η κλίση της συνάρτησης f σε σχέση με το x ορίζεται ως f x f x = df dx = x 1 f x 2 f x m, x = x 1, x 2,, x m T 10

Ιδιότητες της κλίσης των συναρτήσεων x T c x x T Mx = x x T x = x 1c 1 + x 2 c 2 + + x m c m x x T Mx M T x T = Mx c 1 + c 1 x x T + M T x c 1 x c 2 x = c x = = Mx + M T x 11

Ιδιότητες της κλίσης των συναρτήσεων Αν ο Μ είναι συμμετρικός x T Mx = Mx + Mx = 2Mx x 12

Ο πίνακας Hessian (hessian matrix) ή πίνακας καμπυλότητας f xx 2 f x 2 = 2 f x x = = 2 f 2 f 2 f 2 x 1 x 1 x 2 x 1 x m 2 f 2 f 2 f x 2 x 2 1 x 2 x 2 x m 2 f 2 f 2 f x m x 1 x m x 2 2 x m 13

2 x T Mx x 2 = M + MT x x Αν ο Μ είναι συμμετρικός 2 x T Mx x 2 = 2M = M + M T 14

Μεταβολή μίας συνάρτησης εξαρτώμενης από δύο διανύσματα f = f x t, y t df = f dx + f x y Παραγώγιση πεπλεγμένων συναρτήσεων f = f x t, y t, t, y t = y x t, t df dx = f x + yt f x y df dx = f x + yt T f dx x y dt + f T y y t + f t T T dy 15

Ανάπτυγμα Taylor μιας συνάρτησης f x = f x 0 + f T x x x 0 x=x0 + 1 2! x x 0 T 2 f T x 2 x=x 0 x x 0 + O 3 όπου ο όρος Ο(3) δηλώνει όρους τάξης μεγαλύτερης του 3. T Δf x = f x x=x0 dx + 1 2! dxt 2 f T x 2 x=x 0 dx + O 3 16

Στατική Βελτιστοποίηση Η συνάρτηση f(x) παρουσιάζει τοπικό ελάχιστο αν-ν υπάρχει x 0 τέτοιο ώστε και ο πίνακας είναι θετικά ορισμένος. f T x x=x0 = 0 Κ = 2 f x 2 x=x 0 17

Στατική Βελτιστοποίηση Η συνάρτηση f(x) παρουσιάζει τοπικό μέγιστο αν-ν υπάρχει x 0 τέτοιο ώστε και ο πίνακας είναι αρνητικά ορισμένος. f T x x=x0 = 0 Κ = 2 f x 2 x=x 0 18

Αν ο Κ είναι αόριστος (ούτε θετικά αλλά ούτε και αρνητικά ορισμένος τότε το σημείο αυτό αποτελεί ένα στάσιμο σημείο ή σαγματικό σημείο (saddle point)). Αν ο πίνακας Κ είναι θετικά (αρνητικά) ημιορισμένος τότε το σημείο x 0 ονομάζεται ανώμαλο σημείο και απαιτείται η εξέταση διαφορικών όρων ανώτερης τάξης για να καθορισθεί αν το σημείο αυτό αποτελεί τοπικό μέγιστο ή ελάχιστο. Για ολικά ακρότατα εκτός από τα παραπάνω εσωτερικά σημεία θα πρέπει επιπλέον να ψάξουμε ανάμεσα σε a) Συνοριακά σημεία του πεδίου ορισμού της f. b) Σε σημεία όπου οι μερικές παράγωγοι δεν υπάρχουν. 19

Να βρεθούν τα ακρότατα της συνάρτησης f x, y = xy x 2 y 2 2x 2y + 4 f = y 2x 2 = 0 x y x = y = 2 y = x 2y 2 = 0 K = 2 f x 2 2 f y x 2 f x y 2 f y 2 x=y= 2 = 2 1 1 2 < 0 Άρα παρουσιάζει τοπικό μέγιστο f 2, 2 = 8 εφόσον ο πίνακας Κ είναι αρνητικά ορισμένος. 20

Να βρεθούν τα ακρότατα της συνάρτησης f x, y = 2 + 2x + 2y x 2 y 2 στην τριγωνική πλάκα, στο πρώτο τεταρτημόριο που περιορίζεται από τις ευθείες x = 0, y = 0, y = 9 x. 21

Να ελαχιστοποιηθεί η συνάρτηση J x, u : R n R κάτω από τους περιορισμούς f x, u = 0 όπου f: R n R m και u(t) είναι το διάνυσμα ελέγχου και x(t) το διάνυσμα κατάστασης. Ορίζουμε την συνάρτηση L x, u, λ = J x, u + λ Τ f x, u που ονομάζεται Langrangian ενώ η σταθερά λεr m ονομάζεται πολλαπλασιαστής Lagrange. 22

Η συνάρτηση J x, u υπό τον περιορισμό f x, u = 0 παρουσιάζει τοπικό ελάχιστο ανν υπάρχει x 0 τέτοιο ώστε L = f x, u = 0 λ x=x0,u=u 0 L = x x=x0,u=u 0 L = u x=x0,u=u 0 και ο πίνακας K = 2 L x 2 2 L x u 2 L x u 2 L u 2 J x,u x J x,u u x=x 0,u=u 0 + x=x 0,u=u 0 + f x,u x f x,u u T λ = 0 T λ = 0 x=x 0,u=u 0 είναι θετικά ορισμένος. 23

Η συνάρτηση J x, u υπό τον περιορισμό f x, u = 0 παρουσιάζει τοπικό μέγιστο ανν υπάρχει x 0 τέτοιο ώστε L = f x, u = 0 λ x=x0,u=u 0 L = x x=x0,u=u 0 L = u x=x0,u=u 0 και ο πίνακας K = 2 L x 2 2 L x u 2 L x u 2 L u 2 J x,u x J x,u u x=x 0,u=u 0 + x=x 0,u=u 0 + f x,u x f x,u u T λ = 0 T λ = 0 x=x 0,u=u 0 είναι αρνητικά ορισμένος. 24

Να υπολογίσετε το μέγιστο και το ελάχιστο της συνάρτησης J x, y = xy πάνω στην έλλειψη f x, y = x2 4 + y2 9 1 = 0 25

L x, y = J x, y + λf x, y = xy + λ x2 4 + y2 9 1 L λ = x2 4 + y2 9 1 = 0 L x = y + λx 2 = 0 L 2λy = x + y 9 = 0 λ = 3, x = 2, y = 3 2 λ = 3, x = 2, y = 3 2 λ = 3, x = 2, y = 3 2 λ = 3, x = 2, y = 3 2 26

= Κ 1 = λ 2 1 1 2λ 9 2 L x 2 2 L y x 2 L x y 2 L y 2 λ= 3,x= 2 η x= 2, y= 3 2 η y= 3 2 λ= 3,x= 2 η x= 2, y= 3 2 η y= 3 2 = 3 2 1 1 2 3 = 0 27

Κ 2 = = λ 2 2 L x 2 2 L y x 1 1 2λ 9 2 L x y 2 = L y 2 λ=3,x= 2 η x= 2, y= 3 2 η y= 3 2 3 = 2 1 1 2 0 3 λ=3,x= 2 η x= 2, y= 3 2 η y= 3 2 28

4 2-4 -2 2 4-2 -4 29

Να ελαχιστοποιηθεί η τετραγωνική συνάρτηση κόστους J x, u = 1 2 xt Qx + 1 2 ut Ru xεr n, uεr r, fεr n, Q 0, R > 0 όπου ο πίνακας Q (θετικά ημιορισμένος) και ο πίνακας R (θετικά ορισμένος) είναι συμμετρικοί πίνακες. Τα υπόκεινται στον παρακάτω περιορισμό f x, u = x + Bu + c = 0 Εφόσον επιλύσετε την παραπάνω άσκηση, να εφαρμόσετε τα αποτελέσματα για Q = 1 0 0 2, R = 2 1 2 2 1, B =, c = 1 1 1 0 3 30

1. Μαθηματική Περιγραφή Συστήματος. 2. Επίλυση συστημάτων - ελεγξιμότητα - παρατηρησιμότητα. 31

Εξισώσεις κατάστασης x t = a x t, u t, t, y t = c x t, u t, t x t = x 1 t x 2 t x n t (state vector), u t = u 1 t u 2 t u p t (input vector) y t = y 1 t y 2 t y m t (output vector) 32

Εξισώσεις κατάστασης x kt + T = a x kt, u kt, T, y kt = c x kt, u kt, T x kt = x 1 kt x 2 kt x n kt (state vector), u kt = u 1 kt u 2 kt u p kt (input vector) y kt = y 1 kt y 2 kt y m kt (output vector) 33

Χρονικά μεταβαλλόμενα Χρονικά αμετάβλητα x t = A t x t + B t u t, A t R t n n, B(t) R t n m x t = Ax t + Bu t, A R n n, B R n m 34

Χρονικά μεταβαλλόμενα x kt + T = A kt x kt + B kt u kt, A kt R kt n n, B(kT) R kt n m Χρονικά αμετάβλητα x kt + T = Ax kt + Bu kt, A R n n, B R n m 35

x t = Ax t + Bu t AεR n n, BεR n m x t = L 1 si A 1 x 0 + si A 1 BU s = = e At x 0 + 0 t e A t τ Bu τ dτ 36

Ορισμός Ένα σύστημα ονομάζεται ελέγξιμο, αν x t = Ax t + Bu t, y t = Cx t + Du t x 0, t 1 > 0 και u t, tε t 0, t 1 : x t 1 = 0 37

Το σύστημα A, B είναι ελέγξιμο αν και μόνο αν rank R B AB A n 1 B = n, AεR n n, BεR n m Έστω το σύστημα x 1 t x 2 t x 3 t B = 1 2 1 = 1 2 3 2 3 1 3 1 2 A, AB = x 1 t x 2 t x 3 t 1 2 3 2 3 1 3 1 2 1 2 1 + 1 2 1 B = u t 8 9 7, 38

A 2 B = A AB == 1 2 3 2 3 1 3 1 2 8 9 7 = 47 50 47 rank R B AB A n 1 B = rank R 2 9 50 1 8 47 1 7 47 Άρα είναι ελέγξιμο. = 3 39

Ορισμός Ένα σύστημα x t = Ax t + Bu t, y t = Cx t + Du t ονομάζεται παρατηρήσιμο, αν υπάρχει πεπερασμένος χρόνος t 1 t 0 τέτοιος ώστε για κάθε αρχική κατάσταση x 0 : = x t 0 γνώση της εισόδου u t, t 0 t t 1 και της εξόδου y t, t 0 t t 1 επιτρέπουν τον προσδιορισμό της αρχικής κατάστασης x 0. 40

Το (A, C) είναι παρατηρήσιμο αν και μόνο αν C rank CA R CA n 1 Έστω το σύστημα x 1 t x 2 t x 3 t = 1 2 3 2 3 1 3 1 2 A = n, AεRn n, CεRp n x 1 t x 2 t x 3 t y t = 1 0 1 + x 1 t x 2 t x 3 t 1 2 1 B u t 41

C = 1 0 1, 1 2 3 CA = 1 0 1 2 3 1 = 2 1 1, 3 1 2 1 2 3 CA 2 = CA A = 2 1 1 2 3 1 = 3 0 3, C 3 1 1 0 2 1 rank R CA = rank R 2 1 1 = 2 < 3 CA 2 3 0 3 άρα δεν είναι παρατηρήσιμο. 42

Στόχος του Βέλτιστου Ελέγχου Προβλήματα ελαχίστου χρόνου. Προβλήματα ελέγχου τελικής τιμής. Προβλήματα ελάχιστης ενέργειας. Προβλήματα παρακολούθησης. Πρόβλημα ρυθμιστή. 43

Ο στόχος του βέλτιστου ελέγχου είναι να προσδιορίσει τα σήματα εισόδου τα οποία θα εξαναγκάσουν μία διαδικασία να ικανοποιήσει φυσικούς περιορισμούς και ταυτόχρονα να ελαχιστοποιήσει (μεγιστοποιήσει) κάποια κριτήρια απόδοσης. Παράδειγμα. Ελαχιστοποίηση καυσίμων κατά την διάρκεια πτήσης ενός αεροσκάφους. 44

Μαθηματική περιγραφή του συστήματος. Προσδιορισμός φυσικών περιορισμών του συστήματος. Προσδιορισμός των κριτηρίων απόδοσης. 45

d(t)=απόσταση. O e d a(t) = Επιτάχυνση από το πεντάλ του γκαζιού. b(t) = Επιβράδυνση από το πεντάλ του φρένου. d t = a t + b t x 1 t = d t x 1 t = d t x 2 t = x 1 t x 2 t = x 1 t = d t d t = a t + b t x 2 t = a t + b(t) 46

Οι εξισώσεις κατάστασης του συστήματος είναι x 1 (t) x 2 (t) = 0 1 x 1 (t) 0 0 x 2 (t) + 0 0 u 1 (t) 1 1 u 2 (t) όπου O e d x t = x 1(t) x 2 (t) = d(t) d(t), u t = u 1(t) u 2 (t) = a(t) b (t) 47

Ας θεωρήσουμε ότι το παραπάνω αυτοκίνητο ξεκινά από μηδενική ταχύτητα και θέλει να φτάσει και να σταματήσει στο σημείο e. x 1 (t 0 ) x 2 (t 0 ) = d(t 0) d(t 0 ) = 0 0, x 1 (t f ) x 2 (t f ) = d(t f) d(t f ) = e 0 Αν υποθέσουμε ότι το αυτοκίνητο δεν προσπερνά το σημείο e και μετά επιστρέφει σε αυτό τότε έχουμε 0 x 1 t e 0 x 2 t 48

Η επιτάχυνση περιορίζεται από τις επιδόσεις της μηχανής (έστω μέγιστη επιτάχυνση Μ1). Η επιβράδυνση περιορίζεται από τις παραμέτρους των φρένων (έστω μέγιστη επιβράδυνση Μ2) 0 u 1 t M1 M2 u 2 (t) 0 49

Ελάχιστη κατανάλωση καυσίμων Αν ο ρυθμός κατανάλωσης καυσίμων είναι ανάλογος της ταχύτητας και της επιτάχυνσης και έχουμε G λίτρα βενζίνης στο αυτικίνητο, τότε θα πρέπει: t f k 1 u 1 t + k 2 u 2 t dt G t 0 50

Ορισμός Μία είσοδος ονομάζεται επιτρεπτή (admissible control input) αν ικανοποιεί τους φυσικούς περιορισμούς της εισόδου του συστήματος στο χρονικό διάστημα t 0, t f. Ορισμός Ένα διάνυσμα κατάστασης λέγεται επιτρεπτό (admissible state trajectory) αν ικανοποιεί τους φυσικούς περιορισμούς του διανύσματος κατάστασης του συστήματος στο χρονικό διάστημα t 0, t f. 51

Μη επιτρεπτή είσοδος Επιτρεπτή είσοδς 52

Για να μετρήσουμε την απόδοση του συστήματος ποσοτικά ο σχεδιαστής επιλέγει ένα ποσοτικό κριτήριο. Ως βέλτιστο έλεγχο εννοούμε την είσοδο που ελαχιστοποιεί (ή μεγιστοποιεί) το κριτήριο αυτό. O e d Αν θέλουμε το παραπάνω αυτοκίνητο να φτάσει στο συντομότερο δυνατό χρόνο τότε η ποσότητα που θέλουμε να ελαχιστοποιήσουμε είναι η παρακάτω J = t f t 0 53

Να βρεθεί η επιτρεπτή είσοδος που μεταφέρει το σύστημα μας από μία αρχική κατάσταση σε μία τελική κατάσταση στον ελάχιστο δυνατό χρόνο. Κριτήριο απόδοσης t f J = t f t 0 = dt t 0 54

Να βρεθεί η επιτρεπτή είσοδος η οποία ελαχιστοποιεί την απόκλιση της τελικής τιμής του διανύσματος κατάστασης από μία επιθυμητή τιμή. Κριτήριο απόδοσης J = ή πιο γενικά n i=1 x i t f r i t f 2 = x tf r(t f ) 2 J = x t f r t f H[x t f r(t f )] όπου H συμμετρικός θετικά ημιορισμένος πίνακας. Παράδειγμα Πορεία πυραύλου για να πετύχει το στόχο. 55

Να βρεθεί η επιτρεπτή είσοδος η οποία μεταφέρει το σύστημα μας από μία αρχική κατάσταση σε μία τελική κατάσταση καταβάλλοντας την ελάχιστη δυνατή είσοδο. Κριτήριο απόδοσης n Ελάχιστα καύσιμα J = i=1 b i u i t, b i > 0. Ελάχιστη ενέργεια J = t0 t f u T t Ru t dt = t0 t f u(t) R 2 dt. όπου R συμμετρικός θετικά ορισμένος πίνακας. Παράδειγμα Ελάχιστα καύσιμα για την κίνηση ενός αεροπλάνου, αυτοκινήτου κ.λ.π. 56

Να βρεθεί η επιτρεπτή είσοδος η οποία προσπαθεί να διατηρήσει το διάνυσμα κατάστασης σε μία επιθυμητή τροχιά. Κριτήριο απόδοσης J = t 0 t f x t r t T Q x t r t dt = = t 0 t f x t r t Q 2 dt όπου Q συμμετρικός θετικά ορισμένος πίνακας. Παράδειγμα Πύραυλος που ακολουθεί τον στόχο. 57

Να βρεθεί η επιτρεπτή είσοδος η οποία προσπαθεί να διατηρήσει το διάνυσμα κατάστασης σε μια επιθυμητή τροχιά καταβάλλοντας την ελάχιστη δυνατή ενέργεια. Κριτήριο απόδοσης J = t 0 t f x t r t Q 2 + u t R 2 dt όπου Q, R συμμετρικά θετικά ορισμένοι πίνακες. Παράδειγμα. Πύραυλος που ακολουθεί τον στόχο ξοδεύοντας τα λιγότερα καύσιμα. 58

Αν επιπλέον θέλουμε και η τελική τιμή του διανύσματος κατάστασης να είναι όσο το δυνατό πιο κοντά σε μια επιθυμητή τιμή, τότε το κριτήριο γίνεται Κριτήριο απόδοσης t f x t + r(t) 2 Q + u(t) 2 R dt 2 J = x t f r t f ) H + t0 όπου Q, R συμμετρικά θετικά ορισμένοι πίνακες και H συμμετρικά θετικά ημιορισμένος πίνακας. 59

Πρόκειται για ειδική περίπτωση του προβλήματος ανίχνευσης στο οποίο το επιθυμητό διάνυσμα κατάστασης είναι το μηδενικό. Κριτήριο απόδοσης t f x t Q 2 dt J = x t f ) H 2 + t0 όπου Q συμμετρικά θετικά ορισμένος πίνακας και H συμμετρικά θετικά ημιορισμένος πίνακας. 60

Να υπολογιστεί μια επιθυμητή είσοδος u t η οποία θα οδηγήσει το σύστημα: x t = a x t, u t, t σε μία επιθυμητή τροχιά x t η οποία θα ελαχιστοποιήσει τον παρακάτω δείκτη απόδοσης t ff J = h x t f, t f + x t, u t, t dt Η είσοδος u t ονομάζεται βέλτιστος έλεγχος (optimal control) και το διάνυσμα κατάστασης x t ονομάζεται βέλτιστη τροχιά (optimal trajectory). t 0 61

Υπάρχει λύση? Είναι μοναδική? Η u t είναι βέλτιστη αν J = h x t f, t f + t 0 t ff x t, u t, t dt h x t f, t f + t 0 t ff x t, u t, t dt u t U, x t X. Μιλάμε λοιπόν για ολικό και όχι τοπικό ελάχιστο. 62

O e d Η επίλυση στο πρόβλημα που παρουσιάσαμε στην αρχή με τις προυποθέσεις για τις εισόδους (με την προυπόθεση ότι η μέγιστη επιτάχυνση είναι Μ αλλά και η μέγιστη επιβράδυνση είναι -Μ) και το διάνυσμα κατάστασης οδηγεί στην παρακάτω λύση: 63

a*(t) O e d b*(t) M t 0 (1/2)(t 0 +t f ) t f t 0 (1/2)(t 0 +t f ) t f -M x 1 *(t) e x 2 *(t) t 0 (1/2)(t 0 +t f ) t f t 0 (1/2)(t 0 +t f ) t f 64

x 1 (t) x 2 (t) = 0 1 0 0 x 1 (t) x 2 (t) + 0 0 1 1 u 1 (t) u 2 (t) x 1 (s) x 2 (s) = s 1 0 s x 1 (s) x 2 (s) = 1 x 1 (0) x 2 (0) + s 1 0 s 1 u 1 s + u 2 s s 2 1 s u 1 s + u 2 s e x 1 (s) x 2 (s) = s e x 1(t) x 2 (t) = 1 0 0 1 1 u 1 t +u 2 (t)=eδ 1 t e eδ t u 1 (s) u 2 (s) 65

Νικόλαος Καραμπετάκης, 2009, Βέλτιστος Έλεγχος Συστημάτων, Εκδόσεις Ζήτη. 66

Copyright, Νικόλαος Καραμπετάκης. «. Ενότητα 2: Εισαγωγή στη». Έκδοση: 1.0. Θεσσαλονίκη 2014. Διαθέσιμο από τη δικτυακή διεύθυνση: http://eclass.auth.gr/courses/ocrs288/

Το παρόν υλικό διατίθεται με τους όρους της άδειας χρήσης Creative Commons Αναφορά - Παρόμοια Διανομή [1] ή μεταγενέστερη, Διεθνής Έκδοση. Εξαιρούνται τα αυτοτελή έργα τρίτων π.χ. φωτογραφίες, διαγράμματα κ.λ.π., τα οποία εμπεριέχονται σε αυτό και τα οποία αναφέρονται μαζί με τους όρους χρήσης τους στο «Σημείωμα Χρήσης Έργων Τρίτων». Ο δικαιούχος μπορεί να παρέχει στον αδειοδόχο ξεχωριστή άδεια να χρησιμοποιεί το έργο για εμπορική χρήση, εφόσον αυτό του ζητηθεί. [1] http://creativecommons.org/licenses/by-sa/4.0/

Οποιαδήποτε αναπαραγωγή ή διασκευή του υλικού θα πρέπει να συμπεριλαμβάνει: το Σημείωμα Αναφοράς το Σημείωμα Αδειοδότησης τη δήλωση Διατήρησης Σημειωμάτων το Σημείωμα Χρήσης Έργων Τρίτων (εφόσον υπάρχει) μαζί με τους συνοδευόμενους υπερσυνδέσμους.

ΑΡΙΣΤΟΤΕΛΕΙΟ ΠΑΝΕΠΙΣΤΗΜΙΟ ΘΕΣΣΑΛΟΝΙΚΗΣ ΑΝΟΙΧΤΑ ΑΚΑΔΗΜΑΙΚΑ ΜΑΘΗΜΑΤΑ Επεξεργασία: Αναστασία Γ. Γρηγοριάδου Θεσσαλονίκη, Εαρινό εξάμηνο 2013-2014