ΤΙΤΛΟΣ Η ΕΞΙΣΩΣΗ RICCATI ΣΤΗΝ ΘΕΩΡΙΑ ΣΥΣΤΗΜΑΤΩΝ ΚΑΙ ΕΛΕΓΧΟΥ-ΕΠΙΛΥΣΗ ΜΕΣΩ ΤΗΣ ΑΡΙΘΜΗΤΙΚΗΣ ΜΕΘΟΔΟΥ NEWTON ΜΕΤΑΠΤΥΧΙΑΚΗ ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ ΚΙΜΩΝ Α.ΓΑΙΤΑ

Σχετικά έγγραφα
Εφαρμοσμένα Μαθηματικά ΙΙ

8.1 Διαγωνοποίηση πίνακα

Ενότητα 10: Γραμμικό Τετραγωνικό Πρόβλημα. Νίκος Καραμπετάκης Τμήμα Μαθηματικών

Εφαρμοσμένα Μαθηματικά ΙΙ

Αριθμητική Ανάλυση και Εφαρμογές

= 7. Στο σημείο αυτό θα υπενθυμίσουμε κάποιες βασικές ιδιότητες του μετασχηματισμού Laplace, δηλαδή τις

ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ ΣΤΗΝ ΠΛΗΡΟΦΟΡΙΚΗ ΜΑΘΗΜΑΤΙΚΑ Ι (ΘΕ ΠΛΗ 12) ΕΡΓΑΣΙΑ 2 η Ημερομηνία Αποστολής στον Φοιτητή: 28 Νοεμβρίου 2011

Παναγιώτης Ψαρράκος Αν. Καθηγητής

Στοχαστικά Σήματα και Τηλεπικοινωνιές

ΜΟΝΤΕΡΝΑ ΘΕΩΡΙΑ ΕΛΕΓΧΟΥ ΜΑΘΗΜΑΤΙΚΗ ΘΕΩΡΙΑΣ ΣΥΣΤΗΜΑΤΩΝ ΙΙ Τμήμα Μαθηματικών - Τομέας Υπολογιστών & Αριθμητικής Ανάλυσης Εξετάσεις Σεπτεμβρίου 2016

Κεφάλαιο 5 ΔΙΔΙΑΣΤΑΤΑ ΓΡΑΜΜΙΚΑ ΣΥΣΤΗΜΑΤΑ. Ενα αυτόνομο δυναμικό σύστημα δύο διαστάσεων περιγράφεται από τις εξισώσεις

Ιδιάζουσες τιμές πίνακα. y έχουμε αντίστοιχα τις σχέσεις : Αυτές οι παρατηρήσεις συμβάλλουν στην παραγοντοποίηση ενός πίνακα

Παραρτήματα. Παράρτημα 1 ο : Μιγαδικοί Αριθμοί

Παραδείγματα Ιδιοτιμές Ιδιοδιανύσματα

Παναγιώτης Ψαρράκος Αν. Καθηγητής

Ο Γραμμικός Τετραγωνικός Ρυθμιστής: Ευρεση Νόμου Ελέγχου

Έλεγχος «Ελάχιστης Ενέργειας»

Παράδειγμα 1. Δίνεται ο κάτωθι κλειστός βρόχος αρνητικής ανάδρασης με. Σχήμα 1. στο οποίο εφαρμόζουμε αρνητική ανάδραση κέρδους

Βέλτιστος Έλεγχος Συστημάτων

Σήματα και Συστήματα

Ενότητα 11: Βέλτιστος Έλεγχος με φραγμένη είσοδο - Αρχή ελαχίστου του Pontryagin. Νίκος Καραμπετάκης Τμήμα Μαθηματικών

Συστήματα Αυτομάτου Ελέγχου & Ρυθμίσεως Μηχανών (h>p://courseware.mech.ntua.gr/ml23147/)

Τεχνολογικό Εκπαιδευτικό Ίδρυμα Σερρών Τμήμα Πληροφορικής & Επικοινωνιών Σήματα και Συστήματα

Αριθμητική Ανάλυση και Εφαρμογές

Κεφάλαιο 6 Ιδιοτιμές και Ιδιοδιανύσματα

Ενότητα 2: Εισαγωγή στη Θεωρία Βέλτιστου Ελέγχου. Νίκος Καραμπετάκης Τμήμα Μαθηματικών

ΕΙΣΑΓΩΓΗ ΣΤΗ ΒΕΛΤΙΣΤΟΠΟΙΗΣΗ ΣΥΣΤΗΜΑΤΩΝ

21 a 22 a 2n. a m1 a m2 a mn

Ψηφιακός Έλεγχος. 6 η διάλεξη Σχεδίαση στο χώρο κατάστασης. Ψηφιακός Έλεγχος 1

Βέλτιστος Έλεγχος Συστημάτων

(a + b) + c = a + (b + c), (ab)c = a(bc) a + b = b + a, ab = ba. a(b + c) = ab + ac

x (t) u (t) = x 0 u 0 e 2t,

Αριθμητική Ανάλυση και Εφαρμογές

Συστήματα Αυτόματου Ελέγχου

1 Επανάληψη εννοιών από τον Απειροστικό Λογισμό

Κεφάλαιο 3 ΣΤΟΙΧΕΙΑ ΓΡΑΜΜΙΚΗΣ ΑΛΓΕΒΡΑΣ

Εισαγωγή στις Τηλεπικοινωνίες. Δομή της παρουσίασης

Αριθμητική Ανάλυση και Εφαρμογές

y 1 (x) f(x) W (y 1, y 2 )(x) dx,

Κεφάλαιο 5. Το Συμπτωτικό Πολυώνυμο

Μοντέρνα Θεωρία Ελέγχου

I. ΜΙΓΑΔΙΚΟΙ ΑΡΙΘΜΟΙ. math-gr

ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ ΣΤΗΝ ΠΛΗΡΟΦΟΡΙΚΗ ΜΑΘΗΜΑΤΙΚΑ Ι (ΘΕ ΠΛΗ 12) ΕΡΓΑΣΙΑ 1 η Ημερομηνία Αποστολής στον Φοιτητή: 20 Οκτωβρίου 2008

Ενότητα 8: Συναρτησιακά καμπύλων οι οποίες υπόκεινται σε δεσμούς. Νίκος Καραμπετάκης Τμήμα Μαθηματικών

Δυναμική Μηχανών I. Επίλυση Προβλημάτων Αρχικών Συνθηκών. σε Συστήματα Συνήθων Διαφορικών Εξισώσεων με Σταθερούς Συντελεστές

ΓΡΑΜΜΙΚΗ ΑΛΓΕΒΡΑ (ΗΥ-119)

ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΚΕΝΤΡΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ ΣΧΟΛΗ ΤΜΗΜΑ. Μαθηματικά 2. Σταύρος Παπαϊωάννου

Σήματα και Συστήματα. Διάλεξη 13: Μελέτη ΓΧΑ Συστημάτων με τον Μετασχηματισμό Laplace. Δρ. Μιχάλης Παρασκευάς Επίκουρος Καθηγητής

Παράδειγμα 14.2 Να βρεθεί ο μετασχηματισμός Laplace των συναρτήσεων

Ασκήσεις3 Διαγωνίσιμες Γραμμικές Απεικονίσεις

Τεχνολογικό Εκπαιδευτικό Ίδρυμα Σερρών Τμήμα Πληροφορικής & Επικοινωνιών Σήματα και Συστήματα

Ευστάθεια συστημάτων

Παναγιώτης Ψαρράκος Αν. Καθηγητής

Κεφ. 7: Συνήθεις διαφορικές εξισώσεις (ΣΔΕ) - προβλήματα αρχικών τιμών

ΜΕΜ251 Αριθμητική Ανάλυση

Ασκήσεις3 Διαγωνισιμότητα Βασικά σημεία Διαγωνίσιμοι πίνακες: o Ορισμός και παραδείγματα.

Kεφάλαιο 4. Συστήματα διαφορικών εξισώσεων. F : : F = F r, όπου r xy

4. ΚΕΦΑΛΑΙΟ ΕΦΑΡΜΟΓΕΣ ΤΟΥ ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΥ FOURIER

1 ιαδικασία διαγωνιοποίησης

Τεχνολογικό Εκπαιδευτικό Ίδρυμα Σερρών Τμήμα Πληροφορικής & Επικοινωνιών Σήματα και Συστήματα

Εφαρμοσμένα Μαθηματικά ΙΙ Τελική Εξέταση 19/6/2018 Διδάσκων: Ι. Λυχναρόπουλος

Ασκήσεις6 Διαγωνοποίηση Ερμιτιανών Πινάκων

Κεφάλαιο 4 Διανυσματικοί Χώροι

Σήματα και Συστήματα. Διάλεξη 9: Μελέτη ΓΧΑ Συστημάτων με τον Μετασχηματισμό Fourier. Δρ. Μιχάλης Παρασκευάς Επίκουρος Καθηγητής

Διαγωνοποίηση μητρών. Στοιχεία Γραμμικής Άλγεβρας

Η ΚΑΝΟΝΙΚΗ ΜΟΡΦΗ JORDAN

Σχόλιο. Κατασκευή των τροχιών της δισδιάστατης γραμμικής δυναμικής.

Συνήθεις διαφορικές εξισώσεις προβλήματα οριακών τιμών

12. ΑΝΙΣΩΣΕΙΣ Α ΒΑΘΜΟΥ. είναι δύο παραστάσεις μιας μεταβλητής x πού παίρνει τιμές στο

website:

Διαφορικές Εξισώσεις.

,..., v n. W πεπερασμένα παραγόμενοι και dimv. Τα ακόλουθα είναι ισοδύναμα f είναι ισομορφιμός. f είναι 1-1. f είναι επί.

Ανάλυση Σ.Α.Ε στο χώρο κατάστασης

ΚΕΦΑΛΑΙΟ 2: ΟΡΙΖΟΥΣΕΣ

Γραμμική Άλγεβρα και Μαθηματικός Λογισμός για Οικονομικά και Επιχειρησιακά Προβλήματα

Δυναμική Μηχανών I. Επίλυση Προβλημάτων Αρχικών Συνθηκών σε Συνήθεις. Διαφορικές Εξισώσεις με Σταθερούς Συντελεστές

Δυναμική Μηχανών I. Διάλεξη 8. Χειμερινό Εξάμηνο 2013 Τμήμα Μηχανολόγων Μηχ., ΕΜΠ

Σήματα και Συστήματα. Διάλεξη 1: Σήματα Συνεχούς Χρόνου. Δρ. Μιχάλης Παρασκευάς Επίκουρος Καθηγητής

ΓΡΑΜΜΙΚΗ ΑΛΓΕΒΡΑ (Εξ. Ιουνίου - 02/07/08) ΕΠΙΛΕΓΜΕΝΕΣ ΑΠΑΝΤΗΣΕΙΣ

Πεπερασμένες Διαφορές.

Θέμα 1. με επαυξημένο 0 1 1/ 2. πίνακα. και κλιμακωτή μορφή αυτού

Έντυπο Yποβολής Αξιολόγησης ΓΕ

2 3x 5x x

(είσοδος) (έξοδος) καθώς το τείνει στο.

ΕΞΙΣΩΣΕΙΣ ΔΙΑΦΟΡΩΝ ΟΡΙΣΜΟΙ: διαφορές των αγνώστων συναρτήσεων. σύνολο τιμών. F(k,y k,y. =0, k=0,1,2, δείκτη των y k. =0 είναι 2 ης τάξης 1.

ΚΕΦ.6:ΤΕΤΡΑΓΩΝΙΚΕΣ ΜΟΡΦΕΣ. ΣΥΜΜΕΤΡΙΚΟΙ ΠΙΝΑΚΕΣ

ΓΡΑΜΜΙΚΗ ΑΛΓΕΒΡΑ (ΗΥ-119)

Συνήθεις Διαφορικές Εξισώσεις Ι Ασκήσεις - 09/11/2017. Άσκηση 1. Να βρεθεί η γενική λύση της διαφορικής εξίσωσης. dy dx = 2y + x 2 y 2 2x

ΤΕΤΥ Εφαρμοσμένα Μαθηματικά 1. Τελεστές και πίνακες. 1. Τελεστές και πίνακες Γενικά. Τι είναι συνάρτηση? Απεικόνιση ενός αριθμού σε έναν άλλο.

Τεχνολογικό Εκπαιδευτικό Ίδρυμα Σερρών Τμήμα Πληροφορικής & Επικοινωνιών Σήματα και Συστήματα

Δυναμική Μηχανών I. Επανάληψη: Μαθηματικά

ΤΕΧΝΟΛΟΓΙΚΟ ΕΚΠΑΙΔΕΥΤΙΚΟ ΙΔΡΥΜΑ ΚΕΝΤΡΙΚΗΣ ΜΑΚΕΔΟΝΙΑΣ ΣΧΟΛΗ ΤΜΗΜΑ. Μαθηματικά 1. Σταύρος Παπαϊωάννου

ΠΡΟΓΡΑΜΜΑ ΣΠΟΥΔΩΝ ΣΤΗΝ ΠΛΗΡΟΦΟΡΙΚΗ ΜΑΘΗΜΑΤΙΚΑ Ι (ΘΕ ΠΛΗ 12) ΕΡΓΑΣΙΑ 1 η Ημερομηνία Αποστολής στον Φοιτητή: 17 Οκτωβρίου 2011

Εφαρμοσμένα Μαθηματικά ΙΙ 9ο Σετ Ασκήσεων (Λύσεις) Διανυσματικοί Χώροι

Κεφάλαιο 4 Διανυσματικοί Χώροι

Περιεχόμενα. Πρόλογος 3

Εφαρμοσμένα Μαθηματικά ΙΙ

Λύσεις θεμάτων Α εξεταστικής περιόδου Χειμερινού εξαμήνου

ΕΛΛΗΝΙΚΗ ΔΗΜΟΚΡΑΤΙΑ Ανώτατο Εκπαιδευτικό Ίδρυμα Πειραιά Τεχνολογικού Τομέα ΣΗΜΑΤΑ & ΣΥΣΤΗΜΑΤΑ

ΘΕΩΡΗΤΙΚΗ ΜΗΧΑΝΙΚΗ ΙΙ

Transcript:

ΤΙΤΛΟΣ Η ΕΞΙΣΩΣΗ RICCATI ΣΤΗΝ ΘΕΩΡΙΑ ΣΥΣΤΗΜΑΤΩΝ ΚΑΙ ΕΛΕΓΧΟΥ-ΕΠΙΛΥΣΗ ΜΕΣΩ ΤΗΣ ΑΡΙΘΜΗΤΙΚΗΣ ΜΕΘΟΔΟΥ NEWTON ΜΕΤΑΠΤΥΧΙΑΚΗ ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ ΚΙΜΩΝ Α.ΓΑΙΤΑΝΗΣ Επιβλέπων:Νικόλαος Καραμπετάκης Καθηγητής Α.Π.Θ. Θεσσαλονίκη, Μάιος 2017

ΤΙΤΛΟΣ Η ΕΞΙΣΩΣΗ RICCATI ΣΤΗΝ ΘΕΩΡΙΑ ΣΥΣΤΗΜΑΤΩΝ ΚΑΙ ΕΛΕΓΧΟΥ-ΕΠΙΛΥΣΗ ΜΕΣΩ ΤΗΣ ΑΡΙΘΜΗΤΙΚΗΣ ΜΕΘΟΔΟΥ NEWTON ΜΕΤΑΠΤΥΧΙΑΚΗ ΔΙΠΛΩΜΑΤΙΚΗ ΕΡΓΑΣΙΑ ΚΙΜΩΝ Α.ΓΑΙΤΑΝΗΣ Επιβλέπων:Νικόλαος Καραμπετάκης Καθηγητής Α.Π.Θ. Εγκρίθηκε από την τριμελή επιτροπή την............... Καραμπετάκης Αντωνίου Κοσμίδου Νικόλαος Ευστάθιος Ολγα Καθηγητής Α.Π.Θ. Αναπλ. Καθηγητής Α.Τ.Ε.Ι.Θ. Αναπλ. Καθηγήτρια Δ.Π.Θ. Θεσσαλονίκη, Μάιος 2017

.................. Κίμων Α.Γαϊτάνης Πτυχιούχος Μαθηματικός Α.Π.Θ. Copyright c Κίμων Α.Γαϊτάνης, 2017 Με επιφύλαξη παντός δικαιώματος. All rights reserved. Απαγορεύεται η αντιγραφή, αποθήκευση και διανομή της παρούσας εργασίας, εξ ολοκλήρου ή τμήματος αυτής, για εμπορικό σκοπό. Επιτρέπεται η ανατύπωση, αποθήκευση και διανομή για σκοπό μη κερδοσκοπικό, εκπαιδευτικής ή ερευνητικής φύσης, υπό την προϋπόθεση να αναφέρεται η πηγή προέλευσης και να διατηρείται το παρόν μήνυμα. Ερωτήματα που αφορούν τη χρήση της εργασίας για κερδοσκοπικό σκοπό πρέπει να απευθύνονται προς τον συγγραφέα. Οι απόψεις και τα συμπεράσματα που περιέχονται σε αυτό το έγγραφο εκφράζουν τον συγγραφέα και δεν πρέπει να ερμηνευτεί ότι εκφράζουν τις επίσημες θέσεις του Α.Π.Θ.

Περίληψη Το αντικείμενο της εργασίας αυτής είναι η ανάλυση καθώς και η επίλυση της συνεχούς χρόνου εξίσωσης πινάκων Riccati. Η εξίσωση Riccati παίζει σημαντικό ρόλο σε πολλά πεδία της επιστήμης των Ηλεκτρονικών Υπολογιστών και των Μαθηματικών, όπως στη θεωρία εκτίμησης, στον βέλτιστο έλεγχο, στις τηλεπικοινωνίες, στην επίλυση ολοκληρωτικών εξισώσεων, στη θεωρία παιγνίων και αλλού. Η επίλυση της εξίσωσης Riccati αποτελεί ένα απαραίτητο προαπαιτούμενο για την επίλυση σημαντικών προβλημάτων σε διάφορες επιστημονικές περιοχές όπως στην επεξεργασία σημάτων, στον αυτοματισμό, στην τεχνητή νοημοσύνη, στην αναγνώριση προτύπων, στην ρομποτική και των εφαρμογών τους σε τομείς της τεχνολογίας ηλεκτρονικών υπολογιστών όπως ο βιομηχανικός αυτοματισμός, η αναγνώριση φωνής και εικόνας με χρήση Η/Υ, ο αμυντικός αυτοματισμός και άλλα. Αρχικά παρουσιάζεται το κλασικό γραμμικό τετραγωνικό πρόβλημα ρύθμισης (Γ.Τ.Π.Ρ.), η επίλυση του οποίου ανάγεται στην εύρεση της λύσης της διαφορικής εξίσωσης πινάκων Riccati. Στην συνέχεια παρουσιάζεται μία εκτενής αναλυτική λύση της διαφορικής ε- ξίσωσης πινάκων Riccati. Επειτα αναλύεται το θεωρητικό υπόβαθρο της εξίσωσης, παραθέτοντας χρήσιμα αποτελέσματα από την Γραμμική Άλγεβρα και την Θεωρία Πινάκων. Στο κεφάλαιο 5 της εργασίας εισάγεται η αριθμητική μέθοδος Newton για την επίλυση της εξίσωσης, καθώς και μία βελτιωμένη έκδοση της μεθόδου. Παραθέτονται επίσης χαρακτηριστικά παραδείγματα και γίνονται συγκρίσεις των μεθόδων αυτών. Τέλος, στο κεφάλαιο 6, η αριθμητική μέθοδος Newton για την λύση της αλγεβρικής εξίσωσης πινάκων Riccati ανάγεται στα συστήματα μεγάλης κλίμακας, όπου παραδίδει αρκετά ικανοποιητικά αποτελέσματα. 2

Abstract The main task of this master thesis is analysis and solution of the continious time matrix Riccati equation. This equation plays an important role in many fields of Mathematics and Computer Science such as estimation theory, optimal control, telecommunications, game theory, Kalman filtering, H -control etc. The numerical solution of matrix Riccati equation is a necessary preliminary for the solution of important problems in several science fields such as signal processing, automatics, artificial intelligence, pattern identification, robotics and their implementation in computer science. Firstly, the well known Linear Quadratic Regulator (LQR) problem, which solution is reduced to the solution of Matrix Riccati equation, is discussed. Then an extensive analytical solution of Matrix Differential Riccati Equation (MRDE) is derived. Subsequently, theoritical background of the equation is being analyzed, by reference to some useful results from Linear Algebra and Matrix Theory. In chapter 5, the well known Newton s method is introduced to provide a numerical solution of the equation. Also, a modified version of the method is introduced in order to compare the results derived from the usage of each method in some examples. Finally, Newton s method for the solution of Matrix Riccati equation expands on large scale systems where it derives pretty accurate results. 3

Περιεχόμενα 1 Εισαγωγή 6 1.1 Βασικές έννοιες και ορισμοί........................ 6 1.2 Εννοιες από την θεωρία ελέγχου..................... 10 2 Γ.Τ.Π.Ρ. και διαφορική εξίσωση Riccati 13 3 Ιδιότητες και μια αναλυτική λύση 21 3.1 Η αρχική εξίσωση............................. 21 3.2 Η συμμετρική ιδιότητα της λύσης της διαφορικής εξίσωσης Riccati.. 22 3.3 Η λύση της διαφορικής εξίσωσης Riccati είναι θετικά ορισμένη..... 23 3.4 Η λύση της διαφορικής εξίσωσης Riccati είναι ανεξάρτητη της κατάστασης x(t).................................. 23 3.5 Αναλυτική λύση της εξίσωσης...................... 24 4 Αλγεβρική εξίσωση Riccati (CARE) 29 4.1 ΓΤΠΡ για άπειρο χρονικό ορίζοντα.................... 29 4.2 Παράδειγμα ενός συστήματος ανάδρασης................. 31 4.3 Αναλλοίωτοι υποχώροι και αλγεβρική εξίσωση Riccati......... 34 4.4 Η συμμετρική θετικά ημιορισμένη λύση που σταθεροποιεί το σύστημα. 38 4.5 Κρίσιμες λύσεις της εξίσωσης....................... 46 4.6 Τεχνικές ολίσθησης............................ 48 4.7 Ανάλυση διαταραχών για την εξίσωση Riccati.............. 52 5 Η μέδοθος Newton για την λύση της CARE 57 4

ΠΕΡΙΕΧΟΜΕΝΑ 5 6 Η εξίσωση για συστήματα μεγάλης κλίμακας 75 6.1 Χρήση της μεθόδου Newton για την επίλυση της αλγεβρικής εξίσωσης Riccati σε συστήματα μεγάλης κλίμακας................. 77 6.1.1 Λύση της μεγάλης κλίμακας εξίσωσης Lyapunov........ 77 6.1.2 Low rank Cholesky factor ADI iteration............ 79 6.2 Η Low rank Cholesky factor Newton method (LRCF-NM)...... 83 6.3 Αριθμητικά αποτελέσματα......................... 86

Κεφάλαιο 1 Εισαγωγή 1.1 Βασικές έννοιες και ορισμοί Αρχικά παραθέτονται οι ορισμοί και οι βασικές έννοιες σχετικές με τις εξισώσεις πινάκων που θα παρουσιαστούν σε αυτή την εργασία. Απο εδώ και στο εξής θα συμβολίζονται με R και C τα σώματα των πραγματικών και των μιγαδικών αριθμών αντίστοιχα. Με R n και C n συμβολίζουμε τους n-διάστατους διανυσματικούς χώρους πάνω απο το R και το C αντίστοιχα. Το σύνολο των m n πινάκων με στοιχεία από το R ή το C συμβολίζεται με R m n ή C m n αντιστοίχως. Για τον πίνακα A C m n, ο πίνακας A συμβολίζει τον ανάστροφο του A, ενώ ο πίνακας A τον συζυγοανάστροφο του A. Η σχέση A 0 (A 0) σημαίνει ότι ο A C m n είναι ερμιτιανός θετικά ημιορισμένος (θετικά ορισμένος) πίνακας. Επιπλέον η σχέση A B (A B) σημαίνει ότι για A, B C n n ο πίνακας A B 0 (A B 0). Ορισμός 1. Ενας πίνακας U C n n λέγεται ορθομοναδιαίος αν UU = U U = I. Αντίστοιχα ένας πίνακας Q R n n λέγεται ορθογώνιος αν QQ = Q Q = I Ορισμός 2. Εστω A ένας n n πίνακας. Τότε το πολυώνυμο p A (λ) = det(λi A) καλείται το χαρακτηριστικό πολυώνυμο του A. Οι ρίζες του χαρακτηριστικού πολυωνύμου καλούνται ιδιοτιμές του A. Ορισμός 3. Φάσμα του πίνακα A ονομάζεται το σύνολο των ιδιοτιμών του και συμβολίζεται με σ(a). Φασματική ακτίνα του πίνακα A ονομάζεται η μέγιστη σε απόλυτη τιμή ιδιοτιμή του A και συμβολίζεται με ϱ(a). 6

ΚΕΦΑΛΑΙΟ 1. ΕΙΣΑΓΩΓΗ 7 Ορισμός 4. Ενα μη μηδενικό διάνυσμα x έτσι ώστε Ax = λx, όπου λ C ιδιοτιμή του A καλείται δεξί ιδιοδιάνυσμα του A. Αντίστοιχα ένα μη μηδενικό διάνυσμα y καλείται αριστερό ιδιοδιάνυσμα του A αν y A = λy για λ C ιδιοτιμή του A. Θεώρημα 1.1 (Jordan κανονική μορφή πίνακα). Κάθε πίνακας A C n n μπορεί να εκφραστεί στην Jordan κανονική του μορφή ως λ k 1. 0 λ S 1 AS = J = diag(j 1, J 2,..., J p ), J k = k..... C m k m k,. 1 όπου m 1 + + m p = n και S κατάλληλος μη ιδιάζων πίνακας. Ορισμός 5. Οι block πίνακες J k ονομάζονται Jordan blocks. Η αλγεβρική πολλαπλότητα μιας ιδιοτιμής λ του A ισούται με το άθροισμα των διαστάσεων των Jordan blocks όπου η λ εμφανίζεται, ενώ η γεωμετρική πολλαπλότητα της ιδιοτιμής λ είναι το πλήθος των μπλοκ στα οποία εμφανίζεται. Ορισμός 6 (αλυσίδες Jordan). Θεωρώντας την ιδιοτιμή λ k η οποία εμφανίζεται στο Jordan μπλοκ J k, συμβολίζονται με s 1,..., s mk οι στήλες του S που αντιστοιχούν στο Jordan block J k. Από τη σχέση AS = SJ προκύπτουν οι σχέσεις λ k As 1 = λ k s 1 As i = s i 1 + λ k s i, i = 2,..., m k Το σύνολο των διανυσμάτων s 1,..., s q, q m k αποτελεί μία αλυσίδα Jordan που αντιστοιχεί στην λ k. Αν q = m k η αλυσίδα καλείται πλήρης. Θεώρημα 1 (Schur decomposition). Κάθε πίνακας A C n n είναι ορθομοναδιαία ισοδύναμος με έναν τριγωνικό πίνακα του οποίου οι ιδιοτιμές εμφανίζονται στην κύρια διαγώνιο με οποιαδήποτε (ή με προκαθορισμένη) σειρά. Για τους πραγματικούς πίνακες το προηγούμενο θεώρημα παίρνει την μορφή:

ΚΕΦΑΛΑΙΟ 1. ΕΙΣΑΓΩΓΗ 8 Θεώρημα 2 (Real Schur decomposition). Για κάθε A R n n υπάρχει ορθογώνιος πίνακας Q R n n τέτοιος ώστε A 1 S 12 S 1k 0 A Q AQ = 2 S 2k...... 0 0 A k όπου A i πραγματικός 1 1 πίνακας ή πραγματικός 2 2 πίνακας με μιγαδικές συζηγείς ιδιοτιμές. Τα διαγώνια μπλοκς A i μπορούν να έχουν οποιαδήποτε σειρά. Είναι δυνατόν όμως να αναδιαταχθούν μέσω μετασχηματισμών ώστε να εμφανίζονται με προκαθορισμένη σειρά. Δύο νόρμες πινάκων που συναντώνται συχνά είναι οι 2-norm και Frobenius norm. Η 2-norm ορίζεται ως ενώ η Frobenius norm ενός m n πίνακα ως A F = [ m i=1 A 2 = ϱ(a A), (1.1) n j=1 a ij 2 ] 1 2 = (trace(a A)) 1 2 (1.2) Επίσης παραθέτονται τα ακόλουθα υποσύνολα του μιγαδικού επιπέδου C C > = {z C : C = {z C : C < = {z C : C = {z C : C 0 = {z C : re(z) > 0} : ανοιχτό δεξί ημιεπίπεδο re(z) 0} : κλειστό δεξί ημιεπίπεδο re(z) < 0} :ανοικτό αριστερό ημιεπίπεδο re(z) 0} : κλειστό αριστερό ημιεπίπεδο re(z) = 0} : ο άξονας των φανταστικών αριθμών Οι έννοιες του αναλλοίωτου υποχώρου ενός πίνακα και του ελαττωμένου (deflating) υ- ποχώρου ενός πρωτοβάθμιου πολυωνυμικού πίνακα είναι θεμελιώδεις για την θεωρητική και την αριθμητική ανάλυση των αλγεβρικών εξισώσεων πινάκων Riccati. Ορισμός 7. Δίνεται ένας n n πίνακας A και ένας m-διάστατος υποχώρος V C n. Εστω AV ο υποχώρος {y C n : y = Ax, x V}. Ο V καλείται αναλλοίωτος υποχώρος για τον A αν AV V. Φαίνεται ότι αν οι στήλες του πλήρους βαθμίδας

ΚΕΦΑΛΑΙΟ 1. ΕΙΣΑΓΩΓΗ 9 n m πίνακα V παράγουν τον υποχώρο V, τότε ο V είναι αναλλοίωτος για τον A αν και μόνο αν υπάρχει m m πίνακας Λ έτσι ώστε AV = V Λ Υπάρχει μια ένα προς ένα αντιστοιχία μεταξύ των αναλλοίωτων υποχώρων ενός πίνακα και του συνόλου των Jordan αλυσιδών του ίδιου πίνακα. Πιο συγκεκριμένα, κάθε μη μηδενικός αναλλοίωτος για κάποιον πίνακα υποχώρος δέχεται μια βάση αποτελούμενη από στοιχεία Jordan αλυσιδών του πίνακα αυτού. Το φάσμα του πίνακα Λ στην παραπάνω σχέση είναι υποσύνολο του φάσματος του πίνακα A και οι ιδιοτιμές του Λ καλούνται οι ιδιοτιμές του A που αντιστοιχούν στον αναλλοίωτο υποχώρο. Ορισμός 8. Για δοθέν ζεύγος n n πινάκων L και K, ορίζεται η συνάρτηση L zk της μεταβλητής z ως ο πρωτοβάθμιος πολυωνυμικός πίνακας του ζεύγους (L, K). Για έναν πρωτοβάθμιο πολυωνυμικό πίνακα L zk, οι μιγαδικοί αριθμοί z για τους οποίους det(l zk) = 0 καλούνται ιδιοτιμές του. Η γενίκευση των αναλλοίωτων υποχώρων στους πρωτοβάθμιους πολυωνυμικούς πίνακες οδηγεί στην έννοια του ελλατωμένου (deflating) υποχώρου. Ορισμός 9. Ενας m-διάστατος υποχώρος S C n λέγεται ελαττωμένος (deflating) υποχώρος για τον n n πρωτοβάθμιο πολυωνυμικό πίνακα L zk αν υπάρχει ένας m-διάστατος υποχώρος T C n έτσι ώστε LS T, KS T Αν T, S C n m είναι πλήρους βαθμίδας πίνακες, οι στήλες των οποίων παράγουν τους χώρους T και S αντίστοιχα, τότε οι παραπάνω σχέσεις ισοδυναμούν με την ύπαρξη πινάκων W 1, W 2 C m m έτσι ώστε LS = T W 1, KS = T W 2 δηλαδή (L zk)s = T (W 1 zw 2 ). Οι ιδιοτιμές του πολυωνυμικού πίνακα W 1 zw 2 είναι υποσύνολο των ιδιοτιμών του L zk και είναι οι ιδιοτιμές που αντιστοιχούν στον ελαττωμένο (deflating) υποχώρο.

ΚΕΦΑΛΑΙΟ 1. ΕΙΣΑΓΩΓΗ 10 1.2 Εννοιες από την θεωρία ελέγχου Εστω το παρακάτω συνεχούς χρόνου γραμμικό σύστημα ẋ(t) = Ax(t) + Bu(t) y(t) = Cx(t) + Du(t) Ορισμός 10. Ενας πίνακας A καλείται ευσταθής αν όλες οι ιδιοτιμές του βρίσκονται εντός του αριστερού ανοικτού μιγαδικού επιπέδου C <. Με άλλα λόγια ο πίνακας A είναι ευσταθής αν όλες οι ιδιοτιμές του έχουν αρνητικό πραγματικό μέρος. Ορισμός 11. [11] Ενα σύστημα καλείται ελέγξιμο εάν, ξεκινώντας από οποιαδήποτε αρχική κατάσταση x(0) το σύστημα μπορεί να οδηγηθεί σε οποιαδήποτε επιθυμητή τελική κατάσταση x 1 (t) σε πεπερασμένο χρόνο t 1, με την χρήση κατάλληλης εισόδου u(t), 0 t t 1. Αν έχω A C n n και B, C C n m και Ω C τότε Θεώρημα 1.2. [9] Το ζεύγος (A, B) λέγεται ελέγξιμο στο λ C αν rank([a λi, B]) = n, ελέγξιμο στο Ω αν είναι ελέγξιμο για κάθε λ Ω, και ελέγξιμο αν είναι ελέγξιμο σε κάθε λ C. Το προηγούμενο θεώρημα είναι ισοδύναμο με το παρακάτω θεώρημα [20]. Θεώρημα 1.3. Το ζεύγος (A, B) είναι ελέγξιμο αν και μόνο αν rank([b AB A 2 B... A n 1 B]) = n Μια δυϊκή έννοια με την ελεγξιμότητα είναι η έννοια της παρατηρησιμότητας. Ορισμός 12. [11] Ενα σύστημα καλείται παρατηρήσιμο εάν υπάρχει t 1 0 ώστε η αρχική κατάσταση x(0) να μπορεί να καθοριστεί αποκλειστικά από την γνώση των u(t) και y(t) για όλα τα t, 0 t t 1. Θεώρημα 1.4. [9] Το ζεύγος (C, A) λέγεται παρατηρήσιμο αν το (A, C ) είναι ελέγξιμο.

ΚΕΦΑΛΑΙΟ 1. ΕΙΣΑΓΩΓΗ 11 Μια ελαφρώς πιο αδύναμη έννοια από την ελεγξιμότητα είναι η σταθεροποιησιμότητα ενός συστήματος. Ορισμός 13. [9] Το ζεύγος (A, B) είναι σταθεροποιήσιμο αν και μόνο αν υπάρχει πίνακας K C m n τέτοιος ώστε ο A BK να είναι ευσταθής. Θεώρημα 1.5. [9] Το ζεύγος (A, B) λέγεται σταθεροποιήσιμο αν είναι ελέγξιμο εκτός της περιοχής ευστάθειας. Ειδικότερα αν έχω συνεχούς χρόνου σύστημα τότε το ζεύγος (A, B) είναι σταθεροποιήσιμο αν είναι ελέγξιμο για κάθε λ C. Παρατηρούμε ότι ένα ελέγξιμο ζεύγος είναι πάντα σταθεροποιήσιμο. Θεώρημα 3. [9] Το ζεύγος (C, A) λέγεται ανιχνεύσιμο αν το (A, C ) είναι σταθεροποιήσιμο. Δύο ιδιαίτερα χρήσιμες εξισώσεις που συναντώνται συχνά στα συστήματα ελέγχου είναι οι παρακάτω. Ορισμός 14 (Εξίσωση Sylvester). Η εξίσωση Sylvester είναι μία εξίσωση πινάκων της μορφής AX + XB = G, (1.3) με άγνωστο X C m n και συντελεστές A C m m, B C n n, G C m n. Ακολούθως παρατίθεται ένα αποτέλεσμα σχετικά με την ύπαρξη και μοναδικότητα της λύσης της εξίσωσης Sylvester [11]. Θεώρημα 1.6. Εστω λ 1, λ 2,..., λ n οι ιδιοτιμές του B και µ 1,..., µ m οι ιδιοτιμές του A. Τότε η εξίσωση Sylvester (1.3) έχει μοναδική λύση X αν και μόνον αν λ i + µ j 0 για όλα τα i = 1,..., n και j = 1,..., m. Με άλλα λόγια η εξίσωση Sylvester έχει μοναδική λύση όταν οι πίνακες B και A δεν έχουν κοινή ιδιοτιμή. Εάν m = n, B = A, G = G, τότε η εξίσωση Sylvester ανάγεται στην παρακάτω εξίσωση. Ορισμός 15 (Εξίσωση Lyapunov). Η εξίσωση Lyapunov είναι μία εξίσωση της μορφής AX + XA = G (1.4)

ΚΕΦΑΛΑΙΟ 1. ΕΙΣΑΓΩΓΗ 12 Θεώρημα 1.7. Η εξίσωση Lyapunov έχει μοναδική λύση αν και μόνο αν ο συντελεστής A δεν έχει ζεύγος ιδιοτιμών συμμετρικών ως προς τον άξονα των φανταστικών. Μια τέτοια περίπτωση είναι όταν ο A είναι ευσταθής. Οταν ο πίνακας A είναι ευσταθής η λύση της Lyapunov δίνεται ως X = 0 e At ( Q)e A t dt

Κεφάλαιο 2 Γραμμικό Τετραγωνικό Πρόβλημα Ρύθμισης και Διαφορική Εξίσωση Riccati Για να έχουμε μία καλύτερη εποπτεία του θέματος που θα ασχοληθούμε, θα ήταν προτιμότερο να παρουσιάζουμε τις διάφορες θεμελιώδεις έννοιες με ιδιαίτερη αναφορά στη φυσική σημασία τους. Το τελευταίο είναι ιδιαίτερα χρήσιμο ώστε να παίρνουμε τις σωστές μαθηματικές συνθήκες. Στην περίπτωση μας έχουμε να κάνουμε με ένα πρόβλημα βελτιστοποίησης από την πλευρά της μηχανικής. Εστω το παρακάτω γραμμικό, συνεχούς χρόνου, σταθερών συντελεστών σύστημα: ẋ(t) = Ax(t) + Bu(t), x(t 0 ) = x 0 y(t) = Cx(t) όπου x(t) : R R n, u(t) : R R r και y : R R p είναι τα διανύσματα κατάστασης, εισόδου και εξόδου αντίστοιχα του συστήματος και A, B, C είναι σταθεροί πίνακες καταλλήλων διαστάσεων με στοιχεία από το R. Το πρόβλημα ανάγεται στην εύρεση μίας εισόδου u(t), t 0 t t f η οποία για κάθε x 0 R n ελαχιστοποιεί το συναρτησιακό κόστους J = 1 2 x (t f )Sx(t f ) + 1 2 tf t 0 ( (x(t) z(t)) Q(x(t) z(t)) + u (t)ru(t) ) dt (2.1) όπου S 0, Q 0, R 0. 13

ΚΕΦΑΛΑΙΟ 2. Γ.Τ.Π.Ρ. ΚΑΙ ΔΙΑΦΟΡΙΚΗ ΕΞΙΣΩΣΗ RICCATI 14 Το πρόβλημα μας μπορεί να λυθεί με την μέθοδο της αρχής του ελαχίστου του Pontryagin [30]. Η ελάχιστη τιμή J 0 της (2.1) δίνεται από την σχέση και ο έλεγχος που μας οδηγεί σε αυτήν είναι ο, J 0 = 1 2 x (t 0 )P (t 0 )x(t 0 ) (2.2) u(t) = R 1 B P (t)x(t) = K(t)x(t) (2.3) όπου K(t) = R 1 B P (t) καλείται πίνακας Kalman (Kalman gain) και ο P (t) είναι ένας συμμετρικός n n πίνακας λύση της Διαφορικής Εξίσωσης Πινάκων Riccati (Δ.Ε.Π. Riccati) P (t) = A P (t) + P (t)a + Q P (t)br 1 B P (t), (2.4) η οποία ικανοποιεί την τελική συνθήκη P (t f ) = S. (2.5) Είναι φανερό ότι η εξίσωση αυτή λύνεται προς τα πίσω στον χρόνο, από την t f ως την t 0, με σκοπό την εύρεση του βελτίστου ελέγχου που ελαχιστοποιεί το συναρτησιακό (2.1). Ας επικεντρωθούμε για λίγο στους πίνακες που εμφανίζονται στο συναρτησιακό (2.1) και στις επιπτώσεις τους. Ο πίνακας στάθμισης σφάλματος Q: Η έκφραση x (t)qx(t) στο συναρτησιακό (2.1) υποδηλώνει το σφάλμα (διαφορά) e(t) = x(t) z(t) της κατάστασης x(t) από την επιθυμητή κατάσταση z(t), που στην προκειμένη περίπτωση είναι η μηδενική (z(t) = 0). Επόμένως το σφάλμα, ως φυσική έννοια, θα πρέπει να είναι μη αρνητικό. Άρα και ο πίνακας Q θα πρέπει να είναι θετικά ημιορισμένος (Q 0).

ΚΕΦΑΛΑΙΟ 2. Γ.Τ.Π.Ρ. ΚΑΙ ΔΙΑΦΟΡΙΚΗ ΕΞΙΣΩΣΗ RICCATI 15 Ο πίνακας στάθμισης ελέγχου R: Η τετραγωνική φύση της έκφρασης κόστους ελέγχου u (t)ru(t) στην (2.1) υποδεικνύει ότι για να έχουμε μεγαλύτερο αποτέλεσμα ελέγχου, θα πρέπει να καταβάλλουμε μεγαλύτερο κόστος. Επειδή το κόστος του ελέγχου είναι θετικό ως έννοια, θα πρέπει ο πίνακας R να είναι θετικά ορισμένος (R 0). Ο πίνακας στάθμισης τελικού κόστους S: Ο κύριος σκοπός του όρου x (t f )Sx(t f ) στην (2.1) είναι για να διασφαλίσουμε ότι το σφάλμα e(t) = x(t) z(t) κατά την τελική στιγμή t f είναι όσο το δυνατόν μικρότερο.για να πετύχουμε αυτό το αποτέλεσμα θα πρέπει ο πίνακας S να είναι θετικά ημιορισμένος (S 0). Επιπλέον θα υποθέσουμε, χωρίς περιορισμό της γενικότητας, ότι οι πίνακες Q, R και S είναι συμμετρικοί. Στην περίπτωση όπου το πρόβλημα μας δίνεται σε άπειρο χρονικό ορίζοντα, δηλαδή η τελική χρονική στιγμή t f είναι το άπειρο, τότε ο όρος τελικού κόστους x (t f )Sx(t f ) στην (2.1) δεν έχει κάποιο ρεαλιστικό νόημα. Επομένως, σε αυτήν την περίπτωση ο πίνακας S είναι μηδενικός. Στην συνέχεια παρουσιάζεται το Γραμμικό Τετραγωνικό Πρόβλημα Ρύθμισης (Linear Quadratic Regulator Problem), για συντομία Γ.Τ.Π.Ρ.. Το ζητούμενο είναι να διατηρηθεί το διάνυσμα κατάστασης κοντά στο μηδέν, καθόλη την διάρκεια του χρονικού διαστήματος που μας ενδιαφέρει. Εστω λοιπόν το συναρτησιακό κόστους J = 1 2 x (t f )Sx(t f ) + 1 2 = 1 2 x (t f )Sx(t f ) + 1 2 tf (x (t)qx(t) + u (t)ru(t))dt t 0 t 0 0 R [ x (t) u (t) ] Q 0 [x(t) tf u(t)] dt όπου S 0, Q 0, R 0. Θα ακολουθήσουμε κατά βήμα την διαδικασία Pontryagin [22],[25] που θα μας δώσει την βέλτιστη λύση, την οποία θα την εκφράσουμε με βάση την κλειστού βρόχου

ΚΕΦΑΛΑΙΟ 2. Γ.Τ.Π.Ρ. ΚΑΙ ΔΙΑΦΟΡΙΚΗ ΕΞΙΣΩΣΗ RICCATI 16 (closed-loop) διαμόρφωση του συστήματος. Βήμα 1. Σχηματίζουμε την Hamiltonian [14] του συστήματος: H(x(t), u(t), λ(t)) = 1 2 (x (t)qx(t)+u (t)ru(t))+λ (t)[ax(t)+bu(t)] (2.6) όπου λ(t) R n καλείται το costate διάνυσμα. Βήμα 2. Βρίσκουμε τον βέλτιστο έλεγχο από: H υ = 0 Ru(t) + B λ(t) = 0 u(t) = R 1 B λ(t) (2.7) όπου χρησιμοποιήσαμε τις σχέσεις: και υ {1 2 u (t)ru(t)} = Ru(t) υ {λ (t)bu(t)} = B λ(t) Από την σχέση (2.7) αμέσως φαίνεται η ανάγκη ο πίνακας R να είναι θετικά ορισμένος, έτσι ώστε ο αντίστροφος του, R 1 να υπάρχει. Βήμα 3. Λαμβάνουμε τις state και costate εξισώσεις από τις σχέσεις: ẋ(t) = H λ ẋ(t) = Ax(t) + Bu(t) (2.8) λ(t) = ( H x ) λ(t) = Qx(t) A λ(t) (2.9) Αντικαθιστώντας την (2.7) στην (2.8) προκύπτει το ακόλουθο Hamiltonian σύστημα εξισώσεων: ẋ(t) = A λ(t) Q Η γενικευμένη οριακή συνθήκη μας δίνει την σχέση: BR 1 B x(t) (2.10) A λ(t) [ H + [ 1 2 x (t f )Sx(t f )] t ] t f δt f + [ [ 1 2 x (t f )Sx(t f )] x λ(t) ] t f δx f = 0, (2.11)

ΚΕΦΑΛΑΙΟ 2. Γ.Τ.Π.Ρ. ΚΑΙ ΔΙΑΦΟΡΙΚΗ ΕΞΙΣΩΣΗ RICCATI 17 όπου H είναι ο υπολογισμός της Hamiltonian στην βέλτιστη λύση. Στο παρόν σύστημα η τελική χρονική στιγμή είναι συγκεκριμένη, άρα ο όρος δt f στην (2.11) είναι ίσος με το μηδέν. Επίσης η τελική κατάσταση x(t f ) μας είναι άγνωστη, ε- πομένως ο όρος δx f στην (2.11) είναι τυχαίος. Άρα, για να δίνει 0 η (2.11), θα πρέπει ο συντελεστής του δx f να είναι μηδέν. Δηλαδή πρέπει λ(t f ) = [ 1 2 x (t f )Sx(t f )] x = Sx(t f ) (2.12) Η τελική συνθήκη μαζί με την αρχική x(t 0 ) = x 0 και το σύστημα εξισώσεων στην (2.10) σχηματίζουν ένα πρόβλημα οριακής αξίας διπλού σημείου (TPBVP). Η αναπαράσταση των εξισώσεων (2.10) καθώς και της εξίσωσης ελέγχου (2.7) φαίνεται στο παρακάτω γράφημα [25]. Βήμα 4. Ο κλειστού-βρόχου βέλτιστος έλεγχος (closed-loop optimal control): Η παραπάνω state-space αναπαράσταση, υποδεικνύει ότι μπορούμε να θεωρήσουμε τον βέλτιστο έλεγχο u (t) ως συνάρτηση (αρνητική ανάδραση) της βέλτιστης κατάστασης x (t). Τώρα για να διατυπώσουμε τον u(t), ο οποίος σύμφωνα με την (2.7) είναι μια συνάρτηση της λ(t), σε όρους της κατάστασης x(t), θεωρούμε

ΚΕΦΑΛΑΙΟ 2. Γ.Τ.Π.Ρ. ΚΑΙ ΔΙΑΦΟΡΙΚΗ ΕΞΙΣΩΣΗ RICCATI 18 τον μετασχηματισμό: λ(t) = P (t)x(t), t [t 0, t f ]. (2.13) Παρατηρούμε ότι μέσω του μετασχηματισμού αυτού, από την (2.7) ο βέλτιστος έλεγχος γίνεται δηλαδή μια αρνητική ανάδραση του x(t). u(t) = R 1 B P (t)x(t), (2.14) Αν παραγωγίσουμε την (2.13) θα πάρουμε την σχέση: λ(t) = P (t)x(t) + P (t)ẋ(t). (2.15) Αν αντικαταστήσουμε τον μετασχηματισμό (2.13) στις σχέσεις (2.7), (2.8), (2.9) λαμβάνουμε τις : x(t) = Ax(t) BR 1 B P (t)x(t) λ(t) = Qx(t) A P (t)x(t) (2.16) Αντικαθιστώντας τις στην σχέση (2.15) παίρνουμε: Qx(t) A P (t)x(t) = P (t)x(t) + P (t) [ Ax(t) BR 1 B P (t)x(t) ] [ ] P (t) + P (t)a + A P (t) + Q P (t)br 1 B P (t) x(t) = 0 (2.17) Βήμα 5. Η διαφορική εξίσωση πινάκων Riccati (ΔΕΠ Riccati): Επειδή η σχέση (2.17) έχει ισχύ για όλα τα t [t 0, t f ] και για οποιαδήποτε αρχική συνθήκη x(t 0 ), έπεται ότι η σχέση (2.17) ισχύει για οποιαδήποτε τιμή της x(t). Άρα η P (t) θα επαληθεύει την διαφορική εξίσωση πινάκων: P (t) + P (t)a + A P (t) + Q P (t)br 1 B P (t) = 0 (2.18) Αυτή η εξίσωση ονομάζεται διαφορική εξίσωση πινάκων Riccati. Επίσης ο μετασχηματισμός (2.13) ονομάζεται μετασχηματισμός Riccati. Ο πίνακας P (t) ονομάζεται συντελεστής Riccati ή πίνακας Riccati. Η (2.14) είναι ο νόμος α- νάδρασης για τον βέλτιστο έλεγχο. Συγκρίνοντας την οριακή συνθήκη (2.5) και τον μετασχηματισμό Riccati (2.13) έχουμε την τελική συνθήκη για τον πίνακα P (t) ως: λ(t f ) = P (t f )x(t f ) = Sx(t f ) P (t f ) = S (2.19)

ΚΕΦΑΛΑΙΟ 2. Γ.Τ.Π.Ρ. ΚΑΙ ΔΙΑΦΟΡΙΚΗ ΕΞΙΣΩΣΗ RICCATI 19 Από την τελική συνθήκη γίνεται φανερό πως η εξίσωση (2.18) λύνεται προς τα πίσω στον χρόνο από την τελική χρονική στιγμή t f προς την αρχική t 0. Βήμα 6. Αφού λυθεί η Riccati ελέγχεται αν ο βέλτιστος έλεγχος αποτελεί ελάχιστο για το συναρτησιακό κόστους J. Ικανή και αναγκαία συνθήκη για να συμβαίνει αυτό είναι ο πίνακας Π = 2 H x 2 2 H u x 2 H x u 2 H u 2 να είναι θετικά ημιορισμένος. Υπολογίζοντας τις δεύτερες παραγώγους της H στον πίνακα Π προκύπτουν Το γεγονός ότι η 2 H u 2 2 H x = Q 0, 2 H 2 x u = 0 2 H u x = 0, 2 H u = R 0 2 = R είναι θετικά ορισμένη (R από κατασκευής του προβλήματος θετικά ορισμένος ως πίνακας στάθμισης ελέγχου), μας εγγυάται ότι ο βέλτιστος έλεγχος u(t) αποτελεί ελάχιστο για το συναρτησιακό κόστους J. Βήμα 7. Υπολογίζουμε την βέλτιστη (ελάχιστη ή μέγιστη ανάλογα με το πρόβλημα) τιμή του συναρτησιακού J. Δίνεται από τον τύπο: J (x (t), t) = 1 2 x (t)p (t)x (t), t [t 0, t f ] (2.20) όπου x (t) συμβολίζει το διάνυσμα βέλτιστης κατάστασης που δίνεται από τον τύπο (2.16). Μέσα από τα 7 αυτά βήματα λύνουμε το γραμμικό τετραγωνικό πρόβλημα ρύθμισης (Γ.Τ.Π.Ρ.). Είναι φανερή λοιπόν η σημασία της εύρεσης της λύσης της εξίσωσης πινάκων Riccati για την λύση του προβλήματος. Στο παρακάτω γράφημα [25] φαίνεται η προηγούμενη διαδικασία. Παρατηρούμε ότι ο υπολογισμός της διαφορικής εξίσωσης πινάκων Riccati γίνεται σε ανεξάρτητο πλαίσιο κι έπειτα τροφοδοτείται το σύστημα με τις τιμές της λύσης για να συνεχιστεί η διαδικασία.

ΚΕΦΑΛΑΙΟ 2. Γ.Τ.Π.Ρ. ΚΑΙ ΔΙΑΦΟΡΙΚΗ ΕΞΙΣΩΣΗ RICCATI 20

Κεφάλαιο 3 Ιδιότητες της διαφορικής εξίσωσης Riccati και μία αναλυτική λύση 3.1 Η αρχική εξίσωση Στα μαθηματικά, εξίσωση Riccati καλούμε μια οποιαδήποτε συνήθη διαφορική εξίσωση η οποία είναι τετραγωνική σε όρους της άγνωστης συνάρτησης. Με άλλα λόγια είναι μια εξίσωση της μορφής: y (x) = q 0 (x) + q 1 (x)y(x) + q 2 (x)y 2 (x) (3.1) όπου q 0 (x) 0 και q 2 (x) 0 (για q 0 (x) = 0 έχουμε την εξίσωση Bernoulli και για q 2 (x) = 0 έχουμε την συνήθη γραμμική διαφορική εξίσωση πρώτης τάξης). Η εξίσωση φέρει το όνομα του Ιταλού μαθηματικού και νομικού Jacopo Francesco Riccati (1676-1754). Ο Jacopo Francesco Riccati γεννήθηκε στην Βενετία στις 28 Μαΐου του 1676. Ο πατέρας του, ένας ευγενής, πέθανε όταν ο Jacopo ήταν σε ηλικία 10 ετών. Το αγόρι ανατράφηκε από την μητέρα του και από τον θείο του, ο οποίος διέκρινε τις ασυνήθιστες ικανότητες του μικρού ανηψιού του και παρότρυνε την μητέρα του να τον γράψει σε ένα Ιησουήτικο κολλέγιο στην Μπρέσια. Το 1693, αφότου αποφοίτησε από το κολλέγιο, εγγράφηκε στο Πα- 21

ΚΕΦΑΛΑΙΟ 3. ΙΔΙΟΤΗΤΕΣ ΚΑΙ ΜΙΑ ΑΝΑΛΥΤΙΚΗ ΛΥΣΗ 22 νεπιστήμιο της Πάντοβα στο τμήμα Νομικής. Ωστόσο, ακολουθώντας την έμφυτη κλίση του στις επιστήμες, παρακολουθούσε παράλληλα και μαθήματα αστρονομίας τα οποία παρέδιδε ένας ιερέας, ο πατέρας Stefano. Ο Stefano ήταν λάτρης της φιλοσοφίας του Νεύτωνα κάτι το οποίο μετέδωσε και στον Jacopo. Αυτό ήταν που οδήγησε τον Jacopo στην στροφή από την νομική στις θετικές επιστήμες. Δεν παρακολούθησε μαθήματα ούτε στα Μαθηματικά ούτε σε κάποιον άλλο επιστημονικό κλάδο. Ηταν αυτοδίδακτος και το εμφανές επιστημονικό υπόβαθρο του το απέκτησε διαβάζοντας. Την Πρωτοχρονιά του 1720, σε γράμμα προς τον φίλο του Giovanni Rizzetti πρότεινε τις δύο παρακάτω νέες διαφορικές εξισώσεις: ẋ = αx 2 + βt m ẋ = αx 2 + βt + γt 2 Αυτή ήταν η πρώιμη μορφή της εξίσωσης Riccati, η οποία μετέπειτα θα αποδεικνύονταν ύψιστης σημασίας. Γενικότερα στα μαθηματικά, οι εξισώσεις Riccati αναφέρονται συνήθως σε εξισώσεις πινάκων που παρουσιάζουν ανάλογους τετραγωνικούς όρους με αυτούς της (3.1), τόσο σε συνεχή χρόνο όσο και σε διακριτό. 3.2 Η συμμετρική ιδιότητα της λύσης της διαφορικής εξίσωσης Riccati Το γεγονός ότι ο n n πίνακας λύση P (t) της εξίσωσης είναι συμμετρικός για κάθε t [t 0, t f ], δηλαδή P (t) = P (t) μπορεί να δεικτεί εύκολα. Πρώτα από όλα παρατηρούμε ότι στην διατύπωση του προβλήματος ελαχιστοποίησης, οι πίνακες Q, R, S είναι συμμετρικοί, επομένως ο πίνακας BR 1 B θα είναι συμμετρικός. Από την σχέση (2.18) τώρα προκύπτει η σχέση P (t) = P (t)a A P (t) Q + P (t)br 1 B P (t) (3.2) Παίρνουμε τον ανάστροφο πίνακα και στις δυο πλευρές της παραπάνω σχέσης και διαπιστώνουμε ότι οι P (t), P (t) ικανοποιούν και οι δυο την (3.2) με τελική συνθήκη την P (t f ) = S. Δείξαμε δηλαδή ότι αν ο P (t) αποτελεί λύση της εξίσωσης, τότε και

ΚΕΦΑΛΑΙΟ 3. ΙΔΙΟΤΗΤΕΣ ΚΑΙ ΜΙΑ ΑΝΑΛΥΤΙΚΗ ΛΥΣΗ 23 ο P (t) είναι λύση. Επιπλέον, εάν η εξίσωση επιδέχεται μοναδική λύση, έπεται ότι P (t) = P (t). Είναι φανερό επομένως ότι η n n εξίσωση πινάκων Riccati (3.2) αντιπροσωπεύει ένα σύστημα n(n+1) 2 μη γραμμικών διαφορικών εξισώσεων πρώτης τάξης. 3.3 Η λύση της διαφορικής εξίσωσης Riccati ε- ίναι θετικά ορισμένη Επειδή ο πίνακας S είναι θετικά ημιορισμένος και ισχύει P (t f ) = S από την τελική συνθήκη, έχουμε ότι P (t f ) είναι θετικά ημιορισμένος. Ισχυριζόμαστε ότι ο πίνακας P (t) είναι θετικά ορισμένος για κάθε t [t 0, t f ). Αν υποθέσουμε αντίθετα ότι ο P (t) δεν είναι θετικά ορισμένος για κάποιο t s < t f, τότε για το αντίστοιχο διάνυσμα κατάστασης x (t s ) θα ισχύει η σχέση 1 2 x (t s )P (t s )x (t s ) 0 κάτι το οποίο έρχεται σε αντίθεση με το γεγονός ότι το ελάχιστο κόστος (2.20) πρέπει να είναι μια θετική ποσότητα. Επομένως ο πίνακας λύση P (t) είναι θετικά ορισμένος για κάθε t [t 0, t f ]. 3.4 Η λύση της διαφορικής εξίσωσης Riccati ε- ίναι ανεξάρτητη της κατάστασης x(t) Ο πίνακας P (t) είναι ανεξάρτητος από την βέλτιστη κατάσταση x (t), επομένως αν δίνονται το σύστημα και το συναρτησιακό κόστους (δηλαδή οι πίνακες συστήματος A, B και οι πίνακες συναρτησιακού κόστους Q, R, S), εμείς μπορούμε να υπολογίσουμε ξεχωριστά τον πίνακα P (t) προτού το βέλτιστο σύστημα λειτουργήσει κατά την προς την εμπρός κατεύθυνση χρόνου από την αρχική του συνθήκη. Τυπικά, γίνεται σε ξεχωριστό πλαίσιο ο υπολογισμός του P (t) προς τα πίσω στο χρονικό διάστημα t [t f, t 0 ] και στη συνέχεια τροφοδοτούμε το σύστημα με την τιμή αυτή του P (t) ώστε να λειτουργήσει προς τα μπρος στο χρονικό διάστημα t [t 0, t f ].

ΚΕΦΑΛΑΙΟ 3. ΙΔΙΟΤΗΤΕΣ ΚΑΙ ΜΙΑ ΑΝΑΛΥΤΙΚΗ ΛΥΣΗ 24 3.5 Αναλυτική λύση της εξίσωσης Στην παράγραφο αυτή θα δώσουμε μία αναλυτική λύση της διαφορικής εξίσωσης πινάκων Riccati, δηλαδή μία λύση που θα προκύπτει με την χρήση γνωστών συναρτήσεων, σταθερών κ.λ.π. και όχι μέσω κάποιας προσεγγιστικής μεθόδου της αριθμητικής ανάλυσης. Στο προηγούμενο κεφάλαιο είδαμε ότι το σύστημα μας είναι ισοδύναμο με το Hamiltonιανό σύστημα: ẋ(t) = A BR 1 B x(t) λ(t) Q A λ(t) (3.3) Εστω := A BR 1 B Q A Υπενθυμίζεται ότι μέσω του μετασχηματισμού λ(t) = P (t)x(t) καταλήγουμε στην διαφορική εξίσωση πινάκων Riccati: P (t) = P (t)a A P (t) Q + P (t)br 1 B P (t) με τελική συνθήκη: P (t f ) = S Η λύση της μπορεί να βρεθεί χρησιμοποιώντας τα ιδιοδιανύσματα και τις ιδιοτιμές του Hamiltonian πίνακα. Αρχικά αποδεικνύεται το παρακάτω αποτέλεσμα [25]. Λήμμα. Εάν µ είναι ιδιοτιμή του πίνακα,τότε µ θα είναι επίσης ιδιοτιμή του πίνακα. Απόδειξη. Ορίζουμε Γ := 0 Ι -Ι 0 Παρατηρούμε ότι Γ 1 = Γ. Αν πολλαπλασιάσουμε από αριστερά και μετά από δεξιά με Γ τον πίνακα προκύπτει = Γ Γ = Γ Γ 1 Αν τώρα µ είναι ιδιοτιμή του πίνακα με αντίστοιχο ιδιοδιάνυσμα ν, θα έχουμε

ΚΕΦΑΛΑΙΟ 3. ΙΔΙΟΤΗΤΕΣ ΚΑΙ ΜΙΑ ΑΝΑΛΥΤΙΚΗ ΛΥΣΗ 25 Επομένως Η τελευταία σχέση αναδιατυπώνεται ως ν = µν Γ Γ ν = µν = Γ 1 Γ ν = µγ ν (Γ ν) = µ(γ ν) απ όπου προκύπτει ότι η µ είναι ιδιοτιμή του. Ο πίνακας είναι όμοιος με τον διαγώνιο πίνακα D = -Μ 0 0 Μ όπου Μ ο διαγώνιος πίνακας με στοιχεία τις ιδιοτιμές του που έχουν θετικό πραγματικό μέρος και -Μ ο αντίστοιχος πίνακας με στοιχεία ιδιοτιμές αρνητικού πραγματικού μέρους. Δηλαδή υπάρχει μη ιδιάζων 2n 2n πίνακας L = L 11 L 12 L 21 L 22 έτσι ώστε L 1 L = D (3.4) όπου οι L ij είναι n n πίνακες με [L 11 L 21 ] να αποτελούν τα n ιδιοδιανύσματα που αντιστοιχούν στις ιδιοτιμές του με αρνητικό πραγματικό μέρος (δηλαδή τις ευσταθείς ιδιοτιμές). Ορίζουμε τώρα τον μετασχηματισμό x(t) = L w(t) = L 11 L 12 w(t) (3.5) λ(t) z(t) L 21 L 22 z(t) Διαφορίζοντας ως προς t και αντικαθιστώντας την (3.4)στην (3.5) θα έχω ẇ(t) = L 1 ẋ(t) = L 1 x(t) = L 1 L w(t) = D w(t) (3.6) ż(t) λ(t) λ(t) z(t) z(t)

ΚΕΦΑΛΑΙΟ 3. ΙΔΙΟΤΗΤΕΣ ΚΑΙ ΜΙΑ ΑΝΑΛΥΤΙΚΗ ΛΥΣΗ 26 Η (3.6) αποτελεί ένα σύστημα διαφορικών εξισώσεων πρώτης τάξης. Η γενική λύση αυτού του συστήματος μας δίνει την σχέση w(t) = e M(t t f ) 0 w(t f) (3.7) z(t) 0 e M(t t f ) z(t f ) Η (3.7) ανάγεται στην παρακάτω μορφή w(t f) = em(t t f ) 0 w(t) (3.8) z(t) 0 e M(t t f ) z(t f ) Από την (3.5) τώρα, χρησιμοποιώντας την τελική συνθήκη (2.12) θα έχουμε λ(t f ) = L 21 w(t f ) + L 22 z(t f ) = Sx(t f ) = S[L 11 w(t f ) + L 12 z(t f )] Λύνοντας την παραπάνω σχέση με άγνωστο z(t f ) προκύπτει z(t f ) = T(t f )w(t f ), όπου T(t f ) = [L 22 SL 12 ] 1 [L 21 SL 11 ] (3.9) Στην (3.8) τώρα έχουμε z(t) = e M(t f t) z(t f ) = e M(t f t) T(t f )w(t f ) = e M(t f t) T(t f )e M(t f t) w(t) Θέτοντας G(t) = e M(t f t) T(t f )e M(t f t) η τελευταία σχέση γράφεται ως z(t) = G(t)w(t) (3.10) Για να συσχετίσουμε τώρα τον συντελεστή Riccati P(t) στην παραπάνω σχέση, παίρνουμε από την (3.5) την σχέση λ(t) = L 21 w(t) + L 22 z(t) P(t)x(t) = L 21 w(t) + L 22 z(t) P(t)[L 11 w(t)+l 12 z(t)] = L 21 w(t) + L 22 z(t) και με χρήση της (3.10) προκύπτει [L 21 + L 22 G(t)]w(t) = P(t)[L 11 + L 12 G(t)]w(t) (3.11)

ΚΕΦΑΛΑΙΟ 3. ΙΔΙΟΤΗΤΕΣ ΚΑΙ ΜΙΑ ΑΝΑΛΥΤΙΚΗ ΛΥΣΗ 27 Επειδή η (3.11) έχει ισχύ για οποιαδήποτε αρχική συνθήκη x(t 0 ) κι επομένως για κάθε κατάσταση w(t) (η οποία προέκυψε μέσω μετασχηματισμού της x(t)), η (3.11) δίνει την παρακάτω αναλυτική έκφραση για την λύση της διαφορικής εξίσωσης Riccati P(t) = [L 21 + L 22 G(t)][L 11 + L 12 G(t)] 1 (3.12) Παράδειγμα 3.1. [25] Δίνεται το σύστημα ẋ 1 (t) = x 2 (t), x 1 (0) = 2 και ο παρακάτω δείκτης απόδοσης ẋ 2 (t) = 2x 1 (t) + x 2 (t) + u(t), x 2 (0) = 3 (3.13) J = 1 2 + 1 2 [ x 2 1 (5) + x 1 (5)x 2 (5) + 2x 2 2(5) ] (3.14) 5 0 [ 2x 2 1 (t) + 6x 1 (t)x 2 (t) + 5x 2 2(t) + 0.25u 2 (t) ] dt (3.15) Οι συντελεστές του συστήματος δίνονται ως A = 0 1, B = 0, S = 1 0.5 2 1 1 0.5 2 Q = 2 3, R = 1 3 5 4, t 0 = 0, t f = 5 Εύκολα φαίνεται ότι το σύστημα (ο πίνακας A) είναι μη ευσταθές. Σχηματίζουμε τον Hamiltonian πίνακα της εξίσωσης 0 1 0 0 = A BR 1 B 2 1 0 4 = Q A 2 3 0 2 3 5 1 1 Ο πίνακας των ιδιοτιμών του δίνεται ως 4.0326 0 0 0 0 0.8590 0 0 D = = M 0 0 0 0.8590 0 0 M 0 0 0 4.0326

ΚΕΦΑΛΑΙΟ 3. ΙΔΙΟΤΗΤΕΣ ΚΑΙ ΜΙΑ ΑΝΑΛΥΤΙΚΗ ΛΥΣΗ 28 και ο μετασχηματισμός ομοιότητας ως 0.1437 0.4679 0.1521 0.1318 0.5797 0.4019 0.1307 0.5314 L = 0.0374 0.6652 0.9771 0.6932 0.8012 0.4207 0.0715 0.4688 = L 11 L 12 L 21 L 22 Ο πίνακας T(t f ) της σχέσης (3.9) δίνεται ως 0.0131 0.3239 T(t f ) = [L 22 SL 12 ] 1 [L 21 SL 11 ] = 0.1826 0.0105 G(t) = e M(t f t) T(t f )e M(t f t) 0.01306 e1.718t 8.59 = 0.3239 e 4.892t 24.46 0.1826 e 4.892t 24.46 0.01045 e 8.065t 40.33 Από τον τύπο (3.12) προκύπτει η αναλυτική λύση P(t) = [L 21 + L 22 G(t)][L 11 + L 12 G(t)] 1 = 3.02 10 12 e 4.89t 2.37 10 6 e 1.72t 0.0374 0.665 7.56 10 12 e 4.89t 2.22 10 20 e 8.07t 2.04 10 12 e 4.89t 1.74 10 7 e 1.72t + 0.801 1.5 10 20 e 8.07t 5.53 10 13 e 4.89t 0.421 [L 11 + L 12 G(t)] 1 όπου ο 2 2 πίνακας W := [L 11 + L 12 G(t)] 1 έχει τα παρακάτω στοιχεία w 11 = (8.5 10 76 e 8.1t + 5.1 10 84 e 4.9t 2 10 96 ) (2.4 10 76 e 8.1t 2.4 10 84 e 4.9t 2.5 10 70 e 9.8t 1.1 10 73 e 9.8t + 2.4 10 32 e 13t 3.1 10 44 e 6.6t + 1.5 10 90 e 1.7t + 1.1 10 96 ) 1 w 12 = (2.1 10 76 e 8.1t + 5.9 10 84 e 4.9t + 2.3 10 96 ) (2.4 10 76 e 8.1t 2.4 10 84 e 4.9t 2.5 10 70 e 9.8t 1.1 10 73 e 9.8t + 2.4 10 32 e 13t 3.1 10 44 e 6.6t + 1.5 10 90 e 1.7t + 1.1 10 96 ) 1 w 21 = (1.6 10 90 e 1.7t 1.2 10 85 e 4.9t + 2.9 10 96 ) (2.4 10 76 e 8.1t 2.4 10 84 e 4.9t 2.5 10 70 e 9.8t 1.1 10 73 e 9.8t + 2.4 10 32 e 13t 3.1 10 44 e 6.6t + 1.5 10 90 e 1.7t + 1.1 10 96 ) 1 w 22 = (2.9 10 84 e 4.9t 1.8 10 90 e 1.7t + 7.2 10 95 ) (2.4 10 76 e 8.1t 2.4 10 84 e 4.9t 2.5 10 70 e 9.8t 1.1 10 73 e 9.8t + 2.4 10 32 e 13t 3.1 10 44 e 6.6t + 1.5 10 90 e 1.7t + 1.1 10 96 ) 1

Κεφάλαιο 4 Η αλγεβρική εξίσωση Riccati και το ΓΤΠ ρύθμισης άπειρου χρονικού ορίζοντα Το κεφάλαιο αυτό παρέχει μια επισκόπηση των βασικών θεωρητικών ιδιοτήτων που εμφανίζουν οι αλγεβρικές εξισώσεις πινάκων Riccati, καθώς και την περιγραφή των βασικών εργαλείων για τον σχεδιασμό και την ανάλυση αλγορίθμων για τις λύσεις των εξισώσεων αυτών. Αρχικά περιγράφεται η συσχέτιση μεταξύ αναλλοίωτων ή deflating υποχώρων πινάκων ή πρωτοβάθμιων πολυωνυμικών πινάκων αντίστοιχα και των αλγεβρικών εξισώσεων Riccati. Στη συνέχεια παραθέτονται φασματικές ιδιότητες των λύσεων των αλγεβρικών εξισώσεων, με ιδιαίτερη αναφορά στις κρίσιμες και στις ακραίες λύσεις. Τέτοιου είδους λύσεις παρουσιάζουν υπολογιστικά προβλήματα, τα οποία μπορούν να αντιμετωπιστούν με την εφαρμογή διάφορων τεχνικών ολίσθησης. Το κεφάλαιο ολοκληρώνεται με αναφορά σε αποτελέσματα διαταραχής της αλγεβρικής ε- ξίσωσης Riccati. 4.1 ΓΤΠΡ για άπειρο χρονικό ορίζοντα Σε αυτή την ενότητα εξετάζεται το ΓΤΠΡ για ένα γραμμικό χρονικά αμετάβλητο σύστημα. Εστω το σύστημα ẋ(t) = Ax(t) + Bu(t) (4.1) 29

ΚΕΦΑΛΑΙΟ 4. ΑΛΓΕΒΡΙΚΗ ΕΞΙΣΩΣΗ RICCATI (CARE) 30 και το συναρτησιακό κόστους J = 1 2 0 [x (t)qx(t) + u (t)ru(t)]dt (4.2) όπου x(t) το n-τάξης διάνυσμα κατάστασης, u(t) το r-τάξης διάνυσμα ελέγχου, A R n n ο πίνακας κατάστασης, B R r r ο πίνακας ελέγχου, ο Q είναι ένας n n συμμετρικός θετικά ημιορισμένος πίνακας και ο R είναι ένας r r συμμετρικός θετικά ορισμένος πίνακας. Παρατηρείται ότι στο σύστημα με άπειρο χρονικό ορίζοντα δεν έχει κάποιο φυσικό νόημα να συμπεριφθεί στο συναρτησιακό κόστους (4.2), ο όρος τελικού κόστους x (t f )F (x(t f ))x(t f ). Επίσης σε άπειρο χρονικό ορίζοντα το σύστημα (4.1) πρέπει να είναι ελέγξιμο. Η συνθήκη αυτή για ελεγξιμότητα του συστήματος απαιτεί ο πίνακας [B AB... A n 1 B] να είναι μη ιδιάζων ή ισοδύναμα να έχει n γραμμικά ανεξάρτητα διανύσματα στήλες. Η ελεγξιμότητα εγγυάται ότι το βέλτιστο κόστος είναι πεπερασμένη ποσότητα. Από την άλλη αν το σύστημα δεν είναι ελέγξιμο και κάποια (ή όλες) από τις μη ελέγξιμες καταστάσεις του είναι μη ευσταθής, τότε το συναρτησιακό κόστους γίνεται άπειρο. Σε τέτοιες περιπτώσεις δεν μπορούμε να διακρίνουμε τον βέλτιστο έλεγχο από άλλους ελέγχους. Αντί του ισχυρισμού ότι το σύστημα είναι ελέγξιμο, μπορούμε να απαιτήσουμε ότι το σύστημα (4.1) είναι σταθεροποήσιμο. Οπως προηγουμένως, στην περίπτωση πεπερασμένου χρονικού ορίζοντα συστήματος, η διαδικασία που ακολουθείται είναι παρόμοια. Μέσω της αρχής του ελαχίστου του Pontryagin φτάνουμε στον κλειστού βρόχου(closed-loop) βέλτιστο έλεγχο και στην αντίστοιχη εξίσωση Riccati. Παρατηρείται όμως ότι η οριακή συνθήκη δίνεται ως P (t f ) = 0, επειδή F (t f ) = 0. Σε αυτήν την περίπτωση ο πίνακας P (t) προσεγγίζει έναν πεπερασμένο σταθερό πίνακα P, δηλαδή ισχύει lim tf P (t) = P, όπου P είναι ένας n n συμμετρικός, θετικά ορισμένος, σταθερός πίνακας. Ο πίνακας αυτός είναι λύση της μη γραμμικής, αλγεβρικής εξίσωσης πινάκων Riccati (ARE) P = 0 = P A A P Q + P BR 1 B P (4.3)

ΚΕΦΑΛΑΙΟ 4. ΑΛΓΕΒΡΙΚΗ ΕΞΙΣΩΣΗ RICCATI (CARE) 31 Μια άλλη, πιο βολική μορφή της παραπάνω εξίσωσης είναι η P A + A P + Q P BR 1 B P = 0 (4.4) Η παραπάνω εξίσωση έχει μελετηθεί αναλυτικά στη διάρκεια των προηγούμενων 50 χρόνων. Είναι ευρύτερα γνωστό ότι μπορεί να έχει διάφορες λύσεις, με κάποιες από αυτές να είναι πραγματικές λύσεις και κάποιες μιγαδικές. Επίσης μπορεί να έχει συμμετρικές αλλά και ερμιτιανές λύσεις. Βεβαίως είναι πιθανό να μην έχει καμία λύση αλλά να έχει και άπειρες λύσεις. Εξαιτίας του φυσικού προβλήματος από το οποίο εξετάζουμε την εξίσωση αυτή, δηλαδή του προβλήματος του βελτίστου ελέγχου, ενδιαφερόμαστε μόνο για μη αρνητικές λύσεις. 4.2 Παράδειγμα ενός συστήματος ανάδρασης Στο παρακάτω παράδειγμα [4] μελετάται η κίνηση του αεροσκάφους Harrier jump set της εικόνας 4.1. Το αεροσκάφος αυτό έχει την δυνατότητα της κάθετης απογείωσης, ανακατευθύνοντας την ώθηση προς τα κάτω και χρησιμοποιώντας μικρότερους προωθητέρες ελιγμών που είναι τοποθετημένοι στα φτερά του. Οι δυνάμεις ώθησης αναλύονται σε ένα ζεύγος δυνάμεων F 1 και F 2 οι οποίες δρουν σε απόσταση r κάτω από το αεροσκάφος. Η τριάδα (x, y, θ) συμβολίζει την θέση και τον προσανατολισμό του κέντρου μάζας του αεροσκάφους. Εστω m η μάζα του αεροσκάφους, J η ροπή αδράνειας, g η σταθερά της βαρύτητας και c ο συντελεστής απόσβεσης. Τότε οι εξισώσεις κίνησης δίνονται από τους τύπους mẍ = F 1 cos θ F 2 sin θ cẋ mÿ = F 1 sin θ + F 2 cos θ mg cẏ (4.5) J θ = rf 1 Οι εξισώσεις αυτές περιγράφουν την κίνηση του αεροσκάφους ως σύστημα τριών διαφορικών εξισώσεων δεύτερης τάξης. Θέτοντας ως διάνυσμα κατάστασης το z(x, y, θ, ẋ, ẏ, θ) και εισόδου το u = (F 1, F 2 ), η

ΚΕΦΑΛΑΙΟ 4. ΑΛΓΕΒΡΙΚΗ ΕΞΙΣΩΣΗ RICCATI (CARE) 32 Σχήμα 4.1: Το στρατιωτικό αεροσκάφος Harrier AV-8B (a) ανακατευθύνει την ώθηση του κινητήρα του προς τα κάτω, έτσι ώστε να πετάει πάνω από το έδαφος. Ποσότητα αέρα εκτρέπεται προς τα ακροπτερύγια, επιτρέποντας έτσι στο αεροσκάφος να κάνει μανούβρες. Οπως φαίνεται στο (b) η ολική ώθηση στο αεροσκάφος μπορεί να αναλυθεί σε μια οριζόντια δύναμη F 1 και σε μια κάθετη δύναμη F 2, που δρουν σε απόσταση r από το κέντρο μάζας του. state-space αναπαράσταση του συστήματος δίνεται ως z 4 0 z 5 0 dz dt = z 6 0 g sin θ c z + m 4 1 cos θf m 1 1 sin θf m 2 g cos θ c z m 5 1 sin θf m 1 + 1 cos θf m 2 0 r J F 1, όπου z i συμβολίζει την i συντεταγμένη του διανύσματος z. Οι παράμετροι του συστήματος δίνονται ως m = 4 kg, J = 0.0475 kg m 2, r = 0.25 m, g = 9.81 m/s 2, c = 0.05 N s/m, οι οποίες αντιστοιχούν σε ένα κλιμακωμένο μοντέλο (scaled model) του συστήματος. Το σημείο ισορροπίας του συστήματος δίνεται για F 1 = 0, F 2 = mg, θέτοντας ẋ = ẏ, = θ = 0 και διαλέγοντας θ = 0. Ετσι λοιπόν προκύπτει το σημείο z e = (x e, y e, 0, 0, 0, 0). Η γραμμικοποίηση του μοντέλου κοντά στο σημείο ισορροπίας προκύπτει ως 0 0 0 1 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 1 0 0 A = 0 0 g c, B = 0 0 1 m m 0 0 0 0 1 0 m m 0 0 0 0 0 0 r 0 J

ΚΕΦΑΛΑΙΟ 4. ΑΛΓΕΒΡΙΚΗ ΕΞΙΣΩΣΗ RICCATI (CARE) 33 C = 1 0 0 0 0 0, D = 0 2 2 0 1 0 0 0 0 Για να υπολογίσουμε τον γραμμικό τετραγωνικό ρυθμιστή (LQR) για το σύστημα, γράφουμε το συναρτησιακό κόστους ως J = 0 (z Qz + υ Rυ)dt, όπου z = z z e και υ = u u e. Χρησιμοποιούνται οι διαγώνιοι πίνακες στάθμισης σφάλματος και ελέγχου 1 0 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 0 Q =, R = 1 0. 0 0 0 1 0 0 0 1 0 0 0 0 1 0 0 0 0 0 0 1 Χρησιμοποιώντας την συνάρτηση lqr του MATLAB προκύπτει ένας νόμος ανάδρασης της μορφής υ = Kz, από τον οποίο προκύπτει ο νόμος ανάδρασης για τις αρχικές μεταβλητές ως u = υ + u e = K(z z e ) + u e. Ο πίνακας ανάδραση δίνεται ως 1 K = 0 7.8582 1.6047 0 2.0689 0 1 0 0 2.9504 0 ενώ ο πίνακας λύση της Riccati ως 1.6147 0 2.0689 0.8010 0 0.2280 0 3.0004 0 0 4 0 2.0689 0 12.7640 3.0964 0 1.6401 P = 0.8010 0 3.0964 1.0785 0 0.3561 0 4 0 0 11.8017 0 0.2280 0 1.6401 0.3561 0 0.4100 Στο σχήμα 4.2 φαίνεται η βηματική απόκριση του αεροσκάφους κατά την επιθυμητή μετατόπιση του. Από το παράρτημα (b) του σχήματος γίνεται φανερό ότι η απόκριση μπορεί να ρυθμιστεί προσαρμόζοντας τα βάρη στο συναρτησιακό κόστους.

ΚΕΦΑΛΑΙΟ 4. ΑΛΓΕΒΡΙΚΗ ΕΞΙΣΩΣΗ RICCATI (CARE) 34 Σχήμα 4.2: Η βηματική απόκριση για το αεροσκάφος. Το γράφημα (a) δείχνει την θέση ως προς x και ως προς y του αεροσκάφους όταν έχει εντολή να μετακινηθεί κατά 1 μέτρο σε κάθε κατεύθυνση. Στο σχήμα (b) φαίνεται η κίνηση του κατά x για βάρη ελέγχου ρ = 1, 10 2, 10 4. Φαίνεται ότι η εισαγωγή μεγαλύτερων βαρών στον όρο εισόδων του συναρτησιακού κόστους J, προκαλεί βραδύτερη απόκριση. 4.3 Αναλλοίωτοι υποχώροι και αλγεβρική εξίσωση Riccati Ορισμός 16. Η αλγεβρική εξίσωση πινάκων Riccati (ARE): XA + A X + Q XSX = 0 (4.6) όπου A, Q, S C n n, S = BR 1 B και S = S, Q = Q ονομάζεται συνεχούς χρόνου αλγεβρική εξίσωση πινάκων Riccati ή για συντομία CARE. Ορισμός 17. Ο πίνακας H που ορίζεται ως H = A S (4.7) Q A είναι ο Hamiltonian πίνακας που αντιστοιχεί στην (4.6). Ο Hamiltonian πίνακας H παρουσιάζει την ακόλουθη ενδιαφέρουσα φασματική ιδιότητα. Θεώρημα 4.1. Για κάθε ιδιοτιμή λ του H, η λ είναι επίσης ιδιοτιμή του H ίδιας αλγεβρικής και γεωμετρικής πολλαπλότητας με την λ. Απόδειξη. Ορίζω τον 2n 2n πίνακα J = 0 I (4.8) I 0

ΚΕΦΑΛΑΙΟ 4. ΑΛΓΕΒΡΙΚΗ ΕΞΙΣΩΣΗ RICCATI (CARE) 35 όπου I συμβολίζει τον n n μοναδιαίο πίνακα. Εύκολα φαίνεται ότι J 1 HJ = JHJ = H, δηλαδή οι πίνακες H και H είναι όμοιοι, έχουν δηλαδή ίδιες ιδιοτιμές. Επειδή οι ιδιοτιμές του H είναι οι αντίθετες των ιδιοτιμών του H και οι μιγαδικές ιδιοτιμές εμφανίζονται σε συζυγή ζεύγη, το θεώρημα αποδείχτηκε. Ορισμός 18. Μία λύση X της CARE καλείται η λύση που σταθεροποιεί το σύστημα αν οι ιδιοτιμές του πίνακα A SX βρίσκονται στο αριστερό ημιεπίπεδο C <. Αναλόγως μια λύση X της CARE λέγεται η λύση που σχεδόν σταθεροποιεί το σύστημα αν οι ιδιοτιμές του A SX ανήκουν στο κλειστό αριστερό ημιεπίπεδο C. Συσχέτιση μεταξύ Hamiltonian πίνακα και εξισώσεων Riccati Τα παρακάτω θεωρήματα [11] μας δείχνουν ότι υπάρχει σημαντική συσχέτιση ανάμεσα στον Hamiltonian πίνακα (4.7) και στην CARE (4.6). Θεώρημα 4.2. Ενας πίνακας X αποτελεί λύση της CARE αν-ν οι στήλες του I X παράγουν έναν n-διάστατο αναλλοίωτο υποχώρο του Hamiltonian πίνακα H (4.7). Απόδειξη. Αποδεικνύουμε πρώτα ότι αν οι στήλες του I παράγουν έναν n-διάστατο X αναλλοίωτο υποχώρο του H, τότε ο X είναι μία λύση της CARE. Ας υποθέσουμε λοιπόν ότι υπάρχει n n πίνακας L έτσι ώστε: H I = I L X X Πολλαπλασιάζοντας από αριστερά και τις δυο πλευρές της παραπάνω ισότητας με τον πίνακα J 1, όπου J ο πίνακας της σχέσης (4.8) παίρνουμε την σχέση: J 1 H I = J 1 I L X X Παρατηρούμε ότι J 1 = 0 I, άρα η παραπάνω σχέση μας δίνει: I 0 Q A I = X L A S X I (4.9)

ΚΕΦΑΛΑΙΟ 4. ΑΛΓΕΒΡΙΚΗ ΕΞΙΣΩΣΗ RICCATI (CARE) 36 Πολλαπλασιάζοντας από αριστερά και τα δύο μέλη της (4.9) με XA + A X + Q XSX = 0, δείξαμε επομένως ότι ο X είναι μια λύση της CARE. ( I ) X έχουμε: Για να αποδείξουμε την αντίστροφη φορά της ισοδυναμίας μας, παρατηρούμε ότι αν ο X είναι μία λύση της CARE, τότε: H I = A SX (4.6) = A SX = I ( ) A SX, X Q A X X(A SX) X δηλαδή οι στήλες του I παράγουν έναν αναλλοίωτο υποχώρο του H. X Πόρισμα 4.1. Αν οι στήλες του X 1 παράγουν έναν n-διάστατο αναλλοίωτο X 2 υποχώρο του Hamiltonian πίνακα H που αντιστοιχεί στην CARE και X 1 είναι αντιστρέψιμος, τότε ο X = X 2 X1 1 είναι μία λύση της CARE. Απόδειξη. Ο χώρος που παράγεται από τις στήλες του X 1 ταυτίζεται με τον χώρο που παράγεται από τις στήλες του X 1 X1 1, ο οποίος ταυτίζεται με τον χώρο που X 2 παράγουν οι στήλες του I X 2 X1 1 Επομένως, σύμφωνα με το παραπάνω θεώρημα (4.2) συμπεραίνουμε ότι X = X 2 X1 1 είναι μια λύση της CARE. Σύμφωνα με το προηγούμενο πόρισμα, το μη γραμμικό πρόβλημα της εύρεσης της λύσης της CARE (4.6) ανάγεται στο γραμμικό πρόβλημα του υπολογισμού ενός αναλλοίωτου υποχώρου για τον πίνακα H. Το επόμενο θεώρημα υποδεικνύει ότι οι ιδιοτιμές του Hamiltonian πίνακα H σχετίζονται με τις ιδιοτιμές του πίνακα του συστήματος κλειστού βρόχου (closed-loop). Θεώρημα 4.3. Εστω X μία συμμετρική λύση της CARE. Τότε οι ιδιοτιμές του Hamiltonian πίνακα H είναι οι ιδιοτιμές του A BK, μαζί με τις ιδιοτιμές του πίνακα (A BK), όπου K = R 1 B X. X 2

ΚΕΦΑΛΑΙΟ 4. ΑΛΓΕΒΡΙΚΗ ΕΞΙΣΩΣΗ RICCATI (CARE) 37 Απόδειξη. Ορίζουμε T := I 0,όπου X και I είναι n n πίνακες. Τότε, X I T 1 HT = I 0 A S I 0 X I Q A X I = A SX S (XA + A X + Q XSX) (A SX) = A SX S 0 (A SX) Δηλαδή ο H είναι όμοιος με τον τελευταίο πίνακα. Επομένως οι ιδιοτιμές του H θα είναι οι ιδιοτιμές του A SX μαζί με τις ιδιοτιμές του (A SX). Παρατηρούμε ότι A SX S=BR 1 B = A BR 1 B X = A BK που μας δίνει το ζητούμενο αποτέλεσμα. Ορισμός 19. Ενας υποχώρος S καλείται J-ουδέτερος αν x, y S, x Jy = 0. Εύκολα διαπιστώνεται ότι ο πίνακας X είναι ερμιτιανός (X = X ) αν και μόνο αν [ I X ]J[ X I ] = 0, όπου J ο πίνακας (4.8). Επεται ότι αν ο S = Span ([ X I ]) είναι ένας αναλλοίωτος υποχώρος που σχετίζεται με την λύση X, τότε ο X είναι ερμιτιανός αν και μόνο αν ο S είναι J-ουδέτερος. Η γενικευμένη εξίσωση Riccati Η συνεχούς χρόνου αλγεβρική εξίσωση πινάκων Riccati θεωρείται μια ειδική περίπτωση μιας πιο γενικής κατηγορίας εξισώσεων, που ονομάζεται γενικευμένη συνεχούς χρόνου αλγεβρική εξίσωση πινάκων Riccati, για συντομία GCARE. Η γενικευμένη εξίσωση προκύπτει εάν εφαρμοστεί η αρχή του ελαχίστου του Pontryagin στο σύστημα Eẋ(t) = Ax(t) + Bu(t) y(t) = Cx(t), όπου E C n n. Η GCARE είναι μια εξίσωση της μορφής: Q + E XA + A XE E XSXE = 0 (4.10)

ΚΕΦΑΛΑΙΟ 4. ΑΛΓΕΒΡΙΚΗ ΕΞΙΣΩΣΗ RICCATI (CARE) 38 Εύκολα φαίνεται ότι αν dete 0, τότε η GCARE μπορεί να θεωρηθεί ως CARE πολλαπλασιάζοντας και τα δύο μέλη της (4.10) με (E ) 1 από αριστερά και με E 1 από δεξιά. Κατά αναλογία με τον Hamiltonian πίνακα της CARE, η (4.10) συσχετίζεται με τον 2n 2n πρωτοβάθμιο πολυωνυμικό πίνακα A S z E 0, (4.11) Q A 0 E θεωρώντας ότι dete 0. Τότε με ευθύ υπολογισμό αποδεικνύεται ότι αν ο X είναι μία λύση της GCARE (4.10), τότε ο χώρος που παράγεται από τον [ I XE ] είναι ελαττωμένος (deflating) υποχώρος για τον πρωτοβάθμιο πολυωνυμικό πίνακα (4.11) και ισχύει η παρακάτω σχέση A S I = E 0 I E 1 (A SXE) (4.12) Q A XE 0 E XE Αντίστροφα τώρα, αν U C n n είναι μη ιδιάζων πίνακας, V C n n και ο υποχώρος που παράγεται από τον [ U V ] είναι ελαττωμένος (deflating), τότε ο X = V (EU) 1 λύνει την GCARE (4.10). 4.4 Η συμμετρική θετικά ημιορισμένη λύση που σταθεροποιεί το σύστημα Η αλγεβρική συνεχούς χρόνου εξίσωση Riccati είναι πιθανόν να μην έχει μοναδική λύση, αλλά να παρουσιάζει μια ποικιλία λύσεων. Μπορεί ακόμη για κάποιους συντελεστές η εξίσωση να μην επιδέχεται καν λύση. Οπως έχουμε δει σε προηγούμενο κεφάλαιο, αρκετές εφαρμογές απαιτούν μια συμμετρική θετικά ημιορισμένη λύση της CARE που σταθεροποιεί το σύστημα. Σε αυτήν την ενότητα αναφέρεται μία αναγκαία και ικανή συνθήκη για ύπαρξη και μοναδικότητα μιας τέτοιας λύσης [11]. Θεωρώ στα παρακάτω ότι οι συντελεστές της CARE είναι πραγματικοί n n πίνακες. Θεώρημα 4.4 ( Υπαρξη και μοναδικότητα της λύσης που σταθεροποιεί το σύστημα). Εστω ότι R 0 και Q 0, Q 0. Τότε οι ακόλουθες συνθήκες είναι ισοδύναμες:

ΚΕΦΑΛΑΙΟ 4. ΑΛΓΕΒΡΙΚΗ ΕΞΙΣΩΣΗ RICCATI (CARE) 39 1. Η CARE: XA + A X + Q XBR 1 B X = 0 έχει μοναδική συμμετρική θετικά ημιορισμένη λύση που σταθεροποιεί το σύστημα. 2. Το ζεύγος (A, B) είναι σταθεροποιήσιμο και ο αντίστοιχος Hamiltonian πίνακας H δεν έχει φανταστικές ιδιοτιμές Απόδειξη. Πρώτα λαμβάνεται ως υπόθεση ότι η X είναι μια λύση της CARE που σταθεροποιεί το σύστημα. Αφού ο πίνακας X σταθεροποιεί το σύστημα, έπεται ότι ο πίνακας A SX είναι ευσταθής, δηλαδή ο πίνακας A BK είναι ευσταθής. Άρα έχω (A, B) σταθεροποιήσιμο. Επίσης από το θεώρημα (4.3) προκύπτει ότι ο H έχει n ευσταθείς ιδιοτιμές και άλλες n ιδιοτιμές με θετικό πραγματικό μέρος. Άρα ο H δεν έχει καμία ιδιοτιμή που να ανήκει στον άξονα των φανταστικών. Επειτα λαμβάνεται ως υπόθεση ότι ο H δεν έχει ιδιοτιμές που να ανήκουν στον άξονα των φανταστικών. Με την προϋπόθεση ότι (A, B) σταθεροποιήσιμο ζεύγος, θα αποδεικτεί ότι υπάρχει μοναδική λύση της CARE που σταθεροποιεί το σύστημα. Η απόδειξη είναι κατασκευαστική. Πρώτα από όλα, αφού (A, B) σταθεροποιήσιμο, και το (A, S) θα είναι σταθεροποιήσιμο. Επειδή ο H δεν έχει ιδιοτιμές στον άξονα των φανταστικών, σύμφωνα με το θεώρημα (4.3) θα έχει n ευσταθείς ιδιοτιμές. Τότε H X 1 = X 1 E (4.13) X 2 X 2 όπου E είναι ένας ευσταθής πίνακας και οι στήλες του X 1 αποτελούν τα ιδιοδιανύσματα του H που αντιστοιχούν στις ευσταθείς ιδιοτιμές του. 1) X 2 X 1 είναι συμμετρικός. Η σχέση (4.13) μπορεί να γραφτεί ως AX 1 SX 2 = X 1 E (4.14) X 2

ΚΕΦΑΛΑΙΟ 4. ΑΛΓΕΒΡΙΚΗ ΕΞΙΣΩΣΗ RICCATI (CARE) 40 και QX 1 A X 2 = X 2 E (4.15) Πολλαπλασιάζοντας από αριστερά και τις δύο πλευρές τις (4.14) με X 2 έχουμε X 2 AX 1 X 2 SX 2 = X 2 X 1 E (4.16) Παίρνοντας τον ανάστροφο και στις δυο πλευρές της (4.15) προκύπτει X 2 A = X 1 Q E X 2 Πολλαπλασιάζοντας από δεξιά την τελευταία εξίσωση με X 1 έχω E X 2 X 1 = X 2 AX 1 X 1 QX 1 (4.17) Αντικαθιστώντας την (4.16) στην (4.17) προκύπτει E X 2 X 1 + X 2 X 1 E = X 2 SX 2 X 1 QX 1 (4.18) Επειδή οι πίνακες Q και S είναι συμμετρικοί, το δεξί μέλος της παραπάνω εξίσωσης είναι συμμετρικό. Άρα και το αριστερό. Δηλαδή, E X 2 X 1 + X 2 X 1 E = X 1 X 2 E + E X 1 X 2 ή αλλιώς E ( X 2 X 1 X 1 X 2 ) + ( X 2 X 1 X 1 X 2 ) E = 0 Επειδή ο πίνακας E είναι ευσταθής, η παραπάνω εξίσωση Lyapunov έχει μοναδική λύση. Άρα προκύπτει ότι η μόνη λύση της είναι η X2 X 1 X1 X 2 = 0. Δηλαδή X2 X 1 = X1 X 2, άρα ο πίνακας X2 X 1 είναι συμμετρικός. 2) X 1 είναι αντιστρέψιμος. Ας υποθέσουμε ότι δεν είναι αντιστρέψιμος. Τότε θα υπάρχει διάνυσμα d 0 έτσι ώστε X 1 d = 0 (4.19) Τώρα πολλαπλασιάζοντας τον ανάστροφο της σχέσης (4.14) με d από αριστερά κι έπειτα με X 2 d από δεξιά προκύπτει d X2 SX 2 d = d E X1 X 2 d + d X1 A X 2 d