ΠΑΝΕΠΙΣΤΗΜΙΟ ΠΑΤΡΩΝ ΤΜΗΜΑ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΤΕΧΝΟΛΟΓΙΑΣ ΥΠΟΛΟΓΙΣΤΩΝ ΤΟΜΕΑΣ: ΣΥΣΤΗΜΑΤΩΝ ΗΛΕΚΤΡΙΚΗΣ ΕΝΕΡΓΕΙΑΣ ΕΡΓΑΣΤΗΡΙΟ ΠΑΡΑΓΩΓΗΣ, ΜΕΤΑΦΟΡΑΣ, ΔΙΑΝΟΜΗΣ ΚΑΙ ΧΡΗΣΙΜΟΠΟΙΗΣΗΣ ΗΛΕΚΤΡΙΚΗΣ ΕΝΕΡΓΕΙΑΣ Διπλωματική Εργασία της φοιτήτριας του Τμήματος Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών της Πολυτεχνικής Σχολής του Πανεπιστημίου Πατρών Κλάδου Αναστασία του Ναπολέοντα Αριθμός Μητρώου: 583 Θέμα «Προσαρμοστικός έλεγχος για μη γραμμικά συστήματα με αβεβαιότητα και διαταραχές» Επιβλέπων Αλεξανδρίδης Αντώνιος, Καθηγητής Αριθμός Διπλωματικής Εργασίας: Πάτρα, Φεβρουάριος 03
ΠΙΣΤΟΠΟΙΗΣΗ Πιστοποιείται ότι η Διπλωματική Εργασία με Θέμα «Προσαρμοστικός έλεγχος για μη γραμμικά συστήματα με αβεβαιότητα και διαταραχές» Της φοιτήτριας του Τμήματος Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών Κλάδου Αναστασίας του Ναπολέοντα Αριθμός Μητρώου : 583 Παρουσιάστηκε δημόσια και εξετάστηκε στο Τμήμα Ηλεκτρολόγων Μηχανικών και Τεχνολογίας Υπολογιστών /0/03 Ο Επιβλέπων Ο Διευθυντής του Τομέα Αλεξανδρίδης Αντώνιος Καθηγητής Αλεξανδρίδης Αντώνιος Καθηγητής 3
Αριθμός Διπλωματικής Εργασίας: Θέμα: «Προσαρμοστικός έλεγχος για μη γραμμικά συστήματα με αβεβαιότητα και διαταραχές» Φοιτήτρια: Κλάδου Αναστασία Επιβλέπων: Αλεξανδρίδης Αντώνιος Περίληψη Η παρούσα διπλωματική εργασία ασχολείται με τη μελέτη και το σχεδιασμό ενός άμεσου προσαρμοστικού ελεγκτή, για μη γραμμικά συστήματα με αβεβαιότητα και εξωγενείς διαταραχές. Αρχικά παρουσιάζονται οι έννοιες του προσαρμοστικού ελέγχου, των μη γραμμικών συστημάτων και διερευνώνται οι έννοιες της ευστάθειας και των διαταραχών, με ιδιαίτερη έμφαση στην ευστάθεια κατά Lyapuov. Στη συνέχεια προτείνεται ένας προσαρμοστικός ελεγκτής για άμεσο προσαρμοστικό έλεγχο, προσαρμοστική ευστάθεια, απόρριψη διαταραχών και εκτέλεση εντολών, σε μη γραμμικά δυναμικά συστήματα πολλαπλών μεταβλητών, με αβεβαιότητα και εξωγενείς διαταραχές, ο οποίος εγγυάται μερική ασυμπτωτική ευστάθεια του συστήματος κλειστού βρόχου. Το προτεινόμενο πλαίσιο, ειδικεύεται περαιτέρω για τις περιπτώσεις όπου το μη γραμμικό σύστημα παρουσιάζεται σε κανονική μορφή, με ευσταθείς iput-to-tate iteral dyamic, έχει μια είσοδο ή έχει εξωγενείς L διαταραχές. Τέλος ο προτεινόμενος ελεγκτής εφαρμόζεται σε αρκετά πειραματικά συστήματα, καθώς και στον έλεγχο της αστάθειας θερμοακουστικής καύσης. 4
Abtract hi diploma thei feature the aalyi ad deig of a direct adaptive cotroller, for oliear ucertai ytem with exogeou diturbace. At firt, we itroduce the cocept of adaptive cotrol ad we uderlie it eed i moder applicatio. Alo, we iclude a brief preetatio of oliear ytem ad we iquire ito the theory of tabilizatio ad diturbace, with igificat emphai i Lyapuov method. Furthermore we develop a direct adaptive cotrol framework for adaptive tabilizatio, diturbace rejectio, ad commad followig of multivariable oliear ucertai dyamical ytem with exogeou diturbace, which guaratee partial aymptotic tability of the cloed-loop ytem. he propoed framework i further pecialized for the cae where the oliear ytem i repreeted i ormal form with iput-to-tate table iteral dyamic, ha igle-iput with ucertai dyamic, or exogeou L diturbace.fially we preet everal illutrative umerical example ad we apply our framework to the cotrol of thermoacoutic combutio itabilitie. 5
Ευχαριστίες Θα ήθελα να ευχαριστήσω τον επιβλέποντα καθηγητή κ. Αλεξανδρίδη Αντώνιο για την εποικοδομητική συνεργασία, και για την ευκαιρία που μου έδωσε να ασχοληθώ με ένα θέμα που ταιριάζει πλήρως στα ενδιαφέροντά μου. Η καθοδήγησή του, σε συνδυασμό με τις εύστοχες παρατηρήσεις του, ήταν ουσιαστική για να φέρω εις πέρας την παρούσα διπλωματική εργασία. Αφιερώνεται στην οικογένεια μου για την πολύτιμη στήριξη της συμβουλευτική, ηθική και οικονομική- κατά τα φοιτητικά μου χρόνια. Ιδιαίτερα στη μητέρα μου, που πάντα πιστεύει σε εμένα, ως ο πιο ένθερμός μου, υποστηρικτής! Σ ευχαριστώ 6
ΠΡΟΛΟΓΟΣ Στόχος αυτής της διπλωματικής εργασίας, είναι η παρουσίαση ενός μοντέλου άμεσου προσαρμοστικού ελέγχου για μη γραμμικά συστήματα, με αβεβαιότητα και εξωγενείς διαταραχές. Λαμβάνοντας υπόψιν την πολυπλοκότητα και την αρκετά αβέβαιη φύση των δυναμικών συστημάτων, δεν μας εκπλήσσει το γεγονός, ότι δεν υπάρχουν αξιόπιστα μοντέλα συστήματος για μηχανικές εφαρμογές υψηλών αποδόσεων. Μια λύση στο πρόβλημα αυτό μπορεί να δοθεί με την περαιτέρω μελέτη του τομέα προσαρμοστικού έλεγχου. Συγκεκριμένα, οι άμεσοι προσαρμοστικοί ελεγκτές ρυθμίζουν άμεσα τα κέρδη ανάδρασης, ώστε να διατηρηθεί η ευστάθεια κλειστού βρόχου και να βελτιωθεί η απόδοση, παρά την εμφάνιση αβεβαιότητας συστήματος, και τυχών μεταβολών του μοντέλου συστήματος. Με έναν τέτοιο προσαρμοστικό ελεγκτή, ασχολούμαστε στην παρούσα εργασία. Αρχικά, αναπτύσσεται ένα πλαίσιο αναφοράς, βασισμένο στον άμεσο προσαρμοστικό έλεγχο κατά Lyapuov, το όποιο απαιτεί μια προσαρμοσμένη συνθήκη στη διαταραχή του συστήματος, και εγγυάται μερικώς ασυμπτωτική ευστάθεια του συστήματος κλειστού βρόχου. Το πλαίσιο αυτό το διερευνούμε περαιτέρω για τις περιπτώσεις συστήματος με μια είσοδο και αβέβαια δυναμική, καθώς και για μη γραμμικά συστήματα με L διαταραχές, και εν τέλει το εφαρμόζουμε σε πειραματικά και πραγματικά μοντέλα συστημάτων. 7
ΠΕΡΙΕΧΟΜΕΝΑ ΠΡΟΛΟΓΟΣ... 7 ΕΙΣΑΓΩΓΗ... ΚΕΦΑΛΑΙΟ ΕΙΣΑΓΩΓΗ ΣΤΟΝ ΠΡΟΣΑΡΜΟΣΤΙΚΟ ΕΛΕΓΧΟ, ΘΕΩΡΗΤΙΚΗ ΠΡΟΣΕΓΓΥΣΗ....3. Η έννοια του προσαρμοστικού ελέγχου...3. Η ανάγκη για προσαρμοστικό έλεγχο..4.3 Μη γραμμικά συστήματα. 6.4 Ευστάθεια και η έννοια της διαταραχής..8.5 Θεωρήματα ευστάθειας..9.6. Ευστάθεια κατά Lyapuov..7Ανασκόπιση κεφαλαίου 7 ΚΕΦΑΛΑΙΟ ΠΡΟΣΑΡΜΟΣΤΙΚΟΣ ΕΛΕΓΧΟΣ ΜΗ ΓΡΑΜΜΙΚΩΝ ΣΥΣΤΗΜΑΤΩΝ ΜΕ ΔΙΑΤΑΡΑΧΕΣ 9. Εισαγωγή 9. Προσαρμοστικός έλεγχος μη γραμμικών συστημάτων με εξωγενείς διαταραχές 30.3 Ειδίκευση στα συστήματα μιας εισόδου με αβέβαια δυναμική....40.4προσαρμοστικος έλεγχος για μη γραμμικά συστήματα με L διαταραχές....45.5 Σύνοψη κεφαλαίου. 50 8
ΚΕΦΑΛΑΙΟ 3 ΠΑΡΑΔΕΙΓΜΑΤΑ ΕΦΑΡΜΟΓΗΣ ΠΡΟΣΑΡΜΟΣΤΙΚΟΥ ΕΛΕΓΧΟΥ...5 3. Εισαγωγή 5 Παράδειγμα 3... 5 Παράδειγμα 3... 57 Παράδειγμα 3.3.. 6 Παράδειγμα 3.4.. 65 Παράδειγμα 3.5.. 7 Παράδειγμα 3.6.. 74 3. Σύνοψη κεφαλαίου.8 ΚΕΦΑΛΑΙΟ 4 ΠΡΟΣΑΡΜΟΣΤΙΚΟΣ ΕΛΕΓΧΟΣ ΓΙΑ ΑΣΤΑΘΕΙΕΣ ΘΕΡΜΟΑΚΟΥΣΤΙΚΗΣ ΚΑΥΣΗΣ 83 4. Εισαγωγή 83 4. Εφαρμογή προτεινόμενου ελεγκτή για καταστολή θερμοακουστικής αστάθειας.. 84 4.3 Σύνοψη κεφαλαίου. 97 ΚΕΦΑΛΑΙΟ 5 5. ΣΥΜΠΕΡΑΣΜΑΤΑ ΚΑΙ ΣΥΝΟΨΗ ΔΙΠΛΩΜΑΤΙΚΗΣ ΕΡΓΑΣΙΑΣ.. 99 ΒΙΒΛΙΟΓΡΑΦΙΑ...0 9
ΚΕΦΑΛΑΙΟ 6 6. ΠΑΡΑΡΤΗΜΑ....04 6. Υλοποίηση Παραδείγματος 3......05 6. Υλοποίηση Παραδείγματος 3.. 06 6.3 Υλοποίηση Παραδείγματος 3.3. 07 6.4 Υλοποίηση Παραδείγματος 3.4. 08 6.5 Υλοποίηση Παραδείγματος 3.5. 09 6.6 Υλοποίηση Παραδείγματος 3.6. 0 6.0 Υλοποίηση προτεινόμενου ελεγκτή για καταστολή θερμοακουστικής αστάθειας... 0
ΕΙΣΑΓΩΓΗ Στο Κεφάλαιο παρουσιάζεται μια προεπισκόπηση της έννοιας του προσαρμοστικού ελέγχου. Διερευνούμε την έννοια της ευστάθειας και τον συνδυασμό αυτής με τις διαταραχές. Διατυπώνουμε και ορίζουμε τα διαφορετικά είδη ευστάθειας, ενώ εμβαθύνουμε περισσότερο στο θέμα της ευστάθειας κατά Lyapuov. Τέλος περιγράφουμε τις βασικές αρχές των μη γραμμικών συστημάτων. Στο Κεφάλαιο προτείνεται ένας προσαρμοστικός ελεγκτής για άμεσο προσαρμοστικό έλεγχο, προσαρμοστική ευστάθεια, απόρριψη διαταραχών και εκτέλεση εντολών, σε μη γραμμικά δυναμικά συστήματα πολλαπλών μεταβλητών, με αβεβαιότητα και εξωγενείς διαταραχές. Η σχεδίασή του, η οποία βασίζεται στη μεθοδολογία Lyapuov, εγγυάται μερική ασυμπτωτική ευστάθεια του συστήματος κλειστού βρόχου, με εξωγενείς, φραγμένες, διαταραχές. Στην περίπτωση των διαταραχών L φραγμένης ενέργειας, η προτεινόμενη προσέγγιση, εγγυάται μια συνθήκη μη επεκτασιμότητας (φραγμένου κέρδους) για τη μη γραμμική απεικόνιση εισόδου-εξόδου του κλειστού βρόχου. Επιπρόσθετα, αν το μη γραμμικό σύστημα αναπαρίσταται σε κανονική μορφή με ευσταθείς iput-to-tate iteral dyamic, τότε δείχνουμε ότι μπορούμε να κατασκευάσουμε, μη γραμμικούς προσαρμοστικούς ελεγκτές, χωρίς να απαιτείται η γνώση της δυναμικής του συστήματος, ή των διαταραχών του συστήματος. Στο Κεφάλαιο 3 χρησιμοποιούμε τη θεωρητική προσέγγιση που εισάγαμε στο ο Κεφάλαιο, αναπτύσσοντας 6 διευκρινιστικά, αριθμητικά παραδείγματα μη γραμμικών συστημάτων στα οποία εξετάζουμε την αποδοτικότητα του προσαρμοστικού ελεγκτή. Στο Κεφάλαιο 4 εφαρμόζουμε το προτεινόμενο πλαίσιο ώστε να ελέγξουμε την αστάθεια θερμοακουστικής καύσης. Επίσης, επιθυμούμε να επιδείξουμε την αποτελεσματικότητα του προτεινόμενου πλαισίου για άμεση προσαρμοστική ευστάθεια και παρακολούθηση. Στο Κεφάλαιο 5 περιλαμβάνεται μια σύνοψη της διπλωματικής εργασίας και συλλέγονται τα τελικά συμπεράσματα. Στο Κεφάλαιο 6 παρουσιάζεται το παράρτημα της εργασίας, όπου περιλαμβάνονται οι κώδικες που χρησιμοποιήθηκαν για την προσομοίωση, καθενός από τα συστήματα. Οι προσομοιώσεις έγιναν σε περιβάλλον Matlab/Simulik.
Κεφάλαιο Εισαγωγή στον προσαρμοστικό έλεγχο, θεωρητική προσέγγιση.. Η έννοια του προσαρμοστικού ελέγχου Ο προσαρμοστικός έλεγχος ορίζεται ως το είδος ελέγχου που χρησιμοποιείται από έναν ελεγκτή, ο όποιος πρέπει να προσαρμοστεί, σε ένα σύστημα με παραμέτρους που διαφέρουν, ή διαφοροποιούνται, ή περιέχουν αβεβαιότητα. Ήδη από τα μέσα του 0 ου αιώνα αναγνωρίστηκε η ανάγκη για κάποιο είδος ελέγχου, ο όποιος θα είναι ικανός να προσαρμοστεί στις αλλαγές που συμβαίνουν, εξαιτίας αλλαγών στη δυναμική της διαδικασίας ελέγχου ή λόγω διαταραχών. Οι παράμετροι της διαδικασίας μπορεί να διαφοροποιηθούν λόγω μη γραμμικών ενεργοποιητών, αλλαγές στις συνθήκες λειτουργίας της διαδικασίας ή σε μη στατικές διαταραχές που επιδρούν στη διαδικασία. Ένας συμβατικός ελεγκτής με σταθερές παραμέτρους δεν είναι ικανός να προσαρμοστεί στις αλλαγές, αν και η ανάδραση αυτή καθεαυτή μειώνει την ευαισθησία στη μεταβολή των παραμέτρων. Τη δεκαετία του 950 έγινε μια πρώτη εκτενής έρευνα πάνω στον προσαρμοστικό έλεγχο, σκεπτόμενοι τον σχεδιασμό αυτόματων πιλότων για αεροσκάφη υψηλών επιδόσεων, τα όποια λειτουργούσαν σε εβραίο φάσμα πολλών διαφορετικών υψόμετρων και ταχυτήτων, και έτσι υφίσταντο μεγάλες μεταβολές παραμέτρων. Ο προσαρμοστικός έλεγχος προτάθηκε ως ένας 3
τρόπος για να ρυθμιστούν αυτόματα οι παράμετροι ελέγχου, αναλογιζόμενοι τις αλλαγές στη δυναμική των αεροσκαφών. Δυστυχώς λόγο άτυχων συγκυριών και έλλειψης διορατικότητας, το ενδιαφέρον στράφηκε σε άλλους τομείς. Έτσι τις δεκαετίες 950-960 αναπτύχθηκαν έρευνες πάνω στη θεωρία ελέγχου, και παρουσιάστηκαν οι έννοιες χώρου κατάστασης (tate pace) και θεωρίας ευστάθειας. Επίσης είχαμε σημαντικά αποτελέσματα στη θεωρία στοχαστικού ελέγχου. Στα τέλη τις δεκαετίας του 970, με τις αρχές του 980 παρουσιάστηκαν αποδείξεις για την ευστάθεια προσαρμοστικών συστημάτων, όμως υπό πολύ περιορισμένες υποθέσεις. Μόνο τις τελευταίες δεκαετίες αναπτύχτηκε μια συνεκτική θεωρία προσαρμοστικού ελέγχου, με χρήση διαφόρων εργαλείων από τη θεωρία μη γραμμικού ελέγχου. Αυτή η θεωρητική πρόοδος, σε συνδυασμό με τη διαθεσιμότητα φθηνής υπολογιστικής δυνατότητας, οδήγησε σε πολλές πρακτικές εφαρμογές όπως ο χειρισμός ρομποτικών βραχιόνων, ο έλεγχος αεροσκαφών και πυραύλων, χημικές διεργασίες, συστήματα ενέργειας, πλοήγηση πλοίων και στη βίο-μηχανική... Η ανάγκη για προσαρμοστικό έλεγχο Πολλά από τα δυναμικά συστήματα που προσπαθούμε να ελέγξουμε, περιλαμβάνουν αργά μεταβαλλόμενες αβέβαιες παραμέτρους. Για παράδειγμα ρομποτικοί βραχίονες πιθανόν να μεταφέρουν μεγάλα αντικείμενα με άγνωστες παραμέτρους αδράνειας, ενώ πυροσβεστικά αεροσκάφη μπορεί να υφίστανται μεγάλες αλλαγές μάζας, καθώς φορτώνουν και αδειάζουν μεγάλες ποσότητες νερού. Ο προσαρμοστικός έλεγχος, βασικά είναι μια προσέγγιση ελέγχου αυτών των συστημάτων. Ο βασικός στόχος είναι η διατήρηση σταθερής της απόδοσης του συστήματος παρουσία αβεβαιότητας, ή αγνώστων μεταβολών στις παραμέτρους του συστήματος. Εφόσον η αβεβαιότητα ή η μεταβολή των παραμέτρων συμβαίνει σε πολλά πρακτικά προβλήματα, ο προσαρμοστικός έλεγχος βασικά είναι μια προσέγγιση ελέγχου αυτών των συστημάτων, όπως για παράδειγμα ρομποτικός χειρισμός, πλοήγηση πλοίου, έλεγχος αεροσκάφους και διαδικασία ελέγχου. Η βασική ιδέα του προσαρμοστικού ελέγχου είναι η o-lie εκτίμηση των αβέβαιων παραμέτρων του μοντέλου, βασιζόμενη στις μετρήσεις 4
του συστήματος, και στη χρησιμοποίηση των εκτιμούμενων παραμέτρων για το σχεδιασμό της εισόδου ελέγχου. Έτσι, ένα προσαρμοστικό σύστημα ελέγχου μπορεί να θεωρηθεί ένα σύστημα με o-lie εκτίμηση παραμέτρων. Καθώς τα προσαρμοστικά συστήματα ελέγχου είναι κατά βάση μη γραμμικά, είτε εφαρμόζονται σε γραμμικά είτε σε μη γραμμικά μοντέλα, η ανάλυση και ο σχεδιασμός τους συνδέεται άμεσα με τη θεωρία των μη γραμμικών συστημάτων και κυρίως τη θεωρία Lyapuov, τις οποίες θα αναλύσουμε επιγραμματικά σε παρακάτω κεφάλαια. Υπάρχουν δύο βασικές προσεγγίσεις για τη σχεδίαση ενός προσαρμοστικού ελεγκτή: ο προσαρμοστικός έλεγχος με μοντέλο αναφοράς (model-referece adaptive cotrol method - MRAC) και ο αυτοσυντονιζόμενος ελεγκτής (elf-tuig method-sc). Σχηματικά το διάγραμμα προσαρμοστικού ελέγχου με μοντέλο αναφοράς φαίνεται στο Σχήμα.. Ο προσαρμοστικός έλεγχος με μοντέλο αναφοράς περιλαμβάνει 4 μέρη: ένα μοντέλο που περιέχει άγνωστες παραμέτρους, ένα μοντέλο αναφοράς που προσδιορίζει την επιθυμητή έξοδο του συστήματος, ένα νόμο ελέγχου ανάδρασης με προσαρμοζόμενες παραμέτρους και έναν μηχανισμό προσαρμογής για την o-lie ενημέρωση των παραμέτρων αυτών. Σχήμα.: Προσαρμοστικός έλεγχος με μοντέλο αναφοράς Η δεύτερη βασική προσαρμοστική μέθοδος ελέγχου, η οποία καλείται αυτοσυντονιζόμενος ελεγκτής (elf-tuig cotrol), περιλαμβάνει έναν κατάλληλο εκτιμητή ο οποίος εκτιμά τις αβέβαιες παραμέτρους του μοντέλου και προσαρμόζει κατάλληλα τον ελεγκτή. Η βασική ιδέα του αυτοσυντονιζόμενου ελεγκτή είναι η εξής: σε κάθε χρονική στιγμή ο εκτιμητής στέλνει στον ελεγκτή μια ομάδα των εκτιμούμενων παραμέτρων 5
του συστήματος, οι οποίες προσδιορίζονται με βάση τις μετρήσεις της εισόδου u και της εξόδου y του αβέβαιου συστήματος. Ο υπολογιστής υπολογίζει τις αντίστοιχες παραμέτρους του ελεγκτή ο οποίος δημιουργεί την είσοδο ελέγχου η οποία προκαλεί μια νέα έξοδο στο σύστημα και ο κύκλος επαναλαμβάνεται. Η σχηματική απεικόνιση αυτού του ελεγκτή φαίνεται στο Σχήμα.. Σχήμα.: Αυτοσυντονιζόμενος ελεγκτής.3. Μη γραμμικά συστήματα Με τον όρο μη γραμμικά συστήματα θεωρούμε κάθε σύστημα που περιλαμβάνει τουλάχιστον ένα μη γραμμικό όρο στις δυναμικές εξισώσεις που το περιγράφουν. Η ύπαρξη μη γραμμικών στοιχείων δυσκολεύει τόσο την ανάλυση της ευστάθειας όσο και την σχεδίαση κατάλληλου νόμου ελέγχου. Οι μη γραμμικότητες χωρίζονται σε δύο είδη: τις υπάρχουσες και τις επιβαλλόμενες. Οι υπάρχουσες είναι αυτές που σχετίζονται με τα φυσικά χαρακτηριστικά του συστήματος, όπως για παράδειγμα με την κίνηση. Παραδείγματα υπαρχουσών μη γραμμικοτήτων περιλαμβάνονται σε περιστροφικές κινήσεις ή σε τριβές Coulomb κατά την επαφή δύο επιφανειών. Συνήθως, τέτοιες μη γραμμικότητες έχουν ανεπιθύμητα αποτελέσματα και τα συστήματα ελέγχου πρέπει να τις αντισταθμίσουν κατάλληλα. Αντίθετα, οι επιβαλλόμενες μη γραμμικότητες προκαλούνται με τεχνητό τρόπο από τον μηχανικό ελέγχου. Παραδείγματα επιβαλλόμενων μη γραμμικοτήτων είναι η εφαρμογή μη γραμμικών ελεγκτών, οι προσαρμοστικοί και οι βέλτιστοι bagbag νόμοι ελέγχου. Επιπλέον, οι μη γραμμικότητες χωρίζονται και με βάση τις μαθηματικές τους ιδιότητες ως συνεχείς ή ασυνεχείς. Επειδή οι ασυνεχείς μη γραμμικότητες 6
δεν μπορούν να προσεγγιστούν από γραμμικές συναρτήσεις, συνήθως ονομάζονται και ισχυρές μη γραμμικότητες. Οι ισχυρές μη γραμμικότητες (πχ. υστέρησης) εμφανίζονται συχνά στα συστήματα ελέγχου, ανεξάρτητα από το αν η περιοχή λειτουργίας τους είναι μικρή ή όχι. Στην περίπτωση μικρής περιοχής λειτουργίας, η προσέγγιση του μη γραμμικού συστήματος από γραμμικό εξαρτάται από το μέγεθος (πλάτος) αυτής της μη γραμμικότητας. Επειδή τα μη γραμμικά συστήματα μπορεί να έχουν πιο πολύπλοκη συμπεριφορά από τα γραμμικά, η ανάλυσή τους είναι πολύ πιο δύσκολη. Μαθηματικά αυτό αντανακλάται σε δυο τομείς. Αρχικά οι μη γραμμικές εξισώσεις, σε αντίθεση με τις γραμμικές, γενικά δεν έχουν αναλυτική λύση και κατά συνέπεια, είναι πολύ δύσκολο να επιτευχθεί απόλυτη κατανόηση της συμπεριφοράς ενός μη γραμμικού συστήματος. Δεύτερον, ισχυρά μαθηματικά εργαλεία όπως μετασχηματισμοί Laplace και Fourier δεν εφαρμόζονται σε μη γραμμικά συστήματα. Ως αποτέλεσμα δεν υπάρχουν συστηματικά εργαλεία για πρόβλεψη συμπεριφοράς μη γραμμικών συστημάτων, και ούτε υπάρχουν συστηματικές διαδικασίες για το σχεδιασμό μη γραμμικών συστημάτων έλεγχου. Αντίθετα υπάρχει μεγάλο εύρος εργαλείων ανάλυσης και σχεδιασμού, καθένα από τα οποία εφαρμόζεται σε διαφορετικά σημεία των μη γραμμικών συστημάτων έλεγχου. Ένα μη γραμμικό δυναμικό σύστημα μπορεί να περιγραφεί από ένα σετ μη γραμμικών διαφορικών εξισώσεων της μορφής: x f ( x, t ), (.) όπου f είναι ένα διάνυσμα συναρτήσεων και x ένα διάνυσμα καταστάσεων. Ο αριθμός των μεταβλητών κατάστασης εκφράζει την τάξη του συστήματος. Η λύση xt () της εξίσωσης (.) αντιστοιχεί σε μια καμπύλη στον χώρο κατάστασης καθώς το t μεταβάλλεται από το μηδέν έως το άπειρο. Ο καμπύλη αυτή συνήθως ονομάζεται τροχιά καταστάσεων ή τροχιά συστήματος. Πρέπει να σημειωθεί ότι παρόλο που η εξίσωση (.) δεν περιλαμβάνει την είσοδο ελέγχου ως μεταβλητή, είναι άμεσα εφαρμόσιμη για συστήματα κλειστού βρόχου. Ειδικότερα, αν η δυναμική του ανοικτού συστήματος είναι: x f ( x, u, t ), (.) και εφαρμοστεί ένας νόμος ελέγχου της μορφής: 7
u g( x, t ) τότε το σύστημα κλειστού βρόχου δίνεται από τη σχέση: x f x, g( x, t), t το οποίο μπορεί να γραφεί στη μορφή της (.). Επίσης, η εξίσωση (.) μπορεί να περιγράφει και συστήματα με μηδενική είσοδο. Όσον αφορά την τροχιά του συστήματος xt (), είναι πιθανόν να αντιστοιχεί σε ένα συγκεκριμένο σημείο. Το σημείο αυτό ονομάζεται σημείο ισορροπίας. Ορισμός.: Μια κατάσταση x ονομάζεται κατάσταση ισορροπίας (ή σημείο ισορροπίας) του συστήματος εάν η τροχιά xt () γίνει ίση με x και παραμείνει ίση με x για κάθε μελλοντική χρονική στιγμή. Ο παραπάνω ορισμός εκφράζεται με μαθηματικό τρόπο ως: * 0 f( x ) Με αφορμή τα παραπάνω, και κυρίως τον ορισμό του σημείου ισορροπίας, μπορούμε να επεκταθούμε στις έννοιες της ευστάθειας..4. Ευστάθεια και η έννοια της διαταραχής Η ευστάθεια (tability), είναι μια από τις πιο σημαντικές ιδιότητες ενός συστήματος και σχετίζεται με τη συμπεριφορά του όταν αυτό υφίσταται ανεπιθύμητες διαταραχές. Υπάρχουν πολλών ειδών διαταραχές, αλλά οι σπουδαιότερες ανήκουν σε μια από δυο μεγάλες κατηγορίες. Την πρώτη κατηγορία διαταραχών αποτελούν εκείνες που επιδρούν στην ίδια την δομή του συστήματος ή που μεταβάλλουν τις τιμές των παραμέτρων του, έχοντας και στις δυο περιπτώσεις, σαν αποτέλεσμα να αλλοιώνουν τη σχέση εισόδουεξόδου του συστήματος. Η δεύτερη μεγάλη κατηγορία διαταραχών αποτελείται από εκείνες οι οποίες μπορούν να εκφραστούν υπό την μορφή σήματος το οποίο επιδρά στην είσοδο του συστήματος έχοντας σαν αποτέλεσμα να αλλοιώνεται η προβλεπόμενη έξοδος χωρίς ωστόσο να μεταβάλλεται η σχέση εισόδου-εξόδου του συστήματος. 8
Οι διαταραχές στην είσοδο του συστήματος διακρίνονται σε στιγμιαίες και επιμένουσες. Ως στιγμιαίες διαταραχές χαρακτηρίζονται εκείνες που εμφανιζόμενες υπό τη μορφή κρουστικού σήματος έχουν μηδενική διάρκεια επίδρασης στο σύστημα. Αντιθέτως, οι επιμένουσες διαταραχές δεν περιέχουν κρουστικές συνιστώσες και η επίδρασή τους στο σύστημα μπορεί να είναι συνεχής..5. Θεωρήματα ευστάθειας Η ευστάθεια είναι ένα θεμελιώδες κεφάλαιο στην ανάλυση και το σχεδιασμό συστημάτων ελέγχου. Διαφορετικά θέματα ευστάθειας, όπως ευστάθεια κατά Lyapuov ασυμπτωτική ευστάθεια, εκθετική ευστάθεια, και καθολική ασυμπτωτική ή εκθετική ευστάθεια πρέπει να οριστούν ώστε να μπορούμε να χαρακτηρίσουμε με σαφήνεια τα περίπλοκα θέματα συμπεριφοράς ευστάθειας που παρουσιάζονται στα μη γραμμικά συστήματα. Παρακάτω θα δώσουμε ορισμούς και θα αναπτύξουμε επιγραμματικά κάποιες από τις παραπάνω κατηγορίες ευστάθειας. Ορισμός.: Το σημείο ισορροπίας x = 0 ονομάζεται ευσταθές εάν για οποιοδήποτε R>0, υπάρχει r>0, τέτοιο ώστε εάν x(0) < r, τότε ισχύει x(t) <R για κάθε t>0. Σε αντίθετη περίπτωση το σημείο ισορροπίας είναι ασταθές. Ουσιαστικά, η έννοια της ευστάθειας ή της ευστάθεια κατά Lyapuov, δηλώνει ότι η τροχιά του συστήματος παραμένει αρκετά κοντά στο μηδενικό σημείο ισορροπίας εάν ξεκινήσει αρκετά κοντά σε αυτό. Όμως, σε πολλά προβλήματα η ευστάθεια κατά Lyapuov δεν είναι αρκετή, καθώς όταν ένα σύστημα διαταραχθεί από τη μηδενική θέση ισορροπίας, δεν επιθυμούμε απλώς να παραμείνει κοντά σε αυτή αλλά να επιστρέψει πλήρως στην αρχική θέση (συμπεριφορά δορυφόρου). Η απαίτηση αυτή περιγράφεται με τον ορισμό της ασυμπτωτικής ευστάθειας. 9
Ορισμός.3: Το σημείο ισορροπίας x 0 είναι ασυμπτωτικά ευσταθές εάν είναι ευσταθές και επιπλέον υπάρχει κάποιο r > 0 τέτοιο ώστε εάν x(0) r, τότε ισχύει xt ( ) 0, καθώς t. Βασικά, η έννοια της ασυμπτωτικής ευστάθειας δηλώνει ότι το σημείο ισορροπίας είναι ευσταθές, και επιπρόσθετα, καταστάσεις κοντά στο σημείο ισορροπίας συγκλίνουν προς αυτό καθώς ο χρόνος τείνει προς το άπειρο. Ένα σημείο ισορροπίας, το οποίο είναι ευσταθές κατά Lyapuov αλλά όχι ασυμπτωτικά ευσταθές, καλείται, οριακά ευσταθές. Οι καταστάσεις αυτές περιγράφονται στο παρακάτω σχήμα. Σχήμα.3: //Ασυμπτωτικά ευσταθές //Οριακά ευσταθές /3/Ασταθές Εντούτοις, σε πολλές εφαρμογές της μηχανικής, η γνώση ότι το σύστημα θα συγκλίνει στο σημείο ισορροπίας, μετά από άπειρο χρόνο, δεν είναι επαρκής. Υπάρχει η ανάγκη εκτίμησης της ταχύτητας με την οποία η τροχιά του συστήματος πλησιάζει το σημείο. Για αυτό το σκοπό, μπορεί να χρησιμοποιηθεί η έννοια της εκθετικής ευστάθειας. 0
Ορισμός.4: Το σημείο ισορροπίας x 0 είναι εκθετικά ευσταθές εάν υπάρχουν δυο αυστηρά θετικοί αριθμοί και τέτοιοι ώστε: t x( t) x(0) e t σε κάποια περιοχή B r (περιοχή έλξης), γύρω από την αρχή. Ουσιαστικά, αυτό σημαίνει ότι το διάνυσμα κατάστασης ενός εκθετικά ευσταθούς συστήματος, συγκλίνει προς την αρχή γρηγορότερα από μια εκθετική συνάρτηση. Ο θετικός αριθμός συχνά καλείται ρυθμός εκθετικής σύγκλισης. Οι παραπάνω ορισμοί διατυπώθηκαν, ώστε να βοηθήσουν στο χαρακτηρισμό της τοπικής συμπεριφοράς των τυχών συστημάτων, δηλαδή, πως εξελίσσεται η κατάσταση αφού ξεκινήσει κοντά στο σημείο ισορροπίας. Τοπικές ιδιότητες, αποκαλύπτουν λίγες πληροφορίες σχετικά με τον τρόπο που θα συμπεριφερθεί το σύστημα, όταν η αρχική κατάσταση βρίσκεται σε κάποια απόσταση μακριά από το σημείο ισορροπίας. Για αυτό το σκοπό απαιτούνται καθολικές έννοιες. Ορισμός.5 : Αν η ασυμπτωτική (ή εκθετική) ευστάθεια ισχύει για κάθε αρχική κατάσταση, το σημείο ισορροπίας, λέγεται ότι είναι καθολικά ασυμπτωτικά (ή εκθετικά) ευσταθές. Τα γραμμικά, χρονικά αμετάβλητα συστήματα είναι είτε ασυμπτωτικά ευσταθή, ή οριακά ευσταθή, ή ασταθή. Η γραμμική ασυμπτωτική ευστάθεια είναι πάντα καθολική και εκθετική, και η γραμμική αστάθεια πάντα καταλήγει σε εκθετικό blow-up. Αυτό εξηγεί για ποιο λόγο οι έννοιες που αναλύσαμε παραπάνω χρησιμοποιούνται κατά κόρον στα μη γραμμικά συστήματα.
.6. Ευστάθεια κατά Lyapuov Δεδομένου ενός συστήματος ελέγχου, η πρώτη και πιο σημαντική ερώτηση που πρέπει να γίνει, έχει να κάνει με την ευστάθειά του, καθώς ένα ασταθές σύστημα είναι μάλλον άχρηστο και δυνητικά επικίνδυνο. Η πιο χρήσιμη και γενικευμένη προσέγγιση για τη μελέτη της ευστάθειας ενός μη γραμμικού συστήματος ελέγχου, είναι η θεωρία που παρουσιάστηκε τα τέλη του 9 ου αιώνα, από το Ρώσο μαθηματικό Alexadr Mikhailovich Lyapuov. Η εργασία του Lyapuov με τίτλο «Το Γενικό Πρόβλημα της Ευστάθειας Κίνησης», εισάγει δυο μεθόδους για ανάλυση ευστάθειας, και πρωτοδημοσιεύθηκε το 89. Η πρώτη μέθοδος Lyapuov ή liearizatio method (μέθοδος γραμμικοποίησης) αντλεί συμπεράσματα για την τοπική ευστάθεια ενός μη γραμμικού συστήματος, γύρω από ένα σημείο ισορροπίας, χρησιμοποιώντας, τις ιδιότητες ευστάθειας της γραμμικής του προσέγγισης. Επειδή όλα τα συστήματα που βρίσκονται στον φυσικό κόσμο, είναι κατά βάση μη γραμμικά, η πρώτη μέθοδος Lyapuov χρησιμεύει στη δικαιολόγηση της χρήσης τεχνικών γραμμικού ελέγχου, δείχνει δηλαδή ότι ένας ευσταθής σχεδιασμός με γραμμικό έλεγχο, εγγυάται την τοπική ευστάθεια του αρχικού φυσικού συστήματος. Θεωρούμε το μη γραμμικό σύστημα (.) όπου η συνάρτηση f( x ) είναι συνεχώς διαφορίσιμη. Τότε, η δυναμική του συστήματος μπορεί να γραφεί ως: f x x fh, o, t, ( x) x x 0 όπου η f h, o, t, αντιπροσωπεύει τους όρους υψηλότερης τάξης της f όταν αναπτυχθεί σε σειρά aylor γύρω από το μηδέν. Παρατηρούμε ότι η σειρά aylor ξεκινά από τον πρώτο όρο καθώς f (0) 0 αφού το 0 είναι το σημείο ισορροπίας. Μπορούμε, λοιπόν, να χρησιμοποιήσουμε έναν σταθερό πίνακα A ο οποίος να ισοδυναμεί με τον ιακωβιανό πίνακα της f στο x 0 (δηλ. ένας πίνακας με στοιχεία f / x ): i j A f x x 0
Τότε το σύστημα: x Ax ονομάζεται γραμμικοποίηση (ή γραμμική προσέγγιση) του αρχικού μη γραμμικού συστήματος γύρω από το 0. Αντίστοιχα για ένα μη γραμμικό σύστημα με είσοδο της μορφής (.), η γραμμική του προσέγγιση γίνεται: f f x x u Ax Bu x u ( x 0, u 0) ( x 0, u 0) Κάνοντας χρήση των γραμμικοποιημένων συστημάτων, μπορούμε να δώσουμε την έκφραση του πρώτου θεωρήματος Lyapuov. Θεώρημα.: Εάν το γραμμικοποιημένο σύστημα είναι αυστηρώς ευσταθές (δηλ. όλες οι ιδιοτιμές του A είναι αυστηρά στο αριστερό μιγαδικό επίπεδο), τότε το σημείο ισορροπίας είναι ασυμπτωτικά ευσταθές (για το μη γραμμικό σύστημα). Εάν το γραμμικοποιημένο σύστημα είναι ασταθές (δηλ. τουλάχιστον μία ιδιοτιμή του A είναι αυστηρά στο δεξί μιγαδικό επίπεδο), τότε το σημείο ισορροπίας είναι ασταθές (για το μη γραμμικό σύστημα). Εάν το γραμμικοποιημένο σύστημα είναι οριακά ευσταθές (δηλ. όλες οι ιδιοτιμές του A είναι στο αριστερό μιγαδικό επίπεδο, αλλά τουλάχιστον μία είναι πάνω στον φανταστικό άξονα), τότε δεν μπορούμε να βγάλουμε συμπέρασμα για την ευστάθεια του μη γραμμικού συστήματος από την γραμμική του προσέγγιση. Το θεώρημα γραμμικοποίησης του Lyapuov, δείχνει ότι ο σχεδιασμός γραμμικού ελέγχου είναι θέμα συμβατότητας, δηλαδή πρέπει να σχεδιαστεί ένας ελεγκτής, τέτοιος ώστε το σύστημα να παραμένει μέσα στη γραμμική περιοχή. Επίσης, τονίζει σημαντικούς περιορισμούς του γραμμικού σχεδιασμού : πόσο μεγάλη είναι η γραμμική περιοχή και ποιο είναι το εύρος ευστάθειας; Τα παραπάνω ερωτήματα, προκαλούν μια βαθύτερη προσέγγιση στο πρόβλημα του μη γραμμικού ελέγχου, και οδηγούν στη δεύτερη μέθοδο Lyapuov. 3
Η δεύτερη ή άμεση (direct method) μέθοδος Lyapuov, δεν περιορίζεται σε τοπική κίνηση και καθορίζει τις ιδιότητες ευστάθειας ενός μη γραμμικού συστήματος, κατασκευάζοντας μια βαθμωτή "eergy-like" συνάρτηση για το σύστημα και εξετάζοντας τη χρονική μεταβλητή της συνάρτησης. Βασικά, εφαρμόζεται σε όλα τα δυναμικά συστήματα είτε είναι αυτά γραμμικά ή μη γραμμικά, συνεχούς ή διακριτού χρόνου. Ωστόσο η μέθοδος πάσχει από μια ουσιαστική δυσκολία εύρεσης της κατάλληλης συνάρτησης Lyapuov για ένα δεδομένο σύστημα. Από τη στιγμή που δεν υπάρχει μια γενική, αποτελεσματική προσέγγιση για εύρεση των κατάλληλων συναρτήσεων Lyapuov, ο ερευνητής πρέπει να χρησιμοποιήσει τη μέθοδο δόκιμης και σφάλματος (trial-ad-error), εμπειρία και διορατικότητα για να κάνει τη σωστή επιλογή. Γενικά, η εφαρμογή θεωρίας Lyapuov στο σχεδιασμό ελεγκτή είναι πιο αποδοτική. Και αυτό γιατί ο σχεδιαστής, έχει τη δυνατότητα να τροποποιήσει συνειδητά τη δυναμική (μέσω σχεδιασμού του ελεγκτή), έτσι ώστε η επιλεγμένη βαθμωτή συνάρτηση, να γίνει συνάρτηση Lyapuov για το εν λόγω σύστημα κλειστού βρόχου. Παρακάτω θα δώσουμε μια συνοπτική θεωρία της δεύτερης μεθόδου Lyapuov. Προτού όμως προχωρήσουμε, θα πρέπει να αναφέρουμε και να ορίσουμε τις θετικά ορισμένες συναρτήσεις, μια έννοια βασική στην παρούσα μέθοδο. Ορισμός.6 : Μια συνεχής βαθμωτή συνάρτηση είναι τοπικά θετικά ορισμένη αν V (0) 0, και σε μια περιοχή B R0 x 0 Vx ( ) 0 Αν V (0) 0 και η παραπάνω ιδιότητα ισχύει για όλο το χώρο καταστάσεων, τότε η V( x ) λέγεται ότι είναι καθολικά ή πλήρως θετικά ορισμένη. Μερικές σχετικές έννοιες μπορούν να οριστούν παρόμοια. Δηλαδή μια συνάρτηση V( xείναι ) αρνητικά ορισμένη αν η - V( x) είναι θετικά ορισμένη. Η V( x) είναι θετικά ημι-ορισμένη, αν V(0) 0 και Vx ( ) 0, για x 0 ενώ η V( x) είναι αρνητικά ημι-ορισμένη, αν η - V( x) είναι θετικά ημι-ορισμένη. Ο όρος 4
ημι- χρησιμοποιείται για να εκφράσει την πιθανότητα η V να είναι ίση με το μηδέν για x 0. Οι σχέσεις μεταξύ των συναρτήσεων Lyapuov και της ευστάθειας του συστήματος, εξακριβώνονται σε έναν αριθμό θεωρημάτων της άμεσης μεθόδου Lyapuov. Αυτά τα θεωρήματα, συνήθως έχουν τοπικές και καθολικές εκδοχές. Οι τοπικές εκδοχές ασχολούνται με τις ιδιότητες ευστάθειας στη γύρω περιοχή του σημείου ισορροπίας και συνήθως περιλαμβάνουν μια τοπική, θετικά ορισμένη συνάρτηση. Θεώρημα.: (Τοπική Ευστάθεια) Εάν σε μια περιοχή B R υπάρχει μια 0 βαθμωτή συνάρτηση V( x ) με συνεχείς μερικές παραγώγους πρώτης τάξης τέτοιες ώστε: η V( xνα ) είναι θετικά ορισμένη (τοπικά στο B R ) 0 η V( x ) να είναι αρνητικά ημι-ορισμένη (τοπικά στο B R ) 0 τότε το σημείο ισορροπίας 0 είναι ευσταθές. Εάν, επιπλέον, η V( x ) είναι αρνητικά ορισμένη στο B R, τότε η ευστάθεια είναι ασυμπτωτική. 0 Για την εφαρμογή του παραπάνω θεωρήματος έχουμε δυο βασικά στάδια. Αρχικά, πρέπει να επιλέξουμε μια θετικά ορισμένη συνάρτηση και στη συνέχεια πρέπει να καθορίσουμε την παράγωγο της στο μη γραμμικό σύστημα. Το θεώρημα αυτό ισχύει για τοπική ανάλυση της ευστάθειας. Για να επιβεβαιώσουμε καθολική ασυμπτωτική ευστάθεια του συστήματος, ίσως κάποιος θεωρούσε ότι αρκεί να επεκταθεί η περιοχή B R σε όλο τον χώρο 0 καταστάσεων. Αυτό φυσικά και είναι απαραίτητο, αλλά δεν είναι επαρκές. Πρέπει να ικανοποιηθεί μια επιπλέον συνθήκη για τη συνάρτηση V. Η V( x ) πρέπει να είναι ακτινικά μη φραγμένη (ακτινικά απεριόριστη-radially ubouded), το οποίο σημαίνει ότι V() x, καθώς x (δηλαδή, καθώς το x τείνει προς το άπειρο προς κάθε κατεύθυνση). Τότε επιτυγχάνουμε το παρακάτω αποτέλεσμα : Θεώρημα.3: (Καθολική Ευστάθεια) Θεωρούμε ότι υπάρχει μια βαθμωτή συνάρτηση V( x ) με συνεχείς πρώτες παραγώγους, τέτοια ώστε: 5
η V( x ) να είναι θετικά ορισμένη η V( x) να είναι αρνητικά ορισμένη η V() x καθώς x Τότε το μηδενικό σημείο ισορροπίας είναι καθολικά, ασυμπτωτικά ευσταθές. Το θεώρημα αυτό, για ένα μη γραμμικό σύστημα δύο καταστάσεων, γίνεται κατανοητό από το σχήμα που ακολουθεί: Σχήμα.4: Η άμεση μέθοδος Lyapuov Ο λόγος για τη συνθήκη ακτινικά μη φραγμένης συνάρτησης (radially ubouded), είναι για να διασφαλίσουμε ότι οι περιγεγραμμένες καμπύλες (ή οι περιγεγραμμένες επιφάνειες στην περίπτωση συστημάτων μεγαλύτερης τάξης) V ( x) V, αντιστοιχούν σε κλειστές καμπύλες. Αν οι καμπύλες δεν είναι κλειστές, υπάρχει η πιθανότητα η τροχιά κατάστασης να απομακρυνθεί από το σημείο ισορροπίας, αν και η κατάσταση συνεχίζει προς καμπύλες που αντιστοιχούν σε ολοένα και μικρότερο V. Υπάρχει η περίπτωση να υφίστανται πολλές διαφορετικές συναρτήσεις Lyapuov για το ίδιο σύστημα. Για παράδειγμα, αν η V είναι μια συνάρτηση Lyapuov για ένα δεδομένο σύστημα, το ίδιο ισχύει και για την V V 6
όπου είναι μια αυστηρά θετική σταθερά και a είναι ένας οποιοσδήποτε βαθμωτός (όχι απαραίτητα ακέραιος), μεγαλύτερος του. Πράγματι το γεγονός ότι η V είναι θετικά ορισμένη, συνεπάγεται το αντίστοιχο και για την V, αν η V είναι θετικά ορισμένη ή θετικά ημι-ορισμένη ισχύει το ίδιο και για την V, ενώ αν η V είναι ακτινικά μη φραγμένη (αν είναι εφαρμόσιμη αυτή η ιδιότητα), συνεπάγεται το ίδιο για την V. Είναι σημαντικό να αναφέρουμε ότι για ένα δεδομένο σύστημα, συγκεκριμένες επιλογές συναρτήσεων Lyapuov, μπορεί να αποφέρουν πιο ακριβή αποτελέσματα από άλλες συναρτήσεις. Ωστόσο πρέπει να σημειωθεί ότι τα θεωρήματα στην ανάλυση Lyapuov είναι θεωρήματα επάρκειας. Δηλαδή, αν για μια συγκεκριμένη επιλογή μιας υποψήφιας συνάρτησης Lyapuov, δεν ισχύουν τα απαραίτητα κριτήρια, δεν μπορούμε να βγάλουμε συμπεράσματα για την ευστάθεια ή αστάθεια του συστήματος. Το μόνο συμπέρασμα που μπορούμε να βγάλουμε είναι ότι πρέπει να ελέγξουμε τα ίδια κριτήρια για μια διαφορετική συνάρτηση Lyapuov..7. Ανασκόπηση κεφαλαίου Στο κεφάλαιο αυτό εισάγαμε την έννοια του προσαρμοστικού ελέγχου και αξιολογήσαμε την ανάγκη για προσαρμοστικό έλεγχο. Διερευνήσαμε τις διαταραχές και τον συνδυασμό αυτών με την ευστάθεια συστήματος. Επίσης διατυπώσαμε και αναπτύξαμε βασικά θεωρήματα ευστάθειας, δίνοντας περισσότερο βάρος στις δύο μεθόδους ευστάθειας κατά Lyapuov. Συγκεκριμένα στο επόμενο κεφάλαιο θα παρουσιάσουμε ένα είδος μη γραμμικού προσαρμοστικού πολυμεταβλητού ελέγχου ο οποίος θα μας βοηθήσει στην προσαρμοστική ευστάθεια, απόρριψη διαταραχών και εκτέλεση εντολών, ενώ παράλληλα θα εγγυάται ασυμπτωτική ευστάθεια για το σύστημα κλειστού βρόχου. 7
8
Κεφάλαιο Προσαρμοστικός Έλεγχος μη γραμμικών συστημάτων με διαταραχές.. Εισαγωγή Σε αυτό το κεφάλαιο αναπτύσσουμε ένα πλαίσιο για άμεσο προσαρμοστικό έλεγχο, για προσαρμοστική ευστάθεια, απόρριψη διαταραχών και εκτέλεση εντολών, για μη γραμμικά δυναμικά συστήματα πολλαπλών μεταβλητών, με αβεβαιότητα και εξωγενείς διαταραχές. Συγκεκριμένα, αρχικά αναπτύσσεται ένα πλαίσιο αναφοράς βασισμένο στον άμεσο προσαρμοστικό έλεγχο κατά Lyapuov, το οποίο απαιτεί μια προσαρμοσμένη συνθήκη στη διαταραχή του συστήματος, και εγγυάται μερικώς ασυμπτωτική ευστάθεια του συστήματος κλειστού βρόχου, δηλαδή ασυμπτωτική ευστάθεια σε συνάρτηση με μερικές καταστάσεις του συστήματος κλειστού βρόχου, που συσχετίζονται με το μοντέλο. Επιπρόσθετα, το υπόλοιπο των καταστάσεων που συσχετίζονται με το κέρδος του προσαρμοστικού ελεγκτή, φαίνεται να είναι ευσταθές κατά Lyapuov. Στην περίπτωση που το μη γραμμικό σύστημα αναπαρίσταται σε κανονική μορφή [6] με ευσταθείς iput-to-tate iteral dyamic [6,8], κατασκευάζουμε μη-γραμμικούς προσαρμοστικούς ελεγκτές, χωρίς να απαιτείται γνώση της δυναμικής του συστήματος, ή της διαταραχής του 9
συστήματος. Επιπλέον οι προτεινόμενοι μη-γραμμικοί προσαρμοστικοί ελεγκτές επίσης εγγυώνται ασυμπτωτική ευστάθεια της κατάστασης του συστήματος αν η δυναμική του συστήματος είναι άγνωστη και ο πίνακας της συνάρτησης εισόδου παραμετροποιείται από μια άγνωστη μήτρα σταθερών όρων με ορισμένο πρόσημο. Τέλος, γενικεύουμε τα προαναφερθέντα αποτελέσματα για μη γραμμικά συστήματα με αβεβαιότητα με εξωγενείς L διαταραχές. Σε αυτή την περίπτωση, δεν υπάρχει συνθήκη συσχέτισης στη διέγερση του συστήματος. Επιπρόσθετα, το προτεινόμενο πλαίσιο, εγγυάται ότι η μη γραμμική απεικόνιση εισόδου εξόδου του κλειστού βρόχου, από εξωγενείς L διαταραχές, μέχρι τις μεταβλητές απόδοσης του συστήματος είναι μη διευρυμένη (φραγμένου κέρδους), και η λύση του συστήματος κλειστού βρόχου είναι μερικώς ασυμπτωτικά ευσταθής. Συνεπώς ο προτεινόμενος προσαρμοστικός ελεγκτής, απευθύνεται στο πρόβλημα της απόρριψης διαταραχής για μη γραμμικά δυναμικά συστήματα με αβεβαιότητα και με νόρμες σήματος (igal orm) L φραγμένης ενέργειας (τετραγωνικά ολοκληρώσιμες) σε διαταραχές και μεταβλητές απόδοσης. Αυτό είναι σχετικό, για δυναμικά συστήματα με αβεβαιότητα και κακώς μοντελοποιημένες διαταραχές, οι οποίες κατέχουν σημαντική ισχύ εντός μικρού αυθαίρετου εύρους ζώνης... Προσαρμοστικός έλεγχος μη γραμμικών συστημάτων με εξωγενείς διαταραχές Στο κεφάλαιο, εξετάζουμε το πρόβλημα χαρακτηρισμού των νόμων προσαρμοστικού ελέγχου με ανάδραση, για μη γραμμικά δυναμικά συστήματα με αβεβαιότητα και εξωγενείς διαταραχές. Συγκεκριμένα, θεωρούμε το ακόλουθο μη γραμμικό σύστημα με έλεγχο και αβεβαιότητα που δίνεται από x( t) f ( x( t)) G( x( t)) u( t) J( x( t)) w( t ), x(0) x 0, t (.),όπου xt (), t, είναι το διάνυσμα κατάστασης, ut () d είναι η είσοδος του ελέγχου, wt (), t, είναι ένα γνωστό, φραγμένο διάνυσμα διαταραχής, f : και ικανοποιεί την f (0) 0, x m x d G : και J : είναι ένας πίνακας συναρτήσεων, m, t 30
σταθμισμένης διαταραχής με άγνωστες εισόδους. Πρέπει να τονίσουμε ότι αν και το wt ( ), t θεωρείται γνωστό, το σήμα διαταραχής J( x( t)) w( t ), t είναι μια άγνωστη φραγμένη διαταραχή. Η είσοδος ελέγχου u στη (.), ανήκει στην τάξη αποδεκτών ελεγκτών που αποτελούνται από μετρήσιμες συναρτήσεις, τέτοιες ώστε ut () m,t. Επιπλέον, για το μη γραμμικό σύστημα υποθέτουμε ότι οι απαραίτητες ιδιότητες για την ύπαρξη και τη μοναδικότητα των λύσεων ικανοποιούνται, δηλαδή οι f ( ), G( ), J( ), u( ) και w() ικανοποιούν επαρκώς τις συνθήκες κανονικότητας, ώστε η (.) να έχει μοναδική λύση στο χρόνο. Θεώρημα.: Θεωρούμε το μη γραμμικό σύστημα που δίνεται από τη m x (.). Υποθέτουμε ότι υπάρχει μια μήτρα K και συναρτήσεις g : ˆ m x m t V, G :, F : με F (0) 0 και l : τέτοιες ώστε η V () να είναι συνεχώς διαφορίσιμη, θετικά ορισμένη, ακτινικά μη φραγμένη. Επίσης ισχύει ότι, V (0) 0, l (0) 0, και για κάθε x, 0 ' V ( x) f ( x) l ( x) l( x), (.) όπου f ( x) f ( x) G( x) Gˆ( x ) K F( x). (.3) g Επιπλέον υποθέτουμε ότι υπάρχει μια μήτρα m x d και μια συνάρτηση ˆ : m x m J τέτοια ώστε GxJ ( )ˆ( x) J( x ). Επίσης, m x m m x m x d x d έστω οι Q, Q, Y και Z είναι θετικά ορισμένες. Τότε ο νόμος προσαρμοστικού έλεγχου με ανάδραση u( t) Gˆ ( x( t) ) K( t) F( x( t) ) Jˆ ( x ( t) ) ( t) w( t) (.4) m x m x d όπου K () t, t και () t,t με νόμους αναπροσαρμογής 3
' ( ) ˆ ( ( ) ) ( ( ) ) K t Q G x t G x t V ( x( t)) F ( x( t) ) Y, K(0) K 0 (.5) ˆ ( x ) G ( x ) V Z, (0) 0 (.6) ' ( t) QJ ( t) ( t) ( x( t)) w ( t) Εγγυάται ότι η λύση x( t), K( t), ( t)) (0, K, ) του συστήματος κλειστού ( g βρόχου που δίνεται από τις (.) (.4)-(.6) είναι ευσταθής κατά Lyapuov και lx ( () t ) 0 καθώς t. Eπιπλέον, αν ισχύει l ( xl )( x ), x, x 0 τότε x () t 0 καθώς t για κάθε x 0. Απόδειξη : Σημειώνεται ότι με τη u( t), t 0 γνωστή από τη (.4), εξυπακούεται από τη (.) ότι x( t) f ( x( t)) G( x( t)) Gˆ ( x( t) ) K( t) F( x( t) ) G( x( t)) Jˆ ( x ( t) ) ( t) w( t) J ( x( t)) w( t ), x(0) x 0, t 0 (.7) ή αντίστοιχα, χρησιμοποιώντας το γεγονός ότι GxJ ( )ˆ( x) J( x ), x( t) f ( x( t)) G( x( t)) Gˆ ( x( t) )( K( t) K ) F( x ( t) ) g G( x( t)) Jˆ ( x ( t) )( ( t) ) w( t), x(0) x 0, t 0 (.8) Για να δείξουμε ευστάθεια κατά Lyapuov για το σύστημα κλειστού βρόχου (.5), (.6) και (.7), θεωρούμε την υποψήφια συνάρτηση Lyapuov V ( x, K, ) V ( x) trq ( K K ) Y ( K K ) trq ( ) ( ) g g (.9) Σημειώνουμε ότι V (0, K g, ) 0 και εφόσον V ( ), Q, Q, Y και Z είναι θετικά ορισμένες, ισχύει ότι V ( x, K, ) για κάθε x (0,, ). Επιπλέον V ( x, K, ) είναι ακτινικά μη φραγμένη. Θεωρώντας, τώρα, xt (), t 0 ως λύση της (.8) και με χρήση των σχέσεων (.), (.5) και K g 3
(.6), καταλήγουμε ότι η παράγωγος Lyapuov κατά μήκος των τροχιών του συστήματος κλειστού βρόχου, δίνεται από τη σχέση: V x K V x f x t G x t Gˆ x K K x ' ( ( t), ( t), ( t) ) ( ( t) )[ ( ( )) ( ( )) ( ( t) )( ( t) g ) F( ( t) ) G( x( t)) Jˆ ( x ( t) )( ( t) ) w( t)] trq ( K( t) K ) Y K ( t) trq ( ( t) ) ( t) g l ( x( t)) l( x( t )) tr K t K F( x t ) V ( x t ) G( x( t)) Gˆ ( x t )] ' [( ( ) g) ( ) ( ) ( ) tr V x G x t Jˆ x ' [( ( t) ) w( t) ( ( t) ) ( ( )) ( ( t) )] tr K t K F( x t ) V ( x t ) G( x( t)) Gˆ ( x t )] ' [( ( ) g) ( ) ( ) ( ) tr V x G x t Jˆ x ' [( ( t) ) w( t) ( ( t) ) ( ( )) ( ( t) )] l ( x( t)) l( x( t )) 0, t 0 (.0) το οποίο αποδεικνύει ότι η λύση x ( t) ( t) ( t) (0, K g, ) για τις (.5), (.6) και (.7) είναι ευσταθής κατά Lyapuov. Επιπροσθέτως, συνεπάγεται από το Θεώρημα του [4] ότι lx ( () t ) 0 καθώςt. Ακόμα, αν l ( xl )( x ), x, x 0 τότε x () t 0 καθώς t για κάθε x 0. Παρατήρηση.: Αξίζει να σημειωθεί ότι στην περίπτωση όπου l ( xl )( x ), x, x 0 από τις συνθήκες στο Θεώρημα., αποδεικνύεται ότι x () t 0 καθώς t, και συνεπώς προκύπτει από τις (.5) και (.6) ότι ( x( t), K( t), ( t) ) M {( x, K, ) m x m x d : x 0, K 0, 0} καθώς t. Παρατήρηση.: Το Θεώρημα. ισχύει και για μη γραμμικά δυναμικά συστήματα t χρονικά μεταβαλλόμενα με αβεβαιότητα, της μορφής 33
x( t) f ( t, x( t)) G( t, x( t)) u( t) J ( t, x( t)) w( t), x(0) x t 0 (.) όπου f : και ικανοποιεί τις συνθήκες f( t,0) 0, t 0, x m G : και J : x d 0.Συγκεκριμένα, αντικαθιστώντας F : με F :, όπου Ft (,0) 0 t 0, και G ˆ : με ˆ : m x m G, και απαιτώντας G( t, x) Jˆ ( t, x) J( t, x ) όπου ˆ : m x m J και t 0 στη θέση του G( x) Jˆ ( x) J( x ), αποδεικνύεται ότι χρησιμοποιώντας τα ίδια επιχειρήματα, όπως και στην απόδειξη του Θεωρήματος., ο νόμος προσαρμοστικού ελέγχου ανάδρασης m x m u( t) Gˆ ( t, x( t)) K( t) F( t, x( t)) Jˆ ( t, x( t)) ( t) w( t ), (.) με νόμους αναπροσαρμογής ' ( ) ˆ (, ( ) ) (, ( ) ) K t Q G t x t G t x t V ( x( t)) F ( t, x( t) ) Y, K(0) K 0 (.3) ˆ ( t, x ) G ( t, x ) V Z, (0) 0 (.4) ' ( t) QJ ( t) ( t) ( x( t)) w ( t) όπου ' V ικανοποιεί τη σχέση (.) με f ( x) f ( t, x) G( t, x) Gˆ ( t, x) K F( t, x), εγγυάται ότι η λύση x ( t) ( t) ( t) (0, K g, ) του συστήματος κλειστού βρόχου (.)-(.4) είναι ευσταθής κατά Lyapuov και ότι xt ( ) 0 καθώς t για κάθε x 0. g Παρατήρηση.3: Όπως φαίνεται και από την Παρατήρηση., το Θεώρημα. μπορεί επίσης να χρησιμοποιηθεί για να κατασκευάσουμε προσαρμοστικούς ελεγκτές παρακολούθησης για μη γραμμικά δυναμικά συστήματα με αβεβαιότητα. Συγκεκριμένα έστω το r ( t) t, συμβολίζει την είσοδο εντολής και καθορίζει την κατάσταση σφάλματος e( t) x( t) rd ( t ). Στην περίπτωση αυτή η δυναμική σφάλματος δίνεται από e( t) ft ( t, e( t)) Gt ( t, e( t)) u( t) Jt( t, e( t)) wt ( t), e(0) e t 0 (.5) 0 d όπου f ( t, e( t) ) f ( e( t) r ( t)) ( t) με t d f ( r ( t)) ( t), G ( t, e( t)) G( e( t) r ( t)) και d t d J ( t, e( t)) w ( t) ( t) r ( t) J( e( t) r ( t)) w( t). Τώρα, ο νόμος ελέγχου t t d d 34
προσαρμοστικού σφάλματος (.)-(.4), όπου το xt () το έχουμε αντικαταστήσει με et (), εγγυάται ότι et ( ) 0 καθώς t για κάθε e 0. Είναι σημαντικό να σημειώσουμε ότι ο νόμος προσαρμοστικού ελέγχου (.4)-(.6) δεν απαιτεί ακριβή γνώση του πίνακα κέρδους K g, του προσαρμοσμένου πίνακα διαταραχής, και του πίνακα συναρτήσεων σταθμισμένης διαταραχής J( x ), αν και το Θεώρημα. απαιτεί την ύπαρξη των K g και μαζί με την κατασκευή των Fx ( ), Gx, ˆ( ) J ˆ( x () t και V ( x ), έτσι ώστε η G( x) Jˆ ( x ) J( x) και η σχέση (.) να ισχύουν. Επιπρόσθετα, για να εφαρμόσουμε το Θεώρημα., δεν χρειάζεται συγκεκριμένη δομή στη μη γραμμική δυναμική f( x. Παρόλα αυτά, αν η (.) είναι σε κανονική μορφή [6] με ασυμπτωτικά ευσταθής iteral dyamic, τότε μπορούμε να κατασκευάσουμε συναρτήσεις V :, F : με F(0) 0 x m και G ˆ : τέτοιες ώστε η (.) να ισχύει χωρίς περαιτέρω γνώση της δυναμικής του συστήματος. Τα παραπάνω δεδομένα, τα χρησιμοποιούμε στη συνέχεια για να κατασκευάσουμε μη γραμμικούς προσαρμοστικούς ελεγκτές με ανάδραση, σε μη γραμμικά δυναμικά συστήματα με αβεβαιότητα. Για απλούστευση, υποθέτουμε ότι J( x) D, x d όπου D είναι μια μήτρα σταθμισμένης διαταραχής με άγνωστες εισόδους. Για να διευκρινίσουμε τα προηγούμενα, θεωρούμε ότι το μη γραμμικό σύστημα με αβεβαιότητα, έχει δημιουργηθεί από m d ( ri ) ˆ i ui ( i, j) j ( i, k ) k j k q ( t) f ( q( t)) G ( q( t)) u ( t) D w ( t) i,, m t 0 (.6) ( r ) ( r ) όπου [,,,,,, m q q q q q ], q(0) q 0, παράγωγο του q i, το r i την έξοδο q i, ( ik, ) m m q συμβολίζει την ( r ) i i th r i συμβολίζει το σχετικό βαθμό αναφορικά με D ˆ, i, m,, k, d, και w () t, t, k,, d. Εδώ υποθέτουμε ότι ο πίνακας τετραγωνικών συναρτήσεων q ( ) που αποτελείται από τις εισόδους G ( i, j) ( q), i, j,, m, είναι τέτοιος ώστε rˆ G q ( ) 0, q, όπου ˆ r r r είναι το διάνυσμα του σχετικού βαθμού m k G 35
της (.6). Επιπλέον εφόσον η (.6) είναι σε τέτοια μορφή, ώστε δεν έχει εσωτερική δυναμική (iteral dyamic) έχουμε ότι ˆr. Την περίπτωση όπου η (.6) έχει iteral dyamic, εξετάζουμε παρακάτω. Στη συνέχεια ορίζουμε το ( i ) ( m ) x [ r,, r ] m qi qm και [,, ] m περιγραφεί από τη (.) με x q q i m ( ) [,, r i i i i ],,,, x x x, έτσι ώστε η (.6) να μπορεί να f ( x) Ax fu() x, 0 ( m ) m Gx ( ), G ( x) 0 ( m ) d J( x) D (.7) Dˆ όπου A 0 A, 0 m ( ) 0 ( m ) f x u f ( x), u A 0 ( m) x είναι μια γνωστή μήτρα που αποτελείται από μηδενικά και άσσους και επιτυγχάνει την αναπαράσταση της ελέγξιμης κανονικής m πολυμεταβλητής μορφής [], f : είναι μια άγνωστη u συνάρτηση που ικανοποιεί τη συνθήκη f u (0) 0, ενώ G: και ˆ m x d D. Εδώ υποθέτουμε ότι f ( x ) είναι άγνωστο και παραμετροποιείται ως f ( x) f ( x) όπου f : f (0) 0, ενώ u m x q u m x m q και ικανοποιεί τη είναι μια μήτρα σταθερών παραμέτρων με αβεβαιότητα. Να σημειωθεί ότι τις J ˆ( x ) και στο Θεώρημα. μπορούμε να τις θεωρήσουμε ως Jˆ( x) G ( x) και ˆD έτσι ώστε η G( x) Jx ˆ( ) J( x) D, να ισχύει. Ακολούθως, για την εφαρμογή του Θεωρήματος., στο σύστημα με αβεβαιότητα (.), με τις f( x ), Gx ( ) και J( x ) να δίνονται από τη m x (.7), θεωρούμε K g, όπου το q r μπορεί να δοθεί από το K g,, (.8),όπου m x q και m x r είναι γνωστοί πίνακες και έστω 36
F( x) f( x) fˆ ( x ) (.9),όπου f ˆ : με f (0) 0 μια τυχαία συνάρτηση. Σε αυτή την περίπτωση, συνεπάγεται ότι, με r ˆ g ˆ( ) ( x ) G x f ( x) f ( x) G( x) Gˆ ( x) K F( x) G, 0 ( m ) m ( ) ˆ u G ( x) Ax f x G ( x)[ f ( x) f ( x) f ( x) ] 0 ( m ) Ax (.0) f ( x) fˆ ( x) Τώρα, εφόσον οι m x q και m x r είναι μήτρες αυθαίρετων σταθερών και f ˆ : είναι μια τυχαία συνάρτηση, μπορούμε να κατασκευάσουμε τις K g, Fx ( ) και V ( x ) χωρίς να έχουμε γνώση της f( x ), έτσι ώστε η (.) να ισχύει. Συγκεκριμένα, επιλέγοντας r f ( x) fˆ ( x) Ax ˆ όπου ˆ m x A, φαίνεται ότι η (.0) έχει τη μορφή f ( x ) Ax όπου η A A0, A είναι σε ελέγξιμη πολυμεταβλητή κανονική μορφή. Συνεπώς, επιλέγοντας Â τέτοια ώστε η A να είναι ασυμπτωτικά ευσταθής, συνεπάγεται από την αντίστροφη θεωρία Lyapuov, ότι υπάρχει μια θετικά ορισμένη μήτρα P που ικανοποιεί την εξίσωση Lyapuov ˆ 0 A P PA R (.) όπου η R είναι θετικά ορισμένη. Σε αυτή την περίπτωση, με V ( x) x Px ο προσαρμοστικός ελεγκτής με ανάδραση (.4) με νόμους αναπροσαρμογής (.5), (.6) ή αντίστοιχα ( ) ˆ ( ( ) ) ( ( ) ) K t Q G x t G x t Px( t) F ( x( t) ) Y, K(0) K 0 (.) ( t) Q J x( t) G x( t) Px( t) w ( t) Z, (0) 0 (.3) ˆ ( ) ( ) εγγυάται καθολική ασυμπτωτική ευστάθεια του μη γραμμικού δυναμικού συστήματος με αβεβαιότητα (.) όπου f( x ), Gx ( ) και J( x ) δίνονται 37
από τη (.7). Όπως αναφέραμε παραπάνω, είναι σημαντικό να τονίσουμε ότι δεν είναι απαραίτητο να χρησιμοποιήσουμε μια συνάρτηση γραμμικοποίησης με ανάδραση Fx ( ) για να σχηματίσουμε μια γραμμική f ( x ). Ωστόσο, όταν το σύστημα είναι σε κανονική μορφή, μια συνάρτηση γραμμικοποίησης με ανάδραση Fx ( ), παρέχει σημαντική απλούστευση στην κατασκευή της V ( x ), η οποία είναι απαραίτητη για τον υπολογισμό των νόμων αναπροσαρμογής (.5) και (.6). Μια ανάλογη κατασκευή, όπως η παραπάνω μπορεί να χρησιμοποιηθεί στην περίπτωση όπου η (.) είναι σε κανονική μορφή με ευσταθείς iput-totate iteral dyamic [6] και wt ( ) 0. Σε αυτή την περίπτωση, η (.6) δίνεται από z( t) f z ( q( t), z( t )), z (0) 0 t 0 (.4) m ( ri ) i ui ( i, j) j j q ( t) f ( q( t), z( t)) G ( q( t), z( t)) u ( t ), i,, m (.5),όπου rˆ rˆ rˆ f :, ˆr και όπου έχουμε υποθέσει για χάριν z απλούστευσης, ότι η κατανομή που παράγεται από τα διανυσματικά πεδία th col ( G( x)),, colm( G( x )), όπου coli ( G( x )), συμβολίζει την i στήλη της Gx ( ), είναι ivolutive [6] (o αντίστροφός του είναι ο ίδιος ο εαυτός του). Συνεπώς, θεωρούμε ότι η μηδενική λύση zt ( ) 0 στη (.4) είναι iput-totate ευσταθής (ο λόγος εισόδων-κατάστασης του συστήματος είναι σταθερός), όπου q η είσοδος. Στη συνέχεια ορίζουμε το x z, xˆ rˆ όπου, x x,, x. Εφόσον οι iteral dyamic που δίνονται m από τη (.4), είναι iput-to-tate ευσταθείς, συνεπάγεται από το Θεώρημα του [0] και το Λήμμα 5.6 του [7], ότι η μηδενική λύση xt ( ) 0 στη (.)με wt ( ) 0 είναι καθολικά, ασυμπτωτικά ευσταθής. Στη συνέχεια αναλογιζόμαστε την περίπτωση όπου f( x ) και Gxπεριλαμβάνουν ( ) αβεβαιότητα και ˆr. Συγκεκριμένα, θεωρούμε ότι ( ) Gxείναι τέτοια ώστε G ( x ) είναι άγνωστη και παραμετροποιείται ως G ( x) BuG ( x ), ενώ η G : είναι γνωστή και ικανοποιεί την det G ( x) 0, x και m x m m x m B u - με det u 0 B - είναι μια άγνωστη, συμμετρική, μήτρα με ορισμένο πρόσημο, το οποίο όμως γνωρίζουμε, δηλαδή Bu ή B u. 38
Για την διατύπωση του παρακάτω αποτελέσματος ορίζουμε B 0, I για B u, και 0 m ( m) m 0 m ( m) m B 0, I για B u. Πόρισμα.: Θεωρούμε το μη γραμμικό σύστημα που δίνεται από τη (.) με f( x ), Gx ( ) και J( x ) γνωστές από τη (.7) και G ( x) B G ( x) u όπου B u είναι μια άγνωστη συμμετρική μήτρα με γνωστό όμως πρόσημο. m x Υποθέτουμε ότι υπάρχει μια μήτρα Kg και συναρτήσεις t V :, F : με F (0) 0 και l : τέτοιες ώστε η V () είναι συνεχώς διαφορίσιμη, θετικά ορισμένη ακτινικά μη φραγμένη, με V (0) 0, l (0) 0, και η (.) ισχύει. Επίσης έστω x Y και είναι θετικά ορισμένες. Τότε ο νόμος προσαρμοστικού ελέγχου με ανάδραση ( t) ( t) ( t) F ( t) ( t) ( t) w( t) Z d x d u G ( x ) K ( x ) G ( x ) (.6) m x m x d όπου K () t, t και () t,t με νόμους αναπροσαρμογής K( t) B0 V ( x( t) ) F ( x( t) ) Y 0 K(0) K (.7) ( t) B0 V ( x( t) ) w ( t) Z (0) 0 (.8) εγγυάται ότι η λύση, x ( t) ( t ) ( t ) (0, K, ), με g m x d, του συστήματος κλειστού βρόχου, που δίνεται από τις (.), (.6)-(.8) είναι ευσταθής κατά Lyapuov και lx ( () t ) 0 καθώς t.αν επιπρόσθετα ισχύει ότι l ( xl )( x ), x, x 0, τότε x () t 0 καθώς t για όλα τα x 0. Απόδειξη: Η απόδειξη, είναι άμεσο επακόλουθο του Θεωρήματος.. Αρχικά θεωρούμε Gˆ( x ) Jˆ( x) G ( x ) και B ˆ u D, έτσι ώστε G( x) Gˆ ( x) 0, B και G( x) Jˆ ( x) m ( m) u 39 D, ενώ K B,. g u
Στη συνέχεια, εφόσον οι Q και Q είναι αυθαίρετες, θετικά ορισμένες μήτρες, η Q στη (.5) και η Q στη (.6) μπορούν να αντικατασταθούν από τις u q B u και u q B αντίστοιχα, όπου οι q, q είναι θετικές σταθερές και u B B, όπου τετραγωνική ρίζα. Τώρα, εφόσον η δηλώνει τη μοναδική, θετικά ορισμένη B u είναι συμμετρική και έχει ορισμένο πρόσημο, συνεπάγεται από την ανάλυση Schur ότι Bu UDBU, u όπου η U είναι ορθογώνια και η D B πραγματική διαγώνιος. Συνεπώς u ˆ ( ) ( ) 0, B G x G x B όπου I για m m Bu u m ( m) m 0 και I για m m B u. Εν τέλει, αν στις (.5) και (.6), αντικαταστήσουμε τις qy, qz με τις Y, Z, καταλήγουμε στις εξισώσεις (.7) και (.8) αντίστοιχα. Αξίζει να σημειωθεί ότι αν, οι K g, Fx ( ) κατασκευαστούν ώστε στην (.3) να ισχύει f( x) Ax, όπου η A είναι μια μήτρα ασυμπτωτικά ευσταθής σε ελέγξιμη κανονική μορφή πολλών μεταβλητών, τότε το Πόρισμα. επιδέχεται σημαντική απλούστευση. Συγκεκριμένα, σε αυτή την περίπτωση η V ( x) x Px όπου P ικανοποιεί τη (.) και συνεπώς οι (.7) και (.8) μετατρέπονται στις ( ) K t B0 Px( t) F ( x( t)) Y, 0 K(0) K (.9) ( ) t B0 Px( t) w ( t) Z, (0) 0 (.30).3. Ειδίκευση στα συστήματα μιας εισόδου με αβέβαια δυναμική Σε αυτήν την παράγραφο εφαρμόζουμε τη μεθοδολογία που αναπτύχθηκε στην Παράγραφο., σε δυναμικά συστήματα κανονικής μορφής, μιας εισόδου με αβεβαιότητα, ώστε να διευκρινίσουμε περαιτέρω την προτεινόμενη μέθοδο προσαρμοστικής ευστάθειας. Για απλούστευση της 40
παρουσίασης, υποθέτουμε ότι το σύστημα δεν έχει iteral dyamic.την περίπτωση όπου το έχει ευσταθείς iput-to tate iteral dyamic, μπορούμε να τη χειριστούμε όπως αναφέραμε στην Παράγραφο.. Εδώ θεωρούμε το μη γραμμικό σύστημα με αβεβαιότητα που δίνεται από τη (.) με x f( x) u x f ( x), 0 ( ) Gx ( ), g ( x) 0 ( ) d J( x) D (.3) dˆ όπου η f : είναι μια άγνωστη συνάρτηση και ικανοποιεί την f (0) 0, u g : και ικανοποιεί την g( x) 0, x ενώ d ˆ d u. Επιπρόσθετα, υποθέτουμε ότι η f ( x ) είναι άγνωστη και παραμετροποιείται ως u q f ( x) f ( x ) όπου f : και ισχύει f (0) 0, ενώ u u q είναι ένα διάνυσμα αβέβαιων σταθερών παραμέτρων. Να σημειωθεί ότι στην περίπτωση μιας εισόδου, m και συνεπώς τα J ˆ( x ) και. μπορούν να θεωρηθούν ως να ισχύει η σχέση ˆ( ) ( ) G( x) Jˆ ( x) J( x) D. στο Θεώρημα J x g x και ˆd αντίστοιχα, έτσι ώστε Στη συνέχεια, για να εφαρμόσουμε το Θεώρημα. στις περιπτώσεις x μιας εισόδου με άγνωστη δυναμική έστω το K δίνεται από όπου q και g K g,, (.3) r είναι γνωστά διανύσματα με r qκαι έστω Fx ( ) δίνεται από τη σχέση (.9). Σε αυτή τη περίπτωση συνεπάγεται ότι με ˆ( ) ( ) G x g x : f ( x) f ( x) G( x) Gˆ ( x) K F( x ) g x u x f ( x) + 0 ( ) g ( x) ( ) ( ) ˆ f x f x f( x) g ( x) 4
x x f ( x) fˆ ( x), (.33) Τώρα δεδομένου ότι τα q και r είναι αυθαίρετα σταθερά διανύσματα και ˆ : r f είναι μια αυθαίρετη συνάρτηση, μπορούμε να κατασκευάσουμε τα της f( x ), K g, Fx ( ) και V ( x ) χωρίς να έχουμε γνώση ώστε η σχέση (.) να ισχύει. Συγκεκριμένα, επιλέγοντας f ( x) fˆ ( x) a x a x a x,συνεπάγεται ότι η (.33) έχει τη μορφή f ( x ) Ax όπου η A βρίσκεται σε ελέγξιμη κανονική μορφή. Συνεπώς, επιλέγοντας ai, i,, έτσι ώστε η A να είναι ασυμπτωτικά ευσταθής, κατανοούμε ότι υπάρχει μια μήτρα P θετικώς ορισμένη, που ικανοποιεί την (.). Στη περίπτωση αυτή, με τη συνάρτηση Lyapuov V ( x) x Px, ο προσαρμοστικός ελεγκτής με ανάδραση (.4) με νόμους αναπροσαρμογής (.5) (.6), ή αντίστοιχα ( ) ˆ ( ( ) ) ( ( ) ) K t G x t G x t Px( t) F ( x( t) ) Y, K(0) K 0 (.34) ( ) ˆ t J ( x( t) ) G ( x( t) ) Px( t) w ( t) Z, (0) 0 (.35) εγγυάται καθολική ασυμπτωτική ευστάθεια του μη γραμμικού δυναμικού συστήματος (.) όπου οι f( x ) Gxκαι ( ) J( x ) δίνονται από τη (.3). Στη συνέχεια εξετάζουμε την περίπτωση όπου οι f( x ) Gx ( ) παρουσιάζουν και οι δυο αβεβαιότητα. Συγκεκριμένα θεωρούμε ότι G( x) 0, b g ( x ), όπου g : ( ) u είναι γνωστό και ικανοποιεί το ( ) 0 g x, x και b u 0 άγνωστο, αλλά είναι γνωστό το g b b / b. u u u Για τη διατύπωση του επόμενου αποτελέσματος, ορίζουμε το B 0, g b. 0 ( ) u Πόρισμα. : Έστω το μη γραμμικό σύστημα που δίνεται από τη σχέση (.) με τα f( x ), Gxκαι ( ) J( x) να δίνονται από τη (.3), και g ( x) b g ( x ) όπου b u είναι άγνωστο αλλά γνωρίζουμε το υπάρχει ένα διάνυσμα με F (0) 0 και : u gb u. Ας υποθέσουμε ότι x K και συναρτήσεις V :, F : g t l τέτοιες ώστε η V () είναι συνεχώς 4
διαφορίσιμη, θετικά ορισμένη, ακτινικά μη φραγμένη, ενώ οι x d x d V (0) 0, l (0) 0, και η (.) ισχύουν. Επίσης έστω Y και Z είναι θετικά ορισμένες. Τότε ο νόμος προσαρμοστικού ελέγχου με ανάδραση u ( x ) K ( x ) g ( x ) (.36) ( t) g ( t) ( t) F ( t) ( t) ( t) w( t) όπου K ( t) x, t και xd () t με νόμους αναπροσαρμογής K( t) B0 V ( x( t) ) F ( x( t) ) Y, K(0) K 0 (.37) ( t) B0 V ( x( t) ) w ( t) Z, (0) 0 (.38) εγγυάται ότι η λύση x ( t) ( t) ( t) (0, K g, ), με xd, του συστήματος κλειστού βρόχου, που δίνεται από τις (.), (.36)-(.38) είναι ευσταθής κατά Lyapuov και lx ( () t ) 0 καθώς t.αν επιπρόσθετα l ( xl )( x ), x, x 0, τότε x() t 0 καθώς t,για κάθε x 0. Απόδειξη : Το αποτέλεσμα είναι άμεση απόρροια του Θεωρήματος.. Αρχικά θεωρούμε Gˆ ( x) Jˆ ( x) g ( x ) και παρατηρούμε ότι παίρνοντας b ˆ d συνεπάγεται ότι G( x) Jˆ ( x) D. Στη συνέχεια και αφού Q και Q είναι αυθαίρετες, θετικά ορισμένες μήτρες, η Q στο (.5) και η Q (.6) μπορούν να αντικατασταθούν από τις όπου σε αυτή την περίπτωση οι Q και Q bu Q και bu στο Q αντιστοίχως, είναι βαθμωτές. Συνεπώς αν στις εξισώσεις (.5) και (.6) αντικαταστήσουμε τις QY, Q Z με τιςy και Z οδηγούμαστε στις εξισώσεις (.37) και (.38) αντίστοιχα. Αν οι K g και Fx () είναι κατασκευασμένες ώστε να δίνεται στην (.3) αποτέλεσμα f( x) Ax, όπου η A είναι μια ασυμπτωτικώς ευσταθής μήτρα σε ελέγξιμη κανονική μορφή, τότε προκύπτει μια σημαντική απλούστευση στο Πόρισμα.. Συγκεκριμένα σε αυτή την περίπτωση, V ( x) x Px, όπου P, ικανοποιεί τη (.) και επομένως οι (.37) (.38) μετατρέπονται ως ακολούθως K( t) B Px( t) F ( x( t) ) Y, K(0) K (.39) 0 0 43
( t) B Px( t) w ( t) Z, (0) (.40) 0 0 Εν τέλει μπορούμε να ειδικεύσουμε το Πόρισμα. στην περίπτωση όπου d, w( t), d ˆ και f () x Ax, όπου A 0 A (.4) 0 ( ) x είναι μια γνωστή μήτρα και x είναι άγνωστο διάνυσμα. Πόρισμα.3: Θεωρούμε το σύστημα το οποίο δίνεται από τη (.) με f () x Ax, G( x) B, d, J ( x) 0 ˆ ( ), d και wt ( ) ότι υπάρχει ένα διάνυσμα g. Υποθέτουμε x Kg τέτοιο ώστε η (.) να ισχύει, με A A BK, P και R.Επιπροσθέτως έστω η x Y μια θετικά ορισμένη μήτρα και Z μια θετική σταθερά. Τότε ο κανόνας προσαρμοστικού ελέγχου με ανάδραση u( t) K( t) x( t) ( t ) (.4) όπου x K g, t και xd () t, t με νόμους αναπροσαρμογής K( t) B Px( t) x ( t) Y, K(0) K (.43) 0 0 ( t) B Px( t) Z, (0) (.44) 0 0 εγγυάται ότι η λύση x( t) ( t) ( t) (0, K g, ) όπου,του συστήματος κλειστού βρόχου που δίνεται από τις (.), (.4)-(.44) είναι ευσταθής κατά Lyapuov και Rx( t ) 0 καθώς t. Αν επιπροσθέτως R 0 τότε x() t 0 καθώς t, για κάθε x 0. Απόδειξη: Το αποτέλεσμα είναι ένα άμεση συνέπεια του Πορίσματος. με, d, f () x Ax, wt ( ) και V ( x) x Px. Για ακόμα μια φορά, αν και το Πόρισμα.3 απαιτεί την ύπαρξη του K g τέτοια ώστε να επιβεβαιώνεται η (.), ο προσαρμοστικός ελεγκτής με ανάδραση (.4)-(.44), μπορεί να κατασκευαστεί χωρίς να γνωρίζουμε το στο A ή 44
το b στο B. Παρόλα αυτά το gb πρέπει να είναι γνωστό.κατανοούμε λοιπόν ότι επιλέγοντας K g b επακολουθεί ότι A BK g A0 0 b b A 0. Από τη στιγμή που το είναι αυθαίρετο, συμπεραίνουμε ότι η P μπορεί η καθοριστεί χωρίς γνώση του ή του b..4. Προσαρμοστικός έλεγχος για μη γραμμικά συστήματα με L διαταραχές Σε αυτή την παράγραφο εξετάζουμε το πρόβλημα χαρακτηρισμού των κανόνων προσαρμοστικού ελέγχου με ανάδραση, για μη γραμμικά δυναμικά συστήματα με αβεβαιότητα, και εξωγενείς L διαταραχές. Συγκεκριμένα θεωρούμε το ακόλουθο μη γραμμικό σύστημα που δίνεται από την, με έλεγχο και αβεβαιότητα, x( t) f ( x( t)) G( x( t)) u( t) J( x( t)) w( t), x(0) x0, w L t 0 με μεταβλητές απόδοσης (.45) z( t) h( x( t )) (.46) m όπου xt (), t 0 είναι ένα διάνυσμα κατάστασης, ut (), t 0 είναι η d είσοδος έλεγχου, wt () t 0, είναι μια άγνωστη L διαταραχή, φραγμένης p ενέργειας, zt () t 0 είναι μια μεταβλητή απόδοσης, f : και x m ικανοποιεί την f (0) 0, G :, J :, και η h : είναι συνεχής και ικανοποιεί την h (0) 0. Το ακόλουθο θεώρημα γενικεύει το Θεώρημα. για μη γραμμικά δυναμικά συστήματα με αβεβαιότητα και εξωγενείς L διαταραχές. x d p 45
Θεώρημα.: Θεωρούμε το μη γραμμικό σύστημα που δίνεται από τις m x (.45) και (.46). Υποθέτουμε ότι υπάρχει πίνακας Kg και συναρτήσεις V :, F :, G : με F (0) 0 και m x m t l : τέτοιες ώστε η V () είναι συνεχής διαφορίσιμη, θετικά ορισμένη, ακτινικά μη φραγμένη. V (0) 0, l (0) 0, και για κάθε x, ισχύει όπου 0 V ( x) f ( x) ( x ) (.47) ( x) V ( ) ( ) ( ) ( ) ( ) ( ) x J x J x V x h x h x (.48) 4 και η f ( x ) δίνεται από τη (.3). Εν τέλει, έστω οι m x m Q και είναι θετικά ορισμένες. Τότε ο κανόνας προσαρμοστικού ελέγχου με ανάδραση θα είναι Y x u( t) Gˆ ( x( t)) K( t) F( x( t )), (.49) m x όπου Kt (), t 0 με νόμο αναπροσαρμογής ( ) ˆ ( ( ) ) ( ( ) ) K t QG x t G x t V ( x( t)) F ( x( t)) Y, K(0) K 0 (.50) εγγυάται ότι η λύση x ( t) ( t) (0, K g ) του συστήματος κλειστού βρόχου χωρίς διαταραχές ( wt ( ) 0) που δίνεται από τις (.45), (.49)-(.50) είναι ευσταθής κατά Lyapuov και h( x( t )) 0 καθώςt.αν επιπροσθέτως h ( x) h( x) 0, x, x 0 τότε x () t 0 καθώς t για κάθε x0.επιπλέον η λύση x( t), t 0 στο σύστημα κλειστού βρόχου που δίνεται από τις (.45),(.49)-(.50) ικανοποιεί τη συνθήκη φραγμένου κέρδους (oexpaivity cotrait). z ( t) z( t) dt w ( t) w( t) dt V ( x(0), K (0)) 0 0 0, 0, w L (.5) 46
όπου V x K V x trq K K Y K K (.5) (, ) ( ) ( ) ( ) g g Απόδειξη : Αξίζει να επισημανθεί ότι με u( t), t 0 που δίνεται από τη (.49) συνεπάγεται από τη (.45) ότι x( t) f ( x( t)) G( x( t)) Gˆ ( x( t)) K( t) F( x( t)) J ( x( t)) w( t ), x(0) x 0, w L t 0, (.53) ή ισοδύναμα με χρήση του ορισμού της f ( x ) που δίνεται από τη (.3), x( t) f ( x( t)) G( x( t)) Gˆ ( x( t))( K( t) K ) F( x( t)) J( x( t)) w( t ), x(0) x 0, g w L, t 0, (.54) Για να δείξουμε ευστάθεια κατά Lyapuov ενός συστήματος κλειστού βρόχου (.50) και (.54) θεωρούμε την υποψήφια συνάρτηση Lyapuov που δίνεται από τη (.5). Να σημειωθεί ότι V(0, K g ) 0 και εφόσον V ( ), Q, και Y είναι θετικά ορισμένες, V( x, K) 0 για κάθε ( x, K) (0, K ). Επιπροσθέτως η V( x, K ) είναι ακτινικά μη φραγμένη. Τώρα, αφήνοντας το x( t), t 0 να καθορίσει τη λύση στη (.54) και με χρήση των σχέσεων (.47) και (.50), συνεπάγεται ότι η παράγωγος Lyapuov κατά μήκος των τροχιών του κλειστού συστήματος χωρίς διαταραχές ( wt ( ) 0) δίνεται από τη V ( x( t), K( t)) V ( x( t)) f ( x( t)) G( x( t)) Gˆ ( x( t))( K( t) K ) F( x( t )) g g trq ( K( t) K ) Y K g ( x( t)) tr ( K( t) K ) F( x( t)) V ( x( t)) G( x( t)) Gˆ ( x( t )) g tr ( K( t) K ) F( x( t)) V ( x( t)) G( x( t)) Gˆ ( x( t )) ( xt ( )) g 0, t 0, (.55) 47
το όποιο αποδεικνύει ότι η λύση x ( t) ( t) (0, K g ) στις (.50) και (.54) με wt ( ) 0 είναι ευσταθής κατά Lyapuov. Επιπλέον από το Θεώρημα του [0] φαίνεται ότι h( x( t )) 0 καθώς t για κάθε x 0. Αν επιπροσθέτως ισχύει h ( x) h( x) 0, x, x 0 τότε x () t 0 καθώς t για κάθε x 0. Εν τέλει για να δείξουμε ότι η συνθήκη φραγμένου κέρδους ισχύει, d επισημαίνουμε ότι για κάθε ( xw, ), 0 J ( x) V ( x) w J ( x) V ( x) w ( ) ( ) ( ) x w w z z V x J x w (.56) Έστω ότι w L και έστω x( t), t 0 υποδεικνύει τη λύση για το σύστημα κλειστού βρόχου (.54). Τότε με χρήση του (.50) η παράγωγος Lyapuov κατά μήκους των τροχιών του συστήματος κλειστού βρόχου δίνεται από την V ( x( t), K( t)) V ( x( t)) f ( x( t)) G( x( t)) Gˆ ( x( t))( K( t) K ) F( x( t)) J ( x( t)) w( t) g trq ( K( t) K ) g Y K ( t ) ( x( t)) tr ( K( t) K ) F( x( t)) V ( x( t)) G( x( t)) Gˆ ( x( t )) g V ( x( t)) J( x( t)) w( t ) tr ( K( t) K ) F( x( t)) V ( x( t)) G( x( t)) Gˆ ( x( t )) g ( x( t)) V ( x( t)) J( x( t)) w( t ) w ( t) w( t) z ( t) z( t ), t 0. (.57) Τώρα ολοκληρώνοντας τη (.57) επί του [0,Τ] έχουμε ( ( ), ( )) [ ( ) ( ) ( ) ( )] ( (0), (0)) 0 V x K w t w t z t z t dt V x K 0, 0, w L, (.58) 48
η οποία, αν σημειωθεί ότι V( x( ), K( )) 0, 0, καταλήγει στην (.5). Είναι σημαντικό να τονίσουμε ότι αντίθετα με το Θεώρημα. το όποιο απαιτεί μια προσαρμοσμένη λύση στη διαταραχή, το ανάλογο δεν είναι απαραίτητο στο Θεώρημα..Επιπλεον, όπως δείξαμε και στην Παράγραφο., αν η (.45) είναι σε κανονική μορφή με ασυμπτωτικά ευσταθείς iteral dyamic, τότε μπορούμε να κατασκευάσουμε συναρτήσεις m x m V :, F :, G : με F (0) 0 τέτοιες ώστε η (.47) να ισχύει χωρίς να είναι απαραίτητη η γνώση της δυναμικής του συστήματος. Επιπλέον, στην περίπτωση που ισχύουν J( x) D και h( x) Ex, ο προσαρμοστικός ελεγκτής (.50) μπορεί να κατασκευαστεί έτσι ώστε να εγγυάται τη συνθήκη φραγμένου κέρδους (.5) με χρήση συνήθων γραμμικών H μεθόδων. Συγκεκριμένα, επιλέγοντας f ( x) A x όπου η A είναι ασυμπτωτικά ευσταθής και σε ελέγξιμη κανονική μορφή πολλαπλών μεταβλητών, φαίνεται ότι από τη συνήθη H θεωρία [30] ότι αν ( A, E ) είναι παρατηρήσιμα, ισχύει ότι G () όπου αν υπάρχει μια μήτρα θετικά ορισμένη φραγμένη εξίσωση Riccati G( ) E( I A) D, αν και μόνο P που ικανοποιεί τη πραγματική 0 A P PA PDD P E E. (.59) Είναι γνωστό ότι η σχέση (.59) έχει μια μη αρνητικά ορισμένη λύση αν και μόνο αν, η Hamiltoia μήτρα A E E DD A (.60) δεν έχει αυστηρά φανταστικές ιδιοτιμές. Σε αυτή την περίπτωση με V ( x) x Px ο προσαρμοστικός ελεγκτής με ανάδραση με νόμο αναπροσαρμογής (.50), ή ισοδύναμα, ( ) ˆ ( ( ) ) ( ( ) ) K t QG x t G x t Px( t) F ( x( t) ) Y, K(0) K 0 (.6) εγγυάται καθολική ασυμπτωτική ευστάθεια του μη γραμμικού συστήματος χωρίς διαταραχές ( wt ( ) 0) (.45), όπου f( x ) και Gx ( ) δίνονται από τη (.7). Επιπλέον η λύση x( t), t 0 του μη-γραμμικού δυναμικού συστήματος κλειστού βρόχου (.45) και (.49) ικανοποιεί με βεβαιότητα τον περιορισμό φραγμένου κέρδους (oexpaivity cotrait) (.5). 49
Τελικά αν οι f( x ) και Gx ( ) οι οποίες δίνονται από τη (.7) περιέχουν αβεβαιότητα και G ( x) BuG ( x ), όπου το πρόσημο της B u είναι γνωστό, τότε με τη χρήση μιας ταυτόσημης προσέγγισης όπως στην Παράγραφο., μπορούμε να δείξουμε ότι ο κανόνας προσαρμοστικού ελέγχου με ανάδραση με νόμο αναπροσαρμογής u t G x t K t F x t (.6) ( ) ( ( )) ( ) ( ( )), K( t) B0V ( x( t)) F ( x( t)) Y, K(0) K 0, (.63) όπου το B 0 ορίζεται όπως και στην Παράγραφο.., εγγυάται την ασυμπτωτική ευστάθεια και τη συνθήκη φραγμένου κέρδους των (.45) και (.46)..5 Σύνοψη κεφαλαίου Στο κεφάλαιο αυτό παρουσιάσαμε το κύριο πλαίσιο ενός προσαρμοστικού ελεγκτή για προσαρμοστική ευστάθεια, απόρριψη διαταραχών και εκτέλεση εντολών, για μη γραμμικά πολυμεταβλητά δυναμικά συστήματα, με αβεβαιότητα και ταιριασμένες, εξωγενείς, φραγμένες διαταραχές. Στη συνέχεια, το πλαίσιο που αναπτύξαμε αρχικά, το ειδικεύουμε για δυναμικά συστήματα μιας εισόδου σε κανονική μορφή, με αβεβαιότητα. Τέλος επεκτείνουμε τα αποτελέσματα αυτά για μη γραμμικά δυναμικά συστήματα με αβεβαιότητα και εξωγενείς L διαταραχές, χωρίς η προσαρμοσμένη συνθήκη να είναι απαραίτητη προϋπόθεση. Στο επόμενο κεφάλαιο παρουσιάζονται κάποια διευκρινιστικά, επεξηγηματικά αριθμητικά παραδείγματα. 50
Κεφάλαιο 3 Παραδείγματα εφαρμογής προσαρμοστικού έλεγχου 3.. Εισαγωγή Σε αυτό το κεφάλαιο παρουσιάζουμε αρκετά αριθμητικά παραδείγματα για να επιδείξουμε τη χρήση του προτεινόμενου άμεσου προσαρμοστικού ελέγχου, για προσαρμοστική ευστάθεια, απόρριψη διαταραχής και εκτέλεση εντολών. 3.. Παραδείγματα εφαρμογής του προτεινόμενου προσαρμοστικού ελεγκτή Παράδειγμα 3. Θεωρούμε το σύστημα ελέγχου Lieard με αβεβαιότητα, που δίνεται από την 4 z( t) ( z ( t) ) z( t) z( t) tah( z( t)) bu( t ), z(0) z0, z(0) z0, t 0 (3.64) 5
όπου,,,, b είναι άγνωστα. Να σημειωθεί ότι με x zκαι x z, η (3.64) μπορεί να γραφτεί σε μορφή χώρου κατάστασης (.) με x x, x, f ( x) x, x tah x ( x ) x και G( x) 0, b. 4 Εδώ υποθέτουμε ότι f( x) είναι άγνωστο και μπορεί να παραμετροποιηθεί ως f ( x) x, x x tah x x x, όπου,, 3 και 4 είναι 4 3 4 άγνωστες σταθερές. Επιπροσθέτως, θεωρούμε ότι το gb είναι γνωστό. Στη συνέχεια, έστω b έτσι ώστε K g,, 3 4 F( x) x, x, tah( x ) x x και 4 όπου, είναι αυθαίρετες βαθμωτές, 0 f( x) f ( x),, 3 4 F( x) b b 0 x. (3.65) Τώρα, με την κατάλληλη επιλογή των και, φαίνεται από το Πόρισμα. ότι ο προσαρμοστικός ελεγκτής με ανάδραση (.6) με wt ( ) 0 εγγυάται ότι x () t 0 καθώς t. Ειδικά εδώ επιλέγουμε, και R I έτσι ώστε το P το οποίο ικανοποιεί τη (.) δίνεται από 3 P. (3.66) Με,,,, b 3, Y I 4 και αρχικές συνθήκες x(0), και K (0) 0, 0, 0, 0, τα παρακάτω σχήματα δείχνουν την απόκριση των καταστάσεων x () t και x () t σε σχέση με το χρόνο, καθώς και το διάγραμμα τροχιών, το σήμα έλεγχου και το προσαρμοστικό κέρδος συναρτήσει του χρόνου, για το σύστημα με και χωρίς έλεγχο. 5
Σχήμα 3.5: Αποκρίσεις καταστάσεων x () t και x () t συναρτήσει του χρόνου- Ελέγξιμο Σύστημα Σχήμα 3.6: Απόκριση της εισόδου ut () συναρτήσει του χρόνου-ελέγξιμο σύστημα 53
Σχήμα 3.7: Διάγραμμα τροχιών για ελέγξιμο σύστημα Σχήμα 3.8: Προσαρμοστικό κέρδος συναρτήσει του χρόνου για ελέγξιμο σύστημα 54
Σχήμα 3.9: Διάγραμμα τροχιών για μηδενική είσοδο Σχήμα 3.0: Αποκρίσεις καταστάσεων x () t και x () t συναρτήσει του χρόνου για μηδενική είσοδο 55
Σχήμα 3.: Προσαρμοστικό κέρδος συναρτήσει του χρόνου για μηδενική είσοδο Με την εφαρμογή του προτεινόμενου προσαρμοστικού ελέγχου οι καταστάσεις οδηγούνται ταχύτατα στο μηδέν (επιθυμητό σημείο ισορροπίας). Από τις παραπάνω χρονικές αποκρίσεις επιβεβαιώνεται η αποδοτικότητα του προσαρμοστικού ελεγκτή καθώς και η εγγύηση της ευστάθειας του κλειστού βρόχου καθώς όντως το x() t 0 καθώς t. Η σύγκλιση (και αντίστοιχα η ευστάθεια) γίνεται εμφανής στο διάγραμμα τροχιών των καταστάσεων. Οι καταστάσεις συγκλίνουν στο επιθυμητό μηδενικό σημείο ισορροπίας ενώ το μη ελεγχόμενο, δεν συγκλίνει στο μηδέν. 56
Παράδειγμα 3. Έστω το σύστημα ελέγχου Va der Pol ταλαντωτή με αβεβαιότητα που δίνεται από z( t) ( z ( t)) z( t) z( t) bu( t ), z(0) z 0, z(0) z0, t 0 (3.67) όπου, b είναι άγνωστα. Να σημειωθεί ότι με x z και x z, η (3.67)μπορεί να γραφτεί σε μορφή χώρου κατάστασης (.) με x x, x, f ( x) x, x ( x ) x και G( x) 0, b. Εδώ υποθέτουμε ότι f( x) είναι άγνωστη και μπορεί να παραμετροποιηθεί ως f ( x) x, x x x x, όπου και είναι άγνωστες σταθερές. Επιπρόσθετα υποθέτουμε ότι το F( x) x, x x και K g, b βαθμωτός, έτσι ώστε gb είναι γνωστό. Στη συνέχεια έστω 0 f( x) f ( x), F( x) b b όπου είναι ένας αυθαίρετος 0 x. Τώρα, με την κατάλληλη επιλογή των φαίνεται από το Πόρισμα. ότι ο προσαρμοστικός ελεγκτής με ανάδραση (.6) με wt ( ) 0 εγγυάται ότι x () t 0 καθώς t. Ειδικά εδώ επιλέγουμε και R I έτσι ώστε το P το οποίο ικανοποιεί τη (.) δίνεται από τη (3.66). Με, b 3 Y I και αρχικές συνθήκες x(0), και K (0) 0 0, τα επόμενα σχήματα δείχνουν τις απεικονίσεις των καταστάσεων, της εισόδου, τα διαγράμματα τροχιών καθώς και το προσαρμοστικό κέρδος, στην περίπτωση εφαρμογής του προσαρμοστικού ελέγχου και στην περίπτωση μηδενικών εισόδων. 57
Σχήμα 3.: Αποκρίσεις καταστάσεων x () t και x () t συναρτήσει του χρόνου- Ελέγξιμο Σύστημα Σχήμα 3.3: Απόκριση της εισόδου ut () συναρτήσει του χρόνου- Ελέγξιμο Σύστημα 58
Σχήμα 3.4: Διάγραμμα τροχιών για ελέγξιμο σύστημα Σχήμα 3.5: Προσαρμοστικό κέρδος συναρτήσει του χρόνου για ελέγξιμο σύστημα 59
Σχήμα 3.6: Διάγραμμα τροχιών για μηδενική είσοδο Σχήμα 3.7: Αποκρίσεις καταστάσεων x () t και x () t συναρτήσει του χρόνου για μηδενική είσοδο 60
Σχήμα 3.8: Προσαρμοστικό κέρδος συναρτήσει του χρόνου για μηδενική είσοδο Παρατηρούμε ότι οι καταστάσεις συγκλίνουν στο μηδέν, όπως και στο προηγούμενο παράδειγμα, ύστερα από την εφαρμογή του προτεινόμενου ελέγχου, με σχετικά μεγαλύτερη όμως καθυστέρηση. Η σύγκλιση (και αντίστοιχα η ευστάθεια) γίνεται επίσης εμφανής στο διάγραμμα τροχιών των καταστάσεων. Οι καταστάσεις συγκλίνουν στο επιθυμητό μηδενικό σημείο ισορροπίας ενώ το μη ελεγχόμενο σύστημα οδηγείται στην αστάθεια.. Παράδειγμα 3.3 Ας θεωρήσουμε το σύστημα ελέγχου Rayleigh με αβεβαιότητα, το όποιο δίνεται από 3 z( t) ( z( t) z ( t)) z( t) bu( t) d ˆ, z(0) z0, z(0) z0, t 0 (3.68) όπου,, b είναι άγνωστα και ˆd είναι μια άγνωστη σταθερή διαταραχή. Να σημειωθεί ότι με x z και x z, η (3.68) μπορεί να γραφτεί σε μορφή χώρου κατάστασης (.) με x x, x και f ( x) x, x ( x x ), G( x) 0, b, J( x) 0 dˆ και wt ( ). 3 Εδώ υποθέτουμε ότι η f( x ) είναι άγνωστη και μπορεί να παραμετροποιηθεί ως 6
3 3 f ( x) x, x x x, όπου, και 3 είναι άγνωστες σταθερές. Επιπρόσθετα υποθέτουμε ότι το gb είναι γνωστό. Στη συνέχεια έστω 3 F( x) x, x, x και K g, 3, όπου b αυθαίρετες βαθμωτές, έτσι ώστε το f ( x ) δίνεται από τη (3.65)., είναι Επιλέγοντας κατάλληλα, τα και, φαίνεται από το Πόρισμα. ότι ο προσαρμοστικός ελεγκτής με ανάδραση (.6) εγγυάται ότι x () t 0 καθώς t. Ειδικά εδώ επιλέγουμε, και R I έτσι ώστε η P η οποία ικανοποιεί τη (.) δίνεται από τη (3.66). Με, b 3, d ˆ 3, Y I 3,, και αρχικές συνθήκες x (0),, K (0) 0 0 0 και (0) 0, τα επόμενα σχήματα δείχνουν τις απεικονίσεις των καταστάσεων, της εισόδου, τα διαγράμματα τροχιών, στην περίπτωση εφαρμογής του προσαρμοστικού ελέγχου καθώς και στην περίπτωση μηδενικών εισόδων., 3 Σχήμα 3.9: Αποκρίσεις καταστάσεων x () t και x () t συναρτήσει του χρόνου- Ελέγξιμο Σύστημα 6
Σχήμα 3.0: Απόκριση της εισόδου ut () συναρτήσει του χρόνου για ελέγξιμο σύστημα Σχήμα 3.: Διάγραμμα τροχιών για ελέγξιμο σύστημα 63
Σχήμα 3.: Διάγραμμα τροχιών για μηδενική είσοδο Σχήμα 3.3: Αποκρίσεις καταστάσεων x () t και x () t συναρτήσει του χρόνου για μηδενική είσοδο 64
Και σε αυτό το παράδειγμα παρατηρούμε ότι με την εφαρμογή του προτεινόμενου προσαρμοστικού ελέγχου οι καταστάσεις οδηγούνται στο μηδέν (επιθυμητό σημείο ισορροπίας), με ακόμα μεγαλύτερη καθυστέρηση. Από τις παραπάνω χρονικές αποκρίσεις, επιβεβαιώνεται η αποδοτικότητα του προσαρμοστικού ελεγκτή καθώς και η εγγύηση της ευστάθειας του κλειστού βρόχου καθώς όντως το x() t 0 καθώς t. Η σύγκλιση (και αντίστοιχα η ευστάθεια) γίνεται εμφανής και σε αυτή την περίπτωση στο διάγραμμα τροχιών των καταστάσεων. Οι καταστάσεις συγκλίνουν στο επιθυμητό μηδενικό σημείο ισορροπίας με σχετικά μικρές ταλαντώσεις ενώ το μη ελεγχόμενο σύστημα οδηγείται στην αστάθεια. Παράδειγμα 3.4 Το παρακάτω παράδειγμα ανασκοπεί, τη χρησιμότητα του προτεινόμενου πλαισίου προσαρμοστικής ευστάθειας για συστήματα με χρονικά μεταβαλλόμενες διαταραχές. Συγκεκριμένα ας θεωρήσουμε το σύστημα ελέγχου Duffig με αβεβαιότητα, το όποιο δίνεται από 3 mz( t) cz( t) kz( t) ka z ( t) bu( t) Aco t, z(0) z0, z(0) z 0, t 0 (3.69) όπου m, c, k, a, b και A είναι άγνωστα. Να σημειωθεί ότι με x x zκαι z, η (3.69) μπορεί να γραφτεί σε μορφή χώρου κατάστασης (.) με x x, x, J( x) 0 A m 3 k c ka f ( x) x, x x x m m m, Gx ( ) 0, b m, και w( t) co t. Εδώ υποθέτουμε ότι και gb είναι γνωστά και η f( x ) μπορεί να παραμετροποιηθεί ως 3 3 f ( x) x, x x x, όπου, και 3 είναι άγνωστες σταθερές. 3 m Στη συνέχεια έστω F( x) x, x, x και K g, 3, b όπου και, είναι αυθαίρετες βαθμωτές, έτσι ώστε η f ( x ) δίνεται από τη σχέση (3.65). Τώρα, με την κατάλληλη επιλογή των και, φαίνεται από το Πόρισμα. ότι ο προσαρμοστικός ελεγκτής με ανάδραση (.6) εγγυάται 65
ότι x () t 0 καθώς t. Ειδικά εδώ επιλέγουμε, και R I έτσι ώστε το P το οποίο ικανοποιεί τη (.) δίνεται από τη (3.66). Με m, c 0., k, a, A 4,, b 3, Y I, 3, και αρχικές συνθήκες x (0),, K (0) 0 0 0 και (0) 0, τα παρακάτω σχήματα δείχνουν τις απεικονίσεις των καταστάσεων, της εισόδου, τα διαγράμματα τροχιών καθώς και τα προσαρμοστικά κέρδη Κ και Φ, στην περίπτωση εφαρμογής του προσαρμοστικού ελέγχου και στην περίπτωση μηδενικών εισόδων. Σχήμα 3.4: Αποκρίσεις καταστάσεων x () t και x () t συναρτήσει του χρόνου- Ελέγξιμο Σύστημα 66
Σχήμα 3.5: Απόκριση της εισόδου ut () συναρτήσει του χρόνου-ελέγξιμο σύστημα Σχήμα 3.6: Διάγραμμα τροχιών για ελέγξιμο σύστημα 67
Σχήμα 3.7: Προσαρμοστικό κέρδος Κ συναρτήσει του χρόνου για ελέγξιμο σύστημα Σχήμα 3.8: Προσαρμοστικό κέρδος Φ συναρτήσει του χρόνου για ελέγξιμο σύστημα 68
Σχήμα 3.9: Διάγραμμα τροχιών για μηδενική είσοδο Σχήμα 3.30: Αποκρίσεις καταστάσεων x () t και x () t συναρτήσει του χρόνου για μηδενική είσοδο 69
Σχήμα 3.3: Προσαρμοστικό κέρδος Κ συναρτήσει του χρόνου για μηδενική είσοδο Σχήμα 3.3: Προσαρμοστικό κέρδος Φ συναρτήσει του χρόνου για μηδενική είσοδο 70
Όπως βλέπουμε για το παράδειγμα με χρονικά μεταβαλλόμενες διαταραχές, οι καταστάσεις συγκλίνουν στο μηδέν, όπως και στα προηγούμενα, ύστερα από την εφαρμογή του προτεινόμενου ελέγχου, με σχετικά μεγαλύτερη όμως καθυστέρηση, ενώ όπως και πρωτύτερα για μηδενικές εισόδους το σύστημα οδηγείται στην αστάθεια. Από τα διαγράμματα τροχιών γίνεται ακόμα πιο εμφανής η σύγκλιση, καθώς το σύστημα με έλεγχο οδηγείται μεν στην ευστάθεια, με μικρές ταλαντώσεις, ενώ με μηδενικές εισόδους οδηγείται στην αστάθεια. Παράδειγμα 3.5 Το παρακάτω παράδειγμα λαμβάνει υπόψη τη χρησιμότητα του προτεινόμενου πλαισίου προσαρμοστικής ευστάθειας για συστήματα με χρονικά μεταβαλλόμενη δυναμική. Συγκεκριμένα ας θεωρήσουμε το σύστημα Mathieu με έλεγχο και αβεβαιότητα, το όποιο δίνεται από z( t) ( co t) z( t) bu( t ) z(0) z 0, z(0) z0, t 0 (3.70) όπου,, b είναι άγνωστα. Να σημειωθεί ότι με x z και x z, η (3.70) μπορεί να γραφτεί σε μορφή χώρου κατάστασης (.) με x x, x, (, ), ( co ) f t x x t x και G( t, x) 0, b. Εδώ υποθέτουμε ότι το g b είναι γνωστό και η f ( t, x ) μπορεί να παραμετροποιηθεί ως f ( t, x) x, x co( t) x, όπου και είναι άγνωστες σταθερές. Στη συνέχεια έστω F( t, x) x, co( t) x, x και b ώστε K g,, όπου και είναι αυθαίρετες βαθμωτές, έτσι 0 f ( x) x. Τώρα, με την κατάλληλη επιλογή των και, φαίνεται από το Πόρισμα. και την Παρατήρηση. ότι ο προσαρμοστικός ελεγκτής με ανάδραση (.6) με wt ( ) 0 εγγυάται ότι x() t 0 καθώς t. Ειδικά εδώ επιλέγουμε, και R I έτσι ώστε το P το οποίο ικανοποιεί τη (.) να δίνεται από τη (3.66). Με, 0.4, b 3, Y I, και 3 αρχικές συνθήκες x(0), και K (0) 0 0 0 7, τα επόμενα σχήματα δείχνουν τις απεικονίσεις των καταστάσεων, της εισόδου, και τα διαγράμματα
τροχιών, στην περίπτωση εφαρμογής του προσαρμοστικού ελέγχου καθώς και στην περίπτωση μηδενικών εισόδων. Σχήμα 3.33: Αποκρίσεις καταστάσεων x () t και x () t συναρτήσει του χρόνου με έλεγχο Σχήμα 3.34: Απόκριση της εισόδου ut () συναρτήσει του χρόνου-ελέγξιμο σύστημα 7
Σχήμα 3.35: Διάγραμμα τροχιών για ελέγξιμο σύστημα Σχήμα 3.36: Διάγραμμα τροχιών για μηδενική είσοδο 73
Σχήμα 3.37: Αποκρίσεις καταστάσεων x () t και x () t συναρτήσει του χρόνου για μηδενική είσοδο Παρατηρώντας το σύστημα κλειστού βρόχου με χρονικά μεταβαλλόμενη δυναμική, κατανοούμε ότι και σε αυτή την περίπτωση, με την εφαρμογή του προτεινόμενου προσαρμοστικού ελέγχου οι καταστάσεις οδηγούνται ταχύτατα στο μηδέν (επιθυμητό σημείο ισορροπίας). Από τις παραπάνω χρονικές αποκρίσεις, επιβεβαιώνεται η αποδοτικότητα του προσαρμοστικού ελεγκτή καθώς και η εγγύηση της ευστάθειας του κλειστού βρόχου καθώς όντως το x() t 0 καθώς t. Ακόμα η σύγκλιση (και αντίστοιχα η ευστάθεια) γίνεται εμφανής στο διάγραμμα τροχιών των καταστάσεων. Παράδειγμα 3.6 Το παρακάτω παράδειγμα λαμβάνει υπόψη τη χρήση του προτεινόμενου πλαισίου προσαρμοστικού ελέγχου για εκτέλεση εντολών. Συγκεκριμένα ας θεωρήσουμε το σύστημα απόσβεσης μάζας-ελατηρίου με αβεβαιότητα και μη γραμμική δυσκαμψία, το όποιο δίνεται από mx t cx t k x t k x t bu t dw ˆ t x(0) x0, x(0) x 0, t 0 (3.7) 3 ( ) ( ) ( ) ( ) ( ) ( ), 74
όπου m, c, k, k είναι θετικές άγνωστες σταθερές, και το b είναι άγνωστο αλλά το gb, γνωστό. Έστω το rd () t, t 0 είναι ένα επιθυμητό σήμα εντολής και ορίζουμε την κατάσταση σφάλματος e( t) x( t) rd ( t ) έτσι ώστε η δυναμική σφάλματος να δίνεται από me t ce t k k e t r t e t r t e t bu t dw ˆ t ( ) ( ) ( ( ( ) 3 d( ) ( ) 3 d ( ))) ( ) ( ) ( ) mr t cr t k r t k r t e(0) e0, e(0) e 0, t 0 (3.7) 3 ( d ( ) d ( ) d ( ) d ( ), Εδώ υποθέτουμε ότι το σήμα διαταραχής wt () είναι ένα ημιτονοειδές σήμα με άγνωστο πλάτος και φάση, τα οποία είναι dw ˆ ( t) A A i( t ) A i t A co t, όπου ta ( A / A ) και A, A είναι άγνωστες σταθερές. Επιπροσθέτως η επιθυμητή τροχιά δίνεται από τον τύπο t 0 rd ( t ) tah, 5 έτσι ώστε το στίγμα (η θέση) της μάζας να μετακινείται από το - στο τη χρονική στιγμή t = 0 ec.να σημειωθεί ότι με e e και e e, η (3.7) μπορεί να γραφτεί σε μορφή χώρου κατάστασης (.5) με e e, e, c f ( r, e) e, ( k k ( e 3r e 3 r )) e e m m t d d d J ( t, e) 0, dˆ m t 6 x t όπου t 3 ( ) i, co, ( ), ( ), ( ), ( ) t d d d d, G( t, e) 0, b m, dˆ A, A, k, k, c, m, και w t t t r t r t r t r t.εδώ παραμετροποιούμε 3 την f ( r, e) e, e e e r e r e, όπου i, i,,5, είναι t d 3 4 d 5 d 3 άγνωστες σταθερές. Στη συνέχεια έστω F( r, e) e, e, e, r e, r e d d d m και Kg,,, 3, 4, 5όπου είναι αυθαίρετες b βαθμωτές, έτσι ώστε η f () e να δίνεται από την (.6). Τώρα, με την κατάλληλη επιλογή των και, φαίνεται από το Πόρισμα. και την Παρατήρηση.3 ότι ο προσαρμοστικός ελεγκτής με ανάδραση (.6) εγγυάται ότι et () 0 καθώς t. Ειδικά εδώ επιλέγουμε, και R I έτσι ώστε το P το οποίο ικανοποιεί τη (.) δίνεται από τη (3.66). Με m, c, k, k 0.5, dw ˆ ( t) i( t ),, b 3, Y I, I 5 6 75
και αρχικές συνθήκες e (0) 0, 0, K(0) 0 x 5και (0) 0 x 6, τα παρακάτω σχήματα δείχνουν τις απεικονίσεις των καταστάσεων, της εισόδου, τα διαγράμματα τροχιών καθώς και το προσαρμοστικό κέρδος Κ και Φ, στην περίπτωση εφαρμογής του προσαρμοστικού ελέγχου και στην περίπτωση μηδενικών εισόδων. Σχήμα 3.38: Αποκρίσεις καταστάσεων x () t και x () t συναρτήσει του χρόνου- Ελέγξιμο Σύστημα 76
Σχήμα 3.39: Απόκριση της εισόδου ut () συναρτήσει του χρόνου-ελέγξιμο σύστημα Σχήμα 3.40: Διάγραμμα τροχιών για ελέγξιμο σύστημα 77
Σχήμα 3.4: Προσαρμοστικό κέρδος Φ συναρτήσει του χρόνου για ελέγξιμο σύστημα Σχήμα 3.4: Προσαρμοστικό κέρδος Κ συναρτήσει του χρόνου για ελέγξιμο σύστημα 78
Σχήμα 3.43: Διάγραμμα τροχιών για μηδενική είσοδο Σχήμα 3.44: Αποκρίσεις καταστάσεων x () t και x () t συναρτήσει του χρόνου για μηδενική είσοδο 79
Σχήμα 3.45: Προσαρμοστικό κέρδος Φ συναρτήσει του χρόνου για μηδενική είσοδο Σχήμα 3.46: Προσαρμοστικό κέρδος Κ συναρτήσει του χρόνου για μηδενική είσοδο 80
Από τις παραπάνω απεικονίσεις παρατηρούμε ότι ναι μεν οι καταστάσεις του κλειστού συστήματος με εφαρμογή του προτεινόμενου προσαρμοστικού ελέγχου οδηγούνται στο μηδέν (επιθυμητό σημείο ισορροπίας), όμως με αρκετά μεγάλη καθυστέρηση, κάτι που είναι εμφανές και από το διάγραμμα τροχιών. Το σύστημα για μηδενική είσοδο, οδηγείται και εδώ στην αστάθεια. 3.. Σύνοψη κεφαλαίου Στο κεφάλαιο αυτό δοκιμάστηκε το πλαίσιο προσαρμοστικού ελέγχου που αναπτύχτηκε στο ο Κεφάλαιο. Συγκεκριμένα, τον εφαρμόσαμε σε διαφορετικά συστήματα, τα οποία χαρακτηρίζονται από αβεβαιότητα και έλεγχο όπως τα συστήματα Lieard, Va der Paul ταλαντωτής και το σύστημα Rayleigh. Επίσης, ελέγχθηκε σε συστήματα τα οποία επιπλέον παρουσιάζουν χρονικά μεταβαλλόμενες διαταραχές όπως το σύστημα Duffig ή χρονικά μεταβαλλόμενη δυναμική σαν το σύστημα Mathieu. Επιπρόσθετα εξετάσαμε τη χρήση του ελεγκτή για εκτέλεση εντολών. Σε κάθε περίπτωση η αποδοτικότητα του προσαρμοστικού ελεγκτή επιβεβαιώθηκε, καθώς μας οδηγεί σε μερικώς ασυμπτωτική ευστάθεια. Στο επόμενο κεφάλαιο εφαρμόζουμε το πλαίσιο που αναπτύξαμε πρωτύτερα, για άμεσο προσαρμοστικό έλεγχο κατά Lyapuov, ώστε να καταστείλουμε το φαινόμενο της θερμοακουστικής αστάθειας, στη διαδικασία καύσης. 8
8
Κεφάλαιο 4 Προσαρμοστικός έλεγχος για αστάθειες Θερμοακουστικής Καύσης 4. Εισαγωγή Οι δευτερογενείς καυστήρες και οι αυλοαεριωθητήρες (ramjet) που έχουν υψηλή απόδοση των αεροκινητήρων τους, συχνά αντιμετωπίζουν αστάθειες καύσης σε κάποια κατάσταση λειτουργίας. Η καύση σε αυτές τις μηχανές υψηλής ενεργειακής πυκνότητας, είναι αρκετά ευάλωτη σε διαταραχές ροής, κάτι το οποίο οδηγεί σε αυξομειώσεις της στιγμιαίας ταχύτητας έκλυσης θερμότητας στον καυστήρα. Αυτή η ασταθής καύση παρέχει μια ακουστική πηγή (πηγή ήχου) που έχει ως αποτέλεσμα αυτοδιεγειρόμενες ταλαντώσεις. Συγκεκριμένα, η ασταθής καύση, παράγει ακουστική πίεση και ταλαντώσεις ταχύτητας, οι οποίες με τη σειρά τους διαταράσσουν την καύση ακόμα περισσότερο [9,]. Αυτές οι ταλαντώσεις πίεσης, γνωστές ως θερμοακουστική αστάθεια, συχνά συνεπάγονται υψηλά επίπεδα δονήσεων (παλμών), τα οποία προκαλούν μηχανικές βλάβες, υψηλά επίπεδα ακουστικού θορύβου, υψηλούς ρυθμούς καύσης, ακόμα και τήξη υλικών. Συνεπώς, υπάρχει σοβαρή ανάγκη για ενεργό έλεγχο ώστε να περιοριστούν οι καύσεις που προξενούν αστάθειες πίεσης. Λόγω των περίπλοκων, και πολυσύνθετων φυσικών φαινομένων στις διεργασίες καύσης, που περιλαμβάνουν μεταξύ αυτών, ακουστική, 83
θερμοδυναμική, μηχανική υγρών και κινητική χημικών ουσιών, καθιστούν τα πεπερασμένα διαστατικά, γραμμικά ή μη γραμμικά μοντέλα, αναπόφευκτα ανακριβή. Βασικά στοιχεία του συστήματος, όπως η απόσβεση, η συχνότητα και η μορφή αρμονικής συνιστώσας, συνήθως δεν είναι επαρκώς γνωστά. Επιπρόσθετα, οι προσεγγίσεις των αυξομειώσεων της πίεσης και της ταχύτητας -στις οποίες συμπεριλαμβάνεται ο χρονικός μέσος όρος στις ισχύουσες εξισώσεις συστήματος- καταλήγουν σε περαιτέρω αβεβαιότητα συστήματος, η οποία εκδηλώνεται ως μια υψηλά δομημένη, σταθερή, πραγματική, παραμετρική αβεβαιότητα σε ρυθμικές συχνότητες και σε απόσβεση [,3]. Έτσι, για καταστολή των ταλαντώσεων πίεσης στις διαδικασίες καύσης, η αβεβαιότητα της μοντελοποίησης του συστήματος, καθίστα αναγκαία τη χρήση μη γραμμικού προσαρμοστικού ελέγχου. Σε αυτό το τμήμα, εφαρμόζουμε το πλαίσιο που αναπτύξαμε στην Παράγραφο., για άμεσο προσαρμοστικό έλεγχο κατά Lyapuov, ώστε να καταστείλουμε το φαινόμενο της θερμοακουστικής αστάθειας, στη διαδικασία καύσης. Το συνολικό πλαίσιο, καταδεικνύει, ότι οι προτεινόμενοι προσαρμοστικοί ελεγκτές, παρέχουν σημαντική σθεναρότητα στον περιορισμό της αστάθειας από θερμοδυναμική καύση, παρουσία παραμετρικής αβεβαιότητας στο μοντέλο. 4. Εφαρμογή προτεινόμενου ελεγκτή για καταστολή θερμοακουστικής αστάθειες Για να αναπτύξουμε ένα μοντέλο χώρου κατάστασης για τη διαδικασία καύσης η οποία συλλαμβάνει τη σύζευξη μεταξύ ασταθούς καύσης και ακουστικής, θεωρούμε τις εξισώσεις διατήρησης μάζας, ορμής και ενέργειας, για ένα μείγμα δυο φάσεων στον καυστήρα. Συγκεκριμένα, οι εξισώσεις διατήρησης δίνονται [3] t ug p, (4.77) u t g u u p g g, (4.78) p t p u u p g g, (4.79) 84
,όπου είναι η τοπική πυκνότητα του μείγματος, u g η τοπική ταχύτητα του αέριου μείγματος, p η τοπική πίεση, η αναλογία μείγματος για διαφορετικές θερμοκρασίες, αντιπροσωπεύει το ρυθμό μετατροπής μάζας από τη συμπυκνωμένη φάση σε αέριο, ανά μονάδα όγκου, είναι η δύναμη αλληλεπίδρασης μεταξύ αερίου και συμπυκνωμένης φάσης, το ποσό απελευθέρωσης θερμότητας που σχετίζεται με χημικές αντιδράσεις και τη μεταφορά ενέργειας μεταξύ υγρής-αέριας φάσης, συμβολίζει τον τελεστή ανάδελτα, και το, ορίζει το εσωτερικό γινόμενο στο.σε αυτή τη διατύπωση, υποθέτουμε ότι σταγονίδια έχουν διασκορπιστεί μέσα στο αέριο, το οποίο συνεπάγεται ότι αν pl και p g είναι οι τοπικές πιέσεις της υγρής και αέριας φάσης αντίστοιχα, p p, p p g και συνεπώς [3] l g p R g, (4.80) όπου R είναι η σταθερά αερίου για το μείγμα και g είναι η θερμοκρασία του αερίου. Το πλαίσιο για την ανάλυση αστάθειας καύσης, βασίζεται στις εξισώσεις διατήρησης (4.77)-(4.79) για ολική μάζα, ορμή και ενέργεια, έχοντας εκφράσει στην εξίσωση ενέργειας, τη μεταβλητή πίεσης ως εξαρτώμενη μεταβλητή. Γράφοντας όλες τις εξαρτημένες μεταβλητές ως αθροίσματα του μέσου και των μερών που παρουσιάζουν διακύμανση, που δίνονται από p r, r, r3, t p p r, r, r3, t, (4.8) r, r, r3, t r, r, r3 r, r, r3, t, (4.8) u r, r, r, t u r, r, r u r, r, r, t, (4.83) g 3 g 3 g 3 r, r, r, t r, r, r r, r, r, t, (4.84) g 3 g 3 g 3 όπου r, r, r 3 αντιπροσωπεύουν γενικευμένες συντεταγμένες, και θεωρώντας ότι οι μέσες τιμές p,, u g, g δεν μεταβάλλονται με το χρόνο και η μέση πίεση είναι ομοιόμορφη μέσα στον θάλαμο καύσης, η προσέγγιση δεύτερης τάξης των (4.77)-(4.80) μας δίνει p a p t, ˆ p, (4.85) 85
όπου p a είναι η τοπική μέση ταχύτητα ήχου μέσα στον καυστήρα, ˆ είναι το κανονικό διάνυσμα με φορά προς τα έξω της επιφάνειας του θαλάμου καύσης, και και είναι οι μη γραμμικοί όροι που περικλείουν όλες τις φυσικές διεργασίες των ακουστικών κινήσεων, μέσης ροής, και καύσης υπό συνθήκες χωρίς εξωτερικό εξαναγκασμό [3]. Για να ελέγξουμε τις αστάθειες καύσης, πρέπει να εφαρμοστούν κατάλληλες εξωτερικές δυνάμεις ώστε να επηρεαστεί η ασταθής μάζα, ορμή και ενέργεια στο θάλαμο καύσης. Ως εκ τούτου, στις εξισώσεις διατήρησης συμπεριλαμβάνονται δυνάμεις ελέγχου, μέσω μετατροπής των μη ομογενών όρων των (4.77)-(4.79), ώστε να περιλαμβάνουν όρους εισόδου ελέγχου της μορφής c, c, και c αντίστοιχα. Οι συγκεκριμένες μορφές των c, c και c εξαρτώνται από τον τύπο ενεργοποίησης έλεγχου που χρησιμοποιείται. Σε αυτή την περίπτωση, η (4.85) γίνεται p r, r, r3, t p r, r, r3, t r, r, r3, t c r, r, r3, t, a t (4.86) ˆ p r, r, r, t r, r, r, t r, r, r, t, (4.87) 3 3 c 3 όπου c c a c t, ˆ c c (4.88) αναπαριστούν εξωτερικές εισόδους, λόγω της ενεργοποίησης έλεγχου. Εφόσον οι όροι εισόδου στις σχέσεις (4.86),(4.87), αντιμετωπίζονται ως μικρές διαταραχές στο ακουστικό πεδίο, η λύση για το πεδίο ασταθούς πίεσης p r, r, r3, t μπορεί να προσεγγιστεί μέσω p r, r, r, t p ( t) r, r, r, (4.89) 3 i j k i j k 3 i, j, k 0 όπου ijk είναι οι κανονικές ιδομορφές σχηματισμού ενός πλήρους συνόλου εξισώσεων ορθογωνικής βάσης, που ικανοποιούν 0 r, r, r k r, r, r, (4.90) i j k 3 i j k i j k 3 0 ˆ r, r, r, i, j, k 0,,,, (4.9) i j k 3 86
όπου k i j k, i, j, k 0,,,, είναι οι κυματαριθμοί που ορίζονται από i j k k i j k a, και i j k, i, j, k 0,,,, είναι οι φυσικές συχνότητες. Τώρα με τη χρήση ανάλυσης Galerki, από τις (4.86),(4.89)και (4.90), καταλήγουμε όπου i j k i j k i j k i j k i j k F u, (4.9) a F d d i j k, i j k i j k pe m i j k m (4.93) a u d d i j k, c i j k c i j k pe m i j k m (4.94) E d, (4.95) i j k i j k m όπου m είναι κάθε τυχαίος όγκος υλικού, μέσα στο συνεχές, m η επιφάνεια που περιβάλει τον όγκο m, ενώ d και d είναι ο απειροστός όγκος και η στοιχειώδης επιφάνεια, αντίστοιχα. Στη συνέχεια θεωρούμε m σημεία ακουστικών διεγερτών τα οποία παρέχουν διέγερση έλεγχου uˆ a () t στις θέσεις ra, ra, r a3, a,, m όπου υποθέτουμε ότι η μάζα και η ορμή δεν ελέγχονται, δηλαδή με 0 c και c 0, έχουμε r, r, r, t r, r, r uˆ ( t ), (4.96) c 3 a 3 a a m c r, r, r3, t 0 (4.97) όπου a, a,, m, είναι η χωρική συνάρτηση δέλτα, που βρίσκεται στα r, r, r r, r, r, a,, m με διαστάσεις 3 a a a3 (4.96) και (4.97), η (4.94) μορφοποιείται 3 ( ). Με χρήση των m a u ( t) uˆ ( t) r, r, r i j k a i j k a a a3 pei j k a (4.98) 87
Τέλος χρησιμοποιώντας ένα μονοδιάστατο μοντέλο καυστήρα, του οποίου η γεωμετρία είναι τέτοια ώστε οι διαμήκη μορφές να είναι αποζευγμένες από τις εγκάρσιες, εξυπακούεται ότι ο δείκτης i είναι ο μόνος δείκτης από τους i, j, k, που ισχύει. Επιπρόσθετα, υποκαθιστούμε το x για τις γενικευμένες συντεταγμένες r, r, r 3 έτσι ώστε L 0 A ( x) dx, όπου A ( x ) συμβολίζει εμβαδόν διατομής του καυστήρα, και L είναι το μήκος του καυστήρα. Σε αυτή την περίπτωση, η (4.9) γίνεται c c το i ( t) i i ( t) ( di p p( t) ei p p( t)) ( ai pq p ( t) q ( t) bi pq p ( t) q ( t)) ui ( t) p p q όπου οι σταθερές, d ip (4.99), e ip, a i p q και b i p q εξαρτώνται από τις ιδιομορφές χωρίς διέγερση και από τις φυσικές συχνότητες του καυστήρα [3], και η είσοδος έλεγχου στην th i μορφή δίνεται από m a u ( t) uˆ ( t) ( x ), (4.00) i a i a pei a όπου E L i i c 0 ( x) A ( x) dx και xa th αντιστοιχεί στη θέση του a ενεργοποιητή. Για να σχεδιάσουμε έναν άμεσο προσαρμοστικό ελεγκτή για συστήματα καύσης, εστιάζουμε στο μοντέλο μη γραμμικής καύσης που αναπτύξαμε παραπάνω, όπου οι παρούσες μη γραμμικότητες, οφείλονται στη δυναμική αερίων δευτέρας τάξης. Επιπρόσθετα υποθέτουμε ότι παρέχεται διέγερση από μεγάφωνα, ενώ καταμετράμε τις διακυμάνσεις πίεσης μέσω μικρόφωνων συσσώρευσης πίεσης. Χρησιμοποιώντας τις (4.99) και (4.00), ένα μη γραμμικό μοντέλο καυστήρα με δυο ιδιομορφές, δίνεται από x( t) x3( t ), x (0) x 0, t 0, (4.0) x( t) x4( t ), x(0) x 0, (4.0) x ( t) a x ( t) ( ) x ( t) F x ( t) x ( t) F x ( t) x ( t ) (4.03) 3 3 3 4 a ( ( x ˆ ˆ ) u( t) ( x) u( t)), pe i x3(0) x 30, 88
x ( t) a x ( t) ( ) x ( t) F x ( t) F x ( t ) (4.04) 4 4 3 a ( ( x ˆ ˆ ) u( t) ( x) u( t)), pe i x4(0) x 40, όπου x( t) ( t), x( t) ( t), x3( t) ( t), x4( t) ( t), uˆ i () t i,, είναι τα σήματα εισόδου έλεγχου, αύξησης/μείωσης, i e ii i ai dii αναπαριστά μια σταθερά συμβολίζει μια σταθερά μετατόπισης της συχνότητας, και είναι οι συχνότητες της πρώτης και δεύτερης ιδιομορφής, αντίστοιχα, ενώ F F 3, 5( ) F, 3 F, και. Στην περίπτωση όπου θεωρούμε έναν κυλινδρικό καυστήρα, με αμιγώς διαμήκεις ιδιομορφές και στα δυο άκρα του, τότε προκύπτει ότι οι δυο πρώτες ιδιομορφές δίνονται από i ( x) co( k x ), k i, i, (4.05) L i Για τις μη-διαστατοποιημένες παραμέτρους δεδομένων [4] (χρησιμοποιώντας τον συντελεστή-χρόνου t L/ a), a 0.044, a 0.0559, 0.006, 0.078,.,,, και x 0 0.0, 0., 0, 0, η δυναμική ανοιχτού βρόχου ( uˆ i ( t) 0, i, ) (4.0)-(4.04) οδηγεί σε αστάθεια οριακού κύκλου. Για να σχεδιάσουμε έναν άμεσο προσαρμοστικό ελεγκτή χρησιμοποιώντας το Πόρισμα., αξίζει να σημειωθεί ότι οι (4.0)-(4.04) μπορούν να γραφτούν σε μορφή χώρου κατάστασης (.), με x x, x x, x, 3 4 i f x ( ) 4 ax3 ( ) x Fx3x4 Fxx, ax4 ( ) x Fx3 Fx x x 3 89
0 0 a 0 0 Gx ( ), pe ( x) ( x) i ( x ) ( x ) όπου a i, i,, F i, j,,, και i ij, a ( 0) pe i θεωρούνται άγνωστες. Εδώ παραμετροποιούμε την f( x ) ως f ( x) x3, x4, ( l x l fl ( x )), όπου f ( x) x x, x x, x, x και l 3 4 3 l ( ) 0 a 0 0 ( ) 0 a, l F F 0 0 0 0 F F, είναι άγνωστες μήτρες σταθερών όρων. Επιπρόσθετα υποθέτουμε ότι 3 μεγάφωνα έχουν τοποθετηθεί στα x L και x L έτσι ώστε B u και 4 ( ) G x στη G( x) 0, G ( x) B u δίνονται από B u a pe i 0, 0 G ( ), x I Στη συνέχεια, έστω F( x) x, f ( x) και όπου x 4 είναι ένας αυθαίρετος πινάκας, έτσι ώστε l A f x x A x K 0 ( ), a,, pe g l l i όπου A0 0, I. Τώρα με την κατάλληλη επιλογή του φαίνεται από το Πόρισμα. ότι ο προσαρμοστικός ελεγκτής με ανάδραση (.6), με νόμο αναπροσαρμογής (.7), εγγυάται ότι xt ( ) 0 καθώς t. Συγκεκριμένα εδώ επιλέγουμε.5 0.5 0 0 5 0 4.5 90,
και R I 4, έτσι ώστε η P που ικανοποιεί την (.), δίνεται από.6667 0 0.6667 0 P 0.333 0 0.000, 0.6667 0 0.6667 0 0 0.000 0 0.667 Για να απεικονίσουμε τη δυναμική συμπεριφορά ενός συστήματος κλειστού βρόχου, έστω a 0.044, a 0.0559, 0.006, 0.078,.,,, Y I 8, και a 0.4. Στα παρακάτω σχήματα pe i φαίνονται οι αποκρίσεις του ελεγχόμενου συστήματος (.) με νόμο προσαρμοστικού έλεγχου με ανάδραση (.6),(.7) και αρχικές συνθήκες 0 0.0, 0., 0, 0, x K (0) 0 x 8 του συστήματος κλειστού βρόχου (.), (.6),(.7)..Το Πόρισμα. εγγυάται την ευστάθεια Σχήμα 4.47: Αποκρίσεις καταστάσεων x () t και x () t συναρτήσει του χρόνου 9
Σχήμα 4.48: Αποκρίσεις καταστάσεων x () t και 3 x () 4 t συναρτήσει του χρόνου Σχήμα 4.49: Απόκριση της εισόδου ut () συναρτήσει του χρόνου 9
Για να απεικονίσουμε τη σθεναρότητα του προτεινόμενου νόμου προσαρμοστικού ελέγχου, αυξάνουμε τη σταθερά αύξησης της πρώτης ιδιομορφής από a 0.044, σε a 0.070. Η απόκριση του συστήματος κλειστού βρόχου φαίνεται στα Σχήματα 4.50-4.5-4.5. Σχήμα 4.50: Αποκρίσεις καταστάσεων x () t και x () t συναρτήσει του χρόνου 93