Lecţia a 4-a. Estimarea stării. Compensarea cu estimator Ideea de estimare a stării Reacţia inversă după stare nu poate fi realizată (implementată) efectiv fără cunoaşterea stării curente. S-a văzut (cazul motorului electric) că există astfel de situaţii. Pe de altă parte, cazul modelului pe calculator analogic indică posibilitatea unei reconstituiri a stării unui sistem. Ca urmare se formulează următoarea problemă: dându-se sistemul ẋ = Ax + bu(t) y = c T x, x(0) = x 0 (1) să se determine starea curentă x(t) cunoscând variabilele terminale u(t) şi y(t). O primă soluţie ar fi ca, prin cunoaşterea lui A, b şi u(t), să se construiască un dispozitiv modelator cu aceleaşi caracteristici cu sistemul, care să furnizeze pe x(t). Dificultatea constă în necunoaşterea condiţiilor iniţială, dar presupunem că se poate elimina această dificultate. În acest caz ieşirea y(t) nu mai intervine. Structura din fig.1 este, evident, de tip circuit deschis, deoarece modul de obţinere a estimării ˆx nu depinde de rezultat - adică de ceea ce se întâmplă la ieşire. Ca orice sistem fără reacţie inversă, această structură este foarte dependentă de perturbaţiile de tot felul (în coeficienţi sau în starea iniţială). de exemplu, o eroare în condiţia iniţială e 0 = ˆx 0 x 0, e 0 < δ (2) va genera o eroare care se poate acumula în timp. Fie e x (t) această eroare; 1
u x y A, b c T A, b xˆ Figura 1: Estimarea în circuit deschis vom avea, conform schemei adoptate ẋ = Ax + bu(t), x(0) = x 0 ˆx = Aˆx + bu(t), ˆx(0) = ˆx 0 (3) ė x = ˆx ẋ = A(ˆx x) = Ae x, e x (0) = e 0 deci sistemul de evoluţie a erorii este unul liber (cu intrare identic nulă), comandat doar de condiţiile iniţiale care, cel puţin în cazul de faţă, au rolul unor perturbaţii. Evident, eroarea tinde să crească, chiar exponenţial, dacă se estimează starea unui sistem instabil, ceea ce face imposibilă aplicarea acestei soluţii în probleme de stabilizare. Ca urmare este necesară şi în acest caz aplicarea unei reacţii inverse în scopul aducerii la 0 al erorii cu ajutorul unui semnal de reacţie după eroare care să corecteze evoluţia estimatorului. Apare astfel o mărime de tipul erorii de reacţie inversă care aici se exprimă la nivelul accesibil măsurătorilor - al ieşirii (fig.2). Matematic, sistemul astfel structurat se exprimă prin ˆx = Aˆx + bu(t) + l(y c T ˆx) (4) unde l se va alege corespunzător. Sistemul astfel conceput se numeşte estimator de stare. Introducând din nou eroarea de estimare definită în (3) vom obţine e x = Aˆx + bu(t) + l(c T x c T ˆx) Ax bu(t) = Ae x lc T e x = (A lc T )e x (5) 2
u x y A, b c T A, b, l c T + - xˆ Figura 2: Estimator cu reacţie şi se vede că valorile proprii ale matricei A lc T se află în semiplanul complex stâng, atunci eroarea tinde asimptotic spre 0 astfel încât condiţia iniţială pentru estimator îşi pierde importanţa. Din acest motiv estimatorul se mai numeşte asimptotic, iar deoarece ieşirea estimatorului coincide cu starea estimată, estimatorul se numeşte identic. Cele de mai sus arată că proiectarea unui estimator asimptotic identic revine la alegerea unui vector l astfel încât A lc T să aibă valorile proprii în semiplanul stâng. În fapt aceasta este tot o problemă de alocare prin reacţie inversă după stare (starea estimatorului) pentru perechea (A T, c); dacă această pereche este controlabilă - adică (c T, A) este observabilă - problema are sigur soluţie. Dar şi dacă suntem în situaţia în care (A T, c) are o parte a valorilor proprii necontrolabilă dar situată în semiplanul stâng, problema încă are soluţie; această proprietate de stabilizabilitate a perechii (A T, c) se numeşte detectabilitate a perechii (c T, A). Compensatoare cu estimator A. Ideea de compensator (regulator) a fost deja discutată încât aici nu vom face decât să re-definim compensatorul în limbajul variabilelor de stare. Considerând sistemul strict propriu (1), un compensator este un alt sistem, cel mult propriu, cuplat în reacţie inversă cu (1), adică având la intrarea sa ieşirea y a lui (1) şi furnizând la ieşire semnalul de intrare (comandă), astfel 3
încât sistemul rezultant, cu reacţie inversă (în circuit închis) să aibă o serie de proprietăţi dorite (să fie compensat ). Structura de compensator are forma ẋ c = A c x c + b c y(t) u = f T c x c + γ c y(t) (6) Utilizarea estimatorului de stare într-o reacţie inversă după stare furnizează o anumită structură de compensator; într-adevăr, utilizarea estimatorului presupune ca în reacţia după stare u = f T x să considerăm că x este reprezentat de estimarea sa ˆx şi să obţinem astfel ecuaţiile ˆx = Aˆx + bu(t) + l(y c T ˆx) u = f T ˆx (7) care se mai rescrie sub forma ˆx = (A + bf T lc T )ˆx + ly u = f T ˆx (8) evident, un sistem strict propriu. B. În cele ce urmează vom încerca să punem în evidenţă diversele reacţii inverse şi structuri de sistem pe care le implică utilizarea estimatorului; aceasta presupune întreruperea unor legături pentru a le reface apoi. Astfel, estimatorul (7) primeşte semnalele u şi y, fiind un sistem cu două semnale de intrare, furnizând un singur semnal de ieşire u c = f T ˆx; ca urmare va fi valabilă structura din fig.3 Structura rezultă din aplicarea transformatei Laplace în (7) dar cu u c = f T ˆx ca a doua ecuaţie; deducem ũ c (s) = f T (si A + lc T ) 1 bũ(s) + f T (si A + lc T ) 1 lỹ(s) (9) Schema din fig.3 permite calculul funcţiei de transfer a sistemului în circuit închis H(s) 1 H H 0 (s) = 1 (s) H(s) 1 H(s)H = (10) 2(s) 1 H(s)H 2 (s) H 1 (s) 1 H 1 (s) unde am notat, pentru scrierea mai concisă H 1 (s) = f T (si A + lc T ) 1 b, H 2 (s) = f T (si A + lc T ) 1 l (11) 4
v + + u u c v A, b, c y T A lc, b, f T A lc, l, f Figura 3: Structura compensatorului cu estimator Considerând numitorul lui (10) obţinem 1 H(s)H 2 (s) H 1 (s) = 1 f T (si A + lc T ) 1 (lh(s) + b) = = 1 f T (si A + lc T ) 1 (lc T (si A) 1 b + b) = = 1 f T (si A + lc T ) 1 (lc T + si A)(sI A) 1 b = = 1 f T (si A) 1 b = 1 H c (s) ; H c (s) := f T (si A) 1 b unde H c (s) astfel notată poate fi considerată ca o funcţie de transfer echivalentă a compensatorului ideal - în care nu este necesară estimarea, dinamica lui x(t) din reacţia după stare fiind dată de (si A) b ; dacă considerăm activarea compensatorului de către ieşirea y, atunci putem scrie formal H c (s) = H c(s) H(s) H(s) în care caz obţinem, luând G c (s) = H c (s)/h(s) H 0 (s) = H(s) 1 H c (s) = H(s) 1 G c (s)h(s) (12) adică formula standard a reacţiei inverse. Formula (12) poate fi prelucrată în continuare după cum urmează: pornind de la expresia de definiţie H(s)(1 H c (s)) 1 = c T (si A) 1 b(1 f T (si A) 1 b) 1 (13) 5
vom arăta, printr-un calcul pur algebric, că (1 f T (si A) 1 b) 1 = 1 + f T (si A bf T ) 1 b (14) Într-adevăr (1 f T (si A) 1 b)f T = f T (si A) 1 (si A bf T ) f T (si A) 1 1 f T (si A) 1 b = f T (si A bf T ) 1 1 + f T (si A) 1 b 1 f T (si A) 1 b = 1 + f T (si A bf T ) 1 b Deducem atunci din (13) şi (14) că H 0 (s) = H(s) 1 H c (s) = ct (si A) 1 b[1 + f T (si A bf T ) 1 b] = = c T (si A) 1 (si A bf T + bf T )(si A bf T ) 1 b = = c T (si A bf T ) 1 b Rezultă că dinamica estimatorului nu este sensibilă nici în ieşirea compensatorului - a se vedea expresiile lui H c (s) sau G c (s) - dar nici în ieşirea întregului sistem în circuit închis, cu funcţia de transfer H 0 (s). Pentru stare iniţială nulă acest lucru este natural deoarece estimatorul este activat de diferenţa condiţiilor iniţiale. Se pune însă problema dacă din punct de vedere al dinamicii interne - de exemplu al stabilităţii interne - estimatorul are vreun efect particular. Considerăm deci ecuaţiile de stare ale întregii structuri ẋ = Ax + bf T ˆx + bv(t) ˆx = lc T x + (A lc T )ˆx + bf T ˆx + bv(t) Introducem un nou vector de stare prin transformarea nesingulară ( ) ( ) ( ) ( ) I 0 x I 0 x T = ; = I I I I ˆx e x (15) (16) 6
obţinând sistemul (A x ẋ = (A + bf T )x+ bf T e x +bv(t) ė x = lc T )e (17) Cum ecuaţia caracteristică a lui (15) e invariantă la transformări de coordonate tip (16), ea coincide cu ecuaţia caracteristică a lui (17); ca urmare det si A bf T = det (si A bf T ) det(si A+lc T ) lc T si A bf T + lc T (18) Structura ecuaţiei din (18) conţine ceea ce se numeşte în Teoria Sistemelor Teorema Separării - cu enunţul de mai jos Teorema 1. Într-o structură cu reacţie inversă după stare şi estimator, dinamica sistemului cu reacţie după stare şi a estimatorului pot fi alocate independent. Dacă (A, b) este stabilizabilă şi (c T, A) detectabilă, sistemul cu coeficienţii (A, b, c) este stabilizabil prin reacţie inversă după stare implementată cu estimator unitar. Să observăm, în al doilea rând, că sistemul (17), deci şi (16), este necontrolabil având, în caz vectorial, forma pe care am mai întâlnit-o la un sistem scalar necontrolabil. Se explică astfel faptul că dinamica estimatorului nu apare în funcţia de transfer H 0 (s) = ỹ(s)/ṽ(s). Cum şi această funcţie este invariantă la transformări de coordonate, ea poate fi calculată direct din (17) la care se adaugă ieşirea y = c T x. Vom obţine ỹ(s) = ( c T 0 ) ( (si A bf T ) 1 X ) ( ) b = 0 (si A + lc T ) 1 b = c T (si A bf T ) 1 bṽ(s) (19) În al treilea rând prezenţa estimatorului modifică dinamica tranziţiei de stare, ceea ce este vizibil din (16) sau (17) prin creşterea dimensiunii; în particular, numărul valorilor proprii este dublu. În structura răspunsului, deci în ieşire, după cum s-a văzut deja, dinamica estimatorului apare doar în răspunsul liber. Cel mai clar însă este efectul estimatorului în legea de comandă unde e valabilă înlocuirea stării efective prin estimarea sa u = f T ˆx = f T (x + e x ) (20) 7
Pentru o bună funcţionare a sistemului componenta e x (t) trebuie să tindă la 0 suficient de repede, mai rapid decât starea sistemului x(t) (în probleme de stabilizare, de exemplu). De aceea valorile proprii dominante - cele mai apropiate de axa imaginară - vor trebui să fie ele alocate prin reacţia după stare; valorile proprii ale estimatorului care, aşa cum rezultă din Teorema separării, pot fi alocate independent, este bine să se afle în stânga celor de mai sus. Acest aspect va deveni limpede în exemplul de mai jos. Aplicaţie de calcul Se dă sistemul ẋ 1 = x 2 ( ) 0 1 ( ) 0 ( ) 1 ẋ 2 = x 1 + u(t), A = 1 0, b = 1, c = 0 (21) y = x 1 Ecuaţia sa caracteristică este iar funcţia de transfer det (si A) = s 2 1 = 0 (22) H(s) = 1 s 2 1 (23) este ireductibilă, sistemul fiind controlabil, observabil şi instabil, deoarece rădăcinile ecuaţiei caracteristice sunt ±1. Se cere alocarea prin reacţie după stare şi estimator a valorilor proprii la 0.5(1 ± j), estimatorul fiind alocat la 1 ± j. Calculul este simplu ( ) 0 1 A+bf T =, det(si A bf T ) = s 2 f 2 s 1 f 1 s 2 +s+0.5 1 + f 1 f 2 Deducem coeficienţii reacţiei inverse după stare f 1 = 1.5, f 2 = 1 (24) Pentru estimator vom avea ( ) A lc T l1 1 =, det(si A + lc T ) = s 2 + l 1 s 1 + l 2 s 2 + 2s + 2 1 l 2 0 8
şi rezultă l 1 = 2, l 2 = 3. Deducem de aici ecuaţiile de stare ale sistemului în circuit închis ẋ 1 = x 2 ẋ 2 = x 1 1.5ˆx 1 ˆx 2 + v(t) ˆx 1 = 2x 1 2ˆx 1 + ˆx 2 (25) ˆx 2 = 3x 1 3.5ˆx 1 ˆx 2 + v(t) y = x 1 În continuare calculăm funcţiile de transfer pe cele două canale ale dinamicii estimatorului. H u (s) = f T (si A + lc T ) 1 b = s + 3.5 s 2 + 2s + 2 H y (s) = f T (si A + lc T ) 1 5.5s + 6.5 l = s 2 + 2s + 2 (26) obţinându-se structura din fig.4a care se transformă apoi în structura din fig.4b. - - H(s) - 2 s 2s 2 2 s 3s 5.5 1 s 2 1 H u (s) H y (s) 5.5s 6.5 2 s 2s 2 a) Compensator cu estimator - structura primară b) Compensator cu estimator - structura transformată Figura 4: Compensator cu estimator - aplicaţie de calcul Să precizăm în încheiere că obţinerea unor coeficienţi în limite rezonabile este datorată prescrierii raţionale a setului de valori proprii atât pentru sistem cât pentru sistem cât şi pentru estimator. În caz contrar ar fi fost inevatibilă prezenţa unor coeficienţi care să difere între ei prin câteva ordine de mărime; fenomenul este specific unei astfel de sinteze şi de aceea 9
este important să nu se impună performanţe absurde sistemului; locul rădăcinilor poate furniza o bună indicaţie de tatonare a performanţelor ce pot fi prescrise. 10