Model Predictive Control

Univerzitet u Novom Sadu Fakultet tehni ckih nauka Automatika i upravljanje sistemima
Milan R. Rapai c Boris B. Jakovljevi c Zoran D. Jeli ci c
OSNOVI PREDIKTIVNOG UPRAVLJANJA

Model Predictive Control
materijal za pripremu isputa iz predmeta
Adaptivno i napredno upravljanje
verzija 0.2
Sadraj
Poglavlje 1. Projektovanje linearnih optimalnih regulatora 1.1. Projektovanje linearnih optimalnih regulatora po stanjima 1.2. Projektovanje observera stanja sistema 1.3. Projektovanje linearnih optimalnih regulatora po izlazima Poglavlje 2. Pregled komercijalnih MPC strategija 2.1. DMC (Dynamic Matrix Control) 2.2. MAC (Model algorithmic control) 2.3. PFC (Predictive Functional Control) Literatura 1 3 15 21 25 25 28 31 33
POGLAVLJE 1
Projektovanje linearnih optimalnih regulatora

U ovom poglavlju baviemo se problemom projektovanja linearnih optimalnih regulatora. Optimalni regulatori imaju niz osobina koji ih ine izuzetno atraktivnim sa praktinog stanovita. Teorija optimalnih regulatora je kljuni gradivni element mnogobrojnih savremenih upravljakih metodologija. Konkretno, linearni optimalni regulatori u manjoj ili veoj meri lee u osnovi veine prediktivnih i adaptivnih upravljakih algoritama. Problem optimalnog upravljanja se moe postaviti na vie naina. Dva pristupa su iroko zastupljena: pristup zasnovan na formalizmu prostora stanja i pristup zasnovan na formlizmu ulazno-izlazlnih relacija (funkcija prenosa). Naravno, kako god da postavimo problem, u krajnjem moramo doi do (gotovo) identinih rezultata. Razlika prvenstveno postoji u nainu, odnosno matematikom aparatu pomou koga se do reenja dolazi, te u formi samog reenja. U ovom tekstu baviemo se prvenstveno metodama projektovanja optimalnih regulatora zasnovanim na formalizmu prostora stanja. Pre svega, ovakav pristup problemu optimalnog upravljanja bi studentima trebao biti blii, s obzirom da su sline probleme (ali u kontinualnom vremenskom domenu) ve reavali u okviru predmeta Metodi optimizacije. Ovakav pristup je, takoe, u izvesnoj meri optiji, jer dozvoljava projektovanje vremenski promenljivih regulatora. Metodama koje se baziraju na formalizmu funkcije prenosa moemo analizirati jedino upravljake algoritme sa vremenski nepromenljivim parametrima. Takoe, multivarijabilni sistemi (sistemi sa vie ulaza i izlaza) se u prostoru stanja opisuju na sasvim prirodan i jednostavan nain. Konano, makar principski, ovako postavljen problem optimalnog upravljanja se lako uoptava na sluaj nelinearnih procesa. Zainteresovani italac se upuuje da ira znanja iz oblasti (optimalnog) upravljanja diskretnim sistemima potrai u knjizi Computer-Controlled Systems Theory and Design iji su autori Karl Johan Ostrem i Bjorn Witenmark [ AW97]. Izlaganje u ovom poglavlju je u mnogome nadahnuto materijalom koji se moe nai u tom udbeniku. Neto laganiji pristup razliitim postupcima projektovanja savremenih regulatora moe se nai u [Bur01]. Smatraemo da je proces kojim se eli upravljati opisan linearnim, vremenski invarijantnim diskretnim modelom u prostoru stanja x[k + 1] = x[k ] + u[k ], y[k ] = Cx[k ], (1.1) (1.2)
gde je sa x = [x1 . . . xn ]T obeleen vektor stanja sistema, sa u = [u1 . . . up ]T vektor ulaza, a sa y = [y1 . . . yl ]T vektor izlaza sistema. Smatramo da sistem moe biti multivarijabilan, odnosno da moe imati vie ulaza i izlaza. Oznaiemo broj stanja sistema sa n, broj ulaza sa p, a broj izlaza sa l. Simbol T u gornjem desnom indeksu oznaava operaciju transpozicije. Po konvenciji, odbirkovane vrednosti signala obeleavaemo tako to emo redni broj odbirka stavljati u uglaste zagrade. Tako, recimo, y[k ] predstavlja k -ti odbirak signala y. Pri tome vai da je y[k ] = y(kTs ), gde je Ts period sa kojim se signal odbirkuje.
1
1. PROJEKTOVANJE LINEARNIH OPTIMALNIH REGULATORA
Realni tehniki procesi su veoma sloeni U najveem broju sluajeva potpun ziki opis sistema nije na raspolaganju. Takav jedan model bi bio nelinearan i najee bi se odlikovao prostorno raspodeljenim parametrima. Drugim reima, takav jedan model bi se sastojao iz nelinearnih parcijalnih diferencijalnih jednaine visokog reda. Iako su ovakvi modeli detaljni, informativni i jasno utemeljeni u zikim zakonitostima po kojima se posmatrani proces odvija, rad sa ovakvim modelima je izuzetno teak. Sa stanovita projektovanja upravljakih ureaja daleko su pogodniji linearni modeli sa koncentrisanim parametrima. U veoma vanoj klasi upravljakih problema, cilj upravljanja je zadrati proces u okolini unapred date radne take, uprkos eventualnim poremeajima koji potiu iz spoljne sredine. U okolini ksne radne take mogue je aproksimirati pravu (nelinearnu, distribuiranu) dinamiku industrijskog procesa relativno jednostavnim linearnim modelom sa koncentrisanim parametrima (1.1), (1.2). ta vie, iroka lepeza industrijskih postrojenja se (makar u odreenom radnom opsegu) veoma dobro moe opisati linearnim modelima. Modelovanje zikih procesa je problem za sebe. U nastavku emo smatrati da su modeli koje posmatramo adekvatni, odnosno da na zadovoljavajui nain opisuju sistem (proces) na koji se odnose. Baviemo se problemom projektovanja upravljake strategije koja optimizuje odreeni pokazatelj kvaliteta rada sistema. Obino se pred sistem automatskog upravljanja stavljaju dva meusobno suprotstavljena zahteva: (i) da greka upravljanja bude to manja, te (ii) da je utroak energije, odnosno upravljaki napor to skromniji. Greka upravljanja se obino denie kao apsolutna vrednost razlike eljene i ostvarene (izmerene) vrednosti upravljane promenljive y. Upravljaki napor se veoma esto poistoveuje sa amplitudom upravljakog signala u. Na primer, ukoliko je izvrni organ greja, a upravljanje se vri putem napona napajanja ili struje grejaa, jasno je da je utroena energija direktno srazmerna kvadratu amplitude upravljakog signala. Postoje, meutim, procesi kod kojih se upravljaki napor denie i na drugaiji nain, recimo pomou prvog izvoda upravljake promenljive. Napomena 1.0.1. Naravno, model opisan jednainama (1.1) i (1.2) je diskretan. Industrijska postrojenja, kao uostalom i svi drugi ziki procesi, postoje i odvijaju se u kontinualnom vremenu. Diskretni modeli se mogu dobiti bilo diskretizacijom odgovarajuih kontinualnih modela, bilo razliitim metodama identikacije. itaocu bi oba pomenuta postupka trebala biti dobro poznata. Na ovu temu postoji zaista iroka literatura. Detaljnije informacije italac moe nai recimo u [ AW97], [Bur01], [Sto04]. Kriterijumi optimalnosti koje emo posmatrati nastoje da jednovremeno uzmu u obzir i sumu kvadrata greke upravljanja i sumu kvadrata amplitude upravljakog signala. Ovakvi kriterijumi nazivaju se kvadratnim kriterijumima. Sam problem projektovanja optimalnog regulatora za linearni sistem u odnosu na kvadratni kriterijum otpimalnosti naziva se u literaturi LQ (linear-quadratic) problemom. Rezultujui optimalni regulator se naziva LQR-om, odnosno LQ regulatorom. Ukoliko se prilikom projektovanja optimalnog regulatora merni um eksplicitno uzme u obzir, dobijeni regulator se naziva LQG (linear-quadratic Gaussian). U nastavku e izlaganje postepeno rasti po sloenosti. U odeljku 1.1 emo izloiti reenje problema optimalnog upravljanja u sluaju kada su sva stanja sistema direktno merljiva. U praksi, stanja sistema obino nisu direktno merene veliine, te ovako projektovani regulator nema iru praktinu primenu. Praktino je mogue upravljati jedino na osnovu merenih veliina, odnosno izlaza. U odeljku 1.2 ukratko emo se pozabaviti problemom projektovanja observera stanja. Kao to je poznato, observer je algoritam koji omoguava rekonstrukciju stanja na osnovu merenja izlaza sistema. Konano, u odeljku 1.3 prikazan je postupak projektovanja
1.1. PROJEKTOVANJE LINEARNIH OPTIMALNIH REGULATORA PO STANJIMA
optimalnog regulatora po estimiranim stanjima, tj. po izlazima sistema. Postupci razmatrani u ovom odeljku tiu se prvenstveno problema stabilizacije, odnosno odravanja sistema u tekuoj radnoj taki uprkos prisustvu razliitih poremeaja. Postupci koji se tiu servo-upravljanja, odnosno praenja zadate trajektorije nisu razmatrani. Zainteresovani italac se ponovo upuuje na [ AW97] 1.1. Projektovanje linearnih optimalnih regulatora po stanjima U ovom odeljku bavimo se problemom projektovanja linearnih optimalnih regulatora u sluaju kada su sva stanja sistema merljiva. Posmatraemo problem stabilizacije. Dakle, zadatak je prevesti sistem (1.1) iz polaznog neravnotenog stanja x[0] = x0 u krajnje ravnoteno stanje x[N ] = 0. Podseamo itaoca da je model (1.1) aproksimacija realnog sistema dobijena linearizacijom oko odgovarajue radne take. Drugim reima, posmatramo problem projektovanja regulatora koji vraa sistem u eljeni radni reim nakon poremeaja. 1.1.1. Formiranje kriterijuma optimalnosti. S obzirom na postavljene zahteve, mogue je greku upravljanja u svakoj iteraciji k denisati na sledei nain n e1 [k ] = x2 (1.3) i [k ].
i=1
Ovako denisana mera greke uzima u obzir greku upravljanja po razliitim stanjima podjednako. esto nisu sva stanja podjednako znaajna, te je prikladnije greku denisati na sledei nain n e2 [k ] = (1.4) qi x2 i [k ],
i=1
gde su qi 0 teinski faktori pridrueni razliitim stanjima. Ako je neko qi veliko u odnosu na ostale teinske faktore, odgovarajue stanje xi doprinosi vrednosti kriterijuma u veoj meri od ostalih stanja, te e optimalni regulator nastojati da greku po tom stanju to pre anulira. Takoe, razliita stanja obino imaju i razliitu ziku prirodu, pa faktori qi imaju i ulogu normalizacije, odnosno dimenzionog usaglaavanja razliitih komponenata greke. Jo optije, greka se moe denie kao n n e3 [k ] = qij xi [k ]xj [k ]. (1.5)
i=1 j =1
Ovako denisan kriterijum uzima u obzir i meusobni uticaj razliitih stanja. Teinski faktori qij ne moraju svi biti nenegativni, ali ukupna vrednost izraza e3 ne sme biti negativna ni za jednu vrednost promenljivih stanja x. Drugim reima kvadratna forma (1.5) mora biti pozitivno semidenitna. (to implicira da bar koecijenti qii moraju biti vei ili jednaki od nule). Izraz (1.5) moe biti kompaktnije zapisan pomou matrine notacije. Neka je Q = [qij ] matrica koecijenata kvadratne forme e3 , tada moemo pisati e3 [k ] = xT [k ]Qx[k ]. (1.6) Da bi kvadratna forma bila pozitivno semidenitna, njoj pridruena matrica mora biti pozitivno semidenitna, odnosno sve svojstvene vrednosti joj moraju biti nenegativne. Matrica Q dakle mora biti pozitivno semidenitna. Napomena 1.1.1. Optimalni regulator nastoji da minimizuje meru greke. Ukoliko bi neki od koecijenata qi u izrazu (1.4) bio negativan, tada bi se proizvoljno smanjenje kriterijuma optimalnosti moglo postii poveanjem kvadrata vrednosti promenljive stanja xi . Dakle optimalni regulator bi nastojao da udalji xi od nule
umesto da ga priblii nuli. Ukoliko je neko qi nula, tada odgovarajue stanje ne utie na vrednost kriterijuma. Slino je i opravdanje zahteva da matrica Q bude pozitivno semidenitna. Napomena 1.1.2. Mere greke upravljanja e1 i e2 mogu se posmatrati kao specijalni sluajevi mere e3 . Konkretno, ukoliko je Q jedinina matrica e3 postaje e1 , a ukoliko je Q dijagonalna matrica sa dijagonalnim elementima jednakim qi (Q = diag {qi }), tada je e3 jednako e2 . Sve svojstvene vrednosti jedinine matrice su jednake jedinici. Svojstvene vrednosti matrice diag {qi } su ba qi . Napomena 1.1.3. ini se loginim greku upravljanja iskazati preko izlaza, a ne preko stanja (koja su najee nepoznata). Pretpostavimo da su izlazi sistema dati u vidu linearne kombinacije stanja, dakle izrazom (1.2). Greka upravljanja u trenutku k je l 2 e4 [k ] = wi yi [k ] = yT [k ]Wy[k ], (1.7)
i=1
gde je W = diag {wi } i wi 0. Teinski koecijenti opisuju znaaj pojedinih izlaza. S obzirom na vezu izmeu izlaza i stanja sistema, datu jednainom (1.2), moemo pisati e4 [k ] = xT [k ]CT WCx[k ]. (1.8) Dakle, e4 je specijalan sluaj izraza e3 , pod uslovom da je Q = CT WC. Poto je izraz e3 formalno najoptiji, greku upravljanja u trenutku k emo denisati sa e[k ] = e3 [k ]. Ukupnu greku upravljanja deniemo sabiranjem greaka upravljanja u svim trenucima od interesa, Je =
N k=0
xT [k ]Qx[k ].
(1.9)
Kvadrat vrednosti upravljake promenljive e biti uzet kao mera upravljakog napora. S obzirom da je sistem multivarijabilan, mogue je razliite upravljake promenljive vrednovati na razliite naine. Naravno, mogue je (mada se to retko ini) uvrstiti i unakrsne proizvode razliitih upravljakih promenljivih u kriterijum. Time dolazimo do opteg izraza za ukupan upravljaki napor Ju =
N 1 k=0
uT [k ]Ru[k ].
(1.10)
Upravljanje u trenutku N se ne uzima u obzir, s obzirom da ono utie na vrednosti stanja tek u trenutku N + 1 koji nije od interesa. Ukupan kriterijum optimalnosti se dobija zbrajanjem greke upravljanja i mere upravljakog napora, dakle J1 = Je + Ju =
N 1 k=0
} xT [k ]Qx[k ] + uT [k ]Ru[k ] + xT [N ]Qx[N ].
(1.11)
Krajnja vrednost promenljivih stanja x[N ] je od posebnog interesa, s obzirom da na neki nain predstavlja rezultat upravljanja. esto se svako odstupanje krajnjih stanja od eljene vrednosti posebno kanjava. Takoe, itav kriterijum se esto mnoi sa 1 2 kako bi potonji izrazi bili elegantniji. Konano, kriterijum optimalnosti koji emo posmatrati u nastavku glasi J=
N 1 } 1 1 { T x [k ]Qx[k ] + uT [k ]Ru[k ] + xT [N ]x[N ], 2 2 k=0
(1.12)
gde su Q i pozitivno semidenitne, a R pozitivno denitna matrica. Bez gubitka optosti moemo pretpostaviti da su ove matrice simetrine. Time se dalji raun pojednostavljuje. Ukoliko neka od pomenutih matrica (recimo Q) nije simetrina, uvek je mogue formirati ekvivalentan kriterijum u kome guriu samo simetrine 1 matrice (smenom Q 2 (Q + QT )). Pravilan izbor kriterijuma optimalnosti jeste kljuan korak u primeni teorije optimalnog upravljanja. Kriterijum optimalnosti denie ta se oekuje od sistema, koje su promenljive bitne, i u kojoj meri. Iako je kvantitativna povezanost performansi sistema u zatvorenoj sprezi i kriterijuma optimalnosti veoma sloena, kvalitativna povezanost je najee sasvim jasna i intuitivna. Sledei primer ilustruje uticaj kriterijuma optimalnosti na ponaanje sistema u zatvorenoj sprezi. Primer 1.1. Posmatrajmo sistem opisan modelom x1 [k + 1] = 0.95x1 [k ] + 0.1x2 [k ] + u[k ], x2 [k + 1] = 0.8x2 [k ] + u[k ]. Sistem ima dva stanja i jednu ulaznu promenljivu. Matrice kojima se denie model su [ ] [ ] 0.95 0.1 1 = , = . 0 0.8 1 Polovi sistema su 0.95 i 0.8. Promenljiva stanja x2 ima neto bru dinamiku u odnosu na promenljivu stanja x1 . Kriterijum otpimalnosti (1.12) deniemo pomou matrica [ ] 1 0 Q= , = Q, R = 1. 0 a Parametar a u matrici Q denie relativni uticaj promenljivih stanja. Za a < 1 stanje x1 ima veu vanost, dok je za a > 1 stanje x2 bitnije. Stanja se podjednako vrednuju za a = 1. Na slici 1.1 prikazano je optimalno kretanje sistema u prostoru stanja za razliite vrednosti ovog parametra. Vidi se da se u sluaju a = 0.1 stanje x1 smiruje bre od stanja x2 . U druga dva sluaja vreme smirenja je priblino isto, ali je ukupna greka stanja x2 daleko manja kada je a = 10. Kako je ve naglaeno, pri specikaciji kriterijuma optimalnosti vri se kompromis izmeu brzine odziva sistema (performansi) i potrebnog upravljakog napora (slobodno govorei: utroka energije). Da bi smo to pokazali, ksiraemo matricu Q = I i analiziraemo odziv sistema za razliite vrednosti matrice (u konkretnom sluaju skalarnog parametra) R. Rezultati su prikazani na slici 1.2. Za R = 0.1 greka po stanju se vrednuje daleko vie od utroenog upravljakog napora, pa je i odziv bri na utrb otrije upravljake strategije. Sa druge strane, kada je R = 10 upravljaki napor je relativno skup, pa je i odziv sporiji, ali je i maksimalna vrednost upravljakog signala gotovo tri puta manja nego u prvom sluaju. Napomena 1.1.4. Ponekad je svrsishodno dozvoliti da se matrice Q i R menjaju sa vremenom. Mogue je, recimo, pogodnim izborom ovih matrica dozvoliti energinije upravljanje i posledino brz odziv na poetku, te zahtevati slabije upravljanje i mirniji odziv pri kraju vremenskog intervala od interesa. To se moe postii, na primer, ukoliko deniemo Q(k ) = Q0 N k , (0, 1). Tada relativni uticaj greke upravljanja u odnosu na upravljaki napor raste tokom vremena. 1.1.2. Reenje problema optimalnog upravljanja primenom principa dinamikog programiranja. U ovom pododeljku prikazaemo postupak dolaenja do reenja problema optimalnog upravljanja uz oslonac na Belmanov princip dinamikog programiranja. Princip dinamikog programiranja daje eksplicitno reenje problema optimalnog upravljanja u rekurzivnoj formi. Veoma je bitno, takoe, da
(a) a = 0.1
(b) a = 1
(c) a = 10
Slika 1.1. Optimalno kretanje sistema u prostoru stanja za razliite vrednosti parametara kriterijuma optimalnosti. Promenljiva stanja x1 prikazana je plavom punom linijom, dok je promenljiva stanja x2 prikazana zelenom isprekidanom linijom.
se analizom postupka dolaska do reenja mogu razumeti i analizirati mnoge osobine optimalne upravljake strategije. Zadatak je, dakle, projektovati upravljaki algoritam koji upravlja sistemom (1.1) minimizirajui kriterijum (1.12). Princip dinamikog programiranja se moe iskazati na razliite naine. Originalna formulacija je An optimal policy has the property that whatever the initial state and initial decisions are, the remaining decisions must constituate an optimal policy with regard to the state resulting from the initial decisions. Moda najjednostavnija, mada ne i najpreciznija, interpretacija Belmanovog principa je sledea: Svaki deo optimalnog procesa mora i sam biti optimalan. U duhu ovog principa, problem se reava od kraja. Prvo se rauna optimalno upravljanje u trenutku k = N 1, potom u trenutku k = N 2, itd. Konano, izrauna se optimalno upravljanje u inicijalnom trenutku k = 0, ime je problem reen. Deniimo najpre preostali minimalni gubitak (loss-to-go) kao minimalnu vrednost kriterijuma optimalnosti poev od trenutka k , pod uslovom da je tekue stanje x[k ] poznato } { N 1 ) 1 T 1 ( T T x [i]Qx[i] + u [i]Ru[i] + x [N ]x[N ] . (1.13) V (x[k ]) = min 2 2 u[k..N 1]
i= k
(a) Optimalna trajektorija sistema za R = 0.1 (b) Optimalna trajektorija sistema za R = 10
(c) Optimalni upravljaki signal za R = 0.1
(d) Optimalni upravljaki signal za R = 10
Slika 1.2. Optimalno kretanje sistema u prostoru stanja i optimalno upravljanje za razliite vrednosti parametra R. Promenljiva stanja x1 prikazana je plavom punom linijom, dok je promenljiva stanja x2 prikazana zelenom isprekidanom linijom. Upravljaki signali su prikazani crnom punom linijom na posebnim gracima. Kljuni korak u postupku iznalaenja optimalnog upravljanja jeste pokazati da je u svakom trenutku minimalni preostali gubitak kvadratna funkcija stanja, drugim reima da postoji simetrina matrina funkcija S(k ) takva da je 1 V (x[k ]) = xT [k ]S(k )x[k ]. (1.14) 2 Ovo tvrenje se moe dokazati principom matematike indukcije, poev od krajnjeg stanja sistema. Jasno je da je 1 (1.15) V (x[N ]) = xT [N ]x[N ], 2 odnosno S(N ) = . (1.16) Pretpostavimo dalje da (1.14) vai u trenutku k , pokazaemo da vai i u trenutku k 1. Najpre, oigledno je da je } 1{ T V (x[k 1]) = min x [k 1]Qx[k 1] + uT [k 1]Ru[k 1] + V (x[k ]) u[k1] 2 } 1{ T x [k 1]Qx[k 1] + uT [k 1]Ru[k 1] = min u[k1] 2 { } 1 T + min x [k ]S(k )x[k ] , (1.17) u[k1] 2
pri emu je poslednja jednakost posledica indukcione hipoteze (1.14). Uvrtavanjem modela sistema (1.1) u poslednju jednainu, nakon kraeg sreivanja dobijamo { ( ) 1 T V (x[k 1]) = min x [k 1] Q + T S(k ) x[k 1] u[k1] 2 + uT [k 1]T S(k )x[k 1] } ( ) 1 T T + u [k 1] R + S(k ) u[k 1] . 2
(1.18)
Izraz koji se minimizuje jeste kvadratna funkcija upravljanja. Ukoliko je matrica R + T S(k ) pozitivno denitna, tada jedinstveni globalni minimum ovog izraza nalazimo izjednaavanjem gradijenta po upravljanju sa nulom, odnosno iz uslova ( ) R + T S(k ) u[k 1] + T S(k )x[k 1] = 0. (1.19) odakle proizilazi ( )1 uopt [k 1] = R + T S(k ) T S(k )x[k 1]. ( )1 K(k 1) = R + T S(k ) T S(k ) . izraz (1.20) moemo zapisati konciznije uopt [k 1] = K(k 1)x[k 1] . (1.22)
(1.20)
Ukoliko uvedemo smenu (1.21)
Konano, minimalni preostali gubitak u trenutku k 1 nalazimo smenom prethodnog izraza u izraz (1.18) 1 V (x[k 1]) = xT [k 1]S(k 1)x[k 1] (1.23) 2 ( ) S(k 1) = T S(k ) + Q KT (k 1) R + T S(k ) K(k 1) . (1.24) Napomena 1.1.5. Jednaina (1.24) se naziva diskretnom Rikatijevom jednainom. Reavanje ove jednaine je nezaobilazan korak u izraunavanju linearne optimalne upravljake strategije. Bitno je naglasiti da reenje Rikatijeve jednaine ne zavisi od stanja sistema, te se data jednaina moe reiti unapred (ne mora se reavati u realnom vremenu). Reenje se potom koristi kako bi se u svakom trenutku odabiranja zadala nova vrednost upravljakog vektora. Napomena 1.1.6. Izuzetno zanimljivo svojstvo LQ regulatora jeste da daju reenje u formi linearne povratne sprege po stanjima sistema. Ukoliko model sistema nije linearan a kriterijum optimalnosti nije kvadratnog tipa, tada se u optem sluaju optimalno upravljanje ne moe nai u formi (1.22). ta vie, u tom sluaju optimalno upravljanje se najee uopte ne moe nai u pozicionoj formi (kao funkcija stanja sistema). Napomena 1.1.7. Prethodno izvoenje u celosti vai i ukoliko je sistem vremenski promenljiv, odnosno ukoliko su parametri sistema i sami funkcije vremena. Razmatranje ostaje na snazi neizmenjeno ak i ukoliko su parametri koji guriu u kriterijumu optimalnosti vremenski zavisni. Napomena 1.1.8. Iz prethodnog izvoenja se vidi da je zahtev da je matrica R pozitivno denitna prestrog. Dovoljan uslov da bi postavljeni problem imao jedinstveno
reenje jeste da je matrica R + T S(k ) pozitivno denitna (ima sve svojstvene vrednosti pozitivne). Napomena 1.1.9. Ukoliko je pozitivno semidenitna matrica, reenje Rikatijeve jednaine S(k ) je pozitivno semidenitna matrica u svakom trenutku vremena k . Da rezimiramo, u cilju projektovanja linearnog optimalnog regulatora za sistem opisan modelom u prostoru stanja (1.1) najpre je potrebno denisati kriterijum optimalnosti u formi (1.12). Pravilan izbor kriterijuma optimalnosti je kljuni korak, s obzirom da kriterijum optimalnosti odreuje potonje ponaanje sistema u zatvorenoj sprezi. Nakon toga, potrebno je reiti rekurentnu jednainu (1.24) uz krajnji uslov (1.16). Optimalni regulator je dat u vidu linearne, vremenski zavisne povratne sprege po stanjima (1.22), pri emu je matrica pojaanja u svakoj iteraciji denisana izrazom (1.21). Kljune formule su uokvirene u prethodnom tekstu. Napomena 1.1.10. italac bi trebao uporediti rezultate izlaganja u prethodnom poglavlju sa rezultatima kontinualne teorije optimalnog upravljanja sa kojima bi trebao biti upoznat od ranije. Primer 1.2. Posmatrajmo ponovo sistem denisan u primeru 1.1. Na dijagramima prikazanim na slici 1.3 data je zavisnost koecijenata matrice pojaanja K(k ) od vremena. Proraun je vren za R = 1 i razliite vrednosti parametra a. Oigledno je da sa poveanjem vanosti odreene promenljive u kriterijumu optimalnosti raste i njoj odgovarajua komponenta u upravljakom vektoru. Primetiti, meutim, da su vrednosti pojaanja uslovljene i dinamikom objekta upravljanja. Napomena 1.1.11. Problem projektovanja optimalnog regulatora mogue je reiti na identian nain i u neto optijem sluaju kada kriterijum optimalnosti poseduje meovite lanove, odnosno kada se javljaju i proizvodi komponenata vektora stanja sa komponentama upravljakog vektora. U tom sluaju, kriterijum optimalnosti glasi } N 1 { 1 T 1 1 J= x [k ]Qx[k ] + xT [k ]Nu[k ] + uT [k ]Ru[k ] + xT [N ]x[N ], (1.25) 2 2 2
k=0
Rikatijeva jednaina i dalje zadrava formu (1.24), ali se optimalna matrica pojaanja rauna na neto drugaiji nain ( )1 ( ) K(k 1) = R + T S(k ) T S(k ) + NT . (1.26)
Za razliku od matrica Q, R i , novouvedena matrica parametara N ne mora biti ni simetrina ni pozitivno denitna. Logino je zahtevati, meutim, da izraz koji se sumira, posmatran kao funkcija stanja i upravljanja, predstavlja pozitivno denitnu kvadratnu formu. Drugim reima, logino je zahtevati da je matrica [ ] Q N NT R pozitivno denitna.
Problem 1.1. U prethodnom razmatranju upravljaki napor je poistoveivan sa intenzitetom upravljake promenljive. Ranije je napomenuto da je mogue upravljaki napor poistovetiti i sa brzinom promene upravljake promenljive. Pretpostavimo da
10
(a) a = 0.1
(b) a = 1
(c) a = 10
Slika 1.3. Optimalno vrednosti koecijenata matrice pojaanja za razliite parametre kriterijuma optimalnosti. Pojaanje promenljive stanja x1 prikazano je plavom punom linijom, dok je pojaanje koje odgovara promenljivoj x2 prikazano zelenom isprekidanom linijom.
je kriterijum optimalnosti denisan na sledei nain N 1 } 1 1 { T J= x [k]Qx[k] + uT [k]Ru[k] + xT [N ]x[N ], 2 2

k=0
gde je u[k] = u[k] u[k 1]. Izvesti izraze pomou kojih se rauna optimalno upravljanje u ovom sluaju. Pomo. Zadatak se moe reiti formiranjem ekvivalentnog modela. Najpre se uvede pomona promenljiva stanja koja je jednaka prethodnoj vrednosti upravljanja. Potom se inkrement upravljanja proglasi za novu, pomonu upravljaku promenljivu. Stvarna upravljaka promenljiva se potpuno eliminie iz modela. Prethodno izvedeni izrazi pomou kojih se rauna optimalno upravljanje mogu biti primenjeni na novodobijeni proireni model.
Problem 1.2. U nekim varijanta MPC-a smatra se da intenzitet upravljake promenljive i intenzitet njene promene jednovremeno uestvuju u formiranju upravljakog napora. Denisati kriterijum optimalnosti u ovom sluaju. Koristei se trikom iz prethodne vebe reiti dobijeni problem optimalnog upravljanja u optem sluaju.
11
1.1.3. Vremenski nepromenljivi suboptimalni linearni regulator. Jedan od osnovnih nedostataka prethodno opisanog postupka projektovanja optimalnog regulatora jeste u tome to rezultuje linearnim upravljakim zakonom sa vremenski promenljivim pojaanjem. Sa praktine take gledita to je nezgodno jer zahteva poznavanje reenja Rikatijeve jednaine u svakom trenutku vremena. Kao to je ve napomenuto, Rikatijeva jednaina se moe reiti i van glavne upravljake petlje, s obzirom da njeno reenje ne zavisi od stanja sistema. Uprkos tome, ukoliko se parametri sistema promene (ukoliko je upravljanje adaptivno) itavu jednainu je neophodno ponovo reiti, i to u realnom vremenu. Sa teorijskog stanovita, ak i ako je sistem u otvorenoj sprezi vremenski nepromenljiv (to je de facto pretpostavka koja se u praksi najei uvodi), nakon zatvaranja povratne sprege sistem postaje vremenski promenljiv, to ga ini nezgodnim za analizu. Konkretno, za takav se sistem ne moe formirati funkcija prenosa. Posledino, kompletan klasini alat analize u frekvencijskom domenu postaje neupotrebljiv. Pod prilino blagim uslovima reenje Rikatijeva jednaina konvegira ka konstantnoj matrici S. Ovu matricu nalazimo kao stacionarno (asimptotsko) reenje Rikatijeve jednaine (1.24), odnosno kao reenje algebarske Rikatijeve jednaine ( ) S = T S + Q KT R + T S K , (1.27) ( )1 K = R + T S T S . (1.28)
Sa praktinog stanovita, ovako denisan (sub)optimalni regulator sa konstantnom matricom pojaanja izuzetno je interesantan. Konkretno, ukoliko su matrice Q i R pozitivno denitne, te ukoliko postoji pozitivno denitno asimptotsko reenje Rikatijeve jednaine, tada linearni upravljaki algoritam sa matricom pojaanja (1.28) daje stabilan sistem u zatvorenoj sprezi. Grubo govorei, ukoliko su matrice koje guriu u kriterijumu optimalnosti i modelu sistema nepromenljive u vremenu, optimalni regulator stabilie sistem nezavisno od toga da li je polazni sistem bio stabilan ili ne, te nezavisno od naina na koji biramo parametre kriterijuma optimalnosti. ta vie, regulisani sistem obino poseduje i sasvim zadovoljavajue preteke stabilnosti. Napomena 1.1.12. Pod istim uslovima dobija se i vremenski nezavisno (stacionarno) reenje i Rikatijeve jednaine u sluaju kada meoviti lanovi guriu u kriterijumu optimalnosti. Videti jednaine (1.25) i (1.26). Naravno, ukoliko je sam sistem vremenski promenljiv, ili ukoliko se parametri kriterijuma optimalnosti menjaju u vremenu, nije mogue ostvariti vremenski invarijantnu linearnu regulaciju. Optimalni regulator sa konstantnom matricom pojaanja se moe interpretirati i kao regulator koji podeava polove, pole-placement regulator. Oba regulatora dele zajedniku strukturu, jedino se nain na koji se bira matrica pojaanja razlikuje. Da podsetimo, pole-placement regulator jeste linearni regulator oblika upp [k ] = Kx[k ], (1.29) gde se matrica pojaanja bira tako da se polovi sistema u zatvorenoj sprezi postave na eljene vrednosti. Nakon zatvaranja povratne sprege, nalazimo x[k + 1] = x[k ] + upp [k ] = ( K) x[k ], (1.30) te su polovi regulisanog sistema svojstvene vrednosti matrice c = K. Jasno je da se i linearni suboptimalni regulator moe posmatrati na ovaj nain, jedina razlika je to u procesu projektovanja zahteve koji se postavljaju pred sistem ne izraavamo u vidu poloaja polova u zatvorenoj sprezi, ve u vidu koecijenata
12
kriterijuma optimalnosti. Uprkos tome, nakon optimizacije korisno je ispitati i poloaj polova sistema u zatvorenoj sprezi. Na taj nain dobijamo niz zanimljivih informacija o sistemu kao to su propusni opseg, osetljivost na merni um, osetljivost na greke modelovanja i sl. Nije teko pokazati da je, nakon zatvaranje linearne povratne sprege po stanjima, funkcija povratnog prenosa sistema W(z ) = K(z I )1 . (1.31)
Napomena 1.1.13. Kada projektujemo linearni suboptimalni regulator, krajnji vremenski trenutak je N . Poto je ve utvreno da je sistem u zatvorenoj sprezi stabilan, granina vrednost stanja sistema je zasigurno 0. Stoga matrica nema uticaja na rezultujuu upravljaku strategiju. Napomena 1.1.14. Kada se linearni regulator projektuje metodom podeavanja polova, potreban i dovoljan uslov da bi svi polovi bili podesivi jeste da je sistem dohvatljiv (reachable). Da podsetimo, diskretni sistem je dohvatljiv ukoliko za ma koje poetno stanje x[k0 ] = x0 i ma koje eljeno krajnje stanje xf postoji upravljaka sekvenca u[k ], k {k0 , ..., k0 + N 1} (N je konaan prirodan broj) koja prevodi sistem iz datog poetnog u dato krajnje stanje. Ukoliko je sistem opisan modelom (1.1) ovaj zahtev je ekvivalentan uslovu da postoji linearni upravljaki zakon u[k ] = Kx[k ] kojim se na proizvoljan nain mogu podeavati polovi sistema u zatvorenoj sprezi, odnosno da postoji matrica K kojom se na proizvoljan nain mogu podeavati svojstvene vrednosti matrice K. Zanimljivo je meutim, da je i jedan od uslova da bi algebarska Rikatijeva jednaina imala jedinstveno pozitivno denitno simetrino reenje da je sistem kojim upravljamo dohvatljiv. Time se jo jednom iskazuje bliska povezanost linearnog vremenski nepromenljivog regulatora i regulatora koji podeava polove. Ve je napomenuto da sa porastom brzine odziva sistema raste i intenzitet upravljanja. Sa praktinog stanovita to moe biti problem jer aktuatori nameu ogranienja po pitanju kako vrednosti upravljake promenljive, tako i brzine njene promene. Agresivna upravljaka strategija je takoe nepraktina sa stanovita otpornosti sistema na um merenja, koji je u praksi uvek prisutan. U procesu projektovanju regulatora prinueni smo na kompromis izmeu brzine odziva sa jedne i otpornosti sistema na merni um sa druge strane. Takoe, suvie brzi regulatori mogu biti izuzetno osetljivi na uvek prisutne greke modelovanja. U graninom sluaju, ukoliko sve polove sistema u zatvorenoj sprezi postavimo u koordinatni poetak, dobijamo tzv. deat-beat regulator. Ovakvi regulatori su izuzetno brzi (kada ne bi bilo uma, izlaz bi bio identiki jednak zadatoj vrednosti zakasneloj za ksan broj odbiraka), ali su krajnje neotporni na merni um i greke modelovanja (ovako projektovan regulator nije robustan). Efekat prisustva mernog uma ilustrovan je sledeim primerom. Primer 1.3. Posmatrajmo sistem razmatran u prethodnom primeru. Zadraemo pretpostavku da su sva stanja merljiva, ali emo pretpostaviti da je prisutan i merni um, odnosno da je upravljaki zakon u[k ] = Kxm [k ] = K (x[k ] + n[k ]) , (1.32)
gde je xm vektor merenih vrednosti stanja, a n vektor mernog uma. Smatraemo da je u pitanju beli Gausov um standardne devijacije 0.05. Dijagrami na slici 1.4 ilustruju odziv sistema za razliite vrednosti kriterijuma optimalnosti (odnosno matrice pojaanja). Oigledno je da se bri regulator jednovremeno odlikuje i veom
13
varijansom upravljakog signala. Na slici su prikazane stvarne a ne merene vrednosti promenljivih stanja (x, a ne xm ). Lako uoljivo treperenje stanja je posledica varijanse upravljakog signala, a ne direktna posledica superponiranog uma merenja.
(a) Stanje x1
(b) Stanje x2
(c) Upravljanje
Slika 1.4. Trajektorija sistema i upravljaki signal za razliite vrednosti parametra R, odnosno matrice pojaanja K. T Promenljive koje odgovaraju R = 0.1 (K = [0.4462 0.2588] ) prikazane su punom, a promenljive koje odgovaraju R = 10 T (K = [0.2072 0.1228] ) prikazane su isprekidanom linijom. Svi rezultati su dobijeni za a = 1 i standardnu devijaciju uma 0.05.
1.1.4. Kompenzacija merljivih poremeaja. Svaki sistem automatskog upravljanja je pod neprekidnim dejstvom razliitih poremeaja. Zapravo prisustvo poremeajnih veliina u sistemu jeste osnovni razlog zbog koga se uvodi povratna sprega i automatska regulacija uopte. Po svojoj prirodi poremeaji su veoma raznovrsni. Javljaju se u vidu visokofrekventnih umova merenja (measurement noise), niskofrekventnih poremeaja koji nastoje da odvuku sistem iz tekue radne take (load disturbances), itd. U retkim sluajevima veliine koje unose poremeaje u sistem mogu se direktno meriti. Ukoliko je vrednost poremeaja poznata mogue je eliminisati njihovo dejstvo na sistem postupkom koji se u literaturi naziva feed-forward kompenzacija. Kada u sistemu postoje poremeaji, model sistema (1.1) treba zameniti modelom x[k + 1] = x[k ] + u[k ] + xu v[k ], (1.33)
14
gde je v[k ] vektor merenih vrednosti poremeajnih veliina, a xu matrica kojom se opisuje uticaj poremeaja na pojedina stanja sistema. Ukoliko deniemo upravljaki signal na sledei nain u[k ] = Kx[k ] Kv v[k ] sistem u zatvorenoj sprezi se vodi dinamikom x[k + 1] = x[k ] (Kx[k ] + Kv v[k ]) + xu v[k ] = ( K) x[k ] + (xu Kv ) v[k ]. (1.34)
Jasno, ukoliko matricu Kv biramo tako da je xu Kv = 0, (1.35)
poremeaj, ma koliki i kakav bio, nee imati apsolutno nikakvog uticaja na ponaanje sistema. Matricu pojaanja K biramo na uobiajen nain, optimizacijom odgovarajueg kriterijuma optimalnosti ili postupkom podeavanja polova. Ponekad uslov (1.35) ne mora biti identiki zadovoljen. esto je sasvim dovoljno birati Kv tako da norma matrice koja gurie na levoj strani ovog uslova bude mala. Takoe, mogue je reavati problem optimalnog upravljanja tretirajui v kao poznatu spoljanju veliinu (kad kaemo spoljanju, mislimo na to da ova veliina nije pod naim uticajem). Optimizacijom kriterijuma (1.12) nalazimo da je ( )1 Kv (k 1) = R + T S(k ) T S(k ) . (1.36)
Napomena 1.1.15. U emu je razlika izmeu feed-forward kompenzacije denisane izrazima (1.35) i (1.36)? U prvom sluaju, cilj je ponititi poremeaj po svaku cenu, bez obzira na eventualni upravljaki napor. Sa druge strane, kada se matrica pojaanja bira na osnovu izraza (1.36) vri se kompromis izmeu ekasnosti kompenzacije i intenziteta upravljanja. Ukoliko poremeaji deluju na ulazu objekta upravljanja (izmeu regulatora i samog procesa) postupak feed-forward kompenzacije je naroito jednostavan, i svodi se na oduzimanje izmerene vrednosti poremeaja od izraunatog upravljakog signala. Postupak je ilustrovan slikom 1.5.
Slika 1.5. Shematski dijagram feed-forward merljivog poremeaja na ulazu sistema.
kompenzacije
1.2. PROJEKTOVANJE OBSERVERA STANJA SISTEMA
15
Problem 1.3. Pokazati da struktura prikazana na slici 1.5 zaista u potpunosti eliminie mereni poremeaj; odnosno da vrednost poremeaja, ma koja ona bila, ne utie na stanja sistema. Pokazati kako se do prikazane strukture moe doi polazei od uslova (1.35).
Relativno je redak sluaj u praksi da se poremeaji mogu direktno meriti. Poremeaji su obino nepoznate veliine ijeg smo prisustva svesni tek kroz njihov uticaj na sam proces. Uprkos tome, poremeaje je mogue estimirati, odnosno mogue je proceniti njihovu vrednost na osnovu vrednosti poznatih veliina. Kompenzacija se tada moe vriti na osnovu estimiranih poremeaja. Vie o estimaciji poremeaja bie rei kada budemo govorili o observerima stanja, s obzirom da se identini algoritmi koriste i za observaciju stanja i za estimaciju poremeaja. 1.1.5. Numeriko reenje problema optimalnog upravljanja. U praktinim implementacijama optimalnog upravljanja koje se sreu u okviru razliitih prediktivnih upravljakih strategija est je sluaj da se optimalno upravljanje sraunava metodom direktne numerike optimizacije zadatog kriterijuma optimalnosti. Jedna od prednosti ovakvog naina reavanja problema jeste mogunost uvrtavanja razliitih ogranienja u proces iznalaenja optimalnog upravljanja. Posmatramo sistem opisan modelom (1.1) kojim elimo upravljati tako da se minimizuje vrednost kriterijuma optimalnosti (1.12). U cilju formalnog pojednostavljenja daljih razmatranja pretpostaviemo da posmatrani sistem poseduje samo jedan ulaz i jedan izlaz. Posmatrani problem se sada moe formulisati na sledei nain: nai vrednosti upravljakog signala u[0], u[1], ..., u[N 1] i vektore stanja x[1], ..., x[N ] koji minimiziraju (1.12) uz ogranienje da vai (1.1). Dakle imamo optimizacioni problem sa N + nN promenljivih i nN linearnih ogranienja. Sam kriterijum optimalnosti je kvadratna funkcija po svim promenljivama. Optimizacioni problem u kome je kriterijum optimalnosti kvadratna funkcija koju treba optimizovati pod uslovom da vai skup linearnih ogranienja spada u grupu tzv. QP (quadratic programming) problema. Ovakvi problemi se sreu u irokoj lepezi praktinih aplikacija, dobro su poznati i daju se ekasno reiti. 1.2. Projektovanje observera stanja sistema U prethodnom odeljku, razmatran je problem optimalne regulacije sistema opisanog modelom u prostoru stanja pod pretpostavkom da su sva stanja merljiva. U praksi, samo su izlazi sistema merljive veliine, te upravljanje povratnom spregom po stanjima nije mogue direktno implementirati. Ipak, stanja sistema je mogue rekonstruisati (observirati, estimirati, proceniti) na osnovu vrednosti poznatih veliina. Upravljanje je potom mogue vriti povratnom spregom po procenjenim vrednostima stanja. Algoritmi pomou kojih se vri rekonstrukcija vrednosti promenljivih stanja na osnovu poznatih ulaznih i izlaznih veliina nazivaju se estimatorima ili observerima stanja. 1.2.1. Projektovanje observera metodom podeavanja polova. Smatraemo da je dinamika sistema opisana jednainama (1.1) i (1.2), te da su jedine merene veliine u sistemu izlazne promenljive. U nastavku emo se sluiti sledeom notacijom: ako je a[k ] vrednost neke proizvoljne veliine u trenutku k , tada emo sa a [k ] oznaiti estimiranu vrednost te veliine u trenutku k . Dalje, ukoliko elimo naglasiti na osnovu kojih je informacija dobijena estimacija, pisaemo a [k |m ] u znaenju estimacija veliine a u trenutku k na osnovu podataka poznatih zakljuno sa trenutkom m.
16
estimiranu Observer stanja se projektuje na sledei nain. Oznaimo sa x vrednost promenljivih stanja. Estimacija stanja se vri na sledei nain [k + 1] = x [k ] + u[k ] + L (y[k ] Cx [k ]) x (1.37)
Poslednji sabirak u izrazu (1.37) ima ulogu korektivnog lana koji potpomae u eliminaciji greke estimacije. Da bi smo to videli, deniimo najpre greku estimacije stanja kao razliku stvarne i estimirane vrednosti vektora stanja. [k ]. e[k ] = x[k ] e Kombinovanjem izraza (1.1), (1.2), (1.37) i (1.38) lako nalazimo da je e[k + 1] [k + 1] = x[k + 1] e [k ] u[k ] L (y[k ] Cx [k ]) = x[k ] + u[k ] x = ( LC) e[k ]. (1.38)
(1.39)
Drugim reima dinamika greke estimacije upravljana je svojstvenim vrednostima matrice o = LC. Moe se pokazati da je, ukoliko je posmatrani sistem potpuno observabilan (observable), uvek mogue izabrati matricu L tako da se svojstvene vrednosti observerske matrice o postave u eljeni poloaj. Polovi ove matrice su od kljunog znaaja za pravilan rad observera. Ukoliko je dinamika observera suvie spora, on nee biti u stanju da prati brze promene stanja sistema. Sa druge strane, ukoliko je observer suvie brz nee biti u stanju da potisne visokofrekventni merni um. Polove observera uvek treba birati unutar jedininog kruga, nikako na njemu ili van njega. Ukoliko se polovi observera izaberu van jedininog kruga, greka estimacije e rasti tokom vremena, te observer nee sluiti svojoj osnovnoj nameni. Ukoliko se neki od polova observera nae na jedininom krugu, moe se desiti da se neka od stanja estimiraju sa ofsetom. Kada se polovi biraju unutar jedininog kruga greke estimacije tei nuli. Polovi blii jedininom krugu odgovaraju sporijoj, dok polovi blii koordinatnom poetku odgovaraju broj observaciji stanja. Ukoliko se svi polovi observera smeste u koordinatni poetak, greka estimacije e pasti na nulu za najvie onoliko perioda koliki je red sistema. Takav observer se naziva dead-beat observerom. Od svih estimatora stanja dead-beat observer je najbri, ali i najosetljiviji na merni um. Da bi se observer inicijalizovao neophodno je dati procenu vrednosti stanja u [0]. Ukoliko je razlona procena na raspolaganju inicijalnom trenutku vremena, x tim bolje, ali takva je procena obino nedostupna. U tom sluaju, moe se pret [0] = 0. Ukoliko je observer stabilan (a uvek se tako projektuje) postaviti da je x greka estimacije e teiti nuli, bez obzira na pogrenu polaznu procenu. Primer 1.4. Posmatrajmo sistem opisan diskretnim modelom u prostoru stanja x1 [k + 1] = 0.95x1 [k ] + 0.1x2 [k ] + u[k ], x2 [k + 1] = 0.8x2 [k ] + u[k ], y [k ] = x1 [k ]. (Izuzimajui jednainu izlaza, ovo je isti sistem koji je bio posmatran u svim dosadanjim primerima). Polovi sistema su 0.95 i 0.8. Nakon ekscitacije, sistem se smiruje na sledei nain y [k ] = C1 0.95k + C2 0.8k , gde su C1 i C2 konstante koje se lako odreuju (kako? ). Prethodno dobijena dinamika u diskretnom vremenu se moe posmatrati kao diskretizacija kontinualne dinamike y (t) = C1 exp ( Tt1 ) + C2 exp ( Tt2 ), gde su T1 i T2 vremenske konstante koje odgovaraju T T razliitim polovima sistema. Pri tome vai da je 0.95 = exp ( T ), 0.8 = exp ( T ), 1 2 gde je T period odabiranja. Sada je jasno da ukoliko elimo projektovati observer
17
koji je buta bri od sistema, polove observera treba birati tako to se polovi diskretnog sistema stepenuju na . (U optem sluaju, polovi diskretnog modela mogu imati nenulti argument, u tom sluaju stepenuju se samo absolutne vrednosti polova, dok argument moe ostati neizmenjen ili se birati na proizvoljan nain.) Na slici 1.6 prikazane su stvarne i estimirane vrednosti promenljivih stanja, kao i greka estimacije za razliite polove observera pod pretpostavkom da je merenje idealno (bez uma). Uticaj uma merenja je ilustrovan dijagramima na slici 1.7. [0] = 0, standardna devijacija belog uma je u Observeri su inicijalizovani sa x ovom primeru 0.05. Sasvim je jasno da se izborom breg observera postie i bra
(a) x1 : stvarna i estimirane vrednosti
(b) x2 : stvarna i estimirane vrednosti
(c) x1 : greke estimacije
(d) x2 : greke estimacije
Slika 1.6. Stvarne i estimirane vrednosti stanja, kao i greka estimacije za dva razliita izbora polova observera. Prvi, sporiji observer (zelena isprekidana linija) ima polove u takama 0.9025 i 0.64 ( = 2). Drugi, bri observer (crvena takasta linija) ima polove u 0.7738 i 0.3277 ( = 5). Razlika u brzini konvergencije greke estimacije je oigledna. Stvarne vrednosti stanja su prikazane punom plavom linijom. eliminacija greke estimacije. Treba, meutim, imati u vidu i injenicu da svaki observer deluje i kao ltar mernog uma. Brz observer ima irok propusni opseg. Usled toga, sporiji observer e ekasnije eliminisati merni um. Izbor polova observera je uvek kompromis izmeu brzine eliminacije greke estimacije i ekasnosti ltracije mernog uma. Napomena 1.2.1. Uticaj mernog uma na kvalitet estimacije moemo raunati na sledei nain. Mereni izlaz sistema jednak je stvarnom izlazu datom jednainom
18
(a) x1 : stvarna i estimirane vrednosti
(b) x2 : stvarna i estimirane vrednosti
(c) y : stvarna i izmerena vrednost
Slika 1.7. Stvarne i estimirane vrednosti stanja za dva razliita izbora polova observera, te stvarna i merena vrednost izlaza. Prvi, sporiji observer (zelena isprekidana linija) ima polove u takama 0.9025 i 0.64 ( = 2). Drugi, bri observer (crvena takasta linija) ima polove u 0.7738 i 0.3277 ( = 5). Stvarne vrednosti stanja i izlaza su prikazane punom plavom linijom. Merena vrednost izlaza je prikazana takastom linijom u purpurnoj boji. Jai ltarski efekat sporijeg observera je oigledan. (1.2) na koji je superponiran merni um y[k ] = Cx[k ] + n[k ]. Signal n[k ] je tipino visokofrekventni signal male amplitude koji dovodi do brzog treperenja mernog signala ali mu ne menja srednju vrednost. Videti primer 1.3. Kada se ovako izraen mereni signal izlaza uvrsti u jednainu observera (1.37) dolazimo do sledeeg izraza kojim se opisuje dinamika greke observacije e[k + 1] = ( LC) e[k ] + Ln[k ]. Brzi observeri tipino imaju velike vrednosti komponenata matrice L. Jasno je stoga da ovakvi observeri u veoj meri proputaju merni um. 1.2.2. Estimacija nemerljivih poremeaja. Kao to se stanja sistema obino ne mogu direktno meriti, ve ih je neophodno estimirati na osnovu izlaza sistema, tako su i poremeaji koji deluju na sistem obino nemerljivi. U jednom od prethodnih pododeljaka videli smo kako je mogue eliminisati uticaj merljivog poremeaja na sistem. Ukoliko poremeaji nisu merljivi, njihov uticija na sistem je mogue redukovati kompenzacijom na osnovu estimirane vrednosti poremeaja. Sada emo
19
pokazati na koji nain se vri estimacija nemerljivih poremeaja. Posmatrajmo sistem opisan modelom u prostoru stanja x[k + 1] = x[k ] + u[k ] + xu v[k ], v[k + 1] = u v[k ]. (1.40) (1.41)
Smatramo da, iako sam poremeaj nije merljiv, dinamika poremeajnih veliina jeste poznata. Modelovanje poremeaja (eksplicitno, kao u ovom sluaju, ili implicitno, kao u sluaju PID regulatora) je znaajan korak u projektovanju ma kog praktino primenljivog upravljakog algoritma. Uoiti da su promenljive kojima se opisuje poremeaj, v[k ], nekontrolabilne, na njih nije mogue uticati pomou ulaznih promenljivih u[k ]. Ipak, pretpostaviemo da su poremeajne promenljive observabilne, odnosno da ih je mogue proceniti na osnovu merenja izlaza sistema. Polovi koji odgovaraju modovima poremeaja (svojstvene vrednosti matrice u ) su tipino granino stabilni (nalaze se na jedininoj krunici). Model (1.41) je mogue zapisati i u konciznijoj formi, kao [ ] [ ][ ] [ ] x[k + 1] xu x[k ] = + u[k ]. (1.42) v[k + 1] 0 u v[k ] 0 Sada se observer projektuje za ovakav proireni sistem na identian nain kao i ranije, u formi (1.37), pri emu se uvode smene [ ] [ ] xu , . 0 u 0 [ ]T Matrica pojaanja observera ima strukturu LT LT , i bira se tako da se polovi u matrice observacije o postave u eljeni poloaj. Kompromis izmeu brzine estimacije i otpornosti na merni um je i dalje na snazi. Ovaj kompromis ima zanimljivu interpretaciju kada je estimator poremeaja u pitanju. Brz estimator e gotovo trenutno reagovati na pojavu poremeaja, dok e sporijem estimatoru trebati vie vremena da shvati da je poremeaj prisutan u sistemu. Sa druge strane, svako odstupanje merene promenljive od oekivane vrednosti (a ovo odstupanje moe da bude posledica bilo poremeaja bilo uma merenja) naterae brz observer da odreaguje. Sporiji observer e reagovati tromije. Posledino, brz observer e pratiti merni um dok e tromiji observer usrednjavati (ltrirati) merenu veliinu. 1.2.3. Kalmanovi ltri. Kalmanovi ltri su observeri stanja kod kojih se matrica observera bira u cilju minimizacije srednjeg kvadrata greke estimacije. Dakle struktura observera ostaje ista. Na snazi su i svi prethodno izneti zakljuci o osobinama estimatora stanja. Jedino se matrica pojaanja observera L bira na drugaiji nain. Kada se observer stanja projektuje kao Kalmanov ltar, tada se osobine uma eksplicitno uzimaju u obzir. U cilju praenja izlaganja u ovom pododeljku, od itaoca se oekuje da poseduje elementarna znanja iz oblasti teorije verovatnoe i sluajnih procesa. Konkretno, smatraemo da su pojmovi matematiko oekivanje i varijansa (disperzija) poznati, te da je italac upoznat sa pojmom belog uma. Posmatramo sistem opisan modelom u prostoru stanja x[k + 1] = x[k ] + u[k ] + nx [k ], y[k ] = Cx[k ] + ny [k ], (1.43) (1.44)
gde su nx [k ] i ny [k ] sluajni signali. Smatramo da su ovi signali nezavisni meusobno, ali da takoe ne zavise od stanja i ulaza sistema. Konkretno, smatraemo da se ove promenljive mogu posmatrati kao stohastike veliine sa osobinama Gausovog
20
belog uma. Pretpostaviemo da su kovarijanse ovih signala poznate, konkretno } { E nx nT = Rx x { } E nx nT = Rxy y { } T = Ry E ny ny gde je E oznaka za operator matematikog oekivanja. Zbog toga to sada kompletan sistem posmatramo iz ugla teorije sluajnih procesa, razlono je smatrati da ni poetno stanje nije poznato sa potpunom sigurnou, ve da je poznata statistika raspodela poetnog stanja. Konkretno, poznate su oekivana vrednost i varijansa poetnog stanja. Uvodimo oznake { } T Ex[0] = m0 , E (x[0] m0 ) (x[0] m0 ) = R0 . Napomena 1.2.2. Veoma bitno je uoiti da se poremeaji u modelu (1.43), (1.44) sutinski razlikuju od poremeaja koji se javlja u prethodno razmatranom modelu (1.41). U modelu koji razmatramo u tekuem poglavlju, poremeaji su stohastiki signali ija je srednja vrednost nula, dok su u prethodnom odeljku poremeaji bili deterministiki signali ija vrednost najee odstupa od nule, praktino u pitanju su najee step signali, a neto ree rampe i tamo gde je to svrsishodno prostoperiodini signali poznatih frekvencija. Dakle, u prethodnom poglavlju bavili smo se problemom eliminacije poremeaja koji nastoje da izmeste sistem iz tekue radne take (load disturbance), dok se u ovom poglavlju bavimo poremeajima koji se ponaaju poput uma, odnosno poremeajima koji nastoje da poveaju varijansu, a ne srednju vrednost procesnih promenljivih. Kalmanov ltar jeste estimator stanja koji minimizira varijansu greke estimacije, odnosno veliinu { } T P(k ) = E (e[k ] Ee[k ]) (e[k ] Ee[k ]) . (1.45) Valja naglasiti da je P[k ] matrica, te da minimizirati treba shvatiti u smislu minimizirati normu. Moe se pokazati da je optimalna vrednost matrice pojaanja estimatora ( )( )1 L(k ) = P(k )CT + Rxy Ry + CP(k )CT (1.46) Pri emu se matrica kovarijanse rauna na osnovu rekurentnog izraza ( ) P(k + 1) = P(k )T + Rx L(k ) Ry + CP(k )CT LT (k ) P(0) = R0 Napomena 1.2.3. Treba uoiti da je izrazi kojima se denie Kalmanov ltar potpuno analogni izrazima pomou kojih se rauna optimalna upravljaka strategija. Drugim reima, (1.47) ima formu Rikatijeve jednaine (1.24), dok je izraz (1.46) sasvim slian izrazu pomou koga se rauna optimalno pojaanje linearnog regulatora (1.26). ta vie, kae se da su problem projektovanja linearnog optimalnog regulatora i problem projektovanja optimalnog estimatora (Kalmanovog ltra) meusobno dualni. Napomena 1.2.4. Slino kao to je sa praktinog stanovita daleko pogodnije koristiti vremenski nepromenljivi (sub)optimalni regulator, i vremenski nepromenljivi estimator je od posebnog znaaja. Vremenski nepromenljivi Kalmanov ltar dobijamo ukoliko matricu kovarijanse greke estimacije P(k ) zamenimo njenom vrednou u
(1.47)
1.3. PROJEKTOVANJE LINEARNIH OPTIMALNIH REGULATORA PO IZLAZIMA
21
ustaljenom stanju P = P(k ). Algebarska Rikatijeva jednaina pomou koje se rauna matrica pojaanja vremenski invarijantnog optimalnog estimatora jeste ( )1 L P = PT + Rx LT Ry + CP(k )CT (1.48) ( )( )1 L = PCT + Rxy Ry + CPCT (1.49)
Napomena 1.2.5. Vremenski nepromenljiv Kalmanov ltar jeste estimator stanja iste strukture kao observer dobijen metodom podeavanja polova. Razlika je jedino u nainu na koji je dobijena matrica observera. Poznato je da je potreban i dovoljan uslov da bi se stanja sistema mogla rekonstruisati na osnovu izlaza da je sistem osmotriv (observable). Da podsetimo, sistem je osmotriv ako i samo ako je mogue na osnovu merenja izlaza u konanom intervalu vremena izraunati vrednosti stanja na poetku tog intervala. Na osnovu dialnosti problema projektovanja optimalnog regulatora i optimalnog estimatora (dakle, na osnovu dualnosti odgovarajuih algebarskih jednaina (1.27) i (1.48)) i dualnosti pojmova dohvatljivosti i osmotrivosti, zakljuujemo da je jedan od uslova da bi se Kalmanov vremenski nepromenljiv estimator mogao projektovati jeste da je sistem koji posmatramo osmotriv. 1.3. Projektovanje linearnih optimalnih regulatora po izlazima U ovom odeljku, baviemo se problemom projektovanja (praktino ostvarivog) linearnog optimalnog regulatora po izlazima sistema. Problemi koje smo razmatrali u prethodnim odeljcima mogu se smatrati koracima, odnosno komponentama, reenja tekueg problema. Moe se pokazati da je problem projektovanja optimalnog regulatora uvek mogue dekomponovati na problem projektovanja regulatora pod pretpostavkom da su sva stanja merljiva i na problem estimacije stanja. Ovo tvrenje se naziva principom separacije i moe se strogo formulisati i dokazati na vie naina. Struktura regulatora dobijenog na ovaj nain prikazana je na slici 1.8.
Slika 1.8. Shematski dijagram sistema u kome se regulacija vri povratnom spregom po estimiranim stanjima. Komponente koje ine regulator, odnosno komponente koje se implementiraju unutar upravljakog ureaja uokvirene su pravougaonikom isprekidanih ivica.
22
1.3.1. Struktura linearnog optimalnog regulatora po izlazima sistema. Princip separacije. Pretpostaviemo, kao i do sada, da je sistem opisan modelom u prostoru stanja (1.1), (1.2). Pretpostaviemo takoe da je estimator stanja linearan, vremenski nezavistan (bez obzira da li se radi o observeru dobijenom metodom podeavanja polova ili o Kalmanovom ltru), te da se upravljanje vri linearnom, vremenski nezavisnom povratnom spregom po estimiranim stanjima. Trenutno nije od interesa da li je regulator optimalan ili je projektovan metodom podeavanja polova. Smatraemo, meutim, da su i linearni regulator i linearni estimator vremenski nezavisni. Jednaine sistema nakon zatvaranja povratne sprege glase x[k + 1] = x[k ] + u[k ], y[k ] = Cx[k ], [k + 1] = x [k ] + u[k ] + L (y[k ] Cx [k ]) , x [k ]. u[k ] = Kx (1.50) (1.51) (1.52) (1.53)
Vidimo da nakon zatvaranja povratne sprege sistem ima 2n stanja, odnosno dvostruko vie stanja nego to ih ima sistem u otvorenoj sprezi. Vidimo takoe da su sva dodatna stanja posledica dinamike observera. Uoavamo da dinamika observera (pa dakle, dinamika projektovanog regulatora) u sebi sadri model upravljanog procesa. Struktura sistema postaje znatno jednostavnija za analizu ukoliko umesto es [k ]. Eliminacijom timiranih stanja posmatramo greku estimacije e[k ] = x[k ] x upravljakog signala, jednaine (1.50), (1.52) i (1.53) postaju x[k + 1] e[k + 1] = = ( K) x[k ] + Ke[k ], ( LC) e[k ] (1.54) (1.55)
jednaina izlaza (1.51) je, naravno, i dalje na snazi. Promenljive stanja sistema u zatvorenoj sprezi su x[k ] i e[k ]. Karakteristina matrica (matrica koja denie dinamiku) sistema je [ ] K K . (1.56) 0 LC Polovi sistema u zatvorenoj sprezi su svojstvene vrednosti ove matrice, odnosno nule njenog svojstvenog polinoma. Usled blok-trougaone strukture posmatrane matrice njen karakteristini polinom se lako nalazi u formi pcl (z ) = det (z I + K) det (z I + LC) . (1.57) Jasno, sistem u zatvorenoj sprezi ima 2n polova, od ega n polova observera i n polova nastalih podeavanjem polova samog sistema linearnom spregom po stanjima. Vidi se takoe da uvoenje linearne povratne sprege po stanjima ni na koji nain ne menja dinamiku greke estimacije (to je sasvim logino, jer greka estimacija ne zavisi od upravljakog signala, pa ne zavisi ni od naina na koji se upravljaki signal formira). Zanimljivo je, meutim, da iako se greka estimacije pojavljuje eksplicitno u jednaini (1.54) ona ne utie na polove sistema koji su posledica primene linearnog upravljakog zakona. Prilikom projektovanja regulatora, mogue je stoga najpre projektovati linearni regulator pod pretpostavkom da su sva stanja sistema merljiva, a potom, nezavisno od prvog koraka, projektovati estimator stanja. Prethodno izneti zakljuci ine sr principa separacije. Napomena 1.3.1. Princip separacije se moe formulisati i na drugaiji nain. Naime, moe se pokazati da se i u kontekstu optimalnog upravljanja optimalna upravljaka strategija moe formulisati u vidu linearnog upravljanja po estimiranim stanjima, drugim reima, optimalnom regulacijom po optimalno estimiranim stanjima [ AW97].
1.3. PROJEKTOVANJE LINEARNIH OPTIMALNIH REGULATORA PO IZLAZIMA
23
Na osnovu jednaina (1.52) i (1.53) moe se izvesti i funkcija prenosa regulatora. Treba samo imati na umu da je regulator linearni sistem koji na osnovu merenih veliina (putem estimiranih stanja) proraunava upravljaki signal. Prelaskom u z domen, nakon eliminacije estimiranih stanja, nalazimo U (z ) 1 = K (z I + K + LC) L (1.58) D(z ) = Y (z ) 1.3.2. Projektovanje regulatora koji estimira i eliminie poremeaj. Uvoenje integralnog dejstva. U nekim od prethodnih odeljaka, bilo je rei o eliminaciji uticaja merljivih poremeaja, te o upotrebi observera u cilju estimacije poremeaja koje nije mogue direktno meriti. Sada emo prikazati opti postupak tretiranja poremeaja pri projektovanju linearnih regulatora u prostoru stanja. Pretpostaviemo da je sistem u otvorenoj sprezi opisan modelom u prostoru stanja glase x[k + 1] = x[k ] + u[k ] + xu v[k ], v[k + 1] = u v[k ], y [k ] = Cx[k ]. (1.59) (1.60) (1.61) (1.62) (1.63) (1.64)
Nakon zatvaranja povratne sprege, ovim jednainama treba dodati i sledee izraze [k + 1] = x [k ] + u[k ] + xu v [k ] + L (y[k ] Cx [k ]) , x [k + 1] = u v [k ] + Lv (y[k ] Cx [k ]) , v [k ] K v v [k ]. u[k ] = Kx
Kao i ranije, dati sistem se jednostavnije analizira uvoenjem greaka estimacije greka estimacije promenljivih stanja, a kao promenljivih stanja. Neka je e = x x greka estimacije poremeaja. Nakon eliminacije upravljake promenljive ev = vv i kraeg sreivanja nalazimo x[k + 1] = ( K) x[k ] + (xu Kv ) v[k ] + Ke[k ] + Kv ev [k ], (1.65) (1.66) (1.67) (1.68) (1.69) (1.70)
v[k + 1] = u v[k ], e[k + 1] = ( LC) e[k ] + xu ev [k ], ev [k + 1] = v ev [k ] Lv Ce[k ], y[k ] = Cx[k ].
Analizom prethodnih izraza dolazimo do niza zakljuaka. Najpre, kao to je poznato od ranije, dinamika procesa se podeava ogovarajuim izborom matrice K, dok se dinamika observera stanja sistema podeava pogodnim izborom matrice L. Na greku estimacije poremeaja se moe uticati pomou matrice Lv . Uticaj poremeaja na stanja sistema se moe redukovati pravilnim izborom matrice Kv . Konkretno, ukoliko je mogue birati ovu matricu tako da je xu Kv = 0, tada poremeaj ne utie na stanja sistema (uoiti, dodue, da greka estimacije poremeaja utie na dinamiku stanja sistema). U praktino najvanijem sluaju, pretpostavlja se da poremeaj ima konstantu, ali nepoznatu vrednosti, te da utie na sistem preko ulaza.
POGLAVLJE 2
Pregled komercijalnih MPC strategija

Ovo poglavlje obuhvata pregled komercijalnih upravljakih prediktivnih strategija koje su nale svoju primenu u industriji. Veoma lepo izloena materija vezana za prediktivne strategije moe se nai u [CB99]. Svaki prediktivni kontroler je denisan izborom optih elemenata kao to su: model procesa i poremeaja, kriterijum optimalnosti i upravljaki zakon. Postoji veliki broj MPC algoritama koji se nalaze u irokoj primeni u industriji. Neki od njih pripadaju velikoj kategoriji prediktivnih upravljakih pristupa koja koristi konvolucione modele, takode poznate pod nazivom neparametarski modeli. Ovi algoritmi su bazirani na modelima step i impulsnog odziva. Kao njihovi najpoznatiji predstavnici pominju se DMC (Dynamic Matrix Control) and MAC (Model Algorithmic Control). Uz gore pomenute interesantan je jo i PFC (Predictive Funtional Control) algoritam koji koristi skup osnovnih funkcija da bi formirao buduu upravljaku sekvencu.
2.1. DMC (Dynamic Matrix Control) DMC je razvijen krajem sedamdesetih godina od strane Katlera (Cutler) i Rejmejkera (Ramaker), i naao je svoju primenu vecinom u petrohemijskoj industriji.
2.1.1. Predikcija. Model procesa u ovom algoritmu je konvolucioni model zasnovan na poznavanju step odziv procesa, dok se poremeaji smatraju konstantnim du celog horizonta. Step model je dat u sledeoj formi:
i=1
y ( t) =
gi u(t i).
(2.1)
A predviene vrednosti izlaza du horizonta sledeim izrazom:

i=1
y (t + k | t)
gi u(t + k i) + n (t + k | t) gi u(t + k i) +
i=k+1
k i=1
gi u(t + k i) + n (t + k | t)(2.2)
Poremeaji se smatraju konstantnim du celog horizonta i predstavljaju razliku izmeu merenog izlaza i onog procenjenog od strane modela, tj. n (t + k | t) = n (t | t) = ym (t) y (t | t). Dalje se moe pisati:
25
26
2. PREGLED KOMERCIJALNIH MPC STRATEGIJA
y (t + k | t)
k i=1
gi u(t + k i) +
i=1
i=k+1
gi u(t + k i)
+ y m ( t) =
k i=1
gi u(t i) (2.3)
gi u(t + k i) + f (t + k )
Gde je f (t + k ) slobodan odziv sistema, tj. Deo odziva koji ne zavisi od buduih upravljkih signala i dat je izrazom: f (t + k ) = ym (t) +
i=1
(gk+i gi )u(t i).
(2.4)
Ako je proces asimptotski stabilan koecijenti gi step odziva tee kontanatnoj vrednosti. Nakon N perioda odabiranja se moe rei da je gk+i gi 0, i > N. I zato vai: f (t + k ) = ym (t) +
N i=1
(2.5)
(gk+i gi )u(t i).
(2.6)
Ako proces nije asimptotski stabilan, onda ne moemo da ponaemo N za koje vai prethodni izraz i f (t + k ) se ne moe izraunati na ovaj nain. Predikcije se mogu raunati du horizonta predikcija uzimajui u obzir m upravljakih signala y (t + 1 | t) = g1 u(t) + f (t + 1) y (t + 2 | t) = g2 u(t) + g1 u(t + 1) + f (t + 2) . . . k y (t + p | t) = gi u(t + p i) + f (t + p)
i=1
(2.7)
Sada moemo denisati dinamiku matricu sistema G G= g1 g2 . . . gm . . . 0 g1 . . . gm1 . . . .. . . . . 0 0 . . . g1 . . .
(2.8)
gp gp1 gpm1 Stoga izraz za izlaz moe biti denisani u sledeem obliku: y ^ = Gu + f (2.9)
G ini m kolona (koliki je upravljaki horizont) step odziva sistema pomerenih na dole za jedan stepen vie sa svakom kolonom. y ^ je p dimenzioni vektor koji sadri predikciju izlaza du horizonta, u predstavlja m dimenzioni vektor upravljaih inkremenata i f je vektor slobodnog odziva.
2.1. DMC (DYNAMIC MATRIX CONTROL)
27
2.1.2. Merljivi poremeaji. Merljivi poremeaji mogu lako biti dodati u jednaine predikcija poto mogu da se tretiraju kao ulazi sistema. Izraz (2.9) moe da se koristi da bi se izraunali estimirani(predvieni) poremeaji: y ^ (2.10) d = Dd + fd Gde je y ^ d doprinos merljivih poremeaja izlazu sistema, matrica D je slina matrici G i sadri koecijente odziva sistema na step u poremeaju, d je vektor inkremenata poremeaja i fd je deo odziva koji ne zavisi od merljivih poremeaja. U najoptijem sluaju merljivi i nemerljivi poemeaji, ukupan slobodan odziv sistema (deo izlaza koji ne zavisi od manipulativne promenljive) moe da se posmatra kao suma etiri faktora: odziva na ulaz u(t) , odziva na merljive poremeaje d(t) , odziva na nemerljive poremeaje fd i odziva na aktuelno stanje procesa: f = fu + Dd + fd + fn Sada opti izraz moe biti zapisan u sledeoj formi: y ^ = Gu + f (2.11)
(2.12)
2.1.3. Upravljaki algoritam. Uspeh DMC a u industriji dolazi od njegove primene u visoko dimenzionim multivarijabilnim sistemima sa korienjem ogranienja. Cilj DMC kontrolera je da omogui izlazu da prati ulaz (setpoint) to blie mogue u smislu namanjih kvadrata sa mogunou ukljuivanja izraza za kanjavanje lanova ulaznih akcija. Funkcija cilja je data u obliku kvadratne funkcije koja minimizuje budue greke: J=
p i=1
( y (t + j | t) (t + j ))
(2.13)
Ili moe da ukljui upravljaki napor koji se kanjava: J=

p i=1
( y (t + j | t) (t + j )) +
m i=1
(u(t + j 1))2
(2.14)
Ako ne postoje ogranienja, reenje minimizacije funkcije cilja J = eeT + uuT , gde je e vektor buduih greaka du horizonta, a u vektor buduih upravljakih inkremenata u(t), , u(t + m) se moe dobiti analitiki raunajui izvod od J i izjednaavajui ga sa 0 ( dJ du = 0), to da je sledei izraz u = (GT G + )1 GT ( f) (2.15) Obavezno zapamtiti da se u svim prediktivnim strategijama pamti samo prvi elemenat vektora u (u(t)) i da se alje procesu. Ne preporuuje se da se implementira cela sekvenca upravljanja u narednih m intervala. Ovo je iz razloga zato to je nemogue savreno proceniti vektor poremeaja i zato je nemogue tano predvideti neizbene poremeaje koji dovode do toga da se stvarni izlaz razlikuje od prediktovanog koji se koristi za izraunavanje buduih upravljakih sekvenci. 2.1.4. Problemi sa ogranienjima. Iako je raunski mnogo sloeniji od mnogih algoritama ovaj algoritam (i sam MPC uopte) se pokazao kao veoma pogodan za baratanje ogranienjima iz razloga to se esto deava da ekonomska radna taka lei u preseku ogranienja. Ponekad je iz bezbednosnih razloga potrebno odravati sigurnu zonu oko radne take, poto efekti poremeaja mogu uiniti da proces prekri ogranienja. Smanjenjem ove zone zarada se poveava, naravno ukoliko je kontroler sposoban da prati ogranienja. Ogranienja se uvode u sledeoj formi:
28
N i=1
j j Cyi y (t + k | t) + Cui u(t + k i | t) + cj 0, j = 1, , Nc
(2.16)
Poto budui estimirani izlazi mogu direktno da se poveu sa inkrementalnim vektorom upravljanja putem dinamike matrice, sva ogranienja na ulaze i izlaze mogu da se stave u matricu R i da se predstave putem nejednakosti koja ukljuuje ulazni vektor, (Ru c). Na ovaj nain ovaj problem postaje klasini QP problem. Optimizacija postaje numerika zbog prisustva konstanti i obavlja se reavanjem ovog QP problema, koristei najee neki od standardnih komercijalnih QP kodova, u svakom trenutku odabiranja, a potom se vrednost (u(t)) alje procesu kao to se radi kod svih klasinih MPC algoritama. Ovaj metod se naziva QDMC (zbog toga to se koristi QP algoritam). 2.1.5. Proirenje na multivarijabailni sluaj. Mogue je proiriti osnovnu emu koja vai za sluaj jednog ulaza i izlaza na sluajeve sa vie ulaza i izlaza. Osnovne jednaine ostaju iste, ali se matrice i vektori menjaju u smislu da postaju glomazniji. Vektor predvienih ulaza se denie na sledei nain: y = [y1 (t + 1 | t), , y1 (t + p1 | t), , yny (t + 1 | t), , yny (t + pny | t)] (2.17) Dok se vektor buduih kontrolnih signala denie kao: u = [u1 (t), , u1 (t + m1 1), , unu (t), , unu (t + mnu 1)] (2.18) A vektor slobodno odziva kao: f = [f1 (t + 1 | t), , f1 (t + p1 | t), , fny (t + 1 | t), , fny (t + pny | t)] (2.19) uzimajui u obzir da se slobodan odziv i tog izlaza zavisi i od prolih izlaza yi i prolih vrednosti svih upravljakih signala. 2.2. MAC (Model algorithmic control) Ovo je moda najjednostavniji i najintuitivniji algoritam prediktivnog upravljanja. Ovaj metod je veoma slian DMC u sa nekoliko malih razlika. Umesto step odziva kao u DMC u, u MAC - u se koristi skraeni impulsni odziv procesa. Ovaj metod takoe omoguava jednostavno eksplicitno reenje u odsustvu ogranienja. Ovaj metod se dosta koristi u upravljakim aplikacijama iz razloga to za za razliku od modela funkcije prenosa koji mogu da daju rezultate sa velikim grekama kada postoji greka u modelu (kada se model razlikuje od stvarnog procesa), identikacija impulsnog odziva je prilino jednostavna. 2.2.1. Model procesa i nain predikcije. Izlaz sistema u trenutku t je povezan sa ulazima preko koecijenata skraenog impulsnog odziva na sledei nain y (t) =
i=1 T T T
hi u(t i) = H (z 1 )u(t).
(2.20)
Ovaj model predvia izlaz u datom trenutku u zavisnosti od linearne kombinacije vrednosti prolih ulaza. Teinski faktori hi predstavljaju koecijente impulsnog odziva. Kada se odziv skrati na N elemenata , za sistem se smatra da je stabilan i kauzalan. Sada se moe za k to korani prediktor napisati:
2.2. MAC (MODEL ALGORITHMIC CONTROL)
29
y (t + k | t) =
N i=1
hi u(t + k i) + n (t + k | t)
(2.21)
S tim da se ova suma moe podeliti na dva dela: fr (t + k ) = I fo (t + k ) =

N i=k+1 N i=k+1
hi u(t + k i)
(2.22)
hi u(t + k i)
(2.23)
Gde fr (t + k ) predstavlja slobodan odziv, to jest oekivanu vrednost izlaza y (t + j ) bez ijednog budueg signala, a fo predstavlja forsirani odziv, tj. dodatnu komponentu izlaznog odziva zbog buduih upravaljakih akcija. Predpostavlja se da e poremeaji ostati konstantni u budunosti stoga vai n (t + k | t) = n (t | t) = ym (t) y (t | t) Onda je predikcija data sledeim izrazom: y (t + k | t) = fr + fo + n ( t | t) (2.25) (2.24)
Ako je M duina horizonta predikcije, a u+ vektor buduih upravljakih signala, u vektor prolih upravljakih signala, y vektor predvienih izlaza, n vektor poremeaja, - vektor referenci koji predstavljaju blag prilaz trenutnom setpointu: u(t) u(t + 1) u+ = (2.26) . . . u(t + M 1) u(t N + 1) u(t N + 2) u = (2.27) . . . u(t 1) y (t + 1) y (t + 2) y= (2.28) . . . n= = i ako deniemo matrice: y (t + M ) n (t + 1) n (t + 2) . . . n (t + M ) (t + 1) (t + 2) . . . (t + M ) (2.30) (2.29)
30
H1 = H2 =
h1 h2 . . . hm .. .
0 h1 . . . hm1 hi hj . . . hN
.. . . . .
0 0 . . . h1
(2.32) (2.31)
hN 0 . . . 0
h2 h3 . . . hM +1
moemo zapisati prediktor u sledeoj formi: y = H1 u+ + H2 u + n (2.33)
2.2.2. Upravljaki zakon. Osnovni cilj kontrolera je da odredi sekvencu upravljakih signala koja e minimizovati sumu kvadrata razlika predvienog izlaza od referencne trajektorije. Referencna trajektorija koju MAC uglavnom koristi je glatka aproksimacija trenutne vrednosti sistema perma poznatoj referenci putem sistema prvog reda sledeeg oblika: (t + k ) = (t + k 1) + (1 )r(t + k ), k = 1, , N, (t) = y (t) (2.34)
Vano je primetiti da je oblik referencne trajektorije (koji zavisi od izbora parametra ) odreuje eljenu brzinu prilaska setpointu (eljenoj vrednosti). Ovo je u praksi od velikog interesa poto omoguava da se kontrolie agresivnost algoritma: poveevanje konstante vodi do sporijeg ali robusnijeg kontrolera. Parametar je vie direktan i intuitivan od faktora kao to su teinski faktori i duina horizonta. Funkcija cilje minimizuje greku i upravljaki napor. Budue greke su date na sledei nain: e = y = H2 u n H1 u+ = f H1 u+ (2.35)
Gde vektor f sadri lanove koji zavise samo od poznatih vrednosti (prolih ulaza, tekuih izlaza i referenci). Funkcija cilja je data na sledei nain: J = eeT + uT + u+ (2.36)
Gde je kanjavajui faktor za upravljaki napor. Ako se ogranienja ne uzimaju u obzir, reenje se eksplicitno moe dobiti na sledei nain:
1 u = (HT H1 T ( f) 1 H1 + I)
(2.37)
Poto je ovo strategija pomerajueg horizonta, u obzir se uzima samo prvi elemenat vektora u(t) , dok se ostatak zanemaruje i ponavljaju se izraunavanja u sledeem vremenskom trenutku. Iako je izraunavanje upravljakog zakona prilino jednostavno u odnosu na druge formulacije ipak se zahteva raunanje inverzne matrice dimenzija M M . Ako je broj buduih ulaza jednak P < M , onda je ova matrica dimenzija P P , poto je matrica H1 dimenzija M P , i na ovaj nain se smanjuju neophodna izraunavanja.
2.3. PFC (PREDICTIVE FUNCTIONAL CONTROL)
31
2.3. PFC (Predictive Functional Control) PFC je predloen od strane Rieljea (Richalet, 1987) za brze procese i karakteriu ga dve osobine: strukturizacija upravljakih signala kao linearne kombinacije odreenih predenisanih baznih funkcija, i koncept podudarajuih taaka (coincidence points) da bi se procenila funkcija cilja du horizonta. 2.3.1. Formulacija. Razmotrimo sledei model u prostoru stanja: xm (t) ym (t) = M xm (t 1) + N u(t 1) = Qxm (t) (2.38)
Predikcija se dobija dodavanjem autokompenzacionog lana koji predstavlja razliku izmeu modela i prolih izlaza. y (t + k | t) = ym (t + k ) + e(t + k ) (2.39)
Budui upravljaki signal je linearana kombinacija osnovnih funkcija Bi , izabranih po prirodi procesa i referenci: u(t + k ) =
NB i=1
i (t) + Bi (k )
(2.40)
Obino su ove funkcije polinomialnog tipa: stepa (B1 (k ) = 1), rampe(B2 (k ) = k ), parabole (B3 (k ) = k 2 ), poto veina referenci moe biti izraena linearnom kombinacijom ovih funkcija. Korienjem ove strategije kompleksni ulazni prol moe biti speciciran korienjem malog broja nepoznatih parametara. Izbor baznih funkcija denie ulazni prol i moe obezbediti predenisano ponaanje (na primer, gladak signal). Ovo predstavalja veliku prednost kada se upravlja nelinearnim sistemima. Funkcija cilja koja se minimizuje je data u sledeoj formi: J=
NH i=1
( y (t + j ) (t + j ))2
(2.41)
Gde je (t + j ) obino aproksimacija prvog reda poznatoj referenci, kao u (2.34) ili: (t + k ) = r(t + k ) + k (r(t) y (t)) (2.42)
2
Da bi se upravljaki signal uinio glatkim, kvadratni faktor oblika [u(k )] se moe dodati u funkciju cilja. Prediktovana greka se ne rauna du celog horizonta nego samo u odreenim trenucima hj , j = 1, , nH zvanim take poklapanja. Ove take mogu da se posmatraju kao podeavajui parametri i mora se uzeti u obzir njihov uticaj na stabilnost i robusnost upravljakog sistema. Njihov broj mora biti najmanje jednak izabranom broju baznih funkcija. 2.3.2. Raunanje upravljakog zakona. U sluaju SISO procesa bez ogranienja, upravaljki zakon se moe dobiti na sledei nain. Prvo je potrebno izlaz razdvojiti na slobodni i forsirani, da bi strukturizacija upravljakog signala dala: ym (t + k ) = QM k xm (t) +
NB i=1
i (t) + yBi (k )
(2.43)
Gde yBi predstavlja odziv sistema na skup osnovnih funkcija Bi . Sada se funkcija cilja moe zapisati u obliku:
32
J= Gde je:
NH i=1
[ y (t + hj ) (t + hj )] +
NH i=1
[yB d(t + hj )]
(2.44)
= y d(t + hj ) =
[ ]T 1 (t), , ( nB )(t)
T
= [yB1 (j ), , yBnB (j )]
r(t + hj ) j [r(t) y (t)] QM j xm (t) e(t + hj ) (2.45)
Minimizirajui J po koecijentima dobijamo: J = 2(YB YB T ) YB d = 0 (2.46) Gde matrica YB predstavlja matricu ije su kolone vektori yB , u poklapajuim takama hj , j = 1, , nH i d = [d1 (t + h1 ), , d1 (t + hnH )]. Uzimajui u obzir koecijente vektora koji su sad izraunati, upravljaki signal uzimajui u obzir upravljaku strategiju pomeranja je da ta sa: u(t) =
NB i=1
i (t) Bi (0)
(2.47)
Ovaj algoritam moe da se koristi samo za stabilne sisteme, poto ponitavanje polova(pole cancelation) moe voditi do problema stabilnosti kada se pojavljuju nestabilni ili visoko oscilatorni modovi. Takoe se ovaj metod moe koristiti za nelinearne procese korienjem nelinearnih modela u prostoru stanja.
Literatura
[ AW97] Karl Johan Astr om and Bj orn Wittenmark, Computer-controlled systems theory and design, 3 ed., Prentice Hall, Inc., 1997. [Bur01] Roland S. Burns, Advanced control engineering, Butterworth-Heinemann, 2001. [CB99] Eduardo F. Camacho and Carlos Bordons, Model predictive control, 2 ed., Springer, London, 1999. [Sto04] Mili R. Stoji, Digitalni sistemi upravljanja, 5 ed., Akademska misao, Beograd, 2004.
33

Model Predictive Control

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Model Predictive Control

Uploaded by

Copyright:

Available Formats

Univerzitet u Novom Sadu Fakultet tehni ckih nauka Automatika i upravljanje sistemima

Milan R. Rapai c Boris B. Jakovljevi c Zoran D. Jeli ci c

OSNOVI PREDIKTIVNOG UPRAVLJANJA

Adaptivno i napredno upravljanje

Projektovanje linearnih optimalnih regulatora

1. PROJEKTOVANJE LINEARNIH OPTIMALNIH REGULATORA

1.1. PROJEKTOVANJE LINEARNIH OPTIMALNIH REGULATORA PO STANJIMA

1. PROJEKTOVANJE LINEARNIH OPTIMALNIH REGULATORA

} xT [k ]Qx[k ] + uT [k ]Ru[k ] + xT [N ]Qx[N ].

1.1. PROJEKTOVANJE LINEARNIH OPTIMALNIH REGULATORA PO STANJIMA

1. PROJEKTOVANJE LINEARNIH OPTIMALNIH REGULATORA

1.1. PROJEKTOVANJE LINEARNIH OPTIMALNIH REGULATORA PO STANJIMA

(a) Optimalna trajektorija sistema za R = 0.1 (b) Optimalna trajektorija sistema za R = 10

(c) Optimalni upravljaki signal za R = 0.1

(d) Optimalni upravljaki signal za R = 10

1. PROJEKTOVANJE LINEARNIH OPTIMALNIH REGULATORA

Ukoliko uvedemo smenu (1.21)

1.1. PROJEKTOVANJE LINEARNIH OPTIMALNIH REGULATORA PO STANJIMA

1. PROJEKTOVANJE LINEARNIH OPTIMALNIH REGULATORA

je kriterijum optimalnosti denisan na sledei nain N 1 } 1 1 { T J= x [k]Qx[k] + uT [k]Ru[k] + xT [N ]x[N ], 2 2

1.1. PROJEKTOVANJE LINEARNIH OPTIMALNIH REGULATORA PO STANJIMA

1. PROJEKTOVANJE LINEARNIH OPTIMALNIH REGULATORA

1.1. PROJEKTOVANJE LINEARNIH OPTIMALNIH REGULATORA PO STANJIMA

1. PROJEKTOVANJE LINEARNIH OPTIMALNIH REGULATORA

Jasno, ukoliko matricu Kv biramo tako da je xu Kv = 0, (1.35)

Slika 1.5. Shematski dijagram feed-forward merljivog poremeaja na ulazu sistema.

1.2. PROJEKTOVANJE OBSERVERA STANJA SISTEMA

1. PROJEKTOVANJE LINEARNIH OPTIMALNIH REGULATORA

1.2. PROJEKTOVANJE OBSERVERA STANJA SISTEMA

(a) x1 : stvarna i estimirane vrednosti

(b) x2 : stvarna i estimirane vrednosti

(c) x1 : greke estimacije

(d) x2 : greke estimacije

1. PROJEKTOVANJE LINEARNIH OPTIMALNIH REGULATORA

(a) x1 : stvarna i estimirane vrednosti

(b) x2 : stvarna i estimirane vrednosti

(c) y : stvarna i izmerena vrednost

1.2. PROJEKTOVANJE OBSERVERA STANJA SISTEMA

1. PROJEKTOVANJE LINEARNIH OPTIMALNIH REGULATORA

1.3. PROJEKTOVANJE LINEARNIH OPTIMALNIH REGULATORA PO IZLAZIMA

1. PROJEKTOVANJE LINEARNIH OPTIMALNIH REGULATORA

1.3. PROJEKTOVANJE LINEARNIH OPTIMALNIH REGULATORA PO IZLAZIMA

v[k + 1] = u v[k ], e[k + 1] = ( LC) e[k ] + xu ev [k ], ev [k + 1] = v ev [k ] Lv Ce[k ], y[k ] = Cx[k ].

Pregled komercijalnih MPC strategija

A predviene vrednosti izlaza du horizonta sledeim izrazom:

2. PREGLED KOMERCIJALNIH MPC STRATEGIJA

(gk+i gi )u(t i).

(gk+i gi )u(t i).

Sada moemo denisati dinamiku matricu sistema G G= g1 g2 . . . gm . . . 0 g1 . . . gm1 . . . .. . . . . 0 0 . . . g1 . . .

2.1. DMC (DYNAMIC MATRIX CONTROL)

Ili moe da ukljui upravljaki napor koji se kanjava: J=

2. PREGLED KOMERCIJALNIH MPC STRATEGIJA

j j Cyi y (t + k | t) + Cui u(t + k i | t) + cj 0, j = 1, , Nc

2.2. MAC (MODEL ALGORITHMIC CONTROL)

S tim da se ova suma moe podeliti na dva dela: fr (t + k ) = I fo (t + k ) =

2. PREGLED KOMERCIJALNIH MPC STRATEGIJA

moemo zapisati prediktor u sledeoj formi: y = H1 u+ + H2 u + n (2.33)

2.3. PFC (PREDICTIVE FUNCTIONAL CONTROL)

2. PREGLED KOMERCIJALNIH MPC STRATEGIJA

r(t + hj ) j [r(t) y (t)] QM j xm (t) e(t + hj ) (2.45)

You might also like