Professional Documents
Culture Documents
Irányításelmélet Előadás 7
Irányításelmélet Előadás 7
Vegyük észre, hogy abban a speciális és gyakori esetben, V (ϑ , t ) konvex függvény ϑ -ban ⇒ V ′(ϑ , t ) = 0 :
amikor y ∈ R1 , pl. y (i ) egyváltozós rendszer kimenőjele Y − Φϑ
2
=< Y − Φϑ , Y − Φϑ >=
T
az i -edik mintavételi időpontban, ϕ (i ) egy sorvektor
=< Y , Y > −2 < Y ,Φϑ > + < Φϑ ,Φϑ >=
(1 × p méretű mátrix).
Két esetet fogunk vizsgálni. Az első esetben t = N fix =< Y , Y > −2 < Φ T Y ,ϑ > + < Φ T Φϑ ,ϑ >,
(off-line paraméterbecslés vagy batch-feldolgozás). A má- dV
V ′(ϑ , t ) = = −Φ T Y + Φ T Φϑ = 0
sik esetben az adatok valósidőben fokozatosan gyűlnek, t dϑ
fokozatosan nő (rekurzív paraméterbecslés).
dV
Mivel a Φ T Φ mátrixnak invertálhatónak kell lennie, ez a V ′(ϑ , t ) = = −Φ T WY + Φ T WΦϑ = 0 .
kisérletekre feltételt szab, amit úgy szoktunk megfogal- dϑ
mazni, hogy a megfigyeléseknek megfelelően gerjesztő- Ha ϑ̂ jelöli az optimális WLS megoldást, akkor algebrai-
nek, ún. perzisztens gerjesztésűnek kell lenni a paraméte- lag két ekvivalens alakban írható fel, amelyből a normál
rek meghatározásához. egyenletnek nevezett alak numerikusan jobban
kondícionált:
Súlyozott legkisebb négyzetek (WLS) módszer: Bevezet-
hetünk az egyenlethibák súlyozására egy W > 0 szimmet- Φ T WΦϑˆ = Φ T WY normál egyenlet,
rikus és pozitív definit súlyozó mátrixot (WLS, weighted
least squares method), amelynek felhasználásával választ- ϑˆ = (Φ T WΦ ) −1Φ T WY .
hatjuk a W -vel súlyozott hibafüggvényt. Általában W jelenléte megnöveli a számítási időt, mivel
t = N és m = dim y esetén W mérete ( Nm) × ( Nm) . A
Mivel V (ϑ , t ) ebben az esetben is konvex és kvadratikus, módszert a rekurzív paraméterbecslésnél fogjuk felhasz-
ezért a globális minimum szükséges és elégséges feltétele nálni, ami az adaptív irányításoknál lesz fontos.
most is V ′(ϑ , t ) = 0 .
1 t [
= λP −1 (t − 1) + ϕ (t )ϕ T (t ) ]
−1
= ∑
2 i =1
< λt −i [ y (i ) − ϕ T (i )ϑ ], y (i ) − ϕ T (i )ϑ > .
Alkalmazzuk az inverz mátrix lemmát
Ha m = dim y , akkor ez megfelel a korábban már tárgyalt
esetnek, ahol a W súlyozó mátrix blokkdiagonális: ( A + BCD) −1 = A −1 − A −1 B(C −1 + DA −1 B) −1 DA −1
Λ := W = diag (λt −1 I m , K , λ1 I m , λ 0 I m ) . A := λP −1 (t − 1) , B := ϕ (t ) , C := I , D := ϕ T (t )
választás mellett, akkor
Speciálisan ha dim y = 1 , akkor Λ := diag (λt −1 , K , λ ,1) .
Jól látható, hogy a reziduált közvetlenül a h(ϑ , t ) nemlineáris modell alapján célszerű számítani és a bevezetett korrekció
elvégzésére nincs szükség.
A nemlineáris paraméterbecslésre (lokális linearizálást alkalmazva) a következő rekurzív alakot nyertük:
dh(ϑ , t )
ϕ T (t ) :=
dϑ ϑˆ (t −1)
1
P(t ) = {P(t − 1) − P(t − 1)ϕ (t ) [λI + ϕ T (t ) P(t − 1)ϕ (t )]−1ϕ T (t ) P(t − 1)}
λ
t := t + 1.
Átalakítások:
y (t ) = G ( q )u (t ) + H ( q )e(t )
y (t + k ) = G ( q )u (t + k ) + H (q )e(t + k ) =
~
A zajos rendszer modelljében G (q), H (q) és H −1 (q) stabil = G ( q )u (t + k ) + H k ( q ) e(t + k ) + H k ( q ) e(t ) =
A(q) = 1 + a1 q −1 + L + a na q − na .
1 N 1 2 ϑˆ NLS = [ R ( N )] −1 h( N )
V N (ϑ , Z N ) = ∑ y (t ) − ϕ T
(t )ϑ , alakú lesz.
N t =1 2
1
0.5
0.5
0
0
-0.5
-0.5
-1
-1
-1.5 0 20 40 60 80 100 120
0 20 40 60 80 100 120
0
0.5
-0.5
-1
0
-1.5 0 20 40 60 80 100 120
0 20 40 60 80 100 120 Time (sec)
Time (sec)
A rendszer zajmentes kimenete ( y s szimulált) és az ARMAX mo-
Az ARMAX modell identifikációjához használt bemenőjel ( u ),
zajos kimenet ( y m mért) és zajmentes kimenet ( y s szimulált). dell kimenete ( y armax ) és az átmeneti függvények ( v s , v armax ).
0
Egy másik ábrán a valódi rendszer és az IV4 modell átme- -0.5
neti függvényét ábrázoltuk, amelyek szintén jó egyezést -1
mutatnak. -1.5
-2
0 20 40 60 80 100 120
Time (sec)
Az IV4 modell identifikációjához használt bemenőjel ( u ), zajos ki-
menet ( y m mért) és zajmentes kimenet ( y s szimulált).
0.5
-0.5
-1
-1.5
-2
0 20 40 60 80 100 120
0.8
0.6
0.4
0.2
0
0 20 40 60 80 100 120
Time (sec)
C
Γ i = M .
CA
CA i −1
D 0 0 L 0
CB D 0 L 0
H i = CAB CB D L 0.
M M M O M
i −2 i −3 i −4
CA B CA B CA B L D
(1)
iv) Legyen Γ egy ( mi ) × n méretű mátrix ( i > n ), és jelölje a Γ első m(i − 1) sorából álló mátrixot Γ , az utolsó
( 2)
m(i − 1) sorából állót pedig Γ . A Γ mátrixot shift-invariánsnak nevezzük, ha létezik olyan négyzetes (nem szük-
( 2) (1)
ségképpen invertálható) T mátrix, hogy Γ =Γ T . Világos, hogy a Γ i mátrix shift-invariáns, mivel
C CA
2
Γ (1) := M , Γ
CA ( 2)
:= CA
M , T := A ⇒ Γ
( 2)
=Γ (1)
T.
CA i − 2 CA i −1
yj y j +1 y j+2 L y j + N −1
C
y y j+2 y j +3 L y j + N CA
j +1
y j+2 y j +3 y j+4
2
L y j + N +1 = CA x j [ x j +1 x j + 2 L x j + N −1 + ]
M M M M M Mi −1
y j + i −1 y j +i y j + i +1 L y j + N + i − 2 CA
L 0 j
u u j +1 u j+2 L u j + N −1
D 0 0
CB D 0 L 0 u j +1 u j + 2 u j +3 L u j+N
+ CAB CB D L 0 ⋅ u j + 2 u j +3 u j+4 L u j + N +1
M M M O 0
i−2 i −3 i−4 M M M M M
CA B CA B CA B L D u u u j + i +1 L u j + N + i − 2
j + i −1 j +i
yj y j +1 y j+2 L y j + N −1
y y j +2 y j +3 L y j+N
j +1
Y j, i, N := y j + 2 y j +3 y j+4 L y j + N +1 ,
M M M M M
y j +i −1 y j +i y j +i +1 L y j + N +i − 2
uj u j +1 u j +2 L u j + N −1
u u j+2 u j +3 L u j+N
j +1
U j, i, N := u j + 2 u j +3 u j +4 L u j + N +1 .
M M M M M
u j +i −1 u j +i u j +i +1 L u j + N +i − 2
Az így bevezetett jelölésekkel a rendszer (általában nem mérhető) állapotai, a rendszerről méréssel felvehető bemeneti-
kimeneti adatsorok, valamint az identifikálandó rendszert tömören jellemző Γ i és H i mátrixok között a következő
kapcsolat írható fel: Y j , i , N = Γ i X j , N + H iU j , i, N . A továbbiakban j = 1 értéket választva a MOESP módszer vizsgálatára
az Y1, i, N = Γ i X 1, N + H iU 1, i, N
egyenletrendszer fog szolgálni. Feltesszük még, hogy a bemenőjel perzisztens abban az értelemben, hogy rank (U 1, i , N ) = ri ,
ahol r = dim u
.
QQ T = Q T Q = I , R = 11
R R12
, X = QR ,
0 R22
iii) Tetszőleges X mátrixnak van X = UΣV T szinguláris érték felbontása (SVD), ahol U és V ortonormált mátrixok, to-
vábbá a Σ diagonális mátrix tartalmazza az X mátrix (mindig nemnegatív) szinguláris értékeit csökkenő sorrendben,
lásd (12.57a-d). A szinguláris érték felbontás MATLAB környezetben az svd függvénnyel határozható meg.
AT = TAT −1 , BT = TB, CT = CT −1 , DT = D ,
~
hs = CT ( AT ) s BT = CT −1 (TAT −1 ) s TB = CA s B = hs .
Tételezzük fel, hogy egy U n mátrix oszlopai kifeszítik Γ i képterét, vagy más néven az oszlopterét. Tudjuk, hogy i > n ,
ezért minimális (teljesen megfigyelhető és teljesen irányítható) rendszer reprezentáció esetén rank (Γ i ) = rank (U n ) = n ,
ezért létezik olyan T1 nemszinguláris mátrix, hogy
U n = Γ i T1 .
Jelölje a U n első m(i − 1) sorából álló mátrixot U n(1) , az utolsó m(i − 1) sorából állót pedig U n( 2) . Tekintsük a T := T1−1
koordináta-transzformációt. Akkor a konstrukció szerint
U 1, i , N R11 0 Q1
Y = .
1, i , N R21 R22 Q2
Itt R11 mérete (r ⋅ i ) × (r ⋅ i ) , R22 mérete pedig (m ⋅ i ) × (m ⋅ i ) , ahol r = dim u és m = dim y . Az elmélet szerint
rank ( R22 ) = n , ahol n = dim x .
3. Határozzuk meg R22 szinguláris érték (SVD) felbontását, és legyen a dominánsnak választott szinguláris értékek száma
n , amelyet a minimális rendszer rendszámának fogunk tekinteni. A szinguláris érték felbontás ekkor a következő lesz:
0 VnT
[
R22 = U n ]
Σ
U n⊥ n
0 Σ 0 (Vn⊥ ) T
,
((U ⊥ T
n ) )
H i R11 − (U n⊥ ) T R21 Q1 = 0 .
Ha az egyenletet megszorozzuk jobbról Q1T -tal és figyelembe vesszük, hogy Q ortonormalitása miatt Q1Q1T = I , akkor
következik
(U n⊥ ) T H i R11 − (U n⊥ ) T R21 = 0 .
Ψ (:,1 : r )
Ψ (:, + 1 : 2 )
Ψ := (U n⊥ ) T −1
R21 R11 = (U n⊥ ) T +
R21 R11 , Ψˆ := r r
,
M
Ψ (:, r (i − 1) + 1 : ri )
CB C
CAB = CA T −1 (TB ) = Γ (1) T −1 (TB ) = U (1) B .
M M i n T
i−2 i−2
CA B CA
Akkor a DT és BT mátrixokra egy egyenletrendszert kapunk, amit pl. a robusztus Moore-Penrose pszeudoinverzzel (LS ér-
telemben) megoldhatunk:
Φˆ T =Ψˆ ⇒ T = Φˆ + Ψˆ
D D
BT BT
lc1 x1
l1
A robotkar paraméterei a következők: m1 , m 2 = 5 kg , y0 K1
2
I 1 , I 2 = 1 kg m , l1 = l 2 = 1 m és l c1 , l c 2 = 0.5 m .
ϕ1 m1 , I1
K0
x0
Tekintsük a nemlineáris rendszert a q 0 = (−π / 2, 0) T
munkapont környezetében (a szögek radiánban, a nyoma-
tékok Nm-ben értendők). A folytonosidejű linearizált A robotkar blokkvázlata
rendszer eme munkapont körül két-két csillapítatlan kon-
jugált komplex póluspárral rendelkezik.
0 0 1 0 0 0
0
x& = − 10.3584 0 0 1 x + 0 0 u,
6.0932 0 0 0.2236 − 0.4720
10.9677 − 23.7634 0 0 − 0.4720 1.4410
y = 10 10 00 00 x,
y k = 10 10 00 00 xk .
Az identifikációhoz a nemlineáris rendszert elláttuk szabályozóval, és olyan referencia jelet választottunk, amely a q 0 mun-
kapont körüli kis (kb. ± 5o ) változásokra késztette a rendszert.
Az identifikációhoz a jeleket a nemlineáris rendszeren vettük fel zárt szabályozási körben. A jelekből a munkaponti értéke-
ket levontuk, és az így kapott jelek láthatók már az ábrán.
-100 -0.15
-150 -0.2
0 5 10 15 20 25 0 5 10 15 20 25
-0.15 -0.15
-0.2 -0.2
0 5 10 15 20 25 0 5 10 15 20 25
Time (sec) Time (sec)
Az identifikációnál használt bemenő- és kimenőjelek A lineariált rendszer és a MOESP-pel identifikált rendszer válaszje-
(munkapont körüli változások) lei