Universidad Nacional de La Plata

Facultad de Ingenier´ıa
Departamento de Electrotecnia
C´atedra de Control Moderno
Introducci´on al control optimo´
Ricardo Juli´an Mant
!"no #$$%
1. Introducci´on.
´
En estas notas se introducen ideas &´asicas de la 'eor´ıa del Control
(ptimo) !lgunas de ´estas presentan di*erencias signi+cativas con
respecto a las previamente vistas , resulta natural preguntarse-
¿Por qu´e es necesario plantear un nuevo enfoque para el dise˜no de controladores?
.emos visto /ue los m´etodos de control &asados en realimentaci´on de
estados son m´as vers´atiles , potentes /ue los correspondientes a la teor
´ıa del control cl´asico) En particular0 permiten la asignaci´on de los
autovalores de lao cerrado a 1voluntad2) 'am&i´en se 3a discutido como
estos m´etodos pueden ser complementados con t´ecnicas de o&servaci
´on de estados para so&rellevar limitaciones 4econ´omicas ,5o *´ısicas6 en
la medida de los mismos) Luego0 es raona&le cuestionarse acerca de la
necesidad o conveniencia de introducir un nuevo marco te´orico0 de 3ec3o
m´as comple7o0 para el dise"no de controladores) Con respecto a este
posi&le cuestionamiento puede argumentarse /ue-
1- Ni en los m´etodos de dise"no de control cl´asico0 ni en los de
realimentaci´on de es8tados para la asignaci´on de autovalores0 se
pone e9pl´ıcitamente de mani+esto el compromiso /ue e9iste entre
las especi+caciones din´amicas , el 1costo2 para poder cumplirlas 4por
e7emplo0 entre la velocidad de respuesta de la varia&le controlada , la
acci´on de control necesaria6)
2- Restricciones en el control
1
pueden imposi&ilitar un dise"no de polos
dominantes) Esto puede di+cultar seriamente la selecci´on de los
autovalores de lao cerrado para cumplir determinadas
especi+caciones temporales 4tener presente /ue las conocidas
e9presiones /ue vinculan el so&repaso0 el tiempo de esta&lecimiento0
etc) con la u&icaci´on de los polos0 s´olo tienen valide en sistemas
de segundo orden puro6) !dicionalmente0 si e9iste un espacio no
controla&le0 s´olo algunos autovalores podr´an ser asignados0 , por
consiguiente0 di*´ıcilmente pueda 3acerse un dise"no con polos
dominantes)
3- La presencia de ceros en la *unci´on de trans*erencia pueden
di+cultar el dise"no por asignaci´on de autovalores0 a´un en a/uellos
casos en /ue las restricciones no sean *uertes) Ver ejemplo 1
4- En sistemas MIM( no e9iste una correspondencia entre la respuesta
temporal , la localiaci´on de los polos) E*ectivamente0 en sistemas
MIM(0 la misma asignaci´on de polos puede 3acerse con distintos
7uegos de ganancias0 , de 3ec3o0 dan lugar a distintas respuestas
temporales) Ver ejemplo 2
5- Por otra parte0 uno podr´ıa preguntarse0 :por/u´e con*ormarse con ganancias
de re8alimentaci´on constantes;) :No podr´ıa me7orarse la respuesta de
seguimiento de un sistema si la4s6 ganancia4s6 de realimentaci´on se asocia4n6
a la amplitud del error;)
Los argumentos previos0 entre otros0 sirvieron de motivaci´on para el
desarrollo de la teor´ıa del control ´optimo)
1
todo sistema de control est´a sujeto a restricciones, por ejemplo, debidas al actuador de potencia,
o a raones de se!uridad, o debidas al anc"o de banda necesario para rec"aar determinadas
perturbaciones, etc.
<
#jemplo 1. Considere los siguientes sistemas-
8 sistema <
$= > "
$ <
#$ ? "
$
#
u
$ < <
8 sistema #
$= > "
$ <
#$ ? "
$
#
u
$ < <
h
%
&
> < #
i
$.
4<
6
4#
6
El sistema #0 solo
di+ere del <0 en /ue
presenta un cero en
%$,@) Ae dise"na un
control por
realimentaci´on de
estados /ue permite
la misma asignaci
´on de autovalores
de lao cerrado en
%$,B ' j $,B<@ 4esto
es posi&le
realimentando los
estados con un
7uego de ganancias
C%$,D, %<E6) La +gura
<0 muestra la salida
de los dos sistemas
con la misma
asignaci´on de
polos) Claramente0
0
2 4 0
Figura <- Respuesta de los sistemas <
, # 4partes a , b respectivamente60 con
la misma asignaci´on de autovalores
de lao cerrado)
#jemplo 2. Considere el control de un reactor
4FGaHernaaH I Aivan <JB#60 donde se pretende
controlar volumen , concentraci´on de una
mecla) El modelo de estados del
sistema MIM( es-
$= >
"
,$< $
#
$

?
"
<
%
$ %,$# %,#@ ,B@
siendo los estados las varia&les
controladas 4apartamientos del volumen ,
de la concen8traci´on con respecto a los
valores de e/uili&rio6)
(´acilmente puede verificarse que cualquiera de los si!uientes jue!os de !anancias
de real)imentaci´on
"
, ,
#
*
a +
1
,
1 -
,
.
*
b + "
, ,
#
1,1 1,2--
"
%
#
, ,
*
c +
,
,
1
,,1
conducen a la misma asi!naci´on de polos en %,,1'j ,,,/0. 1in embar!o, como puede verse
en la fi!ura 2, las respuestas del sistema son completamente distintas 2los transitorios
corresponden a condiciones iniciales 3,, ,,14
5
6. 7as curvas ponen en evidencia la poca
practicidad de las t´ecnicas de asi!naci´on de polos en sistemas 8I89.
0.5
v
0.5
t
0 0
−0.5 −0.5
−1 −1
0 20 40
a)
0.4 0.4
c
0.3 0.3
0.2 0.2
0.1 0.1
0 0
t
−0.1
20
−0.1
0 40
a)
v
0 20 40
b)
c
t
0 20
40
b)
0.5
0
−0.5
−1
0 20
0.4
0.3
0.2
0.1
0
t
−0.1
0 20
40
c)
(i!ura 2: Variables controladas
2volumen & concentraci´on6 a
partir de la realimentaci´on de
los estados con los jue!os de
!anancias *
a
, *
b
& *
c
.
2. Aigni+cado de la
pala&ra ´optimo
en el conte9to de
la teor´ıa del
control de
sis
te
m
as
)
;uando
se "abla
de la
soluci
´on
´optima
de
un
prob
lem
a,
intuit
ivam
ente
se
pien
sa
en
que
´est
a es
<la
mejor
soluci
´on=,
es
decir
<insu
perab
le=.
>e
"ec"
o,
´este
es el si!nificado que puede
encontrarse en el >iccionario
de la ?eal @cademia
#spa˜nola:
optimo:´ forma
procedente del
superlativo latino
optimus, que si!nifica
<bueno en !rado
sumo=, que no puede
ser mejor. Por tanto,
es incorrecto su
empleo en
-
combinaci´on con mu&, m´as, menos o tan: Amu& optimo,´ Am´as optimoB´
Amenos ´optimo, Atan ´optimo.
Ain em&argo0 como muc3os otros ad7etivos0 la pala&ra ´optimo tiene un
alto grado de su&87etividad) E*ectivamente0 un p´esimo control desde el
punto de vista del comportamiento din´amico podr´ıa ser ´optimo desde
el punto de vista econ´mico , viceversa) Luego0 para cali+car la &ondad de
un control 4en particular para poder decir /ue es optimo6´ es nece8sario
asociarlo a un 1´ındice2 de per*ormance) En t´erminos de control diremos
/ue un control es optimo´ si minimia un *uncional de costo en el /ue
claramente se mani+esta un compromiso entre distintas especi+caciones
, restricciones) ! este *uncional lo llamare8mos ´ındice de per*ormance ,
normalmente lo indicaremos con C ) (&viamente0 el mismo control
evaluado con otro ´ındice de per*ormance C
1
no ser´a ´optimo)
´
-. Indice de performance.
Considere la Figura %) 'anto la parte a6 como la parte &6 de la +gura
muestran la vari8a&le controlada de un determinado proceso en dos casos
di*erentes0 cuando es controlada empleando los controladores ;
1
, ;
2
respectivamente) En am&os casos se produce una pertur&aci´on en t >
<#se!0 la cual es rec3aada con los transitorios mostrados) !ceptemos /ue
la calidad de un determinado producto depende de esta varia&le) Luego0
no parece desacertado pensar /ue la &ondad de dic3o producto en t
,
depender´a de la amplitud del error e4t
,
6 > &
sp
% &4t
,
60 siendo &
sp
el valor de
re*erencia)
1.25
1.2
y C
1
a)
1.15
1.1
1.05
y
sp
1
0.95 t[seg]
0.9
12 13 14 15 16 17 18 11
1.25
1.2
C
2
b)
1.15
1.1
y
y
1.05
1
sp
0.95
t
0
t f
t[seg] 0.9
11 12 13 14 15 16 17 18
Figura %- Comparaci´on de per*ormance de dos controladores)
'am&i´en podr´ıamos encontrar varios e7emplos 4particularmente en procesos /u
´ımicos6 en los /ue la calidad del producto *a&ricado en el intervalo t
,
% t
f

depender´a de
Z
t
f
e4t6 dt.
t,
D
Ai el valor de esta integral es usado para comparar la per*ormance de los controladores C
1
,
C
2
podr´ıa decirse /ue el controlador C
1
es me7or /ue el C
2
)
En realidad0 la selecci´on de 4@6 como ´ındice de per*ormance no ser´ıa
mu, a*ortunada) E*ectivamente0 un sistema con respuesta mu,
su&amortiguada podr´ıa dar lugar a una cancelaci´on de ´areas &a7o la
curva del error0 , as´ı aparentar &uena per*ormance) Para evitar este
pro&lema0 en todo ´ındice de optimiaci´on solo se consideran varia&les
positivas) !s´ı son comunes ´ındices de per*ormance /ue consideran el
modulo del error0 por e7emplo-
t
I!E J >
Z
t,
f
De4t6D dt0 4K6
t
I'!E J >
Z
t,
f
De4t6D t dt0 4B6
o los conocidos como ´ındices cuadr´aticos0 por e7emplo-
t
J >
Z
t,
f e
2
4t6 dt) 4L6
Nuestra atenci´on estar´ centrada e9clusivamente en estos ultimos0´ los ´ındices cuadr´aticos)
!3ora &ien0 el ´ındice 4L6 a´un no pone de mani+esto ninguna restricci´on
en el control0 , de 3ec3o si dise"n´aramos un control /ue minimice dic3o
´ındice0 seguramente se presentar´ıan pro&lemas de incompati&ilidad
entre la acci´on de control re/uerida , la disponi&le) Para contemplar el
compromiso entre la respuesta transitoria , las restricciones en el control
u4t6 puede considerarse el ´ındice
t
f
e
2
4t6 ? Mu
2
4t6 dt ? e
2
4t
f
60
J >
Z
t,
donde M es simplemente un *actor de ponderaci´on de u
2
4t6 *rente a e
2
4t60
, el t´ermino e
2
4t
f
6 penalia el error en t > t
f
)
Resolver un pro&lema de control ´optimo implicar´ o&tener un controlador
/ue minimice un *uncional como 4J6)
´
/. Indice de performance para el problema del re!ulador ´optimo.
Las presentes notas introducen las nociones de control optimo´ a trav´es de
la resoluci´on del pro&lema conocido como LNR 4linear /uadratic regulator60
/ue es un pro&lema de re!u)laci´on0 /ue se resuelve a partir de la optimiaci
´on de un ´ındice de per*ormance cuadr´atico0 dando lugar a una soluci´on
lineal) El ´ındice de per*ormance es la generaliaci´on del *un8cional 4J6-
2
t
f 9
5
N 9 ? u
5
R u dt0
J > 95 4tf 6 P, 94tf 6 ? Zt,
donde 9 son los estados del sistema elegidos como errores con respecto a
los valores de estado estacionario) Las matrices de peso N0 R , P
,
son
matrices reales0 sim´etricas0 constantes , de+nidas positivas
-
)
2
de a/u´ı en m´as0 omitiremos el tiempo t en la notaci´on de las varia&les0 es decir $ > $4t6, ...
-
En realidad0 E , P
,
pueden ser de+nidas o semide+nidas positivas0 pero no pueden ser simult´anea8
mente nulas0 ,a /ue esto implicar´ıa minimiar el ´ındice-
t
C >
Z
t,
f
u
5
? u dt,
@
Pro&a&lemente0 la *orma m´as intuitiva de elegir
/
estas matrices sea la
*orma diagonal-
q
11 $
F
$
F F
$
r
11 $ F
$
F F $
$ q22 $ $ r22 $
E >
)
$
)
) ) ? >
)
$
)
) ) 4<#6
)) ))
)
)
)
)
)
)
$ $ $ $ $ $
En muc3os pro&lemas se considera tf G H0 en este caso el ´ındice de per*ormance se
reduce a C >
Z
t,

$
5
E $ ? u
5
? u dt, 4<%6
,a /ue0 para /ue C sea +nito0 necesariamente $4t
f
6 G $)
Para el caso de sistemas de tiempo discreto0 el ´ındice de per*ormance
e/uivalente a 4<$6 es
I −1
C > $
5
4I 6 P, $4I 6 ?$
5
4J6 E $4J6 ? u
5
4J6 ? u4J6, 4<D6
J+,
X
mientras /ue el e/uivalente a 4<%60 cuando I G H0 es

C >$5 4J6 E $4J6 ? u5 4J6 ? u4J6. 4<@6
X
J+,
5. Problema del 7E?. Principio de 9ptimalidad de Kellman.
En &ase a los comentarios previos0 puede decirse /ue en esta nueva concepci´on del control
4control optimo6´ el esta&lecimiento del pro&lema re/uiere de-
1. la descripci´on del sistema a ser controlado0
2. la descripci´on de las restricciones , de los o&7etivos de control0
3. la de+nici´on de un criterio /ue permita 7ugar el grado de optimiaci
´on)
En particular la resoluci´on del pro&lema del regulador ´optimo LNR
consiste en- dado un modelo del sistema a controlar en varia&les de
estado , un ´ındice de per*ormance de la *orma 4<$6 4o de la *orma 4<D6
para el caso discreto60 encontrar el control u4t6 > u

4t6 /ue minimia el
citado *uncional C 4> C

6)
La soluci´on del pro&lema LNR puede ser a&ordada desde distintos caminos0 en estas notas
emplearemos el principio de optimalidad de Oellman para o&tener la soluci´on)
Principio de 9ptimalidad de Kellman.
Considere un control gen´erico u) Au aplicaci´on so&re el sistema a
controlar dar´ lugar a una evoluci´on de los estados /ue de+ne una
tra,ectoria) Diremos /ue esta tra,ectoria es ´optima si el valor del control
u4t6 minimia C )
/ue dar´ıa lugar a la soluci´on trivial u > $ 4e)d) sin control6)
/
o&viamente esto depende de cada pro&lema)
K
Aeg´un Oellman 4Principio de optimalidad 6- 1si una tra,ectoria entre dos
estados $4t
,
6 , $4t
f
6 es ´optima0 entonces cual/uier tramo de esta
tra,ectoria0 de+nido desde un punto $4t
i
6 4perteneciente a dic3a
tra,ectoria6 , el punto $4t
f
60 es en s´ı una tra,ectoria ´optima2 4Figura D6)
Este principio 4/ue podr´ıa decirse /ue es casi o&vio60 esta ´ıntimamente
ligado a los con8ceptos de programaci´on din´amica /ue permiten simpli+car
pro&lemas de optimiaci´on de distintas especialidades 4econom´ıa0 ciencias *
´ısicas0 ingenier´ıa0 )))6)
Por raones de simplicidad0 primero se resuelve el pro&lema del regulador
optimo´ para el caso discreto , con 3orionte de optimiaci´on +nito 4N
+nito6 4secci´on K6) Posteriormente0 en la secci´on B se considera el caso
continuo 4con 3orionte de optimiaci´on +nito e in8+nito60 , el caso
discreto con 3orionte de optimiaci´on in+nito es citado en el !p´endice
O)
0.4
x
2
0.2
.
0
x
1
−0.2
x
tf
−0.4
−0.6
.
x
ti
−0.8
x
.
to
−1
−1 −0.5 0 0.5
Figura D- 'ra,ectoria en el espacio de estados)
6. 1oluci´on del problema de re!ulaci´on ´optima. ;aso discreto &
"or)ionte finito.
En este caso el sistema a controlar est´a descripto por-
$4J ? <6 > @$4J6 ? Ku4J6
&4J6 > ;$4J6
su7eto al ´ındice de per*ormance 4<D6-
I %1
C >$5 4I 6 P, $4I 6 ?$5 4J6 E $4J6 ?u5 4J6 ? u4J6.
X
J+,
B
(ptimiaci´on del control en el per´ıodo de+nido por 4I % <65 G I 5 )
Mas all´ de /ue e9isten I decisiones 4una por cada per´ıodo de muestreo6
para optimiar el control del sistema 4<K684<B60 comencemos por deducir la
1*orma2 del control /ue corre8sponde a la ultima´ decisi´on0 es decir la
decisi´on a tomar en el instante 4I % <65 ) Como veremos0 la generaliaci
´on de esta soluci´on parcial nos permitir´a o&tener la le, de control
´optima /ue &uscamos
L
) Con esta +nalidad supondremos /ue0 a partir de
las I %< primeras decisiones se 3a alcanado el estado gen´erico $4I % <6)
Para optimiar la ultima´ decisi´on consideramos el ´ındice de per*ormance
C
I

%1,I
> $
5
4I 6 P
,
$4I 6 ? $
5
4I % <6 E $4I % <6 ? u
5
4I % <6 ? u4I % <6,
4<L6
e9presi´on en la /ue puede reemplaarse $4I 6 por las ecuaciones del
sistema 4<K6-
C
I %1,I
> C@$4I % <6 ? Ku4I % <6E
5
P
,
C@$4I % <6 ? Ku4I % <6E
?
? $
5
4I % <6 E $4I % <6 ? u
5
4I % <6 ? u4I % <6.
4<J6
Para
minimiar
C
I

%1,I
con respecto al
control
u4I % <6 4constante en el
intervalo
4I % <65 M t M I 5 66 es necesario /ue-
N
C
I

%
1
,
I

>

$
.
Nu
<6
Es importante notar /ue
el estado en el instante
4I % <65 a tomar en ese
mismo instante0 es decir
es independiente de
alge&raicos triviales
O
conducen a
4#$6
no
depende
de la
decisi´on
u4I % <6)
Luego0 c
´alculos
? u

4I % <6 ?
4detalles de los pasos intermedios pueden encontrarse en el !p
´endice !6)
Luego0 el control ´optimo a aplicar en el instante 4
u

4I % <6 >
/ue podemos reescri&irlo como
Es decir /ue la
decisi´on
´optima a tomar
en el instante 4I
% <65 0 es una
realimentaci´on
de estados con
la
ganan
cia
L
Este
*raccionam
iento en el
proceso de
optimiaci
´on est´a
&asado en
el principio
de
Oellman)
O'ener presente /ue d2$5 b6 > b , /ue > @5 ? @ $)
d$
.
En realidad para asegurar /ue u

4I %
<6 minimia el ´ındice de per*ormance
4<L6 4 , /ue no lo ma9imice6 de&e
veri+carse /ue la segunda derivada de C
sea 1positiva2 4de+nida positiva6)
E*ectivamente
N
2
C
%1
> ? ? K
5
P
,
K es de+nida positiva ,a /ue
semide+nida
I ,I
2
Nu 2I −16
positiva)
L
d2$
5
@$6 d$
Para o&tener el valor del ´ındice de per*ormance ´optimo 4el costo m
´ınimo de la ultima´
decisi´on6 C


1
se reemplaa u

4I % <6 en 4<L60 o&teni´endose-
I % ,I
C


1
> $
5
4I % <6 P
1
$4I % <6, 4#@6
I % ,I
donde
P
1
> C@ ? K*4I % <6E
5
P
,
C@ ? K*4I % <6E ? *
5
4I % <6?*4I % <6 ? E.
4#K6
Como el control ´optimo u

4I % <6 es o&tenido a partir de consideraciones
completamente generales0 en particular0 a partir de una condici´on inicial
gen´erica0 la soluci´on o&tenida tiene /ue estar contenida en la soluci´on
de optimiar el control en m´as de una decisi´on 4principio de Oellman6)
(ptimiaci´on del control en el per´ıodo de+nido por 4I % #65 G I 5 )
Procedamos a3ora a la optimiaci´on en el per´ıodo 4I % #65 M t M I 5 /ue
involucra dos decisiones 4es decir0 los controles u4I %#6 , u4I %<66) Para
este +n0 de&emos considerar-
I %1
C
I

%2,I
> $
5
4I 6 P
,
$4I 6 ? $
5
4J6 E $4J6 ? u
5
4J6 ? u4J6, 4#B6
J+I %
2 X
es decir0
C
I

%2,I
> $
5
4I % #6 E $4I % #6 ? u
5
4I % #6 ? u4I % #6 ? C
I

%1,I
. 4#L6
Como ,a sa&emos cual es el m´ınimo costo de C
I

1,I
4> C


1
6 podemos reemplaarlo
%
I % ,I
en 4#L6
C
I

%2,I
> $
5
4I % #6 E $4I % #6 ? u
5
4I % #6 ? u4I % #6 ? C
I

%1,I
. 4#J6
Luego0 considerando las ecuaciones del sistema0 resulta-
C
I

%2,I
> $
5
4I % #6 E $4I % #6 ? u
5
4I % #6 ? u4I % #6 ?
? C@$4I % #6 ? Ku4I % #6E
5
P
1
C@$4I % #6 ? Ku4I %
#6E .
4%$6
Esta e9presi´on tiene la *orma de la ecuaci´on 4<J60 es decir0 /ue al anular
su derivada con respecto a u4I % #6
NC
I %2,I
> $, 4%<6 Nu4I % #6
se o&tiene una soluci´on an´aloga a las ecuaciones 4##684#%6
u

I
#6 >
%
h
? ? K
5
P
K
%1

K
5
P @$ I
4%#6
4
%

1 i 1 4
% #6 4%%6
u
4I % #6 > *4I % #6 $4I % #6.
Nuevamente0 la decisi´on a tomar en el instante 4I %#65 es una
realimentaci´on de estados0 pero con un 7uego de ganancias distinto al
correspondiente a la decisi´on a tomar en el instante 4I % <65 )
Reemplaando el control ´optimo u

4I % #6 en 4#J6 se o&tiene el m´ınimo
costo de C
I

%2,I
-
C

2 > $
5
4I % #6 P2 $4I % #6, 4%D6
I % ,I
donde
P
2
> C@ ? K*4I % #6E
5
P
1
C@ ? K*4I % #6E ? *
5
4I % #6?*4I % #6 ? E.
4%@6
J
(ptimiaci´on del control en el per´ıodo de+nido por $
G I 5 )
Reiterando el procedimiento podemos
encontrar0 por
inducci
´on0
la
*orma
gener
al del
regulador
optimo´
´
) Este resulta de la aplicaci´on iterativa de las ecuaciones 4%K60 4%B60
4%L6 , 4%J6)
u

2I % j6 + * 2I % j6 $2I % j6 2-O6
* 2I % j6 + % ? P K
5
P
j%1
K
%1
K
5
P
j%1
@ 2-.6
P
j + 3@P K* 2I
5
j64 P *
5
2I j6?* 2I j6 P E 2-Q6
%
j64 Pj%1 3@ P K* 2I
% % %
C
I

%j,I + $
5
2I % j6 P
j
$2I % j6. 2-06
Resulta conveniente o&servar /ue
1- El regulador ´optimo consiste en una realimentaci´on lineal de los
estados)
2- 'anto el regulador como el sistema de lao cerrado son variantes en
el tiempo)
3- Una ve calculadas las ganancias0 la implementaci´on del regulador
resulta sim8ple) :C´omo lo 3ar´ıa;) Ai los estados no *ueran accesi&les
podr´ıa complementarse el regulador con un o&servador de estados
4o&viamente el sistema de&er´ıa satis*acer las condiciones de
o&serva&ilidad6)
4- ! partir de la ultima´ ecuaci´on el costo m´ınimo C

/ue resulta de
aplicar el control ´optimo u

0 resulta-
C

> C
,

,I
> $
5
4$6 P
I
$4$6.
E7emplo %) Considere el sistema muestreado-
$4J ? <6 >
"
<
#
$4J ? <6 ?
"
$
#
u4J6.
#
< < <
%
Calcular el regulador optimo´ /ue minimia el ´ındice
#,@ $
C > $21,6
5
"
$ #,@
, simular la evoluci´on de los estados a
partir de la condici´on inicial
!
? u
2
2J6
, 4D#6
1" #
#
$
2,6
>
%%
)
Empleando iterativamente las
ecuaciones 4%B6 , 4%L6 pueden
calcularse la matri P , las
ganancias de realimentaci´on)
Esta tarea es realiada a partir
de la condici´on inicial
P
,
>
"
, $
#
4correspondiente a
decrecientes2
#
$
@ #,@
3asta alcanar I > $)
La +gura D muestra
los elementos de la
matri P /ue
permiten el c
´alculo de las
ganancias de
realimentaci´on
correspondientes a
cada
per
´ıodo
de
mues
treo)
(&ser
ve
/ue
las
ganancias corresponden
a J > <, #, ..,J0 el valor
para J > <$ /ueda
e9cluido :Por /u´e;) Por
ultimo0´ en la parte c6 de
la +gura se muestra la
evoluci´on de los estados
del sistema a lao
cerrado)
<$
60
a)
50
40
p
12
=p
21
p
11
30
20
p
22
10
0
2 4 6 8 10 0
tiempo k
1
0.5
b)
0
−0.5
−1 k
1
−1.5
−2
k
2
−2.5
2 4 6 8 10 0
tiempo k
Figura @- a8
Elementos
de la matri
P en *unci
´on de J) b8
Panancias
del
regulador) c8
Estados)
7. 1oluci
´on del
problem
a de
re!ulaci
´on
´optima.
;aso
continu
o.
7.1. Roriont
e de
optimia
ci´on
finito 2t
f
% t
,
finito6.
La soluci´on
del pro&lema
de regulaci
´on optima´
de un
sistema de
tiempo
continuo
donde el ´ındice de per*ormance es de
la *orma
es similar a
la soluci´on
del caso
discreto
correspondie
nte 4para ser
sinceros0
ligeramente
m´as
complicada6)
Para ver los
detalles de la
deducci´on
recomendam
os el li&ro
Linear Atate
Apace
A,stems0
Jo3n Oa,0
<JJJ)
La soluci´on
a este
pro&lema
tam&i´en es
una
realimentaci
´on de
estados
u

> *4t6 $,
4D@6
pero a3ora las ganancias son *unciones continuas del tiempo
*4t6 > %?
−1
K
5
P 4t6,
4DK6
donde P 4t6 de&e ser calculada a partir de la ecuaci´on di*erencial
dP
? E % P 4t6K?
−1
K
5
P 4t6 ? P 4t6@ ? @
5
P 4t6 > $,
4DB6 dt
<<
conocida como ecuaci´on diferencial de ?iccati) La condici´on inicial para
resolver 4DB6 es P 4t
f
6 > P
,
> R )
Como 3a&r´ notado la ecuaci´on di*erencial de Riccati0 a mas de matricial0
es no lineal) Au resoluci´on puede ser complicada a´un empleando m
´etodos num´ericos) Este 3ec3o0 podr´ıa desanimar a m´as de un
dise"nador) Ain em&argo0 nos sirve de motivaci´on para proponer un
controlador 1cuasi´optimo2 4es decir con per*ormance mu, pr´o9ima a la
del control ´optimo6 de mu, *´acil implementaci´on)
Para ser m´as claros0 consideremos el siguiente e7emplo)
#jemplo /. Considere el sistema de primer orden
$=4t6 > #$4t6 ? u4t6.
Ae desea encontrar la le, de control /ue minimia el siguiente ´ındice de
per*ormance-
C >
Z
,
siendo tf > <se!.
Aa&emos /ue la le, de control
´optima responde a-
u

>
%?
−1
K
5
P
4t6 $4t6
donde P 4t6 es la soluci´on
de la ecuaci´on di*erencial
de Riccati-
=
P 4t6 ? E % P 4t6K?
4
4
4
El presente e7emplo es lo
su+cientemente simple
para o&tener una soluci´on
anal´ıtica de P 4t6 sin
ma,or di+cultad) En casos
de ma,or comple7idad son
recomenda&les m´etodos
de integraci´on num´erica0
desde t > t
f
3asta t > t
,
con
la condici´on P 4t
f
6 > R.
F´acilmente0 se identi+can
las 2matrices2- @ > #, K >
<, R > $, E > %,
? > <SD) Luego la
ecuaci´on
di*erencial de
Riccati resulta-
Q
con la condici´on
p4t
f
6 > $)
La soluci´on p4t6
puede ser
D
<
(
ln4
L
Q
como el sistema 2/Q6 tiene un
s´olo estado, la ecuaci´on de
?iccati resulta escalar, e.d. P
2t6 + p2t6.
resultando0
- Q2t%tf 6
p4t6 >
2 4< % e 6
) 4@B6
< ? %e
Q2t%t
f
6
Luego0 la acci´on de control resulta-
u

> %Dp4t6
94t6)
4@L6
Puede o&servarse /ue0 a´un para este e7emplo simple0 la implementaci´on
del regulador ´optimo con 3orionte de optimiaci´on +nito0 resulta mu,
complicada 4por *avor0 Io >e)sesperarT 6)
7.2. Rorionte de optimiaci´on infinito.
El regulador optimo´ de tiempo in+nito es a/uel /ue minimia el ´ındice de
per*ormance-
Z
H
J > 49
5
4t6N94t6 ? u
5
Ru4t66 dt 4@J6
,
Ca&e destacar /ue-
1- a di*erencia del regulador de tiempo +nito0 a3ora es necesario
imponer condiciones so&re la controla&ilidad del sistema para
asegurar /ue el ´ındice de per*ormance sea +nito)
t
G H0
9 t $) Ai no *uera as´ı J ser´ıa in+nito) Luego0 en
8 si f
4 f 6 tam&i´en de&e tender a
5
el ´ındice 4@J6 se 3a omitido el t´ermino 9 4t
f
6.94t
f
6 presente en 4DD60 ,a /ue se
3a perdido el sentido /ue 7usti+ca&a su inclusi´on)
Empleemos el e7emplo D a los e*ectos de introducir la soluci´on al pro&lema de optimiaci´on
cuando t
f
es mu, grande 4regulador ´optimo de tiempo in+nito6)
Aa&emos /ue la ecuaci´on di*erencial de Riccati se resuelve 13acia atr´as2
con el tiempo inicial t > t
f
correspondiente a la condici´on inicial P 4t
f
6) En
el e7emplo previo0 la soluci´on *ue 3allada en *orma anal´ıtica sin ma,or
comple7idad) En la +gura @ se gra+ca la varia&le p4t6 /ue de+ne la
ganancia de realimentaci´on) Puede o&servarse /ue p4t6 presenta dos
componentes0 una transitoria , otra permanente) Para tiempos t > t
f
% Q
con Q positivo , pe/ue"no0 se distingue la respuesta transitoria de&ida a la
condici´on inicial p4t
f
6) !gotado el transitorio 4t RR t
f
60 p4t6 se corresponde
con la soluci´on de estado estacionario de la ecuaci´on de Riccati0 la cual
puede calcularse anulando la derivada p=4t6 en la e9presi´on 4@<6)
En la +gura 4K60 tam&i´en se muestra como inSu,e un aumento de t
f
so&re p4t6)
(&viamente0 en la medida /ue t
f
G H0 la respuesta de estado estacionario
predomina so&re la transitoria) Luego0 para el caso l´ımite0 podr´ıa
tomarse p4t6 constante e igual al valor de estado estacionario
pss > l´ım p4t6 > <0@
tGH
como una mu, &uena apro9imaci´on al control ´optimo) !s´ı0 puede
implementarse un con8trolador e9tremadamente simple a trav´es de una
le, de realimentaci´on invariante en el tiempo-
u

> %K94t6)
<%
1.5
1 seg.
10 seg.
1
Componente de
Estado Transitorio.
0.5
Componente de
Estado Estacionario.
t
0
2 4 6 8 10 12 0
Figura K- p4t6 para distintos 3oriontes de optimiaci´on)
Temos /ue la simpli+caci´on de 4K<6 con respecto a 4@L6 es signi+cativa)
M´as all´ del e7emplo particular0 la soluci´on cuasi´optima resulta
particularmente moti8vante) (&serve /ue0 generalmente0 el pro&lema de
optimiaci´on con 3orionte de opti8miaci´on in+nito es m´as *recuente
/ue el caso +nito)
Podemos resumir la soluci´on del re!ulador ´optimo de tiempo infinito en las
sigu8ientes ecuaciones-
u

> *
c
$, 4K#6
con
*
c
> %?
%1
K
5
P
c
, 4K%6
, donde P
c
es conocido como la soluci´on de la ecuaci´on al!ebraica de ?iccati
E % P
c
K?
%1
K
5
P
c
? P
c
@ ? @
5
P
c
> $. 4KD6
(&servaci´on- la soluci´on de la ecuaci´on alge&raica de Riccati puede no ser
unica´) Ain em&argo0 si el sistema es controla&le0 puede *orarse una soluci
´on unica´ e9igiendo /ue ´esta sea la /ue corresponde a P
c
de+nida positiva)
En este caso0 puede demostrarse0 /ue el lao cerrado es siempre esta&le
0
)
#jemplo L. Considere el sistema a controlar-
$= >
"
$ <
#
$

?
"
$
#
u.
$ $ <
Ae desea encontrar el control ´optimo /ue permita minimiar-
H
$1
2
?

u
2
dt
C >
Z
t,
0
se asume E definida positiva
4K@6
4KK6
<
D
(´acilmente pueden identificarse:
@ +
"
, 1
#
, K +
"
,
#
, E +
"
2 ,
#
, ? + 2.
, , 1 , ,
7ue!o, la ecuaci´on al!ebraica de ?iccati resulta:
"
2 ,
#
%
"
p
11
p
12
# "
, 1
, 1
i
"
p
11
p
12
#
P , ,
p
12
p
22 1
#

2
h
p
12
p
22
P
"
, ,
# "
p
11
p
12
#
P
"
p
11
p
12
# "
, 1
#
+
"
, ,
# 1 ,
p
12
p
22
p
12
p
22
, , , ,
es decir,
p12
2
P 2 + ,
% 2 p 12 p 22
p
11
2
% 2 + ,
%
p
22
P 2p
12
+ ,
2
7a soluci´on de estas ecuaciones conduce a la matri definida positiva P
c
:
P
c
+
"
U
2
2
2
?esultando el control ´optimo
u

+ %?
−1
K
5
P
c
$
U
u

+ % $
1
% 2 $
2
2O.6
2OQ6
2O06
2.,6
2.16
2.26
1L
@p´endice @. 9btenci´on de la e$presi´on 2216
NC
I %1,I
+ 2?u2I %16P
N
n
3@$2I % 16 P Ku2I % 164
5
P
,
3@$2I % 16 P Ku2I % 164
o
Nu2I 16
%
Nu2I % 16
2@)16
2?u2I 16P
P
N %
3@$2I %
164
5
P
,
3@$2I
%
164
Nu2I
%
16
V
5
NC
I %1,I
P 3Ku2I 164 P, 3Ku2I 164 P
+
% 5 %
2@)26
Nu2I 16 P 3@$2I 164 P
,
3Ku2I 164 P
%
% %
escalar
5
164 P, 3@$2I 164
P 3Ku2I
| {z }
% % W
5 55
P
,
3Ku2I % 164
i
2@)-6
3@$2I % 164
P
,
3Ku2I % 164 +
h
3@$2I % 164
3@$2I % 164
5
P
,
3Ku2I % 164 + 3Ku2I % 164
5
P
,
3@$2I % 164 2@)/6
2?u2I 16P
NC
I %1,I P N % 3Ku2I 164
5
P 3Ku2I 164 P
Nu2I 16
+
Nu2I %16
V
%
% 2@)L6
5
,
%
P2 3Ku2I % 164 P
,
3@$2I % 164 W
N 5
(
NC
I %1,I 2?u2I % 16 P V 3Ku2I % 164 P
,
3Ku2I % 164 P
Nu I %
Nu2I
%
16 + 5 2 16 2@)O6
P2 3Ku2I % 164 P
,
3@$2I % 164 W
NC
I %1,I
+ 2?u2I % 16 P 2K
5
P
,
Ku2I % 16 P 2K
5
P
,
@$2I % 16 2@).6 Nu2I % 16
NC
I %1,I
+ 2?u2I % 16 P 2K
5
P
,
3@$2I % 16 P Ku2I % 164 2@)Q6 Nu2I % 16
NC
I %1,I

2I % 16 P 2K
5
P
,
3@$2I % 16 P Ku2I % 164 + , + 2?u
2@)06 Nu2I
%
16
1O
@p´endice K. 1istemas de tiempo discreto. Rorionte Infinito.
Dado el sistema muestreado-
$4J ? <6 > @$4J6 ? Ku4J6
4O8
<6
&4J6 > ;$4J6,
4O8
#6
el control ´optimo u

4J6 /ue minimia el ´ındice de per*ormance-

C >$5 4J6 E $4J6 ? u5 4J6 ? u4J6 4O8%6
X
J+,
para dado apartamiento inicial de los estados $4$60 resulta invariante en el tiempo) Au valor se
calcula a partir de la soluci´on de estado estacionario de P 0 resultando-
u

4J6 > * $4J6
4O8
D6
con
h
? ? K
5
P
cd
K
i
−1
K
5
P
cd
@
* > % 4O8@6
P
cd
> C@ ? K*E
5
P
cd
C@ ? K*E ? *
5
?* ? E, 4O8K6
siendo el m´ınimo valor de C -
C

> $
5
4$6 P
cd
$4$6 4O8B6
<
B
?eferencias
Ka&, C. 210006. 7inear 1tate 1pace 1&stems, 8cXraY)Rill.
Kro!an, Z. 210016. 8odern ;ontrol 5"eor&, Prentice Rall.
(riedland, K. 210QO6. ;ontrol 1&stem >esi!n, 8cXraY)Rill.
*YaJernaaJ, R. [ 1ivan, ?. 210.26. 7inear 9ptimal ;ontrol 1&stems, Zille&)
Intercience. Ia!rat", I. [ Xopal, 8. 210Q26. ;ontrol 1&stem #n!ineerin!, Zile&.
1Q