Professional Documents
Culture Documents
Control No Lineal Multivariable 1ra Edic
Control No Lineal Multivariable 1ra Edic
MULTIVARIABLE
APLICACIONES EN TIEMPO REAL
r
q
i
θ
u2
ISBN
Queda rigurosamente prohibida la reproducción total o parcial de esta obra por cualquier
medio o procedimiento, sin la autorización escrita del propietario del “Copyright”.
Índice general
2. Control Óptimo 33
2.1. Estructura del Sistema de Control Óptimo . . . . . . . . . . . . . . . . 33
2.2. Descripción dinámica del Sistema . . . . . . . . . . . . . . . . . . . . . 34
2.3. El Controlador Óptimo PI . . . . . . . . . . . . . . . . . . . . . . . . . 35
2.4. El Observador Óptimo No Lineal . . . . . . . . . . . . . . . . . . . . . 38
2.5. Procedimiento de Diseño . . . . . . . . . . . . . . . . . . . . . . . . . . 39
2.6. Aplicación en Tiempo Real . . . . . . . . . . . . . . . . . . . . . . . . 40
2.6.1. Control Óptimo del Sistema MRE . . . . . . . . . . . . . . . . 40
5. Control Backstepping 67
5.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
5.2. Caracterı́sticas del Modelo . . . . . . . . . . . . . . . . . . . . . . . . . 70
5.3. Diseño Backstepping No Lineal . . . . . . . . . . . . . . . . . . . . . . 71
5.4. Procedimiento de Diseño Backstepping . . . . . . . . . . . . . . . . . . 72
5.5. Aplicaciones en Tiempo Real . . . . . . . . . . . . . . . . . . . . . . . 73
5.5.1. Control Backstepping del Manipulador Esférico MRE . . . . . 73
B
. ibliografı́a 87
Capı́tulo 1
Modelado de Sistemas No
Lineales
dθm d 2 θm
Tm = Jm θ̈m + Bm θ̇m + Tg1 θ̇m = θ̈m = (1.1)
dt dt2
La ia mh
θm mh
ωm
N1
L
+ + θ θ
u KA ω mb L
V
_ _b
L
Tm Bm Tg1
Jm
BL
τ
N2 T Bg TL J
Ra g2 L
Jg
Tg2 = Jg θ̈ + Bg θ̇ + TL (1.4)
TL = JL θ̈ + BL θ̇ + τL (1.5)
L
τL = mb g senθ + mh g (L + rh )senθ = Q sen θ (1.6)
2
L
Q = mb g + mh g (L + rh )
2
donde JL y BL representan el momento de inercia y la constante de fricción viscosa
de la carga no lineal (brazo más efector final), g es la constante gravitacional, m b
y mh denotan las masas del brazo y del efector final (esta masa también incluye la
masa de la carga en el efector) respectivamente, y rh denota la distancia desde el
extremo del brazo al centro de masa de mh .
1.1 Modelado Empleando las Leyes de la Fı́sica 5
rh
θ _
L
2
mhg
_L τL
2
mb g
Notar en (1.6) que el torque τL se debe a las fuerzas ejercidas por los pesos del
brazo y de la esfera. Ası́, el torque mb g L senθ
2 es el producto del peso mb g del brazo
L senθ
por su brazo de palanca 2 , mientras que el torque mh g (L+rh )senθ es el producto
del peso mh g del efector por su brazo de palanca (L + rh )senθ.
El momento de inercia JL de la carga es la suma del momento de inercia del brazo
Jb más el momento de inercia del efector Jh . Por otra parte, el teorema de los ejes
paralelos, establece que el momento de inercia de una masa m alrededor de un eje de
rotación que no pasa por su C.M. está dado por:
J = Jo + m a 2 (1.7)
donde Jo es el momento de inercia de m alrededor del eje de rotación que pasa por
su centro de masa y a es la distancia entre los dos ejes. Asumiendo que la masa
mb del brazo se concentra en su C.M., su momento de inercia con relación a un eje
perpendicular que pasa por su C.M. es [3]:
1
Jbo = mb L2 (1.8)
12
Considerando que la masa del brazo está distribuida a lo largo de su longitud y
aplicando el teorema de los ejes paralelos, el momento de inercia Jb con respecto al
punto de articulación se formula como:
2
L 1
Jb = Jbo + mb = mb L2 (1.9)
2 3
Del mismo modo, asumiendo que la masa mh del efector está concentrada en su C.M.,
entonces:
Jh = Jho + mh (L + rh )2 (1.10)
donde Jho es el momento de inercia del efector con relación a un eje de rotación
que pasa por su C.M. Si consideramos por ejemplo, sin perder generalidad, que el
6 Modelado de Sistemas No Lineales
ẋ1 = x2
Q Beq nKm
ẋ2 = − senx1 − x2 + x3
Jeq Jeq Jeq
nKb Ra KA
ẋ3 = − x2 − x3 + u (1.20)
La La La
donde la salida es la posición x1 y la señal de control es u (la tensión de armadura).
ẋ1 = x2
ẋ2 = −a1 senx1 − a2 x2 + bu (1.22)
donde:
Q Beq Ra + n2 Km Kb nKm KA
a1 = a2 = b=
Jeq Jeq Ra Jeq Ra
donde:
Ra Q
h=M α1 = P f1 = θ̇ α2 = f2 = senθ
nKm KA
donde:
Jeq La Beq La + Ra Jeq
h= α1 =
nKm KA nKA Km
nKb Ra Beq QLa Ra Q
α2 = + α3 = α4 =
KA nKA Km nKA Km nKA Km
f1 = ÿ f2 = ẏ f3 = ẏ cos y f4 = sen y
La ia mh
θm mh
ωm
$%
%
$%$% $%
$% %$
+ + $ %$%$ N1
θ L θ
&'
'
& ' &'
& '&'& /./. 1101K*+ w-,-,
KA ω mb
_
u Vb
.
./ ./
. *
"
!!#
"!! #!" !!!
L
_
( (
) *
* ( ) 00 ***+++ -,-,
!
L" " !
!# !#" !!
* τ !
Tm Bm Tg1 (
() ((
) * )(() *+
Jm BL
Ra N 2 T Bg TL J
g2 L
Jg
Fig. 1.4: Esquema de estudio del Manipulador Robótico con Articulación Elástica
(MRAE).
Jeq = n2 Jm + Jg Beq = n2 Bm + Bg
La ecuación que gobierna la dinámica del brazo del manipulador (ver Fig. 1.3) se
puede expresar como:
θm 1
Kw − θ = JL θ̈ + BL θ̇ + mb gLsen θ + mh g(L + rh )sen θ (1.29)
n 2
10 Modelado de Sistemas No Lineales
f1 (x, u) = x2
Kw BL Kw Lg mb
f2 (x, u) = − x1 − x2 + x3 − + mh sen x1
JL JL JL JL 2
f3 (x, u) = x4
Kw Kw Beq nKm
f4 (x, u) = x1 − x3 − x4 + x5
Jeq Jeq Jeq Jeq
nKb Ra KA
f5 (x, u) = − x4 − x5 + u
La La La
donde hemos usado el hecho de que ẋ1 = x2 y ẋ3 = x4 . Si la salida del sistema es
y = θ, entonces la ecuación de salida del MRAE resulta:
y = h(x) = Cx = [1 0 0 0 0] x (1.38)
Despreciando la inductancia de armadura La en (1.37), lo que equivale a eliminar
un elemento almacenador de energı́a independiente (por consiguiente, eliminar una
variable de estado), entonces:
nKb KA
La ẋ5 = 0 = −nKb x4 − Ra x5 + KA u ⇒ x5 = − x4 + u
Ra Ra
Reemplazando x5 en la cuarta ecuación de (1.37), se obtiene una ecuación de estado
no lineal de orden 4:
ẋ1 f1 (x, u)
ẋ2 f2 (x, u)
ẋ3 = f3 (x, u)
(1.39)
ẋ4 f4 (x, u)
f1 (x) = x2
Kw BL Kw Lg mb
f2 (x) = − x1 − x2 + x3 − + mH sen x1
JL JL JL JL 2
f3 (x) = x4
2
Kw Kw n Km Kb Beq nKm KA
f4 (x) = x1 − x3 − + x4 + u
Jeq Jeq Jeq Ra Jeq Jeq Ra
La salida del sistema en este caso se expresa como:
y = h(x) = Cx = [1 0 0 0] x (1.40)
12 Modelado de Sistemas No Lineales
Este sistema es multivariable porque posee dos entradas y dos salidas. Las varia-
bles de entrada (las fuerzas de control) son el flujo de agua qi y el calor Φi suministrado
al agua por la resistencia eléctrica. Las variables de salida (las señales controladas)
son el nivel H del lı́quido en el tanque y la temperatura de salida θo del agua calen-
tada. La Tabla 1.2 describe las variables y los valores de los parámetros del sistema
tanque de agua.
dh
A = Aḣ = qi − qo (1.41)
dt
Considerando un flujo laminar de salida:
h
qo = (1.42)
Rh
1.1 Modelado Empleando las Leyes de la Fı́sica 13
66
565 θi
θa
5 qi
9:3 9 9
A
9:3 9:3 22 4242
43
:3
9 :3 3
: 9 :3 3
: 9 :3 9 :3 9 :9:9 43 2432 4242
43
θo
H
Φi
7 87
83 qo
Ao
Determinación Experimental de Rh
La válvula de control empleada para regular la entrada de agua al tanque es del
tipo VXN015F250, con diámetro nominal DN15, conexión G1B y actuador motórico.
La abertura máxima se obtiene alimentando con 10 V al actuador, la cual corresponde
a un flujo de 0.4 m3 /h, de acuerdo al manual del fabricante. La mı́nima abertura,
con 0 V, corresponde a un flujo de 0 m3 /h. Esto significa que para una abertura de
1 V el flujo que pasa por la válvula es de 1/90000 m3 /s.
Asumiendo una variación lineal entre el flujo qi que pasa por la válvula y la altura
h del tanque, se realizó el siguiente experimento. Con una abertura de válvula para
4 V (0.16 m3 /h), se abrió convenientemente la válvula de descarga hasta lograr una
altura estable de 0.12 m. Luego, con una abertura de válvula para 6 V (0.24 m 3 /h), se
siguió abriendo la válvula de descarga hasta lograr una altura de 0.18 m. Empleando
la relación:
H
Rh =
Q
la resistencia hidráulica para cada punto resultó aproximadamente R h = 2700 s/m2 .
Se asume que los valores en estado estacionario de h y qi son H = 0.12 m y Q = 0.16
m3 /h respectivamente.
1.1 Modelado Empleando las Leyes de la Fı́sica 15
ẋ = A x + B u y = Cx (1.51)
x1 h u1 qi y1 h
x= = u= = y= =
x2 θo u2 Φi y2 θo
1 1
− AR 0 A 0 1 0
A= h B= C=
0 − Rt1Ct 0 C1t 0 1
a √ θo − θ a θi 1
θ̇o = − θo h − + qi + Φi (1.58)
Ah AhρCp Rt Ah AhρCp
Notar en la ecuación (1.62) que L depende de las variables q1 , . . . , qr , q̇1 , . . . , q̇r . Por
otra parte, de acuerdo al principio de la mı́nima acción de Hamilton para sistemas
conservativos, la integral I definida por:
Z t2
I= L(q1 , . . . , qr , q̇1 , . . . , q̇r )
t1
Lh
y EFECTOR
m h FINAL
BRAZO
ma
L bcos θ
M1 POLEA θ ><
>< >> mp
;=<
=<
;< =; ?<
>?<?>?
=; =;=; PIVOTE
@A<
A<
@A@<A< @A<
@A< A@A@ CARRO ?<?
@ A@ x rp
M2 F
B< B
B<C< <
C B
B C< <
C B
B C< <
C B
B C< <
C B
B C< <
C B
B C< <
C FCB<
f B<
B CB<C< C B
B C< <
C B
B C< <
C B C< B <
C B C< B <
C B C< B <
C B
B C< <
C B
B C< <
C B
B C< <
C BC<
B C< BC<
B C< BC<
B C< BC<
B C< BC<
B C< BC<
B C< BC<
B C< B CBCB
r L b sen θ
Tabla 1.3: Parámetros valorados del sistema MRT. La abreviatura C.M. significa
Centro de Masa.
Sı́mbolo Descripción Valor Unidades
u1 , u2 Voltaje de entrada al sistema V
KA Ganancia del amplificador 8.5
Va1 , Va2 , Voltaje de armadura V
Ra Resistencia de armadura 3.5 Ω
La Inductancia de armadura 0.002 H
ia1 , ia2 Corriente de armadura A
Km Constante del torque motor 0.0421 N-m/A
Tm1 , Tm2 Torque motor N-m
Tg1 , Tg2 Torque en los engranajes N-m
T Torque de carga N-m
Jm Momento de inercia del motor 0.0003 kg-m2
Jg Momento de inercia de los engranajes 0.053 kg-m2
Jp Momento de inercia de la polea kg-m2
Jb Momento de inercia del brazo kg-m2
Jeq Momento de inercia equivalente kg-m2
Beq Constante de fricción equivalente N-m-s/rad
Bm Constante de fricción del motor 0.0001 N-m/rad/s
Bg Constante de fricción engranajes 0.01 N-m-s/rad
Bp Constante de fricción en la polea 0.006 N-m-s/rad
F Fuerza aplicada al carro N
Ff Fuerza de rozamiento (Ff = Fc ṙ) N
Fc Constante de fricción del carro 2.81 kg/s
mh Masa del efector 0.15 kg
ma Masa del brazo 0.8 kg
mc Masa del carro 0.95 kg
mp Masa de la polea 0.3 kg
rp Radio de la polea 0.05 m
r Posición del carro m
L Longitud del brazo m
Lb Longitud del brazo más efector 0.225 m
Vb1 , Vb2 Voltajes contraelectromotrices V
Kb Constante contraelectromotriz 0.0565 V-s/rad
g Aceleración de la gravedad 9.81 m/s2
N1 , N2 N o de dientes de los engranajes N 2 > N1
n Relación de engranajes (n = N2 /N1 ) 12.5
θ, θm Posición angular: brazo y motor rad
ω, ωm Velocidad angular: carga y motor rad/s
1.2 Método de Las Ecuaciones de Lagrange 21
Lb
U2 ≈ m b g cosθ (1.68)
2
La i a1
θ m1
ωm1
DE<
E<
DED<E< DE<
DE< EDED N1 Jp
+ + D ED θ1
ω1 Bp
u KA FG<
G<
F G< FG<
F GFGF J< JJ< JJ<
J<K< K K< K KJJK
V b1
_1 _ rp
Tm1 Bm Tg1 IH<
H I<
I< HI<
H I< HI<
H IHIH
Jm F
Ra N2 Tg2 Bg
Jg
θ̈m1 θ̇m1
Tg2 = nTg1 = (Jg + Jp ) + (Bg + Bp ) + F rp (1.77)
n n
donde n > 1 es la relación de dientes de los engranajes del mecanismo de reducción,
Jm , Jg y Jp son los momentos de inercia de la armadura, del mecanismo de reducción
y de la polea respectivamente, mientras que Bm , Bg y Bp son las constantes de
fricción de la armadura, del mecanismo de reducción y de la polea respectivamente.
La relación Tg2 = nTg1 se obtiene asumiendo que los engranajes son ideales. En esta
situación, el principio de conservación de energı́a requiere que:
θm1
Tg1 θm1 = Tg2
n
Asumiendo que la polea es un disco que gira sobre su eje, su momento de inercia se
puede calcular como:
Jp = mp rp2 /2; (1.78)
El torque servomotor Tm1 es proporcional a ia1 :
donde:
Jeq1 = n2 Jm + Jg + Jp Beq1 = n2 Bm + Bg + Bp
1.2 Método de Las Ecuaciones de Lagrange 23
donde:
Vb2 = Kb nθ̇ (1.83)
La ecuación del torque motor Tm2 es (ver Fig. 1.10):
La i a2
θm
ωm
LM
M
LMLM LM
LM ML
+ + L MLML N1
Articulación
u2 KA V b2 NO
O
N O NO
N ONON RS
S
RSRS R
S RS RS
S
R SRSR
_ _ R S R SR
Tm2 Bm Tg1 P
PQ PQ
P Q PQ
P QPQP θ
Jm
Ra N2 Tg2 Bg ω
Jg
Empleando las ecuaciones (1.82), (1.83), (1.84), (1.85) y (1.86) se puede demostrar
que:
n2 K m K b nKm KA
T = −Jeq2 θ̈ − Beq2 + θ̇ + u2 (1.87)
Ra Ra
donde:
Jeq2 = n2 Jm + Jg Beq2 = n2 Bm + Bg
0 0
1 0 0
1 0 0 0
B= C= den = M 11 M 22 −M 12 M 21
den M 22 −M 12 0 1 0 0
−M 21 M 11
En las relaciones anteriores:
Ra rp mb Lb
M 11 = M11 M 12 =
2nKA Km
Ra mb Lb
M 21 = M 22 = M22
2nKm KA
P 11 = P11 P 12 = 0
Ra mb Lb g
P 22 = P22 d21 = −
2nKA Km
1
V1 = J1 q̇12 U1 = m 1 g L 1 (1.93)
2
donde:
mb b + m d d
m1 = m d + m b L1 = (1.94)
mb + m d
26 Modelado de Sistemas No Lineales
Tabla 1.4: Variables y parámetros del sistema MRE (C.M.: centro de masa).
Sı́mbolo Descripción Valor Unidad
q1 Posición angular de la base rad
q2 Posición angular del brazo rad
T1 , T 2 Torques generados N-m
md Masa del disco 0.55 kg
mb Masa de la barra 0.9 kg
ma Masa del brazo o eslabón 0.8 kg
mh Masa del efector final 0.15 kg
m2 Masa equivalente del brazo kg
d Espesor del disco 0.01 m
rd Radio del disco 0.06 m
b Longitud de la barra 0.25 m
a2 Sección cuadrada de la barra 0.044 2 m2
M1 , M2 Servomotores D.C.
Lb Longitud del brazo 0.3 m
Lh Longitud del efector 0.05 m
L1 Ubicación C.M. de la base m
L2 Longitud equivalente del brazo m
Jh Momento de inercia del efector kg-m2
Jm Momento de inercia de M1 y M2 0.0003 kg-m2
Jeq Momento de inercia equivalente kg-m2
Jg1 , Jg2 Momentos de inercia de los engranajes 0.053 kg-m2
J1 , J2 Momentos de inercia de la base y del brazo kg-m2
Bm Constante de fricción de M1 y M2 0.0001 N-m-s/rad
Beq Constante de fricción equivalente N-m-s/rad
Bg1 , Bg2 Constantes de fricción en engranajes 0.01 N-m-s/rad
n Relación de engranajes de M1 y M2 12.5
Ra Resistencia de armadura de M1 y M2 3.5 Ω
La Inductancia de armadura de M1 y M2 0.00015 H
Vb1 , Vb2 Voltajes contra electromotrices V
Va1 , Va2 Voltajes de armadura V
ia1 , ia2 Corrientes de armadura A
KA Ganancia del amplificador 8.5
Km Constante del servomotor 0.0421 N-m/A
Kb Constante contra electromotrı́z 0.0565 V-s/rad
u1 , u2 Voltajes de control V
g Constante gravitacional 9.81 m/s2
1.2 Método de Las Ecuaciones de Lagrange 27
z
EFECTOR
FINAL
mh
ma
SERVOMOTOR q2
M2 Lh
Lb
BRAZO
a
mb
b
BASE
a L1
rd
d y
md
SERVOMOTOR
x q1 M1
L arm i a1
TU
q m1
q m1 XY
Y
XYXY XY
XY YX
+ + X YXYX N1
Articulación
u1 KA V b1 Z[
[
Z [ Z[
Z [Z[Z ^_
_
^_^_ ^_
^_ ^^ _^_^
_
_ _ ^ _ ^ _^
_
Tm1 Bm Tg1 \
\] \]
\ ] \]
\ ]\]\ q1
Jm
Ra N2 Tg2 Bg W V WV
Jg q1
donde:
Vb2 = Kb q̇m2 = Kb nq̇2 qm2 = nq2 (1.113)
L arm i a 2
`a
q m2
q m2
+ +
de
e
d e de
d eded N1
Articulación
u2 KA fg
g
f g fg
f gfgf jk
k
jkjk jk
jk jj kjkj
k
j k
V b2
_ _ j kj
k
Tm2 Bm Tg1 h
hi hi
h i hi
h ihih q
Jm
Ra N2 Tg2 Bg c b cb 2
Jg q2
Empleando las ecuaciones (1.112), (1.113), (1.114), (1.115) y (1.116) se puede de-
mostrar que:
n2 K m K b nKm KA
T2 = −Jeq q̈2 − Beq + q̇2 + u2 (1.117)
Ra Ra
donde:
Jeq = n2 Jm + Jg Beq = n2 Bm + Bg (1.118)
1.2 Método de Las Ecuaciones de Lagrange 31
donde:
M11 0 P11 P12 0
M= P= d=
0 M22 P21 P22 d21
Ra 1
M11 = J1 + Jeq + m2 L2 sen2 q2
nKm KA 4
Ra 1
M22 = J2 + Jeq + m2 L2
nKm KA 4
2
Ra n Km Kb
P11 = Beq +
nKm KA Ra
Ra 1
P12 = m2 L2 q̇1 senq2 cos q2
nKm KA 2
Ra 1
P21 = − m2 L2 q̇1 senq2 cos q2
nKm KA 4
Ra n2 K m K b
P22 = Beq +
nKm KA Ra
Ra 1
d21 = − m2 L2 gsenq2
nKm KA 2
Control Óptimo
R z z U X Y
KΙ SISTEMA C
OBSERVADOR
X
K
sobre el sistema para hacer que el error entre R y la salida Y tienda a cero cumpliendo
ciertas especificaciones de diseño.
Ẋ = f (X, U) + v
Y = h(X) + w (2.1)
X1 U1 v1 Y1 w1
X = ... U = ... v = ... Y = ... w = ...
Xn Um vn Yp wp
f1 (X, U) h1 (X)
.. ..
f = . h= .
fn (X, U) hp (X)
donde X es el vector de estado, U es el vector de control (la entrada al sistema) e Y
es el vector de salida. Asumiremos que las funciones vectoriales de variable vectorial
f (X, U) y h(X) son operadores no lineales diferenciables que representan la dinámica
del sistema y la dinámica de la salida respectivamente. Los vectores v de orden n × 1
y w de orden p × 1 son los disturbios en los estados del sistema (ruidos en los estados)
y en sus salidas (ruidos de medición) respectivamente.
Sean X0 , U0 e Y0 los vectores de referencia (o nominales) de X, U e Y respecti-
vamente. Si la entrada del sistema se selecciona exactamente igual a U0 , su respuesta
será X0 . Entonces X0 satisface:
Ẋ0 = f (X0 , U0 ) + v
Y0 = h(X0 ) + w (2.2)
2.3 El Controlador Óptimo PI 35
X = X0 + x U = U0 + u Y = Y0 + y (2.3)
Ẋ0 + ẋ = f (X0 + x, U0 + u) + v
Y0 + y = h(X0 + x) + w (2.4)
Como hemos asumido que las desviaciones actuales son pequeñas, entonces el sistema
(2.4) admite ser linealizado alrededor de un vector de trayectorias nominales o de
referencia X0 . La linealización de (2.4) empleando operadores jacobianos alrededor
de X0 y U0 resulta:
ẋ ≈ Ax + Bu + v x(0− ) = 0
y ≈ Cx + w (2.5)
donde:
∂f1 ∂f1 ∂f1 ∂f1
∂X1 ··· ∂Xn ∂U1 ··· ∂Um
.. .. .. .. .. ..
A = . . . B= . . .
∂fn ∂fn ∂fn ∂fn
∂X1 ··· ∂Xn (X0 ,U0 ) ∂U1 ··· ∂Um (X0 ,U0 )
∂h1 ∂h1
∂X1 ··· ∂Xn
.. .. ..
C = . . . (2.6)
∂hp ∂hp
∂X1 ··· ∂Xn (X0 )
Observar que las matrices jacobianas Ann , Bnm , Cpn y Dpm necesitan ser evaluadas
alrededor de los vectores de referencia X0 y U0 .
ẋ = Ax + Bu
y = Cx
u = −Kx + KI z
ż = R − y = R − Cx (2.7)
R z z u x x y
KI B C
xe = x(t) − x(tf )
ze = z(t) − z(tf )
ue = u(t) − u(tf )
Re = R(t) − R(tf ) (2.11)
son los errores del sistema. Dado que se desea un comportamiento asintóticamente
estable del sistema controlado, entonces los errores xe , ze y ue deben de tender a cero,
mientras que el error Re debe de ser nulo cuando se alcance el estado estacionario.
Por consiguiente, la ecuación de estado del error (incluyendo los vectores de ruido
gaussiano) toma la forma:
ė = Aa e + Ba ue + v (2.12)
xe a A 0 a B
e = A = B =
ze −C 0 0
2.3 El Controlador Óptimo PI 37
Ka = R−1 a T a
u (B ) P (2.15)
donde Ru = RT a a T
u es una matriz de sintonización definida positiva y P = (P ) de
orden (n + p) × (n + p) es la única matriz solución definida positiva de la siguiente
ecuación asociada de Riccati:
ẋa = Aa xa + Ba u + va (2.19)
ḃ = f (X,
X b U) + H(Y − Y)
b
b = h(X)
Y b (2.22)
v w R
+ + +
x x + Y z z
h( ) h(X)
+ f(X, U)
f( )
U
^
X
U ^a
X ^
X
a
−K z
z
^
X ^ ^
X Y Y
C
+ +
+
f( )
^ U)
f(X, U
H
Fig. 2.3: Estructura del sistema de control óptimo para estimación de estados y
control.
2.5 Procedimiento de Diseño 39
Por otra parte, asumamos que los disturbios v y w en (2.1) sean ruido blanco
gaussiano con media (o esperanza) nula. El ruido blanco gaussiano posee la propiedad
de ser no correlacionado en cada instante de tiempo. En otras palabras, no existe una
interrelación (correlación) entre v y w. La propiedad de la media nula implica que
toda la información estadı́stica del ruido se acumula en la covarianza de los disturbios.
En términos matemáticos:
(5) Computar la matriz de ganancia H del observador no lineal del sistema (ecua-
ciones (2.25) y (2.26)).
(6) Simular el sistema de control óptimo empleando las ecuaciones dinámicas no
lineales (2.1) y (2.22).
(7) Desarrollar el software de control en tiempo real del sistema.
(8) Implementar el sistema de control óptimo (hardware).
(9) Ejecutar pruebas de funcionamiento en tiempo real.
Ra
M 11 = (J1 + Jeq )
nKm KA
M 22 = M22
P 11 = P 22 = P11 = P22
P 12 = P 21 = 0
Ra m2 L2 g
d21 = d21 senx2 ; d21 = ;
2nKm KA
Por consiguiente:
0 0 1 0 0 0
0 0 0 1 0 0
A= −1 B= −1
0 0 −M 11 P 11 0 M 11 0
−1 −1 −1
0 −M 22 d21 0 −M 22 P 22 0 −M 22
1 0 0 0 0 0
C= D=
0 1 0 0 0 0
Por lo tanto:
a A 0 a B
A = B = Ca = C 0
−C 0 0
1
Posición X1 [rad]
0.5
0
0 1 2 3 4 5 6 7 8
10
Control U1 [V]
−5
0 1 2 3 4 5 6 7 8
1
Posición X2 [rad]
0.5
0
0 1 2 3 4 5 6 7 8
10
Control U2 [V]
−5
0 1 2 3 4 5 6 7 8
Tiempo [segundos]
Fig. 2.4: Posiciones angulares de la base y del del brazo MRE controladas.
Posición x1 [grad]
100
−100
0 5 10 15 20 25
TIEMPO [s]
CONTROL u1 [V]
−5
0 5 10 15 20 25
TIEMPO [s]
Posición x2 [grad]
50
−50
0 5 10 15 20 25
TIEMPO [s]
CONTROL u2 [V]
10
−10
0 5 10 15 20 25
TIEMPO [s]
Fig. 2.5: Respuesta experimental del sistema de control óptimo del MRE.
Capı́tulo 3
MODELO
REFERENCIAL
− qd
r
CONTROLADOR u SISTEMA +
ADAPTATIVO NO LINEAL
q
~q
MECANISMO
DE ADAPTACIÓN
la referencia [14], asumamos que es posible transformar (3.1) en una expresión que
dependa linealmente de un vector de parámetros a con elementos conocidos, a saber:
Ya = u (3.2)
donde Y es una matriz que contiene información de las variables en juego. Considere
la siguiente ley de control:
u = Yb a − KD s (3.3)
donde KD s es el término derivativo e Yb a es el término anticipativo. En los términos
b es el vector estimado de parámetros, KD (la ganancia derivativa) es una
descritos, a
matriz simétrica constante definida positiva y s es un vector de superficies deslizantes
cuyos elementos si , i = 1, . . . , m se definen mediante la ecuación escalar si (q, t) = 0,
de modo tal que:
d
si = ( + λi )n−1 qei = (p + λi )n−1 qei (3.4)
dt
donde λi > 0 es una constante (el ancho de banda), p es el operador de Laplace y:
qei = qi − qdi
ė + Λe
s=q q = q̇ − q̇r q̃ = q − qd q̇r = q̇d − Λe
q (3.5)
donde:
s1 qė1 qėr1
s = ... ė = ...
q ėr = ...
q
sm qėm qėrm
λ1 0 ... 0
0 λ2 ... 0
qd = [qd1 ... qdm ]T Λ= .. .. .. (3.6)
. . ... .
0 0 . . . λm
La conservación de la energı́a requiere que:
1 d T
[q̇ Mq̇] = q̇T (u − d) (3.7)
2 dt
donde q̇T Mq̇ es la energı́a cinética del sistema y q̇T (u − d) es la potencia de entrada
generada por el actuador. Diferenciando el miembro izquierdo de (3.7):
1
q̇T Mq̈ + q̇T Ṁq̇ = q̇T (u − d) (3.8)
2
De (3.1) obtenemos: Mq̈ = u − d − Pq̇. Sustituyendo este término en (3.8):
ḃ = −ΓY T s
a (3.13)
Dado que s = q ė + Λe
q (ver (3.5)), entonces (3.15) garantiza que los errores de
seguimiento de posición q ė tiendan a 0 conforme t → ∞. En otras
e y de velocidad q
palabras, los errores de seguimiento convergen en la superficie s = 0.
ḃ = q̇d + Ld (q − q
q b) (3.16)
ḃ = q̇d + Ld (q − q
q b)
q̃ = q − qd q̃˙ = q̇ − q̇d
y la función de deslizamiento:
b + Λe
s=q q
q̇r = q̇d − Λe
q ė
q̈r = q̈d − Λq
48 Control Adaptativo con Modelo Referencial
a4 Ra Ra m2 L22
M11 = a1 + sin2 q2 a1 = (J1 + Jeq a4 =
2 nKm KA 2nKm KA
Ra 1 2
M22 = a2 a2 = J2 + Jeq + m2 L2
nKm KA 4
2
Ra n Km Kb
P11 = a3 a3 = Beq +
nKm KA Ra
P12 = a4 q̇1 sin q2 cos q2
a4
P21 = q̇1 sin q2 cos q2
2
P22 = a3
Ra m2 L2 g
d21 = a5 sin q2 a5 =
2nKm KA
3.3 Aplicaciones en Tiempo Real 49
10
0
0 2 4 6 8 10 12 14 16
CONTROL u1 [V]
−1
0 2 4 6 8 10 12 14 16
TIEMPO [s]
POSICIÓN q2 [rad]
10
0
0 2 4 6 8 10 12 14 16
CONTROL u2 [V]
−1
0 2 4 6 8 10 12 14 16
TIEMPO [s]
Fig. 3.2: Posiciones angulares controladas de los brazos del MRE. Caso: seguimiento.
POSICIÓN q1 [rad]
1
0.5
0
0 1 2 3 4 5 6 7 8
50
CONTROL u1 [V]
−50
0 1 2 3 4 5 6 7 8
POSICIÓN q2 [rad]
0.5
0
0 1 2 3 4 5 6 7 8
50
CONTROL u2 [V]
−50
0 1 2 3 4 5 6 7 8
TIEMPO [segundos]
Fig. 3.3: Posiciones angulares controladas de los brazos del MRE. Caso: regulación.
y SETPOINT5.vi, tanto para la base como para el brazo del MRE respectivamente.
También requiere de un archivo MATRIZYadap.vi, en el cual se realizan varias opera-
ciones requeridas por el algoritmo. Los gráficos de la Fig. 3.4 se obtienen ejecutando
el archivo acmrertr.m, el cual emplea los mismos parámetros de sintonización usados
en la simulación (archivo acmrer.m) además de los archivos de datos experimentales
setpoitnbase, setpointbrazo, U1 y U2. Las especificaciones de diseño preestablecidas
en la simulación también se cumplen para el caso experimental y para el mismo
tiempo de muestreo: T = 0.001 s. ♣
3.3 Aplicaciones en Tiempo Real 51
Posición x1 [grad]
200
−200
0 5 10 15
TIEMPO [s]
CONTROL u1 [V]
10
−10
0 5 10 15
TIEMPO [s]
Posición x2 [grad]
100
−100
0 5 10 15
TIEMPO [s]
CONTROL u2 [V]
10
−10
0 5 10 15
TIEMPO [s]
Fig. 3.4: Respuesta experimental del sistema de control adaptativo del MRE.
Capı́tulo 4
s = (p + λ)2 x
e = (p2 + 2λp + λ2 )e
x=x ė + λ2 x
ë + 2λx e
= ẍ − ẍr
ė − λ2 x
ẍr = ẍd − 2λx e (4.5)
Notar en este caso que s resulta la suma ponderada del error de aceleración x, ë del
error de velocidad xė y el error de posición xe.
La relación (4.4) establece que un problema de control de trayectoria de orden
n se puede reemplazar por un problema de estabilización de primer orden, es decir,
por el problema de mantener el escalar s en cero. Tal problema de estabilización se
puede resolver seleccionando la ley de control u de (4.1) de forma tal que fuera de la
superficie S(t):
1 d 2
s = ṡ s ≤ −η|s| (4.6)
2 dt
donde η es una constante positiva. Como se ilustra en la Fig. 4.1(a) para el caso
n = 2, todas las trayectorias de estado que satisfacen la condición (4.6), la condición
de deslizamiento, hacen de la superficie S(t) un conjunto invariante en el sentido de
Lyapunov (ver Apéndice C), implicando que las trayectorias del sistema fuera de S(t)
apuntarán a tal superficie, y las trayectorias del sistema en S(t) permanecerán en ella.
También se puede establecer que dinámica no modelada, incertidumbre paramétrica
4.1 Conceptos Básicos 55
o ciertos disturbios, serán tolerados por un sistema que satisfaga la condición dada
en (4.6). S(t) es conocida como la superficie de deslizamiento porque satisface la
condición de deslizamiento. El comportamiento del sistema sobre una superficie de
deslizamiento se denomina modo de deslizamiento.
S(t)
(a)
dx
dt s=0
. xd
x
0
(b)
dx
s=0
dt
. xd
x
0
(c)
Fig. 4.1: (a) La superficie de deslizamiento S(t). (b) Convergencia exponencial. (c)
Fenómeno del “chattering”.
nos conduce a thit ≤ s(0)/η. Se puede obtener el mismo resultado si se arranca con
s(0) negativo. Por consiguiente:
La Fig. 4.1(b) ilustra el caso de una trayectoria de estado que evoluciona con una
condición inicial arbitraria, y luego golpea a la superficie s(t) = 0 en un tiempo finito
thit ≤ |s(t = 0)|/η. En el modo de deslizamiento, tal trayectoria “se desliza” a lo
largo de S(t) con el objeto de alcanzar exponencialmente a xd con una constante de
56 Control por Modos Deslizantes
1/λ
s = (p + λ)x̃ → x̃ = s
(1/λ)p + 1
Ejemplo 4.1
sgn(x) = +1 si x > 0
sgn(x) = −1 si x < 0
La Fig. 4.2 muestra las trayectorias del sistema x(t) = −t y x(t) = t originadas
por la ley de control u+ y u− respectivamente. La superficie s(t) = x(t) = 0 es una
superficie de deslizamiento porque satisface la condición (4.6) para η ≤ 1. ♣
s=0
qei (t) = qi (t) − qdi (t) qėi (t) = q̇i (t) − q̇di (t)
o en forma matricial:
ė =
s(x, t) = s(q, q̇, t) = Λq̃ + q (4.11)
s1 (x, t) s1 (q, q̇, t) λ11 · · · 0 qe1 qė1
.. .. .. .. .. .. + ..
. = . = . . . . .
sm (x, t) sm (q, q̇, t) 0 · · · λmm qem qėm
donde las constantes positivas λii son los elementos de una matriz diagonal Λ de
orden m × m. Asumiendo que una fuerza de control diseñada es capaz de confinar
58 Control por Modos Deslizantes
Esta última relación nos indica que q̃i (t) y q̃˙ i (t) deben converger exponencialmente a
cero, esto es:
q̃i (t) = qi (t) − qdi (t) = 0 q̃˙ i (t) = q̇i (t) − q̇di (t) = 0
Por consiguiente: qi (t) = qdi (t) y q̇i (t) = q̇di (t), con lo cual se logra el objetivo de
control.
u = u0 − Usgn(s) (4.12)
+
u1 u+
1 + u1
−
u1 − u −1 ··· 0 sign(s1 )
.. 1 .. 1 .. .. .. ..
. = . − . . . .
2 2
um u+
m + u−
m 0 · · · u+
m − u −
m sign(s m )
o en función de sus elementos:
1 + 1 +
u0j = uj + u −
j Uj = uj − u −
j
2 2
La derivada de s (ecuación (4.11)) produce:
ṡ = Λq ė + (q̈ − q̈d )
ë = Λq
ė + q
Seleccionando:
Uj ≥ |[u0 + Ps − ueq ]j | + η ε>0 (4.16)
y reemplazando esta última expresión en (4.15) se obtiene:
m
X
V̇ ≤ −η |sj | η>0
j=1
Si seleccionamos:
ū+
j = Kj ū−
j = − Kj (4.18)
entonces de (4.17) obtenemos:
1 b j
u0j = (u+ + u−
j ) = [b
ueq − Ps] Uj = K j
2 j
o lo que es lo mismo, en forma matricial:
+
u1 + u −
1
1 .. b
u0 = . =u b eq − Ps
2
u+
m + um
−
+
u1 − u −
1 ··· 0 K1 · · · 0
1 .. .. .. .. . . ..
U = . . . = . . . (4.19)
2 +
0 · · · um − um − 0 · · · Km
d = u0 = u b
b eq − Ps (4.20)
60 Control por Modos Deslizantes
Kj ≥ |[ueq − Ps − d]i | + η
˙
Ahora, dado que ueq = −MΛq̃+Pq̇+d+Mq̈d , entonces las ganancias Kj se pueden
seleccionar siempre que:
ḃ = q̇d + Ld (q − q
q b)
e = q − qd
q ė = q̇ − q̇d
q ë = q̈ − q̈d
q
ė
q+q
s = Λe
siendo Λ = λI una matriz diagonal, donde λ es una constante positiva. Las
constantes Kj (j = 1, . . . , m) se calculan de (4.22):
u
if (sj /Φ > 1)
satj = 1
elseif (sj /Φ < −1)
Φ Φ s satj = −1
else
satj = sj /Φ
end
(3) Simular el sistema de control con modos deslizantes empleando los parámetros
de sintonización: Λ, η, Ld y Φ.
(4) Implementar el sistema de control deslizante (hardware).
(5) Desarrollar el software de control en tiempo real del sistema.
(6) Ejecutar pruebas de funcionamiento en tiempo real.
Por consiguiente:
Ra
nKm KA J1 + Jeq + 14 m2 L22 sin q22 0
M(q) =
0 M 22
62 Control por Modos Deslizantes
P 11 P 12 q̇1 sin q2 cos q2
P(q, q̇) =
P 21 q̇1 sin q2 cos q2 P 22
0
d(q) = Ra m2 L2 g
2nKm KA sin q2
qd1 = A sin W k + Bk
qd2 = A cos W k + Bk (4.25)
POSICIÓN q1 [rad]
−5
0 5 10 15 20 25 30 35 40
CONTROL u1 [V]
0.5
−0.5
0 5 10 15 20 25 30 35 40
TIEMPO [s]
POSICIÓN q2 [rad]
−5
0 5 10 15 20 25 30 35 40
CONTROL u1 [V]
10
−10
0 5 10 15 20 25 30 35 40
TIEMPO [s]
Fig. 4.3: Posiciones angulares controladas de los brazos del MRE. Caso: seguimiento.
64 Control por Modos Deslizantes
POSICIÓN q1 [rad]
0.4
0.2
0
0 2 4 6 8 10 12 14 16 18 20
CONTROL u1 [V]
−5
0 2 4 6 8 10 12 14 16 18 20
TIEMPO [s]
POSICIÓN q2 [rad]
0.4
0.2
0
0 2 4 6 8 10 12 14 16 18 20
CONTROL u1 [V]
−5
0 2 4 6 8 10 12 14 16 18 20
TIEMPO [s]
Fig. 4.4: Posiciones angulares controladas de los brazos del MRE. Caso: regulación.
4.4 Aplicaciones en Tiempo Real 65
Posición x1 [grad]
100
−100
0 2 4 6 8 10 12 14 16 18 20
TIEMPO [s]
CONTROL u1 [V]
10
−10
0 2 4 6 8 10 12 14 16 18 20
TIEMPO [s]
Posición x2 [grad]
200
100
0
0 2 4 6 8 10 12 14 16 18 20
TIEMPO [s]
CONTROL u2 [V]
10
−10
0 2 4 6 8 10 12 14 16 18 20
TIEMPO [s]
Fig. 4.5: Respuesta experimental del sistema de control deslizante del MRE.
Capı́tulo 5
Control Backstepping
5.1. Introducción
El método directo de Lyapunov (Apéndice C) se emplea extensivamente para
el análisis y sı́ntesis de sistemas. Los sistemas de control adaptativo con modelo
referencial y con modos deslizantes descritos en los capı́tulos 3 y 4 respectivamente,
fueron sintetizados empleando dicho método. El método directo de Lyapunov, descrito
en el Apéndice A, emplea una función de Lyapunov que contiene cierta información
de la dinámica del sistema. Si la derivada en el tiempo de la función de Lyapunov
seleccionada es negativa, entonces se dice en el sentido de Lyapunov que el sistema
en estudio es estable, tal como se puede ver en el siguiente ejemplo.
Ejemplo 5.1
ẋ = − cos x − x3 + u
dV
2. dt = x dx 2
dt = xẋ = −kx es definida negativa.
La Fórmula de Sontag
La fórmula de Sontag [17], [18] nos permite determinar una adecuada ley de
control u = αs (x) para sistemas dinámicos descritos como:
ẋ = f (x) + g(x)αs
Tal fórmula supone que existe una función de Lyapunov V (x) para dicho sistema.
Entonces, una ley de control αs (x) capaz de estabilizar tal sistema se formula como:
q
2 4
∂V
∂x
f+ ( ∂V f +( ∂V
∂x ) ∂x )
g ∂V
αs (x) = − ∂V , ∂x g 6= 0; (5.1)
( ∂x )
g
∂V
0, ∂x g = 0.
La ley de control de Sontag permite generar una ley de control de magnitud apropiada
(no grandes magnitudes) y rápida convergencia al estado estacionario a pesar de la
presencia de grandes valores iniciales de x, tal como se demuestra en el siguiente
ejemplo.
Ejemplo 5.2
ẋ = − cos x − x3 + u
∂V ∂V p p
g = −x f = −x4 αs (x) = x3 − x x4 + 1 u(x) = − cos x − x3 − x x4 + 1
∂x ∂x
Podemos observar que para grandes valores de x, αs (x) tiende a cero, mientras que
para pequeños valores de x, αs (x) tiende a −x. Por consiguiente, la magnitud de u
usando la fórmula de Sontag resulta menor que en los casos anteriores. ♣
5.1 Introducción 69
El Control Backstepping
La técnica de control backstepping comprende varios pasos, de acuerdo al orden
del sistema. Cada paso se puede descomponer en las partes siguientes:
(3) Buscar una ecuación para el control virtual que haga que la función de Lyapunov
sea una del tipo estabilizable, es decir, que su aplicación en el sistema permita
determinar las condiciones para estabilizar al sistema, sujeto a las restricciones
del caso.
Ejemplo 5.3
(1) Para la ecuación (5.2) definamos una fuerza de control virtual α y un estado
virtual z = x2 − α. Por consiguiente:
ẋ1 = −x31 + z + α
Definamos ahora una función de Lyapunov candidata: V (x) = x21 /2. Entonces:
En este punto se puede usar la fórmula de Sontag para calcular α con el fin
de estabilizar al sistema propuesto. Por simplicidad usaremos: α = −k1 x1 para
k1 ≥ 0. Por lo tanto:
ż = ẋ2 − α̇ = x2 + u + k1 (−x31 + x2 )
(2) Seleccionemos ahora una función de Lyapunov para el sistema. En este caso,
una apropiada selección resulta la siguiente función de Lyapunov aumentada:
Va (x) = V (x) + z 2 /2. Por consiguiente:
(3) Seleccionemos una apropiada ley de control u que pueda estabilizar al sistema
de segundo orden. Una posible selección, de las muchas que pueden existir,
puede ser:
u = −k2 z − (x1 + x22 + k1 (−x31 + x2 ))
la cual hace que: V̇a (x) = −x41 − kx21 − k2 z 2 ≤ −x41 , lo que asegura la estabilidad
asintótica del sistema. Dado que z = x2 − α = x2 + k1 x1 , la señal de control u
toma la forma:
u = −k2 (x2 + k1 x1 ) − (x1 + x22 + k1 (−x31 + x2 ))
La Fig. 5.1, obtenida ejecutando el programa bscej33.m, muestra las respuestas
x1 (t) y x2 (t) del sistema estabilizado para las siguientes condiciones iniciales:
x1 (0) = 1.5, x2 (0) = 0.8, y los parámetros: k1 = 1.5 y k2 = 2. ♣
En la siguiente sección se desarrolla un sistema de control backstepping apropiado
para controla una gran clase de sistemas representados mediante un modelo dinámico
de Lagrange.
1.5
1
x1
SALIDA
0.5
−0.5
0 1 2 3 4 5 6
0.5
x2
SALIDA
−0.5
−1
0 1 2 3 4 5 6
2
CONTROL u
−2
−4
−6
0 1 2 3 4 5 6
TIEMPO [s]
Fig. 5.1: Respuesta x del sistema ẋ1 = −x31 + x2 , ẋ2 = x22 + u a una señal de control
backstepping.
e = q − qd (5.6)
ż1 = z2 + α1 = −K z1 + z2 (5.11)
Empleando las ecuaciones (5.5) y (5.11), la ecuación (5.12) se puede formular como:
qd1 = A sin W k + Bk
qd2 = A cos W k + Bk
ḃ q̇r + d(q) − Kd (q
u = M(q)q̈ + P(q, q) ḃ − q̇r ) − K1 z1
donde:
" #
Ra
J1 + Jeq + 14 m2 L22 sin2 q2 0
M(q) = nKm KA
0 Ra
nKm KA J2 + Jeq + 14 m2 L22 )
Ra n 2 Km Kb Ra m2 L22 qḃ1 sin q2 cos q2
nKm KA Beq + Ra 2nKm KA
ḃ =
P(q, q) Ra m2 L22 qḃ1 sin q2 cos q2
Ra n 2 Km Kb
4nKm KA nKm KA Beq + Ra
0
d(q) = Ra m2 L2 g sin q2
2nKm KA
Las Figs. 5.2 y 5.3 muestran los resultados de las simulaciones del sistema de
control backstepping diseñado para controlar la posición angular de los dos brazos
del MRE para los casos de seguimiento y regulación respectivamente. Tales Figs. se
obtienen ejecutando los programa bscmres.m (caso seguimiento) y bscmrer.m (caso
regulación) para un tiempo de muestreo de T = 0.01 s. Notar que en ambos casos las
especificaciones de diseño: porcentaje de sobrenivel nulo, error en estado estacionario
nulo y tiempo de estabilización menor de 1 s se cumplen satisfactoriamente. Los
parámetros de sintonización se seleccionaron: k = 5, k1 = 8, ld = 10 y kd = 8, para
ambos casos: regulación y seguimiento. El modelo dinámico del MRE para propósitos
de simulación toma la forma:
q̈ = M−1 [u − Pq̇ − d]
74 Control Backstepping
POSICIÓN q1 [rad]
2
−2
0 2 4 6 8 10 12 14 16 18 20
CONTROL u1 [v]
−2
0 2 4 6 8 10 12 14 16 18 20
TIEMPO [S]
POSICIÓN q2 [rad]
−2
0 2 4 6 8 10 12 14 16 18 20
CONTROL u2 [v]
50
−50
0 2 4 6 8 10 12 14 16 18 20
TIEMPO [S]
Fig. 5.2: Control backstepping de la posición angular de los brazos del MRE. Caso
seguimiento.
POSICIÓN q1 [rad]
1
0.5
0
0 5 10 15 20 25 30 35 40
CONTROL u1 [v]
50
−50
0 5 10 15 20 25 30 35 40
TIEMPO [S]
POSICIÓN q2 [rad]
0.5
0
0 5 10 15 20 25 30 35 40
CONTROL u2 [v]
50
−50
0 5 10 15 20 25 30 35 40
TIEMPO [S]
Fig. 5.3: Control backstepping de la posición angular de los brazos del MRE. Caso
regulación.
Posición x1 [grad]
100
−100
0 2 4 6 8 10 12 14 16 18 20
TIEMPO [s]
CONTROL u1 [V]
10
−10
0 2 4 6 8 10 12 14 16 18 20
TIEMPO [s]
Posición x2 [grad]
100
50
0
0 2 4 6 8 10 12 14 16 18 20
TIEMPO [s]
CONTROL u2 [V]
10
−10
0 2 4 6 8 10 12 14 16 18 20
TIEMPO [s]
Fig. 5.4: Respuesta experimental del sistema de control backstepping del MRE.
Apéndice A
ẋ = f (x, t) (A.1)
se dice que es no autónomo si f depende del tiempo, por ejemplo, si f posee parámetros
variantes con el tiempo. Por consiguiente, un sistema autónomo puede ser descrito
por: ẋ = f (x). Las trayectorias de estado para procesos autónomos son independientes
del tiempo inicial, mientras que para los no autónomos generalmente no lo son.
Un estado o punto de equilibrio xe (realmente un vector constante) de un sistema
autónomo se puede determinar de:
0 = f (xe ) (A.2)
Entonces debemos de hacer ciertas suposiciones con relación a la figura A.1. De-
notemos como B(R) a la región esférica (balón) ||x|| < R y como S(R) a la esfera
||x|| = R en sı́. La región esférica anular cerrada r ≤ ||x|| ≤ R será descrita como B rR .
Asumiremos que en una cierta región esférica Ω : ||x|| < B(R), todas las derivadas
parciales ∂xi /∂xj existen y son continuas en Ω. Entonces diremos que el origen es:
Asintóticamente
estable
Estable
B(r) S(R)
0 r
x0 R
Inestable
H(A)
B(R) T
S(A)
∂V (x)
= ∇ V (x)
∂x
son continuas en una cierta región abierta Ω alrededor del origen.
(b) V (0) = 0
(c) Fuera del origen, pero siempre en Ω, V (x) es positiva. Por consiguiente, el origen
es un mı́nimo aislado de V (x).
A.1 Estabilidad vı́a el Método Directo de Lyapunov 79
V(x1 , x 2) x2
V(x1 , x 2)
x2 x1
x1
Ejemplo A.1
Ejemplo A.2
R i
+
+
u C e RN
- -
Solución: Sumando las corrientes que salen del nodo superior derecho (ver la figura
A.3) produce:
e−u
C ė + + N e3 = 0
R
La energı́a almacenada en el capacitor está dada por V (e) = 21 Ce2 . Para el sistema
no actuado (u = 0) tenemos:
2 1 2
V̇ (e) = Ceė = −e + Ne ≤ 0
R
Ejemplo A.3
K0 B
K1 b(t)
lm
n lm
n lm
n lm
n lm
n lm
n lm
n lm
n lm
n lm
n lm
n lm
n ln
Fig. A.4: Sistema masa–amortiguador–resorte.
Ejemplo A.4
V=0
. . 0
Ω
x0
V = constant
Ω1
VII. Teorema de Inestabilidad. Sea Ω una vecindad del origen. Sea Ω` una
región en Ω. Dada una función V (x, t) en Ω, entonces el equilibrio del origen en el
tiempo t0 es inestable si:
Ejemplo A.5
Determine la estabilidad del sistema autónomo descrito en los ejemplos A.2 y A.3
aplicando el método directo de Lyapunov.
84 El Método Directo de Lyapunov
Solución: Del ejemplo A.2 podemos establecer que la función de Lyapunov V (e) =
1 2
2 Ce → ∞ cuando ||e|| → ∞. Por consiguiente, el sistema autónomo no lineal
descrito en dicho ejemplo es completa (global) asintóticamente estable.
Del ejemplo A.3 podemos establecer que la función de Lyapunov:
1 1 1
V (x) = M ẋ2 + K0 x2 + K1 x4 → ∞
2 2 4
cuando ||x|| → ∞. Por consiguiente, el sistema autónomo no lineal descrito en dicho
ejemplo es completa (global) asintóticamente estable.
Ejemplo A.6
conforme ||x|| → ∞, siempre que α > 0, b(t) > M α, y ḃ(t) < 2K0 . Por consiguiente,
el sistema no autónomo descrito en tal ejemplo es completa (global) asintóticamente
estable.
V̇ (x) ≤ 0 (A.5)
A.1 Estabilidad vı́a el Método Directo de Lyapunov 85
para todo x en Ω` . Sea R el conjunto de todos los puntos dentro de Ω` donde V̇ (x) = 0,
y sea M el más grande conjunto invariante en R. Entonces, cada solución x(t) en Ω `
tiende a M conforme t → ∞.
Ωl
x2
x0
x1
Ejemplo A.7
Observe que V̇ (x) < 0 dentro de un cı́rculo de radio 2. Por consiguiente, usando el
teorema de estabilidad II de Lyapunov, podemos inferir que el origen es asintótica-
mente estable. Para ` = 4, la región Ω` definida por V (x) = x21 +x22 < 4 es acotada y el
conjunto R es el origen, el cual es un conjunto invariante. Por consiguiente, cualquier
trayectoria que se inicia dentro del cı́rculo de radio 2 converge hacia el origen y esta
región constituye el dominio de atracción.
Bibliografı́a
[5] H. Goldstain, John L. Safko and Charles P. Poole Classical mechanics, 3ed.
Addison Wesley, 2001.
[8] Alberto Isidori, Nonlinear Control Systems, 3ed, Springer-Verlag Berlin, 1995.
[13] D. E. Koditschek, “Natural Motion for Robot Arms´´Proc. 23rd I.E.E.E. Conf.
on Decision and Control, Las Vegas, p. 733, 1984.
[14] Jean-Jacques E. Slotine and Weiping Li, Applied Nonlinear Control, Prentice
Hall, 2006, ISBN: 0130408905, ISBN-13: 9780130408907, 978-0130408907.
[16] E. Bailey and A. Arapostathis, “Simple sliding mode control scheme applied to
robot manipulators,” Int. J. Control, vol. 45, No. 4, p. 1197–1209, 1987.
[17] Lin, Y. and E.D. Sontag, Lin, Y. and E.D. Sontag, “A universal formula for
stabilization with bounded controls”, Report 90-10, SYCON-Rutgers Center for
Systems and Control, July 1990.
[18] Jie Yu, Ali Jadbabaie, James Primbs and Yun Huang, “Comparison of nonlinear
control design techniques on a model of the Caltech ducted fan”, Automatica
Volume 37, Issue 12, Pages 1971-1978 , December 2001.
[19] Fang-Shiung Chen and Jung-Shan Lin, “Nonlinear backstepping design of robot
manipulators with velocity estimation feedback,”5th Asian Control Conference,
July 2004, vol. 1, no. 6, pp 351–356. New Jersey 07632, 1989.
[20] M. Vidyasagar, Nonlinear Systems Analysis (Second Edition), Society for Indus-
trial and Applied Mathematics Philadelphia, PA, USA , 2001, ISBN:0898715261.
[21] Katsuhiko Ogata, Modern Control Engineering (5th Edition), Prentice Hall,
2009.
[22] Joseph La Salle and Solomon Lefschetz, Stability by Liapunov’s Direct Method
With Applications, Academic Press new York, London, 1961.