Control No Lineal Multivariable 1ra Edic

CONTROL NO LINEAL
MULTIVARIABLE
APLICACIONES EN TIEMPO REAL
ARTURO ROJAS MORENO, Ph.D.

r
q
i

θ

θo

H
Φi

u1

u2

F Modelado de Sistemas No Lineales

F Control Óptimo Cuadrático
F Control Adaptativo con Modelo Referencial
F Control por Modos Deslizantes
F Control Backstepping
II
CONTROL NO LINEAL MULTIVARIABLE

APLICACIONES EN TIEMPO REAL
c 2011 Arturo Rojas Moreno. Todos los derechos reservados.

Copyright
ISBN
Queda rigurosamente prohibida la reproducción total o parcial de esta obra por cualquier
medio o procedimiento, sin la autorización escrita del propietario del “Copyright”.
Índice general
1. Modelado de Sistemas No Lineales 1

1.1. Modelado Empleando las Leyes de la Fı́sica . . . . . . . . . . . . . . . 1
1.1.1. Manipulador Robótico de 1GDL: MR1 . . . . . . . . . . . . . . 1
1.1.2. Manipulador Robótico con Articulación Elástica (MRAE) . . . 8
1.1.3. Sistema Tanque con Agua . . . . . . . . . . . . . . . . . . . . . 12
1.2. Método de Las Ecuaciones de Lagrange . . . . . . . . . . . . . . . . . 17
1.2.1. Manipulador Robótico Traslacional (MRT) . . . . . . . . . . . 18
1.2.2. Manipulador Robótico Esférico (MRE) . . . . . . . . . . . . . . 25
2. Control Óptimo 33
2.1. Estructura del Sistema de Control Óptimo . . . . . . . . . . . . . . . . 33
2.2. Descripción dinámica del Sistema . . . . . . . . . . . . . . . . . . . . . 34
2.3. El Controlador Óptimo PI . . . . . . . . . . . . . . . . . . . . . . . . . 35
2.4. El Observador Óptimo No Lineal . . . . . . . . . . . . . . . . . . . . . 38
2.5. Procedimiento de Diseño . . . . . . . . . . . . . . . . . . . . . . . . . . 39
2.6. Aplicación en Tiempo Real . . . . . . . . . . . . . . . . . . . . . . . . 40
2.6.1. Control Óptimo del Sistema MRE . . . . . . . . . . . . . . . . 40
3. Control Adaptativo con Modelo Referencial 43

3.1. Estructura de un SCAMR . . . . . . . . . . . . . . . . . . . . . . . . . 43
3.2. SCAMR para Sistemas No Lineales Multivariables . . . . . . . . . . . 44
3.2.1. Diseño del SCAMR . . . . . . . . . . . . . . . . . . . . . . . . 44
3.2.2. El Observador de Velocidad . . . . . . . . . . . . . . . . . . . . 46
3.2.3. Zona–Muerta para Evitar Corrimiento de Parámetros . . . . . 47
3.2.4. Procedimiento de Diseño del SCAMR . . . . . . . . . . . . . . 47
3.3. Aplicaciones en Tiempo Real . . . . . . . . . . . . . . . . . . . . . . . 48
3.3.1. Control Adaptativo del Manipulador Robótico Esférico . . . . . 48
4. Control por Modos Deslizantes 53

4.1. Conceptos Básicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
4.2. Control Deslizante para Sistemas Multivariables . . . . . . . . . . . . . 56
4.2.1. El Sistema a Controlar . . . . . . . . . . . . . . . . . . . . . . . 56
4.2.2. La Superficie de Conmutación . . . . . . . . . . . . . . . . . . . 57
4.2.3. Diseño de la Fuerza de Control Multivariable . . . . . . . . . . 58
4.3. Procedimiento de Diseño . . . . . . . . . . . . . . . . . . . . . . . . . . 60
4.4.1. Control Deslizante del Manipulador Esférico MRE . . . . . . . 61
IV ÍNDICE GENERAL
5. Control Backstepping 67
5.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
5.2. Caracterı́sticas del Modelo . . . . . . . . . . . . . . . . . . . . . . . . . 70
5.3. Diseño Backstepping No Lineal . . . . . . . . . . . . . . . . . . . . . . 71
5.4. Procedimiento de Diseño Backstepping . . . . . . . . . . . . . . . . . . 72
5.5.1. Control Backstepping del Manipulador Esférico MRE . . . . . 73
A. El Método Directo de Lyapunov 77

A.1. Estabilidad vı́a el Método Directo de Lyapunov . . . . . . . . . . . . . 77
A.1.1. Conceptos de Estabilidad . . . . . . . . . . . . . . . . . . . . . 77
A.1.2. Funciones de Lyapunov . . . . . . . . . . . . . . . . . . . . . . 78
A.1.3. Teoremas de Estabilidad de Lyapunov . . . . . . . . . . . . . . 82
A.1.4. Teoremas del Conjunto Invariante . . . . . . . . . . . . . . . . 84
B
. ibliografı́a 87
Capı́tulo 1
Modelado de Sistemas No
Lineales
La dinámica de una gran variedad de sistemas a ser controlados se puede describir

mediante un conjunto de ecuaciones diferenciales. Tal descripción matemática se obtiene
aplicando las leyes de la fı́sicas y de la quı́mica sobre el sistema, tales como la conservación
de la energı́a, las leyes de Newton, entre otras. Para construir un modelo adecuado para
propósitos de control, se requiere conocer bien la dinámica del sistema. No siempre es
mejor que un modelo sea lo más exacto posible a su comportamiento dinámico. Tener en
cuenta que mientras más complejo sea el modelo, más dificultoso será el análisis y diseño
del sistema de control correspondiente. Lo recomendable es que el modelo del sistema
mantenga las caracterı́sticas dinámicas de interés para el rango de operación del sistema
de control a diseñar.
En este capı́tulo se emplean las siguientes estrategias de modelado: aplicación de
las leyes de la fı́sica (sección 1.1) y aplicación de las ecuaciones de Lagrange (sección
1.2). Los modelos dinámicos de los siguientes sistemas prototipo serán desarrollados en
este capı́tulo: Manipulador Robótico de 1 Grado de Libertad (MR1, leyes fı́sicas), MR1
con Articulación Elástica (MRAE, leyes fı́sicas), sistema Tanque con Agua (leyes fı́sicas),
Manipulador Robótico Esférico (MRE, ecuaciones de Lagrange) y Manipulador Robótico
Traslacional (MRT, ecuaciones de Lagrange). En la sección Problemas se propone la
derivación de modelos dinámicos de otros sistemas no lineales.
1.1. Modelado Empleando las Leyes de la Fı́sica

1.1.1. Manipulador Robótico de 1GDL: MR1
El Manipulador Robótico de 1GDL (MR1) mostrado en la Fig. 1.1 es uno de los
sistemas prototipo a ser utilizado en esta publicación para validar vı́a experimentación
algunos de los sistemas de control no lineal desarrollados en esta publicación. La
Fig. 1.2 muestra su esquema de estudio. Este sistema prototipo se compone de un
subsistema eléctrico y un subsistema mecánico. El subsistema eléctrico comprende un
servomotor DC con decodificador de posición (encoder en inglés) incorporado, el cual
se emplea para medir la posición angular del brazo del manipulador en cada instante
de tiempo. El servomotor posee una caja de engranajes para reducir la velocidad en
su eje de salida; de esta manera se facilita el control de posición del manipulador.
2 Modelado de Sistemas No Lineales
Fig. 1.1: El Manipulador Robótico de 1GDL (MR1).
El subsistema mecánico consiste de un brazo accionado por el torque rotacional

generado en el eje de salida del servomotor DC (el actuador). En el extremo libre del
brazo robótico se puede acoplar un efector final, el cual puede ser una pinza para asir
objetos, una herramienta para soldar, una herramienta para pintar, etc. En nuestro
caso usaremos una pinza con dos grados de libertad: un grado para rotar la pinza y
otro para abrirla y cerrarla. Para propósitos de modelado, vamos a suponer que el
efector final y su carga se pueden modelar mediante una masa mh variable. La Tabla
1.1 describe las variables y los valores de los parámetros del manipulador mostrado
en la Fig. 1.2.
El sistema MR1 es del tipo SISO ya que sólo posee una entrada: el voltaje de
control u aplicado a la armadura del servomotor, y una salida: la posición angular θ
del brazo.
Modelo del Subsistema Mecánico
Para modelar el subsistema mecánico del manipulador empleamos la segunda ley

de Newton para los movimientos lineal y rotacional. La aplicación de esta segunda
ley se traduce en una ecuación de balance mecánico. Con respecto a la Fig. 1.2, la
ecuación de balance mecánico en el eje del servomotor articulado al primer engranaje
se formula como:
dθm d 2 θm
Tm = Jm θ̈m + Bm θ̇m + Tg1 θ̇m = θ̈m = (1.1)
dt dt2
donde Jm y Bm representan el momento de inercia y la constante de fricción viscosa

del rotor respectivamente, Tm es el torque del servomotor, Tg1 es el torque de reacción
debido al primer engranaje y θm es la posición angular en el lado del motor. Para los
1.1 Modelado Empleando las Leyes de la Fı́sica 3
Tabla 1.1: Parámetros y variables del brazo robótico de 1GDL (MR1).
Sı́mbolo Descripción Valor Unidades

u Voltaje de entrada al sistema V
KA Ganancia del amplificador 8.5
Va Voltaje de armadura V
Ra Resistencia de armadura 3.5 Ω
La Inductancia de armadura 0.004 H
ia Corriente de armadura A
Km Constante del torque motor 0.0436 N-m/A
Tm Torque motor N-m
TL Torque de carga N-m
τL Torque causado por pesos de la carga N-m
Tg1 Torque de entrada a los engranajes N-m
Tg2 Torque de salida de los engranajes N-m
Jm Inercia del motor 0.00059 kg-m2
Jg Inercia de los engranajes 0.066 kg-m2
JL Inercia de la carga kg-m2
Bm Constante de fricción del motor 0.00014 N-m/rad/s
Bg Constante de fricción en engranajes 0.0124 N-m/rad/s
BL Constante de fricción en la carga 0.0023 N-m/rad/s
mh Masa del efector final 0.1 kg
mb Masa del brazo 0.4 kg
L Longitud del brazo 0.25 m
rh Distancia al centro de masa del efector 0.02 m
Vb Voltaje contra electromotriz V
Kb Constante contra electromotriz 0.0565 V/rad/s
g Aceleración de la gravedad 9.81 m/s2
N1 , N2 N o de dientes de los engranajes N 2 > N1
n Relación de engranajes (n = N2 /N1 ) 18.5
θm Posición angular del motor rad
θ Posición angular de la carga rad
ω Velocidad angular de la carga rad/s
ωm Velocidad angular del motor ωm = nω rad/s
Kw Constante de elasticidad 0.052 N-m/rad
La ia mh
θm mh
ωm

N1
L

+ + θ θ

u KA ω mb L
V
_ _b

L
Tm Bm Tg1
Jm
BL
τ
N2 T Bg TL J
Ra g2 L
Jg
Fig. 1.2: Esquema del Manipulador Robótico de 1GDL.
engranajes de reducción del servomotor podemos formular:

N2 θm
n= = θm = nθ n>1 (1.2)
N1 θ
donde N1 y N2 es el número de dientes de los engranajes y n > 1 es la relación entre
ellos. Para formular la ecuación (1.2) se ha tenido en cuenta que el espacio angular
recorrido por el engranaje de menor radio es n veces mayor que el espacio recorrido
por el engranaje de radio mayor. Por otra parte, el principio de la conservación de la
energı́a establece que el trabajo realizado por el engranaje de la izquierda debe ser
igual al trabajo realizado por el engranaje de la derecha, es decir:
Tg2 θ = Tg1 θm = Tg1 nθ; Tg2 = nTg1 (1.3)
donde Tg2 es el torque de reacción debido al segundo engranaje. El balance mecánico

en el eje articulado al brazo del manipulador produce:
Tg2 = Jg θ̈ + Bg θ̇ + TL (1.4)
donde Jg y Bg representan el momento de inercia y la constante de fricción viscosa

de la caja de reducción respectivamente. El torque de carga TL se formula como (ver
Fig. 1.3):
TL = JL θ̈ + BL θ̇ + τL (1.5)
L
τL = mb g senθ + mh g (L + rh )senθ = Q sen θ (1.6)
2
L
Q = mb g + mh g (L + rh )
2
donde JL y BL representan el momento de inercia y la constante de fricción viscosa
de la carga no lineal (brazo más efector final), g es la constante gravitacional, m b
y mh denotan las masas del brazo y del efector final (esta masa también incluye la
masa de la carga en el efector) respectivamente, y rh denota la distancia desde el
extremo del brazo al centro de masa de mh .
rh
θ _
L
2
mhg
_L τL
2
mb g
Fig. 1.3: Brazo del manipulador robótico de 1GDL.
Notar en (1.6) que el torque τL se debe a las fuerzas ejercidas por los pesos del
brazo y de la esfera. Ası́, el torque mb g L senθ
2 es el producto del peso mb g del brazo
L senθ
por su brazo de palanca 2 , mientras que el torque mh g (L+rh )senθ es el producto
del peso mh g del efector por su brazo de palanca (L + rh )senθ.
El momento de inercia JL de la carga es la suma del momento de inercia del brazo
Jb más el momento de inercia del efector Jh . Por otra parte, el teorema de los ejes
paralelos, establece que el momento de inercia de una masa m alrededor de un eje de
rotación que no pasa por su C.M. está dado por:
J = Jo + m a 2 (1.7)
donde Jo es el momento de inercia de m alrededor del eje de rotación que pasa por
su centro de masa y a es la distancia entre los dos ejes. Asumiendo que la masa
mb del brazo se concentra en su C.M., su momento de inercia con relación a un eje
perpendicular que pasa por su C.M. es [3]:
1
Jbo = mb L2 (1.8)
12
Considerando que la masa del brazo está distribuida a lo largo de su longitud y
aplicando el teorema de los ejes paralelos, el momento de inercia Jb con respecto al
punto de articulación se formula como:
2
L 1
Jb = Jbo + mb = mb L2 (1.9)
2 3
Del mismo modo, asumiendo que la masa mh del efector está concentrada en su C.M.,
entonces:
Jh = Jho + mh (L + rh )2 (1.10)
donde Jho es el momento de inercia del efector con relación a un eje de rotación
que pasa por su C.M. Si consideramos por ejemplo, sin perder generalidad, que el
efector es una masa esférica de radio rh , su momento de inercia alrededor de un eje

de rotación que coincide con su diámetro [3] es:
2
Jho = mh rh2 (1.11)
5
Empleando (1.5), (1.6), (1.4), (1.3) y (1.2) en (1.1) y operando se obtiene:
nTm = Jeq θ̈ + Beq θ̇ + τL = Jeq ω̇ + Beq ω + Q senθ (1.12)
donde:
Jeq = n2 Jm + Jg + JL Beq = n2 Bm + Bg + BL
Las expresiones de Q, Jh y Jb (tener en cuenta que JL = Jh + Jb ) se dan en (1.6),
(1.10) y (1.8) respectivamente.
Modelo del Subsistema Eléctrico

El voltaje de armadura Va viene expresado por (ver la descripción de las variables
y parámetros en la Tabla 1.1):
dia
Va = ia Ra + La + Vb (1.13)
dt
donde ia , Ra y La son la corriente, la resistencia y la inductancia en la armadura
del servomotor respectivamente, y Vb es el voltaje de fuerza contra electromotriz
gobernado por la relación:
Vb = Kb ωm = Kb nω = Kb nθ̇ (1.14)
donde Kb es la constante de fuerza contra electromotriz y ωm es la velocidad angular
del motor. El voltaje de armadura Va es:
Va = K A u (1.15)
donde KA es la ganancia del amplificador.
Conversión de Energı́a Eléctrica en Mecánica

Sabemos que el torque motor Tm (energı́a mecánica) es proporcional a la corriente
de armadura ia (energı́a eléctrica):
Tm = K m i a (1.16)
donde Km es la constante del motor. Reemplazando (1.12) en ( 1.16) se obtiene la
siguiente ecuación de conversión de energı́a eléctrica a energı́a mecánica:
nKm ia = Jeq θ̈ + Beq θ̇ + τL (1.17)
Por otra parte, igualando (1.13) con (1.15) obtenemos:
dia KA Kb n Ra
= u− ω− ia (1.18)
dt La La La
Empleando (1.16) en (1.12) y despejando ω̇ = dω/dt obtenemos:
dω Q Beq nKm
=− senθ − ω+ ia (1.19)
dt Jeq Jeq Jeq
Ecuación de Estado del Sistema MR1 con La 6= 0

Las ecuaciones (1.18) y (1.19) describen el modelo no lineal del sistema de tercer
orden. Eligiendo en dichas ecuaciones como variables de estado: x1 = θ (posición
angular), x2 = θ̇ (velocidad angular) y x3 = ia (corriente de armadura), se obtiene:
ẋ1 = x2
Q Beq nKm
ẋ2 = − senx1 − x2 + x3
Jeq Jeq Jeq
nKb Ra KA
ẋ3 = − x2 − x3 + u (1.20)
La La La
donde la salida es la posición x1 y la señal de control es u (la tensión de armadura).
Ecuación de Estado del Sistema MR1 con La ∼

=0
En la Tabla 1.1 podemos observar que la inductancia de armadura La del ser-
vomotor es bastante pequeña, de modo tal que puede despreciarse sin que se pierda
considerable exactitud en los resultados. Considerando el producto ẋ 3 La = 0 en la
tercera ecuación de (1.20) y despejando la corriente de armadura x 3 resulta:
KA nKb
x3 = u− x2 (1.21)
Ra Ra
Reemplazando (1.21) en la segunda ecuación de (1.20), se obtiene la ecuación de
estado no lineal de orden dos del manipulador:
ẋ1 = x2
ẋ2 = −a1 senx1 − a2 x2 + bu (1.22)
donde:

Q Beq Ra + n2 Km Kb nKm KA
a1 = a2 = b=
Jeq Jeq Ra Jeq Ra
Modelo de Lagrange del Sistema MR1 con La ∼

=0
La ecuación (1.16) tiene la forma de (1.12):
nKm ia = Jeq θ̈ + Beq θ̇ + τL τL = Qsenθ

dia
Si despreciamos la inductancia La en (1.18), entonces el producto La dt iguala a
cero. Por consiguiente:
0 = KA u − Kb n θ̇ − Ra ia
Combinando las dos últimas ecuaciones se obtiene el denominado modelo dinámico
de Lagrange:
M θ̈ + P θ̇ + d = u (1.23)
donde:

Jeq Ra Beq Ra nKb Ra Q
M= P = + d= senθ
nKm KA nKm KA KA nKm KA
Forma Asociada del Sistema MR1 con La ∼

=0
La ecuación (1.23) se puede poner en su denominada forma asociada:
2
X
M θ̈ + P θ̇ + d = hθ̈ + αi fi = hθ̈ + α1 f1 + α2 f2 = u (1.24)
i=1
donde:
Ra Q
h=M α1 = P f1 = θ̇ α2 = f2 = senθ
nKm KA
Forma Asociada del Sistema MR1 con La 6= 0

Definamos y = θ y x = [ y ẏ ÿ y (3) ]. Derivando (1.19) se obtiene:
d3 y Q Beq nKm dia

3
=− cos y ẏ − ÿ + (1.25)
dt Jeq Jeq Jeq dt
Reemplazando (1.18) en (1.25) se obtiene:
d3 y Q Beq nKm KA n2 K m K b nKm Ra

= − cos y ẏ − ÿ + u − ẏ − ia (1.26)
dt3 Jeq Jeq Jeq La Jeq La Jeq La
Despejamos ia de ( 1.19), la reemplazamos en (1.26) y luego reordenamos la ecuación

resultante para obtener la siguiente forma asociada del sistema MR1:
4
X
h y (3) + αi fi (x) = u (1.27)
i=1
donde:
Jeq La Beq La + Ra Jeq
h= α1 =
nKm KA nKA Km

nKb Ra Beq QLa Ra Q
α2 = + α3 = α4 =
KA nKA Km nKA Km nKA Km
f1 = ÿ f2 = ẏ f3 = ẏ cos y f4 = sen y
1.1.2. Manipulador Robótico con Articulación Elástica (MRAE)

La Fig. 1.4 muestra el esquema de estudio Manipulador Robótico con Articulación
Elástica (MRAE) de 1GDL. El efecto del acoplamiento elástico entre el eje de salida
del servomotor con el brazo (o eslabón) del MRAE, se puede modelar mediante un
resorte rotacional con constante de elasticidad Kw .
En la Fig. 1.4, u denota el voltaje de entrada, θ (la salida del sistema) es la posición
angular del brazo de longitud L y masa mb , θm representa la posición angular del eje
del actuador (el servomotor DC) antes de la caja de reducción. Al extremo del brazo
se puede articular un efector final, como en el caso del manipulador de 1GDL. La
Tabla 1.1 también describe las variables y los valores de los parámetros del sistema
mostrado en la Fig. 1.2.
La ia mh
θm mh
ωm
$%
%
$%$% $%
$% %$
+ + $ %$%$ N1
θ L θ
&'
'
& ' &'
& '&'& /./. 1101K*+ w-,-,
KA ω mb
_
u Vb
.
./ ./
. *
"
!!#
"!! #!" !!!
L
_
( (
) *

* ( ) 00 ***+++ -,-,
!
L" " !
!# !#" !!

* τ !
Tm Bm Tg1 (
() ((
) * )(() *+
Jm BL
Ra N 2 T Bg TL J
g2 L
Jg
Fig. 1.4: Esquema de estudio del Manipulador Robótico con Articulación Elástica
(MRAE).
Ecuaciones Dinámicas del MRAE

El balance mecánico en el eje del servomotor articulado al primer engranaje se
expresa como:
Tm = Jm θ̈m + Bm θ̇m + Tg1
donde Jm y Bm representan el momento de inercia y la constante de fricción viscosa
del rotor, Tm es el torque del servomotor y Tg1 es el torque de reacción debido al
primer engranaje. El balance mecánico del eje articulado a la carga se expresa como:

θ̈m θ̇m θm
Tg2 = Jg + Bg + Kw −θ
n n n

en donde Kw θnm − θ es el torque originado por el acoplamiento elástico, Tg2 es el
torque debido al segundo engranaje, n = N2 /N1 denota la relación de transmisión de
los engranajes, y Jg y Bg representan el momento de inercia y la constante de fricción
viscosa de la caja de reducción respectivamente. Asumiendo engranajes ideales, la
conservación de la energı́a requiere que el trabajo realizado por cada engranaje debe
de ser el mismo, a saber:
θm
Tg1 θm = Tg2
n
Empleando las relaciones anteriores, la ecuación que gobierna el torque servomotor
se formula como:
! !
Jeq θ̈m Beq θ̇m K w θm
Tm = + + −θ (1.28)
n n n n n n
Jeq = n2 Jm + Jg Beq = n2 Bm + Bg
La ecuación que gobierna la dinámica del brazo del manipulador (ver Fig. 1.3) se
puede expresar como:

θm 1
Kw − θ = JL θ̈ + BL θ̇ + mb gLsen θ + mh g(L + rh )sen θ (1.29)
n 2
donde JL y BL representan el momento de inercia y la constante de fricción viscosa

de la carga no lineal (brazo más efector), g es la constante gravitacional, m b y mh
(esta masa también incluye la masa de la carga) denotan la masa del brazo y del
efector respectivamente, rh es la distancia al C.M. del efector y, 21 mb g(L + rh )sen θ y
mh gL sen θ son los torques debido a los pesos del brazo y del efector respectivamente.
Los momentos de inercia Jh y Jb (se sabe que JL = Jh +Jb ), asumiendo que las masas
mh y mb se concentran en sus respectivos C.M., se formularon en (1.9) y (1.10).
Para completar el modelado de la parte eléctrica del sistema MRAE, podemos
aseverar que:
dia
Ra ia + La + Vb = K A u (1.30)
dt
donde KA es la ganancia del amplificador y Vb es el voltaje de la fuerza contra
electromotrı́z y responde a la relación:
Vb = Kb θ̇m (1.31)
donde Kb es la constante de fuerza contra electromotriz. El torque servomotor T m es
también proporcional a la corriente ia , es decir:
Tm = K m i a (1.32)
donde Km es la constante del servomotor.
Modelo de Lagrange del MRAE

Las ecuaciones (1.28) y (1.29) se pueden reordenar en forma matricial, con el
propósito de obtener el denominado modelo dinámico de Lagrange del sistema MRAE:
T = Hq̈ + Cq̇ + d (1.33)
donde:
   Jeq  θ̈m
  Beq  θ̇m
  Kw θm

Tm n 0 n n 0 n n n −θ
 = 

 
+ 

 
+ 
0 0 JL θ̈ 0 BL θ̇ d2

1 θm
d2 = mb + mh Lg sen θ − Kw −θ
2 n
Despreciando la inductancia de armadura La en (1.30), y despejando ia se obtiene:
Kb KA
ia = − θ̇m + u (1.34)
Ra Ra
Sustituyendo ia en Tm = Km ia de (1.33) y despejando u, el modelo de Lagrange
toma una nueva forma:
u = Mq̈ + Pq̇ + d (1.35)

     θ̈     θ̇   
u m11 0 m
n 
p11 0 m
n 
d1
 =       
 +   + (1.36)
0 0 JL θ̈ 0 BL θ̇ d2

Ra Jeq nKb Ra Beq Ra Kw θm
m11 = p11 = + d1 = −θ
nKA Km KA nKA Km nKA Km n
Modelo del MRAE en el Espacio de Estado

Seleccionando como variables de estado: x1 = θ, x2 = θ̇, x3 = θm /n, x4 =
θ̇m /n, y x5 = ia , entonces el vector de estado del sistema es de orden 5. Luego,
las ecuaciones (1.28), (1.29) y (1.30) (sin despreciar la inductancia L a ) producen la
siguiente ecuación de estado no lineal:
   
ẋ1 f1 (x, u)
 ẋ2   f2 (x, u) 
   
ẋ =    
 ẋ3  = f (x, u) =  f3 (x, u)  (1.37)
 ẋ4   f4 (x, u) 
ẋ5 f5 (x, u)
f1 (x, u) = x2
Kw BL Kw Lg mb
f2 (x, u) = − x1 − x2 + x3 − + mh sen x1
JL JL JL JL 2
f3 (x, u) = x4
Kw Kw Beq nKm
f4 (x, u) = x1 − x3 − x4 + x5
Jeq Jeq Jeq Jeq
nKb Ra KA
f5 (x, u) = − x4 − x5 + u
La La La
donde hemos usado el hecho de que ẋ1 = x2 y ẋ3 = x4 . Si la salida del sistema es
y = θ, entonces la ecuación de salida del MRAE resulta:
y = h(x) = Cx = [1 0 0 0 0] x (1.38)
Despreciando la inductancia de armadura La en (1.37), lo que equivale a eliminar
un elemento almacenador de energı́a independiente (por consiguiente, eliminar una
variable de estado), entonces:
nKb KA
La ẋ5 = 0 = −nKb x4 − Ra x5 + KA u ⇒ x5 = − x4 + u
Ra Ra
Reemplazando x5 en la cuarta ecuación de (1.37), se obtiene una ecuación de estado
no lineal de orden 4:    
ẋ1 f1 (x, u)
 ẋ2   f2 (x, u) 
   
 ẋ3  =  f3 (x, u) 
(1.39)
ẋ4 f4 (x, u)
f1 (x) = x2
Kw BL Kw Lg mb
f2 (x) = − x1 − x2 + x3 − + mH sen x1
JL JL JL JL 2
f3 (x) = x4
2
Kw Kw n Km Kb Beq nKm KA
f4 (x) = x1 − x3 − + x4 + u
Jeq Jeq Jeq Ra Jeq Jeq Ra
La salida del sistema en este caso se expresa como:
y = h(x) = Cx = [1 0 0 0] x (1.40)
1.1.3. Sistema Tanque con Agua

El sistema tanque con agua estudiado aquı́ se muestra en la Fig. 1.5. La Fig. 1.6
muestra el esquema para estudio de este sistema, donde el flujo de agua frı́a q i que
ingresa al tanque se calienta en forma controlada mediante el calor Φ i entregado por
la resistencia eléctrica. El agua calentada puede ser usado luego por los consumidores.
Fig. 1.5: Sistema tanque con agua.
Este sistema es multivariable porque posee dos entradas y dos salidas. Las varia-
bles de entrada (las fuerzas de control) son el flujo de agua qi y el calor Φi suministrado
al agua por la resistencia eléctrica. Las variables de salida (las señales controladas)
son el nivel H del lı́quido en el tanque y la temperatura de salida θo del agua calen-
tada. La Tabla 1.2 describe las variables y los valores de los parámetros del sistema
tanque de agua.
Modelo Lineal del Sistema Nivel

El volumen de agua acumulado en el tanque se modela como:
dh
A = Aḣ = qi − qo (1.41)
dt
Considerando un flujo laminar de salida:
h
qo = (1.42)
Rh
Tabla 1.2: Parámetros y variables del sistema tanque con agua.
Sı́mbolo Descripción Valor Unid.

dA Diámetro del tanque 0.265 m
A Sección circular del tanque 0.055 m2
h Nivel del agua en el tanque m
H Estado estacionario de h 0.12 m
qi Flujo de agua de entrada al tanque m3 /s
qo Flujo de agua de salida del tanque m3 /s
Q Estado estacionario de qo y qi 0.16 m3 /h
Rh Resistencia hidráulica del tanque: Rh = H/Q 2700 s/m2
ρ Densidad del agua 1000 kg/m3
do Diámetro del orificio de salida 0.0127 m
Ao Sección del orificio de salida 0.000126 m2
Av Sección de la vena contracta m2
Cc Coeficiente de corrección entre Ao y Av 0.6 a 1
Cv Coeficiente de corrección por pérdidas 0.8 a 0.99
Cd Coeficiente de descarga:Cd = Cv Cc 0.5
√
a Factor de flujo turbulento: a = Cd AO 2g 0.00028 m2.5 /s
J
Cp Calor especı́fico del agua 4186.8 kg K
Ct Capacitancia térmica del tanque: Ct = ρAHCp 27633 K/W
Rt Resistencia térmica del tanque: Rt = C 1ρQ 0.0054 K/W
p
θa Temperatura ambiente oC
Θ Temperatura en el tanque en estado estacionario oC
θo Temperatura del agua de salida oC
Φi Calor entregado por la resistencia eléctrica W

Φi Calor en estado estacionario 1540 W
ΦT Calor del agua en el tanque W
Φo Calor que toma el flujo de salida W
Φs Calor que se libera al exterior: Φs = ΘoR−Θt
a
W
Φc Calor que trae consigo el flujo de entrada W
66
565 θi
θa
5 qi
9:3 9 9
A
9:3 9:3 22 4242
43
:3
9 :3 3
: 9 :3 3
: 9 :3 9 :3 9 :9:9 43 2432 4242
43
θo
H
Φi
7 87
83 qo
Ao
Fig. 1.6: Esquema de estudio del sistema tanque con agua.
La resistencia hidráulica Rh se calcula de la relación:

H
Rh = (1.43)
Q
donde H y Q son los valores estacionarios de h y qo respectivamente. Luego, la
ecuación de estado del sistema nivel toma la forma:
1 1
ḣ = − h + qi (1.44)
ARh A
y su función de transferencia resulta:
h(s) Rh
= (1.45)
qi (s) ARh s + 1
donde el producto ARh es la constante de tiempo en s del sistema nivel.
Determinación Experimental de Rh
La válvula de control empleada para regular la entrada de agua al tanque es del
tipo VXN015F250, con diámetro nominal DN15, conexión G1B y actuador motórico.
La abertura máxima se obtiene alimentando con 10 V al actuador, la cual corresponde
a un flujo de 0.4 m3 /h, de acuerdo al manual del fabricante. La mı́nima abertura,
con 0 V, corresponde a un flujo de 0 m3 /h. Esto significa que para una abertura de
1 V el flujo que pasa por la válvula es de 1/90000 m3 /s.
Asumiendo una variación lineal entre el flujo qi que pasa por la válvula y la altura
h del tanque, se realizó el siguiente experimento. Con una abertura de válvula para
4 V (0.16 m3 /h), se abrió convenientemente la válvula de descarga hasta lograr una
altura estable de 0.12 m. Luego, con una abertura de válvula para 6 V (0.24 m 3 /h), se
siguió abriendo la válvula de descarga hasta lograr una altura de 0.18 m. Empleando
la relación:
H
Rh =
Q
la resistencia hidráulica para cada punto resultó aproximadamente R h = 2700 s/m2 .
Se asume que los valores en estado estacionario de h y qi son H = 0.12 m y Q = 0.16
m3 /h respectivamente.
Modelo Lineal del Sistema Temperatura

El calor en el interior del tanque se modela aproximadamente como:
dθo
Ct = Φi − Φo (1.46)
dt
donde:
Φo = C p ρ Q θo (1.47)
Por consiguiente, la ecuación de estado del sistema temperatura resulta:
1 1
θ˙o = − θo + Φi (1.48)
Rt Ct Ct
donde la capacitancia térmica Ct y la resistencia térmica Rt se calculan de:
1
Ct = ρAHCp Rt = (1.49)
Cp ρQ
La función de transferencia del sistema temperatura toma la forma:
θo (s) Rt
= (1.50)
Φi (s) Ct Rt s + 1
donde el producto Ct Rt es la constante de tiempo de dicho sistema.
Ecuación de Estado Lineal del Sistema Tanque

Juntando las ecuaciones (1.44) y (1.48), las ecuaciones de estado y de salida
lineales del sistema tanque con agua resulta:
ẋ = A x + B u y = Cx (1.51)

x1 h u1 qi y1 h
x= = u= = y= =
x2 θo u2 Φi y2 θo
1 1
− AR 0 A 0 1 0
A= h B= C=
0 − Rt1Ct 0 C1t 0 1
Modelo No Lineal del Sistema Nivel

El volumen de agua acumulado en el tanque se modela como:
dh
A = Aḣ = qi − qo (1.52)
dt
donde qi y qo son los flujos de agua de entrada y salida respectivamente y h es la
altura del tanque. Para orificios circulares pequeños, se puede formular [4]:
p √ p
qo = Cd Ao 2gh = a h; a = Cd Ao 2g (1.53)
donde g es la aceleración de la gravedad, Cd es el coeficiente de descarga y Ao es la

sección del orificio de salida. Se sabe además que [4]:
Cd = CvCc ; 0.8 ≤ Cv ≤ 0.99; 0.6 ≤ Cc ≤ 1 (1.54)

donde Cv es el coeficiente de corrección por pérdidas y Cc es el coeficiente de correc-

ción entre Ao y Av (la sección de la vena contracta). Para nuestro estudio tomaremos
Cd =0.5. De (1.52) se obtiene la primera ecuación de estado:
a√ 1
ḣ = − h + qi (1.55)
A A
Modelo No Lineal del Sistema Temperatura

El balance de energı́a térmica dentro del tanque se formula:
ΦT = −Φo − Φs + Φc + Φi (1.56)
donde Φi es calor entregado por la resistencia eléctrica, ΦT es el calor del agua en
el tanque, Φo es el calor que toma el flujo de salida, Φs es el calor que se libera
al exterior y Φc es el calor que trae consigo el flujo de entrada. Las relaciones que
gobiernan tales flujos calorı́ficos:
dθo
ΦT = AhρCp
√dt
Φo = Cp ρθo a h
θo − θ a
Φs =
Rt
Φc = Cp ρθi qi (1.57)
Los parámetros que aparecen en (1.57) se describen en la tabla 1.2. La ecuación de
estado del sistema temperatura se obtiene despejando dθ
dt = θ̇o de (1.56):
o
a √ θo − θ a θi 1
θ̇o = − θo h − + qi + Φi (1.58)
Ah AhρCp Rt Ah AhρCp
Ecuación de Estado No Lineal del Sistema Tanque

Seleccionemos como variables de estado q1 = h, q2 = θo y como entradas de control
u1 = qi , u2 = Φi . Introduciendo tales variables en ( 1.55) y (1.58), las ecuaciones de
estado del sistema resultan:

q̇1 f1 G11 0 u1
= + (1.59)
q̇2 f2 G21 G22 u2
a√ a √ q2 − θ a
f1 = − q1 f2 = − q2 q1 −
A Aq1 AρCp Rt q1
1 θi 1
G11 = G21 = G22 =
A Aq1 AρCp q1
Modelo de Lagrange del Sistema Tanque

Para obtener el modelo de Lagrange del sistema tanque, despejamos u 1 de la
primera relación de (1.59) y lo reemplazamos en la segunda relación de dicha ecuación.
El resultado es la siguiente ecuación de estado:
a √ q2 − θ a θi √ 1
q̇2 = − q2 q 1 − + (Aq̇1 + a q1 ) + u2 (1.60)
Aq1 AρCp Rt q1 Aq1 AρCp q1
1.2 Método de Las Ecuaciones de Lagrange 17
Empleando la primera relación de (1.59) y la ecuación (1.60), se obtiene el modelo

de Lagrange del sistema:

u1 P11 0 q̇1 d11
= + (1.61)
u2 P21 P22 q̇2 d21
P11 = A P21 = −AρCp θi P22 = AρCp q1

√ √ √ q2 − θ a
d11 = a q1 d21 = Cp ρa q1 q2 − Cp ρa q1 θi +
Rt
Determinación del Estado Estacionario Φi

El actuador que emplea el sistema de control de temperatura trabaja en el rango
de voltaje de 1 a 5 V. Con 5 V, el calefactor proporciona un flujo máximo de calor de
7700 W, de acuerdo al manual del fabricante. Se asume una correspondencia lineal
entre el voltaje que ingresa al actuador y el flujo de calor entregado. Entonces, para
subir 1 V en dicho actuador (de 1 a 2 V o de 4 a 5 V por ejemplo), se debe de
proporcionar 7700/4 = 1925 W. Empleando esta escala se puede fijar el valor de Φ i .
1.2. Método de Las Ecuaciones de Lagrange

Las ecuaciones diferenciales que gobiernan el movimiento de complicados sistemas,
se pueden obtener empleando las ecuaciones de Lagrange, las cuales se derivan de las
leyes de Newton del movimiento. El método de las ecuaciones de Lagrange considera
cantidades escalares (energı́as potencial y cinética) en lugar de vectores (fuerzas y
torques), minimizando ası́ la necesidad de complicados diagramas vectoriales.
El modelo dinámico del sistema obtenido con el método de las ecuaciones de
Lagrange se denomina el modelo de Lagrange. Este modelo también nos permite de-
terminar el modelo en el espacio de estado. El método en cuestión requiere de la
representación del sistema mediante un conjunto de coordenadas generalizadas q i
(i = 1, 2, . . . , r), una para cada grado de libertad independiente del sistema. Luego,
la energı́a cinética V y la energı́a potencial U se formulan en términos de tales coorde-
nadas y de sus derivadas con el fin de establecer la función Lagrangiana del sistema,
la cual toma la forma:
L = V (q1 , . . . , qr , q̇1 , . . . , q̇r ) − U (q1 , . . . , qr , q̇1 , . . . , q̇r ) (1.62)
Notar en la ecuación (1.62) que L depende de las variables q1 , . . . , qr , q̇1 , . . . , q̇r . Por
otra parte, de acuerdo al principio de la mı́nima acción de Hamilton para sistemas
conservativos, la integral I definida por:
Z t2
I= L(q1 , . . . , qr , q̇1 , . . . , q̇r )
t1
es un extremo para la trayectoria de movimiento del sistema desde el tiempo t 1 hasta

el tiempo t2 . En adición, la variación de I es igual al trabajo realizado por fuerzas
externas. Basado en el principio de Hamilton, se puede demostrar que las ecuaciones
que gobiernan el movimiento de un sistema dinámico constituyen las ecuaciones de

Lagrange [5], [6]:
d ∂L ∂L
− = Qi i = 1, 2, . . . , r (1.63)
dt ∂ q̇i ∂qi
donde Qi indica las fuerzas y torques generalizados que son externos al sistema o no
son obtenibles a partir de una función potencial escalar. Si asignamos una variable de
estado para cada coordenada generalizada qi y otra para su derivada q̇i , tendremos
entonces 2r ecuaciones diferenciales de segundo orden de la forma dada en (1.63)
correspondientes al sistema de r grados de libertad.
1.2.1. Manipulador Robótico Traslacional (MRT)

Descripción del Sistema
La Fig. 1.7 ilustra el manipulador robótico traslacional (MRT) de 2 GDL, mien-
tras que la Fig. 1.8 muestra el esquema de estudio de este sistema, en donde M1 es
un servomotor DC que posee un mecanismo de reducción por engranajes y un deco-
dificador óptico y está articulado a una polea de radio rp . Esta polea usa un cable
para transmitir la fuerza F para accionar el movimiento de traslación de un carro de
masa mc montado sobre un par de rieles a lo largo de un eje x. M2 es también un
servomotor similar a M1 , empleado para accionar el movimiento rotatorio del brazo
(el eslabón) del MRT alrededor de una articulación ubicada en el centro de masa del
carro. Dado que M1 y M2 son similares, entonces poseen los mismos parámetros.
Fig. 1.7: MRT: Manipulador robótico traslacional.
En la Fig. 1.8, θ es la posición angular del brazo de longitud L y masa ma , r es la

posición longitudinal del carro y Ff es la fuerza de fricción opuesta al movimiento del
carro. Al extremo del brazo se puede articular una mano o efector final de longitud
Lh y masa mh para diferentes propósitos. El sistema MRT es multivariable cuadrado,

denominado ası́ por poseer dos entradas: los voltajes u1 y u2 aplicados a los terminales
de las armaduras de M1 y M2 respectivamente, y dos salidas: r y θ. La tabla 1.3
muestra los valores de los parámetros del sistema MRT.
Lh
y EFECTOR
m h FINAL
BRAZO
ma
L bcos θ
M1 POLEA θ ><
>< >> mp
;=<
=<
;< =; ?<
>?<?>?
=; =;=; PIVOTE
@A<
A<
@A@<A< @A<
@A< A@A@ CARRO ?<?
@ A@ x rp
M2 F
B< B
B<C< <
C B
B C< <
C B
B C< <
C B
B C< <
C B
B C< <
C B
B C< <
C FCB<
f B<
B CB<C< C B
B C< <
C B
B C< <
C B C< B <
C B C< B <
C B C< B <
C B
B C< <
C B
B C< <
C B
B C< <
C BC<
B C< BC<
B C< BC<
B C< BC<
B C< BC<
B C< BC<
B C< BC<
B C< B CBCB
r L b sen θ
Fig. 1.8: El manipulador robótico traslacional (MRT).
Ecuaciones de Energı́a del MRT

Ecuaciones de Energı́a del Carro
El carro está confinado a moverse en la dirección horizontal x (ver Fig. 1.8). Su
energı́a cinética V1 y su energı́a potencial U1 vienen dadas por:
1
V1 = mc ṙ2 U1 = 0 (1.64)
2
Ecuaciones de Energı́a del Brazo

Sean ma y mh las masas del brazo y del efector más su carga respectivamente.
Asumiendo que el brazo y el efector final forman una unidad de masa mb = ma + mh
y longitud Lb = L + Lh , donde Lh es mucho menor que L por conveniencia, la energı́a
cinética almacenada en el brazo se formula aproximadamente como:
1 1
V2 = Jb θ̇2 + mb ẋ2 + ẏ 2 (1.65)
2 2
De acuerdo a la Fig. 1.8:
Lb Lb
x≈r+ sen θ y≈ cos θ (1.66)
2 2
El momento de inercia Jb , según la referencia [3], se calcula como:
1
Jb = mb L2b mb = m a + m h Lb = L a + L h (1.67)
3
Tabla 1.3: Parámetros valorados del sistema MRT. La abreviatura C.M. significa
Centro de Masa.
Sı́mbolo Descripción Valor Unidades
u1 , u2 Voltaje de entrada al sistema V
Va1 , Va2 , Voltaje de armadura V
Ra Resistencia de armadura 3.5 Ω
La Inductancia de armadura 0.002 H
ia1 , ia2 Corriente de armadura A
Km Constante del torque motor 0.0421 N-m/A
Tm1 , Tm2 Torque motor N-m
Tg1 , Tg2 Torque en los engranajes N-m
T Torque de carga N-m
Jm Momento de inercia del motor 0.0003 kg-m2
Jg Momento de inercia de los engranajes 0.053 kg-m2
Jp Momento de inercia de la polea kg-m2
Jb Momento de inercia del brazo kg-m2
Jeq Momento de inercia equivalente kg-m2
Beq Constante de fricción equivalente N-m-s/rad
Bm Constante de fricción del motor 0.0001 N-m/rad/s
Bg Constante de fricción engranajes 0.01 N-m-s/rad
Bp Constante de fricción en la polea 0.006 N-m-s/rad
F Fuerza aplicada al carro N
Ff Fuerza de rozamiento (Ff = Fc ṙ) N
Fc Constante de fricción del carro 2.81 kg/s
mh Masa del efector 0.15 kg
ma Masa del brazo 0.8 kg
mc Masa del carro 0.95 kg
mp Masa de la polea 0.3 kg
rp Radio de la polea 0.05 m
r Posición del carro m
L Longitud del brazo m
Lb Longitud del brazo más efector 0.225 m
Vb1 , Vb2 Voltajes contraelectromotrices V
Kb Constante contraelectromotriz 0.0565 V-s/rad
N1 , N2 N o de dientes de los engranajes N 2 > N1
n Relación de engranajes (n = N2 /N1 ) 12.5
θ, θm Posición angular: brazo y motor rad
ω, ωm Velocidad angular: carga y motor rad/s
La energı́a potencial almacenada en el brazo se puede expresar como:
Lb
U2 ≈ m b g cosθ (1.68)
2
Las Ecuaciones de Lagrange del MRT

Reemplazando (1.66) en (1.65), efectuando las operaciones indicadas y simplifi-
cando, la función de Lagrange L = V − U = (V1 + V2 ) − (U1 + U2 ) toma la forma:

1 1 L2 1 1
L = (mc + mb )ṙ2 + Jb + b θ̇2 − mb Lb ṙθ̇ cos θ − mb Lb g cos θ (1.69)
2 2 2 2 2
Las ecuaciones de Lagrange para las coordenadas generalizadas r y θ del MRT se

formulan como:

d ∂L ∂L
− = F − Ff
dt ∂ ṙ ∂r
(1.70)

d ∂L ∂L
− =T (1.71)
dt ∂ θ̇ ∂θ
donde F es la fuerza generada para mover al carro, Ff es la fuerza de fricción actuando

sobre las ruedas del carro, Fc es la constante de fricción y T es el torque generado para
accionar el brazo. Reemplazando L ( ecuación (1.73)) en (1.70) y (1.71) y operando,
se obtiene:
Lb Lb
F = (mc + mb )r̈ − mb θ̇2 senθ + mb θ̈ cos θ + Ff ṙ (1.72)
2 2
2
Lb Lb Lb
T = mb r̈ cos θ + mb + Jb θ̈ − mb senθ (1.73)
2 4 2
Partiendo de (1.72) y (1.73) podemos determinar el modelo de Lagrange del sistema
MRT. Sin embargo, si estamos interesados en tener como fuerzas de control los volta-
jes de armadura u1 y u2 en lugar de F y T respectivamente, entonces se requiere
modelar los susbsistemas eléctricos del sistema como sigue.
Modelado del Servomotor M1 Accionando la Polea

La Fig. 1.9 muestra el servomotor M1 articulado a la polea. Despreciando la
inductancia de armadura La , el voltaje de entrada KA u1 aplicado a la armadura es:
Ra ia1 + Vb1 = KA u1 (1.74)
El voltaje de fuerza contra electromotriz es proporcional a la velocidad del servomo-

tor, es decir:
Vb1 = Kb θ̇m1 (1.75)
La ecuación del torque motor Tm1 está dada por (ver Fig. 1.9):
Tm1 = Jm θ̈m1 + Bm θ̇m1 + Tg1 (1.76)

La i a1
θ m1
ωm1
DE<
E<
DED<E< DE<
DE< EDED N1 Jp
+ + D ED θ1
ω1 Bp
u KA FG<
G<
F G< FG<
F GFGF J< JJ< JJ<
J<K< K K< K KJJK
V b1
_1 _ rp
Tm1 Bm Tg1 IH<
H I<
I< HI<
H I< HI<
H IHIH
Jm F
Ra N2 Tg2 Bg
Jg
Fig. 1.9: Servomotor M1 articulado a la polea.
El torque Tg2 requerido para mover a la polea se expresa como:
θ̈m1 θ̇m1
Tg2 = nTg1 = (Jg + Jp ) + (Bg + Bp ) + F rp (1.77)
n n
donde n > 1 es la relación de dientes de los engranajes del mecanismo de reducción,
Jm , Jg y Jp son los momentos de inercia de la armadura, del mecanismo de reducción
y de la polea respectivamente, mientras que Bm , Bg y Bp son las constantes de
fricción de la armadura, del mecanismo de reducción y de la polea respectivamente.
La relación Tg2 = nTg1 se obtiene asumiendo que los engranajes son ideales. En esta
situación, el principio de conservación de energı́a requiere que:
θm1
Tg1 θm1 = Tg2
n
Asumiendo que la polea es un disco que gira sobre su eje, su momento de inercia se
puede calcular como:
Jp = mp rp2 /2; (1.78)
El torque servomotor Tm1 es proporcional a ia1 :
Tm1 = Km ia1 (1.79)
El movimiento rotacional de la polea se puede transformar en el movimiento trasla-

cional del carro usando la relación (ver Fig. 1.9):
θm1
r= rp (1.80)
n
Usando las ecuaciones (1.74), (1.75), (1.76), (1.77), (1.79) y (1.80) se obtiene:

Km KA Jeq1 Beq1 nKm Kb
F = u1 − r̈ − + ṙ (1.81)
rp Ra nrp2 nrp2 nrp2
donde:
Jeq1 = n2 Jm + Jg + Jp Beq1 = n2 Bm + Bg + Bp
Modelado del Servomotor M2 Accionando el Brazo

La Fig. 1.10 muestra al servomotor M2 articulado al punto pivote localizado en
el centro de masa del carro. Sabemos que M1 y M2 poseen los mismos parámetros
por ser similares. Despreciando la inductancia de armadura La , podemos formular:
Ra ia2 + Vb2 = KA u2 (1.82)
donde:
Vb2 = Kb nθ̇ (1.83)
La ecuación del torque motor Tm2 es (ver Fig. 1.10):
La i a2
θm
ωm
LM
M
LMLM LM
LM ML
+ + L MLML N1
Articulación
u2 KA V b2 NO
O
N O NO
N ONON RS
S
RSRS R
S RS RS
S
R SRSR
_ _ R S R SR
Tm2 Bm Tg1 P
PQ PQ
P Q PQ
P QPQP θ
Jm
Ra N2 Tg2 Bg ω
Jg
Fig. 1.10: Servomotor M2 articulado al punto pivote del carro
Tm2 = Jm nθ̈ + Bm nθ̇ + Tg1 (1.84)
El torque Tg2 requerido para mover el brazo se expresa como:
Tg2 = nTg1 = Jg θ̈ + Bg θ̇ + T (1.85)
donde T es el torque de carga. El torque motor Tm2 es proporcional a ia2 :
Tm2 = Km ia2 (1.86)
Empleando las ecuaciones (1.82), (1.83), (1.84), (1.85) y (1.86) se puede demostrar
que:
n2 K m K b nKm KA
T = −Jeq2 θ̈ − Beq2 + θ̇ + u2 (1.87)
Ra Ra
donde:
Jeq2 = n2 Jm + Jg Beq2 = n2 Bm + Bg
Modelo Dinámico de Lagrange del MRT

Igualando (1.72) con (1.81) y (1.73 ) con(1.87) el modelo de Lagrange del sistema
MRT toma la forma:
u1 = M11 r̈ + M12 θ̈ + P11 ṙ + P12 θ̇ (1.88)

u2 = M21 r̈ + M22 θ̈ + P22 θ̇ + d21 (1.89)
Las ecuaciones (1.88) y (1.89) se pueden transformar en su forma matricial como

sigue:

q1 r u1
M(q)q̈ + P(q, q̇)q̇ + d(q) = u q= = u= (1.90)
q2 θ u2
donde:

M11 M12 P11 P12 0
M= P= d(q) =
M21 M22 0 P22 d21

Ra rp Jeq
M11 = mc + m b + 2
nKm KA rp
Ra rp mb Lb
M12 = cos θ
2nKA Km
Ra mb Lb
M21 = cos θ
2nKm KA

Ra mb L2b
M22 = + Jb + Jeq
nKA Km 4

Ra rp Beq n2 K m K b
P11 = Fc + 2 +
nKm KA rp Ra rp2
Ra rp mb Lb
P12 = − θ̇senθ
2nKA Km

Ra n2 K m K b
P22 = Beq +
nKA Km Ra
Ra mb Lb g
d21 = − senθ
2nKA Km
Ecuación de Estado del MRT

Seleccionemos como variables de estado: x1 = r, x2 = θ, x3 = ṙ y x4 = θ̇. Por
consiguiente, las dos primeras ecuaciones de estado son: ẋ1 = x3 , ẋ2 = x4 . Las otras
dos ecuaciones de estado no lineales se deducen despejando q̈ = [ẋ3 ẋ4 ]T de (1.90),
resultando:
ẋ3 = M22 (−P11 x3 − P12 x4 + u1 )/den − M12 (−P22 x4 − d21 + u2 )/den
ẋ4 = −M21 (−P11 x3 − P12 x4 + u1 )/den + M11 (−P22 x4 − d21 + u2 )/den
den = M11 M22 − M12 M21 (1.91)
Haciendo en la ecuación (1.90) las aproximaciones siguientes: cos θ ∼ = 1 en M12 y M21 ,
θ̇senθ ∼
= θ̇θ ∼
= 0 en P 12 y senθ ∼
= θ en d 21 , la ecuación de estado lineal del sistema
MRT resulta:
ẋ = A x + B u y = Cx (1.92)
donde:
 
0 0 1 0
1  0 0 0 1 

A=
den  0 M 12 d21 −M 22 P 11 −(M 22 P 12 − M 12 P 22 ) 
0 −M 11 d21 M 21 P 11 (M 22 P 12 − M 11 P 22 )
 
0 0
1  0 0 
 1 0 0 0
B=  C= den = M 11 M 22 −M 12 M 21
den M 22 −M 12  0 1 0 0
−M 21 M 11
En las relaciones anteriores:
Ra rp mb Lb
M 11 = M11 M 12 =
2nKA Km
Ra mb Lb
M 21 = M 22 = M22
2nKm KA
P 11 = P11 P 12 = 0
Ra mb Lb g
P 22 = P22 d21 = −
2nKA Km
1.2.2. Manipulador Robótico Esférico (MRE)

Descripción del MRE
La Fig. 1.11 muestra el sistema prototipo MRE. Su esquema para estudio se ilustra
en la Fig. 1.12, donde M1 es un servomotor DC con decodificador óptico que acciona
el movimiento rotatorio de una base metálica (la base del MRE) articulada a su eje.
Esta base comprende un disco metálico de espesor d y radio rd unido a una barra
metálica de longitud b, sección a2 y masa mb . La barra y el disco conforman un cuerpo
rı́gido con movimiento rotatorio alrededor del eje z, donde L1 es la distancia del
C.M. (centro de masa) de la base con respecto al origen del sistemas de coordenadas
(x, y, z). M2 es un servomotor montado en el extremo libre de la barra similar a M1 y
se emplea para accionar el movimiento de rotación de un brazo o eslabón de longitud
L (el brazo del manipulador) y masa ma . Ya que M1 y M2 son similares, entonces
poseen los mismos parámetros.
En el esquema del sistema MRE (Fig. 1.12), q1 y q2 son las posiciones angulares
de la base y del brazo respectivamente. Al extremo del brazo se puede articular un
efector final de masa mh . El manipulador MRE representa un sistema multivariable
cuadrado, denominado ası́ por poseer dos entradas: los voltajes de control u 1 y u2
aplicados a los terminales de armaduras de M1 y M2 respectivamente, y dos salidas:
q1 y q2 . La tabla 1.4 muestra los valores de los parámetros del manipulador.
Ecuaciones de Energı́a del MRE

Ecuaciones de Energı́a de la Base
La base está confinada a girar alrededor del eje z (ver Fig. 1.12). Su energı́a
cinética V1 y su energı́a potencial U1 vienen dadas por:
1
V1 = J1 q̇12 U1 = m 1 g L 1 (1.93)
2
donde:
mb b + m d d
m1 = m d + m b L1 = (1.94)
mb + m d
Tabla 1.4: Variables y parámetros del sistema MRE (C.M.: centro de masa).
Sı́mbolo Descripción Valor Unidad
q1 Posición angular de la base rad
q2 Posición angular del brazo rad
T1 , T 2 Torques generados N-m
md Masa del disco 0.55 kg
mb Masa de la barra 0.9 kg
ma Masa del brazo o eslabón 0.8 kg
mh Masa del efector final 0.15 kg
m2 Masa equivalente del brazo kg
d Espesor del disco 0.01 m
rd Radio del disco 0.06 m
b Longitud de la barra 0.25 m
a2 Sección cuadrada de la barra 0.044 2 m2
M1 , M2 Servomotores D.C.
Lb Longitud del brazo 0.3 m
Lh Longitud del efector 0.05 m
L1 Ubicación C.M. de la base m
L2 Longitud equivalente del brazo m
Jh Momento de inercia del efector kg-m2
Jm Momento de inercia de M1 y M2 0.0003 kg-m2
Jeq Momento de inercia equivalente kg-m2
Jg1 , Jg2 Momentos de inercia de los engranajes 0.053 kg-m2
J1 , J2 Momentos de inercia de la base y del brazo kg-m2
Bm Constante de fricción de M1 y M2 0.0001 N-m-s/rad
Beq Constante de fricción equivalente N-m-s/rad
Bg1 , Bg2 Constantes de fricción en engranajes 0.01 N-m-s/rad
n Relación de engranajes de M1 y M2 12.5
Ra Resistencia de armadura de M1 y M2 3.5 Ω
La Inductancia de armadura de M1 y M2 0.00015 H
Vb1 , Vb2 Voltajes contra electromotrices V
Va1 , Va2 Voltajes de armadura V
ia1 , ia2 Corrientes de armadura A
Km Constante del servomotor 0.0421 N-m/A
Kb Constante contra electromotrı́z 0.0565 V-s/rad
u1 , u2 Voltajes de control V
g Constante gravitacional 9.81 m/s2
Fig. 1.11: El manipulador robótico esférico (MRE).
z
EFECTOR
FINAL
mh
ma
SERVOMOTOR q2
M2 Lh
Lb
BRAZO
a
mb
b
BASE
a L1
rd
d y
md
SERVOMOTOR
x q1 M1
Fig. 1.12: Esquema del manipulador robótico esférico (MRE).
y el momento de inercia J1 resulta de la suma de los momentos de inercia del disco

(Jd ) y de la barra (Jb ) alrededor del eje z, como sigue [3]:
1 1
J1 = Jd + Jb = md rd2 + mb (a2 + a2 ) (1.95)
2 12
Ecuaciones de Energı́a del Brazo

Sean ma y mh las masas del brazo y del efector más su carga respectivamente.
Asumiendo que el brazo y el efector final forman una unidad de masa m2 = ma + mh
y longitud L2 = Lb + Lh , la energı́a cinética almacenada en el brazo se formula como:
1 1
V2 = J2 q̇22 + m2 ẋ2 + ẏ 2 + ż 2 (1.96)
2 2
De acuerdo a la Fig. 1.12:
L2 L2 L2
x≈ sen q2 cos q1 y≈ sen q2 sin q1 z ≈d+b+ cos q2 (1.97)
2 2 2
El momento de inercia J2 , según la referencia [3], se calcula como:
1
J2 = m2 L22 m2 = m a + m h L2 = L b + L h (1.98)
3
La energı́a potencial almacenada en el brazo se puede expresar como:

L2
U2 = m 2 g cos q2 + b + d (1.99)
2
Modelo Dinámico de Lagrange del MRE

Reemplazando (1.97) en (1.96), efectuando las operaciones indicadas y simplifi-
cando, la función de Lagrange L = V − U = (V1 + V2 ) − (U1 + U2 ) toma la forma:
1 1 1
L = J1 q̇12 + J2 q̇22 + m2 L2 q̇22 + q̇12 sen2 q2
2 2 8
L2
− m1 gL1 − m2 g d + b + cos q2 (1.100)
2
Las ecuaciones de Lagrange para las coordenadas generalizadas q 1 y q2 del MRE se
formulan como:

d ∂L ∂L
− = T1 (1.101)
dt ∂ q̇1 ∂q1

d ∂L ∂L
− = T2 (1.102)
dt ∂ q̇2 ∂q2
donde T1 y T2 son los torques generados para hacer girar la base y el brazo respec-
tivamente. Notar que se desprecian los torques de fricción que se oponen a T 1 y T2 .
Reemplazando L en (1.101) y (1.102) y operando se obtiene:

1 2 1
J1 + m2 L2 sen q2 q̈1 + m2 L2 senq2 cos q2 q̇1 q̇2 = T1 (1.103)
4 2

1 1 2 1
J2 + m2 L2 q̈2 − m2 L2 q̇1 senq2 cos q2 + m2 L2 gsenq2 = T2 (1.104)
4 4 2
Partiendo de (1.101) y (1.102) podemos determinar el modelo de Lagrange del mo-
delo MRE. Sin embargo, si estamos interesados en tener como fuerzas de control
los voltajes de armadura u1 y u2 en lugar de T1 y T2 respectivamente, entonces se
requiere modelar los susbsistemas eléctricos del sistema MRE como sigue.
Modelado del Servomotor M1 Accionando la Base

La Fig. 1.13 muestra al servomotor M1 articulado al punto pivote en contacto
con el disco de la base. Sabemos que M1 y M2 poseen los mismos parámetros por ser
similares. Despreciando la inductancia de armadura La , podemos formular (ver Fig.
1.13):
Ra ia1 + Vb1 = KA u1 (1.105)
donde:
Vb1 = Kb q̇m1 = Kb nq̇1 qm1 = nq1 (1.106)
Notar que n = N2 /N1 > 1 es la relación de dientes de los engranajes del mecanismo
de reducción. La ecuación del torque motor Tm1 es (ver Fig. 1.13):
L arm i a1
TU
q m1
q m1 XY
Y
XYXY XY
XY YX
+ + X YXYX N1
Articulación
u1 KA V b1 Z[
[
Z [ Z[
Z [Z[Z ^_
_
^_^_ ^_
^_ ^^ _^_^
_
_ _ ^ _ ^ _^
_
Tm1 Bm Tg1 \
\] \]
\ ] \]
\ ]\]\ q1
Jm
Ra N2 Tg2 Bg W V WV
Jg q1
Fig. 1.13: Servomotor M1 articulado al disco de la base.
Tm1 = Jm nq̈1 + Bm nq̇1 + Tg1 (1.107)

El torque Tg2 requerido para mover la base se expresa como:
Tg2 = nTg1 = Jg q̈1 + Bg q̇1 + T1 (1.108)
donde Jm y Jg son los momentos de inercia del motor y del mecanismo de reducción
respectivamente, mientras que Bm y Bg son las constantes de fricción del motor y
del mecanismo de reducción respectivamente. La relación Tg2 = nTg1 se obtiene asu-
miendo que los engranajes son ideales. En esta situación, el principio de conservación
de energı́a requiere que:
qm1
Tg1 qm1 = Tg2 qm1 = nq1
n
El torque motor Tm1 es proporcional a ia1 :
Tm1 = Km ia1 (1.109)
Empleando las ecuaciones (1.105), (1.106), (1.107), (1.108) y (1.109) se puede de-
mostrar que:

n2 K m K b nKm KA
T1 = −Jeq q̈1 − Beq + q̇1 + u1 (1.110)
Ra Ra
donde:
Jeq = n2 Jm + Jg Beq = n2 Bm + Bg (1.111)
Modelado del Servomotor M2 Accionando el Brazo
La Fig. 1.14 muestra al servomotor M2 articulado al punto pivote del segundo

brazo. Sabemos que M1 y M2 poseen los mismos parámetros por ser similares. Des-
preciando la inductancia de armadura Larm , formulamos:
Ra ia2 + Vb2 = KA u2 (1.112)
donde:
Vb2 = Kb q̇m2 = Kb nq̇2 qm2 = nq2 (1.113)
La ecuación del torque motor Tm2 es (ver Fig. 1.14):
L arm i a 2
à
q m2
q m2
+ +
de
e
d e de
d eded N1
Articulación
u2 KA fg
g
f g fg
f gfgf jk
k
jkjk jk
jk jj kjkj
k
j k
V b2
_ _ j kj
k
Tm2 Bm Tg1 h
hi hi
h i hi
h ihih q
Jm
Ra N2 Tg2 Bg c b cb 2
Jg q2
Fig. 1.14: Servomotor M2 articulado al punto pivote del brazo.
Tm2 = Jm nq̈2 + Bm nq̇2 + Tg1 (1.114)
El torque Tg2 requerido para mover el brazo se expresa como:
Tg2 = nTg1 = Jg q̈2 + Bg q̇2 + T2 (1.115)
donde T2 es el torque para accionar el brazo. El torque motor Tm2 es proporcional a

ia2 :
Tm2 = Km ia2 (1.116)
Empleando las ecuaciones (1.112), (1.113), (1.114), (1.115) y (1.116) se puede de-
mostrar que:

n2 K m K b nKm KA
T2 = −Jeq q̈2 − Beq + q̇2 + u2 (1.117)
Ra Ra
donde:
Jeq = n2 Jm + Jg Beq = n2 Bm + Bg (1.118)
Modelo de Lagrange del Manipulador MRE

Igualando (1.103) con (1.110) y (1.104) con (1.117) el modelo de Lagrange del
sistema MRE toma la forma:
u1 = M11 q̈1 + P11 q̇1 + P12 q̇2 (1.119)

u2 = M22 q̈2 + P21 q̇1 + P22 q̇2 + d21 (1.120)
Manipulando las ecuaciones (1.119) y (1.120) se obtiene el modelo dinámico de La-

grange del sistema:

q1 u1
M(q)q̈ + P(q, q̇)q̇ + d(q) = u q= u= (1.121)
q2 u2
donde:

M11 0 P11 P12 0
M= P= d=
0 M22 P21 P22 d21

Ra 1
M11 = J1 + Jeq + m2 L2 sen2 q2
nKm KA 4

Ra 1
M22 = J2 + Jeq + m2 L2
nKm KA 4
2

Ra n Km Kb
P11 = Beq +
nKm KA Ra

Ra 1
P12 = m2 L2 q̇1 senq2 cos q2
nKm KA 2

Ra 1
P21 = − m2 L2 q̇1 senq2 cos q2
nKm KA 4

Ra n2 K m K b
P22 = Beq +
nKm KA Ra

Ra 1
d21 = − m2 L2 gsenq2
nKm KA 2
Ecuación de Estado No Lineal del Sistema MRE

Definiendo las siguientes variables de estado: x1 = q1 , x2 = q2 , x3 = q̇1 y x4 = q̇2 ,
el modelo dinámico dado en (1.119) y (1.120) se puede transformar en la siguiente
ecuación de estado del sistema MRE:
     
ẋ1 f1 (x, u) x3
 ẋ2   f2 (x, u)   x4 
 = =  (1.122)
 ẋ3   f3 (x, u)   M11 (−P11 x3 − P12 x4 + u1 )
−1 
ẋ4 f4 (x, u) M22−1
(−P21 x3 − P22 x4 − d21 + u2 )
Capı́tulo 2
Control Óptimo
El procedimiento de diseño del sistema de control óptimo presentado en este capı́tulo

se puede aplicar a una gran clase de procesos no lineales, algunos de los cuales ya fueron
propuestos en el capı́tulo 2. Este capı́tulo trata el problema del control óptimo cuadrático
gaussiano, denominado ası́ porque el ı́ndice de rendimiento o función de costo que emplea
es una función cuadrática de los estados y de las señales de control. La solución del
problema de control planteado consiste en determinar un extremo de la función de costo
mediante minimización con el propósito de generar la ley de control óptima.
La configuración del sistema de control óptimo no lineal desarrollado en este capı́tulo
comprende el modelo no lineal multivariable del sistema a controlar, un observador no
lineal para estimar los estados del sistema y un controlador de realimentación de estados
del tipo proporcional–integral. El diseño del sistema de control óptimo (Fig. 2.1) consiste
en producir una fuerza de control U que sea capaz de hacer que el vector de salida Y del
sistema (la salida controlada) siga al vector de referencias deseadas R cumpliendo ciertas
especificaciones de diseño, a pesar de la presencia de disturbios estocásticos gaussianos
actuando sobre el sistema en operación.
2.1. Estructura del Sistema de Control Óptimo

La estructura del sistema de control óptimo no lineal empleada en este capı́tulo se
ilustra en la Fig. 2.1. Tal configuración combina en su diseño la representación de un
sistema no lineal, un observador no lineal para estimar los estados del sistema y una
ley de control de realimentación de estados del tipo proporcional–integral. El objetivo
del sistema de control óptimo consiste en seleccionar una fuerza de control U capaz de
minimizar la diferencia entre el vector de salida Y del sistema y el vector de referencias
deseadas R, cumpliendo las especificaciones de diseño del caso, a pesar de la presencia
de incertidumbres en los parámetros y de disturbios estocásticos gaussianos actuando
sobre el sistema controlado.
La implementación en tiempo real del sistema mostrado en la figura 2.1 opera
como sigue: después de cada tiempo de discretización, el observador no lineal estima
los estados Xb del sistema empleando los datos proporcionados por el vector de entrada
U y el vector de salida Y. Invocando el bien conocido teorema de la separación [10],
tales estados estimados y la integral del error z, se usan para computar la ley de
control U = −K X b + KI z. La señal U, que es del tipo proporcional–integral, actúa
34 Control Óptimo
R z z U X Y
KΙ SISTEMA C
OBSERVADOR
X
K
Fig. 2.1: Configuración del sistema de control óptimo.
sobre el sistema para hacer que el error entre R y la salida Y tienda a cero cumpliendo
ciertas especificaciones de diseño.
2.2. Descripción dinámica del Sistema

El sistema dinámico no lineal multivariable (de múltiples entradas U y múltiples
salidas Y) se describe mediante la siguiente ecuación de estado:
Ẋ = f (X, U) + v
Y = h(X) + w (2.1)
         
X1 U1 v1 Y1 w1
         
X =  ...  U =  ...  v =  ...  Y =  ...  w =  ... 
Xn Um vn Yp wp
   
f1 (X, U) h1 (X)
 ..   .. 
f = .  h= . 
fn (X, U) hp (X)
donde X es el vector de estado, U es el vector de control (la entrada al sistema) e Y
es el vector de salida. Asumiremos que las funciones vectoriales de variable vectorial
f (X, U) y h(X) son operadores no lineales diferenciables que representan la dinámica
del sistema y la dinámica de la salida respectivamente. Los vectores v de orden n × 1
y w de orden p × 1 son los disturbios en los estados del sistema (ruidos en los estados)
y en sus salidas (ruidos de medición) respectivamente.
Sean X0 , U0 e Y0 los vectores de referencia (o nominales) de X, U e Y respecti-
vamente. Si la entrada del sistema se selecciona exactamente igual a U0 , su respuesta
será X0 . Entonces X0 satisface:
Ẋ0 = f (X0 , U0 ) + v
Y0 = h(X0 ) + w (2.2)
2.3 El Controlador Óptimo PI 35
Si la entrada del sistema U no es exactamente, pero sı́ muy cercana a U0 , el vector

de estado X resultante difiere muy poco de X0 . Para tal situación, las trayectorias
actuales pueden formularse como:
X = X0 + x U = U0 + u Y = Y0 + y (2.3)
donde los vectores residuales x, u e y representan desviaciones con respecto a los

correspondientes vectores de estado, de control y de salida respectivamente. Reem-
plazando (2.3) en (2.1) produce:
Ẋ0 + ẋ = f (X0 + x, U0 + u) + v
Y0 + y = h(X0 + x) + w (2.4)
Como hemos asumido que las desviaciones actuales son pequeñas, entonces el sistema
(2.4) admite ser linealizado alrededor de un vector de trayectorias nominales o de
referencia X0 . La linealización de (2.4) empleando operadores jacobianos alrededor
de X0 y U0 resulta:
ẋ ≈ Ax + Bu + v x(0− ) = 0
y ≈ Cx + w (2.5)
donde:
 ∂f1 ∂f1   ∂f1 ∂f1 
∂X1 ··· ∂Xn ∂U1 ··· ∂Um
 .. .. ..   .. .. .. 
A =  . . .  B= . . . 
∂fn ∂fn ∂fn ∂fn
∂X1 ··· ∂Xn (X0 ,U0 ) ∂U1 ··· ∂Um (X0 ,U0 )
 ∂h1 ∂h1 
∂X1 ··· ∂Xn
 .. .. .. 
C =  . . .  (2.6)
∂hp ∂hp
∂X1 ··· ∂Xn (X0 )
Observar que las matrices jacobianas Ann , Bnm , Cpn y Dpm necesitan ser evaluadas
alrededor de los vectores de referencia X0 y U0 .
2.3. El Controlador Óptimo PI

La Fig. 2.2 muestra el sistema de control óptimo PI (Proporcional–Integral) usado
para la deducción de la correspondiente ley de control. Notar que en dicha figura no
aparece el observador de estados. Además, el sistema a controlar emplea la descripción
lineal dada en (2.5). Sin considerar los vectores gaussianos v y w (estos vectores se
incluyen al final), de la figura 2.2 se obtiene:
ẋ = Ax + Bu
y = Cx
u = −Kx + KI z
ż = R − y = R − Cx (2.7)
donde x es el vector de estado de orden n, u es el vector de control de orden m, y es

36 Control Óptimo
R z z u x x y
KI B C
Fig. 2.2: Sistema de control óptimo linealizado con controlador PI (Proporcional–

Integral) de realimentación de estados.
el vector de salida de orden p, z es el vector de salida del integrador de orden p, R es

el vector de referencias deseadas de orden p, A es la matriz de estado de dimensión
n × n, B es la matriz de control de dimensión n × m y C es la matriz de salida de
dimensión p × n. De (2.7) se puede formular:

ẋ(t) A 0 x(t) B 0
= + u(t) + R(t) (2.8)
ż(t) −C 0 z(t) 0 I
donde I es la matriz identidad de orden p y las matrices y vectores 0 poseen dimen-
siones apropiadas. Dado que (2.8) es cierto para cualquier t, entonces para un tiempo
final tf se tiene:

ẋ(tf ) A 0 x(tf ) B 0
= + u(tf ) + R(tf ) (2.9)
ż(tf ) −C 0 z(tf ) 0 I
Restando (2.8) de (2.9) resulta:

ẋe A 0 xe B 0
= + ue + Re (2.10)
że −C 0 ze 0 I
donde:
xe = x(t) − x(tf )
ze = z(t) − z(tf )
ue = u(t) − u(tf )
Re = R(t) − R(tf ) (2.11)
son los errores del sistema. Dado que se desea un comportamiento asintóticamente
estable del sistema controlado, entonces los errores xe , ze y ue deben de tender a cero,
mientras que el error Re debe de ser nulo cuando se alcance el estado estacionario.
Por consiguiente, la ecuación de estado del error (incluyendo los vectores de ruido
gaussiano) toma la forma:
ė = Aa e + Ba ue + v (2.12)

xe a A 0 a B
e = A = B =
ze −C 0 0
2.3 El Controlador Óptimo PI 37
donde el vector de error e es de orden n + p, el vector de ruido gaussiano v es ahora

de orden n + p y las matrices Aa y Ba son de orden (n + p) × (n + p) y (n + p) × m
respectivamente. De la misma manera, la ley de control u = −Kx + KI z dada en
(2.7) toma la forma:
ue = −Kxe + KI ze = −Ka e Ka = [K − KI ] (2.13)
donde la matriz de ganancia aumentada Ka es de orden m × (n + p).

Observar que la ecuación de estado del error (2.12) y la ley de control residual
(2.13) poseen la misma estructura que las ecuaciones de estado y de control del
sistema dado en (2.7). Esta similitud nos permite ahora determinar la matriz de
ganancia óptima Ka como sigue [11],[12]. Siempre que el sistema descrito por (2.12)
cumpla la siguiente condición de controlabilidad completa:

rango Ma = rango Ba Aa Ba · · · (Aa )n−1 Ba = n + p (2.14)
entonces, Ka puede ser computada de:
Ka = R−1 a T a
u (B ) P (2.15)
donde Ru = RT a a T
u es una matriz de sintonización definida positiva y P = (P ) de
orden (n + p) × (n + p) es la única matriz solución definida positiva de la siguiente
ecuación asociada de Riccati:
Pa (Aa + αI) + (Aa + αI)T Pa − Pa Ba R−1 a T a a

u (B ) P + Q = 0 (2.16)
Por lo tanto, la ley de control de realimentación de estados (el controlador PI de

realimentación de estados):

a a
x
u = −K x = − K −KI (2.17)
z
minimiza la siguiente función de costo cuadrática:

Z ∞
Ia = e2αt [(xa )T (t)Qa xa (t) + uTu (t)Ru u(t)]dt (2.18)
0
sujeta a la ecuación de restricción:
ẋa = Aa xa + Ba u + va (2.19)
En (2.18), Qa = (Qa )T de orden (n+p)×(n+p) es una matriz semi-definida positiva,

Ru = RTu de orden m × m ya fue definida como positiva y α ≥ 0 es una constante.
Observar que Ru y Qa son matrices de sintonización que sirven para ponderar el
rendimiento del sistema.
Agregando los vectores nominales Uo y Xo a ambos miembros de (2.17), se obtiene
la ley de control actual U:

a a
x + Xo X
u + Uo = U = −K X = − K −KI = − K −KI
z z
(2.20)
38 Control Óptimo
De acuerdo al principio de la separación [10], los controladores de realimentación de

estado se pueden implementar empleando los estimados de los estados en lugar de
los estados actuales del sistema. Por consiguiente, la ley de control (2.20) se puede
implementar también como:

aba
X b
U = −K X = − K −KI (2.21)
z
Para obtener el vector de estado estimado X b emplearemos un observador no lineal

(sección 2.4). El vector estimado z no necesita estimarse ya que se obtiene integrando
la salida actual Y.
2.4. El Observador Óptimo No Lineal

Consideremos la estructura de la Fig. 2.3 para la estimación de estados y control
del sistema descrito en (2.1). El observador no lineal ilustrado se puede describir por:
ḃ = f (X,
X b U) + H(Y − Y)
b
b = h(X)
Y b (2.22)
donde Yb y X b son los vectores estimados de Y y X respectivamente, y H es una

matriz residual de ganancia de orden n × p a ser determinada.
v w R
+ + +
x x + Y z z
h( ) h(X)
+ f(X, U)
f( )
U
^
X
U â
X ^
X
a
−K z
z
^
X ^ ^
X Y Y
C
+ +
+
f( )
^ U)
f(X, U
H
Fig. 2.3: Estructura del sistema de control óptimo para estimación de estados y
control.
2.5 Procedimiento de Diseño 39
Por otra parte, asumamos que los disturbios v y w en (2.1) sean ruido blanco
gaussiano con media (o esperanza) nula. El ruido blanco gaussiano posee la propiedad
de ser no correlacionado en cada instante de tiempo. En otras palabras, no existe una
interrelación (correlación) entre v y w. La propiedad de la media nula implica que
toda la información estadı́stica del ruido se acumula en la covarianza de los disturbios.
En términos matemáticos:
E[v(t)vT (τ )] = Vδ(t − τ ) E[v] = 0

T
E[w(t)w (τ )] = Wδ(t − τ ) E[w] = 0 (2.23)
donde E[.] es la operación matemática esperanza, δ(t − τ ) es la función delta de

Kronecker definida como: δ(t − τ ) = 1 para t = τ y nula en otro caso. También, V
de orden n × n y W de orden p × p son matrices de covarianza definidas positivas.
Es un hecho conocido que un sistema lineal de la forma dada en (2.7) pero con
v = w = 0, es completamente observable siempre que su correspondiente matriz de
observabilidad N posea rango completo:
 
C
 CA 
 
rango N = rango  .. =n (2.24)
 . 
CAn−1
Cuando el modelo linealizado dado en (2.7) es completamente observable, la matriz

residual de ganancia H del observador no lineal descrito en (2.22), se calcula de:
H = SCT W−1 (2.25)
donde S = ST de orden n × n es la única matriz definida positiva solución de la

siguiente ecuación asociada de Riccati:
0 = S(A + αI)T + (A + αI)S − SCT W−1 CS + V (2.26)
El estimador de estados resultante mostrado en la Fig. 2.3 es conocido también como

el filtro de Kalman de ganancia constante H.
2.5. Procedimiento de Diseño

El procedimiento de diseño del sistema de control óptimo desarrollado sigue los
pasos siguientes:
(1) Formular el problema: describir el sistema a controlar, definir las especifica-

ciones de diseño y determinar el modelo no lineal del sistema en la forma dada
en (2.1).
(2) Determinar el modelo linealizado del sistema (ecuación (2.5)).
(3) Determinar la controlabilidad y observabilidad del sistema linealizado (ecua-
ciones (2.14) y (2.24) respectivamente).
(4) Computar la matriz de ganancia Ka de la ley de control PI del sistema (ecua-
ciones (2.15) y (2.16)).
40 Control Óptimo
(5) Computar la matriz de ganancia H del observador no lineal del sistema (ecua-
ciones (2.25) y (2.26)).
(6) Simular el sistema de control óptimo empleando las ecuaciones dinámicas no
lineales (2.1) y (2.22).
(7) Desarrollar el software de control en tiempo real del sistema.
(8) Implementar el sistema de control óptimo (hardware).
(9) Ejecutar pruebas de funcionamiento en tiempo real.
2.6. Aplicación en Tiempo Real

2.6.1. Control Óptimo del Sistema MRE
La ecuación de estado del sistema MRE se muestra en la ecuación (1.122). Este
sistema se puede linealizar usando las matrices jacobianas dadas en (2.6). Sin embar-
go, aplicaremos el método de linealización aproximada que consiste en asumir que,
cuando x es suficientemente pequeño, se cumple: sen(x) ∼= x, cos(x) ∼
= 1, x2 ∼
= 0, etc.
Aplicando esta aproximación en (1.122) se obtiene (el sobre rayado indica un valor
estacionario):
Ra
M 11 = (J1 + Jeq )
nKm KA
M 22 = M22
P 11 = P 22 = P11 = P22
P 12 = P 21 = 0
Ra m2 L2 g
d21 = d21 senx2 ; d21 = ;
2nKm KA
Por consiguiente:
   
0 0 1 0 0 0
 0 0 0 1   0 0 
   
A= −1  B= −1 
 0 0 −M 11 P 11 0   M 11 0 
−1 −1 −1
0 −M 22 d21 0 −M 22 P 22 0 −M 22

1 0 0 0 0 0
C= D=
0 1 0 0 0 0
Por lo tanto:

a A 0 a B
A = B = Ca = C 0
−C 0 0
Usando el hecho de que el sistema es completamente controlable y completamente

observable, la ganancia Ka del controlador y la ganancia H del observador fueron
determinadas usando los comandos lqr y lqe de MathScript, respectivamente. Las
matrices requeridas por estos comandos se fijaron como sigue: Ru = 0.1I, Qa = 2I,
V = 0.1I, W = 0.1I y G = I, donde I es la matriz identidad. El parámetro α de la
función de costo se fijó en 6.
2.6 Aplicación en Tiempo Real 41
La simulación se llevó a cabo ejecutando

R t el archivo ocmrer.m para las señales de
referencia tipo escalón. La relación z = 0 Ydτ se aproximó en el dominio discreto
como z(k + 1) = z(k) + T x(k), donde T = 0.01 s es el tiempo de muestreo y k = t/T
es el tiempo discreto. El resultado de la simulación se muestra en la Fig. 2.4. Notar
que las especificaciones de diseño porcentaje de sobrenivel nulo, error en estado esta-
cionario nulo y tiempo de estabilización menor de 1.2 s se cumplen satisfactoriamente.
1
Posición X1 [rad]
0.5
0
0 1 2 3 4 5 6 7 8
10
Control U1 [V]
−5
0 1 2 3 4 5 6 7 8
1
Posición X2 [rad]
0.5
0
0 1 2 3 4 5 6 7 8
10
Control U2 [V]
−5
0 1 2 3 4 5 6 7 8
Tiempo [segundos]
Fig. 2.4: Posiciones angulares de la base y del del brazo MRE controladas.
El resultado experimental para un tiempo de muestreo de T = 0.01 s se muestra

en la Fig. 2.5, el cual se obtiene ejecutando el archivo LabVIEW ocmrer.vi. Este
último archivo emplea el controlador y el observador calculados en la simulación
(archivo ocmrer.m). Además usa dos archivos para implementar las señales de refe-
rencia tipo escalón: setpoint reg.vi (para la base del MRE) y setpoint reg2.vi (para
el brazo del MRE). Los gráficos de la Fig. 2.5 se obtienen ejecutando el archivo
ocmrertr.m, el cual emplea los archivos de datos experimentales SETPOINT BASE,
SETPOINT BRAZO, U1 y U2. Notar que las especificaciones de diseño previamente
establecidas también se cumplen satisfactoriamente para el caso experimental. ♣
42 Control Óptimo
Posición x1 [grad]
100
−100
0 5 10 15 20 25
TIEMPO [s]
CONTROL u1 [V]
−5
0 5 10 15 20 25
TIEMPO [s]
Posición x2 [grad]
50
−50
0 5 10 15 20 25
TIEMPO [s]
CONTROL u2 [V]
10
−10
0 5 10 15 20 25
TIEMPO [s]
Fig. 2.5: Respuesta experimental del sistema de control óptimo del MRE.
Capı́tulo 3
Control Adaptativo con Modelo

Referencial
El procedimiento de diseño de un sistema de control adaptativo presentado en este

capı́tulo se puede aplicar a una gran variedad de procesos no lineales, algunos de los
cuales ya fueron formulados en el capı́tulo 2. Este capı́tulo trata el problema del con-
trol adaptativo con modelo referencial, cuya estructura incluye un modelo dinámico de
referencia, un controlador adaptativo, un modelo dinámico del sistema a controlar y un
mecanismo de adaptación.
El objetivo de control del sistema diseñado consiste en producir una fuerza de control
u que sea capaz de hacer que el vector de salida y del sistema, siga a la respuesta
deseada yd cumpliendo ciertas especificaciones de diseño, a pesar de la presencia de
incertidumbre paramétrica (parámetros no modelados en el modelo dinámico usado o
con valores inciertos) y no paramétrica (efectos no lineales no tomados en cuenta en el
modelo dinámico tales como fricción de coulumb, saturación, entre otros).
3.1. Estructura de un SCAMR

La figura 3.1 ilustra la configuración de un Sistema de Control Adaptativo con
Modelo Referencial (SCAMR) que puede ser empleado en una gran variedad de apli-
caciones. El SCAMR se compone básicamente de un modelo de referencia, un contro-
lador adaptativo, el sistema a controlar y un mecanismo de adaptación. El esquema
en consideración se denomina un SCAMR paralelo debido a la ubicación relativa del
modelo referencial con respecto al sistema.
El modelo de referencia, el cual está excitado por una entrada externa r, es un
sistema dinámico auxiliar usado para obtener la respuesta deseada del sistema. Tal
respuesta debe de ser lograda por el SCAMR a pesar de las restricciones generadas
por inexactitudes en el modelado de la estructura del modelo de referencia y el mo-
delo del sistema. En este capı́tulo se emplea un modelo de referencia con matriz de
transferencia unitaria lo cual implica que r = qd .
El mecanismo de adaptación es un conjunto de bloques interconectados usados
para implementar la ley de adaptación. De hecho, la ley de adaptación es el algoritmo
de control empleado para modificar los parámetros del controlador adaptativo, de
modo tal que el SCAMR permanezca estable y que el error de seguimiento q e = q−qd
44 Control Adaptativo con Modelo Referencial
MODELO
REFERENCIAL
− qd
r
CONTROLADOR u SISTEMA +
ADAPTATIVO NO LINEAL
q
~q
MECANISMO
DE ADAPTACIÓN
Fig. 3.1: Configuración de un Sistema de Control Adaptativo con Modelo Referencial

(SCAMR).
converja a cero a pesar de la presencia de parámetros del sistema variantes con

el tiempo y disturbios externos. El método directo de Lyapunov (Apéndice C) es
empleado para determinar que el SCAMR diseñado garantice convergencia global de
las señales controladas con respecto a sus trayectorias deseadas.
Se asume que el sistema es no lineal. Por consiguiente, su descripción puede ser
imprecisa; esto es, el modelo dinámico del sistema puede presentar incertidumbres en
su estructura o dinámica no modelada en su representación. Ya que la descripción del
sistema permite incertidumbres, el control adaptativo (en general) se puede considerar
una aproximación particular de control robusto.
3.2. SCAMR para Sistemas No Lineales Multivariables

3.2.1. Diseño del SCAMR
Una gran clase de sistemas no lineales se pueden describir mediante su modelo
dinámico de Lagrange:
   
q1 u1
   
M(q)q̈ + P(q, q̇)q̇ + d(q) = u q =  ...  u =  ...  (3.1)
qm um
donde M es una matriz simétrica definida positiva y la matriz P y el vector d se

determinan por construcción a partir del modelo dinámico no lineal del sistema a
controlar. También, q es el vector de coordenadas generalizadas y u es el vector de
control. Cabe a notar que en el caso de los manipuladores robóticos, las matrices
M, P y d representan la inercia del sistema a controlar, los torques centrı́petos y
de Coriolis, y los torques gravitacionales respectivamente. Sistemas dinámicos que
acepten la descripción arriba expuesta, también pueden ser controlados empleando
el procedimiento de diseño a desarrollar más adelante.
El objetivo de control del SCAMR es diseñar una ley de control u capaz de
hacer que la salida del sistema q(t) siga a la trayectoria deseada qd (t) con velocidad
suficiente a pesar de la presencia de incertidumbres en los parámetros. De acuerdo a
3.2 SCAMR para Sistemas No Lineales Multivariables 45
la referencia [14], asumamos que es posible transformar (3.1) en una expresión que
dependa linealmente de un vector de parámetros a con elementos conocidos, a saber:
Ya = u (3.2)
donde Y es una matriz que contiene información de las variables en juego. Considere
la siguiente ley de control:
u = Yb a − KD s (3.3)
donde KD s es el término derivativo e Yb a es el término anticipativo. En los términos
b es el vector estimado de parámetros, KD (la ganancia derivativa) es una
descritos, a
matriz simétrica constante definida positiva y s es un vector de superficies deslizantes
cuyos elementos si , i = 1, . . . , m se definen mediante la ecuación escalar si (q, t) = 0,
de modo tal que:
d
si = ( + λi )n−1 qei = (p + λi )n−1 qei (3.4)
dt
donde λi > 0 es una constante (el ancho de banda), p es el operador de Laplace y:
qei = qi − qdi
es el i–ésimo error de seguimiento. Por ejemplo, para n = 2, (3.4) se convierte en un

error de seguimiento compuesto formado por el error de seguimiento de velocidad q ė
e como sigue:
y el de posición q
ė + Λe
s=q q = q̇ − q̇r q̃ = q − qd q̇r = q̇d − Λe
q (3.5)
donde:      
s1 qė1 qėr1
     
s =  ...  ė =  ... 
q ėr =  ... 
q
sm qėm qėrm
 
λ1 0 ... 0
 0 λ2 ... 0 
 
qd = [qd1 ... qdm ]T Λ= .. .. ..  (3.6)
 . . ... . 
0 0 . . . λm
La conservación de la energı́a requiere que:
1 d T
[q̇ Mq̇] = q̇T (u − d) (3.7)
2 dt
donde q̇T Mq̇ es la energı́a cinética del sistema y q̇T (u − d) es la potencia de entrada
generada por el actuador. Diferenciando el miembro izquierdo de (3.7):
1
q̇T Mq̈ + q̇T Ṁq̇ = q̇T (u − d) (3.8)
2
De (3.1) obtenemos: Mq̈ = u − d − Pq̇. Sustituyendo este término en (3.8):
q̇T (Ṁ − 2P)q̇ = 0 (3.9)

Ha sido establecido en [13], [14] que (Ṁ−2P) = J es antisimétrica, es decir: J = −JT .

Por consiguiente:
Ṁ = 2P + J (3.10)
Considere la siguiente candidata para función de Lyapunov:
1 T
V (t) = bT Γ−1 a
s Ms + a e (3.11)
2
e=a
donde Γ es una matriz simétrica definida positiva y a b −a es el error de estimación
de parámetros. Diferenciando (3.11) se obtiene:
1 T
V̇ (t) = sT Mṡ + sT Ṁs + a
ḃ Γ−1 a
e
2
y empleando la relación s = q̇− q̇r (ecuación (3.5)) en la expresión anterior se obtiene:
1 T
V̇ (t) = sT (Mq̈ − Mq̈r ) + sT Ṁs + a
ḃ Γ−1 a
e
2
Sustituyendo (3.10), (3.3) y Mq̈ de (3.1) en V̇ produce:
T
V̇ (t) = sT (Yb ḃ Γ−1 a
a − KD s − Mq̈r − Pq̇r − d) + a e (3.12)
en donde hemos usado el hecho de que sT Js = 0, dado que J es antisimétrica1 . La

b se puede formular como:
ley de adaptación de los parámetros estimados a
ḃ = −ΓY T s
a (3.13)
mientras que la propiedad de parametrización lineal en (3.12) establece que:
Y(q, q̇, q̇r , q̈r )a = M(q)q̈r + P(q, q̇)q̇r + d(q) (3.14)
Reemplazando (3.14)y (3.13) en (3.12) produce:
V̇ (t) = −sT KD s ≤ 0 (3.15)
Dado que s = q ė + Λe
q (ver (3.5)), entonces (3.15) garantiza que los errores de
seguimiento de posición q ė tiendan a 0 conforme t → ∞. En otras
e y de velocidad q
palabras, los errores de seguimiento convergen en la superficie s = 0.
3.2.2. El Observador de Velocidad

Es conveniente estimar la velocidad angular q̇ del sistema, dado que solo se cuen-
ta con la medición del vector de posición q. El estimado de la velocidad angular,
denotada como q,ḃ toma la forma:
ḃ = q̇d + Ld (q − q
q b) (3.16)
donde la matriz de ganancia Ld = `d I del observador es diagonal y definida positiva,

siendo `d es una constante positiva.
1
Suponga que sT Js = c 6= 0, donde c es una constante. Como J es antisimétrica: J = −JT ; luego
sT Js = ±c. Entonces, la única solución posible para la constante es: c = 0
3.2 SCAMR para Sistemas No Lineales Multivariables 47
3.2.3. Zona–Muerta para Evitar Corrimiento de Parámetros

El problema del corrimiento de parámetros hacia valores peligrosos está aso-
ciado con las incertidumbres no paramétricas tales como fricciones estática y de
Coulomb, ruidos de medición, tiempos muertos, entre otros. Tal problema se origi-
na principalmente cuando el SCAMR no está excitado permanentemente o debido a
la presencia del ruido de medición o de disturbios. El corrimiento de los valores de
los parámetros puede causar que el SCAMR se torne inestable si se permite que los
parámetros estimados desplacen sus valores hacia valores que puedan provocar que
los polos del SCAMR se vuelvan inestables.
La experiencia dicta que la presencia de pequeños errores de seguimiento pueden
originar el corrimiento de los parámetros a valores peligrosos, debido a que dichas
señales básicamente contienen ruido y disturbios. La técnica más simple de modi-
ficación de la ley de control para evitar este problema es detener el mecanismo de
adaptación en presencia de pequeño errores de seguimiento. Esta técnica conocida
como “zona–muerta”sustituye (3.13) por:

−ΓY T s |s| > ∆
ḃ =
a
0 |s| < ∆
(3.17)
donde ∆ representa el tamaño de la zona–muerta. Ecuación (3.17) nos indica que

ḃ debe tomar el valor −ΓY T s computado en el tiempo de
cuando |s| < ∆, entonces a
muestreo anterior.
3.2.4. Procedimiento de Diseño del SCAMR

El procedimiento de diseño del sistema de control adaptativo con modelo referen-
cial desarrollado sigue los pasos siguientes:

ciones de diseño y determinar el modelo dinámico de Lagrange (ecuación (3.1)).
(2) Construir la ecuación de parametrización lineal dada en (3.14) como sigue.

ḃ usando el observador de velocidad dado en (3.16):
Primero estimar el vector q
ḃ = q̇d + Ld (q − q
q b)
Luego, formular los errores de posición y velocidad:
q̃ = q − qd q̃˙ = q̇ − q̇d
y la función de deslizamiento:
b + Λe
s=q q
La velocidad y aceleración de referencias se formulan como:
q̇r = q̇d − Λe
q ė
q̈r = q̈d − Λq
Finalmente, formular la matriz de parametrización:
Y(q, q̇, q̇r , q̈r )a = M(q)q̈r + P(q, q̇)q̇r + d(q)
b integrando la ley de adaptación

(3) Determinar el vector de parámetros estimados a
ḃ = −ΓY T s (ecuación (3.13)).
a
(4) Calcular la ley de control u = Yb
a − KD s (ecuación (3.3)).
(5) Si fuera necesario, con el fin de evitar el corrimiento de los parámetros, emplear
la siguiente ecuación de la zona–muerta:

−Γ Y T s |s| > ∆
α
ḃi = (3.18)
0 |s| < ∆
donde ∆ representa el tamaño de la zona–muerta.

(6) Simular el sistema de control adaptativo empleando los resultados de los pasos
anteriores.
(7) Implementar el sistema de control adaptativo (hardware).
(9) Ejecutar pruebas de funcionamiento.
3.3. Aplicaciones en Tiempo Real

3.3.1. Control Adaptativo del Manipulador Robótico Esférico
El modelo dinámico de Lagrange del MRE se muestra en la ecuación (1.121). Para
fines de parametrización lineal, tal modelo dinámico toma la forma dada en (3.14):

M11 0 P11 P12 0 u1
q̈r + q̇r + =
0 M22 P21 P22 d21 u2
Este sistema puede ser parametrizado definiendo:
a4 Ra Ra m2 L22
M11 = a1 + sin2 q2 a1 = (J1 + Jeq a4 =
2 nKm KA 2nKm KA

Ra 1 2
M22 = a2 a2 = J2 + Jeq + m2 L2
nKm KA 4
2

Ra n Km Kb
P11 = a3 a3 = Beq +
nKm KA Ra
P12 = a4 q̇1 sin q2 cos q2
a4
P21 = q̇1 sin q2 cos q2
2
P22 = a3
Ra m2 L2 g
d21 = a5 sin q2 a5 =
2nKm KA
3.3 Aplicaciones en Tiempo Real 49
Por consiguiente, la propiedad de parametrización lineal dada en (3.14) queda como:

 
a1
b
 b 
q̈r1 0 q̇r1 1
sin2 q2 + q̇r1 0  a2 
Y(q, q̇, q̇r , q̈r )b
a= 2  a3 
0 q̈r2 q̇r2 12 q̇r1
2 sin q cos q
2 2 sin q2
 b 
 b
a4 
a5
b
donde el vector de parámetros estimados a b se calcula integrando la ley de adaptación:

b = −ΓY T s. Para determinar el vector de deslizamiento s dado en (3.5), se requiere
a
emplear el observador de velocidad descrito en (3.16). Finalmente, la ley de control
se determina de: u = Yb a − Kd s.
Las Figs. 3.2 y 3.3 muestran los resultados de la simulación del sistema de control
adaptativo diseñado para controlar las posiciones angulares de los brazos del MRE
para los casos de seguimiento y regulación respectivamente. Para obtener tales re-
sultados, ejecutar los programas acmres.m y acmrer.m, para los cuales el tiempo de
muestreo se fijó en T = 0.001 s. Observar que las especificaciones de diseño porcenta-
je de sobrenivel nulo, error en estado estacionario nulo y tiempo de estabilización
menor de 1 segundo se cumplen satisfactoriamente para ambos casos. Los parámet-
ros de sintonización en los dos casos se seleccionaron: Λ = 4, γ = 0.1, L d = 80 y
Kd = 20.
POSICIÓN q1 [rad]
10
0
0 2 4 6 8 10 12 14 16
CONTROL u1 [V]
−1
0 2 4 6 8 10 12 14 16
TIEMPO [s]
POSICIÓN q2 [rad]
10
0
0 2 4 6 8 10 12 14 16
CONTROL u2 [V]
−1
0 2 4 6 8 10 12 14 16
TIEMPO [s]
Fig. 3.2: Posiciones angulares controladas de los brazos del MRE. Caso: seguimiento.
El resultado experimental para el caso regulación se muestra en la Fig. 3.4. Este

resultado se se obtiene ejecutando el archivo LabVIEW acmrer.vi, el cual emplea otros
dos archivos para implementar las señales de referencia tipo escalón: SETPOINT4.vi
POSICIÓN q1 [rad]
1
0.5
0
0 1 2 3 4 5 6 7 8
50
CONTROL u1 [V]
−50
0 1 2 3 4 5 6 7 8
POSICIÓN q2 [rad]
0.5
0
0 1 2 3 4 5 6 7 8
50
CONTROL u2 [V]
−50
0 1 2 3 4 5 6 7 8
TIEMPO [segundos]
Fig. 3.3: Posiciones angulares controladas de los brazos del MRE. Caso: regulación.
y SETPOINT5.vi, tanto para la base como para el brazo del MRE respectivamente.
También requiere de un archivo MATRIZYadap.vi, en el cual se realizan varias opera-
ciones requeridas por el algoritmo. Los gráficos de la Fig. 3.4 se obtienen ejecutando
el archivo acmrertr.m, el cual emplea los mismos parámetros de sintonización usados
en la simulación (archivo acmrer.m) además de los archivos de datos experimentales
setpoitnbase, setpointbrazo, U1 y U2. Las especificaciones de diseño preestablecidas
en la simulación también se cumplen para el caso experimental y para el mismo
tiempo de muestreo: T = 0.001 s. ♣
Posición x1 [grad]
200
−200
0 5 10 15
TIEMPO [s]
CONTROL u1 [V]
10
−10
0 5 10 15
TIEMPO [s]
Posición x2 [grad]
100
−100
0 5 10 15
TIEMPO [s]
CONTROL u2 [V]
10
−10
0 5 10 15
TIEMPO [s]
Fig. 3.4: Respuesta experimental del sistema de control adaptativo del MRE.
Capı́tulo 4
Control por Modos Deslizantes
Este capı́tulo se ocupa del control de sistemas no lineales usando la metodologı́a

del denominado control por modos deslizantes, o simplemente control deslizante. Para
este control, la descripción dinámica del sistema puede ser imprecisa; esto es, su modelo
dinámico puede presentar incertidumbre paramétrica en su estructura o dinámica no mo-
delada en su representación. Dado que la descripción del sistema permite incertidumbres,
el control deslizante puede ser considerado como una técnica de control robusto.
La metodologı́a del control deslizante incluye una ley de control no lineal de reali-
mentación que conmuta discontinuamente sobre una superficie que pertenece al espacio
de estado del sistema, de forma tal que si una trayectoria de estado que se origina en su
superficie y trata de desviarse de dicha superficie, entonces se aplica una fuerza de control
con el propósito de hacer retornar tal trayectoria a su superficie original. Por consiguiente,
trayectorias de estado naturales del sistema controlado estarán restringidos a deslizarse
a lo largo de su superficie.
Este capı́tulo describe la la metodologı́a para diseñar sistemas de control deslizante
para una cierta clase de sistemas multivariables no lineales.
4.1. Conceptos Básicos

Para explicar la notación empleada y los conceptos básicos del control con modos
deslizantes, emplearemos un sistema dinámico de una entrada y lineal en u. Este
sistema posee la forma:
 
x
 ẋ 
 
(n)  x(2) 
x = f (x) + b(x)u x=  (4.1)
 .. 
 . 
x(n−1)
donde el estado escalar x es la salida de interés del sistema, el escalar u es la entrada
de control, x es el vector de estado y las funciones f (x) y g(x) no son exactamente
conocidas pero son acotadas por funciones conocidas dependientes de x. En adición,
b(x) es de signo conocido. Notar que la notación para expresar derivadas totales de
orden superior es:
dxn
x(n) , n
dt
54 Control por Modos Deslizantes
Dada una trayectoria de estado deseada y variante con el tiempo:

 
xd
 ẋ 
 d 
 (2) 

xd =  x d  xd (0) = x(0) (4.2)
. 
 . 
 . 
(n−1)
xd
El problema de control a resolver consiste en diseñar un control finito u que fuerce al

estado x seguir a la trayectoria deseada xd a pesar de la presencia de incertidumbres
en los parámetros y dinámica no modelada.
Definamos el error de seguimiento x̃ y el vector de error de seguimiento x̃ como:
 
x
e
 ė 
x
 
 x e(2) 
x
e = x − xd e
x = x − xd =   (4.3)
 .. 
 . 
e(n−1)
x
Además, consideremos la superficie S(t) variante con el tiempo en el espacio de estado

Rn definido mediante la ecuación escalar s(x, t) = 0, tal que:
d
s(x, t) = ( + λ)n−1 x e = x(n−1) − xr(n−1)
e = (p + λ)n−1 x (4.4)
dt
donde λ es una constante positiva cuya selección se discutirá luego, p es el operador
(n−1)
de Laplace y xr es una función que puede ser computada de x y xd . Por ejemplo,
para un sistema de orden n = 3, s toma la forma:
s = (p + λ)2 x
e = (p2 + 2λp + λ2 )e
x=x ė + λ2 x
ë + 2λx e
= ẍ − ẍr
ė − λ2 x
ẍr = ẍd − 2λx e (4.5)
Notar en este caso que s resulta la suma ponderada del error de aceleración x, ë del
error de velocidad xė y el error de posición xe.
La relación (4.4) establece que un problema de control de trayectoria de orden
n se puede reemplazar por un problema de estabilización de primer orden, es decir,
por el problema de mantener el escalar s en cero. Tal problema de estabilización se
puede resolver seleccionando la ley de control u de (4.1) de forma tal que fuera de la
superficie S(t):
1 d 2
s = ṡ s ≤ −η|s| (4.6)
2 dt
donde η es una constante positiva. Como se ilustra en la Fig. 4.1(a) para el caso
n = 2, todas las trayectorias de estado que satisfacen la condición (4.6), la condición
de deslizamiento, hacen de la superficie S(t) un conjunto invariante en el sentido de
Lyapunov (ver Apéndice C), implicando que las trayectorias del sistema fuera de S(t)
apuntarán a tal superficie, y las trayectorias del sistema en S(t) permanecerán en ella.
También se puede establecer que dinámica no modelada, incertidumbre paramétrica
4.1 Conceptos Básicos 55
o ciertos disturbios, serán tolerados por un sistema que satisfaga la condición dada
en (4.6). S(t) es conocida como la superficie de deslizamiento porque satisface la
condición de deslizamiento. El comportamiento del sistema sobre una superficie de
deslizamiento se denomina modo de deslizamiento.
S(t)
(a)
dx
dt s=0
. xd
x
0
(b)
dx
s=0
dt
. xd
x
0
(c)
Fig. 4.1: (a) La superficie de deslizamiento S(t). (b) Convergencia exponencial. (c)
Fenómeno del “chattering”.
Consideremos el caso de aquellos sistemas que satisfacen la condición (4.6), pero

no la condición dada en (4.2), esto es, xd (0) 6= x(0). Para tales sistemas, la superficie
de deslizamiento s(t) = 0 será golpeada por alguna trayectoria del sistema en un
tiempo thit , el cual se puede computar como sigue. Asumiendo que s(0) > 0 y s(thit ) =
0 e integrando (4.6) entre t = 0 y t = thit se obtiene:
Z thit Z s(thit ) Z thit
ṡ dt = = 0ds ≤ − η dt (4.7)
0 s(0) 0
nos conduce a thit ≤ s(0)/η. Se puede obtener el mismo resultado si se arranca con
s(0) negativo. Por consiguiente:
thit ≤ |s(0)|/η (4.8)
La Fig. 4.1(b) ilustra el caso de una trayectoria de estado que evoluciona con una
condición inicial arbitraria, y luego golpea a la superficie s(t) = 0 en un tiempo finito
thit ≤ |s(t = 0)|/η. En el modo de deslizamiento, tal trayectoria “se desliza” a lo
largo de S(t) con el objeto de alcanzar exponencialmente a xd con una constante de
tiempo igual a 1/λ. Por cierto, la expresión de (4.4) para n = 2:
1/λ
s = (p + λ)x̃ → x̃ = s
(1/λ)p + 1
posee una constante de tiempo igual a 1/λ.

La implementación de sistemas de control deslizantes requiere de una ley de con-
trol realimentada, la cual se puede obtener de (4.4) y (4.1) de modo tal que s 2 en la
ecuación (4.6) se comporte muy parecido a una función de Lyapunov (Apéndice C)
con el fin de garantizar estabilidad asintótica del sistema a lazo cerrado. En modo
deslizante para el caso ideal, por ejemplo, cuando el modelo del sistema (4.1) repre-
senta exactamente al sistema actual, la ley de control diseñada forzará a todas las
trayectorias de estado a deslizarse a lo largo de s = 0, tal como se observa en la Fig.
4.1(b).
Sin embargo, debido a la presencia de imprecisiones en el modelado (incertidum-
bres en los parámetros y dinámica no modelada) y de disturbios, la ley de control
forzará a todas las trayectorias de estado a deslizarse discontinuamente a lo largo
de s = 0 tal como se muestra en la Fig. 4.1(c); es decir, la ley de control en mo-
do deslizante necesita ser discontinua a través de S(t), produciendo ası́ el fenómeno
conocido como chattering. Desde que el chattering implica una muy elevada actividad
de control, entonces, por consideraciones prácticas, la fuerza de control u necesita ser
suavizada adecuadamente (por ejemplo, mediante una acción de saturación) a pesar
de la pérdida de precisión en el seguimiento y en el ancho de banda.
Ejemplo 4.1
Para el sistema ẋ = u definamos la superficie s(t) = x(t). Consideremos una ley de

control de la forma:
+
u = −1 if s(t) > 0
u = ẋ = −sgn(x) =
u− = +1 if s(t) < 0
donde sgn(.) es la función signo definida como:
sgn(x) = +1 si x > 0
sgn(x) = −1 si x < 0
La Fig. 4.2 muestra las trayectorias del sistema x(t) = −t y x(t) = t originadas
por la ley de control u+ y u− respectivamente. La superficie s(t) = x(t) = 0 es una
superficie de deslizamiento porque satisface la condición (4.6) para η ≤ 1. ♣
4.2. Control Deslizante para Sistemas Multivariables

4.2.1. El Sistema a Controlar
Esta sección sigue el procedimiento desarrollado en [16]. La representación dinámi-
ca del sistema no lineal multivariable, el modelo de Lagrange, está dado por:
M(q)q̈ + P(q, q̇)q̇ + d(q) = u (4.9)

4.2 Control Deslizante para Sistemas Multivariables 57
s=0
Fig. 4.2: La superficie de deslizamiento s(t) = 0, por ejemplo 4.1.
donde q es un m × 1 vector de coordenadas generalizadas. Si el sistema a controlar es

un manipulador robótico, entonces M(q) es una matriz de inercia simétrica definida
positiva de orden m × m, P(q, q̇) es una matriz de orden m × m que representa las
fuerzas de Coriolis y centrı́peta, d(q) es un vector de orden m × 1 que representa las
fuerzas gravitacionales y u es un vector de orden m × 1 de fuerzas generalizadas. El
procedimiento de diseño a desarrollarse también puede ser aplicado a otros sistemas
no lineales que acepten la representación dinámica dada en (4.9).
El vector de estado correspondiente a (4.9) posee la forma x = [q q̇] T . Sean
qdi (t) y q̇di (t) para i = 1, . . . , m las trayectorias deseadas, las cuales se suponen ser
funciones del tiempo continuamente diferenciables. Los vectores de error se definen
como:
e(t) = q − qd
q ė = q̇ − q̇d
q(t)
o lo que es lo mismo empleando sus componentes:
qei (t) = qi (t) − qdi (t) qėi (t) = q̇i (t) − q̇di (t)
4.2.2. La Superficie de Conmutación

Sea la siguiente superficie de conmutación:
si (x, t) = si (q, q̇, t) = λii qei (t) + qėi (t) i = 1, . . . , m (4.10)
o en forma matricial:
ė =
s(x, t) = s(q, q̇, t) = Λq̃ + q (4.11)
        
s1 (x, t) s1 (q, q̇, t) λ11 · · · 0 qe1 qė1
 ..   ..   .. .. ..   ..  +  .. 
 . = . = . . .  .   . 
sm (x, t) sm (q, q̇, t) 0 · · · λmm qem qėm
donde las constantes positivas λii son los elementos de una matriz diagonal Λ de
orden m × m. Asumiendo que una fuerza de control diseñada es capaz de confinar
todas las trayectorias que se originan en la intersección de tales superficies y hacerlas

permanecer allı́, entonces en tal situación se cumple, de acuerdo a (4.10), que:
si (q, q̇, t) = 0 = λii qei (t) + qėi (t) i = 1, . . . , m
Esta última relación nos indica que q̃i (t) y q̃˙ i (t) deben converger exponencialmente a
cero, esto es:
q̃i (t) = qi (t) − qdi (t) = 0 q̃˙ i (t) = q̇i (t) − q̇di (t) = 0
Por consiguiente: qi (t) = qdi (t) y q̇i (t) = q̇di (t), con lo cual se logra el objetivo de
control.
4.2.3. Diseño de la Fuerza de Control Multivariable

El diseño de la fuerza o ley de control requerida para confinar las trayectorias del
sistema que se originan en la intersección de las superficies de deslizamiento y hacerlas
permanecer allı́ emplea el método directo de Lyapunov. Omitiendo por simplicidad
la dependencia de los argumentos, consideremos la siguiente candidata para función
de Lyapunov:
1
V = sT Ms
2
Definamos ahora la siguiente ley de control:
u = u0 − Usgn(s) (4.12)
     +   
u1 u+
1 + u1
−
u1 − u −1 ··· 0 sign(s1 )
 ..  1  ..  1 .. .. ..  .. 
 . =  . −  . . .  . 
2 2
um u+
m + u−
m 0 · · · u+
m − u −
m sign(s m )
o en función de sus elementos:
1 + 1 +
u0j = uj + u −
j Uj = uj − u −
j
2 2
La derivada de s (ecuación (4.11)) produce:
ṡ = Λq ė + (q̈ − q̈d )
ë = Λq
ė + q
Despejando q̈ de (4.9) y reemplazando la expresión resultante en la ecuación anterior

se obtiene:
ṡ = M−1 (u0 − U sgn(s) − ueq )
donde:
ė + Pq̇ + d + Mq̈d
ueq = −MΛq
Por consiguiente:
1 T 1
V̇ = sT Mṡ + s Ṁs = sT [u0 − Usgn(s) − ueq ] + sT Ṁs (4.13)
2 2
En la referencia [13] se establece que:
1h i
P= Ṁ − J (4.14)
2
4.2 Control Deslizante para Sistemas Multivariables 59
donde J es una matriz antisimétrica, es decir: J = −JT . Empleando (4.14) en (4.13)

nos conduce a:
1
V̇ = sT [u0 − Usgn(s) + Ps − ueq ] + sT Js
2
Dado que sT Js = 0 debido a que J es antisimétrica, entonces:
m
X m
X
V̇ = sT [u0 + Ps − ueq ] − sT Usgn(s) = sj [u0 + Ps − ueq ]j − Uj |sj |
j=1 j=1
m
X m
X
≤ |sj [u0 + Ps − ueq ]j | − Uj |sj | (4.15)
j=1 j=1
Seleccionando:
Uj ≥ |[u0 + Ps − ueq ]j | + η ε>0 (4.16)
y reemplazando esta última expresión en (4.15) se obtiene:
m
X
V̇ ≤ −η |sj | η>0
j=1
lo que significa que se ha cumplido la condición de deslizamiento y a la vez se garantiza

˙
que q̃(t) y q̃(t) convergen exponencialmente a cero.
+
Sean ûeq y P̂ los estimados de u y P respectivamente. Los controles u− j y uj se
pueden seleccionar para satisfacer:
)
u+ = [b
u eq − b
Ps] j + ū +
j j
b j + ū− i = 1, . . . , m (4.17)
u−
j = [b
u eq − Ps] j
Si seleccionamos:
ū+
j = Kj ū−
j = − Kj (4.18)
entonces de (4.17) obtenemos:
1 b j
u0j = (u+ + u−
j ) = [b
ueq − Ps] Uj = K j
2 j
o lo que es lo mismo, en forma matricial:
 + 
u1 + u −
1
1 ..  b
u0 =  . =u b eq − Ps
2
u+
m + um
−
 +   
u1 − u −
1 ··· 0 K1 · · · 0
1 .. .. ..   .. . . .. 
U =  . . . = . . .  (4.19)
2 +
0 · · · um − um − 0 · · · Km
Asumiendo que el término gravitacional se puede expresar como:
d = u0 = u b
b eq − Ps (4.20)
entonces la ley de control dada por (4.12) toma la forma:

 
K1 · · · 0
 ..  sgn(s)
u = u0 − Usign(s) = d −  ... . . . .  (4.21)
0 · · · Km
y la relación (4.16) con Uj = Kj se expresa como:
Kj ≥ |[ueq − Ps − d]i | + η
˙
Ahora, dado que ueq = −MΛq̃+Pq̇+d+Mq̈d , entonces las ganancias Kj se pueden
seleccionar siempre que:
Kj ≥ |(−M Λq̃˙ + P q̇ + M q̈d − P s)j | + η (4.22)
en donde M and P son las cotas superiores de M y P respectivamente.
4.3. Procedimiento de Diseño

El procedimiento de diseño de un sistema de control con modos deslizante, como
el desarrollado en la sección 4.2, comprende los pasos siguientes.
ciones de diseño y determinar el modelo no lineal del sistema en la forma dada
en (4.9).
(2) Determinar la ley de control con modos deslizantes dada en (4.21). Para ello se
requiere primero determinar las cotas superiores de M y P. Luego, formular el
siguiente observador de velocidad para determinar el vector q:ḃ
ḃ = q̇d + Ld (q − q
q b)
donde Ld = Ì es una matriz diagonal siendo ` una constante positiva. El vector

estimado q ḃ mientras que q
b se calcula integrando q, b̈ se determina del modelo
dinámico de Lagrange:
b̈ = M−1 (q)[u − P(q, q)

q ḃ − d(q)]
El vector de deslizamiento s se calcula como sigue:
e = q − qd
q ė = q̇ − q̇d
q ë = q̈ − q̈d
q
ė
q+q
s = Λe
siendo Λ = λI una matriz diagonal, donde λ es una constante positiva. Las
constantes Kj (j = 1, . . . , m) se calculan de (4.22):
Kj ≥ |(−M Λq̃˙ + P q̇ + M q̈d − P s)j | + η (4.23)
donde M and P son las cotas superiores de M y P respectivamente y η una

constante positiva. Para suavizar la acción de control introducimos las función
de saturación satj , j = 1, . . . , m:
u
if (sj /Φ > 1)
satj = 1
elseif (sj /Φ < −1)
Φ Φ s satj = −1
else
satj = sj /Φ
end
Finalmente, la ley de control se calcula de:

  
K1 · · · 0 sat1
 ..   .. 
u=d− .  .  (4.24)
0 · · · Km satm
(3) Simular el sistema de control con modos deslizantes empleando los parámetros
de sintonización: Λ, η, Ld y Φ.
(4) Implementar el sistema de control deslizante (hardware).

4.4.1. Control Deslizante del Manipulador Esférico MRE
El modelo dinámico de Lagrange del MRE se describe en la subsección 1.2.2, ecuación
(1.121). La determinación de la ley de control requiere la formulación de las cotas
superiores de M y P:

Ra 1 2
M 11 = J1 + Jeq + m2 L2
nKm KA 4
M 12 = M 21 = 0

Ra 1 2
M 22 = J2 + Jeq + m2 L2
nKm KA 4

Ra n2 K m K b
P 11 = Beq + = P 22
nKm KA Ra
Ra m2 L22
P 12 =
2nKm KA
Ra m2 L22
P 21 =
4nKm KA
Por consiguiente:

Ra
nKm KA J1 + Jeq + 14 m2 L22 sin q22 0
M(q) =
0 M 22

P 11 P 12 q̇1 sin q2 cos q2
P(q, q̇) =
P 21 q̇1 sin q2 cos q2 P 22

0
d(q) = Ra m2 L2 g
2nKm KA sin q2
Las señales de referencia deseada qd para propósitos de simulación se formulan para

el caso de seguimiento como:
qd1 = A sin W k + Bk
qd2 = A cos W k + Bk (4.25)
donde A y B son constantes, k = t/T es el tiempo discreto y T es el tiempo de

muestreo. Para el caso de regulación, qd es del tipo escalón. Los parámetros de sin-
tonización K1 y K2 se determinan de (4.23) con:

M 11 0 P 11 P 12
M= P=
0 M 22 P 21 P 22
Luego, la ley de control se calcula de (4.24).

Las Figs. 4.3 y 4.4 muestran el resultado de la simulación del sistema de control
deslizante diseñado para controlar las posiciones angulares de la base y del brazo
del MRE para los casos de seguimiento y regulación respectivamente. Para obtener
tales resultados, ejecutar los programas scmres.m y scmrer.m. Notar que las especi-
ficaciones de diseño porcentaje de sobrenivel nulo, error en estado estacionario nulo
y tiempo de estabilización menor de 1 s se cumplen satisfactoriamente para ambos
casos. Los parámetros de sintonización para los dos casos se fijaron en: λ = 7, η = 2,
`d = 30 y Φ = 0,4. El tiempo de muestreo empleado fue de T = 0.01 s.
El resultado experimental para el caso regulación se muestra en la Fig. 4.5, resul-
tado que se obtiene ejecutando el archivo LabVIEW scmrer.vi, el cual a su vez emplea
dos archivos para implementar las señales de referencia tipo escalón: SETPOINT1.vi
y SETPOINT3.vi tanto para la base como para el brazo del MRE respectivamente.
Los gráficos de la Fig. 4.5 se obtienen ejecutando el archivo scmrertr.m, el cual usa
los mismos parámetros de sintonización del archivo de simulación scmrer.m, además
de los archivos de datos experimentales setpoint base, setpoint brazo, U1 y U2. Las
especificaciones de diseño preestablecidas en la simulación también se cumplen para
el caso experimental y para el mismo tiempo de muestreo. ♣
POSICIÓN q1 [rad]
−5
0 5 10 15 20 25 30 35 40
CONTROL u1 [V]
0.5
−0.5
0 5 10 15 20 25 30 35 40
TIEMPO [s]
POSICIÓN q2 [rad]
−5
0 5 10 15 20 25 30 35 40
CONTROL u1 [V]
10
−10
0 5 10 15 20 25 30 35 40
TIEMPO [s]
Fig. 4.3: Posiciones angulares controladas de los brazos del MRE. Caso: seguimiento.
POSICIÓN q1 [rad]
0.4
0.2
0
0 2 4 6 8 10 12 14 16 18 20
CONTROL u1 [V]
−5
0 2 4 6 8 10 12 14 16 18 20
TIEMPO [s]
POSICIÓN q2 [rad]
0.4
0.2
0
0 2 4 6 8 10 12 14 16 18 20
CONTROL u1 [V]
−5
0 2 4 6 8 10 12 14 16 18 20
TIEMPO [s]
Fig. 4.4: Posiciones angulares controladas de los brazos del MRE. Caso: regulación.
Posición x1 [grad]
100
−100
0 2 4 6 8 10 12 14 16 18 20
TIEMPO [s]
CONTROL u1 [V]
10
−10
0 2 4 6 8 10 12 14 16 18 20
TIEMPO [s]
Posición x2 [grad]
200
100
0
0 2 4 6 8 10 12 14 16 18 20
TIEMPO [s]
CONTROL u2 [V]
10
−10
0 2 4 6 8 10 12 14 16 18 20
TIEMPO [s]
Fig. 4.5: Respuesta experimental del sistema de control deslizante del MRE.
Capı́tulo 5
Control Backstepping
Este capı́tulo describe la metodologı́a para diseñar sistemas de control backstepping

para una cierta clase de sistemas multivariables no lineales. Tal metodologı́a, basada en
el método directo de Lyapunov, comprende varios pasos en concordancia con el orden del
sistema. En cada paso es necesario introducir un estado virtual y una fuerza de control
virtual que permitan reescribir la ecuación de estado actual del sistema a controlar en
términos de éstos. La selección adecuada de una función de Lyapunov, va a permitir
determinar un control virtual, que aplicado al sistema a controlar, permita la estabilización
del mismo.
5.1. Introducción
El método directo de Lyapunov (Apéndice C) se emplea extensivamente para
el análisis y sı́ntesis de sistemas. Los sistemas de control adaptativo con modelo
referencial y con modos deslizantes descritos en los capı́tulos 3 y 4 respectivamente,
fueron sintetizados empleando dicho método. El método directo de Lyapunov, descrito
en el Apéndice A, emplea una función de Lyapunov que contiene cierta información
de la dinámica del sistema. Si la derivada en el tiempo de la función de Lyapunov
seleccionada es negativa, entonces se dice en el sentido de Lyapunov que el sistema
en estudio es estable, tal como se puede ver en el siguiente ejemplo.
Ejemplo 5.1
Determinar una función de Lyapunov para el sistema escalar:
ẋ = − cos x − x3 + u
donde x es la variable de estado y u es la señal de control.
Solución: Es claro que una fuerza de control de la forma u = cos x + x3 − kx,

donde k es una constante, convierte tal sistema a su forma lineal ẋ = −kx, y por lo
tanto, lo puede estabilizar. Si tomamos V (x) = x2 /2 como una función de Lyapunov
para el sistema, vemos que:
1. V (x) es definida positiva.

68 Control Backstepping
dV
2. dt = x dx 2
dt = xẋ = −kx es definida negativa.
Por consiguiente, el sistema es globalmente asintóticamente estable en el sentido de

Lyapunov. Observar que el término x3 en la ley de control u = cos x + x3 − kx, puede
hacerla crecer significativamente.
Si seleccionamos en cambio como ley de control u = cos x−kx, entonces el sistema
tomas la forma ẋ = −kx − x3 . Usando la misma función de Lyapunov V (x) = x2 /2,
obtenemos V̇ (x) = xẋ = −x4 − kx2 ≤ −x4 . Este resultado es ventajoso porque
demuestra que la magnitud de la fuerza de control u se incrementa linealmente con
x en lugar de hacerlo con x3 y que la función de Lyapunov V decrece más rápido
cuanto más grande sea x. ♣
La Fórmula de Sontag
La fórmula de Sontag [17], [18] nos permite determinar una adecuada ley de
control u = αs (x) para sistemas dinámicos descritos como:
ẋ = f (x) + g(x)αs
Tal fórmula supone que existe una función de Lyapunov V (x) para dicho sistema.
Entonces, una ley de control αs (x) capaz de estabilizar tal sistema se formula como:
 q
2 4
 ∂V
∂x
f+ ( ∂V f +( ∂V
∂x ) ∂x )
g ∂V
αs (x) = − ∂V , ∂x g 6= 0; (5.1)
( ∂x )
g
 ∂V
0, ∂x g = 0.
La ley de control de Sontag permite generar una ley de control de magnitud apropiada
(no grandes magnitudes) y rápida convergencia al estado estacionario a pesar de la
presencia de grandes valores iniciales de x, tal como se demuestra en el siguiente
ejemplo.
Ejemplo 5.2
Determinar una función de Lyapunov para el sistema escalar:
ẋ = − cos x − x3 + u
Solución: Asumamos la ley de control u = cos x − αs (x), donde αs (x) se determina

usando la fórmula de Sontag con f (x) = −x3 , g(x) = −1 y V (x) = x2 /2. Luego:
∂V ∂V p p
g = −x f = −x4 αs (x) = x3 − x x4 + 1 u(x) = − cos x − x3 − x x4 + 1
∂x ∂x
Podemos observar que para grandes valores de x, αs (x) tiende a cero, mientras que
para pequeños valores de x, αs (x) tiende a −x. Por consiguiente, la magnitud de u
usando la fórmula de Sontag resulta menor que en los casos anteriores. ♣
5.1 Introducción 69
El Control Backstepping
La técnica de control backstepping comprende varios pasos, de acuerdo al orden
del sistema. Cada paso se puede descomponer en las partes siguientes:
(1) Introducir un estado virtual y una fuerza de control virtual, y reescribir la

ecuación de estado actual en términos de éstos.
(2) Seleccionar una función de Lyapunov para el sistema.
(3) Buscar una ecuación para el control virtual que haga que la función de Lyapunov
sea una del tipo estabilizable, es decir, que su aplicación en el sistema permita
determinar las condiciones para estabilizar al sistema, sujeto a las restricciones
del caso.
En los pasos subsiguientes, se aumenta la función de Lyapunov para reflejar la presen-

cia de nuevos estados virtuales. En el ejemplo siguiente se aplica el método descrito.
Ejemplo 5.3
Diseñar un controlador backstepping para el sistema:
ẋ1 = −x31 + x2 (5.2)

ẋ2 = x22 +u (5.3)
Solución: Apliquemos los pasos descritos anteriormente.
(1) Para la ecuación (5.2) definamos una fuerza de control virtual α y un estado
virtual z = x2 − α. Por consiguiente:
ẋ1 = −x31 + z + α
Definamos ahora una función de Lyapunov candidata: V (x) = x21 /2. Entonces:
V̇ (x) = x1 ẋ1 = x1 (−x31 + z + α) = x1 (−x31 + α) + zx1
En este punto se puede usar la fórmula de Sontag para calcular α con el fin
de estabilizar al sistema propuesto. Por simplicidad usaremos: α = −k1 x1 para
k1 ≥ 0. Por lo tanto:
α̇ = −k1 ẋ1 = −k1 (−x31 + x2 )
ż = ẋ2 − α̇ = x2 + u + k1 (−x31 + x2 )
(2) Seleccionemos ahora una función de Lyapunov para el sistema. En este caso,
una apropiada selección resulta la siguiente función de Lyapunov aumentada:
Va (x) = V (x) + z 2 /2. Por consiguiente:
V̇a (x) = V̇ (x) + z ż = −x41 − kx21 + z(u + x1 + x22 + k1 (−x31 + x2 ))

(3) Seleccionemos una apropiada ley de control u que pueda estabilizar al sistema
de segundo orden. Una posible selección, de las muchas que pueden existir,
puede ser:
u = −k2 z − (x1 + x22 + k1 (−x31 + x2 ))
la cual hace que: V̇a (x) = −x41 − kx21 − k2 z 2 ≤ −x41 , lo que asegura la estabilidad
asintótica del sistema. Dado que z = x2 − α = x2 + k1 x1 , la señal de control u
toma la forma:
u = −k2 (x2 + k1 x1 ) − (x1 + x22 + k1 (−x31 + x2 ))
La Fig. 5.1, obtenida ejecutando el programa bscej33.m, muestra las respuestas
x1 (t) y x2 (t) del sistema estabilizado para las siguientes condiciones iniciales:
x1 (0) = 1.5, x2 (0) = 0.8, y los parámetros: k1 = 1.5 y k2 = 2. ♣
En la siguiente sección se desarrolla un sistema de control backstepping apropiado
para controla una gran clase de sistemas representados mediante un modelo dinámico
de Lagrange.
1.5
1
x1
SALIDA
0.5
−0.5
0 1 2 3 4 5 6
0.5
x2
SALIDA
−0.5
−1
0 1 2 3 4 5 6
2
CONTROL u
−2
−4
−6
0 1 2 3 4 5 6
TIEMPO [s]
Fig. 5.1: Respuesta x del sistema ẋ1 = −x31 + x2 , ẋ2 = x22 + u a una señal de control
backstepping.
5.2. Caracterı́sticas del Modelo

El modelo dinámico de una gran clase sistemas no lineales multivariables se puede
representar mediante la siguiente ecuación matricial [9], [14]:
M(q)q̈ + P(q, q̇)q̇ + d(q) = u (5.4)
5.3 Diseño Backstepping No Lineal 71
donde el vector q de orden n es el vector de estado, M de dimensión n × n es una

matriz simétrica definida positiva que por construcción depende de q, P de dimensión
n × n es otra matriz que depende de los vectores q y q̇, d de orden n es un vector que
depende de q por construcción, y u de orden n es el vector de entrada de control.
Para el caso de los manipuladores robóticos, q es el vector posición, M es la matriz
de inercia, P es la matriz de Coriolis–centripetal y d es el vector de gravedad.
De (5.4), la ecuación para q̈ resulta:
q̈ = M−1 (q)[u − P(q, q̇)q̇ − d(q)] (5.5)
Asumiremos que sólo se dispone de la medición del vector q.
5.3. Diseño Backstepping No Lineal

El diseño backstepping descrito a continuación ha sido desarrollado en [19]. Defi-
namos el error de seguimiento e de la posición angular de un brazo robótico como:
e = q − qd (5.6)
donde qd es la trayectoria deseada de la posición angular. El objetivo de control con-

siste en resolver el problema de seguimiento de la trayectoria usando sólo mediciones
de la posición. Definamos z1 = e como la variable regulada dentro del procedimiento
de diseño backstepping. Computando la derivada de z1 se obtiene:
ż1 = ė = q̇ − q̇d = eν (5.7)
Usemos ahora eν como la variable virtual de control. Seleccionemos la siguiente fun-

ción de estabilización:
α1 = −K z1 (5.8)
donde K es una matriz diagonal de la forma K = kI, donde k es una constante
positiva e I es la matriz identidad. El correspondiente error de la variable de estado
se define como:
z2 = eν − α1 = q̇ − q̇d + K z1 = q̇ − q̇r (5.9)
donde q̇r se define como:
q̇r = q̇d − K z1 (5.10)
Entonces, ecuación (5.7) se puede reescribir como:
ż1 = z2 + α1 = −K z1 + z2 (5.11)
También, la derivada de la variable de error z2 toma la forma:
ż2 = q̈ − q̈d + K ż1 (5.12)
Empleando las ecuaciones (5.5) y (5.11), la ecuación (5.12) se puede formular como:
ż2 = M−1 (q)[u − P(q, q̇)q̇ − d(q)] − q̈d + K z2 − K2 z1 (5.13)

El análisis de estabilidad del sistema de control a lazo cerrado desarrollado en [19]

emplea el método directo de Lyapunov. Para ello se selecciona la siguiente función
de Lyapunov:
1 T 1 1 T 1
V = z1 K1 z1 + zT2 M(q)z2 + q ė ≡ xT1 P1 x
ė M(q)q (5.14)
2 2 2 2
h T
i
donde q ḃ es el error de estimación de velocidad, xT = zT1 z2T q
ė = q̇ − q ė y
P = diag [K1 M(q) M(q)]. En [19] se demuestra que la derivada total de V posee
la siguiente expresión:
ė 2
V̇ = −α1 kz1 k2 − λ2 kz2 k2 − λ3 kqk (5.15)
donde α1 , λ2 y −λ3 son constantes positivas y en consecuencia, V̇ resulta definida
negativa, lo cual asegura la estabilidad asintótica del sistema. El análisis de estabi-
lidad de Lyapunov realizado en [19] también demuestra que la siguiente entrada de
control es capaz de estabilizar al sistema :
u = M(q)q̈ + P(q, q) ḃ − q̇r ) − K1 z1
ḃ q̇r + d(q) − Kd (q (5.16)
ḃ toma la forma:
donde el observador de la velocidad angular q
ḃ = q̇d + Ld (q − q
q b) (5.17)
Las ganancias de control Kd , K1 y Ld son matrices diagonales definidas positivas
con Kd = kd I, K1 = k1 I y Ld = `d I, donde kd , k1 y `d son constantes positivas.
5.4. Procedimiento de Diseño Backstepping

El procedimiento de diseño de un sistema de control backstepping, como el de-
sarrollado en la sección 5.3, comprende los pasos siguientes:
ciones de diseño determinar el modelo no lineal del sistema en la forma dada
en (5.4).
(2) Determinar la ley de control backstepping dada en (5.16). Para ello se requiere
definir el vector de referencias deseadas qd . Luego, formular el vector de error
e y el vector q̇r :
e = z1 = q − q d q̇r = q̇d − Kz1
En la última relación, K = kI es una matriz diagonal donde k es una constante
positiva e I es la matriz identidad. El observador se expresa como:
ḃ = q̇d + Ld (q − q
q b)
En esta expresión, Ld = Ì es una matriz diagonal donde ` es una constante
b se puede calcular integrando q.
positiva. El vector q ḃ Con los datos anteriores
se puede formular la ley de control backstepping:
ḃ q̇r + d(q) − Kd (q
u = M(q)q̈ + P(q, q) ḃ − q̇r ) − K1 z1
En dicha ley de control, Kd = kd I y K1 = k1 I son matrices diagonales donde
kd y k1 son constantes positivas.
(3) Simular el sistema de control backstepping empleando los parámetros de sin-

tonización kd , k1 y `d .
(4) Implementar el sistema de control backstepping (hardware).

5.5.1. Control Backstepping del Manipulador Esférico MRE
El modelo dinámico de Lagrange del MRE se describe en la subsección 1.2.2, ecuación
(1.121). Las señales de referencias deseadas qd para propósitos de simulación se for-
mulan para el caso de seguimiento como:
qd1 = A sin W k + Bk
qd2 = A cos W k + Bk
donde A, W y B son constantes, k = t/T es el tiempo discreto y T es el tiempo de

muestreo. Para el caso de regulación, qd es del tipo escalón. La ley de control dada
en (5.16) toma la forma:
ḃ q̇r + d(q) − Kd (q
u = M(q)q̈ + P(q, q) ḃ − q̇r ) − K1 z1
donde:
" #
Ra
J1 + Jeq + 14 m2 L22 sin2 q2 0
M(q) = nKm KA
0 Ra
nKm KA J2 + Jeq + 14 m2 L22 )
 
Ra n 2 Km Kb Ra m2 L22 qḃ1 sin q2 cos q2
nKm KA Beq + Ra 2nKm KA
ḃ = 
P(q, q) Ra m2 L22 qḃ1 sin q2 cos q2

Ra n 2 Km Kb
4nKm KA nKm KA Beq + Ra

0
d(q) = Ra m2 L2 g sin q2
2nKm KA
Las Figs. 5.2 y 5.3 muestran los resultados de las simulaciones del sistema de
control backstepping diseñado para controlar la posición angular de los dos brazos
del MRE para los casos de seguimiento y regulación respectivamente. Tales Figs. se
obtienen ejecutando los programa bscmres.m (caso seguimiento) y bscmrer.m (caso
regulación) para un tiempo de muestreo de T = 0.01 s. Notar que en ambos casos las
especificaciones de diseño: porcentaje de sobrenivel nulo, error en estado estacionario
nulo y tiempo de estabilización menor de 1 s se cumplen satisfactoriamente. Los
parámetros de sintonización se seleccionaron: k = 5, k1 = 8, ld = 10 y kd = 8, para
ambos casos: regulación y seguimiento. El modelo dinámico del MRE para propósitos
de simulación toma la forma:
q̈ = M−1 [u − Pq̇ − d]
POSICIÓN q1 [rad]
2
−2
0 2 4 6 8 10 12 14 16 18 20
CONTROL u1 [v]
−2
0 2 4 6 8 10 12 14 16 18 20
TIEMPO [S]
POSICIÓN q2 [rad]
−2
0 2 4 6 8 10 12 14 16 18 20
CONTROL u2 [v]
50
−50
0 2 4 6 8 10 12 14 16 18 20
TIEMPO [S]
Fig. 5.2: Control backstepping de la posición angular de los brazos del MRE. Caso
seguimiento.
El resultado experimental para el caso regulación se muestra en la Fig. 5.4, el cual

se obtiene ejecutando el archivo LabVIEW [1] bscmrer.vi. Este último archivo emplea
dos archivos para implementar las señales de referencia tipo escalón: setpoint reg.vi
y setpoint reg2.vi tanto para la base como para el brazo del MRE respectivamen-
te. Los gráficos de la Fig. 5.4 se obtienen ejecutando el archivo bscmrertr.m, el
cual emplea los mismos parámetros de sintonización usados en la simulación (archi-
vo bscmrer.m) además de los archivos de datos experimentales SETPOINT BASE,
SETPOINT BRAZO, U1 y U2. Las especificaciones de diseño preestablecidas en la
simulación también se cumplen para el caso experimental y para el mismo tiempo de
muestreo: T = 0.01 s. ♣
POSICIÓN q1 [rad]
1
0.5
0
0 5 10 15 20 25 30 35 40
CONTROL u1 [v]
50
−50
0 5 10 15 20 25 30 35 40
TIEMPO [S]
POSICIÓN q2 [rad]
0.5
0
0 5 10 15 20 25 30 35 40
CONTROL u2 [v]
50
−50
0 5 10 15 20 25 30 35 40
TIEMPO [S]
Fig. 5.3: Control backstepping de la posición angular de los brazos del MRE. Caso
regulación.
Posición x1 [grad]
100
−100
0 2 4 6 8 10 12 14 16 18 20
TIEMPO [s]
CONTROL u1 [V]
10
−10
0 2 4 6 8 10 12 14 16 18 20
TIEMPO [s]
Posición x2 [grad]
100
50
0
0 2 4 6 8 10 12 14 16 18 20
TIEMPO [s]
CONTROL u2 [V]
10
−10
0 2 4 6 8 10 12 14 16 18 20
TIEMPO [s]
Fig. 5.4: Respuesta experimental del sistema de control backstepping del MRE.
Apéndice A
El Método Directo de Lyapunov
A.1. Estabilidad vı́a el Método Directo de Lyapunov

A. M. Lyapunov trata el problema de la estabilidad de sistemas descritos median-
te ecuaciones diferenciales empleando dos métodos. El denominado primer método
analiza el comportamiento de la estabilidad de una solución explı́cita del modelo no
lineal del sistema y se aplica solamente a ciertos casos. El segundo método, o método
directo de Lyapunov, es de gran generalidad y potencia porque no requiere de la
solución de la descripción del sistema, como sı́ lo requiere el primer método.
A.1.1. Conceptos de Estabilidad

Un sistema no lineal de la forma:
ẋ = f (x, t) (A.1)
se dice que es no autónomo si f depende del tiempo, por ejemplo, si f posee parámetros
variantes con el tiempo. Por consiguiente, un sistema autónomo puede ser descrito
por: ẋ = f (x). Las trayectorias de estado para procesos autónomos son independientes
del tiempo inicial, mientras que para los no autónomos generalmente no lo son.
Un estado o punto de equilibrio xe (realmente un vector constante) de un sistema
autónomo se puede determinar de:
0 = f (xe ) (A.2)
Nosotros vamos a tratar la estabilidad en el origen del sistema autónomo básico:
ẋ = f (x) x(0) = 0 (A.3)
Entonces debemos de hacer ciertas suposiciones con relación a la figura A.1. De-
notemos como B(R) a la región esférica (balón) ||x|| < R y como S(R) a la esfera
||x|| = R en sı́. La región esférica anular cerrada r ≤ ||x|| ≤ R será descrita como B rR .
Asumiremos que en una cierta región esférica Ω : ||x|| < B(R), todas las derivadas
parciales ∂xi /∂xj existen y son continuas en Ω. Entonces diremos que el origen es:
estable si alguna trayectoria que empieza en B(r) en un punto arbitrario x o

nunca logra alcanzar la esfera frontera S(R) de B(R);
78 El Método Directo de Lyapunov
asintóticamente estable cuando es estable y en adición cada trayectoria de es-

tado que empieza en B(R) en un punto arbitrario xo , tiende hacia el origen
conforme el tiempo se incremente indefinidamente;
inestable cuando para algún R y r, ya sea grande o pequeño, alguna trayectoria

de estado que empieza en B(R) en un punto arbitrario x0 logra alcanzar la
esfera frontera S(R). Observar en la figura A.1 que para la trayectoria T el
origen es inestable en el sentido de Lyapunov, a pesar de que tal trayectoria de
estado muestre convergencia.
Asintóticamente
estable
Estable
B(r) S(R)
0 r
x0 R
Inestable
H(A)
B(R) T
S(A)
Fig. A.1: Estabilidad en sistemas autónomos.
A.1.2. Funciones de Lyapunov

Un tipo especial de función escalar V (x), la denominada función de Lyapunov
juega un importante rol en el análisis de la estabilidad y el diseño de sistemas de con-
trol. Una función de Lyapunov V (x) para sistemas autónomos verifica las siguientes
propiedades:
(a) V (x) y sus primeras derivadas parciales
∂V (x)
= ∇ V (x)
∂x
son continuas en una cierta región abierta Ω alrededor del origen.
(b) V (0) = 0
(c) Fuera del origen, pero siempre en Ω, V (x) es positiva. Por consiguiente, el origen
es un mı́nimo aislado de V (x).
A.1 Estabilidad vı́a el Método Directo de Lyapunov 79
(d) V̇ (x) = ∇ V (x) ẋ = ∇ V (x) f (x) ≤ 0 en Ω.

V (x) es una función definida positiva si satisface las propiedades (a)–(c). La figura
A.2 ilustra una función de Lyapunov para un sistema de segundo orden. Notar que
V (x1 , x2 ) tiene el aspecto general de un espejo parabólico apuntando hacia arriba. Si
V fuera definida negativa, el espejo parabólico deberı́a de apuntar hacia abajo. Por
consiguiente, V (x) es definida negativa si −V (x) es definida positiva. También, V (x)
es semidefinida positiva si V (0) = 0 y V (x) ≥ 0 para x 6= 0; V (x) es semidefinida
negativa si −V (x) es semidefinida positiva.
Para una matriz cuadrada V de orden n × n, las expresiones V > 0, V ≥ 0,
V < 0 y V ≤ 0 denotan que V es definida positiva, semidefinida positiva, definida
negativa y semidefinida negativa respectivamente, siempre y cuando V esté asociada
a su forma cuadrática.
V es definida positiva (V > 0), es decir, xT Vx > 0, si la función cuadrática
T
x Vx es definida positiva para x 6= 0. También, V es definida positiva si todos sus
eigenvalores o sus menores principales son mayores que cero.
En general, los menores principales mi de V = [vij ] (de orden n × n) son:
 
v11 v12 v13
v11 v12
m0 = 1; m1 = v11 ; m2 = det ; m3 = det  v21 v22 v23  ;
v21 v22
v31 v32 v33
y ası́ sucesivamente hasta llegar a mn = det(V).

V es semidefinida positiva (V ≥ 0), es decir, xT Vx ≥ 0, si la función cuadrática
T
x Vx es semidefinida positiva para x 6= 0. También, V ≥ 0 si V es singular de rango
r < n, y r eigenvalores o r menores principales de V son positivos y el resto (n − r)
son nulos.
V definida negativa (V < 0), es decir, xT Vx < 0, si la función cuadrática xT Vx
es definida negativa para x 6= 0. También, V < 0 si V es no singular y todos los
eigenvalores o los menores principales de V son negativos.
V semidefinida negativa (V ≤ 0), es decir, xT Vx ≤ 0, si la función cuadrática
T
x Vx ≤ 0 para x 6= 0. V ≤ 0 si V es singular de rango r < n, y r eigenvalores o r
menores principales de V son negativos y el resto (n − r) son nulos.
Si la matriz cuadrada V de orden n × n posee eigenvalores positivos y negativos,
entonces V es indefinida.
V(x1 , x 2) x2
V(x1 , x 2)
x2 x1
x1
Fig. A.2: Representación gráfica de una función de Lyapunov.

Ejemplo A.1
La función V (x) = (x1 + x2 )2 con x = [x1 x2 ]T es semidefinida positiva desde

que V (0) = 0 y V (x) ≥ 0 para x 6= 0 (por ejemplo, para x1 = −x2 , V (x) = 0),
mientras que la función V (x) = −x21 + x22 no es definida positiva ni negativa porque
V (x) > 0 para x1 = 0 y V (x) < 0 para x2 = 0. Es fácil de demostrar que la función
V (x) = x21 + x22 es definida positiva.
Ejemplo A.2
El circuito mostrado en la figura A.3 contiene un resistor no lineal RN que obedece

la ley i = N e3 , N > 0. Determine si la energı́a almacenada en el capacitor C es una
función de Lyapunov.
R i
+
+
u C e RN
- -
Fig. A.3: Circuito no lineal.
Solución: Sumando las corrientes que salen del nodo superior derecho (ver la figura
A.3) produce:
e−u
C ė + + N e3 = 0
R
La energı́a almacenada en el capacitor está dada por V (e) = 21 Ce2 . Para el sistema
no actuado (u = 0) tenemos:

2 1 2
V̇ (e) = Ceė = −e + Ne ≤ 0
R
Por consiguiente, la función V (e) es una función de Lyapunov.
Ejemplo A.3
La figura A.4 muestra un sistema masa–amortiguador–resorte no lineal cuyo modelo

dinámico es:
M ẍ + Bo ẋ + B1 ẋ|ẋ| + K0 x + K1 x3 = 0
donde (B0 ẋ+B1 ẋ|ẋ|) caracteriza un amortiguador no lineal con coeficientes de amor-
tiguación B0 , B1 > 0 constantes, y donde (K0 x + K1 x3 ) representa un resorte no
lineal con coeficientes de resorte K0 , K1 > 0 constantes. Demostrar que la energı́a
total almacenada en el sistema es una función de Lyapunov.
Solución: La energı́a del sistema es:
Z x
1 2 1 1 1
V (x) = M ẋ + (K0 x + K1 x3 )dx = M ẋ2 + K0 x2 + K1 x4
2 0 2 2 4
K0 B
K1 b(t)
lm
n lm
n lm
n lm
n lm
n lm
n lm
n lm
n lm
n lm
n lm
n lm
n ln
Fig. A.4: Sistema masa–amortiguador–resorte.
Se puede demostrar fácilmente que:
V̇ (x) = M ẋẍ + (K0 x + K1 x3 )ẋ = [−B0 ẋ − B1 ẋ|ẋ|]ẋ = −B0 ẋ2 − B1 |ẋ|3 ≤ 0
Por consiguiente, V (x) es una función de Lyapunov.
Función de Lyapunov para Sistemas No Autónomos

El sistema no autónomo en consideración se describe en la región Ω: ||x|| < A
mediante:
ẋ = f (x, t) f (0, t) = 0 t≤0 (A.4)
Siempre que W (x) es una función de Lyapunov en Ω, entonces V (x, t) es una
función de Lyapunov si:
(a) V (x, t) está definida en Ω para algún t ≥ 0;
(b) V (0, t) = 0 para algún t ≥ 0;
(c) V (x, t) ≥ W (x) para algún t ≤ t0 ;
(d) V̇ (x, t) ≤ 0 para algún t ≥ 0, donde:
dV ∂V ∂V ∂V ∂V
V̇ = = + ẋ = + f (x, t)
dt ∂t ∂x ∂t ∂x
Se dice que una función V (x, t) es definida positiva si satisface las condiciones (a)–
(c). También se dice que V (x, t) es una función definida positiva si esta función domina
a otra función definida positiva W (x), por ejemplo, cuando V (x, t) ≥ W (x). También,
V (x, t) es definida negativa si −V (x, t) es definida positiva; V (x, t) es semidefinida
positiva si esta función domina a otra función semidefinida positiva W (x); V (x, t) es
semidefinida negativa si −V (x, t) es semidefinida positiva.
Ejemplo A.4
Desprecie el término no lineal ẋ|ẋ| del amortiguador descrito en el ejemplo A.3 y

considere un coeficiente de amortiguación b(t) variante con el tiempo en lugar de
B0 , de modo tal que el sistema se convierta en uno no autónomo. Demostrar que la
siguiente función V (x, t) es una función de Lyapunov.

M 2 1 1 2
V (x, t) = (ẋ + αx) + K0 + K1 − M α + α b(t) x2
2
2 2 2
Solución: El cómputo de V̇ (x, t) produce:

1
V̇ (x, t) = (M α − b(t))ẋ2 + α(ḃ(t) − 2k0 ) − αK1 x4 < 0
2
siempre que α > 0, b(t) > M α y ḃ(t) < 2K0 . De acuerdo al ejemplo A.3, la energı́a
del sistema es una función de Lyapunov, a saber:
1 1 1
W (x) = M ẋ2 + K0 x2 + K1 x4
2 2 4
Podemos observar que V (x, t) > W (x). Por consiguiente, V (x, t) es una función de
Lyapunov.
A.1.3. Teoremas de Estabilidad de Lyapunov

Los teoremas de estabilidad de Lyapunov generalizan la idea de que cerca al estado
de equilibrio de un sistema f1sico, la energı́a del sistema es siempre decreciente.
Teoremas de Estabilidad para Sistemas Autónomos

I. Teorema de Estabilidad. El equilibrio en el origen es estable si allı́ existe
en alguna vecindad Ω del origen, una función de Lyapunov V (x).
II. Teorema de Estabilidad Asintótica. El equilibrio en el origen es asintótica-

mente estable si −V̇ es definida positiva (esto es: −V̇ > 0) en Ω.
III. Teorema de Estabilidad Completa (Global). Considere una función

escalar V (x) con primeras derivadas parciales continuas para todo x 6= 0 tal que
V (x) > 0, V̇ (x) < 0, y V (x) → ∞ cuando ||x|| → ∞. entonces el sistema autónomo
(A.4) es completamente (globalmente) asintóticamente estable.
IV. Teorema de Inestabilidad of Cĕteav. Sea Ω una vecindad en el origen.

Sea Ω` una región en Ω. Dada una función V (x) en Ω, entonces el equilibrio en el
origen es inestable si:
(a) V (x) posee derivadas parciales continuas en Ω` .
(b) V (x) y V̇ (x) son definidas positivas en Ω` .
(c) V (x) = 0 en los puntos de frontera de Ω` dentro de Ω.
(d) El origen es un punto de frontera de Ω` . La figura A.5 ilustra el teorema de
inestabilidad de Cĕteav.
El teorema de inestabilidad de Cĕteav se convierte en el denominado primer teorema
de inestabilidad si Ω = Ω1` , cuando Ω es una cierta vecindad del origen. Si, en adición
a la condición Ω = Ω` , la condición V̇ > 0 es reemplazada por:
V̇ (x) − λV (x) ≥ 0 ∀t≥0 ∀x Ω
donde λ es una constante positiva, de este modo el teorema de inestabilidad de Cĕteav
se convierta en el denominado segundo teorema de inestabilidad. Las demostraciones
de los teoremas descritos anteriormente se realizan básicamente en forma geométrica
en [22], [14].
V=0
. . 0
Ω
x0
V = constant
Ω1
Fig. A.5: Representación gráfica del teorema de estabilidad de Cĕteav.
Teoremas de Estabilidad de Lyapunov para Sistemas no Autónomos

V. teorema de Estabilidad. El equilibrio en el origen es estable, si allı́ existe
en alguna vecindad Ω del origen, una función de Lyapunov V (x, t).
VI. Teorema de Estabilidad Asintótica Uniforme. El equilibrio en el origen

es uniforme asintóticamente estable si la función definida positiva V (x, t) es decre-
ciente (lo que significa que V está dominado por una función definida positiva W (x)
para algún t ≥ 0) y −V̇ (x, t) es definida positiva(es decir, −V̇ > 0) en Ω.
VII. Teorema de Inestabilidad. Sea Ω una vecindad del origen. Sea Ω` una
región en Ω. Dada una función V (x, t) en Ω, entonces el equilibrio del origen en el
tiempo t0 es inestable si:
(a) V (x, t) posee derivadas parciales continuas en Ω` .
(b) V (x, t) y V̇ (x, t) son definidas positivas en Ω1 .
(c) V (x, t) = 0 para algún t ≥ t0 en los puntos de frontera de Ω` dentro de Ω.
(d) El origen es un punto de frontera de Ω` dentro de Ω.
En forma similar, el teorema de inestabilidad anterior se convierte en el denomi-

nado primer teorema de inestabilidad si Ω = Ω` , donde Ω es una cierta vecindad del
origen. Si en adición a la condición Ω = Ω` , la condición V̇ > 0 es reemplazada por
V̇ (x, t) − λV (x, t) ≥ 0 ∀ t ≥ t0 ∀xΩ
donde λ es una constante positiva, entonces el teorema de inestabilidad se convierte

en el denominado segundo teorema de inestabilidad. Las demostraciones de estos
teoremas se pueden encontrar en [14].
Ejemplo A.5
Determine la estabilidad del sistema autónomo descrito en los ejemplos A.2 y A.3
aplicando el método directo de Lyapunov.
Solución: Del ejemplo A.2 podemos establecer que la función de Lyapunov V (e) =
1 2
2 Ce → ∞ cuando ||e|| → ∞. Por consiguiente, el sistema autónomo no lineal
descrito en dicho ejemplo es completa (global) asintóticamente estable.
Del ejemplo A.3 podemos establecer que la función de Lyapunov:
1 1 1
V (x) = M ẋ2 + K0 x2 + K1 x4 → ∞
2 2 4
cuando ||x|| → ∞. Por consiguiente, el sistema autónomo no lineal descrito en dicho
ejemplo es completa (global) asintóticamente estable.
Ejemplo A.6
Determine la estabilidad el sistema no autónomo descrito en el ejemplo A.4 aplicando

el método directo de Lyapunov.
Solución: Del ejemplo A.4 se puede establecer que la función de Lyapunov:

M 2 1 1 2
V (x, t) = (ẋ + αx) + K0 + K1 − M α + α b(t) x2 → ∞
2
2 2 2
conforme ||x|| → ∞, siempre que α > 0, b(t) > M α, y ḃ(t) < 2K0 . Por consiguiente,
el sistema no autónomo descrito en tal ejemplo es completa (global) asintóticamente
estable.
A.1.4. Teoremas del Conjunto Invariante

En aplicaciones relacionadas con sistemas de control, estabilidad asintótica es más
importante que estabilidad. Claramente, pequeñas desviaciones de las salidas contro-
ladas con respecto a señales de referencia deseadas se pueden cancelar como resultado
de la operación de un sistema asintóticamente estable. Sin embargo, la aplicación del
segundo teorema de estabilidad nos conduce a menudo a la relación − V̇ ≥ 0 en lugar
de la requerida condición −V̇ > 0 para estabilidad asintótica. Para tales casos, puede
ser de gran utilidad emplear el denominado teorema del conjunto invariante atribuido
a La Salle [22] con la finalidad de obtener más conclusiones acerca de la estabilidad
asintótica.
Conjunto Invariante. Se dice que un conjunto G es el conjunto invariante de un

sistema dinámico ẋ = f (x) si cada trayectoria de estado x(t) que comienza desde un
punto x0 en G permanece en G para todo tiempo. por consiguiente, una trayectoria
de estado cerrada en G es un conjunto invariante. De acuerdo a tal definición, algún
punto de equilibrio es un conjunto invariante. El dominio de atracción del punto de
equilibrio es también un conjunto invariante.
VIII. Teorema del Conjunto Invariante Local. Considere el sistema dado en

(A.3). Sea V (x) una función escalar con primeras derivadas parciales continuas. Sea
Ω` una región acotada definida por V (x) < `, con ` > 0. Asumamos que:
V̇ (x) ≤ 0 (A.5)
para todo x en Ω` . Sea R el conjunto de todos los puntos dentro de Ω` donde V̇ (x) = 0,
y sea M el más grande conjunto invariante en R. Entonces, cada solución x(t) en Ω `
tiende a M conforme t → ∞.
Que M sea el conjunto invariante más grande en R significa que M es la unión

de todos conjuntos invariantes dentro de R. La interpretación geométrica de este
teorema se ilustra en la figura A.6.
V
V=l
Ωl
x2
x0
x1
Fig. A.6: Interpretación geométrica del teorema del conjunto invariante.
Si la condición (A.5) se sustituye por

V̇ (x) < 0 for all x 6= 0 in Ω` (A.6)
y el origen está en Ω` , entonces tal origen es asintóticamente estable, y cada solución
en Ω` tiende hacia el origen conforme t → ∞.
IX. Teorema del Conjunto Invariante Global. Considere el sistema dado

en (A.3) Sea V (x) una función escalar con primeras derivadas parciales continuas.
Suponga que V (x) > 0 para todo x 6= 0 y V̇ (x) ≤ 0. Sea R el conjunto de todos los
puntos donde V̇ (x) = 0, y M el conjunto invariante más grande en R. Entonces todas
las soluciones convergen completa (global) asintóticamente en M conforme t → ∞.
En vista de los teoremas del conjunto invariante, una función de Lyapunov V tiene
que desaparecer gradualmente. Esto es, V̇ tiene que converger a cero debido a que
V es acotado inferiormente. Demostración de los teoremas del conjunto invariante se
pueden encontrar en [22], [14].
Ejemplo A.7
Considere el sistema dinámico:

ẋ1 = x1 (x21 + x22 − 4) − 4x1 x22
ẋ2 = 4x21 x2 + x2 (x21 + x22 − 4)
para el punto de equilibrio x = 0 considere la función:
V (x) = x21 + x22
A lo largo de una trayectoria de estado, su derivada V̇ es:
V̇ (x) = 2(x21 + x22 )(x21 + x22 − 4)
Observe que V̇ (x) < 0 dentro de un cı́rculo de radio 2. Por consiguiente, usando el
teorema de estabilidad II de Lyapunov, podemos inferir que el origen es asintótica-
mente estable. Para ` = 4, la región Ω` definida por V (x) = x21 +x22 < 4 es acotada y el
conjunto R es el origen, el cual es un conjunto invariante. Por consiguiente, cualquier
trayectoria que se inicia dentro del cı́rculo de radio 2 converge hacia el origen y esta
región constituye el dominio de atracción.
Bibliografı́a
[1] National Instruments, LabVIEW 2010, Development System: Professional.
[2] The MathWorks, Inc., MATLABr 7 Getting Started Guide, 1984–2010.
[3] Murray R. Spiegel, Mathematical handbook, Shaum’s Outline Series, McGraw-

Hill,Inc., 3ed Edition, New York et. al. 2008.
[4] W. F. Hughes and J. A. Brighton, Theory and Problems of Fluid Dynamics,

Shaum’s outline series, McGraw-Hill, 3ed edition, Inc., 1999.
[5] H. Goldstain, John L. Safko and Charles P. Poole Classical mechanics, 3ed.
Addison Wesley, 2001.
[6] James Curry, Hamiltonian and Lagrangian Mechanics. AuthorHouse, 2005.

ISBN-10: 1420858564. ISBN-13: 978-1420858563.
[7] Eduardo F. Camacho y Carlos Bordons, Model Predictive Control, Springer-

Verlag London Limited, 2004.
[8] Alberto Isidori, Nonlinear Control Systems, 3ed, Springer-Verlag Berlin, 1995.
[9] A. Barrientos, L. F. Peñin, C. Balaguer, and R. Aracil, Fundamentos de Robótica,

2nd Edition, McGraw-Hill/Interamericana de España, S. A., Madrid, Buenos
aires, Caracas, and others, 2007.
[10] S. Kilicaslan, S.P. BanksLocalización, “A separation theorem for nonlinear sys-

tems”, A journal of IFAC, ISSN 0005-1098, Vol. 45, No . 4, pags. 928-935, 2009.
[11] M. G. Sofonov, Stability and Robustness of Multivariable Feedback Systems, The

MIT Press Cambridge, MA, and London, England, 1980.
[12] Jeffrey B. Burl , Linear Optimal Control, Prentice Hall, 1998.
[13] D. E. Koditschek, “Natural Motion for Robot Arms´´Proc. 23rd I.E.E.E. Conf.
on Decision and Control, Las Vegas, p. 733, 1984.
[14] Jean-Jacques E. Slotine and Weiping Li, Applied Nonlinear Control, Prentice
Hall, 2006, ISBN: 0130408905, ISBN-13: 9780130408907, 978-0130408907.
[15] Asif Sabanovic, Variable Structure Systems: From Principles to Implementation,

The Institution of Engineering and Technology; illustrated edition, 2004.
88 BIBLIOGRAFÍA
[16] E. Bailey and A. Arapostathis, “Simple sliding mode control scheme applied to
robot manipulators,” Int. J. Control, vol. 45, No. 4, p. 1197–1209, 1987.
[17] Lin, Y. and E.D. Sontag, Lin, Y. and E.D. Sontag, “A universal formula for
stabilization with bounded controls”, Report 90-10, SYCON-Rutgers Center for
Systems and Control, July 1990.
[18] Jie Yu, Ali Jadbabaie, James Primbs and Yun Huang, “Comparison of nonlinear
control design techniques on a model of the Caltech ducted fan”, Automatica
Volume 37, Issue 12, Pages 1971-1978 , December 2001.
[19] Fang-Shiung Chen and Jung-Shan Lin, “Nonlinear backstepping design of robot
manipulators with velocity estimation feedback,”5th Asian Control Conference,
July 2004, vol. 1, no. 6, pp 351–356. New Jersey 07632, 1989.
[20] M. Vidyasagar, Nonlinear Systems Analysis (Second Edition), Society for Indus-
trial and Applied Mathematics Philadelphia, PA, USA , 2001, ISBN:0898715261.
[21] Katsuhiko Ogata, Modern Control Engineering (5th Edition), Prentice Hall,
2009.
[22] Joseph La Salle and Solomon Lefschetz, Stability by Liapunov’s Direct Method
With Applications, Academic Press new York, London, 1961.

Control No Lineal Multivariable 1ra Edic

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Control No Lineal Multivariable 1ra Edic

Uploaded by

Copyright:

Available Formats

CONTROL NO LINEAL

ARTURO ROJAS MORENO, Ph.D.

     

F Modelado de Sistemas No Lineales

CONTROL NO LINEAL MULTIVARIABLE

c 2011 Arturo Rojas Moreno. Todos los derechos reservados.

1. Modelado de Sistemas No Lineales 1

3. Control Adaptativo con Modelo Referencial 43

4. Control por Modos Deslizantes 53

A. El Método Directo de Lyapunov 77

La dinámica de una gran variedad de sistemas a ser controlados se puede describir

1.1. Modelado Empleando las Leyes de la Fı́sica

Fig. 1.1: El Manipulador Robótico de 1GDL (MR1).

El subsistema mecánico consiste de un brazo accionado por el torque rotacional

Modelo del Subsistema Mecánico

Para modelar el subsistema mecánico del manipulador empleamos la segunda ley

donde Jm y Bm representan el momento de inercia y la constante de fricción viscosa

Tabla 1.1: Parámetros y variables del brazo robótico de 1GDL (MR1).

Sı́mbolo Descripción Valor Unidades

Fig. 1.2: Esquema del Manipulador Robótico de 1GDL.

engranajes de reducción del servomotor podemos formular:

Tg2 θ = Tg1 θm = Tg1 nθ; Tg2 = nTg1 (1.3)

donde Tg2 es el torque de reacción debido al segundo engranaje. El balance mecánico

donde Jg y Bg representan el momento de inercia y la constante de fricción viscosa

Fig. 1.3: Brazo del manipulador robótico de 1GDL.

efector es una masa esférica de radio rh , su momento de inercia alrededor de un eje

Modelo del Subsistema Eléctrico

Conversión de Energı́a Eléctrica en Mecánica

Ecuación de Estado del Sistema MR1 con La 6= 0

Ecuación de Estado del Sistema MR1 con La ∼

Modelo de Lagrange del Sistema MR1 con La ∼

nKm ia = Jeq θ̈ + Beq θ̇ + τL τL = Qsenθ

Forma Asociada del Sistema MR1 con La ∼

Forma Asociada del Sistema MR1 con La 6= 0

d3 y Q Beq nKm dia

Reemplazando (1.18) en (1.25) se obtiene:

d3 y Q Beq nKm KA n2 K m K b nKm Ra

Despejamos ia de ( 1.19), la reemplazamos en (1.26) y luego reordenamos la ecuación

1.1.2. Manipulador Robótico con Articulación Elástica (MRAE)

Ecuaciones Dinámicas del MRAE

donde JL y BL representan el momento de inercia y la constante de fricción viscosa

Modelo de Lagrange del MRAE

u = Mq̈ + Pq̇ + d (1.35)

Modelo del MRAE en el Espacio de Estado

1.1.3. Sistema Tanque con Agua

Fig. 1.5: Sistema tanque con agua.

Modelo Lineal del Sistema Nivel

Tabla 1.2: Parámetros y variables del sistema tanque con agua.

Sı́mbolo Descripción Valor Unid.

Θ Temperatura en el tanque en estado estacionario oC

θo Temperatura del agua de salida oC

Φi Calor entregado por la resistencia eléctrica W

Fig. 1.6: Esquema de estudio del sistema tanque con agua.

La resistencia hidráulica Rh se calcula de la relación:

Modelo Lineal del Sistema Temperatura

Ecuación de Estado Lineal del Sistema Tanque

Modelo No Lineal del Sistema Nivel

donde g es la aceleración de la gravedad, Cd es el coeficiente de descarga y Ao es la

Cd = CvCc ; 0.8 ≤ Cv ≤ 0.99; 0.6 ≤ Cc ≤ 1 (1.54)

donde Cv es el coeficiente de corrección por pérdidas y Cc es el coeficiente de correc-

Modelo No Lineal del Sistema Temperatura

Ecuación de Estado No Lineal del Sistema Tanque

Modelo de Lagrange del Sistema Tanque

Empleando la primera relación de (1.59) y la ecuación (1.60), se obtiene el modelo