You are on page 1of 92

CONTROL NO LINEAL

MULTIVARIABLE
APLICACIONES EN TIEMPO REAL

ARTURO ROJAS MORENO, Ph.D.


r
  q
i



θ

       








  
θo
  


      H
Φi
 
u1

  
 
  

  
 
    

   
  
u2

           

F Modelado de Sistemas No Lineales


F Control Óptimo Cuadrático
F Control Adaptativo con Modelo Referencial
F Control por Modos Deslizantes
F Control Backstepping
II

CONTROL NO LINEAL MULTIVARIABLE


APLICACIONES EN TIEMPO REAL

c 2011 Arturo Rojas Moreno. Todos los derechos reservados.


Copyright

ISBN

Queda rigurosamente prohibida la reproducción total o parcial de esta obra por cualquier
medio o procedimiento, sin la autorización escrita del propietario del “Copyright”.
Índice general

1. Modelado de Sistemas No Lineales 1


1.1. Modelado Empleando las Leyes de la Fı́sica . . . . . . . . . . . . . . . 1
1.1.1. Manipulador Robótico de 1GDL: MR1 . . . . . . . . . . . . . . 1
1.1.2. Manipulador Robótico con Articulación Elástica (MRAE) . . . 8
1.1.3. Sistema Tanque con Agua . . . . . . . . . . . . . . . . . . . . . 12
1.2. Método de Las Ecuaciones de Lagrange . . . . . . . . . . . . . . . . . 17
1.2.1. Manipulador Robótico Traslacional (MRT) . . . . . . . . . . . 18
1.2.2. Manipulador Robótico Esférico (MRE) . . . . . . . . . . . . . . 25

2. Control Óptimo 33
2.1. Estructura del Sistema de Control Óptimo . . . . . . . . . . . . . . . . 33
2.2. Descripción dinámica del Sistema . . . . . . . . . . . . . . . . . . . . . 34
2.3. El Controlador Óptimo PI . . . . . . . . . . . . . . . . . . . . . . . . . 35
2.4. El Observador Óptimo No Lineal . . . . . . . . . . . . . . . . . . . . . 38
2.5. Procedimiento de Diseño . . . . . . . . . . . . . . . . . . . . . . . . . . 39
2.6. Aplicación en Tiempo Real . . . . . . . . . . . . . . . . . . . . . . . . 40
2.6.1. Control Óptimo del Sistema MRE . . . . . . . . . . . . . . . . 40

3. Control Adaptativo con Modelo Referencial 43


3.1. Estructura de un SCAMR . . . . . . . . . . . . . . . . . . . . . . . . . 43
3.2. SCAMR para Sistemas No Lineales Multivariables . . . . . . . . . . . 44
3.2.1. Diseño del SCAMR . . . . . . . . . . . . . . . . . . . . . . . . 44
3.2.2. El Observador de Velocidad . . . . . . . . . . . . . . . . . . . . 46
3.2.3. Zona–Muerta para Evitar Corrimiento de Parámetros . . . . . 47
3.2.4. Procedimiento de Diseño del SCAMR . . . . . . . . . . . . . . 47
3.3. Aplicaciones en Tiempo Real . . . . . . . . . . . . . . . . . . . . . . . 48
3.3.1. Control Adaptativo del Manipulador Robótico Esférico . . . . . 48

4. Control por Modos Deslizantes 53


4.1. Conceptos Básicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
4.2. Control Deslizante para Sistemas Multivariables . . . . . . . . . . . . . 56
4.2.1. El Sistema a Controlar . . . . . . . . . . . . . . . . . . . . . . . 56
4.2.2. La Superficie de Conmutación . . . . . . . . . . . . . . . . . . . 57
4.2.3. Diseño de la Fuerza de Control Multivariable . . . . . . . . . . 58
4.3. Procedimiento de Diseño . . . . . . . . . . . . . . . . . . . . . . . . . . 60
4.4. Aplicaciones en Tiempo Real . . . . . . . . . . . . . . . . . . . . . . . 61
4.4.1. Control Deslizante del Manipulador Esférico MRE . . . . . . . 61
IV ÍNDICE GENERAL

5. Control Backstepping 67
5.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
5.2. Caracterı́sticas del Modelo . . . . . . . . . . . . . . . . . . . . . . . . . 70
5.3. Diseño Backstepping No Lineal . . . . . . . . . . . . . . . . . . . . . . 71
5.4. Procedimiento de Diseño Backstepping . . . . . . . . . . . . . . . . . . 72
5.5. Aplicaciones en Tiempo Real . . . . . . . . . . . . . . . . . . . . . . . 73
5.5.1. Control Backstepping del Manipulador Esférico MRE . . . . . 73

A. El Método Directo de Lyapunov 77


A.1. Estabilidad vı́a el Método Directo de Lyapunov . . . . . . . . . . . . . 77
A.1.1. Conceptos de Estabilidad . . . . . . . . . . . . . . . . . . . . . 77
A.1.2. Funciones de Lyapunov . . . . . . . . . . . . . . . . . . . . . . 78
A.1.3. Teoremas de Estabilidad de Lyapunov . . . . . . . . . . . . . . 82
A.1.4. Teoremas del Conjunto Invariante . . . . . . . . . . . . . . . . 84

B
. ibliografı́a 87
Capı́tulo 1

Modelado de Sistemas No
Lineales

La dinámica de una gran variedad de sistemas a ser controlados se puede describir


mediante un conjunto de ecuaciones diferenciales. Tal descripción matemática se obtiene
aplicando las leyes de la fı́sicas y de la quı́mica sobre el sistema, tales como la conservación
de la energı́a, las leyes de Newton, entre otras. Para construir un modelo adecuado para
propósitos de control, se requiere conocer bien la dinámica del sistema. No siempre es
mejor que un modelo sea lo más exacto posible a su comportamiento dinámico. Tener en
cuenta que mientras más complejo sea el modelo, más dificultoso será el análisis y diseño
del sistema de control correspondiente. Lo recomendable es que el modelo del sistema
mantenga las caracterı́sticas dinámicas de interés para el rango de operación del sistema
de control a diseñar.
En este capı́tulo se emplean las siguientes estrategias de modelado: aplicación de
las leyes de la fı́sica (sección 1.1) y aplicación de las ecuaciones de Lagrange (sección
1.2). Los modelos dinámicos de los siguientes sistemas prototipo serán desarrollados en
este capı́tulo: Manipulador Robótico de 1 Grado de Libertad (MR1, leyes fı́sicas), MR1
con Articulación Elástica (MRAE, leyes fı́sicas), sistema Tanque con Agua (leyes fı́sicas),
Manipulador Robótico Esférico (MRE, ecuaciones de Lagrange) y Manipulador Robótico
Traslacional (MRT, ecuaciones de Lagrange). En la sección Problemas se propone la
derivación de modelos dinámicos de otros sistemas no lineales.

1.1. Modelado Empleando las Leyes de la Fı́sica


1.1.1. Manipulador Robótico de 1GDL: MR1
El Manipulador Robótico de 1GDL (MR1) mostrado en la Fig. 1.1 es uno de los
sistemas prototipo a ser utilizado en esta publicación para validar vı́a experimentación
algunos de los sistemas de control no lineal desarrollados en esta publicación. La
Fig. 1.2 muestra su esquema de estudio. Este sistema prototipo se compone de un
subsistema eléctrico y un subsistema mecánico. El subsistema eléctrico comprende un
servomotor DC con decodificador de posición (encoder en inglés) incorporado, el cual
se emplea para medir la posición angular del brazo del manipulador en cada instante
de tiempo. El servomotor posee una caja de engranajes para reducir la velocidad en
su eje de salida; de esta manera se facilita el control de posición del manipulador.
2 Modelado de Sistemas No Lineales

Fig. 1.1: El Manipulador Robótico de 1GDL (MR1).

El subsistema mecánico consiste de un brazo accionado por el torque rotacional


generado en el eje de salida del servomotor DC (el actuador). En el extremo libre del
brazo robótico se puede acoplar un efector final, el cual puede ser una pinza para asir
objetos, una herramienta para soldar, una herramienta para pintar, etc. En nuestro
caso usaremos una pinza con dos grados de libertad: un grado para rotar la pinza y
otro para abrirla y cerrarla. Para propósitos de modelado, vamos a suponer que el
efector final y su carga se pueden modelar mediante una masa mh variable. La Tabla
1.1 describe las variables y los valores de los parámetros del manipulador mostrado
en la Fig. 1.2.
El sistema MR1 es del tipo SISO ya que sólo posee una entrada: el voltaje de
control u aplicado a la armadura del servomotor, y una salida: la posición angular θ
del brazo.

Modelo del Subsistema Mecánico

Para modelar el subsistema mecánico del manipulador empleamos la segunda ley


de Newton para los movimientos lineal y rotacional. La aplicación de esta segunda
ley se traduce en una ecuación de balance mecánico. Con respecto a la Fig. 1.2, la
ecuación de balance mecánico en el eje del servomotor articulado al primer engranaje
se formula como:

dθm d 2 θm
Tm = Jm θ̈m + Bm θ̇m + Tg1 θ̇m = θ̈m = (1.1)
dt dt2

donde Jm y Bm representan el momento de inercia y la constante de fricción viscosa


del rotor respectivamente, Tm es el torque del servomotor, Tg1 es el torque de reacción
debido al primer engranaje y θm es la posición angular en el lado del motor. Para los
1.1 Modelado Empleando las Leyes de la Fı́sica 3

Tabla 1.1: Parámetros y variables del brazo robótico de 1GDL (MR1).

Sı́mbolo Descripción Valor Unidades


u Voltaje de entrada al sistema V
KA Ganancia del amplificador 8.5
Va Voltaje de armadura V
Ra Resistencia de armadura 3.5 Ω
La Inductancia de armadura 0.004 H
ia Corriente de armadura A
Km Constante del torque motor 0.0436 N-m/A
Tm Torque motor N-m
TL Torque de carga N-m
τL Torque causado por pesos de la carga N-m
Tg1 Torque de entrada a los engranajes N-m
Tg2 Torque de salida de los engranajes N-m
Jm Inercia del motor 0.00059 kg-m2
Jg Inercia de los engranajes 0.066 kg-m2
JL Inercia de la carga kg-m2
Bm Constante de fricción del motor 0.00014 N-m/rad/s
Bg Constante de fricción en engranajes 0.0124 N-m/rad/s
BL Constante de fricción en la carga 0.0023 N-m/rad/s
mh Masa del efector final 0.1 kg
mb Masa del brazo 0.4 kg
L Longitud del brazo 0.25 m
rh Distancia al centro de masa del efector 0.02 m
Vb Voltaje contra electromotriz V
Kb Constante contra electromotriz 0.0565 V/rad/s
g Aceleración de la gravedad 9.81 m/s2
N1 , N2 N o de dientes de los engranajes N 2 > N1
n Relación de engranajes (n = N2 /N1 ) 18.5
θm Posición angular del motor rad
θ Posición angular de la carga rad
ω Velocidad angular de la carga rad/s
ωm Velocidad angular del motor ωm = nω rad/s
Kw Constante de elasticidad 0.052 N-m/rad
4 Modelado de Sistemas No Lineales

La ia mh
θm mh
ωm


 
 
  N1
 L
 
+ + θ θ
   


    
u KA ω mb L
V
_ _b 
 

  
 L  
Tm Bm Tg1
Jm   
 BL
τ

N2 T Bg TL J
Ra g2 L
Jg

Fig. 1.2: Esquema del Manipulador Robótico de 1GDL.

engranajes de reducción del servomotor podemos formular:


N2 θm
n= = θm = nθ n>1 (1.2)
N1 θ
donde N1 y N2 es el número de dientes de los engranajes y n > 1 es la relación entre
ellos. Para formular la ecuación (1.2) se ha tenido en cuenta que el espacio angular
recorrido por el engranaje de menor radio es n veces mayor que el espacio recorrido
por el engranaje de radio mayor. Por otra parte, el principio de la conservación de la
energı́a establece que el trabajo realizado por el engranaje de la izquierda debe ser
igual al trabajo realizado por el engranaje de la derecha, es decir:

Tg2 θ = Tg1 θm = Tg1 nθ; Tg2 = nTg1 (1.3)

donde Tg2 es el torque de reacción debido al segundo engranaje. El balance mecánico


en el eje articulado al brazo del manipulador produce:

Tg2 = Jg θ̈ + Bg θ̇ + TL (1.4)

donde Jg y Bg representan el momento de inercia y la constante de fricción viscosa


de la caja de reducción respectivamente. El torque de carga TL se formula como (ver
Fig. 1.3):

TL = JL θ̈ + BL θ̇ + τL (1.5)
L
τL = mb g senθ + mh g (L + rh )senθ = Q sen θ (1.6)
2
L
Q = mb g + mh g (L + rh )
2
donde JL y BL representan el momento de inercia y la constante de fricción viscosa
de la carga no lineal (brazo más efector final), g es la constante gravitacional, m b
y mh denotan las masas del brazo y del efector final (esta masa también incluye la
masa de la carga en el efector) respectivamente, y rh denota la distancia desde el
extremo del brazo al centro de masa de mh .
1.1 Modelado Empleando las Leyes de la Fı́sica 5

rh

θ _
L
2
mhg
_L τL
2
mb g

Fig. 1.3: Brazo del manipulador robótico de 1GDL.

Notar en (1.6) que el torque τL se debe a las fuerzas ejercidas por los pesos del
brazo y de la esfera. Ası́, el torque mb g L senθ
2 es el producto del peso mb g del brazo
L senθ
por su brazo de palanca 2 , mientras que el torque mh g (L+rh )senθ es el producto
del peso mh g del efector por su brazo de palanca (L + rh )senθ.
El momento de inercia JL de la carga es la suma del momento de inercia del brazo
Jb más el momento de inercia del efector Jh . Por otra parte, el teorema de los ejes
paralelos, establece que el momento de inercia de una masa m alrededor de un eje de
rotación que no pasa por su C.M. está dado por:

J = Jo + m a 2 (1.7)

donde Jo es el momento de inercia de m alrededor del eje de rotación que pasa por
su centro de masa y a es la distancia entre los dos ejes. Asumiendo que la masa
mb del brazo se concentra en su C.M., su momento de inercia con relación a un eje
perpendicular que pasa por su C.M. es [3]:

1
Jbo = mb L2 (1.8)
12
Considerando que la masa del brazo está distribuida a lo largo de su longitud y
aplicando el teorema de los ejes paralelos, el momento de inercia Jb con respecto al
punto de articulación se formula como:
 2
L 1
Jb = Jbo + mb = mb L2 (1.9)
2 3

Del mismo modo, asumiendo que la masa mh del efector está concentrada en su C.M.,
entonces:
Jh = Jho + mh (L + rh )2 (1.10)

donde Jho es el momento de inercia del efector con relación a un eje de rotación
que pasa por su C.M. Si consideramos por ejemplo, sin perder generalidad, que el
6 Modelado de Sistemas No Lineales

efector es una masa esférica de radio rh , su momento de inercia alrededor de un eje


de rotación que coincide con su diámetro [3] es:
2
Jho = mh rh2 (1.11)
5
Empleando (1.5), (1.6), (1.4), (1.3) y (1.2) en (1.1) y operando se obtiene:
nTm = Jeq θ̈ + Beq θ̇ + τL = Jeq ω̇ + Beq ω + Q senθ (1.12)
donde:
Jeq = n2 Jm + Jg + JL Beq = n2 Bm + Bg + BL
Las expresiones de Q, Jh y Jb (tener en cuenta que JL = Jh + Jb ) se dan en (1.6),
(1.10) y (1.8) respectivamente.

Modelo del Subsistema Eléctrico


El voltaje de armadura Va viene expresado por (ver la descripción de las variables
y parámetros en la Tabla 1.1):
dia
Va = ia Ra + La + Vb (1.13)
dt
donde ia , Ra y La son la corriente, la resistencia y la inductancia en la armadura
del servomotor respectivamente, y Vb es el voltaje de fuerza contra electromotriz
gobernado por la relación:
Vb = Kb ωm = Kb nω = Kb nθ̇ (1.14)
donde Kb es la constante de fuerza contra electromotriz y ωm es la velocidad angular
del motor. El voltaje de armadura Va es:
Va = K A u (1.15)
donde KA es la ganancia del amplificador.

Conversión de Energı́a Eléctrica en Mecánica


Sabemos que el torque motor Tm (energı́a mecánica) es proporcional a la corriente
de armadura ia (energı́a eléctrica):
Tm = K m i a (1.16)
donde Km es la constante del motor. Reemplazando (1.12) en ( 1.16) se obtiene la
siguiente ecuación de conversión de energı́a eléctrica a energı́a mecánica:
nKm ia = Jeq θ̈ + Beq θ̇ + τL (1.17)
Por otra parte, igualando (1.13) con (1.15) obtenemos:
dia KA Kb n Ra
= u− ω− ia (1.18)
dt La La La
Empleando (1.16) en (1.12) y despejando ω̇ = dω/dt obtenemos:
dω Q Beq nKm
=− senθ − ω+ ia (1.19)
dt Jeq Jeq Jeq
1.1 Modelado Empleando las Leyes de la Fı́sica 7

Ecuación de Estado del Sistema MR1 con La 6= 0


Las ecuaciones (1.18) y (1.19) describen el modelo no lineal del sistema de tercer
orden. Eligiendo en dichas ecuaciones como variables de estado: x1 = θ (posición
angular), x2 = θ̇ (velocidad angular) y x3 = ia (corriente de armadura), se obtiene:

ẋ1 = x2
Q Beq nKm
ẋ2 = − senx1 − x2 + x3
Jeq Jeq Jeq
nKb Ra KA
ẋ3 = − x2 − x3 + u (1.20)
La La La
donde la salida es la posición x1 y la señal de control es u (la tensión de armadura).

Ecuación de Estado del Sistema MR1 con La ∼


=0
En la Tabla 1.1 podemos observar que la inductancia de armadura La del ser-
vomotor es bastante pequeña, de modo tal que puede despreciarse sin que se pierda
considerable exactitud en los resultados. Considerando el producto ẋ 3 La = 0 en la
tercera ecuación de (1.20) y despejando la corriente de armadura x 3 resulta:
KA nKb
x3 = u− x2 (1.21)
Ra Ra
Reemplazando (1.21) en la segunda ecuación de (1.20), se obtiene la ecuación de
estado no lineal de orden dos del manipulador:

ẋ1 = x2
ẋ2 = −a1 senx1 − a2 x2 + bu (1.22)

donde:
 
Q Beq Ra + n2 Km Kb nKm KA
a1 = a2 = b=
Jeq Jeq Ra Jeq Ra

Modelo de Lagrange del Sistema MR1 con La ∼


=0
La ecuación (1.16) tiene la forma de (1.12):

nKm ia = Jeq θ̈ + Beq θ̇ + τL τL = Qsenθ


dia
Si despreciamos la inductancia La en (1.18), entonces el producto La dt iguala a
cero. Por consiguiente:
0 = KA u − Kb n θ̇ − Ra ia
Combinando las dos últimas ecuaciones se obtiene el denominado modelo dinámico
de Lagrange:
M θ̈ + P θ̇ + d = u (1.23)
donde:
 
Jeq Ra Beq Ra nKb Ra Q
M= P = + d= senθ
nKm KA nKm KA KA nKm KA
8 Modelado de Sistemas No Lineales

Forma Asociada del Sistema MR1 con La ∼


=0
La ecuación (1.23) se puede poner en su denominada forma asociada:
2
X
M θ̈ + P θ̇ + d = hθ̈ + αi fi = hθ̈ + α1 f1 + α2 f2 = u (1.24)
i=1

donde:
Ra Q
h=M α1 = P f1 = θ̇ α2 = f2 = senθ
nKm KA

Forma Asociada del Sistema MR1 con La 6= 0


Definamos y = θ y x = [ y ẏ ÿ y (3) ]. Derivando (1.19) se obtiene:

d3 y Q Beq nKm dia


3
=− cos y ẏ − ÿ + (1.25)
dt Jeq Jeq Jeq dt

Reemplazando (1.18) en (1.25) se obtiene:

d3 y Q Beq nKm KA n2 K m K b nKm Ra


= − cos y ẏ − ÿ + u − ẏ − ia (1.26)
dt3 Jeq Jeq Jeq La Jeq La Jeq La

Despejamos ia de ( 1.19), la reemplazamos en (1.26) y luego reordenamos la ecuación


resultante para obtener la siguiente forma asociada del sistema MR1:
4
X
h y (3) + αi fi (x) = u (1.27)
i=1

donde:  
Jeq La Beq La + Ra Jeq
h= α1 =
nKm KA nKA Km
 
nKb Ra Beq QLa Ra Q
α2 = + α3 = α4 =
KA nKA Km nKA Km nKA Km
f1 = ÿ f2 = ẏ f3 = ẏ cos y f4 = sen y

1.1.2. Manipulador Robótico con Articulación Elástica (MRAE)


La Fig. 1.4 muestra el esquema de estudio Manipulador Robótico con Articulación
Elástica (MRAE) de 1GDL. El efecto del acoplamiento elástico entre el eje de salida
del servomotor con el brazo (o eslabón) del MRAE, se puede modelar mediante un
resorte rotacional con constante de elasticidad Kw .
En la Fig. 1.4, u denota el voltaje de entrada, θ (la salida del sistema) es la posición
angular del brazo de longitud L y masa mb , θm representa la posición angular del eje
del actuador (el servomotor DC) antes de la caja de reducción. Al extremo del brazo
se puede articular un efector final, como en el caso del manipulador de 1GDL. La
Tabla 1.1 también describe las variables y los valores de los parámetros del sistema
mostrado en la Fig. 1.2.
1.1 Modelado Empleando las Leyes de la Fı́sica 9

La ia mh
θm mh
ωm
$%
%
$%$% $%
$% %$
+ + $ %$%$ N1
θ L θ
&'
'
& ' &'
& '&'& /./. 1101K*+ w-,-,
KA ω mb
_
u Vb
.
./ ./
. * 
"
!!#
"!! #!" !!!
L
_
( ( 
) *

* ( ) 00 ***+++ -,-,  
!
L" " !
!# !#" !!

* τ !
Tm Bm Tg1 (
() ((
) * )(() *+ 
Jm BL
Ra N 2 T Bg TL J
g2 L
Jg

Fig. 1.4: Esquema de estudio del Manipulador Robótico con Articulación Elástica
(MRAE).

Ecuaciones Dinámicas del MRAE


El balance mecánico en el eje del servomotor articulado al primer engranaje se
expresa como:
Tm = Jm θ̈m + Bm θ̇m + Tg1
donde Jm y Bm representan el momento de inercia y la constante de fricción viscosa
del rotor, Tm es el torque del servomotor y Tg1 es el torque de reacción debido al
primer engranaje. El balance mecánico del eje articulado a la carga se expresa como:
 
θ̈m θ̇m θm
Tg2 = Jg + Bg + Kw −θ
n n n

en donde Kw θnm − θ es el torque originado por el acoplamiento elástico, Tg2 es el
torque debido al segundo engranaje, n = N2 /N1 denota la relación de transmisión de
los engranajes, y Jg y Bg representan el momento de inercia y la constante de fricción
viscosa de la caja de reducción respectivamente. Asumiendo engranajes ideales, la
conservación de la energı́a requiere que el trabajo realizado por cada engranaje debe
de ser el mismo, a saber:
θm
Tg1 θm = Tg2
n
Empleando las relaciones anteriores, la ecuación que gobierna el torque servomotor
se formula como:
! !  
Jeq θ̈m Beq θ̇m K w θm
Tm = + + −θ (1.28)
n n n n n n

Jeq = n2 Jm + Jg Beq = n2 Bm + Bg
La ecuación que gobierna la dinámica del brazo del manipulador (ver Fig. 1.3) se
puede expresar como:
 
θm 1
Kw − θ = JL θ̈ + BL θ̇ + mb gLsen θ + mh g(L + rh )sen θ (1.29)
n 2
10 Modelado de Sistemas No Lineales

donde JL y BL representan el momento de inercia y la constante de fricción viscosa


de la carga no lineal (brazo más efector), g es la constante gravitacional, m b y mh
(esta masa también incluye la masa de la carga) denotan la masa del brazo y del
efector respectivamente, rh es la distancia al C.M. del efector y, 21 mb g(L + rh )sen θ y
mh gL sen θ son los torques debido a los pesos del brazo y del efector respectivamente.
Los momentos de inercia Jh y Jb (se sabe que JL = Jh +Jb ), asumiendo que las masas
mh y mb se concentran en sus respectivos C.M., se formularon en (1.9) y (1.10).
Para completar el modelado de la parte eléctrica del sistema MRAE, podemos
aseverar que:
dia
Ra ia + La + Vb = K A u (1.30)
dt
donde KA es la ganancia del amplificador y Vb es el voltaje de la fuerza contra
electromotrı́z y responde a la relación:
Vb = Kb θ̇m (1.31)
donde Kb es la constante de fuerza contra electromotriz. El torque servomotor T m es
también proporcional a la corriente ia , es decir:
Tm = K m i a (1.32)
donde Km es la constante del servomotor.

Modelo de Lagrange del MRAE


Las ecuaciones (1.28) y (1.29) se pueden reordenar en forma matricial, con el
propósito de obtener el denominado modelo dinámico de Lagrange del sistema MRAE:
T = Hq̈ + Cq̇ + d (1.33)
donde:
   Jeq  θ̈m
  Beq  θ̇m
  Kw θm
 
Tm n 0 n n 0 n n n −θ
 = 

 
+ 

 
+ 
0 0 JL θ̈ 0 BL θ̇ d2

  
1 θm
d2 = mb + mh Lg sen θ − Kw −θ
2 n
Despreciando la inductancia de armadura La en (1.30), y despejando ia se obtiene:
Kb KA
ia = − θ̇m + u (1.34)
Ra Ra
Sustituyendo ia en Tm = Km ia de (1.33) y despejando u, el modelo de Lagrange
toma una nueva forma:

u = Mq̈ + Pq̇ + d (1.35)


     θ̈     θ̇   
u m11 0 m
n 
p11 0 m
n 
d1
 =       
 +   + (1.36)
0 0 JL θ̈ 0 BL θ̇ d2
 
Ra Jeq nKb Ra Beq Ra Kw θm
m11 = p11 = + d1 = −θ
nKA Km KA nKA Km nKA Km n
1.1 Modelado Empleando las Leyes de la Fı́sica 11

Modelo del MRAE en el Espacio de Estado


Seleccionando como variables de estado: x1 = θ, x2 = θ̇, x3 = θm /n, x4 =
θ̇m /n, y x5 = ia , entonces el vector de estado del sistema es de orden 5. Luego,
las ecuaciones (1.28), (1.29) y (1.30) (sin despreciar la inductancia L a ) producen la
siguiente ecuación de estado no lineal:
   
ẋ1 f1 (x, u)
 ẋ2   f2 (x, u) 
   
ẋ =    
 ẋ3  = f (x, u) =  f3 (x, u)  (1.37)
 ẋ4   f4 (x, u) 
ẋ5 f5 (x, u)

f1 (x, u) = x2
Kw BL Kw Lg  mb 
f2 (x, u) = − x1 − x2 + x3 − + mh sen x1
JL JL JL JL 2
f3 (x, u) = x4
Kw Kw Beq nKm
f4 (x, u) = x1 − x3 − x4 + x5
Jeq Jeq Jeq Jeq
nKb Ra KA
f5 (x, u) = − x4 − x5 + u
La La La
donde hemos usado el hecho de que ẋ1 = x2 y ẋ3 = x4 . Si la salida del sistema es
y = θ, entonces la ecuación de salida del MRAE resulta:
y = h(x) = Cx = [1 0 0 0 0] x (1.38)
Despreciando la inductancia de armadura La en (1.37), lo que equivale a eliminar
un elemento almacenador de energı́a independiente (por consiguiente, eliminar una
variable de estado), entonces:
nKb KA
La ẋ5 = 0 = −nKb x4 − Ra x5 + KA u ⇒ x5 = − x4 + u
Ra Ra
Reemplazando x5 en la cuarta ecuación de (1.37), se obtiene una ecuación de estado
no lineal de orden 4:    
ẋ1 f1 (x, u)
 ẋ2   f2 (x, u) 
   
 ẋ3  =  f3 (x, u) 
(1.39)
ẋ4 f4 (x, u)

f1 (x) = x2
Kw BL Kw Lg  mb 
f2 (x) = − x1 − x2 + x3 − + mH sen x1
JL JL JL JL 2
f3 (x) = x4
 2 
Kw Kw n Km Kb Beq nKm KA
f4 (x) = x1 − x3 − + x4 + u
Jeq Jeq Jeq Ra Jeq Jeq Ra
La salida del sistema en este caso se expresa como:
y = h(x) = Cx = [1 0 0 0] x (1.40)
12 Modelado de Sistemas No Lineales

1.1.3. Sistema Tanque con Agua


El sistema tanque con agua estudiado aquı́ se muestra en la Fig. 1.5. La Fig. 1.6
muestra el esquema para estudio de este sistema, donde el flujo de agua frı́a q i que
ingresa al tanque se calienta en forma controlada mediante el calor Φ i entregado por
la resistencia eléctrica. El agua calentada puede ser usado luego por los consumidores.

Fig. 1.5: Sistema tanque con agua.

Este sistema es multivariable porque posee dos entradas y dos salidas. Las varia-
bles de entrada (las fuerzas de control) son el flujo de agua qi y el calor Φi suministrado
al agua por la resistencia eléctrica. Las variables de salida (las señales controladas)
son el nivel H del lı́quido en el tanque y la temperatura de salida θo del agua calen-
tada. La Tabla 1.2 describe las variables y los valores de los parámetros del sistema
tanque de agua.

Modelo Lineal del Sistema Nivel


El volumen de agua acumulado en el tanque se modela como:

dh
A = Aḣ = qi − qo (1.41)
dt
Considerando un flujo laminar de salida:

h
qo = (1.42)
Rh
1.1 Modelado Empleando las Leyes de la Fı́sica 13

Tabla 1.2: Parámetros y variables del sistema tanque con agua.

Sı́mbolo Descripción Valor Unid.


dA Diámetro del tanque 0.265 m
A Sección circular del tanque 0.055 m2
h Nivel del agua en el tanque m
H Estado estacionario de h 0.12 m
qi Flujo de agua de entrada al tanque m3 /s
qo Flujo de agua de salida del tanque m3 /s
Q Estado estacionario de qo y qi 0.16 m3 /h
Rh Resistencia hidráulica del tanque: Rh = H/Q 2700 s/m2
g Aceleración de la gravedad 9.81 m/s2
ρ Densidad del agua 1000 kg/m3
do Diámetro del orificio de salida 0.0127 m
Ao Sección del orificio de salida 0.000126 m2
Av Sección de la vena contracta m2
Cc Coeficiente de corrección entre Ao y Av 0.6 a 1
Cv Coeficiente de corrección por pérdidas 0.8 a 0.99
Cd Coeficiente de descarga:Cd = Cv Cc 0.5

a Factor de flujo turbulento: a = Cd AO 2g 0.00028 m2.5 /s
J
Cp Calor especı́fico del agua 4186.8 kg K
Ct Capacitancia térmica del tanque: Ct = ρAHCp 27633 K/W
Rt Resistencia térmica del tanque: Rt = C 1ρQ 0.0054 K/W
p
θa Temperatura ambiente oC

Θ Temperatura en el tanque en estado estacionario oC

θo Temperatura del agua de salida oC

Φi Calor entregado por la resistencia eléctrica W


Φi Calor en estado estacionario 1540 W
ΦT Calor del agua en el tanque W
Φo Calor que toma el flujo de salida W
Φs Calor que se libera al exterior: Φs = ΘoR−Θt
a
W
Φc Calor que trae consigo el flujo de entrada W
14 Modelado de Sistemas No Lineales

66
565 θi

θa
5 qi

9:3 9 9
A
9:3 9:3 22 4242
43
:3
9 :3 3
: 9 :3 3
: 9 :3 9 :3 9 :9:9 43 2432 4242
43
θo
H
Φi

7 87
83 qo
Ao

Fig. 1.6: Esquema de estudio del sistema tanque con agua.

La resistencia hidráulica Rh se calcula de la relación:


H
Rh = (1.43)
Q
donde H y Q son los valores estacionarios de h y qo respectivamente. Luego, la
ecuación de estado del sistema nivel toma la forma:
1 1
ḣ = − h + qi (1.44)
ARh A
y su función de transferencia resulta:
h(s) Rh
= (1.45)
qi (s) ARh s + 1
donde el producto ARh es la constante de tiempo en s del sistema nivel.

Determinación Experimental de Rh
La válvula de control empleada para regular la entrada de agua al tanque es del
tipo VXN015F250, con diámetro nominal DN15, conexión G1B y actuador motórico.
La abertura máxima se obtiene alimentando con 10 V al actuador, la cual corresponde
a un flujo de 0.4 m3 /h, de acuerdo al manual del fabricante. La mı́nima abertura,
con 0 V, corresponde a un flujo de 0 m3 /h. Esto significa que para una abertura de
1 V el flujo que pasa por la válvula es de 1/90000 m3 /s.
Asumiendo una variación lineal entre el flujo qi que pasa por la válvula y la altura
h del tanque, se realizó el siguiente experimento. Con una abertura de válvula para
4 V (0.16 m3 /h), se abrió convenientemente la válvula de descarga hasta lograr una
altura estable de 0.12 m. Luego, con una abertura de válvula para 6 V (0.24 m 3 /h), se
siguió abriendo la válvula de descarga hasta lograr una altura de 0.18 m. Empleando
la relación:
H
Rh =
Q
la resistencia hidráulica para cada punto resultó aproximadamente R h = 2700 s/m2 .
Se asume que los valores en estado estacionario de h y qi son H = 0.12 m y Q = 0.16
m3 /h respectivamente.
1.1 Modelado Empleando las Leyes de la Fı́sica 15

Modelo Lineal del Sistema Temperatura


El calor en el interior del tanque se modela aproximadamente como:
dθo
Ct = Φi − Φo (1.46)
dt
donde:
Φo = C p ρ Q θo (1.47)
Por consiguiente, la ecuación de estado del sistema temperatura resulta:
1 1
θ˙o = − θo + Φi (1.48)
Rt Ct Ct
donde la capacitancia térmica Ct y la resistencia térmica Rt se calculan de:
1
Ct = ρAHCp Rt = (1.49)
Cp ρQ
La función de transferencia del sistema temperatura toma la forma:
θo (s) Rt
= (1.50)
Φi (s) Ct Rt s + 1
donde el producto Ct Rt es la constante de tiempo de dicho sistema.

Ecuación de Estado Lineal del Sistema Tanque


Juntando las ecuaciones (1.44) y (1.48), las ecuaciones de estado y de salida
lineales del sistema tanque con agua resulta:

ẋ = A x + B u y = Cx (1.51)
           
x1 h u1 qi y1 h
x= = u= = y= =
x2 θo u2 Φi y2 θo
 1   1   
− AR 0 A 0 1 0
A= h B= C=
0 − Rt1Ct 0 C1t 0 1

Modelo No Lineal del Sistema Nivel


El volumen de agua acumulado en el tanque se modela como:
dh
A = Aḣ = qi − qo (1.52)
dt
donde qi y qo son los flujos de agua de entrada y salida respectivamente y h es la
altura del tanque. Para orificios circulares pequeños, se puede formular [4]:
p √ p
qo = Cd Ao 2gh = a h; a = Cd Ao 2g (1.53)

donde g es la aceleración de la gravedad, Cd es el coeficiente de descarga y Ao es la


sección del orificio de salida. Se sabe además que [4]:

Cd = CvCc ; 0.8 ≤ Cv ≤ 0.99; 0.6 ≤ Cc ≤ 1 (1.54)


16 Modelado de Sistemas No Lineales

donde Cv es el coeficiente de corrección por pérdidas y Cc es el coeficiente de correc-


ción entre Ao y Av (la sección de la vena contracta). Para nuestro estudio tomaremos
Cd =0.5. De (1.52) se obtiene la primera ecuación de estado:
a√ 1
ḣ = − h + qi (1.55)
A A

Modelo No Lineal del Sistema Temperatura


El balance de energı́a térmica dentro del tanque se formula:
ΦT = −Φo − Φs + Φc + Φi (1.56)
donde Φi es calor entregado por la resistencia eléctrica, ΦT es el calor del agua en
el tanque, Φo es el calor que toma el flujo de salida, Φs es el calor que se libera
al exterior y Φc es el calor que trae consigo el flujo de entrada. Las relaciones que
gobiernan tales flujos calorı́ficos:
dθo
ΦT = AhρCp
√dt
Φo = Cp ρθo a h
θo − θ a
Φs =
Rt
Φc = Cp ρθi qi (1.57)
Los parámetros que aparecen en (1.57) se describen en la tabla 1.2. La ecuación de
estado del sistema temperatura se obtiene despejando dθ
dt = θ̇o de (1.56):
o

a √ θo − θ a θi 1
θ̇o = − θo h − + qi + Φi (1.58)
Ah AhρCp Rt Ah AhρCp

Ecuación de Estado No Lineal del Sistema Tanque


Seleccionemos como variables de estado q1 = h, q2 = θo y como entradas de control
u1 = qi , u2 = Φi . Introduciendo tales variables en ( 1.55) y (1.58), las ecuaciones de
estado del sistema resultan:
      
q̇1 f1 G11 0 u1
= + (1.59)
q̇2 f2 G21 G22 u2
a√ a √ q2 − θ a
f1 = − q1 f2 = − q2 q1 −
A Aq1 AρCp Rt q1
1 θi 1
G11 = G21 = G22 =
A Aq1 AρCp q1

Modelo de Lagrange del Sistema Tanque


Para obtener el modelo de Lagrange del sistema tanque, despejamos u 1 de la
primera relación de (1.59) y lo reemplazamos en la segunda relación de dicha ecuación.
El resultado es la siguiente ecuación de estado:
a √ q2 − θ a θi √ 1
q̇2 = − q2 q 1 − + (Aq̇1 + a q1 ) + u2 (1.60)
Aq1 AρCp Rt q1 Aq1 AρCp q1
1.2 Método de Las Ecuaciones de Lagrange 17

Empleando la primera relación de (1.59) y la ecuación (1.60), se obtiene el modelo


de Lagrange del sistema:
      
u1 P11 0 q̇1 d11
= + (1.61)
u2 P21 P22 q̇2 d21

P11 = A P21 = −AρCp θi P22 = AρCp q1


√ √ √ q2 − θ a
d11 = a q1 d21 = Cp ρa q1 q2 − Cp ρa q1 θi +
Rt

Determinación del Estado Estacionario Φi


El actuador que emplea el sistema de control de temperatura trabaja en el rango
de voltaje de 1 a 5 V. Con 5 V, el calefactor proporciona un flujo máximo de calor de
7700 W, de acuerdo al manual del fabricante. Se asume una correspondencia lineal
entre el voltaje que ingresa al actuador y el flujo de calor entregado. Entonces, para
subir 1 V en dicho actuador (de 1 a 2 V o de 4 a 5 V por ejemplo), se debe de
proporcionar 7700/4 = 1925 W. Empleando esta escala se puede fijar el valor de Φ i .

1.2. Método de Las Ecuaciones de Lagrange


Las ecuaciones diferenciales que gobiernan el movimiento de complicados sistemas,
se pueden obtener empleando las ecuaciones de Lagrange, las cuales se derivan de las
leyes de Newton del movimiento. El método de las ecuaciones de Lagrange considera
cantidades escalares (energı́as potencial y cinética) en lugar de vectores (fuerzas y
torques), minimizando ası́ la necesidad de complicados diagramas vectoriales.
El modelo dinámico del sistema obtenido con el método de las ecuaciones de
Lagrange se denomina el modelo de Lagrange. Este modelo también nos permite de-
terminar el modelo en el espacio de estado. El método en cuestión requiere de la
representación del sistema mediante un conjunto de coordenadas generalizadas q i
(i = 1, 2, . . . , r), una para cada grado de libertad independiente del sistema. Luego,
la energı́a cinética V y la energı́a potencial U se formulan en términos de tales coorde-
nadas y de sus derivadas con el fin de establecer la función Lagrangiana del sistema,
la cual toma la forma:

L = V (q1 , . . . , qr , q̇1 , . . . , q̇r ) − U (q1 , . . . , qr , q̇1 , . . . , q̇r ) (1.62)

Notar en la ecuación (1.62) que L depende de las variables q1 , . . . , qr , q̇1 , . . . , q̇r . Por
otra parte, de acuerdo al principio de la mı́nima acción de Hamilton para sistemas
conservativos, la integral I definida por:
Z t2
I= L(q1 , . . . , qr , q̇1 , . . . , q̇r )
t1

es un extremo para la trayectoria de movimiento del sistema desde el tiempo t 1 hasta


el tiempo t2 . En adición, la variación de I es igual al trabajo realizado por fuerzas
externas. Basado en el principio de Hamilton, se puede demostrar que las ecuaciones
18 Modelado de Sistemas No Lineales

que gobiernan el movimiento de un sistema dinámico constituyen las ecuaciones de


Lagrange [5], [6]:  
d ∂L ∂L
− = Qi i = 1, 2, . . . , r (1.63)
dt ∂ q̇i ∂qi
donde Qi indica las fuerzas y torques generalizados que son externos al sistema o no
son obtenibles a partir de una función potencial escalar. Si asignamos una variable de
estado para cada coordenada generalizada qi y otra para su derivada q̇i , tendremos
entonces 2r ecuaciones diferenciales de segundo orden de la forma dada en (1.63)
correspondientes al sistema de r grados de libertad.

1.2.1. Manipulador Robótico Traslacional (MRT)


Descripción del Sistema
La Fig. 1.7 ilustra el manipulador robótico traslacional (MRT) de 2 GDL, mien-
tras que la Fig. 1.8 muestra el esquema de estudio de este sistema, en donde M1 es
un servomotor DC que posee un mecanismo de reducción por engranajes y un deco-
dificador óptico y está articulado a una polea de radio rp . Esta polea usa un cable
para transmitir la fuerza F para accionar el movimiento de traslación de un carro de
masa mc montado sobre un par de rieles a lo largo de un eje x. M2 es también un
servomotor similar a M1 , empleado para accionar el movimiento rotatorio del brazo
(el eslabón) del MRT alrededor de una articulación ubicada en el centro de masa del
carro. Dado que M1 y M2 son similares, entonces poseen los mismos parámetros.

Fig. 1.7: MRT: Manipulador robótico traslacional.

En la Fig. 1.8, θ es la posición angular del brazo de longitud L y masa ma , r es la


posición longitudinal del carro y Ff es la fuerza de fricción opuesta al movimiento del
carro. Al extremo del brazo se puede articular una mano o efector final de longitud
1.2 Método de Las Ecuaciones de Lagrange 19

Lh y masa mh para diferentes propósitos. El sistema MRT es multivariable cuadrado,


denominado ası́ por poseer dos entradas: los voltajes u1 y u2 aplicados a los terminales
de las armaduras de M1 y M2 respectivamente, y dos salidas: r y θ. La tabla 1.3
muestra los valores de los parámetros del sistema MRT.

Lh
y EFECTOR
m h FINAL
BRAZO
ma
L bcos θ
M1 POLEA θ ><
>< >> mp
;=<
=<
;< =; ?<
>?<?>?
=; =;=; PIVOTE
@A<
A<
@A@<A< @A<
@A< A@A@ CARRO ?<?
@ A@ x rp
M2 F
B< B
B<C< <
C B
B C< <
C B
B C< <
C B
B C< <
C B
B C< <
C B
B C< <
C FCB<
f B<
B CB<C< C B
B C< <
C B
B C< <
C B C< B <
C B C< B <
C B C< B <
C B
B C< <
C B
B C< <
C B
B C< <
C BC<
B C< BC<
B C< BC<
B C< BC<
B C< BC<
B C< BC<
B C< BC<
B C< B CBCB
r L b sen θ

Fig. 1.8: El manipulador robótico traslacional (MRT).

Ecuaciones de Energı́a del MRT


Ecuaciones de Energı́a del Carro
El carro está confinado a moverse en la dirección horizontal x (ver Fig. 1.8). Su
energı́a cinética V1 y su energı́a potencial U1 vienen dadas por:
1
V1 = mc ṙ2 U1 = 0 (1.64)
2

Ecuaciones de Energı́a del Brazo


Sean ma y mh las masas del brazo y del efector más su carga respectivamente.
Asumiendo que el brazo y el efector final forman una unidad de masa mb = ma + mh
y longitud Lb = L + Lh , donde Lh es mucho menor que L por conveniencia, la energı́a
cinética almacenada en el brazo se formula aproximadamente como:
1 1 
V2 = Jb θ̇2 + mb ẋ2 + ẏ 2 (1.65)
2 2
De acuerdo a la Fig. 1.8:
Lb Lb
x≈r+ sen θ y≈ cos θ (1.66)
2 2
El momento de inercia Jb , según la referencia [3], se calcula como:
1
Jb = mb L2b mb = m a + m h Lb = L a + L h (1.67)
3
20 Modelado de Sistemas No Lineales

Tabla 1.3: Parámetros valorados del sistema MRT. La abreviatura C.M. significa
Centro de Masa.
Sı́mbolo Descripción Valor Unidades
u1 , u2 Voltaje de entrada al sistema V
KA Ganancia del amplificador 8.5
Va1 , Va2 , Voltaje de armadura V
Ra Resistencia de armadura 3.5 Ω
La Inductancia de armadura 0.002 H
ia1 , ia2 Corriente de armadura A
Km Constante del torque motor 0.0421 N-m/A
Tm1 , Tm2 Torque motor N-m
Tg1 , Tg2 Torque en los engranajes N-m
T Torque de carga N-m
Jm Momento de inercia del motor 0.0003 kg-m2
Jg Momento de inercia de los engranajes 0.053 kg-m2
Jp Momento de inercia de la polea kg-m2
Jb Momento de inercia del brazo kg-m2
Jeq Momento de inercia equivalente kg-m2
Beq Constante de fricción equivalente N-m-s/rad
Bm Constante de fricción del motor 0.0001 N-m/rad/s
Bg Constante de fricción engranajes 0.01 N-m-s/rad
Bp Constante de fricción en la polea 0.006 N-m-s/rad
F Fuerza aplicada al carro N
Ff Fuerza de rozamiento (Ff = Fc ṙ) N
Fc Constante de fricción del carro 2.81 kg/s
mh Masa del efector 0.15 kg
ma Masa del brazo 0.8 kg
mc Masa del carro 0.95 kg
mp Masa de la polea 0.3 kg
rp Radio de la polea 0.05 m
r Posición del carro m
L Longitud del brazo m
Lb Longitud del brazo más efector 0.225 m
Vb1 , Vb2 Voltajes contraelectromotrices V
Kb Constante contraelectromotriz 0.0565 V-s/rad
g Aceleración de la gravedad 9.81 m/s2
N1 , N2 N o de dientes de los engranajes N 2 > N1
n Relación de engranajes (n = N2 /N1 ) 12.5
θ, θm Posición angular: brazo y motor rad
ω, ωm Velocidad angular: carga y motor rad/s
1.2 Método de Las Ecuaciones de Lagrange 21

La energı́a potencial almacenada en el brazo se puede expresar como:

Lb
U2 ≈ m b g cosθ (1.68)
2

Las Ecuaciones de Lagrange del MRT


Reemplazando (1.66) en (1.65), efectuando las operaciones indicadas y simplifi-
cando, la función de Lagrange L = V − U = (V1 + V2 ) − (U1 + U2 ) toma la forma:
 
1 1 L2 1 1
L = (mc + mb )ṙ2 + Jb + b θ̇2 − mb Lb ṙθ̇ cos θ − mb Lb g cos θ (1.69)
2 2 2 2 2

Las ecuaciones de Lagrange para las coordenadas generalizadas r y θ del MRT se


formulan como:
 
d ∂L ∂L
− = F − Ff
dt ∂ ṙ ∂r
(1.70)
 
d ∂L ∂L
− =T (1.71)
dt ∂ θ̇ ∂θ

donde F es la fuerza generada para mover al carro, Ff es la fuerza de fricción actuando


sobre las ruedas del carro, Fc es la constante de fricción y T es el torque generado para
accionar el brazo. Reemplazando L ( ecuación (1.73)) en (1.70) y (1.71) y operando,
se obtiene:
Lb Lb
F = (mc + mb )r̈ − mb θ̇2 senθ + mb θ̈ cos θ + Ff ṙ (1.72)
2 2
 2 
Lb Lb Lb
T = mb r̈ cos θ + mb + Jb θ̈ − mb senθ (1.73)
2 4 2
Partiendo de (1.72) y (1.73) podemos determinar el modelo de Lagrange del sistema
MRT. Sin embargo, si estamos interesados en tener como fuerzas de control los volta-
jes de armadura u1 y u2 en lugar de F y T respectivamente, entonces se requiere
modelar los susbsistemas eléctricos del sistema como sigue.

Modelado del Servomotor M1 Accionando la Polea


La Fig. 1.9 muestra el servomotor M1 articulado a la polea. Despreciando la
inductancia de armadura La , el voltaje de entrada KA u1 aplicado a la armadura es:

Ra ia1 + Vb1 = KA u1 (1.74)

El voltaje de fuerza contra electromotriz es proporcional a la velocidad del servomo-


tor, es decir:
Vb1 = Kb θ̇m1 (1.75)
La ecuación del torque motor Tm1 está dada por (ver Fig. 1.9):

Tm1 = Jm θ̈m1 + Bm θ̇m1 + Tg1 (1.76)


22 Modelado de Sistemas No Lineales

La i a1
θ m1
ωm1
DE<
E<
DED<E< DE<
DE< EDED N1 Jp
+ + D ED θ1
ω1 Bp
u KA FG<
G<
F G< FG<
F GFGF J< JJ< JJ<
J<K< K K< K KJJK
V b1
_1 _ rp
Tm1 Bm Tg1 IH<
H I<
I< HI<
H I< HI<
H IHIH
Jm F
Ra N2 Tg2 Bg
Jg

Fig. 1.9: Servomotor M1 articulado a la polea.

El torque Tg2 requerido para mover a la polea se expresa como:

θ̈m1 θ̇m1
Tg2 = nTg1 = (Jg + Jp ) + (Bg + Bp ) + F rp (1.77)
n n
donde n > 1 es la relación de dientes de los engranajes del mecanismo de reducción,
Jm , Jg y Jp son los momentos de inercia de la armadura, del mecanismo de reducción
y de la polea respectivamente, mientras que Bm , Bg y Bp son las constantes de
fricción de la armadura, del mecanismo de reducción y de la polea respectivamente.
La relación Tg2 = nTg1 se obtiene asumiendo que los engranajes son ideales. En esta
situación, el principio de conservación de energı́a requiere que:
θm1
Tg1 θm1 = Tg2
n
Asumiendo que la polea es un disco que gira sobre su eje, su momento de inercia se
puede calcular como:
Jp = mp rp2 /2; (1.78)
El torque servomotor Tm1 es proporcional a ia1 :

Tm1 = Km ia1 (1.79)

El movimiento rotacional de la polea se puede transformar en el movimiento trasla-


cional del carro usando la relación (ver Fig. 1.9):
θm1
r= rp (1.80)
n
Usando las ecuaciones (1.74), (1.75), (1.76), (1.77), (1.79) y (1.80) se obtiene:
 
Km KA Jeq1 Beq1 nKm Kb
F = u1 − r̈ − + ṙ (1.81)
rp Ra nrp2 nrp2 nrp2

donde:
Jeq1 = n2 Jm + Jg + Jp Beq1 = n2 Bm + Bg + Bp
1.2 Método de Las Ecuaciones de Lagrange 23

Modelado del Servomotor M2 Accionando el Brazo


La Fig. 1.10 muestra al servomotor M2 articulado al punto pivote localizado en
el centro de masa del carro. Sabemos que M1 y M2 poseen los mismos parámetros
por ser similares. Despreciando la inductancia de armadura La , podemos formular:

Ra ia2 + Vb2 = KA u2 (1.82)

donde:
Vb2 = Kb nθ̇ (1.83)
La ecuación del torque motor Tm2 es (ver Fig. 1.10):

La i a2
θm
ωm
LM
M
LMLM LM
LM ML
+ + L MLML N1
Articulación
u2 KA V b2 NO
O
N O NO
N ONON RS
S
RSRS R 
S RS RS
S
R SRSR
_ _ R S R SR
Tm2 Bm Tg1 P
PQ PQ
P Q PQ
P QPQP θ
Jm
Ra N2 Tg2 Bg ω
Jg

Fig. 1.10: Servomotor M2 articulado al punto pivote del carro

Tm2 = Jm nθ̈ + Bm nθ̇ + Tg1 (1.84)

El torque Tg2 requerido para mover el brazo se expresa como:

Tg2 = nTg1 = Jg θ̈ + Bg θ̇ + T (1.85)

donde T es el torque de carga. El torque motor Tm2 es proporcional a ia2 :

Tm2 = Km ia2 (1.86)

Empleando las ecuaciones (1.82), (1.83), (1.84), (1.85) y (1.86) se puede demostrar
que:  
n2 K m K b nKm KA
T = −Jeq2 θ̈ − Beq2 + θ̇ + u2 (1.87)
Ra Ra
donde:
Jeq2 = n2 Jm + Jg Beq2 = n2 Bm + Bg

Modelo Dinámico de Lagrange del MRT


Igualando (1.72) con (1.81) y (1.73 ) con(1.87) el modelo de Lagrange del sistema
MRT toma la forma:

u1 = M11 r̈ + M12 θ̈ + P11 ṙ + P12 θ̇ (1.88)


u2 = M21 r̈ + M22 θ̈ + P22 θ̇ + d21 (1.89)
24 Modelado de Sistemas No Lineales

Las ecuaciones (1.88) y (1.89) se pueden transformar en su forma matricial como


sigue:
     
q1 r u1
M(q)q̈ + P(q, q̇)q̇ + d(q) = u q= = u= (1.90)
q2 θ u2
donde:
     
M11 M12 P11 P12 0
M= P= d(q) =
M21 M22 0 P22 d21
 
Ra rp Jeq
M11 = mc + m b + 2
nKm KA rp
Ra rp mb Lb
M12 = cos θ
2nKA Km
Ra mb Lb
M21 = cos θ
2nKm KA
 
Ra mb L2b
M22 = + Jb + Jeq
nKA Km 4
 
Ra rp Beq n2 K m K b
P11 = Fc + 2 +
nKm KA rp Ra rp2
Ra rp mb Lb
P12 = − θ̇senθ
2nKA Km
 
Ra n2 K m K b
P22 = Beq +
nKA Km Ra
Ra mb Lb g
d21 = − senθ
2nKA Km

Ecuación de Estado del MRT


Seleccionemos como variables de estado: x1 = r, x2 = θ, x3 = ṙ y x4 = θ̇. Por
consiguiente, las dos primeras ecuaciones de estado son: ẋ1 = x3 , ẋ2 = x4 . Las otras
dos ecuaciones de estado no lineales se deducen despejando q̈ = [ẋ3 ẋ4 ]T de (1.90),
resultando:
ẋ3 = M22 (−P11 x3 − P12 x4 + u1 )/den − M12 (−P22 x4 − d21 + u2 )/den
ẋ4 = −M21 (−P11 x3 − P12 x4 + u1 )/den + M11 (−P22 x4 − d21 + u2 )/den
den = M11 M22 − M12 M21 (1.91)
Haciendo en la ecuación (1.90) las aproximaciones siguientes: cos θ ∼ = 1 en M12 y M21 ,
θ̇senθ ∼
= θ̇θ ∼
= 0 en P 12 y senθ ∼
= θ en d 21 , la ecuación de estado lineal del sistema
MRT resulta:
ẋ = A x + B u y = Cx (1.92)
donde:
 
0 0 1 0
1  0 0 0 1 

A=
den  0 M 12 d21 −M 22 P 11 −(M 22 P 12 − M 12 P 22 ) 
0 −M 11 d21 M 21 P 11 (M 22 P 12 − M 11 P 22 )
1.2 Método de Las Ecuaciones de Lagrange 25

 
0 0  
1  0 0 
 1 0 0 0
B=  C= den = M 11 M 22 −M 12 M 21
den M 22 −M 12  0 1 0 0
−M 21 M 11
En las relaciones anteriores:
Ra rp mb Lb
M 11 = M11 M 12 =
2nKA Km
Ra mb Lb
M 21 = M 22 = M22
2nKm KA
P 11 = P11 P 12 = 0
Ra mb Lb g
P 22 = P22 d21 = −
2nKA Km

1.2.2. Manipulador Robótico Esférico (MRE)


Descripción del MRE
La Fig. 1.11 muestra el sistema prototipo MRE. Su esquema para estudio se ilustra
en la Fig. 1.12, donde M1 es un servomotor DC con decodificador óptico que acciona
el movimiento rotatorio de una base metálica (la base del MRE) articulada a su eje.
Esta base comprende un disco metálico de espesor d y radio rd unido a una barra
metálica de longitud b, sección a2 y masa mb . La barra y el disco conforman un cuerpo
rı́gido con movimiento rotatorio alrededor del eje z, donde L1 es la distancia del
C.M. (centro de masa) de la base con respecto al origen del sistemas de coordenadas
(x, y, z). M2 es un servomotor montado en el extremo libre de la barra similar a M1 y
se emplea para accionar el movimiento de rotación de un brazo o eslabón de longitud
L (el brazo del manipulador) y masa ma . Ya que M1 y M2 son similares, entonces
poseen los mismos parámetros.
En el esquema del sistema MRE (Fig. 1.12), q1 y q2 son las posiciones angulares
de la base y del brazo respectivamente. Al extremo del brazo se puede articular un
efector final de masa mh . El manipulador MRE representa un sistema multivariable
cuadrado, denominado ası́ por poseer dos entradas: los voltajes de control u 1 y u2
aplicados a los terminales de armaduras de M1 y M2 respectivamente, y dos salidas:
q1 y q2 . La tabla 1.4 muestra los valores de los parámetros del manipulador.

Ecuaciones de Energı́a del MRE


Ecuaciones de Energı́a de la Base
La base está confinada a girar alrededor del eje z (ver Fig. 1.12). Su energı́a
cinética V1 y su energı́a potencial U1 vienen dadas por:

1
V1 = J1 q̇12 U1 = m 1 g L 1 (1.93)
2
donde:
mb b + m d d
m1 = m d + m b L1 = (1.94)
mb + m d
26 Modelado de Sistemas No Lineales

Tabla 1.4: Variables y parámetros del sistema MRE (C.M.: centro de masa).
Sı́mbolo Descripción Valor Unidad
q1 Posición angular de la base rad
q2 Posición angular del brazo rad
T1 , T 2 Torques generados N-m
md Masa del disco 0.55 kg
mb Masa de la barra 0.9 kg
ma Masa del brazo o eslabón 0.8 kg
mh Masa del efector final 0.15 kg
m2 Masa equivalente del brazo kg
d Espesor del disco 0.01 m
rd Radio del disco 0.06 m
b Longitud de la barra 0.25 m
a2 Sección cuadrada de la barra 0.044 2 m2
M1 , M2 Servomotores D.C.
Lb Longitud del brazo 0.3 m
Lh Longitud del efector 0.05 m
L1 Ubicación C.M. de la base m
L2 Longitud equivalente del brazo m
Jh Momento de inercia del efector kg-m2
Jm Momento de inercia de M1 y M2 0.0003 kg-m2
Jeq Momento de inercia equivalente kg-m2
Jg1 , Jg2 Momentos de inercia de los engranajes 0.053 kg-m2
J1 , J2 Momentos de inercia de la base y del brazo kg-m2
Bm Constante de fricción de M1 y M2 0.0001 N-m-s/rad
Beq Constante de fricción equivalente N-m-s/rad
Bg1 , Bg2 Constantes de fricción en engranajes 0.01 N-m-s/rad
n Relación de engranajes de M1 y M2 12.5
Ra Resistencia de armadura de M1 y M2 3.5 Ω
La Inductancia de armadura de M1 y M2 0.00015 H
Vb1 , Vb2 Voltajes contra electromotrices V
Va1 , Va2 Voltajes de armadura V
ia1 , ia2 Corrientes de armadura A
KA Ganancia del amplificador 8.5
Km Constante del servomotor 0.0421 N-m/A
Kb Constante contra electromotrı́z 0.0565 V-s/rad
u1 , u2 Voltajes de control V
g Constante gravitacional 9.81 m/s2
1.2 Método de Las Ecuaciones de Lagrange 27

Fig. 1.11: El manipulador robótico esférico (MRE).

z
EFECTOR
FINAL
mh
ma
SERVOMOTOR q2
M2 Lh
Lb
BRAZO
a

mb
b
BASE
a L1
rd
d y
md
SERVOMOTOR
x q1 M1

Fig. 1.12: Esquema del manipulador robótico esférico (MRE).

y el momento de inercia J1 resulta de la suma de los momentos de inercia del disco


(Jd ) y de la barra (Jb ) alrededor del eje z, como sigue [3]:
1 1
J1 = Jd + Jb = md rd2 + mb (a2 + a2 ) (1.95)
2 12
28 Modelado de Sistemas No Lineales

Ecuaciones de Energı́a del Brazo


Sean ma y mh las masas del brazo y del efector más su carga respectivamente.
Asumiendo que el brazo y el efector final forman una unidad de masa m2 = ma + mh
y longitud L2 = Lb + Lh , la energı́a cinética almacenada en el brazo se formula como:
1 1 
V2 = J2 q̇22 + m2 ẋ2 + ẏ 2 + ż 2 (1.96)
2 2
De acuerdo a la Fig. 1.12:
L2 L2 L2
x≈ sen q2 cos q1 y≈ sen q2 sin q1 z ≈d+b+ cos q2 (1.97)
2 2 2
El momento de inercia J2 , según la referencia [3], se calcula como:
1
J2 = m2 L22 m2 = m a + m h L2 = L b + L h (1.98)
3
La energı́a potencial almacenada en el brazo se puede expresar como:
 
L2
U2 = m 2 g cos q2 + b + d (1.99)
2

Modelo Dinámico de Lagrange del MRE


Reemplazando (1.97) en (1.96), efectuando las operaciones indicadas y simplifi-
cando, la función de Lagrange L = V − U = (V1 + V2 ) − (U1 + U2 ) toma la forma:
1 1 1 
L = J1 q̇12 + J2 q̇22 + m2 L2 q̇22 + q̇12 sen2 q2
2 2  8 
L2
− m1 gL1 − m2 g d + b + cos q2 (1.100)
2
Las ecuaciones de Lagrange para las coordenadas generalizadas q 1 y q2 del MRE se
formulan como:
 
d ∂L ∂L
− = T1 (1.101)
dt ∂ q̇1 ∂q1
 
d ∂L ∂L
− = T2 (1.102)
dt ∂ q̇2 ∂q2
donde T1 y T2 son los torques generados para hacer girar la base y el brazo respec-
tivamente. Notar que se desprecian los torques de fricción que se oponen a T 1 y T2 .
Reemplazando L en (1.101) y (1.102) y operando se obtiene:
   
1 2 1
J1 + m2 L2 sen q2 q̈1 + m2 L2 senq2 cos q2 q̇1 q̇2 = T1 (1.103)
4 2
   
1 1 2 1
J2 + m2 L2 q̈2 − m2 L2 q̇1 senq2 cos q2 + m2 L2 gsenq2 = T2 (1.104)
4 4 2
Partiendo de (1.101) y (1.102) podemos determinar el modelo de Lagrange del mo-
delo MRE. Sin embargo, si estamos interesados en tener como fuerzas de control
los voltajes de armadura u1 y u2 en lugar de T1 y T2 respectivamente, entonces se
requiere modelar los susbsistemas eléctricos del sistema MRE como sigue.
1.2 Método de Las Ecuaciones de Lagrange 29

Modelado del Servomotor M1 Accionando la Base


La Fig. 1.13 muestra al servomotor M1 articulado al punto pivote en contacto
con el disco de la base. Sabemos que M1 y M2 poseen los mismos parámetros por ser
similares. Despreciando la inductancia de armadura La , podemos formular (ver Fig.
1.13):
Ra ia1 + Vb1 = KA u1 (1.105)
donde:
Vb1 = Kb q̇m1 = Kb nq̇1 qm1 = nq1 (1.106)
Notar que n = N2 /N1 > 1 es la relación de dientes de los engranajes del mecanismo
de reducción. La ecuación del torque motor Tm1 es (ver Fig. 1.13):

L arm i a1
TU
q m1
q m1 XY
Y
XYXY XY
XY YX
+ + X YXYX N1
Articulación
u1 KA V b1 Z[
[
Z [ Z[
Z [Z[Z ^_
_
^_^_ ^_
^_ ^^ _^_^
_
_ _ ^ _ ^ _^
_
Tm1 Bm Tg1 \
\] \]
\ ] \]
\ ]\]\ q1
Jm
Ra N2 Tg2 Bg W V WV
Jg q1

Fig. 1.13: Servomotor M1 articulado al disco de la base.

Tm1 = Jm nq̈1 + Bm nq̇1 + Tg1 (1.107)


El torque Tg2 requerido para mover la base se expresa como:
Tg2 = nTg1 = Jg q̈1 + Bg q̇1 + T1 (1.108)
donde Jm y Jg son los momentos de inercia del motor y del mecanismo de reducción
respectivamente, mientras que Bm y Bg son las constantes de fricción del motor y
del mecanismo de reducción respectivamente. La relación Tg2 = nTg1 se obtiene asu-
miendo que los engranajes son ideales. En esta situación, el principio de conservación
de energı́a requiere que:
qm1
Tg1 qm1 = Tg2 qm1 = nq1
n
El torque motor Tm1 es proporcional a ia1 :
Tm1 = Km ia1 (1.109)
Empleando las ecuaciones (1.105), (1.106), (1.107), (1.108) y (1.109) se puede de-
mostrar que:
 
n2 K m K b nKm KA
T1 = −Jeq q̈1 − Beq + q̇1 + u1 (1.110)
Ra Ra
donde:
Jeq = n2 Jm + Jg Beq = n2 Bm + Bg (1.111)
30 Modelado de Sistemas No Lineales

Modelado del Servomotor M2 Accionando el Brazo

La Fig. 1.14 muestra al servomotor M2 articulado al punto pivote del segundo


brazo. Sabemos que M1 y M2 poseen los mismos parámetros por ser similares. Des-
preciando la inductancia de armadura Larm , formulamos:

Ra ia2 + Vb2 = KA u2 (1.112)

donde:
Vb2 = Kb q̇m2 = Kb nq̇2 qm2 = nq2 (1.113)

La ecuación del torque motor Tm2 es (ver Fig. 1.14):

L arm i a 2
`a
q m2
q m2
+ +
de
e
d e de
d eded N1
Articulación
u2 KA fg
g
f g fg
f gfgf jk
k
jkjk jk
jk jj kjkj
k
j k
V b2
_ _ j kj
k
Tm2 Bm Tg1 h
hi hi
h i hi
h ihih q
Jm
Ra N2 Tg2 Bg c b cb 2
Jg q2

Fig. 1.14: Servomotor M2 articulado al punto pivote del brazo.

Tm2 = Jm nq̈2 + Bm nq̇2 + Tg1 (1.114)

El torque Tg2 requerido para mover el brazo se expresa como:

Tg2 = nTg1 = Jg q̈2 + Bg q̇2 + T2 (1.115)

donde T2 es el torque para accionar el brazo. El torque motor Tm2 es proporcional a


ia2 :
Tm2 = Km ia2 (1.116)

Empleando las ecuaciones (1.112), (1.113), (1.114), (1.115) y (1.116) se puede de-
mostrar que:
 
n2 K m K b nKm KA
T2 = −Jeq q̈2 − Beq + q̇2 + u2 (1.117)
Ra Ra

donde:
Jeq = n2 Jm + Jg Beq = n2 Bm + Bg (1.118)
1.2 Método de Las Ecuaciones de Lagrange 31

Modelo de Lagrange del Manipulador MRE


Igualando (1.103) con (1.110) y (1.104) con (1.117) el modelo de Lagrange del
sistema MRE toma la forma:

u1 = M11 q̈1 + P11 q̇1 + P12 q̇2 (1.119)


u2 = M22 q̈2 + P21 q̇1 + P22 q̇2 + d21 (1.120)

Manipulando las ecuaciones (1.119) y (1.120) se obtiene el modelo dinámico de La-


grange del sistema:
   
q1 u1
M(q)q̈ + P(q, q̇)q̇ + d(q) = u q= u= (1.121)
q2 u2

donde:
     
M11 0 P11 P12 0
M= P= d=
0 M22 P21 P22 d21

 
Ra 1
M11 = J1 + Jeq + m2 L2 sen2 q2
nKm KA 4
 
Ra 1
M22 = J2 + Jeq + m2 L2
nKm KA 4
 2

Ra n Km Kb
P11 = Beq +
nKm KA Ra
 
Ra 1
P12 = m2 L2 q̇1 senq2 cos q2
nKm KA 2
 
Ra 1
P21 = − m2 L2 q̇1 senq2 cos q2
nKm KA 4
 
Ra n2 K m K b
P22 = Beq +
nKm KA Ra
 
Ra 1
d21 = − m2 L2 gsenq2
nKm KA 2

Ecuación de Estado No Lineal del Sistema MRE


Definiendo las siguientes variables de estado: x1 = q1 , x2 = q2 , x3 = q̇1 y x4 = q̇2 ,
el modelo dinámico dado en (1.119) y (1.120) se puede transformar en la siguiente
ecuación de estado del sistema MRE:
     
ẋ1 f1 (x, u) x3
 ẋ2   f2 (x, u)   x4 
 = =  (1.122)
 ẋ3   f3 (x, u)   M11 (−P11 x3 − P12 x4 + u1 )
−1 
ẋ4 f4 (x, u) M22−1
(−P21 x3 − P22 x4 − d21 + u2 )
Capı́tulo 2

Control Óptimo

El procedimiento de diseño del sistema de control óptimo presentado en este capı́tulo


se puede aplicar a una gran clase de procesos no lineales, algunos de los cuales ya fueron
propuestos en el capı́tulo 2. Este capı́tulo trata el problema del control óptimo cuadrático
gaussiano, denominado ası́ porque el ı́ndice de rendimiento o función de costo que emplea
es una función cuadrática de los estados y de las señales de control. La solución del
problema de control planteado consiste en determinar un extremo de la función de costo
mediante minimización con el propósito de generar la ley de control óptima.
La configuración del sistema de control óptimo no lineal desarrollado en este capı́tulo
comprende el modelo no lineal multivariable del sistema a controlar, un observador no
lineal para estimar los estados del sistema y un controlador de realimentación de estados
del tipo proporcional–integral. El diseño del sistema de control óptimo (Fig. 2.1) consiste
en producir una fuerza de control U que sea capaz de hacer que el vector de salida Y del
sistema (la salida controlada) siga al vector de referencias deseadas R cumpliendo ciertas
especificaciones de diseño, a pesar de la presencia de disturbios estocásticos gaussianos
actuando sobre el sistema en operación.

2.1. Estructura del Sistema de Control Óptimo


La estructura del sistema de control óptimo no lineal empleada en este capı́tulo se
ilustra en la Fig. 2.1. Tal configuración combina en su diseño la representación de un
sistema no lineal, un observador no lineal para estimar los estados del sistema y una
ley de control de realimentación de estados del tipo proporcional–integral. El objetivo
del sistema de control óptimo consiste en seleccionar una fuerza de control U capaz de
minimizar la diferencia entre el vector de salida Y del sistema y el vector de referencias
deseadas R, cumpliendo las especificaciones de diseño del caso, a pesar de la presencia
de incertidumbres en los parámetros y de disturbios estocásticos gaussianos actuando
sobre el sistema controlado.
La implementación en tiempo real del sistema mostrado en la figura 2.1 opera
como sigue: después de cada tiempo de discretización, el observador no lineal estima
los estados Xb del sistema empleando los datos proporcionados por el vector de entrada
U y el vector de salida Y. Invocando el bien conocido teorema de la separación [10],
tales estados estimados y la integral del error z, se usan para computar la ley de
control U = −K X b + KI z. La señal U, que es del tipo proporcional–integral, actúa
34 Control Óptimo

R z z U X Y
KΙ SISTEMA C

OBSERVADOR

X
K

Fig. 2.1: Configuración del sistema de control óptimo.

sobre el sistema para hacer que el error entre R y la salida Y tienda a cero cumpliendo
ciertas especificaciones de diseño.

2.2. Descripción dinámica del Sistema


El sistema dinámico no lineal multivariable (de múltiples entradas U y múltiples
salidas Y) se describe mediante la siguiente ecuación de estado:

Ẋ = f (X, U) + v
Y = h(X) + w (2.1)
         
X1 U1 v1 Y1 w1
         
X =  ...  U =  ...  v =  ...  Y =  ...  w =  ... 
Xn Um vn Yp wp
   
f1 (X, U) h1 (X)
 ..   .. 
f = .  h= . 
fn (X, U) hp (X)
donde X es el vector de estado, U es el vector de control (la entrada al sistema) e Y
es el vector de salida. Asumiremos que las funciones vectoriales de variable vectorial
f (X, U) y h(X) son operadores no lineales diferenciables que representan la dinámica
del sistema y la dinámica de la salida respectivamente. Los vectores v de orden n × 1
y w de orden p × 1 son los disturbios en los estados del sistema (ruidos en los estados)
y en sus salidas (ruidos de medición) respectivamente.
Sean X0 , U0 e Y0 los vectores de referencia (o nominales) de X, U e Y respecti-
vamente. Si la entrada del sistema se selecciona exactamente igual a U0 , su respuesta
será X0 . Entonces X0 satisface:

Ẋ0 = f (X0 , U0 ) + v
Y0 = h(X0 ) + w (2.2)
2.3 El Controlador Óptimo PI 35

Si la entrada del sistema U no es exactamente, pero sı́ muy cercana a U0 , el vector


de estado X resultante difiere muy poco de X0 . Para tal situación, las trayectorias
actuales pueden formularse como:

X = X0 + x U = U0 + u Y = Y0 + y (2.3)

donde los vectores residuales x, u e y representan desviaciones con respecto a los


correspondientes vectores de estado, de control y de salida respectivamente. Reem-
plazando (2.3) en (2.1) produce:

Ẋ0 + ẋ = f (X0 + x, U0 + u) + v
Y0 + y = h(X0 + x) + w (2.4)

Como hemos asumido que las desviaciones actuales son pequeñas, entonces el sistema
(2.4) admite ser linealizado alrededor de un vector de trayectorias nominales o de
referencia X0 . La linealización de (2.4) empleando operadores jacobianos alrededor
de X0 y U0 resulta:

ẋ ≈ Ax + Bu + v x(0− ) = 0
y ≈ Cx + w (2.5)

donde:
 ∂f1 ∂f1   ∂f1 ∂f1 
∂X1 ··· ∂Xn ∂U1 ··· ∂Um
 .. .. ..   .. .. .. 
A =  . . .  B= . . . 
∂fn ∂fn ∂fn ∂fn
∂X1 ··· ∂Xn (X0 ,U0 ) ∂U1 ··· ∂Um (X0 ,U0 )
 ∂h1 ∂h1 
∂X1 ··· ∂Xn
 .. .. .. 
C =  . . .  (2.6)
∂hp ∂hp
∂X1 ··· ∂Xn (X0 )

Observar que las matrices jacobianas Ann , Bnm , Cpn y Dpm necesitan ser evaluadas
alrededor de los vectores de referencia X0 y U0 .

2.3. El Controlador Óptimo PI


La Fig. 2.2 muestra el sistema de control óptimo PI (Proporcional–Integral) usado
para la deducción de la correspondiente ley de control. Notar que en dicha figura no
aparece el observador de estados. Además, el sistema a controlar emplea la descripción
lineal dada en (2.5). Sin considerar los vectores gaussianos v y w (estos vectores se
incluyen al final), de la figura 2.2 se obtiene:

ẋ = Ax + Bu
y = Cx
u = −Kx + KI z
ż = R − y = R − Cx (2.7)

donde x es el vector de estado de orden n, u es el vector de control de orden m, y es


36 Control Óptimo

R z z u x x y
KI B C

Fig. 2.2: Sistema de control óptimo linealizado con controlador PI (Proporcional–


Integral) de realimentación de estados.

el vector de salida de orden p, z es el vector de salida del integrador de orden p, R es


el vector de referencias deseadas de orden p, A es la matriz de estado de dimensión
n × n, B es la matriz de control de dimensión n × m y C es la matriz de salida de
dimensión p × n. De (2.7) se puede formular:
        
ẋ(t) A 0 x(t) B 0
= + u(t) + R(t) (2.8)
ż(t) −C 0 z(t) 0 I
donde I es la matriz identidad de orden p y las matrices y vectores 0 poseen dimen-
siones apropiadas. Dado que (2.8) es cierto para cualquier t, entonces para un tiempo
final tf se tiene:
        
ẋ(tf ) A 0 x(tf ) B 0
= + u(tf ) + R(tf ) (2.9)
ż(tf ) −C 0 z(tf ) 0 I

Restando (2.8) de (2.9) resulta:


        
ẋe A 0 xe B 0
= + ue + Re (2.10)
że −C 0 ze 0 I
donde:

xe = x(t) − x(tf )
ze = z(t) − z(tf )
ue = u(t) − u(tf )
Re = R(t) − R(tf ) (2.11)

son los errores del sistema. Dado que se desea un comportamiento asintóticamente
estable del sistema controlado, entonces los errores xe , ze y ue deben de tender a cero,
mientras que el error Re debe de ser nulo cuando se alcance el estado estacionario.
Por consiguiente, la ecuación de estado del error (incluyendo los vectores de ruido
gaussiano) toma la forma:

ė = Aa e + Ba ue + v (2.12)
     
xe a A 0 a B
e = A = B =
ze −C 0 0
2.3 El Controlador Óptimo PI 37

donde el vector de error e es de orden n + p, el vector de ruido gaussiano v es ahora


de orden n + p y las matrices Aa y Ba son de orden (n + p) × (n + p) y (n + p) × m
respectivamente. De la misma manera, la ley de control u = −Kx + KI z dada en
(2.7) toma la forma:

ue = −Kxe + KI ze = −Ka e Ka = [K − KI ] (2.13)

donde la matriz de ganancia aumentada Ka es de orden m × (n + p).


Observar que la ecuación de estado del error (2.12) y la ley de control residual
(2.13) poseen la misma estructura que las ecuaciones de estado y de control del
sistema dado en (2.7). Esta similitud nos permite ahora determinar la matriz de
ganancia óptima Ka como sigue [11],[12]. Siempre que el sistema descrito por (2.12)
cumpla la siguiente condición de controlabilidad completa:
 
rango Ma = rango Ba Aa Ba · · · (Aa )n−1 Ba = n + p (2.14)

entonces, Ka puede ser computada de:

Ka = R−1 a T a
u (B ) P (2.15)

donde Ru = RT a a T
u es una matriz de sintonización definida positiva y P = (P ) de
orden (n + p) × (n + p) es la única matriz solución definida positiva de la siguiente
ecuación asociada de Riccati:

Pa (Aa + αI) + (Aa + αI)T Pa − Pa Ba R−1 a T a a


u (B ) P + Q = 0 (2.16)

Por lo tanto, la ley de control de realimentación de estados (el controlador PI de


realimentación de estados):
 
a a
  x
u = −K x = − K −KI (2.17)
z

minimiza la siguiente función de costo cuadrática:


Z ∞
Ia = e2αt [(xa )T (t)Qa xa (t) + uTu (t)Ru u(t)]dt (2.18)
0

sujeta a la ecuación de restricción:

ẋa = Aa xa + Ba u + va (2.19)

En (2.18), Qa = (Qa )T de orden (n+p)×(n+p) es una matriz semi-definida positiva,


Ru = RTu de orden m × m ya fue definida como positiva y α ≥ 0 es una constante.
Observar que Ru y Qa son matrices de sintonización que sirven para ponderar el
rendimiento del sistema.
Agregando los vectores nominales Uo y Xo a ambos miembros de (2.17), se obtiene
la ley de control actual U:
   
a a
  x + Xo   X
u + Uo = U = −K X = − K −KI = − K −KI
z z
(2.20)
38 Control Óptimo

De acuerdo al principio de la separación [10], los controladores de realimentación de


estado se pueden implementar empleando los estimados de los estados en lugar de
los estados actuales del sistema. Por consiguiente, la ley de control (2.20) se puede
implementar también como:
 
aba
  X b
U = −K X = − K −KI (2.21)
z

Para obtener el vector de estado estimado X b emplearemos un observador no lineal


(sección 2.4). El vector estimado z no necesita estimarse ya que se obtiene integrando
la salida actual Y.

2.4. El Observador Óptimo No Lineal


Consideremos la estructura de la Fig. 2.3 para la estimación de estados y control
del sistema descrito en (2.1). El observador no lineal ilustrado se puede describir por:

ḃ = f (X,
X b U) + H(Y − Y)
b
b = h(X)
Y b (2.22)

donde Yb y X b son los vectores estimados de Y y X respectivamente, y H es una


matriz residual de ganancia de orden n × p a ser determinada.

v w R
+ + +
x x + Y z z
h( ) h(X)
+ f(X, U)

f( )
U
^
X
U ^a
X ^
X
a
−K z
z

^
X ^ ^
X Y Y
C
+ +
+
f( )
^ U)
f(X, U
H

Fig. 2.3: Estructura del sistema de control óptimo para estimación de estados y
control.
2.5 Procedimiento de Diseño 39

Por otra parte, asumamos que los disturbios v y w en (2.1) sean ruido blanco
gaussiano con media (o esperanza) nula. El ruido blanco gaussiano posee la propiedad
de ser no correlacionado en cada instante de tiempo. En otras palabras, no existe una
interrelación (correlación) entre v y w. La propiedad de la media nula implica que
toda la información estadı́stica del ruido se acumula en la covarianza de los disturbios.
En términos matemáticos:

E[v(t)vT (τ )] = Vδ(t − τ ) E[v] = 0


T
E[w(t)w (τ )] = Wδ(t − τ ) E[w] = 0 (2.23)

donde E[.] es la operación matemática esperanza, δ(t − τ ) es la función delta de


Kronecker definida como: δ(t − τ ) = 1 para t = τ y nula en otro caso. También, V
de orden n × n y W de orden p × p son matrices de covarianza definidas positivas.
Es un hecho conocido que un sistema lineal de la forma dada en (2.7) pero con
v = w = 0, es completamente observable siempre que su correspondiente matriz de
observabilidad N posea rango completo:
 
C
 CA 
 
rango N = rango  .. =n (2.24)
 . 
CAn−1

Cuando el modelo linealizado dado en (2.7) es completamente observable, la matriz


residual de ganancia H del observador no lineal descrito en (2.22), se calcula de:

H = SCT W−1 (2.25)

donde S = ST de orden n × n es la única matriz definida positiva solución de la


siguiente ecuación asociada de Riccati:

0 = S(A + αI)T + (A + αI)S − SCT W−1 CS + V (2.26)

El estimador de estados resultante mostrado en la Fig. 2.3 es conocido también como


el filtro de Kalman de ganancia constante H.

2.5. Procedimiento de Diseño


El procedimiento de diseño del sistema de control óptimo desarrollado sigue los
pasos siguientes:

(1) Formular el problema: describir el sistema a controlar, definir las especifica-


ciones de diseño y determinar el modelo no lineal del sistema en la forma dada
en (2.1).
(2) Determinar el modelo linealizado del sistema (ecuación (2.5)).
(3) Determinar la controlabilidad y observabilidad del sistema linealizado (ecua-
ciones (2.14) y (2.24) respectivamente).
(4) Computar la matriz de ganancia Ka de la ley de control PI del sistema (ecua-
ciones (2.15) y (2.16)).
40 Control Óptimo

(5) Computar la matriz de ganancia H del observador no lineal del sistema (ecua-
ciones (2.25) y (2.26)).
(6) Simular el sistema de control óptimo empleando las ecuaciones dinámicas no
lineales (2.1) y (2.22).
(7) Desarrollar el software de control en tiempo real del sistema.
(8) Implementar el sistema de control óptimo (hardware).
(9) Ejecutar pruebas de funcionamiento en tiempo real.

2.6. Aplicación en Tiempo Real


2.6.1. Control Óptimo del Sistema MRE
La ecuación de estado del sistema MRE se muestra en la ecuación (1.122). Este
sistema se puede linealizar usando las matrices jacobianas dadas en (2.6). Sin embar-
go, aplicaremos el método de linealización aproximada que consiste en asumir que,
cuando x es suficientemente pequeño, se cumple: sen(x) ∼= x, cos(x) ∼
= 1, x2 ∼
= 0, etc.
Aplicando esta aproximación en (1.122) se obtiene (el sobre rayado indica un valor
estacionario):

Ra
M 11 = (J1 + Jeq )
nKm KA
M 22 = M22
P 11 = P 22 = P11 = P22
P 12 = P 21 = 0
Ra m2 L2 g
d21 = d21 senx2 ; d21 = ;
2nKm KA
Por consiguiente:
   
0 0 1 0 0 0
 0 0 0 1   0 0 
   
A= −1  B= −1 
 0 0 −M 11 P 11 0   M 11 0 
−1 −1 −1
0 −M 22 d21 0 −M 22 P 22 0 −M 22
   
1 0 0 0 0 0
C= D=
0 1 0 0 0 0
Por lo tanto:
   
a A 0 a B  
A = B = Ca = C 0
−C 0 0

Usando el hecho de que el sistema es completamente controlable y completamente


observable, la ganancia Ka del controlador y la ganancia H del observador fueron
determinadas usando los comandos lqr y lqe de MathScript, respectivamente. Las
matrices requeridas por estos comandos se fijaron como sigue: Ru = 0.1I, Qa = 2I,
V = 0.1I, W = 0.1I y G = I, donde I es la matriz identidad. El parámetro α de la
función de costo se fijó en 6.
2.6 Aplicación en Tiempo Real 41

La simulación se llevó a cabo ejecutando


R t el archivo ocmrer.m para las señales de
referencia tipo escalón. La relación z = 0 Ydτ se aproximó en el dominio discreto
como z(k + 1) = z(k) + T x(k), donde T = 0.01 s es el tiempo de muestreo y k = t/T
es el tiempo discreto. El resultado de la simulación se muestra en la Fig. 2.4. Notar
que las especificaciones de diseño porcentaje de sobrenivel nulo, error en estado esta-
cionario nulo y tiempo de estabilización menor de 1.2 s se cumplen satisfactoriamente.

1
Posición X1 [rad]

0.5

0
0 1 2 3 4 5 6 7 8
10
Control U1 [V]

−5
0 1 2 3 4 5 6 7 8
1
Posición X2 [rad]

0.5

0
0 1 2 3 4 5 6 7 8
10
Control U2 [V]

−5
0 1 2 3 4 5 6 7 8
Tiempo [segundos]

Fig. 2.4: Posiciones angulares de la base y del del brazo MRE controladas.

El resultado experimental para un tiempo de muestreo de T = 0.01 s se muestra


en la Fig. 2.5, el cual se obtiene ejecutando el archivo LabVIEW ocmrer.vi. Este
último archivo emplea el controlador y el observador calculados en la simulación
(archivo ocmrer.m). Además usa dos archivos para implementar las señales de refe-
rencia tipo escalón: setpoint reg.vi (para la base del MRE) y setpoint reg2.vi (para
el brazo del MRE). Los gráficos de la Fig. 2.5 se obtienen ejecutando el archivo
ocmrertr.m, el cual emplea los archivos de datos experimentales SETPOINT BASE,
SETPOINT BRAZO, U1 y U2. Notar que las especificaciones de diseño previamente
establecidas también se cumplen satisfactoriamente para el caso experimental. ♣
42 Control Óptimo

Posición x1 [grad]

100

−100
0 5 10 15 20 25
TIEMPO [s]
CONTROL u1 [V]

−5
0 5 10 15 20 25
TIEMPO [s]
Posición x2 [grad]

50

−50
0 5 10 15 20 25
TIEMPO [s]
CONTROL u2 [V]

10

−10
0 5 10 15 20 25
TIEMPO [s]

Fig. 2.5: Respuesta experimental del sistema de control óptimo del MRE.
Capı́tulo 3

Control Adaptativo con Modelo


Referencial

El procedimiento de diseño de un sistema de control adaptativo presentado en este


capı́tulo se puede aplicar a una gran variedad de procesos no lineales, algunos de los
cuales ya fueron formulados en el capı́tulo 2. Este capı́tulo trata el problema del con-
trol adaptativo con modelo referencial, cuya estructura incluye un modelo dinámico de
referencia, un controlador adaptativo, un modelo dinámico del sistema a controlar y un
mecanismo de adaptación.
El objetivo de control del sistema diseñado consiste en producir una fuerza de control
u que sea capaz de hacer que el vector de salida y del sistema, siga a la respuesta
deseada yd cumpliendo ciertas especificaciones de diseño, a pesar de la presencia de
incertidumbre paramétrica (parámetros no modelados en el modelo dinámico usado o
con valores inciertos) y no paramétrica (efectos no lineales no tomados en cuenta en el
modelo dinámico tales como fricción de coulumb, saturación, entre otros).

3.1. Estructura de un SCAMR


La figura 3.1 ilustra la configuración de un Sistema de Control Adaptativo con
Modelo Referencial (SCAMR) que puede ser empleado en una gran variedad de apli-
caciones. El SCAMR se compone básicamente de un modelo de referencia, un contro-
lador adaptativo, el sistema a controlar y un mecanismo de adaptación. El esquema
en consideración se denomina un SCAMR paralelo debido a la ubicación relativa del
modelo referencial con respecto al sistema.
El modelo de referencia, el cual está excitado por una entrada externa r, es un
sistema dinámico auxiliar usado para obtener la respuesta deseada del sistema. Tal
respuesta debe de ser lograda por el SCAMR a pesar de las restricciones generadas
por inexactitudes en el modelado de la estructura del modelo de referencia y el mo-
delo del sistema. En este capı́tulo se emplea un modelo de referencia con matriz de
transferencia unitaria lo cual implica que r = qd .
El mecanismo de adaptación es un conjunto de bloques interconectados usados
para implementar la ley de adaptación. De hecho, la ley de adaptación es el algoritmo
de control empleado para modificar los parámetros del controlador adaptativo, de
modo tal que el SCAMR permanezca estable y que el error de seguimiento q e = q−qd
44 Control Adaptativo con Modelo Referencial

MODELO
REFERENCIAL
− qd
r
CONTROLADOR u SISTEMA +
ADAPTATIVO NO LINEAL
q

~q
MECANISMO
DE ADAPTACIÓN

Fig. 3.1: Configuración de un Sistema de Control Adaptativo con Modelo Referencial


(SCAMR).

converja a cero a pesar de la presencia de parámetros del sistema variantes con


el tiempo y disturbios externos. El método directo de Lyapunov (Apéndice C) es
empleado para determinar que el SCAMR diseñado garantice convergencia global de
las señales controladas con respecto a sus trayectorias deseadas.
Se asume que el sistema es no lineal. Por consiguiente, su descripción puede ser
imprecisa; esto es, el modelo dinámico del sistema puede presentar incertidumbres en
su estructura o dinámica no modelada en su representación. Ya que la descripción del
sistema permite incertidumbres, el control adaptativo (en general) se puede considerar
una aproximación particular de control robusto.

3.2. SCAMR para Sistemas No Lineales Multivariables


3.2.1. Diseño del SCAMR
Una gran clase de sistemas no lineales se pueden describir mediante su modelo
dinámico de Lagrange:
   
q1 u1
   
M(q)q̈ + P(q, q̇)q̇ + d(q) = u q =  ...  u =  ...  (3.1)
qm um

donde M es una matriz simétrica definida positiva y la matriz P y el vector d se


determinan por construcción a partir del modelo dinámico no lineal del sistema a
controlar. También, q es el vector de coordenadas generalizadas y u es el vector de
control. Cabe a notar que en el caso de los manipuladores robóticos, las matrices
M, P y d representan la inercia del sistema a controlar, los torques centrı́petos y
de Coriolis, y los torques gravitacionales respectivamente. Sistemas dinámicos que
acepten la descripción arriba expuesta, también pueden ser controlados empleando
el procedimiento de diseño a desarrollar más adelante.
El objetivo de control del SCAMR es diseñar una ley de control u capaz de
hacer que la salida del sistema q(t) siga a la trayectoria deseada qd (t) con velocidad
suficiente a pesar de la presencia de incertidumbres en los parámetros. De acuerdo a
3.2 SCAMR para Sistemas No Lineales Multivariables 45

la referencia [14], asumamos que es posible transformar (3.1) en una expresión que
dependa linealmente de un vector de parámetros a con elementos conocidos, a saber:

Ya = u (3.2)

donde Y es una matriz que contiene información de las variables en juego. Considere
la siguiente ley de control:
u = Yb a − KD s (3.3)
donde KD s es el término derivativo e Yb a es el término anticipativo. En los términos
b es el vector estimado de parámetros, KD (la ganancia derivativa) es una
descritos, a
matriz simétrica constante definida positiva y s es un vector de superficies deslizantes
cuyos elementos si , i = 1, . . . , m se definen mediante la ecuación escalar si (q, t) = 0,
de modo tal que:
d
si = ( + λi )n−1 qei = (p + λi )n−1 qei (3.4)
dt
donde λi > 0 es una constante (el ancho de banda), p es el operador de Laplace y:

qei = qi − qdi

es el i–ésimo error de seguimiento. Por ejemplo, para n = 2, (3.4) se convierte en un


error de seguimiento compuesto formado por el error de seguimiento de velocidad q ė
e como sigue:
y el de posición q

ė + Λe
s=q q = q̇ − q̇r q̃ = q − qd q̇r = q̇d − Λe
q (3.5)

donde:      
s1 qė1 qėr1
     
s =  ...  ė =  ... 
q ėr =  ... 
q
sm qėm qėrm
 
λ1 0 ... 0
 0 λ2 ... 0 
 
qd = [qd1 ... qdm ]T Λ= .. .. ..  (3.6)
 . . ... . 
0 0 . . . λm
La conservación de la energı́a requiere que:
1 d T
[q̇ Mq̇] = q̇T (u − d) (3.7)
2 dt
donde q̇T Mq̇ es la energı́a cinética del sistema y q̇T (u − d) es la potencia de entrada
generada por el actuador. Diferenciando el miembro izquierdo de (3.7):
1
q̇T Mq̈ + q̇T Ṁq̇ = q̇T (u − d) (3.8)
2
De (3.1) obtenemos: Mq̈ = u − d − Pq̇. Sustituyendo este término en (3.8):

q̇T (Ṁ − 2P)q̇ = 0 (3.9)


46 Control Adaptativo con Modelo Referencial

Ha sido establecido en [13], [14] que (Ṁ−2P) = J es antisimétrica, es decir: J = −JT .


Por consiguiente:
Ṁ = 2P + J (3.10)
Considere la siguiente candidata para función de Lyapunov:
1 T 
V (t) = bT Γ−1 a
s Ms + a e (3.11)
2
e=a
donde Γ es una matriz simétrica definida positiva y a b −a es el error de estimación
de parámetros. Diferenciando (3.11) se obtiene:
1 T
V̇ (t) = sT Mṡ + sT Ṁs + a
ḃ Γ−1 a
e
2
y empleando la relación s = q̇− q̇r (ecuación (3.5)) en la expresión anterior se obtiene:
1 T
V̇ (t) = sT (Mq̈ − Mq̈r ) + sT Ṁs + a
ḃ Γ−1 a
e
2
Sustituyendo (3.10), (3.3) y Mq̈ de (3.1) en V̇ produce:
T
V̇ (t) = sT (Yb ḃ Γ−1 a
a − KD s − Mq̈r − Pq̇r − d) + a e (3.12)

en donde hemos usado el hecho de que sT Js = 0, dado que J es antisimétrica1 . La


b se puede formular como:
ley de adaptación de los parámetros estimados a

ḃ = −ΓY T s
a (3.13)

mientras que la propiedad de parametrización lineal en (3.12) establece que:

Y(q, q̇, q̇r , q̈r )a = M(q)q̈r + P(q, q̇)q̇r + d(q) (3.14)

Reemplazando (3.14)y (3.13) en (3.12) produce:

V̇ (t) = −sT KD s ≤ 0 (3.15)

Dado que s = q ė + Λe
q (ver (3.5)), entonces (3.15) garantiza que los errores de
seguimiento de posición q ė tiendan a 0 conforme t → ∞. En otras
e y de velocidad q
palabras, los errores de seguimiento convergen en la superficie s = 0.

3.2.2. El Observador de Velocidad


Es conveniente estimar la velocidad angular q̇ del sistema, dado que solo se cuen-
ta con la medición del vector de posición q. El estimado de la velocidad angular,
denotada como q,ḃ toma la forma:

ḃ = q̇d + Ld (q − q
q b) (3.16)

donde la matriz de ganancia Ld = `d I del observador es diagonal y definida positiva,


siendo `d es una constante positiva.
1
Suponga que sT Js = c 6= 0, donde c es una constante. Como J es antisimétrica: J = −JT ; luego
sT Js = ±c. Entonces, la única solución posible para la constante es: c = 0
3.2 SCAMR para Sistemas No Lineales Multivariables 47

3.2.3. Zona–Muerta para Evitar Corrimiento de Parámetros


El problema del corrimiento de parámetros hacia valores peligrosos está aso-
ciado con las incertidumbres no paramétricas tales como fricciones estática y de
Coulomb, ruidos de medición, tiempos muertos, entre otros. Tal problema se origi-
na principalmente cuando el SCAMR no está excitado permanentemente o debido a
la presencia del ruido de medición o de disturbios. El corrimiento de los valores de
los parámetros puede causar que el SCAMR se torne inestable si se permite que los
parámetros estimados desplacen sus valores hacia valores que puedan provocar que
los polos del SCAMR se vuelvan inestables.
La experiencia dicta que la presencia de pequeños errores de seguimiento pueden
originar el corrimiento de los parámetros a valores peligrosos, debido a que dichas
señales básicamente contienen ruido y disturbios. La técnica más simple de modi-
ficación de la ley de control para evitar este problema es detener el mecanismo de
adaptación en presencia de pequeño errores de seguimiento. Esta técnica conocida
como “zona–muerta”sustituye (3.13) por:

−ΓY T s |s| > ∆
ḃ =
a
0 |s| < ∆
(3.17)

donde ∆ representa el tamaño de la zona–muerta. Ecuación (3.17) nos indica que


ḃ debe tomar el valor −ΓY T s computado en el tiempo de
cuando |s| < ∆, entonces a
muestreo anterior.

3.2.4. Procedimiento de Diseño del SCAMR


El procedimiento de diseño del sistema de control adaptativo con modelo referen-
cial desarrollado sigue los pasos siguientes:

(1) Formular el problema: describir el sistema a controlar, definir las especifica-


ciones de diseño y determinar el modelo dinámico de Lagrange (ecuación (3.1)).

(2) Construir la ecuación de parametrización lineal dada en (3.14) como sigue.


ḃ usando el observador de velocidad dado en (3.16):
Primero estimar el vector q

ḃ = q̇d + Ld (q − q
q b)

Luego, formular los errores de posición y velocidad:

q̃ = q − qd q̃˙ = q̇ − q̇d

y la función de deslizamiento:

b + Λe
s=q q

La velocidad y aceleración de referencias se formulan como:

q̇r = q̇d − Λe
q ė
q̈r = q̈d − Λq
48 Control Adaptativo con Modelo Referencial

Finalmente, formular la matriz de parametrización:

Y(q, q̇, q̇r , q̈r )a = M(q)q̈r + P(q, q̇)q̇r + d(q)

b integrando la ley de adaptación


(3) Determinar el vector de parámetros estimados a
ḃ = −ΓY T s (ecuación (3.13)).
a
(4) Calcular la ley de control u = Yb
a − KD s (ecuación (3.3)).
(5) Si fuera necesario, con el fin de evitar el corrimiento de los parámetros, emplear
la siguiente ecuación de la zona–muerta:

−Γ Y T s |s| > ∆
α
ḃi = (3.18)
0 |s| < ∆

donde ∆ representa el tamaño de la zona–muerta.


(6) Simular el sistema de control adaptativo empleando los resultados de los pasos
anteriores.
(7) Implementar el sistema de control adaptativo (hardware).
(8) Desarrollar el software de control en tiempo real del sistema.
(9) Ejecutar pruebas de funcionamiento.

3.3. Aplicaciones en Tiempo Real


3.3.1. Control Adaptativo del Manipulador Robótico Esférico
El modelo dinámico de Lagrange del MRE se muestra en la ecuación (1.121). Para
fines de parametrización lineal, tal modelo dinámico toma la forma dada en (3.14):
       
M11 0 P11 P12 0 u1
q̈r + q̇r + =
0 M22 P21 P22 d21 u2

Este sistema puede ser parametrizado definiendo:

a4 Ra Ra m2 L22
M11 = a1 + sin2 q2 a1 = (J1 + Jeq a4 =
2 nKm KA 2nKm KA
 
Ra 1 2
M22 = a2 a2 = J2 + Jeq + m2 L2
nKm KA 4
 2

Ra n Km Kb
P11 = a3 a3 = Beq +
nKm KA Ra
P12 = a4 q̇1 sin q2 cos q2
a4
P21 = q̇1 sin q2 cos q2
2
P22 = a3
Ra m2 L2 g
d21 = a5 sin q2 a5 =
2nKm KA
3.3 Aplicaciones en Tiempo Real 49

Por consiguiente, la propiedad de parametrización lineal dada en (3.14) queda como:


 
a1
b
  b 
q̈r1 0 q̇r1 1
sin2 q2 + q̇r1 0  a2 
Y(q, q̇, q̇r , q̈r )b
a= 2  a3 
0 q̈r2 q̇r2 12 q̇r1
2 sin q cos q
2 2 sin q2
 b 
 b
a4 
a5
b

donde el vector de parámetros estimados a b se calcula integrando la ley de adaptación:


b = −ΓY T s. Para determinar el vector de deslizamiento s dado en (3.5), se requiere
a
emplear el observador de velocidad descrito en (3.16). Finalmente, la ley de control
se determina de: u = Yb a − Kd s.
Las Figs. 3.2 y 3.3 muestran los resultados de la simulación del sistema de control
adaptativo diseñado para controlar las posiciones angulares de los brazos del MRE
para los casos de seguimiento y regulación respectivamente. Para obtener tales re-
sultados, ejecutar los programas acmres.m y acmrer.m, para los cuales el tiempo de
muestreo se fijó en T = 0.001 s. Observar que las especificaciones de diseño porcenta-
je de sobrenivel nulo, error en estado estacionario nulo y tiempo de estabilización
menor de 1 segundo se cumplen satisfactoriamente para ambos casos. Los parámet-
ros de sintonización en los dos casos se seleccionaron: Λ = 4, γ = 0.1, L d = 80 y
Kd = 20.
POSICIÓN q1 [rad]

10

0
0 2 4 6 8 10 12 14 16
CONTROL u1 [V]

−1
0 2 4 6 8 10 12 14 16
TIEMPO [s]
POSICIÓN q2 [rad]

10

0
0 2 4 6 8 10 12 14 16
CONTROL u2 [V]

−1
0 2 4 6 8 10 12 14 16
TIEMPO [s]

Fig. 3.2: Posiciones angulares controladas de los brazos del MRE. Caso: seguimiento.

El resultado experimental para el caso regulación se muestra en la Fig. 3.4. Este


resultado se se obtiene ejecutando el archivo LabVIEW acmrer.vi, el cual emplea otros
dos archivos para implementar las señales de referencia tipo escalón: SETPOINT4.vi
50 Control Adaptativo con Modelo Referencial

POSICIÓN q1 [rad]
1

0.5

0
0 1 2 3 4 5 6 7 8
50
CONTROL u1 [V]

−50
0 1 2 3 4 5 6 7 8
POSICIÓN q2 [rad]

0.5

0
0 1 2 3 4 5 6 7 8
50
CONTROL u2 [V]

−50
0 1 2 3 4 5 6 7 8
TIEMPO [segundos]

Fig. 3.3: Posiciones angulares controladas de los brazos del MRE. Caso: regulación.

y SETPOINT5.vi, tanto para la base como para el brazo del MRE respectivamente.
También requiere de un archivo MATRIZYadap.vi, en el cual se realizan varias opera-
ciones requeridas por el algoritmo. Los gráficos de la Fig. 3.4 se obtienen ejecutando
el archivo acmrertr.m, el cual emplea los mismos parámetros de sintonización usados
en la simulación (archivo acmrer.m) además de los archivos de datos experimentales
setpoitnbase, setpointbrazo, U1 y U2. Las especificaciones de diseño preestablecidas
en la simulación también se cumplen para el caso experimental y para el mismo
tiempo de muestreo: T = 0.001 s. ♣
3.3 Aplicaciones en Tiempo Real 51

Posición x1 [grad]

200

−200
0 5 10 15
TIEMPO [s]
CONTROL u1 [V]

10

−10
0 5 10 15
TIEMPO [s]
Posición x2 [grad]

100

−100
0 5 10 15
TIEMPO [s]
CONTROL u2 [V]

10

−10
0 5 10 15
TIEMPO [s]

Fig. 3.4: Respuesta experimental del sistema de control adaptativo del MRE.
Capı́tulo 4

Control por Modos Deslizantes

Este capı́tulo se ocupa del control de sistemas no lineales usando la metodologı́a


del denominado control por modos deslizantes, o simplemente control deslizante. Para
este control, la descripción dinámica del sistema puede ser imprecisa; esto es, su modelo
dinámico puede presentar incertidumbre paramétrica en su estructura o dinámica no mo-
delada en su representación. Dado que la descripción del sistema permite incertidumbres,
el control deslizante puede ser considerado como una técnica de control robusto.
La metodologı́a del control deslizante incluye una ley de control no lineal de reali-
mentación que conmuta discontinuamente sobre una superficie que pertenece al espacio
de estado del sistema, de forma tal que si una trayectoria de estado que se origina en su
superficie y trata de desviarse de dicha superficie, entonces se aplica una fuerza de control
con el propósito de hacer retornar tal trayectoria a su superficie original. Por consiguiente,
trayectorias de estado naturales del sistema controlado estarán restringidos a deslizarse
a lo largo de su superficie.
Este capı́tulo describe la la metodologı́a para diseñar sistemas de control deslizante
para una cierta clase de sistemas multivariables no lineales.

4.1. Conceptos Básicos


Para explicar la notación empleada y los conceptos básicos del control con modos
deslizantes, emplearemos un sistema dinámico de una entrada y lineal en u. Este
sistema posee la forma:
 
x
 ẋ 
 
(n)  x(2) 
x = f (x) + b(x)u x=  (4.1)
 .. 
 . 
x(n−1)
donde el estado escalar x es la salida de interés del sistema, el escalar u es la entrada
de control, x es el vector de estado y las funciones f (x) y g(x) no son exactamente
conocidas pero son acotadas por funciones conocidas dependientes de x. En adición,
b(x) es de signo conocido. Notar que la notación para expresar derivadas totales de
orden superior es:
dxn
x(n) , n
dt
54 Control por Modos Deslizantes

Dada una trayectoria de estado deseada y variante con el tiempo:


 
xd
 ẋ 
 d 
 (2) 

xd =  x d  xd (0) = x(0) (4.2)
. 
 . 
 . 
(n−1)
xd

El problema de control a resolver consiste en diseñar un control finito u que fuerce al


estado x seguir a la trayectoria deseada xd a pesar de la presencia de incertidumbres
en los parámetros y dinámica no modelada.
Definamos el error de seguimiento x̃ y el vector de error de seguimiento x̃ como:
 
x
e
 ė 
x
 
 x e(2) 
x
e = x − xd e
x = x − xd =   (4.3)
 .. 
 . 
e(n−1)
x

Además, consideremos la superficie S(t) variante con el tiempo en el espacio de estado


Rn definido mediante la ecuación escalar s(x, t) = 0, tal que:
d
s(x, t) = ( + λ)n−1 x e = x(n−1) − xr(n−1)
e = (p + λ)n−1 x (4.4)
dt
donde λ es una constante positiva cuya selección se discutirá luego, p es el operador
(n−1)
de Laplace y xr es una función que puede ser computada de x y xd . Por ejemplo,
para un sistema de orden n = 3, s toma la forma:

s = (p + λ)2 x
e = (p2 + 2λp + λ2 )e
x=x ė + λ2 x
ë + 2λx e
= ẍ − ẍr
ė − λ2 x
ẍr = ẍd − 2λx e (4.5)

Notar en este caso que s resulta la suma ponderada del error de aceleración x, ë del
error de velocidad xė y el error de posición xe.
La relación (4.4) establece que un problema de control de trayectoria de orden
n se puede reemplazar por un problema de estabilización de primer orden, es decir,
por el problema de mantener el escalar s en cero. Tal problema de estabilización se
puede resolver seleccionando la ley de control u de (4.1) de forma tal que fuera de la
superficie S(t):
1 d 2
s = ṡ s ≤ −η|s| (4.6)
2 dt
donde η es una constante positiva. Como se ilustra en la Fig. 4.1(a) para el caso
n = 2, todas las trayectorias de estado que satisfacen la condición (4.6), la condición
de deslizamiento, hacen de la superficie S(t) un conjunto invariante en el sentido de
Lyapunov (ver Apéndice C), implicando que las trayectorias del sistema fuera de S(t)
apuntarán a tal superficie, y las trayectorias del sistema en S(t) permanecerán en ella.
También se puede establecer que dinámica no modelada, incertidumbre paramétrica
4.1 Conceptos Básicos 55

o ciertos disturbios, serán tolerados por un sistema que satisfaga la condición dada
en (4.6). S(t) es conocida como la superficie de deslizamiento porque satisface la
condición de deslizamiento. El comportamiento del sistema sobre una superficie de
deslizamiento se denomina modo de deslizamiento.
S(t)

(a)
dx
dt s=0

. xd

x
0

(b)
dx
s=0
dt

. xd

x
0
(c)

Fig. 4.1: (a) La superficie de deslizamiento S(t). (b) Convergencia exponencial. (c)
Fenómeno del “chattering”.

Consideremos el caso de aquellos sistemas que satisfacen la condición (4.6), pero


no la condición dada en (4.2), esto es, xd (0) 6= x(0). Para tales sistemas, la superficie
de deslizamiento s(t) = 0 será golpeada por alguna trayectoria del sistema en un
tiempo thit , el cual se puede computar como sigue. Asumiendo que s(0) > 0 y s(thit ) =
0 e integrando (4.6) entre t = 0 y t = thit se obtiene:
Z thit Z s(thit ) Z thit
ṡ dt = = 0ds ≤ − η dt (4.7)
0 s(0) 0

nos conduce a thit ≤ s(0)/η. Se puede obtener el mismo resultado si se arranca con
s(0) negativo. Por consiguiente:

thit ≤ |s(0)|/η (4.8)

La Fig. 4.1(b) ilustra el caso de una trayectoria de estado que evoluciona con una
condición inicial arbitraria, y luego golpea a la superficie s(t) = 0 en un tiempo finito
thit ≤ |s(t = 0)|/η. En el modo de deslizamiento, tal trayectoria “se desliza” a lo
largo de S(t) con el objeto de alcanzar exponencialmente a xd con una constante de
56 Control por Modos Deslizantes

tiempo igual a 1/λ. Por cierto, la expresión de (4.4) para n = 2:

1/λ
s = (p + λ)x̃ → x̃ = s
(1/λ)p + 1

posee una constante de tiempo igual a 1/λ.


La implementación de sistemas de control deslizantes requiere de una ley de con-
trol realimentada, la cual se puede obtener de (4.4) y (4.1) de modo tal que s 2 en la
ecuación (4.6) se comporte muy parecido a una función de Lyapunov (Apéndice C)
con el fin de garantizar estabilidad asintótica del sistema a lazo cerrado. En modo
deslizante para el caso ideal, por ejemplo, cuando el modelo del sistema (4.1) repre-
senta exactamente al sistema actual, la ley de control diseñada forzará a todas las
trayectorias de estado a deslizarse a lo largo de s = 0, tal como se observa en la Fig.
4.1(b).
Sin embargo, debido a la presencia de imprecisiones en el modelado (incertidum-
bres en los parámetros y dinámica no modelada) y de disturbios, la ley de control
forzará a todas las trayectorias de estado a deslizarse discontinuamente a lo largo
de s = 0 tal como se muestra en la Fig. 4.1(c); es decir, la ley de control en mo-
do deslizante necesita ser discontinua a través de S(t), produciendo ası́ el fenómeno
conocido como chattering. Desde que el chattering implica una muy elevada actividad
de control, entonces, por consideraciones prácticas, la fuerza de control u necesita ser
suavizada adecuadamente (por ejemplo, mediante una acción de saturación) a pesar
de la pérdida de precisión en el seguimiento y en el ancho de banda.

Ejemplo 4.1

Para el sistema ẋ = u definamos la superficie s(t) = x(t). Consideremos una ley de


control de la forma:
 +
u = −1 if s(t) > 0
u = ẋ = −sgn(x) =
u− = +1 if s(t) < 0

donde sgn(.) es la función signo definida como:

sgn(x) = +1 si x > 0

sgn(x) = −1 si x < 0
La Fig. 4.2 muestra las trayectorias del sistema x(t) = −t y x(t) = t originadas
por la ley de control u+ y u− respectivamente. La superficie s(t) = x(t) = 0 es una
superficie de deslizamiento porque satisface la condición (4.6) para η ≤ 1. ♣

4.2. Control Deslizante para Sistemas Multivariables


4.2.1. El Sistema a Controlar
Esta sección sigue el procedimiento desarrollado en [16]. La representación dinámi-
ca del sistema no lineal multivariable, el modelo de Lagrange, está dado por:

M(q)q̈ + P(q, q̇)q̇ + d(q) = u (4.9)


4.2 Control Deslizante para Sistemas Multivariables 57

s=0

Fig. 4.2: La superficie de deslizamiento s(t) = 0, por ejemplo 4.1.

donde q es un m × 1 vector de coordenadas generalizadas. Si el sistema a controlar es


un manipulador robótico, entonces M(q) es una matriz de inercia simétrica definida
positiva de orden m × m, P(q, q̇) es una matriz de orden m × m que representa las
fuerzas de Coriolis y centrı́peta, d(q) es un vector de orden m × 1 que representa las
fuerzas gravitacionales y u es un vector de orden m × 1 de fuerzas generalizadas. El
procedimiento de diseño a desarrollarse también puede ser aplicado a otros sistemas
no lineales que acepten la representación dinámica dada en (4.9).
El vector de estado correspondiente a (4.9) posee la forma x = [q q̇] T . Sean
qdi (t) y q̇di (t) para i = 1, . . . , m las trayectorias deseadas, las cuales se suponen ser
funciones del tiempo continuamente diferenciables. Los vectores de error se definen
como:
e(t) = q − qd
q ė = q̇ − q̇d
q(t)
o lo que es lo mismo empleando sus componentes:

qei (t) = qi (t) − qdi (t) qėi (t) = q̇i (t) − q̇di (t)

4.2.2. La Superficie de Conmutación


Sea la siguiente superficie de conmutación:

si (x, t) = si (q, q̇, t) = λii qei (t) + qėi (t) i = 1, . . . , m (4.10)

o en forma matricial:
ė =
s(x, t) = s(q, q̇, t) = Λq̃ + q (4.11)
        
s1 (x, t) s1 (q, q̇, t) λ11 · · · 0 qe1 qė1
 ..   ..   .. .. ..   ..  +  .. 
 . = . = . . .  .   . 
sm (x, t) sm (q, q̇, t) 0 · · · λmm qem qėm
donde las constantes positivas λii son los elementos de una matriz diagonal Λ de
orden m × m. Asumiendo que una fuerza de control diseñada es capaz de confinar
58 Control por Modos Deslizantes

todas las trayectorias que se originan en la intersección de tales superficies y hacerlas


permanecer allı́, entonces en tal situación se cumple, de acuerdo a (4.10), que:

si (q, q̇, t) = 0 = λii qei (t) + qėi (t) i = 1, . . . , m

Esta última relación nos indica que q̃i (t) y q̃˙ i (t) deben converger exponencialmente a
cero, esto es:

q̃i (t) = qi (t) − qdi (t) = 0 q̃˙ i (t) = q̇i (t) − q̇di (t) = 0

Por consiguiente: qi (t) = qdi (t) y q̇i (t) = q̇di (t), con lo cual se logra el objetivo de
control.

4.2.3. Diseño de la Fuerza de Control Multivariable


El diseño de la fuerza o ley de control requerida para confinar las trayectorias del
sistema que se originan en la intersección de las superficies de deslizamiento y hacerlas
permanecer allı́ emplea el método directo de Lyapunov. Omitiendo por simplicidad
la dependencia de los argumentos, consideremos la siguiente candidata para función
de Lyapunov:
1
V = sT Ms
2
Definamos ahora la siguiente ley de control:

u = u0 − Usgn(s) (4.12)
     +   
u1 u+
1 + u1

u1 − u −1 ··· 0 sign(s1 )
 ..  1  ..  1 .. .. ..  .. 
 . =  . −  . . .  . 
2 2
um u+
m + u−
m 0 · · · u+
m − u −
m sign(s m )
o en función de sus elementos:
1 +  1 + 
u0j = uj + u −
j Uj = uj − u −
j
2 2
La derivada de s (ecuación (4.11)) produce:

ṡ = Λq ė + (q̈ − q̈d )
ë = Λq
ė + q

Despejando q̈ de (4.9) y reemplazando la expresión resultante en la ecuación anterior


se obtiene:
ṡ = M−1 (u0 − U sgn(s) − ueq )
donde:
ė + Pq̇ + d + Mq̈d
ueq = −MΛq
Por consiguiente:
1 T 1
V̇ = sT Mṡ + s Ṁs = sT [u0 − Usgn(s) − ueq ] + sT Ṁs (4.13)
2 2
En la referencia [13] se establece que:
1h i
P= Ṁ − J (4.14)
2
4.2 Control Deslizante para Sistemas Multivariables 59

donde J es una matriz antisimétrica, es decir: J = −JT . Empleando (4.14) en (4.13)


nos conduce a:
1
V̇ = sT [u0 − Usgn(s) + Ps − ueq ] + sT Js
2
Dado que sT Js = 0 debido a que J es antisimétrica, entonces:
m
X m
X
V̇ = sT [u0 + Ps − ueq ] − sT Usgn(s) = sj [u0 + Ps − ueq ]j − Uj |sj |
j=1 j=1
m
X m
X
≤ |sj [u0 + Ps − ueq ]j | − Uj |sj | (4.15)
j=1 j=1

Seleccionando:
Uj ≥ |[u0 + Ps − ueq ]j | + η ε>0 (4.16)
y reemplazando esta última expresión en (4.15) se obtiene:
m
X
V̇ ≤ −η |sj | η>0
j=1

lo que significa que se ha cumplido la condición de deslizamiento y a la vez se garantiza


˙
que q̃(t) y q̃(t) convergen exponencialmente a cero.
+
Sean ûeq y P̂ los estimados de u y P respectivamente. Los controles u− j y uj se
pueden seleccionar para satisfacer:
)
u+ = [b
u eq − b
Ps] j + ū +
j j
b j + ū− i = 1, . . . , m (4.17)
u−
j = [b
u eq − Ps] j

Si seleccionamos:
ū+
j = Kj ū−
j = − Kj (4.18)
entonces de (4.17) obtenemos:

1 b j
u0j = (u+ + u−
j ) = [b
ueq − Ps] Uj = K j
2 j
o lo que es lo mismo, en forma matricial:
 + 
u1 + u −
1
1 ..  b
u0 =  . =u b eq − Ps
2
u+
m + um

 +   
u1 − u −
1 ··· 0 K1 · · · 0
1 .. .. ..   .. . . .. 
U =  . . . = . . .  (4.19)
2 +
0 · · · um − um − 0 · · · Km

Asumiendo que el término gravitacional se puede expresar como:

d = u0 = u b
b eq − Ps (4.20)
60 Control por Modos Deslizantes

entonces la ley de control dada por (4.12) toma la forma:


 
K1 · · · 0
 ..  sgn(s)
u = u0 − Usign(s) = d −  ... . . . .  (4.21)
0 · · · Km

y la relación (4.16) con Uj = Kj se expresa como:

Kj ≥ |[ueq − Ps − d]i | + η
˙
Ahora, dado que ueq = −MΛq̃+Pq̇+d+Mq̈d , entonces las ganancias Kj se pueden
seleccionar siempre que:

Kj ≥ |(−M Λq̃˙ + P q̇ + M q̈d − P s)j | + η (4.22)

en donde M and P son las cotas superiores de M y P respectivamente.

4.3. Procedimiento de Diseño


El procedimiento de diseño de un sistema de control con modos deslizante, como
el desarrollado en la sección 4.2, comprende los pasos siguientes.
(1) Formular el problema: describir el sistema a controlar, definir las especifica-
ciones de diseño y determinar el modelo no lineal del sistema en la forma dada
en (4.9).
(2) Determinar la ley de control con modos deslizantes dada en (4.21). Para ello se
requiere primero determinar las cotas superiores de M y P. Luego, formular el
siguiente observador de velocidad para determinar el vector q:ḃ

ḃ = q̇d + Ld (q − q
q b)

donde Ld = `I es una matriz diagonal siendo ` una constante positiva. El vector


estimado q ḃ mientras que q
b se calcula integrando q, b̈ se determina del modelo
dinámico de Lagrange:

b̈ = M−1 (q)[u − P(q, q)


q ḃ − d(q)]

El vector de deslizamiento s se calcula como sigue:

e = q − qd
q ė = q̇ − q̇d
q ë = q̈ − q̈d
q


q+q
s = Λe
siendo Λ = λI una matriz diagonal, donde λ es una constante positiva. Las
constantes Kj (j = 1, . . . , m) se calculan de (4.22):

Kj ≥ |(−M Λq̃˙ + P q̇ + M q̈d − P s)j | + η (4.23)

donde M and P son las cotas superiores de M y P respectivamente y η una


constante positiva. Para suavizar la acción de control introducimos las función
de saturación satj , j = 1, . . . , m:
4.4 Aplicaciones en Tiempo Real 61

u
if (sj /Φ > 1)
satj = 1
elseif (sj /Φ < −1)
Φ Φ s satj = −1
else
satj = sj /Φ
end

Finalmente, la ley de control se calcula de:


  
K1 · · · 0 sat1
 ..   .. 
u=d− .  .  (4.24)
0 · · · Km satm

(3) Simular el sistema de control con modos deslizantes empleando los parámetros
de sintonización: Λ, η, Ld y Φ.
(4) Implementar el sistema de control deslizante (hardware).
(5) Desarrollar el software de control en tiempo real del sistema.
(6) Ejecutar pruebas de funcionamiento en tiempo real.

4.4. Aplicaciones en Tiempo Real


4.4.1. Control Deslizante del Manipulador Esférico MRE
El modelo dinámico de Lagrange del MRE se describe en la subsección 1.2.2, ecuación
(1.121). La determinación de la ley de control requiere la formulación de las cotas
superiores de M y P:
 
Ra 1 2
M 11 = J1 + Jeq + m2 L2
nKm KA 4
M 12 = M 21 = 0
 
Ra 1 2
M 22 = J2 + Jeq + m2 L2
nKm KA 4
 
Ra n2 K m K b
P 11 = Beq + = P 22
nKm KA Ra
Ra m2 L22
P 12 =
2nKm KA
Ra m2 L22
P 21 =
4nKm KA

Por consiguiente:
  
Ra
nKm KA J1 + Jeq + 14 m2 L22 sin q22 0
M(q) =
0 M 22
62 Control por Modos Deslizantes

 
P 11 P 12 q̇1 sin q2 cos q2
P(q, q̇) =
P 21 q̇1 sin q2 cos q2 P 22
 
0
d(q) = Ra m2 L2 g
2nKm KA sin q2

Las señales de referencia deseada qd para propósitos de simulación se formulan para


el caso de seguimiento como:

qd1 = A sin W k + Bk
qd2 = A cos W k + Bk (4.25)

donde A y B son constantes, k = t/T es el tiempo discreto y T es el tiempo de


muestreo. Para el caso de regulación, qd es del tipo escalón. Los parámetros de sin-
tonización K1 y K2 se determinan de (4.23) con:
   
M 11 0 P 11 P 12
M= P=
0 M 22 P 21 P 22

Luego, la ley de control se calcula de (4.24).


Las Figs. 4.3 y 4.4 muestran el resultado de la simulación del sistema de control
deslizante diseñado para controlar las posiciones angulares de la base y del brazo
del MRE para los casos de seguimiento y regulación respectivamente. Para obtener
tales resultados, ejecutar los programas scmres.m y scmrer.m. Notar que las especi-
ficaciones de diseño porcentaje de sobrenivel nulo, error en estado estacionario nulo
y tiempo de estabilización menor de 1 s se cumplen satisfactoriamente para ambos
casos. Los parámetros de sintonización para los dos casos se fijaron en: λ = 7, η = 2,
`d = 30 y Φ = 0,4. El tiempo de muestreo empleado fue de T = 0.01 s.
El resultado experimental para el caso regulación se muestra en la Fig. 4.5, resul-
tado que se obtiene ejecutando el archivo LabVIEW scmrer.vi, el cual a su vez emplea
dos archivos para implementar las señales de referencia tipo escalón: SETPOINT1.vi
y SETPOINT3.vi tanto para la base como para el brazo del MRE respectivamente.
Los gráficos de la Fig. 4.5 se obtienen ejecutando el archivo scmrertr.m, el cual usa
los mismos parámetros de sintonización del archivo de simulación scmrer.m, además
de los archivos de datos experimentales setpoint base, setpoint brazo, U1 y U2. Las
especificaciones de diseño preestablecidas en la simulación también se cumplen para
el caso experimental y para el mismo tiempo de muestreo. ♣
4.4 Aplicaciones en Tiempo Real 63

POSICIÓN q1 [rad]

−5
0 5 10 15 20 25 30 35 40
CONTROL u1 [V]

0.5

−0.5
0 5 10 15 20 25 30 35 40
TIEMPO [s]
POSICIÓN q2 [rad]

−5
0 5 10 15 20 25 30 35 40
CONTROL u1 [V]

10

−10
0 5 10 15 20 25 30 35 40
TIEMPO [s]

Fig. 4.3: Posiciones angulares controladas de los brazos del MRE. Caso: seguimiento.
64 Control por Modos Deslizantes

POSICIÓN q1 [rad]

0.4

0.2

0
0 2 4 6 8 10 12 14 16 18 20
CONTROL u1 [V]

−5
0 2 4 6 8 10 12 14 16 18 20
TIEMPO [s]
POSICIÓN q2 [rad]

0.4

0.2

0
0 2 4 6 8 10 12 14 16 18 20
CONTROL u1 [V]

−5
0 2 4 6 8 10 12 14 16 18 20
TIEMPO [s]

Fig. 4.4: Posiciones angulares controladas de los brazos del MRE. Caso: regulación.
4.4 Aplicaciones en Tiempo Real 65

Posición x1 [grad]

100

−100
0 2 4 6 8 10 12 14 16 18 20
TIEMPO [s]
CONTROL u1 [V]

10

−10
0 2 4 6 8 10 12 14 16 18 20
TIEMPO [s]
Posición x2 [grad]

200

100

0
0 2 4 6 8 10 12 14 16 18 20
TIEMPO [s]
CONTROL u2 [V]

10

−10
0 2 4 6 8 10 12 14 16 18 20
TIEMPO [s]

Fig. 4.5: Respuesta experimental del sistema de control deslizante del MRE.
Capı́tulo 5

Control Backstepping

Este capı́tulo describe la metodologı́a para diseñar sistemas de control backstepping


para una cierta clase de sistemas multivariables no lineales. Tal metodologı́a, basada en
el método directo de Lyapunov, comprende varios pasos en concordancia con el orden del
sistema. En cada paso es necesario introducir un estado virtual y una fuerza de control
virtual que permitan reescribir la ecuación de estado actual del sistema a controlar en
términos de éstos. La selección adecuada de una función de Lyapunov, va a permitir
determinar un control virtual, que aplicado al sistema a controlar, permita la estabilización
del mismo.

5.1. Introducción
El método directo de Lyapunov (Apéndice C) se emplea extensivamente para
el análisis y sı́ntesis de sistemas. Los sistemas de control adaptativo con modelo
referencial y con modos deslizantes descritos en los capı́tulos 3 y 4 respectivamente,
fueron sintetizados empleando dicho método. El método directo de Lyapunov, descrito
en el Apéndice A, emplea una función de Lyapunov que contiene cierta información
de la dinámica del sistema. Si la derivada en el tiempo de la función de Lyapunov
seleccionada es negativa, entonces se dice en el sentido de Lyapunov que el sistema
en estudio es estable, tal como se puede ver en el siguiente ejemplo.

Ejemplo 5.1

Determinar una función de Lyapunov para el sistema escalar:

ẋ = − cos x − x3 + u

donde x es la variable de estado y u es la señal de control.

Solución: Es claro que una fuerza de control de la forma u = cos x + x3 − kx,


donde k es una constante, convierte tal sistema a su forma lineal ẋ = −kx, y por lo
tanto, lo puede estabilizar. Si tomamos V (x) = x2 /2 como una función de Lyapunov
para el sistema, vemos que:

1. V (x) es definida positiva.


68 Control Backstepping

dV
2. dt = x dx 2
dt = xẋ = −kx es definida negativa.

Por consiguiente, el sistema es globalmente asintóticamente estable en el sentido de


Lyapunov. Observar que el término x3 en la ley de control u = cos x + x3 − kx, puede
hacerla crecer significativamente.
Si seleccionamos en cambio como ley de control u = cos x−kx, entonces el sistema
tomas la forma ẋ = −kx − x3 . Usando la misma función de Lyapunov V (x) = x2 /2,
obtenemos V̇ (x) = xẋ = −x4 − kx2 ≤ −x4 . Este resultado es ventajoso porque
demuestra que la magnitud de la fuerza de control u se incrementa linealmente con
x en lugar de hacerlo con x3 y que la función de Lyapunov V decrece más rápido
cuanto más grande sea x. ♣

La Fórmula de Sontag

La fórmula de Sontag [17], [18] nos permite determinar una adecuada ley de
control u = αs (x) para sistemas dinámicos descritos como:

ẋ = f (x) + g(x)αs

Tal fórmula supone que existe una función de Lyapunov V (x) para dicho sistema.
Entonces, una ley de control αs (x) capaz de estabilizar tal sistema se formula como:
 q
2 4
 ∂V
∂x
f+ ( ∂V f +( ∂V
∂x ) ∂x )
g ∂V
αs (x) = − ∂V , ∂x g 6= 0; (5.1)
( ∂x )
g
 ∂V
0, ∂x g = 0.

La ley de control de Sontag permite generar una ley de control de magnitud apropiada
(no grandes magnitudes) y rápida convergencia al estado estacionario a pesar de la
presencia de grandes valores iniciales de x, tal como se demuestra en el siguiente
ejemplo.

Ejemplo 5.2

Determinar una función de Lyapunov para el sistema escalar:

ẋ = − cos x − x3 + u

Solución: Asumamos la ley de control u = cos x − αs (x), donde αs (x) se determina


usando la fórmula de Sontag con f (x) = −x3 , g(x) = −1 y V (x) = x2 /2. Luego:

∂V ∂V p p
g = −x f = −x4 αs (x) = x3 − x x4 + 1 u(x) = − cos x − x3 − x x4 + 1
∂x ∂x

Podemos observar que para grandes valores de x, αs (x) tiende a cero, mientras que
para pequeños valores de x, αs (x) tiende a −x. Por consiguiente, la magnitud de u
usando la fórmula de Sontag resulta menor que en los casos anteriores. ♣
5.1 Introducción 69

El Control Backstepping
La técnica de control backstepping comprende varios pasos, de acuerdo al orden
del sistema. Cada paso se puede descomponer en las partes siguientes:

(1) Introducir un estado virtual y una fuerza de control virtual, y reescribir la


ecuación de estado actual en términos de éstos.

(2) Seleccionar una función de Lyapunov para el sistema.

(3) Buscar una ecuación para el control virtual que haga que la función de Lyapunov
sea una del tipo estabilizable, es decir, que su aplicación en el sistema permita
determinar las condiciones para estabilizar al sistema, sujeto a las restricciones
del caso.

En los pasos subsiguientes, se aumenta la función de Lyapunov para reflejar la presen-


cia de nuevos estados virtuales. En el ejemplo siguiente se aplica el método descrito.

Ejemplo 5.3

Diseñar un controlador backstepping para el sistema:

ẋ1 = −x31 + x2 (5.2)


ẋ2 = x22 +u (5.3)

Solución: Apliquemos los pasos descritos anteriormente.

(1) Para la ecuación (5.2) definamos una fuerza de control virtual α y un estado
virtual z = x2 − α. Por consiguiente:

ẋ1 = −x31 + z + α

Definamos ahora una función de Lyapunov candidata: V (x) = x21 /2. Entonces:

V̇ (x) = x1 ẋ1 = x1 (−x31 + z + α) = x1 (−x31 + α) + zx1

En este punto se puede usar la fórmula de Sontag para calcular α con el fin
de estabilizar al sistema propuesto. Por simplicidad usaremos: α = −k1 x1 para
k1 ≥ 0. Por lo tanto:

α̇ = −k1 ẋ1 = −k1 (−x31 + x2 )

ż = ẋ2 − α̇ = x2 + u + k1 (−x31 + x2 )

(2) Seleccionemos ahora una función de Lyapunov para el sistema. En este caso,
una apropiada selección resulta la siguiente función de Lyapunov aumentada:
Va (x) = V (x) + z 2 /2. Por consiguiente:

V̇a (x) = V̇ (x) + z ż = −x41 − kx21 + z(u + x1 + x22 + k1 (−x31 + x2 ))


70 Control Backstepping

(3) Seleccionemos una apropiada ley de control u que pueda estabilizar al sistema
de segundo orden. Una posible selección, de las muchas que pueden existir,
puede ser:
u = −k2 z − (x1 + x22 + k1 (−x31 + x2 ))
la cual hace que: V̇a (x) = −x41 − kx21 − k2 z 2 ≤ −x41 , lo que asegura la estabilidad
asintótica del sistema. Dado que z = x2 − α = x2 + k1 x1 , la señal de control u
toma la forma:
u = −k2 (x2 + k1 x1 ) − (x1 + x22 + k1 (−x31 + x2 ))
La Fig. 5.1, obtenida ejecutando el programa bscej33.m, muestra las respuestas
x1 (t) y x2 (t) del sistema estabilizado para las siguientes condiciones iniciales:
x1 (0) = 1.5, x2 (0) = 0.8, y los parámetros: k1 = 1.5 y k2 = 2. ♣
En la siguiente sección se desarrolla un sistema de control backstepping apropiado
para controla una gran clase de sistemas representados mediante un modelo dinámico
de Lagrange.
1.5

1
x1
SALIDA

0.5

−0.5
0 1 2 3 4 5 6

0.5
x2
SALIDA

−0.5

−1
0 1 2 3 4 5 6

2
CONTROL u

−2

−4

−6
0 1 2 3 4 5 6
TIEMPO [s]

Fig. 5.1: Respuesta x del sistema ẋ1 = −x31 + x2 , ẋ2 = x22 + u a una señal de control
backstepping.

5.2. Caracterı́sticas del Modelo


El modelo dinámico de una gran clase sistemas no lineales multivariables se puede
representar mediante la siguiente ecuación matricial [9], [14]:
M(q)q̈ + P(q, q̇)q̇ + d(q) = u (5.4)
5.3 Diseño Backstepping No Lineal 71

donde el vector q de orden n es el vector de estado, M de dimensión n × n es una


matriz simétrica definida positiva que por construcción depende de q, P de dimensión
n × n es otra matriz que depende de los vectores q y q̇, d de orden n es un vector que
depende de q por construcción, y u de orden n es el vector de entrada de control.
Para el caso de los manipuladores robóticos, q es el vector posición, M es la matriz
de inercia, P es la matriz de Coriolis–centripetal y d es el vector de gravedad.
De (5.4), la ecuación para q̈ resulta:

q̈ = M−1 (q)[u − P(q, q̇)q̇ − d(q)] (5.5)

Asumiremos que sólo se dispone de la medición del vector q.

5.3. Diseño Backstepping No Lineal


El diseño backstepping descrito a continuación ha sido desarrollado en [19]. Defi-
namos el error de seguimiento e de la posición angular de un brazo robótico como:

e = q − qd (5.6)

donde qd es la trayectoria deseada de la posición angular. El objetivo de control con-


siste en resolver el problema de seguimiento de la trayectoria usando sólo mediciones
de la posición. Definamos z1 = e como la variable regulada dentro del procedimiento
de diseño backstepping. Computando la derivada de z1 se obtiene:

ż1 = ė = q̇ − q̇d = eν (5.7)

Usemos ahora eν como la variable virtual de control. Seleccionemos la siguiente fun-


ción de estabilización:
α1 = −K z1 (5.8)
donde K es una matriz diagonal de la forma K = kI, donde k es una constante
positiva e I es la matriz identidad. El correspondiente error de la variable de estado
se define como:
z2 = eν − α1 = q̇ − q̇d + K z1 = q̇ − q̇r (5.9)
donde q̇r se define como:
q̇r = q̇d − K z1 (5.10)
Entonces, ecuación (5.7) se puede reescribir como:

ż1 = z2 + α1 = −K z1 + z2 (5.11)

También, la derivada de la variable de error z2 toma la forma:

ż2 = q̈ − q̈d + K ż1 (5.12)

Empleando las ecuaciones (5.5) y (5.11), la ecuación (5.12) se puede formular como:

ż2 = M−1 (q)[u − P(q, q̇)q̇ − d(q)] − q̈d + K z2 − K2 z1 (5.13)


72 Control Backstepping

El análisis de estabilidad del sistema de control a lazo cerrado desarrollado en [19]


emplea el método directo de Lyapunov. Para ello se selecciona la siguiente función
de Lyapunov:
1 T 1 1 T 1
V = z1 K1 z1 + zT2 M(q)z2 + q ė ≡ xT1 P1 x
ė M(q)q (5.14)
2 2 2 2
h T
i
donde q ḃ es el error de estimación de velocidad, xT = zT1 z2T q
ė = q̇ − q ė y
P = diag [K1 M(q) M(q)]. En [19] se demuestra que la derivada total de V posee
la siguiente expresión:
ė 2
V̇ = −α1 kz1 k2 − λ2 kz2 k2 − λ3 kqk (5.15)
donde α1 , λ2 y −λ3 son constantes positivas y en consecuencia, V̇ resulta definida
negativa, lo cual asegura la estabilidad asintótica del sistema. El análisis de estabi-
lidad de Lyapunov realizado en [19] también demuestra que la siguiente entrada de
control es capaz de estabilizar al sistema :
u = M(q)q̈ + P(q, q) ḃ − q̇r ) − K1 z1
ḃ q̇r + d(q) − Kd (q (5.16)
ḃ toma la forma:
donde el observador de la velocidad angular q
ḃ = q̇d + Ld (q − q
q b) (5.17)
Las ganancias de control Kd , K1 y Ld son matrices diagonales definidas positivas
con Kd = kd I, K1 = k1 I y Ld = `d I, donde kd , k1 y `d son constantes positivas.

5.4. Procedimiento de Diseño Backstepping


El procedimiento de diseño de un sistema de control backstepping, como el de-
sarrollado en la sección 5.3, comprende los pasos siguientes:
(1) Formular el problema: describir el sistema a controlar, definir las especifica-
ciones de diseño determinar el modelo no lineal del sistema en la forma dada
en (5.4).
(2) Determinar la ley de control backstepping dada en (5.16). Para ello se requiere
definir el vector de referencias deseadas qd . Luego, formular el vector de error
e y el vector q̇r :
e = z1 = q − q d q̇r = q̇d − Kz1
En la última relación, K = kI es una matriz diagonal donde k es una constante
positiva e I es la matriz identidad. El observador se expresa como:
ḃ = q̇d + Ld (q − q
q b)
En esta expresión, Ld = `I es una matriz diagonal donde ` es una constante
b se puede calcular integrando q.
positiva. El vector q ḃ Con los datos anteriores
se puede formular la ley de control backstepping:
ḃ q̇r + d(q) − Kd (q
u = M(q)q̈ + P(q, q) ḃ − q̇r ) − K1 z1
En dicha ley de control, Kd = kd I y K1 = k1 I son matrices diagonales donde
kd y k1 son constantes positivas.
5.5 Aplicaciones en Tiempo Real 73

(3) Simular el sistema de control backstepping empleando los parámetros de sin-


tonización kd , k1 y `d .
(4) Implementar el sistema de control backstepping (hardware).
(5) Desarrollar el software de control en tiempo real del sistema.
(6) Ejecutar pruebas de funcionamiento en tiempo real.

5.5. Aplicaciones en Tiempo Real


5.5.1. Control Backstepping del Manipulador Esférico MRE
El modelo dinámico de Lagrange del MRE se describe en la subsección 1.2.2, ecuación
(1.121). Las señales de referencias deseadas qd para propósitos de simulación se for-
mulan para el caso de seguimiento como:

qd1 = A sin W k + Bk
qd2 = A cos W k + Bk

donde A, W y B son constantes, k = t/T es el tiempo discreto y T es el tiempo de


muestreo. Para el caso de regulación, qd es del tipo escalón. La ley de control dada
en (5.16) toma la forma:

ḃ q̇r + d(q) − Kd (q
u = M(q)q̈ + P(q, q) ḃ − q̇r ) − K1 z1

donde:
"  #
Ra
J1 + Jeq + 14 m2 L22 sin2 q2 0
M(q) = nKm KA 
0 Ra
nKm KA J2 + Jeq + 14 m2 L22 )
   
Ra n 2 Km Kb Ra m2 L22 qḃ1 sin q2 cos q2
nKm KA Beq + Ra 2nKm KA
ḃ = 
P(q, q) Ra m2 L22 qḃ1 sin q2 cos q2
  
Ra n 2 Km Kb
4nKm KA nKm KA Beq + Ra
 
0
d(q) = Ra m2 L2 g sin q2
2nKm KA

Las Figs. 5.2 y 5.3 muestran los resultados de las simulaciones del sistema de
control backstepping diseñado para controlar la posición angular de los dos brazos
del MRE para los casos de seguimiento y regulación respectivamente. Tales Figs. se
obtienen ejecutando los programa bscmres.m (caso seguimiento) y bscmrer.m (caso
regulación) para un tiempo de muestreo de T = 0.01 s. Notar que en ambos casos las
especificaciones de diseño: porcentaje de sobrenivel nulo, error en estado estacionario
nulo y tiempo de estabilización menor de 1 s se cumplen satisfactoriamente. Los
parámetros de sintonización se seleccionaron: k = 5, k1 = 8, ld = 10 y kd = 8, para
ambos casos: regulación y seguimiento. El modelo dinámico del MRE para propósitos
de simulación toma la forma:

q̈ = M−1 [u − Pq̇ − d]
74 Control Backstepping

POSICIÓN q1 [rad]
2

−2
0 2 4 6 8 10 12 14 16 18 20
CONTROL u1 [v]

−2
0 2 4 6 8 10 12 14 16 18 20
TIEMPO [S]
POSICIÓN q2 [rad]

−2
0 2 4 6 8 10 12 14 16 18 20
CONTROL u2 [v]

50

−50
0 2 4 6 8 10 12 14 16 18 20
TIEMPO [S]

Fig. 5.2: Control backstepping de la posición angular de los brazos del MRE. Caso
seguimiento.

El resultado experimental para el caso regulación se muestra en la Fig. 5.4, el cual


se obtiene ejecutando el archivo LabVIEW [1] bscmrer.vi. Este último archivo emplea
dos archivos para implementar las señales de referencia tipo escalón: setpoint reg.vi
y setpoint reg2.vi tanto para la base como para el brazo del MRE respectivamen-
te. Los gráficos de la Fig. 5.4 se obtienen ejecutando el archivo bscmrertr.m, el
cual emplea los mismos parámetros de sintonización usados en la simulación (archi-
vo bscmrer.m) además de los archivos de datos experimentales SETPOINT BASE,
SETPOINT BRAZO, U1 y U2. Las especificaciones de diseño preestablecidas en la
simulación también se cumplen para el caso experimental y para el mismo tiempo de
muestreo: T = 0.01 s. ♣
5.5 Aplicaciones en Tiempo Real 75

POSICIÓN q1 [rad]
1

0.5

0
0 5 10 15 20 25 30 35 40
CONTROL u1 [v]

50

−50
0 5 10 15 20 25 30 35 40
TIEMPO [S]
POSICIÓN q2 [rad]

0.5

0
0 5 10 15 20 25 30 35 40
CONTROL u2 [v]

50

−50
0 5 10 15 20 25 30 35 40
TIEMPO [S]

Fig. 5.3: Control backstepping de la posición angular de los brazos del MRE. Caso
regulación.
Posición x1 [grad]

100

−100
0 2 4 6 8 10 12 14 16 18 20
TIEMPO [s]
CONTROL u1 [V]

10

−10
0 2 4 6 8 10 12 14 16 18 20
TIEMPO [s]
Posición x2 [grad]

100

50

0
0 2 4 6 8 10 12 14 16 18 20
TIEMPO [s]
CONTROL u2 [V]

10

−10
0 2 4 6 8 10 12 14 16 18 20
TIEMPO [s]

Fig. 5.4: Respuesta experimental del sistema de control backstepping del MRE.
Apéndice A

El Método Directo de Lyapunov

A.1. Estabilidad vı́a el Método Directo de Lyapunov


A. M. Lyapunov trata el problema de la estabilidad de sistemas descritos median-
te ecuaciones diferenciales empleando dos métodos. El denominado primer método
analiza el comportamiento de la estabilidad de una solución explı́cita del modelo no
lineal del sistema y se aplica solamente a ciertos casos. El segundo método, o método
directo de Lyapunov, es de gran generalidad y potencia porque no requiere de la
solución de la descripción del sistema, como sı́ lo requiere el primer método.

A.1.1. Conceptos de Estabilidad


Un sistema no lineal de la forma:

ẋ = f (x, t) (A.1)

se dice que es no autónomo si f depende del tiempo, por ejemplo, si f posee parámetros
variantes con el tiempo. Por consiguiente, un sistema autónomo puede ser descrito
por: ẋ = f (x). Las trayectorias de estado para procesos autónomos son independientes
del tiempo inicial, mientras que para los no autónomos generalmente no lo son.
Un estado o punto de equilibrio xe (realmente un vector constante) de un sistema
autónomo se puede determinar de:

0 = f (xe ) (A.2)

Nosotros vamos a tratar la estabilidad en el origen del sistema autónomo básico:

ẋ = f (x) x(0) = 0 (A.3)

Entonces debemos de hacer ciertas suposiciones con relación a la figura A.1. De-
notemos como B(R) a la región esférica (balón) ||x|| < R y como S(R) a la esfera
||x|| = R en sı́. La región esférica anular cerrada r ≤ ||x|| ≤ R será descrita como B rR .
Asumiremos que en una cierta región esférica Ω : ||x|| < B(R), todas las derivadas
parciales ∂xi /∂xj existen y son continuas en Ω. Entonces diremos que el origen es:

estable si alguna trayectoria que empieza en B(r) en un punto arbitrario x o


nunca logra alcanzar la esfera frontera S(R) de B(R);
78 El Método Directo de Lyapunov

asintóticamente estable cuando es estable y en adición cada trayectoria de es-


tado que empieza en B(R) en un punto arbitrario xo , tiende hacia el origen
conforme el tiempo se incremente indefinidamente;

inestable cuando para algún R y r, ya sea grande o pequeño, alguna trayectoria


de estado que empieza en B(R) en un punto arbitrario x0 logra alcanzar la
esfera frontera S(R). Observar en la figura A.1 que para la trayectoria T el
origen es inestable en el sentido de Lyapunov, a pesar de que tal trayectoria de
estado muestre convergencia.

Asintóticamente
estable

Estable

B(r) S(R)
0 r
x0 R
Inestable

H(A)
B(R) T
S(A)

Fig. A.1: Estabilidad en sistemas autónomos.

A.1.2. Funciones de Lyapunov


Un tipo especial de función escalar V (x), la denominada función de Lyapunov
juega un importante rol en el análisis de la estabilidad y el diseño de sistemas de con-
trol. Una función de Lyapunov V (x) para sistemas autónomos verifica las siguientes
propiedades:

(a) V (x) y sus primeras derivadas parciales

∂V (x)
= ∇ V (x)
∂x
son continuas en una cierta región abierta Ω alrededor del origen.

(b) V (0) = 0

(c) Fuera del origen, pero siempre en Ω, V (x) es positiva. Por consiguiente, el origen
es un mı́nimo aislado de V (x).
A.1 Estabilidad vı́a el Método Directo de Lyapunov 79

(d) V̇ (x) = ∇ V (x) ẋ = ∇ V (x) f (x) ≤ 0 en Ω.


V (x) es una función definida positiva si satisface las propiedades (a)–(c). La figura
A.2 ilustra una función de Lyapunov para un sistema de segundo orden. Notar que
V (x1 , x2 ) tiene el aspecto general de un espejo parabólico apuntando hacia arriba. Si
V fuera definida negativa, el espejo parabólico deberı́a de apuntar hacia abajo. Por
consiguiente, V (x) es definida negativa si −V (x) es definida positiva. También, V (x)
es semidefinida positiva si V (0) = 0 y V (x) ≥ 0 para x 6= 0; V (x) es semidefinida
negativa si −V (x) es semidefinida positiva.
Para una matriz cuadrada V de orden n × n, las expresiones V > 0, V ≥ 0,
V < 0 y V ≤ 0 denotan que V es definida positiva, semidefinida positiva, definida
negativa y semidefinida negativa respectivamente, siempre y cuando V esté asociada
a su forma cuadrática.
V es definida positiva (V > 0), es decir, xT Vx > 0, si la función cuadrática
T
x Vx es definida positiva para x 6= 0. También, V es definida positiva si todos sus
eigenvalores o sus menores principales son mayores que cero.
En general, los menores principales mi de V = [vij ] (de orden n × n) son:
 
  v11 v12 v13
v11 v12
m0 = 1; m1 = v11 ; m2 = det ; m3 = det  v21 v22 v23  ;
v21 v22
v31 v32 v33

y ası́ sucesivamente hasta llegar a mn = det(V).


V es semidefinida positiva (V ≥ 0), es decir, xT Vx ≥ 0, si la función cuadrática
T
x Vx es semidefinida positiva para x 6= 0. También, V ≥ 0 si V es singular de rango
r < n, y r eigenvalores o r menores principales de V son positivos y el resto (n − r)
son nulos.
V definida negativa (V < 0), es decir, xT Vx < 0, si la función cuadrática xT Vx
es definida negativa para x 6= 0. También, V < 0 si V es no singular y todos los
eigenvalores o los menores principales de V son negativos.
V semidefinida negativa (V ≤ 0), es decir, xT Vx ≤ 0, si la función cuadrática
T
x Vx ≤ 0 para x 6= 0. V ≤ 0 si V es singular de rango r < n, y r eigenvalores o r
menores principales de V son negativos y el resto (n − r) son nulos.
Si la matriz cuadrada V de orden n × n posee eigenvalores positivos y negativos,
entonces V es indefinida.

V(x1 , x 2) x2

V(x1 , x 2)

x2 x1

x1

Fig. A.2: Representación gráfica de una función de Lyapunov.


80 El Método Directo de Lyapunov

Ejemplo A.1

La función V (x) = (x1 + x2 )2 con x = [x1 x2 ]T es semidefinida positiva desde


que V (0) = 0 y V (x) ≥ 0 para x 6= 0 (por ejemplo, para x1 = −x2 , V (x) = 0),
mientras que la función V (x) = −x21 + x22 no es definida positiva ni negativa porque
V (x) > 0 para x1 = 0 y V (x) < 0 para x2 = 0. Es fácil de demostrar que la función
V (x) = x21 + x22 es definida positiva.

Ejemplo A.2

El circuito mostrado en la figura A.3 contiene un resistor no lineal RN que obedece


la ley i = N e3 , N > 0. Determine si la energı́a almacenada en el capacitor C es una
función de Lyapunov.

R i
+
+
u C e RN
- -

Fig. A.3: Circuito no lineal.

Solución: Sumando las corrientes que salen del nodo superior derecho (ver la figura
A.3) produce:
e−u
C ė + + N e3 = 0
R
La energı́a almacenada en el capacitor está dada por V (e) = 21 Ce2 . Para el sistema
no actuado (u = 0) tenemos:
 
2 1 2
V̇ (e) = Ceė = −e + Ne ≤ 0
R

Por consiguiente, la función V (e) es una función de Lyapunov.

Ejemplo A.3

La figura A.4 muestra un sistema masa–amortiguador–resorte no lineal cuyo modelo


dinámico es:
M ẍ + Bo ẋ + B1 ẋ|ẋ| + K0 x + K1 x3 = 0
donde (B0 ẋ+B1 ẋ|ẋ|) caracteriza un amortiguador no lineal con coeficientes de amor-
tiguación B0 , B1 > 0 constantes, y donde (K0 x + K1 x3 ) representa un resorte no
lineal con coeficientes de resorte K0 , K1 > 0 constantes. Demostrar que la energı́a
total almacenada en el sistema es una función de Lyapunov.
Solución: La energı́a del sistema es:
Z x
1 2 1 1 1
V (x) = M ẋ + (K0 x + K1 x3 )dx = M ẋ2 + K0 x2 + K1 x4
2 0 2 2 4
A.1 Estabilidad vı́a el Método Directo de Lyapunov 81

K0 B
K1 b(t)
lm
n lm
n lm
n lm
n lm
n lm
n lm
n lm
n lm
n lm
n lm
n lm
n ln
Fig. A.4: Sistema masa–amortiguador–resorte.

Se puede demostrar fácilmente que:

V̇ (x) = M ẋẍ + (K0 x + K1 x3 )ẋ = [−B0 ẋ − B1 ẋ|ẋ|]ẋ = −B0 ẋ2 − B1 |ẋ|3 ≤ 0

Por consiguiente, V (x) es una función de Lyapunov.

Función de Lyapunov para Sistemas No Autónomos


El sistema no autónomo en consideración se describe en la región Ω: ||x|| < A
mediante:
ẋ = f (x, t) f (0, t) = 0 t≤0 (A.4)
Siempre que W (x) es una función de Lyapunov en Ω, entonces V (x, t) es una
función de Lyapunov si:
(a) V (x, t) está definida en Ω para algún t ≥ 0;
(b) V (0, t) = 0 para algún t ≥ 0;
(c) V (x, t) ≥ W (x) para algún t ≤ t0 ;
(d) V̇ (x, t) ≤ 0 para algún t ≥ 0, donde:
dV ∂V ∂V ∂V ∂V
V̇ = = + ẋ = + f (x, t)
dt ∂t ∂x ∂t ∂x
Se dice que una función V (x, t) es definida positiva si satisface las condiciones (a)–
(c). También se dice que V (x, t) es una función definida positiva si esta función domina
a otra función definida positiva W (x), por ejemplo, cuando V (x, t) ≥ W (x). También,
V (x, t) es definida negativa si −V (x, t) es definida positiva; V (x, t) es semidefinida
positiva si esta función domina a otra función semidefinida positiva W (x); V (x, t) es
semidefinida negativa si −V (x, t) es semidefinida positiva.

Ejemplo A.4

Desprecie el término no lineal ẋ|ẋ| del amortiguador descrito en el ejemplo A.3 y


considere un coeficiente de amortiguación b(t) variante con el tiempo en lugar de
B0 , de modo tal que el sistema se convierta en uno no autónomo. Demostrar que la
siguiente función V (x, t) es una función de Lyapunov.
 
M 2 1 1 2
V (x, t) = (ẋ + αx) + K0 + K1 − M α + α b(t) x2
2
2 2 2
82 El Método Directo de Lyapunov

Solución: El cómputo de V̇ (x, t) produce:


1
V̇ (x, t) = (M α − b(t))ẋ2 + α(ḃ(t) − 2k0 ) − αK1 x4 < 0
2
siempre que α > 0, b(t) > M α y ḃ(t) < 2K0 . De acuerdo al ejemplo A.3, la energı́a
del sistema es una función de Lyapunov, a saber:
1 1 1
W (x) = M ẋ2 + K0 x2 + K1 x4
2 2 4
Podemos observar que V (x, t) > W (x). Por consiguiente, V (x, t) es una función de
Lyapunov.

A.1.3. Teoremas de Estabilidad de Lyapunov


Los teoremas de estabilidad de Lyapunov generalizan la idea de que cerca al estado
de equilibrio de un sistema f1sico, la energı́a del sistema es siempre decreciente.

Teoremas de Estabilidad para Sistemas Autónomos


I. Teorema de Estabilidad. El equilibrio en el origen es estable si allı́ existe
en alguna vecindad Ω del origen, una función de Lyapunov V (x).

II. Teorema de Estabilidad Asintótica. El equilibrio en el origen es asintótica-


mente estable si −V̇ es definida positiva (esto es: −V̇ > 0) en Ω.

III. Teorema de Estabilidad Completa (Global). Considere una función


escalar V (x) con primeras derivadas parciales continuas para todo x 6= 0 tal que
V (x) > 0, V̇ (x) < 0, y V (x) → ∞ cuando ||x|| → ∞. entonces el sistema autónomo
(A.4) es completamente (globalmente) asintóticamente estable.

IV. Teorema de Inestabilidad of Cĕteav. Sea Ω una vecindad en el origen.


Sea Ω` una región en Ω. Dada una función V (x) en Ω, entonces el equilibrio en el
origen es inestable si:
(a) V (x) posee derivadas parciales continuas en Ω` .
(b) V (x) y V̇ (x) son definidas positivas en Ω` .
(c) V (x) = 0 en los puntos de frontera de Ω` dentro de Ω.
(d) El origen es un punto de frontera de Ω` . La figura A.5 ilustra el teorema de
inestabilidad de Cĕteav.
El teorema de inestabilidad de Cĕteav se convierte en el denominado primer teorema
de inestabilidad si Ω = Ω1` , cuando Ω es una cierta vecindad del origen. Si, en adición
a la condición Ω = Ω` , la condición V̇ > 0 es reemplazada por:
V̇ (x) − λV (x) ≥ 0 ∀t≥0 ∀x  Ω
donde λ es una constante positiva, de este modo el teorema de inestabilidad de Cĕteav
se convierta en el denominado segundo teorema de inestabilidad. Las demostraciones
de los teoremas descritos anteriormente se realizan básicamente en forma geométrica
en [22], [14].
A.1 Estabilidad vı́a el Método Directo de Lyapunov 83

V=0
. . 0

x0
V = constant
Ω1

Fig. A.5: Representación gráfica del teorema de estabilidad de Cĕteav.

Teoremas de Estabilidad de Lyapunov para Sistemas no Autónomos


V. teorema de Estabilidad. El equilibrio en el origen es estable, si allı́ existe
en alguna vecindad Ω del origen, una función de Lyapunov V (x, t).

VI. Teorema de Estabilidad Asintótica Uniforme. El equilibrio en el origen


es uniforme asintóticamente estable si la función definida positiva V (x, t) es decre-
ciente (lo que significa que V está dominado por una función definida positiva W (x)
para algún t ≥ 0) y −V̇ (x, t) es definida positiva(es decir, −V̇ > 0) en Ω.

VII. Teorema de Inestabilidad. Sea Ω una vecindad del origen. Sea Ω` una
región en Ω. Dada una función V (x, t) en Ω, entonces el equilibrio del origen en el
tiempo t0 es inestable si:

(a) V (x, t) posee derivadas parciales continuas en Ω` .

(b) V (x, t) y V̇ (x, t) son definidas positivas en Ω1 .

(c) V (x, t) = 0 para algún t ≥ t0 en los puntos de frontera de Ω` dentro de Ω.

(d) El origen es un punto de frontera de Ω` dentro de Ω.

En forma similar, el teorema de inestabilidad anterior se convierte en el denomi-


nado primer teorema de inestabilidad si Ω = Ω` , donde Ω es una cierta vecindad del
origen. Si en adición a la condición Ω = Ω` , la condición V̇ > 0 es reemplazada por

V̇ (x, t) − λV (x, t) ≥ 0 ∀ t ≥ t0 ∀xΩ

donde λ es una constante positiva, entonces el teorema de inestabilidad se convierte


en el denominado segundo teorema de inestabilidad. Las demostraciones de estos
teoremas se pueden encontrar en [14].

Ejemplo A.5

Determine la estabilidad del sistema autónomo descrito en los ejemplos A.2 y A.3
aplicando el método directo de Lyapunov.
84 El Método Directo de Lyapunov

Solución: Del ejemplo A.2 podemos establecer que la función de Lyapunov V (e) =
1 2
2 Ce → ∞ cuando ||e|| → ∞. Por consiguiente, el sistema autónomo no lineal
descrito en dicho ejemplo es completa (global) asintóticamente estable.
Del ejemplo A.3 podemos establecer que la función de Lyapunov:
1 1 1
V (x) = M ẋ2 + K0 x2 + K1 x4 → ∞
2 2 4
cuando ||x|| → ∞. Por consiguiente, el sistema autónomo no lineal descrito en dicho
ejemplo es completa (global) asintóticamente estable.

Ejemplo A.6

Determine la estabilidad el sistema no autónomo descrito en el ejemplo A.4 aplicando


el método directo de Lyapunov.

Solución: Del ejemplo A.4 se puede establecer que la función de Lyapunov:


 
M 2 1 1 2
V (x, t) = (ẋ + αx) + K0 + K1 − M α + α b(t) x2 → ∞
2
2 2 2

conforme ||x|| → ∞, siempre que α > 0, b(t) > M α, y ḃ(t) < 2K0 . Por consiguiente,
el sistema no autónomo descrito en tal ejemplo es completa (global) asintóticamente
estable.

A.1.4. Teoremas del Conjunto Invariante


En aplicaciones relacionadas con sistemas de control, estabilidad asintótica es más
importante que estabilidad. Claramente, pequeñas desviaciones de las salidas contro-
ladas con respecto a señales de referencia deseadas se pueden cancelar como resultado
de la operación de un sistema asintóticamente estable. Sin embargo, la aplicación del
segundo teorema de estabilidad nos conduce a menudo a la relación − V̇ ≥ 0 en lugar
de la requerida condición −V̇ > 0 para estabilidad asintótica. Para tales casos, puede
ser de gran utilidad emplear el denominado teorema del conjunto invariante atribuido
a La Salle [22] con la finalidad de obtener más conclusiones acerca de la estabilidad
asintótica.

Conjunto Invariante. Se dice que un conjunto G es el conjunto invariante de un


sistema dinámico ẋ = f (x) si cada trayectoria de estado x(t) que comienza desde un
punto x0 en G permanece en G para todo tiempo. por consiguiente, una trayectoria
de estado cerrada en G es un conjunto invariante. De acuerdo a tal definición, algún
punto de equilibrio es un conjunto invariante. El dominio de atracción del punto de
equilibrio es también un conjunto invariante.

VIII. Teorema del Conjunto Invariante Local. Considere el sistema dado en


(A.3). Sea V (x) una función escalar con primeras derivadas parciales continuas. Sea
Ω` una región acotada definida por V (x) < `, con ` > 0. Asumamos que:

V̇ (x) ≤ 0 (A.5)
A.1 Estabilidad vı́a el Método Directo de Lyapunov 85

para todo x en Ω` . Sea R el conjunto de todos los puntos dentro de Ω` donde V̇ (x) = 0,
y sea M el más grande conjunto invariante en R. Entonces, cada solución x(t) en Ω `
tiende a M conforme t → ∞.

Que M sea el conjunto invariante más grande en R significa que M es la unión


de todos conjuntos invariantes dentro de R. La interpretación geométrica de este
teorema se ilustra en la figura A.6.
V
V=l

Ωl

x2

x0
x1

Fig. A.6: Interpretación geométrica del teorema del conjunto invariante.

Si la condición (A.5) se sustituye por


V̇ (x) < 0 for all x 6= 0 in Ω` (A.6)
y el origen está en Ω` , entonces tal origen es asintóticamente estable, y cada solución
en Ω` tiende hacia el origen conforme t → ∞.

IX. Teorema del Conjunto Invariante Global. Considere el sistema dado


en (A.3) Sea V (x) una función escalar con primeras derivadas parciales continuas.
Suponga que V (x) > 0 para todo x 6= 0 y V̇ (x) ≤ 0. Sea R el conjunto de todos los
puntos donde V̇ (x) = 0, y M el conjunto invariante más grande en R. Entonces todas
las soluciones convergen completa (global) asintóticamente en M conforme t → ∞.
En vista de los teoremas del conjunto invariante, una función de Lyapunov V tiene
que desaparecer gradualmente. Esto es, V̇ tiene que converger a cero debido a que
V es acotado inferiormente. Demostración de los teoremas del conjunto invariante se
pueden encontrar en [22], [14].

Ejemplo A.7

Considere el sistema dinámico:


ẋ1 = x1 (x21 + x22 − 4) − 4x1 x22
86 El Método Directo de Lyapunov

ẋ2 = 4x21 x2 + x2 (x21 + x22 − 4)

para el punto de equilibrio x = 0 considere la función:

V (x) = x21 + x22

A lo largo de una trayectoria de estado, su derivada V̇ es:

V̇ (x) = 2(x21 + x22 )(x21 + x22 − 4)

Observe que V̇ (x) < 0 dentro de un cı́rculo de radio 2. Por consiguiente, usando el
teorema de estabilidad II de Lyapunov, podemos inferir que el origen es asintótica-
mente estable. Para ` = 4, la región Ω` definida por V (x) = x21 +x22 < 4 es acotada y el
conjunto R es el origen, el cual es un conjunto invariante. Por consiguiente, cualquier
trayectoria que se inicia dentro del cı́rculo de radio 2 converge hacia el origen y esta
región constituye el dominio de atracción.
Bibliografı́a

[1] National Instruments, LabVIEW 2010, Development System: Professional.

[2] The MathWorks, Inc., MATLABr 7 Getting Started Guide, 1984–2010.

[3] Murray R. Spiegel, Mathematical handbook, Shaum’s Outline Series, McGraw-


Hill,Inc., 3ed Edition, New York et. al. 2008.

[4] W. F. Hughes and J. A. Brighton, Theory and Problems of Fluid Dynamics,


Shaum’s outline series, McGraw-Hill, 3ed edition, Inc., 1999.

[5] H. Goldstain, John L. Safko and Charles P. Poole Classical mechanics, 3ed.
Addison Wesley, 2001.

[6] James Curry, Hamiltonian and Lagrangian Mechanics. AuthorHouse, 2005.


ISBN-10: 1420858564. ISBN-13: 978-1420858563.

[7] Eduardo F. Camacho y Carlos Bordons, Model Predictive Control, Springer-


Verlag London Limited, 2004.

[8] Alberto Isidori, Nonlinear Control Systems, 3ed, Springer-Verlag Berlin, 1995.

[9] A. Barrientos, L. F. Peñin, C. Balaguer, and R. Aracil, Fundamentos de Robótica,


2nd Edition, McGraw-Hill/Interamericana de España, S. A., Madrid, Buenos
aires, Caracas, and others, 2007.

[10] S. Kilicaslan, S.P. BanksLocalización, “A separation theorem for nonlinear sys-


tems”, A journal of IFAC, ISSN 0005-1098, Vol. 45, No . 4, pags. 928-935, 2009.

[11] M. G. Sofonov, Stability and Robustness of Multivariable Feedback Systems, The


MIT Press Cambridge, MA, and London, England, 1980.

[12] Jeffrey B. Burl , Linear Optimal Control, Prentice Hall, 1998.

[13] D. E. Koditschek, “Natural Motion for Robot Arms´´Proc. 23rd I.E.E.E. Conf.
on Decision and Control, Las Vegas, p. 733, 1984.

[14] Jean-Jacques E. Slotine and Weiping Li, Applied Nonlinear Control, Prentice
Hall, 2006, ISBN: 0130408905, ISBN-13: 9780130408907, 978-0130408907.

[15] Asif Sabanovic, Variable Structure Systems: From Principles to Implementation,


The Institution of Engineering and Technology; illustrated edition, 2004.
88 BIBLIOGRAFÍA

[16] E. Bailey and A. Arapostathis, “Simple sliding mode control scheme applied to
robot manipulators,” Int. J. Control, vol. 45, No. 4, p. 1197–1209, 1987.

[17] Lin, Y. and E.D. Sontag, Lin, Y. and E.D. Sontag, “A universal formula for
stabilization with bounded controls”, Report 90-10, SYCON-Rutgers Center for
Systems and Control, July 1990.

[18] Jie Yu, Ali Jadbabaie, James Primbs and Yun Huang, “Comparison of nonlinear
control design techniques on a model of the Caltech ducted fan”, Automatica
Volume 37, Issue 12, Pages 1971-1978 , December 2001.

[19] Fang-Shiung Chen and Jung-Shan Lin, “Nonlinear backstepping design of robot
manipulators with velocity estimation feedback,”5th Asian Control Conference,
July 2004, vol. 1, no. 6, pp 351–356. New Jersey 07632, 1989.

[20] M. Vidyasagar, Nonlinear Systems Analysis (Second Edition), Society for Indus-
trial and Applied Mathematics Philadelphia, PA, USA , 2001, ISBN:0898715261.

[21] Katsuhiko Ogata, Modern Control Engineering (5th Edition), Prentice Hall,
2009.

[22] Joseph La Salle and Solomon Lefschetz, Stability by Liapunov’s Direct Method
With Applications, Academic Press new York, London, 1961.

You might also like