You are on page 1of 381

Indice general

1 Introduccion al problema del control realimentado 1


1.1 Introduccion : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 1
1.2 Los bene cios de la realimentacion : : : : : : : : : : : : : : : : : : : 2
1.3 Sensibilidad en bucle abierto y en bucle cerrado. : : : : : : : : : : : : 3
1.4 Analisis y dise~no en presencia de incertidumbres : : : : : : : : : : : : 5
1.5 Posibles planteamientos : : : : : : : : : : : : : : : : : : : : : : : : : 6
1.6 Sistemas de tiempo continuo y de tiempo discreto : : : : : : : : : : : 7

2 Control adaptativo 9
2.1 Introduccion : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 9
2.2 Controladores adaptativos con modelo de referencia (MRAC) : : : : : 13
2.3 Reguladores autoajustables (STR) : : : : : : : : : : : : : : : : : : : : 16
2.4 Ejemplo simple : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 17
2.5 >Porque control adaptativo? : : : : : : : : : : : : : : : : : : : : : : : 19
2.6 El problema del control adaptativo : : : : : : : : : : : : : : : : : : : 23
i
ii Indice general

3 Algoritmo de identi cacion de parametros 27


3.1 Introduccion : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 27
3.2 Modelo del sistema y de las perturbaciones : : : : : : : : : : : : : : : 28
3.3 Metodo de mnimos cuadrados : : : : : : : : : : : : : : : : : : : : : : 29
3.3.1 Caso determinista : : : : : : : : : : : : : : : : : : : : : : : : : 30
3.3.2 Caso no determinista : : : : : : : : : : : : : : : : : : : : : : : 30
3.3.3 Metodo recursivo : : : : : : : : : : : : : : : : : : : : : : : : : 32
3.4 Metodo de mnimos cuadrados extendidos y generalizados : : : : : : : 33
3.5 Aproximacion estocastica : : : : : : : : : : : : : : : : : : : : : : : : : 33
3.6 Metodo de variable instrumental : : : : : : : : : : : : : : : : : : : : : 34
3.7 Metodo de maxima verosimilitud : : : : : : : : : : : : : : : : : : : : 35
3.8 Modi caciones al algoritmo de identi cacion : : : : : : : : : : : : : : 35
3.9 Algoritmos de identi cacion rapidos : : : : : : : : : : : : : : : : : : : 38
3.10 Estimacion de los valores de continua : : : : : : : : : : : : : : : : : : 38
3.11 Algoritmo de identi cacion propuesto : : : : : : : : : : : : : : : : : : 39
3.12 Convergencia e identi cabilidad : : : : : : : : : : : : : : : : : : : : : 41
3.13 Ejemplo de identi cacion : : : : : : : : : : : : : : : : : : : : : : : : : 44

4 Control adaptativo por modelo de referencia 47


4.1 Introduccion : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 47
4.2 Dise~no de controladores adaptativos : : : : : : : : : : : : : : : : : : : 48
4.2.1 Enfoque de sensibilidad : : : : : : : : : : : : : : : : : : : : : : 49
Indice general iii

4.2.2 Metodo de Lyapunov : : : : : : : : : : : : : : : : : : : : : : : 50


4.2.3 Metodo de hiperestabilidad : : : : : : : : : : : : : : : : : : : 54
4.3 Estructura general de los sistemas adaptativos (MRAC) : : : : : : : : 55
4.4 Ejemplos ilustrativos : : : : : : : : : : : : : : : : : : : : : : : : : : : 58
4.4.1 Metodo del gradiente : : : : : : : : : : : : : : : : : : : : : : : 60
4.4.2 Metodo de Lyapunov : : : : : : : : : : : : : : : : : : : : : : : 62
4.4.3 Metodo de hiperestabilidad : : : : : : : : : : : : : : : : : : : 66

5 Reguladores autoajustables (STR) 73


5.1 Introduccion : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 73
5.2 Asignacion de polos y ceros : : : : : : : : : : : : : : : : : : : : : : : 76
5.3 Casos particulares : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 80
5.4 Prediccion optima : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 81
5.5 Regulador de mnima varianza : : : : : : : : : : : : : : : : : : : : : : 83
5.6 Control predictivo generalizado : : : : : : : : : : : : : : : : : : : : : 85
5.6.1 Formulacion del control predictivo generalizado : : : : : : : : 86
5.6.2 Consideracion de ruidos coloreados : : : : : : : : : : : : : : : 91
5.7 Controladores para plantas con parametros desconocidos : : : : : : : 92
5.8 Algoritmos con estructura explcita e implcita : : : : : : : : : : : : : 93
5.9 Propiedad de autosintona : : : : : : : : : : : : : : : : : : : : : : : : 96
5.10 Procedimiento de sntesis : : : : : : : : : : : : : : : : : : : : : : : : : 98
5.11 Ejemplos ilustrativos : : : : : : : : : : : : : : : : : : : : : : : : : : : 99
iv Indice general

5.11.1 Ejemplo de mnima varianza : : : : : : : : : : : : : : : : : : : 99


5.11.2 Control adaptativo PI : : : : : : : : : : : : : : : : : : : : : : 100
5.11.3 Control de robot movil : : : : : : : : : : : : : : : : : : : : : : 102

6 Autoajuste y ajuste por tabla de controladores 113


6.1 Introduccion : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 113
6.2 Control PID : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 115
6.3 Metodos de respuesta transitoria : : : : : : : : : : : : : : : : : : : : 116
6.3.1 Metodo de respuesta en escalon de Ziegler-Nichols : : : : : : : 117
6.3.2 Caracterizacion de la respuesta en escalon : : : : : : : : : : : 117
6.4 Metodos basados en realimentacion con rele : : : : : : : : : : : : : : 118
6.4.1 El metodo del balance armonico : : : : : : : : : : : : : : : : : 119
6.4.2 El metodo de Ziegler-Nichols en bucle cerrado : : : : : : : : : 121
6.4.3 Oscilaciones de rele : : : : : : : : : : : : : : : : : : : : : : : : 121
6.5 Ajuste por tabla : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 123
6.6 Dise~no de reguladores con ajuste por tabla : : : : : : : : : : : : : : : 124
6.6.1 Actuador no lineal : : : : : : : : : : : : : : : : : : : : : : : : 125
6.6.2 Tanque de seccion variable : : : : : : : : : : : : : : : : : : : : 126
6.6.3 Transformacion no lineal : : : : : : : : : : : : : : : : : : : : : 129

7 Aplicacion de control adaptativo 133


7.1 Introduccion : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 133
Indice general v

7.2 Descripcion de la planta : : : : : : : : : : : : : : : : : : : : : : : : : 134


7.3 Modelo dinamico del campo : : : : : : : : : : : : : : : : : : : : : : : 136
7.3.1 Modelo concentrado : : : : : : : : : : : : : : : : : : : : : : : 136
7.3.2 Modelo distribuido : : : : : : : : : : : : : : : : : : : : : : : : 137
7.4 Control en adelanto : : : : : : : : : : : : : : : : : : : : : : : : : : : : 140
7.5 Control en bucle cerrado : : : : : : : : : : : : : : : : : : : : : : : : : 140
7.5.1 Controlador PI : : : : : : : : : : : : : : : : : : : : : : : : : : 141
7.5.2 Controlador PI por asignacion de polos : : : : : : : : : : : : : 142
7.5.3 Controlador autoajustable : : : : : : : : : : : : : : : : : : : : 143
7.5.4 Controlador PID adaptativo : : : : : : : : : : : : : : : : : : : 144
7.5.5 Controlador predictivo generalizado : : : : : : : : : : : : : : : 146
7.5.6 Supervision : : : : : : : : : : : : : : : : : : : : : : : : : : : : 148
7.6 Estudios de simulacion : : : : : : : : : : : : : : : : : : : : : : : : : : 150
7.7 Resultados en planta : : : : : : : : : : : : : : : : : : : : : : : : : : : 152

8 El problema del control robusto 159


8.1 Introduccion : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 159
8.2 Relaciones fundamentales : : : : : : : : : : : : : : : : : : : : : : : : 163
8.3 Descripcion de las incertidumbres : : : : : : : : : : : : : : : : : : : : 171
8.4 Estabilidad robusta : : : : : : : : : : : : : : : : : : : : : : : : : : : : 176
8.5 Comportamiento robusto : : : : : : : : : : : : : : : : : : : : : : : : : 187
8.6 Robustez de plantas con fuerte ganancia direccional : : : : : : : : : : 190
vi Indice general

9 Metodos de dise~no LTR 197


9.1 Introduccion : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 197
9.2 Propiedades del regulador LQR : : : : : : : : : : : : : : : : : : : : : 198
9.3 El controlador LQG : : : : : : : : : : : : : : : : : : : : : : : : : : : : 204
9.4 Controlador LTR basado en observador : : : : : : : : : : : : : : : : : 207
9.4.1 Metodo LQG/LTR-i : : : : : : : : : : : : : : : : : : : : : : : 207
9.4.2 Metodo LQG/LTR-o : : : : : : : : : : : : : : : : : : : : : : : 210
9.5 Controlador LTR no basado en observador : : : : : : : : : : : : : : : 212
9.6 Controlador LTR=H1 : : : : : : : : : : : : : : : : : : : : : : : : : : 221

10 Controladores H1 227
10.1 Introduccion : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 227
10.2 Justi cacion del control H1 : : : : : : : : : : : : : : : : : : : : : : : 228
10.2.1 Interpretacion H1 del comportamiento nominal : : : : : : : : 228
10.2.2 Interpretacion H1 de la estabilidad robusta : : : : : : : : : : 231
10.2.3 Control H1 y la teora de juegos diferencial : : : : : : : : : : 233
10.3 Planteamiento del problema general de control : : : : : : : : : : : : : 234
10.3.1 Problema de seguimiento : : : : : : : : : : : : : : : : : : : : : 237
10.3.2 Problema de estabilidad robusta : : : : : : : : : : : : : : : : : 238
10.4 Parametrizacion de los controladores : : : : : : : : : : : : : : : : : : 239
10.4.1 El problema de ajuste del modelo : : : : : : : : : : : : : : : : 242
10.4.2 Aplicabilidad del teorema de Nehari : : : : : : : : : : : : : : : 244
Indice general vii

10.5 Soluciones al problema de ajuste del modelo : : : : : : : : : : : : : : 246


10.5.1 El problema escalar : : : : : : : : : : : : : : : : : : : : : : : : 246
10.5.2 Optimizacion del comportamiento nominal : : : : : : : : : : : 248
10.6 Problemas de control H2; H1 en el espacio de estados : : : : : : : : : 253
10.6.1 Controlador optimo H2 : : : : : : : : : : : : : : : : : : : : : : 255
10.6.2 Relacion entre LQG/LTR y H2 : : : : : : : : : : : : : : : : : 257
10.6.3 Controlador H1 : : : : : : : : : : : : : : : : : : : : : : : : : : 259
10.6.4 Algoritmo de calculo del regulador H1 : : : : : : : : : : : : : 262
10.6.5 Ejemplos ilustrativos : : : : : : : : : : : : : : : : : : : : : : : 264

11 Aplicacion de control robusto 277


11.1 Introduccion : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 277
11.2 Descripcion de la planta : : : : : : : : : : : : : : : : : : : : : : : : : 280
11.3 Evaluacion de los controladores : : : : : : : : : : : : : : : : : : : : : 291
11.4 Dise~no de controladores LTR multivariables : : : : : : : : : : : : : : 292
11.4.1 Dise~no LTR-o : : : : : : : : : : : : : : : : : : : : : : : : : : : 293
11.4.2 Dise~no LTR-i : : : : : : : : : : : : : : : : : : : : : : : : : : : 297
11.5 Dise~no de controladores H2 y H1 multivariables : : : : : : : : : : : : 304
11.5.1 Controladores H1 para sistema de orden elevado : : : : : : : 306
11.5.2 Regulador H1 para una planta no lineal : : : : : : : : : : : : 313
11.6 Sntesis de los resultados obtenidos : : : : : : : : : : : : : : : : : : : 318
viii Indice general

A Analisis de los sistemas de control basados en observador 321


A.1 Analisis de robustez con y sin observador : : : : : : : : : : : : : : : : 321
A.2 Condicion su ciente para la recuperacion : : : : : : : : : : : : : : : : 323
A.3 Planteamiento del Metodo LQG en el Dominio de la Frecuencia : : : 325
A.4 Regulador LQG obtenido mediante ecuacion diofantica : : : : : : : : 329

B Elementos matematicos utiles en la teora de control 331


B.1 Polos y ceros de un sistema multivariable : : : : : : : : : : : : : : : : 331
B.2 Normas : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 333
B.3 Los Valores Singulares : : : : : : : : : : : : : : : : : : : : : : : : : : 334
B.4 Los Valores Propios : : : : : : : : : : : : : : : : : : : : : : : : : : : : 337
B.5 La Matriz de Ganancia Relativa : : : : : : : : : : : : : : : : : : : : : 339

C De niciones y algoritmos relacionados con la teora H1 343


C.1 Algunas de niciones : : : : : : : : : : : : : : : : : : : : : : : : : : : 343
C.2 El operador de Riccati : : : : : : : : : : : : : : : : : : : : : : : : : : 345
C.3 El problema de aproximacion de Hankel : : : : : : : : : : : : : : : : 346
C.4 El algoritmo de Glover : : : : : : : : : : : : : : : : : : : : : : : : : : 348
Indice general ix
x Indice general
Prologo

Este libro pretende ser una puesta al da sobre el control de sistemas en los que no se
conoce con precision su dinamica. Para ello se aborda el problema desde dos puntos
de vista diferentes, como son las tecnicas de Control Adaptativo y las metodologas
de dise~no de Controladores Robustos.
A lo largo del libro se procede a describir ambos enfoques y se ilustran con
algunos ejemplos teoricos, as como mediante la exposicion de dos aplicaciones a
procesos reales. Los captulos 2 al 7 se dedican a las tecnicas de control adaptativo
y los captulos 8 al 11 al control robusto.
El libro esta organizado en once captulos. El primero constituye una intro-
duccion al tema, y en el se tratan cuestiones relativas al control realimentado y
a los posibles enfoques para tener en cuenta la presencia de incertidumbres en los
sistemas reales.
El captulo segundo se dedica a una descripcion de las tecnicas de dise~no de
controladores adaptativos. Los algoritmos de identi cacion de parametros se des-
criben en el captulo 3, siendo estos una parte esencial de los sistemas de control
adaptativos.
Los captulos 4 y 5 se dedican a describir en profundidad las dos tecnicas basicas
de control adaptativo, como son, los controladores adaptativos por modelo de refe-
rencia (MRAC) y los controladores adaptativos autoajustables (STR).
En el captulo 6 se describen varias tecnicas de autoajuste y ajuste por tabla de
controladores. Estas tecnicas, sin ser consideradas por muchos autores como adap-
tativas, son de gran utilidad y aplicabilidad en el control de procesos industriales.
Las tecnicas descritas en los captulos 2 al 6 son aplicadas en el captulo 7, al
control de un proceso real particularmente interesante, como es el control de un
campo de colectores solares cilndrico parabolico tipo acurex, disponible en la
planta solar de Tabernas (Almera).
En el captulo 8 se hace una introduccion al problema del control robusto,
de niendose algunos conceptos clave en el estudio de la robustez de sistemas de
control. El captulo 9 se dedica a las metodologas de dise~no ltr o metodologas
de recuperacion de la funcion de transferencia. Aunque estas tecnicas fueron desa-
rrolladas inicialmente para el controlador lqg, hoy en da han transcendido para
convertirse en tecnicas de ajuste de funciones de transferencia.
El captulo 10 se dedica a la tecnica de dise~no de controladores robustos conocida
como H1. Dado que esta metodologa esta hoy en da en permanente desarrollo,
existe una gran variedad de posibles algoritmos. En este libro se presenta el plan-
teamiento inicial para resolver el problema de control H1, as como algunas de las
metodologas basadas en la descripcion por variables de estado.
Por ultimo, el captulo 11 se dedica a la aplicacion de los desarrollos planteados
en los captulos 8, 9 y 10 al control de un barco. Para ello, se presentan distin-
tos desarrollos para control multivariable, haciendo especial enfasis en el grado de
robustez que se consigue, evaluado mediante distintos ndices de comportamiento.
El libro esta compuesto de material recogido de apuntes y notas impartidas
a alumnos de cursos de doctorado y de artculos publicados por los autores. El
material de este libro ha servido y sirve en la actualidad, como parte fundamental
de un curso de doctorado. El libro va dirigido a una gran variedad de personas, el
unico requisito es tener unos conocimientos basicos de la teora de control.
Agradecimientos
Los autores desean expresar su agradecimiento a las personas que de distintas formas
han hecho posible este libro. En primer lugar a Javier Aracil y Eduardo F. Camacho,
por sus valiosas sugerencias, estmulos y consejos.
Tambien deseamos expresar nuestro agradecimiento a todos los compa~neros de
los Departamentos de Ingeniera de Sistemas y Automatica de las Universidades
de Sevilla y Cadiz, especialmente a Manolo Berenguel y Carlos Bordons por sus
aportaciones en la elaboracion de pruebas en la Planta Solar de Almera. As mismo
a Julio Terron y Manuel Haro por su disponibilidad y cooperacion.
Parte del material incluido en el libro es el fruto del trabajo de investigacion
realizado, que ha sido nanciado por la cicyt y el ciemat. Deseamos expresar
nuestro agradecimiento a estas instituciones por su nanciacion.
Tambien deseamos expresar nuestro agradecimiento al departamento de Sistemas
de la Fabrica de Artillera y Sistemas de la empresa bazan en San Fernando (Cadiz)
y en especial a Francisco Gonzalez Mene, que nos motivo en el estudio y aplicacion
de las tecnicas de control robusto.
Por ultimo damos las gracias a nuestras familias por el apoyo, paciencia y tiempo,
durante la escritura del libro, sin lo cual, este libro no habra sido posible.

Sevilla, Diciembre de 1995 Cadiz, Diciembre de 1995


Francisco Rodrguez Rubio Manuel Jesus Lopez Sanchez
Ing. de Sistemas y Automatica Ing. de Sistemas y Automatica
Escuela Superior de Ingenieros Facultad de Ciencias Nauticas
41012 - Sevilla 11510 - Puerto Real. Cadiz
E-mail: rubio@esi.us.es E-mail: lopezsan@czv1.uca.es
Captulo 1
Introduccion al problema del
control realimentado
1.1 Introduccion

En la con guracion estandar de un sistema de control, la planta y el controlador


forman un bucle cerrado en el que cada componente ejerce una in uencia sobre
el otro. La entrada a la planta u depende a traves del controlador de la variable
controlada y, la cual a su vez depende de la entrada por la dinamica de la planta.
Este fenomeno se llama realimentacion.
La realimentacion se considera como un concepto general para controlar sistemas
tecnicos, ecologicos o sociales. Las plantas qumicas, por ejemplo, tienen cientos de
bucles para hacer que las temperaturas, presiones o ujos permanezcan en los niveles
dados a pesar de la in uencia de las se~nales externas no medibles. Controladores
multivariables mas complejos son utilizados para procesos con dos o mas se~nales
acopladas fuertemente, tales como sistemas de aire acondicionado, columnas de des-
tilacion, plantas de generacion de energa electrica, calderas de vapor o aviones.
Pretendemos ver los sistemas realimentados desde el punto de vista del control
ingenieril, el cual tiene por mision encontrar un controlador para conseguir o man-
tener la estabilidad, mejorar la robustez, atenuar las perturbaciones, asegurar la
regulacion asintotica, etc. Un sistema realimentado consta de un proceso dado con
unas propiedades jas y de un controlador que puede elegirse libremente.
1
2 Los bene cios de la realimentacion

1.2 Los bene cios de la realimentacion


Los sistemas realimentados muestran varias propiedades importantes porque el com-
portamiento del sistema global esta dado por las propiedades de la interaccion de
cada una de las partes. La realimentacion hace posible estabilizar sistemas ines-
tables, mejorar la robustez ante variaciones del comportamiento de algunas partes
del sistema, o atenuar las pertubaciones externas no medibles. Hay muchas razones
para introducir deliberadamente la realimentacion en procesos que funcionan bien.
El principal bene cio de la realimentacion no puede deducirse sin la conside-
racion de las incertidumbres en el comportamiento de la planta. Hay dos razones
por las que la salida de la planta y, para una entrada dada u, produce una trajec-
toria que no esta completamente determinada previamente. Primero, la dinamica
de la planta no se conoce completamente, por lo que el modelo de la planta solo
puede considerarse como una aproximacion mas que como una descripcion exacta.
Segundo, perturbaciones desconocidas pueden in uir en el comportamiento del sis-
tema. En este caso, la salida y no es solo la respuesta a la se~nal de control u, sino
a la perturbacion d, que es generalmente indeterminada en el sentido que puede ser
cualquier cosa dentro de un conjunto de posibles se~nales de perturbacion ( gura
1.1).

d
r - 

e-
K (s)
u-
G(s)

- ?

y
-
6

Figura 1.1: Control en bucle cerrado

Indeterminaciones de esta clase ocurren en menor o mayor medida en todos los


problemas de control, porque a causa del proceso de modelado y dise~no, el sistema
a ser controlado tiene que ser considerado fuera de su entorno. Usualmente no es
facil saber que fenomenos tienen que ser considerados como parte de la planta o
como conexiones entre la planta y su entorno y cuales no. Bajo estas circunstancias
Introduccion al problema del control realimentado 3

es importante conocer que las principales propiedades de los sistemas realimentados


dependen solo debilmente de tales indeterminaciones. Robustez frente a elementos
de dinamicas inmodeladas y perturbaciones, pueden igualmente ser considerados
como una propiedad estructural de los sistemas realimentados. Como la se~nal de
control u es calculada por el controlador dependiendo del valor actual de y, hay que
tener en cuenta el efecto de las se~nales de control anteriores y de las perturbaciones.
Esta propiedad fundamental de los sistemas realimentados se hace evidente por
la comparacion de las con guraciones de los sistemas de control en bucle abierto
y en bucle cerrado. El control en bucle abierto esta basado en la exactitud del
modelo de la planta, dado que la se~nal de control se calcula en base al modelo. Los
efectos que resultan de las dos clases de indeterminaciones aparecen enteramente
como desviaciones de la trajectoria resultante sobre la respuesta especi cada. Sin
embargo, en el control en bucle cerrado, se compara el valor actual de la salida y
con la se~nal de referencia r, y la entrada a la planta se calcula dependiendo de la
se~nal de error. Ademas de la informacion dada a priori acerca de la planta en forma
de un modelo matematico, el control realimentado usa el conocimiento acerca del
comportamiento actual de la planta y de las perturbaciones existentes, lo cual es
suministrado implcitamente por la medida del valor de y.
La introduccion de la realimentacion esta principalmente motivada por el cono-
cimiento incompleto del sistema a ser controlado y por el efecto de las perturba-
ciones externas. Mas estrictamente, el uso de la realimentacion puede verse como
no justi cable, si no hay indeterminaciones en el sistema, porque para sistemas no
perturbados, el control en bucle abierto produce la misma o probablemente mejor
respuesta.

1.3 Sensibilidad en bucle abierto y en bucle ce-


rrado.
Sea un sistema cuya funcion de transferencia en bucle abierto es G(s). Si la funcion
de transferencia en bucle cerrado es T (s) se tendra que en el dominio de frecuencias
de interes, es decir, para ! 2 [0;
], siendo
la frecuencia angular que de ne el
ancho de banda para el que se proyecta el sistema, se tendra que,

T (s) ' 1
es decir, se pretende que en el anterior dominio de frecuencias la reproduccion de
4 Sensibilidad en bucle abierto y en bucle cerrado.

las se~nales sea lo mas el posible.


Se sabe que la relacion que liga a G(s) y a T (s) es
T (s) = 1 +G(Gs()s)
Por lo tanto, puesto que T ' 1 para todas las frecuencias de interes, se tendra que
G  1 para ! 2 [0;
] (1:1)
Se de ne la sensibilidad de un sistema, dado por su funcion de transferencia T (s),
como la variacion que sufre esta funcion de transferencia como consecuencia de la
variacion de uno de los parametros p que interviene en la misma. Se denota por
SpT la sensibilidad de la funcion de transferencia T (s) con respecto a variaciones del
parametro p. Formalmente se escribe:
SpT = %%variacion de T (s)
variacion de p
lo que a su vez puede escribirse
SpT = dT=T = dT  p
dp=p dp T

Supongase, que uno de los parametros que aparecen en G(s) sufre una variacion
(por envejecimiento, efecto de perturbaciones exteriores, etc.). La sensibilidad de la
funcion de transferencia en bucle cerrado T (s) a la variacion de un parametro de
G(s) sera:
SGT = (1 +1G)2  G =
T 1+G
1

lo que habida cuenta de la expresion 1.1 conduce a SGT  1 es decir, un sistema en


bucle cerrado tiene una sensibilidad a las variaciones de los elementos que constitu-
yen la cadena en bucle abierto mucho menor que 1.
Este resultado debe compararse con la sensibilidad de un sistema en bucle abierto
G = G1G2, que puede escribirse,
SGG1 = 1
Se concluye de lo anterior que la introduccion de la realimentacion reduce no-
tablemente la sensibilidad del sistema con respecto a la variacion de los parametros.
Es este un resultado fundamental que justi ca sobradamente la introduccion de la
realimentaccion en el dise~no de sistemas de control.
Introduccion al problema del control realimentado 5

1.4 Analisis y dise~no en presencia de incertidum-


bres
La mayora de los metodos de analisis y dise~no para sistemas realimentados presupo-
nen que se dispone de un modelo su cientemente exacto del proceso a controlar o
del sistema en bucle cerrado, respectivamente. En este modelo esta jado, tanto la
estructura del modelo como los parametros. Aunque algunos de los metodos hacen
algunas consideraciones sobre el efecto de las posibles incertidumbres, el tratamiento
y atenuacion de las pertubaciones no son su principal razon de ser.
Sin embargo, un enfoque mas realista para el control por realimentacion tiene
que tener en cuenta las imprecisiones del modelo, lo cual es la principal razon para
la utilizacion de la realimentacion. Otra forma de abordar el problema es tratar con
principios y metodos que nos permitan considerar explcitamente las discrepancias
entre el modelo y el proceso real. Esto es, intentar analizar y dise~nar el controlador
sin tener un modelo matematico preciso de la planta. Intentar obtener resultados
que no solo sean validos para el modelo aproximado, sino que lo sean para un rango
de modelos de la planta dados y en consecuencia para el proceso real.
La conveniencia de investigaciones teoricas sobre el analisis y dise~no de sistemas
robustos pone de mani esto que la robustez es una cuestion fundamental en los
sistemas realimentados que ha sido explorada desde hace bastante tiempo (Dorato
1987, Grimble 1994). Conforme a la declaracion de que un ingeniero encuentra una
herramienta y una solucion para cada problema, puede ser tosco, ya que muchos
bucles de control tienen que operar sin ningun modelo matematico. Las bien cono-
cidas reglas de Ziegler y Nichols y similares, son un ejemplo obvio para un ingeniero
practico, el cual se ha basado originalmente en un modelo aproximado simple, pero
que es utilizado sucesivamente sin con rmacion del grado de aproximacion de este
tipo de modelos para el proceso bajo consideracion.
Sin embargo, sin un profundo conocimiento de los bene cios de la realimentacion,
el campo de aplicaciones de los controladores lineales invariantes en el tiempo, para el
caso de desconocimiento del proceso, variable con el tiempo o no lineal, debe quedar
mucho mas limitado. Experiencias practicas y ejemplos academicos muestran que
una mera introduccion a la realimentacion no garantiza obtener los requerimientos
de robustez e insensibilidad frente a las imprecisiones del modelo. La realimentacion
debe estar relacionada con la clase y cantidad de incertidumbre del modelo y con
las propiedades que seran preservadas.
Desde el punto de vista ingenieril, las investigaciones teoricas sobre la robustez
6 Posibles planteamientos

de los sistemas realimentados, deben estar encaminadas a,

 determinar las capacidades fundamentales de la realimentacion lineal para


controlar plantas con incertidumbres, y
 elaborar procedimientos de analisis y dise~no practicos.
La primera tarea concierne a preguntas como: > Que incertidumbre del modelo puede
ser tolerada por el controlador lineal ? > Que estructura debe tener el controlador
? > Bajo que condiciones debe ser dise~nado el controlador para que asegure la
estabilidad (integridad) en el caso de fallo del sensor o actuador ? La segunda tarea
es claro que va hacia la explotacion sistematica de la robustez.

1.5 Posibles planteamientos


Principalmente, para el dise~no de controladores a partir de modelos de la planta que
son lineales e invariantes con el tiempo, hay dos posibles enfoques para contemplar
las incertidumbres en el modelo del sistema y las perturbaciones sobre este (Grimble
1994). El primero de ellos es utilizar un controlador adaptativo, el cual estima
los parametros y calcula la se~nal de control basandose en dichos parametros. La
metodologa de los reguladores autoajustables es la adecuada en este caso, pero
conlleva el dise~no en lnea, con el esfuerzo de calculo necesario para ello, mucho
mayor que en el caso de un regulador mas simple.
El segundo enfoque es considerar las incertidumbres del sistema en el dise~no de un
controlador jo, lo cual lleva a un esquema de control robusto, que es mas insensible a
las variaciones en los parametros y a las perturbaciones. Existen distintas losofas
para hacer esto, desde el calculo de un controlador lqg con recuperacion de la
funcion de transferencia del lqr, lo cual conduce a un controlador robusto llamado
lqg/ltr, a considerar la minimizacion de una cierta norma de una funcion de
transferencia. Las normas mas empleadas son la norma H2 y la norma H1.
Tambien estan apareciendo recientemente en la literatura enfoques combinados
de los mencionados anteriormente. Por ejemplo el dise~no de sistemas de control
robustos H1 adaptativos. Aunque estos enfoques son difciles de tratar por el mo-
mento.
A lo largo de este texto nos centraremos en algunos aspectos de ambos enfoques,
tratando de ilustrar la aplicacion al control de procesos.
Introduccion al problema del control realimentado 7

1.6 Sistemas de tiempo continuo y de tiempo


discreto
Las se~nales de interes en el control de sistemas (se~nales de control, error, salida de los
actuadores, etc.), son usualmente se~nales en tiempo continuo y las especi caciones
(ancho de banda, sobreoscilacion, tiempo de subida, etc.), se formulan tambien en
tiempo continuo. Pero dado que la tecnologa digital ofrece multiples bene cios,
los sistemas de control actuales emplean tecnologa digital para la realizacion de los
controladores. Un controlador digital ejecuta basicamente tres funciones: muestrea
y cuanti ca una se~nal de tiempo continuo (tal como el error de seguimiento) para
obtener una se~nal digital; procesa esta se~nal digital utilizando un computador digital;
y posteriormente convierte la se~nal digital resultante a una se~nal de tiempo continuo.
Este proceso involucra sistemas de tiempo continuo y sistemas de tiempo discreto.
Los sistemas muestreados operan en tiempo continuo, pero algunas se~nales de
tiempo continuo son muestreadas en ciertos instantes de tiempo (normalmente de
forma periodica), produciendo se~nales de tiempo discreto. Por ello, los sistemas
muestreados son sistemas hbridos, que involucran ambos tipos de se~nales.
La sntesis de un controlador digital puede efectuarse de acuerdo con los tres
metodos alternativos siguientes:

 Discretizacion de controladores analogicos.


 Discretizacion de la planta y dise~no en tiempo discreto.
 Dise~no directo utilizando la representacion en tiempo discreto.

En el primer caso se emplean los metodos basados en la utilizacion de representa-


ciones en tiempo continuo para determinar un controlador analogico que posterior-
mente se discretiza (por ejemplo mediante la tranformacion bilineal), obteniendose
una descripcion del controlador como un sistema de tiempo discreto. La ventaja
de este metodo es que el dise~no se realiza en tiempo continuo donde las especi ca-
ciones se dan de forma natural. Este metodo es valido siempre y cuando el periodo
de muestreo sea lo su cientemente peque~no para que la actuacion del controlador
digital se aproxime a la del analogico. Esto lleva a que se necesite un hardware
mas potente y caro, por lo que hay que llegar a un compromiso entre el coste y la
precision del controlador aproximado.
8 Sistemas de tiempo continuo y de tiempo discreto

En el segundo caso se utilizan tecnicas espec cas en tiempo discreto, con-


templandose espec camente los procesos de muestreo y reconstruccion de se~nales.
En este caso se utiliza una representacion equivalente del conjunto como un sistema
de tiempo discreto. La ventaja de este metodo es su simplicidad. Por contra, el
enfoque ignora completamente que ocurre entre los instantes de muestreo, y por
otro lado las especi caciones de tiempo continuo no siempre se pueden trasladar
de forma clara a tiempo discreto. Por ultimo, si el periodo de muestreo cambia, el
controlador debe ser redise~nado.
En el tercer caso el controlador se dise~na directamente para el sistema de tiempo
discreto. La ventaja es que en este caso se resuelve el problema sin aproximaciones.
A lo largo de los proximos captulos, se describen tecnicas de dise~no de con-
troladores tanto para sistemas en tiempo continuo como para sistemas en tiempo
discreto. En algunos casos los desarrollos teoricos estan demostrados para sistemas
continuos, no existiendo hasta el momento desarrollos equivalentes para sistemas en
tiempo discreto, siendo necesario por tanto, para la realizacion digital de estos con-
troladores emplear el primer tratamiento de los tres mencionados. En otros casos el
planteamiento se realiza directamente para sistemas en tiempo discreto, por lo que
su realizacion es mas directa.
En otras ocasiones, debido a la naturaleza del proceso de identi cacion se dispone
de una descripcion en tiempo discreto y los controladores a dise~nar estan basados
en la teora de sistemas de tiempo continuo. En este caso se calcula la aproximacion
de tiempo continuo del sistema (por ejemplo mediante la tranformacion bilineal
inversa), se dise~na el controlador y posteriormente se deshace el cambio para la
realizacion del controlador en un computador digital.
Captulo 2
Control adaptativo
2.1 Introduccion
El termino adaptativo signi ca cambiar el comportamiento conforme a nuevas circun-
stancias. Un regulador adaptativo es un regulador que puede modi car su compor-
tamiento en respuesta a cambios en la dinamica del sistema y a las perturbaciones.
Este mismo objetivo es el de la inclusion de la realimentacion en el bucle de control,
por lo que surge la pregunta de cual es la diferencia entre control realimentado y
control adaptativo.
Existen muchas de niciones de control adaptativo, siendo una de las mas acep-
tadas, que control adaptativo es un tipo especial de control no lineal en el que el
estado del proceso puede ser separado en dos escalas de tiempo que evolucionan a
diferente velocidad. La escala lenta corresponde a los cambios de los parametros
y por consiguiente a la velocidad con la cual los parametros del regulador son mo-
di cados, y la escala rapida que corresponde a la dinamica del bucle ordinario de
realimentacion.
El esquema basico de control adaptativo, (Landau 1974) segun puede verse en
la gura 2.1, esta compuesto de un bucle principal de realimentacion negativa, en el
que actua al igual que en los sistemas convencionales un regulador y de otro bucle
en el que se mide un cierto ndice de funcionamiento, el cual es comparado con el
ndice deseado y se procesa el error en un mecanismo de adaptacion que ajusta los
parametros del regulador y en algunos casos actua directamente sobre la se~nal de
control. Tambien puede existir un tercer bucle dedicado a supervisar la marcha de
9
10 Introduccion

los dos bucles anteriores (Isermann 1982), en orden a asegurar la estabilidad del
sistema y a mejorar la actuacion del conjunto.
El mecanismo de adaptacion presenta una solucion en tiempo real al problema
de dise~no para sistemas con parametros conocidos, aunque como veremos mas ade-
lante, puede ir a un tiempo de muestreo superior al correspondiente al regulador e
identi cador.
La caracterstica fundamental que distingue a los sistemas adaptativos es la pre-
sencia de un bucle de control en el que se compara un ndice de funcionamiento
(Landau 1981).

Perturbacion
 ?
r - ? -u - y

Actuacion
- Controlador
Ajustable 
6
Planta -
Deseada
?  ? ?
Comparacion - Mecanismo
de
Medida del
Indice de
Decision Adaptacion Actuacion
6

Figura 2.1: Con guracion basica de control adaptativo


Existen muchos tipos de controladores que proporcionan buenas caractersticas
de regulacion en presencia de cambios de los parametros del sistema y que segun la
de nicion anterior no son realmente adaptativos, puesto que la adaptacion se realiza
en bucle abierto.
Un ejemplo muy utilizado de control adaptativo en bucle abierto es el denomi-
nado Cambio por tabla1. Consiste en la modi cacion de los parametros del contro-
lador a partir de una tabla que ha sido calculada previamente para distintos puntos
de funcionamiento, en funcion de una variable auxiliar. Un caso tpico es el control
de vuelo de un avion, cuyo regulador puede ser cambiado en funcion de la altura de
este.
1 En la terminologa inglesa se denomina Gain Scheduling
Control adaptativo 11

Mecanismo Medida de Medio


de  la Variable 
Adaptacion auxiliar Ambiente
C
r e - Controlador u y
-

6
Ajustable
- Planta -
C
CW

Figura 2.2: Sistema adaptativo en bucle abierto


En la gura 2.2, se presenta esquematicamente este tipo de controladores. Se
supone que existe una fuerte relacion entre la variable auxiliar y la dinamica de
los parametros del sistema. Este tipo de adaptacion tiene la ventaja de que el
controlador puede ser cambiado muy rapidamente, dependiendo de la rapidez con
que la variable auxiliar re eje el cambio de la dinamica del proceso, siendo muy
importante la eleccion de dicha variable. Sin embargo estos reguladores consumen
mucho tiempo en la realizacion de la tabla de parametros, presentando as mismo
algunos problemas en la conmutacion de unos parametros a otros.
Segun sean dise~nados los bloques descritos anteriormente, podemos tener uno
u otro tipo de control adaptativo, pudiendose dividir principalmente en dos gru-
pos: Controladores adaptativos con modelo de referencia (mrac) y Reguladores
autoajustables (str).
mrac y str pueden ser considerados como una aproximacion a la solucion del
problema de control adaptativo. La hipotesis que justi ca la aproximacion es que
para cualquier juego de valores posibles de los parametros de la planta y las pertur-
baciones, existe un controlador lineal con una complejidad jada, tal que el conjunto
de controlador y planta tienen caractersticas preespeci cadas.

1. Los controladores adaptativos con modelo de referencia, intentan alcanzar para


una se~nal de entrada de nida, un comportamiento en bucle cerrado dado por
un modelo de referencia.
2. Los reguladores adaptativos autoajustables, tratan de alcanzar un control
optimo, sujeto a un tipo de controlador y a obtener informacion del proceso y
12 Introduccion

sus se~nales.

Estas dos tecnicas han sido desarrolladas separadamente durante varios a~nos,
pudiendose demostrar su equivalencia en muchos casos. Las ventajas de mrac
estan en su rapida adaptacion para una entrada de nida y en la simplicidad de
tratamiento de la estabilidad utilizando la teora de estabilidad de sistemas no lin-
eal. Sin embargo, no se adapta convenientemente si la se~nal de entrada al sistema
tiene poca riqueza. El str tiene la ventaja de que se adapta para cualquier caso y
en particular para perturbaciones no medibles, teniendo al mismo tiempo una es-
tructura modular, lo que hace posible la programacion por bloques, siendo facil de
realizar distintos reguladores.
En este captulo se hace una breve introduccion a las distintas variantes de control
adaptativo, describiendose las ventajes e inconvenientes de estos controladores. En
captulos posteriores se analizan con mas detalle cada uno de ellos.
Hasta la actualidad han sido propuestas varias formas de dise~no del algoritmo
de control de un sistema lineal, pudiendose clasi car estas de diferentes maneras,
siendo una posible, en funcion de que el criterio de dise~no sea optimo o no optimo,
pudiendose destacar entre ellos los siguientes :

1. Criterio optimo:

 Controlador de mnima varianza de Astrom y Wittenmark 1973.


 Controlador de mnima varianza generalizado de Clarke y
Gawthrop 1975,1979.
 Controladores predictivos generalizados Clarke y Gawthrop 1988.
2. Criterio no optimo:

 Asignacion de polos y ceros (Wellstead et al. 1979).


 Asignacion de polos y ceros (Astrom y Wittenmark 1980).
 Controlador en tiempo mnimo (Isermann 1981).
 Regulador PID (Ortega 1982).
Control adaptativo 13

2.2 Controladores adaptativos con modelo de refe-


rencia (MRAC)
Los sistemas adaptativos con modelo de referencia fueron dise~nados primeramente
para sistemas continuos por minimizacion de un ndice de actuacion, siendo dicho
ndice la integral del error al cuadrado (Hang 1973). Esta regla de dise~no fue pro-
puesta por Whitaker del MIT (1958), Instrumentation Laboratory, denominandose
por ello como la regla del MIT.
En cuanto a las con guraciones posibles con modelo de referencia, la mas usual
es utilizar un modelo paralelo ( gura 2.3), aunque son posibles otras con guraciones
(Landau 1974, 1981), como modelo serie, serie-paralelo, etc.

Mecanismo
de 
Adaptacion

CC
r - ? - Controlador u- yp -

6
Ajustable Planta
BBN

?

6
- Modelo de
Referencia ym

Figura 2.3: Estructura con modelo de referencia (MRAC)


Existe una dualidad entre los sistemas de control adaptativo a un modelo de
referencia y el problema de identi cacion con un modelo ajustable, siendo en este
caso el modelo de referencia la planta a identi car.
Dado un modelo de referencia Gm (s; p) y un sistema ajustable Ga(s; p^), el cual
se desea que siga al modelo para que el error sea nulo (o mnimo en el caso de la
presencia de perturbaciones), se de ne el ndice de funcionamiento:
14 Controladores adaptativos con modelo de referencia (MRAC)

Z
J = 12 e2 dt ; e = ym ya

ym salida del modelo de referencia,


ya salida del modelo ajustable,
p^ parametro a ajustar.

Usando la tecnica de optimizacion del gradiente (Landau 1981) se tiene que la


regla de adaptacion es:
^p(e; t) = Kgrad(J ) = K
@J
@ p^

siendo ^p la variacion de p^ con relacion al ultimo valor calculado y K es la ganancia


de adaptacion.
La variacion del parametro ajustable con relacion al tiempo sera:
!
p^_ = ddtp^ = K @t
@ @J
@ p^
Si se asume variacion lenta de la ley de adaptacion, se puede intercambiar el
orden de las derivadas:
!  
p^_ = K @ p^ @t = K @@p^ 12 e2
@ @J

p^_ = Ke @@ep^ (2:1)

La ley de adaptacion (2.1) representa la regla del M.I.T.

@e = @ (ym ya) = @ya


@ p^ @ p^ @ p^
luego,
p^_ = Ke @y a
@ p^
Control adaptativo 15

La @ya =@ p^ es la funcion de sensibilidad del modelo ajustable con respecto al


parametro. En este caso la funcion de sensibilidad es proporcional a ym, quedando
la ley de adaptacion de la forma :
p^_ = K1 e ym
Esta regla ha sido muy popular debido a su simplicidad. Sin embargo para el
caso de ajuste de varios parametros requiere un numero elevado de funciones de
sensibilidad (tantas como parametros). Por otro lado la ganancia de adaptacion go-
bierna la velocidad de respuesta, si esta es muy grande el sistema puede ser inestable
y si es muy peque~na la velocidad sera muy lenta. Para obtener un buen compro-
miso entre velocidad de respuesta y estabilidad es necesario un laborioso estudio por
simulacion.
Otra tecnica de dise~no se fundamenta en la utilizacion del segundo metodo de
Lyapunov, el cual tiene la ventaja de que asegura la estabilidad global para cualquier
valor de la ganancia de adaptacion y cualquier tipo de entrada. La principal desven-
taja de este metodo es que se requiere el conocimiento del vector de estado, que no
siempre es accesible. Otra desventaja es que no es aplicable a los casos donde los
parametros del conjunto planta mas controlador no pueden ser modi cados directa-
mente.

 Parte lineal
-

6
- e invariante
en el tiempo
-

w Parte no-lineal
y/o variable v
en el tiempo

Figura 2.4: Separacion del sistema (Hiperestabilidad)


Landau (1981) propone una tecnica de dise~no basada en el concepto de hiper-
estabilidad y en la teora de estabilidad de Popov. El concepto de hiperestabilidad
esta relacionado con la estabilidad de una clase de sistemas, tales que pueden ser
16 Reguladores autoajustables (STR)

separados en dos bloques, gura 2.4. Este sistema esta formado por una parte lineal
invariante en el tiempo y otra no lineal y/o variable en el tiempo.
Si la entrada y salida de la parte no lineal estan relacionadas por la desigualdad
de Popov : Zt
n(0; t) = v w dt  Yo2; 8t > 0:
0

donde v es la entrada y w la salida e Yo2 es una constante nita positiva independiente


de t, el problema de encontrar la estabilidad absoluta de este sistema, se concreta
en averiguar las condiciones que debe de cumplir la parte lineal para que el conjunto
sea estable.
Para dise~nar la ley de adaptacion mediante esta tecnica se tienen que seguir los
pasos que se detallan a continuacion de forma resumida :

1. Transformar el sistema con modelo de referencia en uno equivalente que tenga


la estructura de la gura 2.4.
2. Encontrar la ley de adaptacion para que se cumpla la desigualdad de Popov.
3. Encontrar la parte de la ley de adaptacion que aparezca en la parte lineal para
que el conjunto del sistema sea globalmente estable.
4. Volver al sistema original y formular la ley de adaptacion explcitamente.

Una discusion extensa de esta tecnica puede encontrarse en el libro de Landau


(1981), resultando en casos particulares que la ley de adaptacion es de la forma
proporcional + integral o proporcional + integral + derivada. Con esta tecnica se
garantiza la estabilidad del conjunto, siendo su principal desventaja que a menudo
son necesarios una serie de diferenciadores.

2.3 Reguladores autoajustables (STR)


El diagrama de bloques de estos controladores se puede ver en la gura 2.5; en el se
distinguen tres partes claramente diferenciadas:

 un algoritmo recursivo de estimacion de parametros


Control adaptativo 17

 un mecanismo de adaptacion que desarrolla la tarea de dise~no del regulador y


 un regulador con parametros ajustables.

Estos reguladores conforman una estructura suboptima basada en el principio de


separacion de las tareas de control e identi cacion. El dise~no se hace de forma que
se suponen parametros conocidos y despues estos son sustituidos por sus estimados.
Desde el punto de vista del control estocastico de sistemas no lineales, es clara-
mente un controlador que aplica el principio de equivalencia cierta (supone que los
parametros identi cados coinciden con los reales).

Actuacion
Deseada
- Controlador
Dise~no del  Estimacion 
- la Planta
de

BB
 s s
-

6
- Controlador
Ajustable
- Planta -
BBN

Figura 2.5: Esquema del regulador autoajustable (STR)


La idea de los reguladores autoajustables puede ser aplicada a muchos proble-
mas de control que no son formulados como un problema de control estocastico.
Dada la modularidad y la separacion del control e identi cacion, pueden formarse
muchas clases de reguladores autoajustables por combinacion de diferentes metodos
de dise~no e identi cadores.

2.4 Ejemplo simple


A continuacion se describe un ejemplo simple (Astrom 1980), en el que se ilustra
el problema de control adaptativo y las aproximaciones mas usuales. Supongase el
18 Ejemplo simple

sistema discreto cuya ecuacion en diferencias es de la forma:


y(t + 1) = y(t) + bu(t) + e(t)
donde y es la salida del proceso, u, la se~nal de control, e, es un ruido blanco y b, un
parametro jo.
Se quiere minimizar el criterio:
!
J = Nlim E 1XN
2
!1 N 1 y (t)
Cuando se conoce el parametro b, la ley de control que minimiza el criterio es:
u(t) = y(t)=b; =) y(t + 1) = e(t)

Si no se conoce el parametro b, pero se sabe que en el instante t tiene una


distribucion gausiana normal de media ^b(t) y covarianza P (t). El problema de
control que tiene en cuenta el estado, en este caso la salida y(t), ^b(t) y P (t) llevara
consigo la resolucion de la ecuacion de Bellman, que para este caso podra ser resuelta
numericamente. Este sera el problema del control Dual. Sin embargo se pueden
hacer aproximaciones, derivandose una de ellas de aplicar el principio de equivalencia
cierta, para lo cual se empleara la ley de control:
u(t) = y(t)=^b(t)

Si las estimaciones de ^b(t) son malas y llega a tomar un valor peque~no, el esfuerzo
de control puede llegar a ser muy grande. Una forma de evitar esto es utilizar el
control cauteloso siguiente:
^
u(t) = ^2 b(t) y(t)
b (t) + P (t)
El control cauteloso puede presentar algunos problemas debido a la incertidumbre
de la estimacion, dado que para P (t) >> ^b2(t), u(t) puede ser muy peque~na y al
tener poca riqueza la identi cacion es pobre, con lo que se incrementa P (t), por lo
que u(t) puede llegar a ser cero. Si este control se aplica a un proceso estable, el
fenomeno se llama apagado, ya que el proceso ira a un punto de funcionamiento,
igual al que tena sin control. Si se aplica a un proceso inestable, al ser u(t) = 0,
la salida puede ser muy grande y no se podra controlar al sistema, en este caso el
fenomeno se conoce como escape.
Control adaptativo 19

2.5 >Porque control adaptativo?


Dado que un controlador adaptativo es un sistema no lineal en el que es necesario
ajustar una serie de parametros, es importante explorar bajo que circunstancias es
insu ente utilizar un controlador jo y sera necesario un controlador adaptativo.
Un controlador convencional esta pensado para controlar sistemas (la mayor
parte de las veces lineales), cuyos parametros permanecen constantes. Esto es una
buena aproximacion en la mayor parte de los casos, cuando se pretende regular
un sistema en un punto jo de operacion. Cuando exiten pertubaciones, si estas
son peque~nas, dicha aproximacion continua siendo su ciente para obtener un buen
control. Sin embargo, la aproximacion en torno a un punto de funcionamiento no
suele seguir siendo buena, si el punto de funcionamiento cambia.
Vamos a ver mediante algunos ejemplos, cuando es su ciente un regulador jo o
cuando es necesario otro tipo de control, o un controlador adaptativo. En general
no es inmediato decidir el tipo de control que se necesitara. Es necesario estudiar
cada caso en particular antes de decidirse por el tipo de control a aplicar.

Actuador no lineal
Muchos actuadores poseen caractersticas no lineales, las cuales crean di cultades
para el control.

Planta
yr  y-
- 
6
e-
Gc
u - Valvula v- G0

Figura 2.6: Diagrama de bloques de sistema realimentado


Supongase un sistema lineal ( gura 2.6), con un regulador PI cuyo actuador es
una valvula con la caracterstica,
v = f (u) = u4; u  0
20 >Porque control adaptativo?

Linealizando el sistema en torno al punto de operacion estacionario, puede de-


mostrarse que la ganancia del bucle es proporcional a la derivada de la funcion f (u).
Se deduce entonces que el sistema puede funcionar correctamente en un punto de
trabajo y pobremente en otros. Esto puede ilustrarse particularizando el sistema de
la gura 2.6 con:
1  1
G0 (s) = (s + 1)3 ; Gc(s) = K 1 + T s ; K = 0:15; Ti = 1:0
i
En la gura 2.7 puede verse la respuesta a un escalon de distinta magnitud, la cual
pone de mani esto el hecho de tener distinto comportamiento dependiendo del valor
del escalon (punto de funcionamiento).

Sistema de depositos interconectados


Otro ejemplo particularmente interesante es aquel en el que existen tanques y
tuberas largas interconectados. Supongase un sistema como el de la gura 2.8 en
el que se pretende controlar la concentracion en el segundo tanque.
La ecuacion diferencial que controla dicho proceso viene dada por:
Vm dcdt(t) = q(t) [cin(t  ) c(t)]
donde,
 = Vqd ; T = Vqm

que cuando se aplica la transformada de Laplace queda,


Gp(s) = 1 e+ Ts
s

sistema de primer orden en el que varan la constante de tiempo T y el retardo


asociado  .
Si se simula a este sistema en bucle cerrado con un regulador PI con constantes
K = 0:5 y Ti = 1:1, puede verse que el comportamiento de este sistema vara
considerablemente con las variaciones de caudal ( gura 2.9).
Con estos ejemplos se pone mani esto que existen muchos procesos que pueden
ser candidatos para aplicar control adaptativo. Si la modi cacion de los parametros
Control adaptativo 21

0.4

0.3

0.2

0.1

0
0 10 20 30 40 50 60 70 80 90 100

1.5

0.5

0
0 10 20 30 40 50 60 70 80 90 100

a
8

0
0 10 20 30 40 50 60 70 80 90 100

15

10

0
0 10 20 30 40 50 60 70 80 90 100

b
Figura 2.7: Respuesta a diferentes escalones
22 >Porque control adaptativo?

b""b"b

Cin Vd

Vm C
-

Figura 2.8: Sistema de tanques interconectados

1.6

1.4

1.2

1
cs

0.8

0.6

0.4

0.2

0
0 1 2 3 4 5 6 7 8 9 10

tiempo

Figura 2.9: Respuestas a escalon para diferentes caudales


Control adaptativo 23

es conocida, puede aplicarse un controlador ajustable por tabla (gain scheduling),


pero cuando existen partes del sistema cuya variacion no conocemos y no podemos
medir (por ejemplo la carga de un robot), un buen candidato es aplicar control
adaptativo identi cando solo la parte que desconocemos.

2.6 El problema del control adaptativo


Los ejemplos de la seccion anterior muestran porque es necesario utilizar control
adaptativo. Ellos ponen de mani esto que los procesos industriales son bastante
complejos y la variacion de parametros no puede determinarse desde un primer
momento. Por lo tanto, puede ser ventajoso emplear esfuerzo en desarrollar con-
troladores mas inteligentes. Un controlador mas complejo puede utilizarse para
diferentes procesos y por tanto el mayor costo en el desarrollo puede compartirse
entre las diversas aplicaciones. Sin embargo, es muy importante recordar que la uti-
lizacion de un controlador adaptativo no sustituye el buen conocimiento del proceso
que es necesario para elegir las especi caciones, la estructura del controlador y el
metodo de dise~no.
Como se ha visto en las secciones precedentes, un controlador adaptativo debe
contener:

 Una ley de control con parametros ajustables.


 Caracterizacion de la respuesta del sistema en bucle cerrado (Modelo de refe-
rencia o las especi caciones para el dise~no).
 Procedimiento de dise~no.
 Actualizacion de parametros basado en las medidas.
 Realizacion de la ley de control.

Estas partes son un poco diferentes para los distintos esquemas de control adap-
tativo, pero tienen muchos factores comunes.
Existe hoy en da una separacion entre la teora y la practica en control adapta-
tivo. En teora es posible manejar situaciones idealizadas. En la practica se utilizan
algoritmos bastante complejos, que introducen reglas concretas para manejar las
24 El problema del control adaptativo

posibles di cultades encontradas durante el analisis o con la experiencia de la apli-


cacion.
El hecho de que haya variaciones signi cativas en la respuesta en bucle abierto,
no signi ca necesariamente que sea necesario un controlador adaptativo. Esto puede
ilustrarse con los siguientes ejemplos.

Diferente respuesta en bucle abierto


El sistema con funcion de transferencia en bucle abierto dado por,
G0 (s) = (s + 1)(1 s + a)

con a=-0.01, 0 y 0.01, tiene una dinamica muy diferente para los valores de a ( gura
2.10a). Sin embargo el sistema realimentado unitariamente da las respuestas de la
gura 2.10b.
400

300

200

100

0
0 50 100 150 200 250 300

1.5

0.5

0
0 2 4 6 8 10 12

Figura 2.10: Respuestas en tiempo diferentes en bucle abierto


La razon estriba en que las funciones de transferencia de los tres sistemas son
muy similares en el entorno de la frecuencia de cruce, mientras que son diferentes a
Control adaptativo 25

baja frecuencia.

Similar respuesta en bucle abierto


El sistema con funcion de transferencia en bucle abierto dado por,
G0(s) = (s + 1)(20(1 sT )
s + 20)(Ts + 1)
con T=0, 0.015 y 0.03, tiene una dinamica para los valores de T ( gura 2.11a) muy
similar. Sin embargo el sistema realimentado con u = 20(yr y), da las respuesta
de la gura 2.10b.
1

0.8

0.6

0.4

0.2

0
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5

1.5

0.5

0
0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 2

Figura 2.11: Respuestas en tiempo similares en bucle abierto

Este sistema tiene un comportamiento inverso al anterior. La razon estriba en


que las funciones de transferencia de los tres sistemas son muy similares a baja
frecuencia, mientras que son bastante diferentes a alta frecuencia.
La ense~nanza a seguir de estos ejemplos es que es esencial conocer la respuesta
en frecuencia a la frecuencia de cruce deseada, para poder juzgar si las variaciones
de los parametros afectaran a la respuesta en bucle cerrado.
26 El problema del control adaptativo
Captulo 3
Algoritmo de identi cacion de
parametros
3.1 Introduccion

Una parte muy importante de los sistemas adaptativos es el algoritmo de identi -


cacion de parametros, consumiendo este la mayor parte del tiempo de calculo en cada
periodo de muestreo, y siendo muy cierta la frase de que una buena identi cacion
lleva a un buen control.
La identi cacion de sistemas tiene diversos signi cados en la literatura cient ca.
La acepcion mas usada es la dada por Sage et al. (1971), que de nen la identi cacion
o modelado de un sistema como el proceso de determinar un conjunto de ecuaciones
diferenciales o en diferencias, o los parametros de tales ecuaciones, que describen
un proceso fsico de acuerdo con un determinado criterio.
El modelo del proceso puede obtenerse algunas veces por consideraciones fsicas,
siendo mucho mas di cil determinar el modelo de las perturbaciones, que tienen
tanta o mas importancia. Por otro lado un proceso puede no ser representable por
un modelo matematico, siendo necesario una jerarqua de modelos complejos que
implementan hasta el mas mnimo detalle. Desde el punto de vista del dise~nador
es deseable disponer de modelos simples, aunque solo sean validos para estudios a
groso modo. Es tarea del ingeniero elegir el modelo adecuado entre la gran variedad
de modelos existentes entre un modelo simple o complejo.
27
28 Modelo del sistema y de las perturbaciones

Desde el punto de vista de procesamiento, la identi cacion puede ser hecha en


lnea con el proceso o bien las medidas efectuadas son guardadas en un archivo y
posteriormente procesadas. Por otro lado, si la identi cacion en lnea se hace cada
periodo de muestreo, tenemos lo que se llama\identi cacion en tiempo real". Para el
caso de los sistemas adaptativos, estamos interesados en la identi cacion en tiempo
real, por lo que normalmente utilizaremos la version recursiva de los algoritmos. Por
todo ello, es interesante disponer de un algoritmo de identi cacion que sea adecuado
en tiempo de ejecucion y convergencia.
La identi cacion de un sistema comprende las siguientes tareas :

 Estudio experimental. (Adquisicion de datos).


 Formulacion de un criterio.
 Seleccionar la estructura del modelo.
 Estimacion de los parametros.
 Validacion del modelo obtenido.

A continuacion describimos los algoritmos de identi cacion de parametros de sis-


temas lineales discretos mas utilizados y algunas modi caciones de estos, propues-
tas por diversos autores. Un buen artculo monogra co sobre identi cacion es el
de Astrom y Eykho (1971). La demostracion exhaustiva de los distintos metodos
puede encontrarse en Eykho (1974) y en otros textos clasicos, como por ejemplo
en Ljung (1987).

3.2 Modelo del sistema y de las perturbaciones


Suponemos que el sistema puede ser modelado como un proceso estable, invariante
en el tiempo y linealizable, con una sola entrada y una sola salida, por lo que puede
ser descrito por una ecuacion lineal en diferencias de la forma :
y(k) + a1 y(k 1) +    + any(k n) = b1 u(k d 1) + b2 u(k d 2) +   
+ bnu(k d n) + v(k) + c1 v(k 1) + c2 v(k 2) +    + cnv(k n)
o bien en forma vectorial:
y(k) = 'T (k)  + v(k) (3:1)
Algoritmo de identi cacion de parametros 29

donde:
'T (k) = ( y(k 1); y(k 2)    y(k n); u(k d 1); u(k d 2)   
u(k d n); v(k); v(k 1); v(k 2); ::; v(k n))

T = (a1 ; a2;    an; b1; b2 ;    bn; c1; c2;    cn)


u(k) = U (k) U1 (3.2)
y(k) = Y (k) Y1
U (k) e Y (k) son los valores de entrada y salida del sistema en el instante k, U1
es el valor medio de la se~nal de entrada, Y1 es el valor medio de la variable de
salida y v(k) es una se~nal de ruido estadsticamente independiente y estacionaria
con distribucion normal y de media nula. Asumimos que las perturbaciones pueden
ser modeladas por un proceso ARMA1 , con el mismo polinomio que el sistema. La
funcion de transferencia en z de este sistema puede escribirse como:
y (z ) = B (z 1 ) d
A(z 1 ) z u ( z ) +
C (z 1 ) v(z)
A(z 1 ) (3:3)
donde:
A(z 1 ) = 1 + a1 z 1 + a2 z 2 + :::: + anz n (3.4)
B (z ) =1 1 2
b1 z + b2 z + :::: + bnz n
C (z ) = 1 + c1 z 1 + c2z 2 + :::: + cnz n
1

El primer cociente B (z 1 )=A(z 1 ) representa el modelo de la planta, y el segundo


C (z 1 )=A(z 1) representa el modelo de las perturbaciones. El conjunto planta mas
perturbaciones, se denomina modelo ARMAX2 .

3.3 Metodo de mnimos cuadrados


Este metodo es el mas popular y mas utilizado en la practica como parte funda-
mental de los sistemas de control adaptativo. De acuerdo con Gauss, el principio
de mnimos cuadrados consiste en buscar los parametros desconocidos de tal forma
que la suma de los cuadrados de las diferencias entre los valores observados y calcu-
lados multiplicado por un numero que mide el grado de precision, sea un mnimo.
Para poder obtener una solucion analtica, los valores calculados deben ser funciones
lineales de los parametros desconocidos.
1 Auto Regresive Moving Average
2 Auto Regresive Moving Average con una variable eXogenous
30 Metodo de mnimos cuadrados

3.3.1 Caso determinista


En un primer paso vamos a considerar que el sistema a identi car es perfectamente
determinista y que sobre el mismo no inciden perturbaciones ni ruidos de ningun
tipo. Para este caso el modelo de la seccion 3.2 se reduce a:
y(k) + a1 y(k 1) +    + any(k n) = b1 u(k d 1) + b2 u(k d 2) +   
+ bn u(k d n)

Por lo que, para encontrar los 2n parametros se necesitan realizar 2n medidas de


u(k) e y(k), con las que se puede plantear un sistema de ecuaciones lineales, donde
las incognitas son los parametros ai y bj . O sea,

y(k) = 'T (k)


y(k + 1) = 'T (k + 1)
 
y(k + N 1) = 'T (k + N 1)

O bien,
Yk = k 
donde N = 2n y cuya solucion viene dada por:
^ = k 1 Yk

3.3.2 Caso no determinista


Normalmente el sistema no es perfectamente determinista, sino que esta afectado
por ruidos. En el modelo descrito anteriormente (ecuaciones 3.3 y 3.5), para el caso
considerado se supone que C (z 1 ) = 1 , v(k) = e(k) y que el error residual e(k) es
incorrelado con los elementos de '(k), de media nula y distribucion normal, por lo
que el modelo del sistema resulta ser:
y(k) = 'T (k) ^(k) + e(k) (3:5)
Algoritmo de identi cacion de parametros 31

donde,
'T (k) = ( y(k 1); y(k 2)    y(k n);
u(k d 1); u(k d 2)    u(k d n)
 (k) = (a1; a2 ;    an; b1 ; b2 ;    bn )
T

El primer termino del segundo miembro (ecuacion 3.5), puede ser interpretado
como la prediccion de un paso y^(k=k 1) de la salida y(k) con los datos disponibles
en el instante k 1, por lo que el error resulta ser la diferencia entre la salida real
y su prediccion:
e(k) = y(k) y^(k=k 1)

El metodo de mnimos cuadrados consiste en minimizar el cuadrado del error:


X X
J= e2k = (yk 'Tk )2 (3:6)
k k
O bien en forma matricial,
J = kT k
= (Yk k )T (Yk k )
= YkT Yk YkT k  T Tk Yk + T Tk k 
Calculando la derivada e igualando a cero se obtiene:
2YkT k + 2T Tk k = 0
que resolviendo se llega a la expresion de,
^MC = ( Tk k ) 1 Tk Yk (3:7)
El desarrollo anterior se ha realizado para 2n parametros, pero es igualmente valido
para el caso de na + nb parametros.
Si el sistema esta cambiando o bien estamos identi cando un sistema no lineal
en una determinada zona de trabajo y pasamos a otra, necesitamos tomar otras
medidas (N > 2n) y volver a calcular los parametros estimados. Este proceso, a la
luz de la expresion 3.7, conlleva la inversion de una matriz de dimension 2n  2n,
por lo que si la identi cacion se realiza en tiempo real puede sobrepasar el tiempo
de muestreo necesario para el sistema de control.
32 Metodo de mnimos cuadrados

3.3.3 Metodo recursivo


Los metodos recursivos aprovechan parte de los calculos realizados en un paso para
el siguiente, por lo que el calculo de los parametros en un instante se realiza como,
^N +1 = ^N + correccion (3:8)
Ademas si el sistema esta variando, (o bien se desea una actualizacion permanente
de los parametros), se suelen ponderar las medidas que se van tomando, dandole
mas peso a las mas recientes como se vera en un apartado posterior.
Para el desarrollo de la version recursiva se plantean las expresiones de los
parametros en los instantes N y N + 1 y se calcula el termino de correccion de
la expresion 3.8.
La solucion es bien conocida y conduce a los siguientes pasos (Franklin y Powell
1980):

1. Seleccionar los valores iniciales de P (k) y ^(k).


2. Obtener los nuevos valores de y(k + 1) y u(k + 1).
3. Calcular el error residual a priori :
e(k + 1) = y(k + 1) 'T (k + 1)^(k) (3:9)
4. Calcular L(k + 1) dado por la expresion :

L(k + 1) = 1 + 'T (Pk(+k)1)


'(k + 1)
P (k)'(k + 1)
5. Calcular los nuevos parametros estimados dados por :
^(k + 1) = ^(k) + L(k + 1)e(k + 1) (3:10)
6. Actualizar la matriz de covarianza.
P (k + 1) = (I L(k + 1)'T (k + 1))P (k) (3:11)
7. Actualizar el vector de medidas '(k + 2).
8. Hacer k = k + 1 y volver al paso 2.
Algoritmo de identi cacion de parametros 33

La estimacion de los parametros () esta dada por los valores de la estimacion
anterior corregida por un termino lineal del error entre la salida y su prediccion,
siendo L(k + 1) la ganancia de la correccion.
La ecuacion 3.10 tambien puede ser interpretada (Astrom 1980), como una cuasi-
Newton iteracion para minimizar e2 , donde ' = gradp(e) y el termino 'e puede ser
interpretado como el gradiente de e2 =2. La matriz de covarianza P (k) modi ca la di-
reccion del gradiente y determina la longitud del paso. Tambien puede interpretarse
como un factor de ganancia que determina el cambio de la identi cacion.
Cuando los residuos estan correlados, los parametros estimados pueden sufrir
desviaciones. Por otro lado el orden del sistema y el retardo deben ser conocidos
exactamente.

3.4 Metodo de mnimos cuadrados extendidos y


generalizados
En mnimos cuadrados se supone que los residuos estan incorrelados, si no es as, se
puede utilizar una version extendida, en cuyo caso se supone que los residuos estan
correlados de la forma C (z 1 )e(k), donde el polinomio C (z 1 ) tiene todos sus ceros
dentro del circulo unidad. De todo ello se deduce que utilizando el modelo 3.1 con
v^(k) = e(k) cuyo valor es calculado mediante la ecuacion 3.9, se puede identi car el
modelo de la planta y de las perturbaciones.
Por otro lado, el metodo de mnimos cuadrados generalizados se utiliza cuando
se dispone de alguna informacion acerca de las perturbaciones, como puede ser el
conocimiento del polinomio C (z 1 ) o la matriz de covarianza, en cuyo caso puede
demostrarse que se obtienen mejores resultados si la matriz N = E (vvT ), es distinta
de la identidad, minimizando en este caso el criterio J = eT N 1 e en vez de J = eT e,
que se utiliza en mnimos cuadrados.

3.5 Aproximacion estocastica


Este es un metodo de identi cacion recursiva, caracterizado por su gran simplicidad.
Existen muchas versiones de este algoritmo, siendo una de ellas (Isermann 1981), la
34 Metodo de variable instrumental

que minimiza la funcion de costo:


J = 12 e2 (k)
resultando el algoritmo:
e(k + 1) = y(k + 1) 'T (k + 1)^(k)

^(k + 1) = ^(k) + W (k + 1)'(k + 1)e(k + 1)

Puede verse que el metodo es muy similar al de mnimos cuadrados, con la


diferencia del factor W (k + 1) que es de eleccion libre. Una de las formas mas
frecuentes de escoger este factor es:

W (k + 1) = Constante
(k + 1)

La desventaja del metodo, es que los parametros sufren desviaciones de los exac-
tos y que la convergencia no es muy buena.

3.6 Metodo de variable instrumental


Si solo se esta interesado en los parametros del sistema y no en los del modelo de las
perturbaciones cuando estas estan correladas con '(k), se puede utilizar el metodo
de variable instrumental. Este metodo (Isermann 1981), sustituye el vector '(k)
por otro W (k) que es incorrelado con e(k). Dicho vector es de la forma:
W T (k) = ( h(k 1); h(k 2)    h(k n); u(k d 1); u(k d 2)    u(k d n))

donde h(k) = y^(k) = W T (k)^aux (k)


es la salida de un modelo auxiliar de parametros ^aux (k), sin perturbaciones. La es-
tructura del algoritmo es igual a la de mnimos cuadrados recursivos. Los parametros
suelen ltrarse con un ltro paso bajo. La eleccion de los parametros iniciales pre-
senta algunos problemas, por lo que suele inicializarse con los parametros estimados
por mnimos cuadrados.
Algoritmo de identi cacion de parametros 35

3.7 Metodo de maxima verosimilitud


Este metodo se basa en maximizar la probabilidad de las medidas obtenidas en los
parametros ai y bi y es fuertemente no lineal en los ci . Por ello este metodo requiere
muchos mas calculos que los anteriores, siendo de aplicacion practica limitada por
este motivo.
El modelo utilizado es el dado el apartado 3.2, pudiendose estimar los parametros
del sistema y los del modelo de las perturbaciones.

3.8 Modi caciones al algoritmo de identi cacion


Todos los algoritmos citados pueden darse bajo una formulacion uni cada (Isermann
1981). Por otro lado se ha supuesto que los parametros del sistema son invariantes
con el tiempo, por lo que el identi cador formulado tiene memoria in nita, es decir,
tienen el mismo peso todas las medidas obtenidas. Sin embargo si los parametros
del sistema varian lentamente, bien por derivas o por que el sistema sea no lineal,
es conveniente reducir la memoria del identi cador con el objeto de que este pueda
seguir las variaciones del sistema, ponderando las medidas de forma que tengan mas
peso las ultimas sobre las mas antiguas. Esto puede hacerse (Wellstead y Zanker
1978) esencialmente:

 Introduciendo un factor de olvido (c).


 Sumando una matriz positiva (R) a la matriz de covarianza (P ) del identi -
cador.
 O bien por una combinacion de las dos tecnicas anteriores.
Los dos metodos consiguen que la matriz P no se haga muy peque~na, ya que en el
identi cador original, esta matriz es monotonamente decreciente. El metodo mas
empleado es el del factor de olvido, que en algunos casos puede ser variable.

Inclusion de un factor de olvido


Introduciendo un factor de olvido, se consigue que el identi cador tenga memoria
nita. La modi cacion en concreto consiste en sustituir P (k) por P (k)=c.
36 Modi caciones al algoritmo de identi cacion

Para c = 1 se tiene el algoritmo de mnimos cuadrados normal, mientras que


para c < 1 el algoritmo olvida las medidas mas antiguas. Como referencia se puede
decir que para c = 0:99 tiene una memoria de 100 pasos, siendo un rango normal de
utilizacion del factor de olvido entre 0:98 y 1, pudiendo en algunos casos especiales
disminuirse hasta 0:95. La eleccion de c es un compromiso entre una gran eliminacion
del ruido o un mejor seguimiento de la variacion de los parametros.
La funcion de costo que se minimiza por mnimos cuadrados pasa a ser:
X
k
J= ck me2(k)
m=1

Suma de una matriz positiva


Este metodo (random walk), consiste en sumar una matriz (R) positiva a la matriz
P (k), que pasa a ser de la forma :
P (k + 1) = (I L(k + 1)'T (k + 1))P (k) + R

con ello se asegura que la matriz de covarianza permanezca limitada a un valor


superior a R.

Problemas que pueden presentarse


Si a lo largo del tiempo el punto de funcionamiento del sistema no cambia, es decir,
en este caso la excitacion es pobre, pueden aparecer algunos problemas. El producto
P (k)'(k) puede hacerse cero o muy peque~no, por lo que la expresion 3.11 se reduce
a P (k + 1) = P (k)=c. Si se utiliza un factor de olvido menor de la unidad, P (k)
puede crecer mucho, siendo por ello el identi cador muy sensible a cualquier cambio
(problema de Blow up o bursts, identi cador windup). Al mismo tiempo pueden
presentarse problemas numericos en P (k) (Latawiec 1983, Astrom 1983).
Para evitar el problema mencionado se han utilizado varias tecnicas, las cuales
no son excluyentes.

Posibles soluciones
1. Un metodo para evitar los problemas mencionados es utilizar un factor de
Algoritmo de identi cacion de parametros 37

olvido variable (Fortescue 1981), basandose para ello en la informacion disponible,


de forma que es calculado a cada paso segun la expresion:
 
1 'T (k + 1)L(k + 1) e(k + 1)
2
c(k + 1) = 1 So
Cuando el error tiende a cero, c(k) tiende a uno, por lo que puede evitarse el
problema de crecimiento de la matriz P (k). El parametro So debe buscarse
a priori, (So esta relacionado con la suma de los errores al cuadrado), pero el
identi cador es menos sensible a su busqueda que a la de c(k).
Normalmente en la fase inicial de puesta en marcha del algoritmo es cuando
interesa que el factor de olvido sea peque~no, ya que es en esta fase cuando los
parametros son mas inciertos, siendo necesario que a lo largo del tiempo se
incremente al valor que deseamos tener. Esto puede conseguirse facilmente,
utilizando por ejemplo una expresion de la forma (Isermann 1981):
c(k + 1) = coc(k) + cf (1 co )
con: co < 1 y c(0) < 1
siendo el lmite de c(k + 1) cuando k tiende a in nito igual a cf . La tecnica
del factor de olvido variable no elimina totalmente los problemas mencionados
anteriormente, pero disminuye la probabilidad de aparicion.
2. Otra posible solucion para evitar el crecimiento de la matriz P (k), es hacer
c(k) = 1 cuando la traza de la matriz P (k) exceda de un cierto valor (Cordero
1981).
3. Landau 1981 y Lozano 1982, proponen una estructura con dos factores de
olvido, cuya expresion es de la forma:
L(k + 1) = c1(k) PT (k)'(k + 1)
c2 (k) + ' (k + 1)P (k)'(k + 1)

P (k + 1) = (I L(k + 1)'T (k + 1)) cP ((kk))


1

donde 0 < c1(k) < 1 y 0 < c2(k) < 2;


obteniendose los mejores resultados para ganancia constante P (k) = P (0), o
bien para traza constante traza(P (k)) = traza(P (0)). Una posible solucion es
jar el cociente c1 (k)=c2(k) entre 0:8 y 1, resolviendo la ecuacion de P (k + 1)
para c1 (k) de forma que la traza de P (k + 1) sea igual a la traza de P (k) e
igual a una constante.
38 Algoritmos de identi cacion rapidos

3.9 Algoritmos de identi cacion rapidos


Cuando el tiempo es un factor primordial, se puede utilizar un algoritmo rapido
como por ejemplo el que sugiere Robin (1981). La idea de estos algoritmos es usar
una propiedad de invarianza. En concreto, de una iteracion a la siguiente de un
algoritmo recursivo, mucha de la informacion que se necesita en el instante k + 1 ya
se tiene en el instante k, aunque en otro lugar distinto al que se precisa. Por ello
utilizando este hecho se puede ahorrar tiempo, ya que en vez de calcular nuevamente
todos los datos, a algunos solo habra que cambiarlos de lugar, siendo menor el tiempo
de traslacion que el de calculo.

3.10 Estimacion de los valores de continua


Como se ha visto, el identi cador trabaja con los valores incrementales de las se~nales
de entrada y salida con respecto a los valores de continua U1 e Y1. Por ello estos
valores deben ser calculados o cancelados. A continuacion se dan varias formas de
poder hacer esto.

Utilizacion de los incrementos de las variables


Mediante este metodo no se necesitan conocer los valores de continua ya que:
u(k) = u(k) u(k 1) = (U (k) U1) (U (k 1) U1) = U (k) U (k 1)
y(k) = y(k) y(k 1) = (Y (k) Y1) (Y (k 1) Y1) = Y (k) Y (k 1)

La expresion anterior es aplicar un ltro paso alto tanto a la entrada como a la


salida.

Calculo de los valores medios


Una forma simple de calcular U1 e Y1 es hallando su valor medio para una serie de
medidas o bien recursivamente:
Algoritmo de identi cacion de parametros 39

 1 XM  1 XM
U1 = M u(i) Y1 = M y(i)
i=1 i=1

U1(k) = U1(k 1) + k1 (U (k) U1(k 1))


Y1(k) = Y1(k 1) + k1 (Y (k) Y1(k 1))

Mediante estimacion de una constante


Si se tiene descrito el sistema por la ecuacion en diferencias de la forma:
Y (k) = a1 Y (k 1) a2Y (k 2)    anY (k n) +
b1 U (k d 1) + b2U (k d 2) +    + bnU (k d n)
Sustituyendo las expresiones 3.3 se obtiene:
y(k) = a1 y(k 1) a2 y(k 2)    any(k n) +
b1 u(k d 1) + b2 u(k d 2) + ::: + bnu(k d n) + K

K = (1 + a1 + a2 + :: + an)Y1 (b1 + b2 + :: + bn)U1 (3:12)

Luego extendiendo el vector p(k) con un elemento K mas y el vector de datos


'(k) con un 1, se puede estimar la constante K y jando uno de los dos valores U1
o bien Y1 se podra calcular el otro. Se obtienen buenos resultados tomando Y1
igual a la referencia y calculando U1 por la expresion 3.12.
Para estimacion de sistemas en bucle cerrado donde actua un regulador, Witten-
mark (1973), recomienda sustituir y(k) por y(k) r(k) y u(k) por u(k) = u(k)
u(k 1), tanto para el identi cador como para el regulador.

3.11 Algoritmo de identi cacion propuesto


Dadas las buenas caractersticas de simplicidad y convergencia, el metodo de iden-
ti cacion mas utilizado es el de mnimos cuadrados recursivos, normal o extendido,
40 Algoritmo de identi cacion propuesto

con un factor de olvido variable y utilizando las soluciones propuestas para salvar
algunos problemas que se pueden presentar, quedando resumido en los pasos:

1. Seleccionar los valores iniciales de P (k) y ^(k).


2. Obtener los nuevos valores de y(k + 1) y u(k + 1).
3. Calcular el error residual a priori :
e(k + 1) = y(k + 1) 'T (k + 1)^(k)
4. Calcular L(k+1) dado por la expresion :

L(k + 1) = c(k) + 'PT ((kk)+'1)


(k + 1)
P (k)'(k + 1)
5. Calcular los nuevos parametros estimados dados por :
^(k + 1) = ^(k) + L(k + 1)e(k + 1)
6. Calcular el nuevo factor de olvido c(k + 1).

c(k + 1) = 1 (1 'T (k + 1)L(k + 1)) e(k S+ 1)


2
o

Si c(k + 1) < cmin Entonces c(k + 1) = cmin


Si c(k + 1) > 1 Entonces c(k + 1) = 1

7. Actualizar la matriz de covarianza.


W (k + 1) = (I L(k + 1)'T (k + 1))P (k) + R1
!
Si tr W ( k + 1)
c(k + 1) > trmax Entonces c(k + 1) = 1
P (k + 1) = Wc((kk++1)1)

8. Actualizar el vector de medidas '(k + 2).


9. Hacer k = k + 1 y volver al paso 2.
Algoritmo de identi cacion de parametros 41

3.12 Convergencia e identi cabilidad


El criterio general que debe cumplir un algoritmo de identi cacion es que los parametros
no sufran desviaciones, o sea, que E (^(N )) = o para N ! 1.
Para mnimos cuadrados las condiciones que se necesitan, (Isermann 1981), se
pueden resumir en :

1. El orden de los polinomios y el retardo (d) del sistema deben ser conocidos.
2. U1 e Y1 deben ser conocidos exactamente.
3. u(k) debe ser persistentemente excitada de orden n o mayor.
4. y(k) debe estar perturbada por un ruido estacionario.
5. e(k) debe ser incorrelado con los elementos de '(k).
6. E (e(k)) = 0.
7. La convergencia tambien depende de los valores de inicializacion del identi -
cador.

Identi cacion en bucle cerrado


Un sistema en bucle cerrado se dice identi cable si los parametros estimados son
consistentes cuando, usando un metodo de identi cacion apropiado, se tiene que:
lim E (^(N )) = o
N !1
y la salida debe ser medible.
Dado que en los sistemas de control adaptativo la identi cacion se realiza con el
sistema operando en bucle cerrado, pueden aparecer problemas de identi cabilidad
en ciertos parametros, cuando se utiliza un regulador lineal y no se emplean se~nales
externas de excitacion. En Isermann (1981), se plantean las condiciones de iden-
ti cabilidad de un sistema actuando en bucle cerrado sin se~nales externas. Estas
condiciones estan relacionadas con los ordenes de los polinomios del sistema y del
regulador. A continuacion se exponen los resultados mas importantes.
42 Convergencia e identi cabilidad

Dado el sistema :
A(z 1 )y (k + d) = B (z 1 )u(k ) + C (z 1 )e(k + d) (3:13)
donde,
A(z 1) = 1 + a1z 1 + a2z 2 +    + ama z ma
B (z 1) = b1 z 1 + b2 z 2 +    + bmb z mb
C (z 1) = 1 + c1z 1 + c2 z 2 +    + cmc z mc

Suponiendo que el sistema opera en bucle cerrado con un regulador de la forma:


u(t) = Q (z 1 ) y(t)
P (z 1 )
donde,
Q(z 1 ) = q1 z 1 + q2 z 2 + :::: + qv z v
P (z 1) = 1 + p1z 1 + p2 z 2 + :::: + pw z w

Primera condicion
Introduciendo el regulador en la ecuacion del sistema 3.13, suponiendo d = 0 y
sumando en ambos miembros de la igualdad el termino 'Sy', donde S es un polinomio
arbitrario en z 1 , se tiene que :
Ay + Sy = BQP y + Sy + Ce
Multiplicando por Q y operando se obtiene :
 
(A + S )Qy = ( SP + BQ) Q y + CQe
P
Ay = Bu + Ce
siendo,
A = (A + S )Q
B = SP + BQ
C = CQ
O sea, dado que S es arbitrario, existen muchas soluciones basadas en las medidas
de u(k), y(k) y e(k). Luego esta condicion implica que los ordenes del modelo del
proceso y de las perturbaciones deben ser conocidos con exactitud.
Algoritmo de identi cacion de parametros 43

Segunda condicion
La funcion de transferencia de la salida a las perturbaciones es de la forma :
y(z) = CP = 1 + b01 + b0 2:: + b0r z r
e(z) AP + Bz d Q 1 + a0 1 + a0 2:: + a0l z f
Luego debe cumplirse que,
f = max(ma + w; mb + d + v)
r = mc + w
El numero de parametros a identi car es ma + mb que deben ser calculados a
partir de f , o sea , f debe ser mayor o igual a ma + mb. Dicha condicion se expresa
por:

max(ma + w; mb + d + v)  ma + mb
o sea,
max(w mb; d + v ma )  0
En dicha condicion pueden ocurrir dos casos :

1. d + v ma  w mb  0
v  w mb + ma d  ma d

2. w mb  d + v ma  0
w  d + v ma + mb  mb
Por otro lado para estimar los mc parametros de C (z 1 ), se necesita que r sea
mayor que mc, lo cual se cumple si se escoge por ejemplo w > 0. Si A y C tienen p
ceros comunes, estos no pueden ser identi cados y la condicion 3.12 quedara como:
max(w mb; d + v ma )  p

Para hacer cumplir esta condicion, segun el caso, habra que jar algunos para-
metros a priori para disminuir el numero de parametros a identi car o bien habra
que aumentar el retardo (d) del sistema. Normalmente p = 0 y se considerara que
los ordenes de los polinomios son iguales a n, por lo que esta condicion se puede
expresar como:
max(w; v + d)  n
44 Ejemplo de identi cacion

Un ejemplo
Supongamos un sistema con orden de los polinomios A y B igual a n y que trabaja
con el regulador de mnima varianza que se describira mas adelante (apartado 5.5),
dado por:
u(k) = zBFG y(k)

Los ordenes de los polinomios G y F son respectivamente n 1 y d, luego :


v =n 1 y w =n+d 1

De acuerdo con la condicion expresada en el apartado anterior, para que el


sistema sea identi cable, el retardo debe ser mayor o igual a 1 o bien habra que jar
un parametro.

3.13 Ejemplo de identi cacion


A continuacion se muestra la evolucion de los parametros identi cados en bucle
abierto, del sistema dado por su funcion de transferencia:
3z 1 + 4z 2
G(z) = 1 z 1 2z 2
cuando se le somete a una entrada aleatoria de media cero. Puede observarse en la
gura 3.1, como los parametros convergen a los valores correctos.
Algoritmo de identi cacion de parametros 45

5.0

4.0 a1
a2
b1
b2
3.0
Parametros

2.0

1.0

0.0
0.0 10.0 20.0 30.0 40.0 50.0 60.0 70.0
Tiempo

Figura 3.1: Parametros identi cados


46 Ejemplo de identi cacion
Captulo 4
Control adaptativo por modelo de
referencia
4.1 Introduccion
Como se menciono en el captulo 2, la tecnica de control adaptativo por modelo
de referencia (mrac) fue introducida por Whitacker en 1958, siendo su forma mas
popular la mostrada en la gura 4.1.
En este esquema puede verse un controlador primario que se utiliza para obtener
el comportamiento en bucle cerrado (como en cualquier esquema de control conven-
cional). Por otro lado como los parametros del proceso pueden ser desconocidos y
variables, es difcil encontrar un controlador jo que responda en todas las situa-
ciones. En la tecnica mrac, la respuesta deseada a una se~nal de entrada del proceso
se especi ca como un modelo de referencia. El mecanismo de adaptacion mira la
salida yp del proceso y la salida ym del modelo de referencia y calcula los parametros
adecuados de forma que la diferencia tienda a cero. El mecanismo de adaptacion
puede utilizar, si estan disponibles, ademas de las se~nales de salida del proceso y del
modelo de referencia (yp, ym), las se~nales de entrada, de referencia y las variables
de estado del proceso.
En el esquema de la gura 4.1, el modelo de referencia esta colocado en paralelo
con el proceso. Este esquema es bastante usual, aunque existen diversas posibili-
dades, como colocarlo en serie o bien una combinacion serie-paralelo. A lo largo de
este captulo nos centraremos en la estructura paralelo.
47
48 Dise~no de controladores adaptativos

Mecanismo
de 
Adaptacion

CC
r - ? - Controlador u- yp

6
Ajustable Planta -
BBN

?

6
- Modelo de
Referencia ym

Figura 4.1: Esquema general de MRAC paralelo

Una de las partes mas importantes en control adaptativo es el dise~no de la


ley de control. La primera ley de control adaptativo haca uso de los modelos de
sensibilidad y mas tarde de la teora de estabilidad de Lyapunov y de la teora de
hiperestabilidad de Popov. Estas ultimas garantizan la estabilidad del conjunto del
sistema, lo que las hace particularmente interesantes, convirtiendose en metodos de
dise~no estandar.

4.2 Dise~no de controladores adaptativos


Como se ha visto en la seccion anterior, un sistema de control adaptativo basicamente
esta formado por tres partes: un controlador primario, un modelo de referencia y la
ley de adaptacion. Por lo tanto para el dise~no de un sistema de control adaptativo,
sera necesario de nir las tres partes. Dado que la parte que caracteriza al control
adaptativo es la ley de adaptacion, en lo que sigue, nos centraremos fundamental-
mente en esta parte.
Control adaptativo por modelo de referencia 49

Controlador Primario
El controlador primario puede tener en principio cualquiera de las con guraciones
conocidas para el dise~no de controladores lineales. Sin embargo, debe cumplir la
condicion de que sea posible que el conjunto del proceso y el controlador puedan
reproducir al modelo de referencia. Este requisito, supone restricciones sobre el
orden y la estructura del controlador. Por otro lado para que pueda aplicarse una
adaptacion directa, la se~nal de control debe ser una funcion lineal de los parametros.
Modelo de referencia
El modelo de referencia, que especi ca el comportamiento deseado en bucle ce-
rrado, se da usualmente en forma parametrica. La condicion mencionada anterior-
mente para el seguimiento del modelo de referencia, tambien condiciona en ciertos
aspectos el modelo de referencia posible, en cuanto al orden relativo del proceso
(exceso de polos). Por otro lado el modelo elegido debe ser sensible a la dinamica
del proceso, ya que si por ejemplo se elige un modelo con una dinamica muy rapida,
la se~nal de control sera muy grande causando saturaciones y no pudiendo el sistema
responder a dicha dinamica. Por ello la eleccion del modelo de referencia no es facil,
eligiendose normalmente un modelo conservador.

4.2.1 Enfoque de sensibilidad


Este metodo esta basado en el uso de los modelos de sensibilidad para adaptar los
parametros en la direccion correcta. La deduccion de este metodo comienza con el
planteamiento de un ndice de actuacion, normalmente cuadratico:
Z t+T
J (t + T ) = t
e21 ( )d
En esta ecuacion e1 = yp ym y el ndice J se evalua sobre el periodo T jo, en el
cual los parametros permanecen constantes. En el instante (t + T ) los parametros
son ajustados en la direccion decreciente de J .
Z t+T
(t + T ) = (t) @@J = (t) @e ( )
2e1( ) 1 d
@ (4:1)
t
debe ser una matriz cuadrada de nida positiva, que representa la ganancia de
adaptacion. Usualmente es diagonal. Teniendo en cuenta que:
@e1 ( ) = @yp
@ @
50 Dise~no de controladores adaptativos

La ecuacion (4.1) queda:

(t + T ) (t) = 1 Z t+T 2e ( ) @yp d (4:2)


1
T t @
Que en el lmite para T ! 0 da la ley de adaptacion:
d = 2 e @yp (4:3)
1
dt @
El factor @yp=@ representa la sensibilidad de la salida del proceso a las varia-
ciones en , y puede ser generado por un modelo de sensibilidad. Como puede
observarse esta ley de adaptacion es la misma obtenida en el captulo 2, denomi-
nada como la regla del MIT.
El modelo de sensibilidad anterior se sustituye por la sensibilidad del modelo
de referencia, dado que normalmente el modelo del proceso se desconoce. Esta
suposicion se hace en base a que pasado un tiempo la respuesta del sistema converge
a la respuesta del modelo de referencia.
La principal desventaja de este metodo, es la ausencia de un criterio que garantice
la estabilidad del sistema de control. El sistema puede hacerse inestable si el modelo
de referencia no se escoge adecuadamente o si la ganancia de adaptacion se elige
demasiado grande.

4.2.2 Metodo de Lyapunov


Dado el caracter no lineal y variable en el tiempo de los sistemas adaptativos por
modelo de referencia mrac, no son validos los criterios de estabilidad de sistemas
lineales. Un metodo bien conocido es el metodo directo de Lyapunov. Este metodo
establece que un sistema tiene un equilibrio x = 0, asintoticamente estable, si existe
una funcion, llamada de Lyapunov, V (x) que satisface:

V (x) > 0 para x 6= 0 de nida positiva


V_ (x) < 0 para x 6= 0 de nida negativa
V (x) ! 1 para jjxjj ! 1 (4.4)
V (0) = 0
Control adaptativo por modelo de referencia 51

Como la funcion de Lyapunov es similar a una funcion de energa, esta debe


decrecer con el tiempo. Utilizando este metodo en el dise~no de sistemas adaptativos,
se trasladan las especi caciones de estabilidad directamente en la ley de adaptacion,
siguiendo los pasos:

1. El primer paso es encontrar la ecuacion de error, bien en la salida (yp ym) o


en las variables de estado (xp xm ).
2. Encontrar una funcion de Lyapunov como una funcion del error entre las
se~nales y del error en los parametros ( = ^ ). En su forma mas sim-
ple esta funcion toma la forma:
V = eT Pe + T 1
Donde las matrices P y 1 deben ser de nidas positivas.
3. Calcular la derivada de la funcion de Lyapunov. La derivada debe ser de nida
negativa. Generalmente toma la forma:
V_ = eT Qe + algunos terminos incluyendo 
El primer termino garantiza que la derivada es de nida negativa, por lo que,
haciendo el resto igual a cero se tiene una posible solucion. La matriz Q es
de nida positiva. Las matrices P y Q, para un sistema gobernado por una
matriz A, estan relacionadas por la ecuacion de Lyapunov:
Q = AT P + PA (4:5)
4. Haciendo el termino extra igual a cero se obtiene la ley de adaptacion. Nor-
malmente tiene la forma:
_ = " (4:6)
" esta directamente relacionado con el error e y  es una version modi cada
del vector de se~nales (referencia, salida, etc).

Ejemplo de sistema de primer orden


Considerando el sistema de la gura 4.2, donde la se~nal de control esta dada por:
u = K r, siendo K la ganancia ajustable que hay que calcular, la deduccion de la
ley de adaptacion es como sigue:
y_p = bKr yp
y_m = r ym
e_ = y_p y_m = (bK 1)r (yp ym) (4.7)
= e + (bK 1)r
52 Dise~no de controladores adaptativos

Proceso
u- yp
- K b
s+1

r - 
? e-

6
- 1
s+1
ym
Modelo

Figura 4.2: Sistema y modelo de primer orden


Teniendo en cuenta que el termino (bK 1) es proporcional al error en el parametro,
la funcion de Lyapunov en este caso puede elegirse como:
V = e2 + 1 (bK 1)2
Su derivada resulta ser:
V_ = 2ee_ + 2 b K_ (bK 1)
2b
= 2e[ e + (bK 1)r] + K_ (bK 1)

= 2e2 + 2e(bK 1)r + 2b K_ (bK 1) (4.8)

El primer termino es negativo. As que haciendo el resto igual a cero se obtiene la
ley de adaptacion:
2b
2e(bK 1)r + K_ (bK 1) = 0 =) K_ = er = 1 er
b
En esta ley de adaptacion el parametro libre es 1 , siendo necesario conocer el signo
de b para jar el de 1.
En las guras 4.3 y 4.4 se representa una simulacion del ejemplo descrito cuando
el parametro b vale inicialmente 4 y en el instante 20 pasa a valer 2. Puede observarse
Control adaptativo por modelo de referencia 53

1.5

1
Salidas yp - ym

0.5

-0.5

-1
0 5 10 15 20 25 30 35 40
Tiempo

0.5

0.4
Parametro k

0.3

0.2

0.1

0
0 5 10 15 20 25 30 35 40
Tiempo

Figura 4.3: Proceso de primer orden ( 1 = 0:1)

1.5

1
Salidas yp - ym

0.5

-0.5

-1
0 5 10 15 20 25 30 35 40
Tiempo

0.6
Parametro k

0.4

0.2

0
0 5 10 15 20 25 30 35 40
Tiempo

Figura 4.4: Proceso de primer orden ( 1 = 0:5)


54 Dise~no de controladores adaptativos

como la adaptacion es buena en ambos casos, siendo mas rapida en el caso de la


gura 4.4, dado que la ganancia de adaptacion es superior. En lnea a trazos se
representa la salida del modelo de referencia y en lnea continua la salida del modelo
ajustable.
La principal desventaja del metodo de Lyapunov es que no es un metodo sis-
tematico, dado que hay que encontrar la funcion de Lyapunov V adecuada en cada
caso.

4.2.3 Metodo de hiperestabilidad


Con este metodo tambien se consigue una ley de adaptacion estable. Como en el
metodo de Lyapunov, en primer lugar se formulan las ecuaciones de error. Estas
ecuaciones se dividen en una parte lineal invariable con el tiempo y otra no lineal y
variable con el tiempo. La primera parte contiene usualmente al modelo de referencia
y su salida es la se~nal de error que es utilizada para la ley de adaptacion. La segunda
parte contiene la ley de adaptacion y su salida negada es la entrada a la parte lineal.
Esta estructura se corresponde con la vista en la seccion 2.2 del captulo 2. La
teora de hiperestabilidad garantiza la estabilidad asintotica si ambas partes (lineal
y no lineal), satisfacen las condiciones de pasividad (Landau 1979):

1. La parte lineal (llamese G(s)), debe ser estrictamente positiva. Ello signi ca
que:

(a) G(s) debe ser real si s es real.


(b) los polos de G(s) deben tener parte real negativa, y
(c) la parte real de G(j!) de ser mayor que cero para 1 < ! < 1.

2. La parte no lineal debe cumplir la desigualdad de Popov.


Zt
vT w dt  2 ; 8t > 0
0

siendo v el vector de entrada y w el vector de salida de la parte no lineal, y 2


una constante nita positiva que no depende de t.
Control adaptativo por modelo de referencia 55

4.3 Estructura general de los sistemas adapta-


tivos (MRAC)
Considerando de nuevo el esquema paralelo de la gura 4.1, pueden considerarse dos
posibles formas de descripcion: mediante variables de estado o bien entrada-salida.
Considerando la primera de ellas, puede escogerse el modelo de referencia como el
conjunto de ecuaciones lineales,

x_ = AM x + BM u; x(0) = x0 (4:9)

donde x es el vector de estado y u es el vector de entrada. Este modelo se supone


estable y completamente controlable. En cuanto al modelo ajustable (planta mas
controlador), puede utilizarse la siguiente representacion,

y_ = AS (e; t)x + BS (e; t)u; x(0) = x0 ; AS (0) = AS0; BS (0) = BS0; (4:10)

El vector de error generalizado viene dado por: e=x y


El objetivo de dise~no, en el caso parametrico, es encontrar la ley de adaptacion
tal que las matrices de parametros AS (e; t) y BS (e; t) sean modi cadas de forma que
el error tienda a cero para cualquier entrada u.
La derivada del error puede obtenerse restando las ecuaciones anteriores, donde
ademas se suma y resta el termino AM y.

e_ = x_ y_ = AM x + BM u AS (e; t)x BS (e; t)u + AM y AM y (4:11)

pudiendose expresar como:


e_ = AM e + [AM AS (e; t)]y + [BM BS (e; t)]u (4:12)

Si se desea que el mecanismo de adaptacion tenga memoria (lo cual es lo mas


habitual), debe considerarse la inclusion de un integrador en el mecanismo de
56 Estructura general de los sistemas adaptativos (MRAC)

 e
_
ll e
-

6
- l,
,,
AM 

y AM AS (0)
ZZ ? 
?

? ZZ  F (e; t) 


6 ZZ 
 6ZZ 
6
 G(e; t) 

u BM BS (0)

Figura 4.5: Representacion equivalente del modelo de error


Control adaptativo por modelo de referencia 57

adaptacion. Esto tendra el efecto de que los parametros ajustables dependeran


no solo del error en un instante sino tambien de los valores pasados. Por ello la ley
de adaptacion se de ne como:
AS (e; t) = F (e; ; t) + AS (0); 0    t

BS (e; t) = G(e; ; t) + BS (0); 0    t (4.13)

Las ecuaciones 4.12 y 4.13, pueden representarse segun la gura 4.5, sistema que
se puede descomponer en un sistema lineal y otro no lineal, al cual se le pueden
aplicar el criterio de Popov de estabilidad (o criterio de hiperestabilidad).

w -e_ - ll e v

6 
l - D
1
,,
w 6 ,
AM  SL

y AS (0) AM
ZZ? 
? ,,
ZZ 
6
 ,l 
ll
1 


? 2 

6 BS (0) BM
ZZ 
? ,,
6ZZ 
6
,l 
ll
1 
SNL u 2 

Figura 4.6: Sistema adaptativo por modelo de referencia paralelo


Para conseguir cumplir dicho criterio, por un lado la parte lineal se modi ca
a~nadiendole un termino D en serie. En cuanto a las funciones F y G, caben muchas
58 Ejemplos ilustrativos

posibilidades de eleccion, pero teniendo en cuenta que deseamos que el error en


regimen permanente sea cero, pueden elegirse de la forma:
Z1
F (e; t) = 1 (v; t)dt + 2 (v; t)
0
Z1
G(e; t) = 1(v; t)dt + 2(v; t) (4.14)
0

La estructura nal del sistema sera la representada en la gura 4.6 donde los
parametros de dise~no seran las funciones D, 1 , 2 , 1 y 2 . La resolucion se
realiza para cada caso concreto y no de forma general, ya que el caso general resulta
bastante complicado.

4.4 Ejemplos ilustrativos


En primer lugar vamos a ver un ejemplo de control de un barco, de los dos primeros
metodos comentados y posteriormente un ejemplo del metodo de hiperestabilidad.
Generalmente, la dinamica de un barco se obtiene aplicando las leyes de Newton
al movimiento del barco. Para buques de grandes dimensiones, el movimiento en
el plano vertical puede despreciarse, dado que el efecto del balance y cabezada es
peque~no en esos casos. El movimiento es descrito generalmente por un sistema de
coordenadas jo al barco (ver gura 4.7).
Un modelo simple que describe el comportamiento dinamico de un buque puede
expresarse mediante la ecuacion diferencial (modelo de Nomoto de 3er orden):
     
3) (t) + 1 + 1  (t) + 1 ( _ t) = K 3 _ (t) + (t) (4:15)
1 2 1 2 1 2
donde es el rumbo y  el angulo de timon. Asumiendo condiciones iniciales nulas,
(4.15) puede escribirse como,
(s) = K (3 s + 1) (4:16)
(s) s(1 s + 1)(2s + 1)
donde K , 1 , 2 y 3 son parametros, los cuales son funcion de la constante de
velocidad axial del barco u y de su longitud l, pudiendose expresar dichos parametros
como:
Control adaptativo por modelo de referencia 59

v u

x
y

Figura 4.7: Sistema de coordenadas del barco

u
K = K0 l (4.17)
!
l
i = i0 u ; i = 1; 2; 3: (4.18)

En nuestro ejemplo tomaremos los siguientes parametros que corresponden a un


buque tipo carguero (Layne y Passino 1993): K0 = 3:86, 10 = 5:66, 20 = 0:38,
30 = 0:89, y l = 161 m. Tambien asumimos que el barco esta navegando en la
direccion x a una velocidad de 5 m/s.
En la navegacion de mantenimiento de rumbo, un barco solo experimenta peque~nas
desviaciones del curso marcado. De esta forma, el modelo (4.15) se obtiene de la
linealizacion de las ecuaciones de movimiento en torno a un angulo de timon de
cero grados ( = 0). Como resultado de esto, el angulo de timon no debe exceder
aproximadamente de 5o, en otro caso el modelo sera inadecuado, ya que se pondra
de mani esto el comportamiento no lineal. Para nuestro proposito, necesitamos un
modelo que sea valido para variaciones del angulo de timon superiores a los 5o, por
ello, utilizaremos el modelo propuesto por Bech y Smitt (Layne y Passino 1993).
Este modelo extendido esta dado por,
60 Ejemplos ilustrativos

     
_ t)) = K 3 _(t) + (t)
3) (t) + 1 + 1  (t) + 1 H ( ( (4:19)
1 2 1 2 12

_ t)) es una funcion no lineal de (


donde H ( ( _ t). La funcion H ( (
_ t)) puede cal-
cularse de la relacion entre  y _ en regimen permanente tal que 3) =  _ = 0.
Un experimento conocido como el test de espiral ha demostrado que H ( ) _ puede
aproximarse por:
_ = a _ 3 + b _
H ( ) (4:20)

donde a y b son dos valores reales constantes tal que a es siempre positivo. En
nuestro ejemplo elegiremos ambos valores de a y b como la unidad.
A continuacion vamos a presentar dos controladores adaptativos por modelo de
referencia para el sistema descrito anteriormente. Ambos utilizaran un controlador
proporcional derivativo (PD). Los metodos considerados son el metodo del gradi-
ente y el metodo basado en el criterio de estabilidad de Lyapunov para dise~no de
controladores adaptativos.

4.4.1 Metodo del gradiente


El mecanismo de ajuste de parametros utilizando este metodo puede ser implemen-
tado mediante la conocida regla del MIT. Para ello, se utiliza la funcion de costo,
J = 21 2e (t) (4:21)
donde
e(t) = m (t) (t)
y
d = @ J
dt @
por lo que,
d = (t) @ e (t)
e
dt @
Para el desarrollo de la regla del MIT para el control del barco, asumimos que
el barco puede ser modelado por un sistema lineal de segundo orden. Este modelo
Control adaptativo por modelo de referencia 61

puede obtenerse eliminando el polo del sistema correspondiente a 2 en (4.15), dado


que la dinamica asociada a este polo es mucho mayor que la resultante del polo 1 .
Por otro lado, se supone que el sistema opera con peque~nos valores de la derivada
del angulo de timon, de forma que el termino correspondiente a _ es despreciable;
quedando en ese caso que el modelo (conocido como de Nomoto) de 2o orden del
buque tiene la forma:    
 (t) + 1 ( _ t) = K (t) (4:22)
1 1
El controlador PD que puede emplearse en este caso viene dado por,
(t) = kp( r (t) (t)) kd ( _ t) (4:23)

donde kp y kd son las ganancias proporcional y derivativa respectivamente y r (t)


es la salida deseada. Sustituyendo 4.23 en 4.22 se obtiene,
! ! !
 t) + 1 + Kkd (
( _ t) + Kkp (t) = Kkp r (t) (4:24)
1 1 1
cuya funcion de transferencia es,
Kkp
(t) =  1+Kkd1  Kkp  r (t) (4:25)
s2 + 1 s+ 1

El modelo de referencia para este sistema se escoge como:


m (t) = 2 !n2
s + 2!ns + !n2 r (t) (4:26)

con  = 1 y !n = 0:05. Combinando 4.26 con 4.25 y calculando la derivada parcial


con respecto a kp y kd se tiene,
0 K 1
@ e (t) = @  1+Kkd1  Kkp  A ( (t) r (t)) (4:27)
@kp s + 1 s + 1
2
y 0 1
Ks
@ e(t) = @  1+Kkd1  Kkp  A (t) (4:28)
@kd s + 1 s + 1
2
62 Ejemplos ilustrativos

En general las expresiones 4.27 y 4.28 no se pueden utilizar porque los parametros
kp y kd no se conocen, pero en el caso optimo se tiene que,
! !
2
s + 1 + Kk d Kk p
s +  = s2 + 2!ns + !n2 (4:29)
1 1

Ademas el termino K=1 puede incluirse en la ganancia de adaptacion . No


obstante, esto requiere que se conozca el signo de K=1 . En general debe ser
positivo para asegurar que la adaptacion del controlador se hace en la direccion
negativa del gradiente. Para un buque de las caractersticas rese~nadas en el apartado
anterior el signo de K=1 es negativo lo cual implica que el de con K=1 incluido
debe ser negativo para asegurar la direccion negativa del gradiente. Despues de
estas aproximaciones se obtienen las ecuaciones diferenciales del controlador PD
siguientes:
!
dkp = 1
(4:30)
dt s + 2!ns + !n2 ( r ) e
1 2

!
dkd = s (4:31)
dt s + 2!ns + !n2 e
2 2

donde 1 y 2 son numeros negativos. Despues de muchas simulaciones, se han


encontrado que los mejores parametros son: 1 = 0:005 y 2 = 0:1
En la gura 4.8, puede verse la evolucion de la respuesta del sistema junto con
la salida del modelo de referencia y la se~nal de referencia. En el instante de tiempo
2300 segundos se cambia la velocidad de 5 m/s a 7.5 m/s, variable que afecta en
gran medida a la dinamica del buque. Puede observarse como la salida del sistema
se va aproximando a la salida deseada conforme los parametros del controlador PD
van convergiendo a los valores optimos. En la gura 4.9 se muestran la se~nal de
control y los parametros kp y kd. La convergencia de estos ultimos es un poco lenta,
aunque como se aprecia en la gura 4.8 el seguimiento es bueno a partir de 1500
segundos.

4.4.2 Metodo de Lyapunov


A continuacion se va a resolver el mismo ejemplo anterior utilizando el metodo de
Lyapunov descrito en la seccion 4.2.2. En este caso tambien se utilizara un regulador
Control adaptativo por modelo de referencia 63

80

60

40

20
Rumbo (grados)

-20

-40

-60

-80
0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000

Tiempo (segundos)

Figura 4.8: Respuesta ante entradas en escalon

100
Angulo de timon

50

-50

-100
0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000
Tiempo (segundos)

0
kd - kp

-200

-400

0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000
Tiempo (segundos)

Figura 4.9: Evolucion de la se~nal de control y de los parametros


64 Ejemplos ilustrativos

PD (4.23) y se considerara el modelo reducido (4.22). Tambien se emplearan los


mismos valores de  = 1 y !n = 0:05.
Las ecuaciones que describen la dinamica del barco pueden ponerse en forma
matricial de la siguiente forma:
! ! ! !
_ = 0 1 + 0
r (4:32)
 Kkp
1
1+Kkd
1 _ Kkp
1

As mismo el modelo de referencia esta dado por:


! ! ! !
_ m = 0 1 m + 0 (4:33)
 m !n2 2!n _ m !n2 r

La dinamica que describe la evolucion del error e(t) = m (t) (t) puede
expresarse por:
_ e = Am e + (Am As(t)) + (Bm Bs(t)) r (4:34)

donde el subndice m y s corresponde a las matrices del modelo y del sistema


ajustable dados por las ecuaciones 4.32 y 4.33. Los vectores corresponden a:

e = [ e _ e]T ; _T
= [ ]

El punto de equilibrio e = 0 es asintoticamente estable si se elige la ley de


adaptacion como:
A_ s(t) = P e T
(4.35)
_Bs(t) = P e r

donde P es una matriz de nida positiva, solucion de la ecuacion de Lyapunov ATm P +


PAm = Q < 0. Resolviendo para Q la matriz identidad se tiene que:
! !
p 11 p 12 25 :0125
P = p p = 200:000 2005:00200: 000 (4:36)
21 22
Control adaptativo por modelo de referencia 65

Por otro lado a partir de las ecuaciones 4.35 para k_ p y k_ d, se tiene la ley de
adaptacion,

k_ p = 1 (p21 e + p22 _ e)( r ) (4.37)

k_ d = 2 (p21 e + p22 _ e) _ (4.38)

donde 1 y 2 son numeros negativos. Despues de varias simulaciones, se han en-


contrado los valores de los parametros: 1 = 0:0005 y 2 = 0:001

80

60

40

20
Rumbo (grados)

-20

-40

-60

-80
0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000

Tiempo (segundos)

Figura 4.10: Respuesta ante entradas en escalon

En la gura 4.10, puede verse la evolucion de la respuesta del sistema junto con
la salida del modelo de referencia y la se~nal de referencia. Puede observarse como
la salida del sistema se va aproximando a la salida deseada conforme los parametros
del controlador PD van convergiendo a los valores optimos. En la gura 4.11 se
muestran la se~nal de control y los parametros kp y kd. La convergencia de estos
ultimos es un poco lenta, aunque como se aprecia en la gura 4.10 el seguimiento es
bueno a partir de 500 segundos.
66 Ejemplos ilustrativos

100
Angulo de timon

50

-50

-100
0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000
Tiempo (segundos)

0
kd - kp

-200

-400

0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000
Tiempo (segundos)

Figura 4.11: Evolucion de la se~nal de control y de los parametros

4.4.3 Metodo de hiperestabilidad


Supongase el modelo de referencia y el sistema ajustable dados por:

yR = (4.39)
u s + a1s + a2
2

yA = ^ (4.40)
u s + a1s + a2
2

La aplicacion del enfoque de hiperestabilidad a este caso conlleva los siguientes


pasos:

1. Transformar el sistema en la forma equivalente de dos bloques, con la parte


lineal y no lineal.
2. Encontrar la solucion de la parte de la ley de adaptacion no lineal utilizando
el criterio de Popov.
Control adaptativo por modelo de referencia 67

3. Encontrar la solucion de la parte de la ley de adaptacion correspondiente a la


parte lineal de forma que sea estrictamente positiva.
4. Realizar la ley de adaptacion.

Siguiendo estos pasos, en primer lugar restando las ecuaciones 4.40 y 4.39 se
tiene,
(1 + a1 s + a2 s2)" = [ ^("; t)]u (4:41)

donde ^("; t), de acuerdo con la estructura general de la ley de adaptacion vendra
dado por: Zt
^("; t) = 1 (v; t;  )d + 2 (v; t) +
^(0) (4:42)
0

siendo v la salida de la parte lineal, que es la salida del error generalizado con el
operador D. O sea, v = D(s)".
La parte derecha de la ecuacion 4.41, puede considerarse como una entrada
w1 = [ ^("; t)]u. Por lo que la parte lineal vendra de nida por:
(1 + a1 s + a2 s2)" = w1
v = D(s)" (4.43)

Si se considera la expresion dada por la ecuacion 4.42, la se~nal w1 aparece como


la salida del bloque no lineal que tiene a su vez como entrada la se~nal v. Por lo
tanto se tiene,
Z t 
w = w1 = [ ^("; t)]u = u 1 (v; t;  )d + 2 (v; t) +
^(0) (4:44)
0

El esquema equivalente correspondiente puede verse en la gura 4.12.


El segundo paso, corresponde a encontrar la solucion para 1 y 2 de forma que
se veri que,

Z t1 Z t1 Z t 
v w dt = vu 1 (v; t;  )d + 2 (v; t) + ^(0) dt  02 (4:45)
0 0 0

En este caso particular, para resolver la desigualdad puede descomponerse en


dos integrales I1 e I2 tales que,
68 Ejemplos ilustrativos

w e- v
 -
1 1
1+a1 s+a2 s2 D(s)
6
w
^(0)
@@  
? 
@
6

6
HHH  1 

u 2 

Figura 4.12: Esquema equivalente del ejemplo

Z t1 Z t 
I1 = vu ^(0) dt  12
1 (v; t;  )d + (4.46)
0 0
Z t1
I2 = v u 2 (v; t)dt  22 (4.47)
0

Si se hace que ambas integrales sean  0, la suma sera  0 y por lo tanto  2


para todo t  0.
Centrandonos, en primer lugar, en la integral I2 , una solucion puede ser,

2 (v; t) = k2 (t) v u; [k2(t)  0] para todo t  0 (4:48)

A su vez de la ecuacion 4.48, pueden deducirse soluciones particulares:

 Adaptacion proporcional:
2 (v; t) = k2 v u; k2  0 (4:49)
Control adaptativo por modelo de referencia 69

 Adaptacion mediante rele:


{ Si se elige k2(t) = k2=jvj,
2 (v; t) = k2 (v=jv j) u = k2 signo(v) u; k2  0 (4:50)
{ Si se elige k2(t) = k2=juj,
2 (v; t) = k2 signo(u) v; k2  0 (4:51)
{ Si se elige k2(t) = k2=juvj,
2 (v; t) = k2 signo(uv); k2  0 (4:52)

Para la resolucion de la integral I1, teniendo en cuenta un resultado bien conocido


como,
Z t1 h i
f_(t)k1f (t)dt = k21 f 2(t1) f 2(0)  12 k1f 2 (0); k1  0 (4:53)
0
puede hacerse,
f_(t) = vu
y Zt
k1f (t) = 1 (v; t;  )d +
^(0) (4.54)
0
Diferenciando con respecto a t se obtiene,
1 (v; t) = k1 vu (4:55)
Si se elige k1  0 se cumple la condicion buscada. En conjunto la ley de adaptacion,
con la eleccion particular que se ha realizado, quedara,
Zt
^("; t) = k1 v u dt + k2 v u + ^(0) (4:56)
0
Considerando el producto vu como una variable, se tiene que la ley de adaptacion
(ecuacion 4.56), tiene una parte proporcional y otra integral (PI).
El tercer paso, consiste en encontrar el termino D, tal que la parte lineal GSL,
sea una funcion de transferencia estrictamente real positiva.

GSL = 1 + aDs(s+) a s2 (4:57)


1 2
70 Ejemplos ilustrativos

Para ello el modelo de referencia debe ser estable y los coe cientes a1 , a2 y los
de D(s) deben ser reales. Eligiendo D(s) = d0 + d1s, puede encontrarse que,

Re[GSL(jw)] = d0(aa2 + (wd21)a21 + ad20w)w2


2
(4:58)
2 1

As que para que 4.58 sea mayor que cero para todo w real, se tiene la condicion,

d0a2  0 =) d0  0
a1 d1 d0  0 =) d1  d0=a1 (4.59)

El cuarto paso es realizar la estructura completa del sistema de control adapta-


tivo, la cual corresponde en este a una ley de adaptacion proporcional mas integral
que puede verse en la gura 4.13. Puede observarse que en la realizacion de esta
estructura tambien es necesario un termino derivada del error. En algunos casos
puede accederse al estado completo del modelo de referencia y del modelo ajustable
por lo que podra obtenerse directamente el termino derivada sin tener que realizar
un derivador.
Control adaptativo por modelo de referencia 71

- yM e_ - d
1+a1 s+a2 s2 -d 1
dt
u 
?e r - 
- ?

6
d 0 
-@@ - 1
1+a1 s+a2 s2 yA
6@ ^

^(0)-   
 HHH k1  r @@  v
6 6@
k2  u

Figura 4.13: MRAC con ley de adaptacion P+I


72 Ejemplos ilustrativos
Captulo 5
Reguladores autoajustables
(STR)
5.1 Introduccion
En general cuando dise~namos un controlador, este se dise~na para un punto de fun-
cionamiento determinado del proceso. Ahora bien, si los parametros del proceso
varan con el tiempo, ya sea por derivas o desgastes de las constantes fsicas, o
bien porque el proceso es no lineal y se modi ca el punto de funcionamiento en el
que estamos trabajando, el controlador calculado para un punto de funcionamiento
concreto, no sera en general el adecuado para este tipo de situaciones.
Cuando nos enfrentamos con este tipo de problemas, podemos plantear una
estructura de control que ademas del bucle principal de regulacion que existe en
todo sistema de control, incorpore un segundo bucle de control, en el que a partir
de la informacion recogida del proceso y con un determinado criterio de dise~no, se
modi quen los parametros del regulador.
Como se vio en el captulo 2 sobre los controladores adaptativos, esto puede ha-
cerse con dos planteamientos diferentes: con un modelo de referencia o bien mediante
los reguladores autoajustables1 .
En este caso, se comienza con un metodo de dise~no para sistemas con parametros
conocidos, sustituyendo posteriormente los parametros conocidos por sus estimados
1 Self-tuning regulator (STR) en la terminologa inglesa

73
74 Introduccion

y recalculando el controlador en cada paso. La aplicacion de esta idea es lo que se


conoce como el principio de equivalencia cierta.
El diagrama de bloques de estos controladores se puede ver en la gura 5.1; en
el se distinguen tres partes claramente diferenciadas:

 un algoritmo recursivo de estimacion de parametros


 un mecanismo de adaptacion que desarrolla la tarea de dise~no del regulador y
 un regulador con parametros ajustables.

Estos reguladores conforman una estructura suboptima basada en el principio de


separacion de las tareas de control e identi cacion.

Actuacion
Deseada
- Controlador
Dise~no del  Estimacion 
- la Planta
de

BB
 s s
-

6
- Controlador
Ajustable
- Planta -
BBN

Figura 5.1: Esquema de regulador autoajustable (STR)


La idea de los reguladores autoajustables puede ser aplicada a muchos proble-
mas de control que no son formulados como un problema de control estocastico.
Dada la modularidad y la separacion del control e identi cacion, pueden formarse
muchas clases de reguladores autoajustables por combinacion de diferentes metodos
de dise~no e identi cadores.
En cuanto al modelo de la planta, supondremos en general, que sobre el sistema
actuan perturbaciones estocasticas, por lo que el proceso estara descrito por su
modelo ARMAX, de la siguiente forma:
Reguladores autoajustables (STR) 75

y (k ) = B (z 1 ) z d u(k) + C (z 1 ) v(k)
A(z 1 ) A(z 1 ) (5:1)

donde los distintos polinomios y variables tienen el siguiente signi cado:


A(z 1 ) = 1 + a1 z 1 + a2 z 2 + :::: + anz n
B (z 1 ) = b1 z 1 + b2 z 2 + :::: + bnz n
C (z 1 ) = 1 + c1 z 1 + c2z 2 + :::: + cnz n

siendo y(k) la secuencia de salida, u(k) la se~nal de control del sistema, v(k) una
se~nal aleatoria independiente con distribucion gaussiana N (0; ), d es el retardo del
sistema y z 1 es el operador retardo tal que y(k) = z 1 y(k + 1).
En cuanto al criterio de dise~no, pueden dividirse en dos tipos, segun el plantea-
miento del problema sea: estocastico o no estocastico. Cuando el planteamiento es
estocastico, se consideran sistemas cuyas se~nales no se pueden conocer exactamente
y tampoco se pueden predecir.
En el dise~no con planteamiento estocastico, normalmente se minimiza un cierto
ndice de actuacion, como por ejemplo para el caso de mnima varianza, se trata de
minimizar las variaciones con respecto a cero, ya que se trata de un problema de
regulacion.
J = E fy2(k + d + 1)g
O bien puede plantearse un ndice mas general de la forma:

J = E f(Py(k + d + 1) + Qu(k) Rr(k))2 g


Mediante el planteamiento no estocastico, se considera que las perturbaciones
que inciden sobre un sistema son exactamente conocidas, pudiendose describir estos
sistemas analticamente por medio de un sistema dinamico determinista.
En este caso el ndice de actuacion se da en funcion de unas especi caciones que
debe cumplir la salida del sistema, lo que normalmente se traduce en especi car
una funcion de transferencia deseada en bucle cerrado, como es el caso de asig-
nacion de polos. En la actualidad, se ha demostrado en numerosos casos, que ambos
planteamientos conducen a resultados similares.
76 Asignacion de polos y ceros

A continuacion se exponen algunas tecnicas de dise~no de controladores, que son


utilizadas frecuentemente en control adaptativo.

5.2 Asignacion de polos y ceros


Astrom y Wittenmark (1980) proponen una estructura de control con dise~no por
asignacion de polos como la dada en la gura 5.2. Esta estructura puede inter-
pretarse como un compensador en adelanto y un compensador en bucle cerrado.
Tambien puede demostrarse que dicha estructura corresponde a un controlador lineal
por realimentacion del estado y a un observador. La ley de control puede dise~narse
para unos polos deseados del sistema en bucle cerrado, preservando los ceros ines-
tables del sistema en bucle abierto.

v(k) - C
A

w(k)- - 
? y(k)
S -

6
1
M
- Bz d
A
-
-

G 

Figura 5.2: Estructura de control por asignacion de polos y ceros


El problema que se plantea consiste en hacer que la funcion de transferencia,
desde la salida a la referencia, del sistema ( gura 5.2), sea de la forma:
y(k) = RP m z d w(k) (5:2)
m

donde los polinomios Rm y Pm no tienen factores comunes y el grado de Pm es mayor


o igual a Rm. Esto permitira dar las especi caciones del problema de seguimiento
Reguladores autoajustables (STR) 77

en terminos de la respuesta deseada a una se~nal de referencia. Tambien habra que


especi car la dinamica del observador mediante el polinomio Ao .
El metodo de dise~no elegido es el de sntesis algebraica directa. La solucion
consiste basicamente en resolver una ecuacion polinomial con ciertas restricciones
en los ordenes de los polinomios para asegurar que el regulador propuesto sea causal
y con realizacion mnima.
A partir de la gura 5.2, la funcion de transferencia en bucle cerrado que se
obtiene es:
y(k) = AMSBz CM
d
+ BGz d w (k) +
AM + BGz d v(k) (5:3)

Suponiendo que las perturbaciones son despreciables e igualando dicha ecuacion


con la 5.2, se tiene la siguiente ecuacion polinomial:
(AM + BGz d )Rm = SBPm (5:4)

Las raices de esta ecuacion polinomial contienen las raices de los polinomios S ,
B y Pm. Si el polinomio B no esta contenido en el polinomio Rm , entonces formara
parte del regulador que cancelara estos ceros, luego para que as pueda ocurrir, los
ceros del polinomio B deben ser estables o estar contenidos en Rm .
Factorizando B como B B +, donde el superndice corresponde a los ceros
inestables y el + a los ceros estables. Haciendo tambien,
Rm = B Rm1
M = M1B + (5.5)
S = AoRm1

introduciendolos en la ecuacion 5.4, se obtiene la expresion :


AM1 + B Gz d = Ao Pm (5:6)

Para resolver esta ecuacion polinomial, cuyas incognitas son M1 y G, pueden


utilizarse varios metodos, como son: resolucion de un sistema de ecuaciones lineales
simultaneas, utilizacion del metodo de la matriz polinomial (Aracil 1974), o bien
como apuntan Alix et al. (1982), mediante un segundo algoritmo de identi cacion,
lo que conduce a un metodo llamado cuasi-directo.
78 Asignacion de polos y ceros

La ecuacion caracterstica del bucle cerrado es de la forma:


AM + BGz d = AM1 B + + B B +Gz d = B +Ao Pm (5:7)

luego dicha ecuacion tiene como ceros suyos, los ceros estables del sistema en bucle
abierto, los ceros del observador y los polos del modelo deseado.
La ecuacion 5.6 (5.7), tiene in nitas soluciones, pudiendose obtener una solucion
unica realizable. Para ello es necesario determinar los ordenes mnimos de los poli-
nomios para que el controlador por asignacion de polos y ceros de Astrom y Wit-
tenmark, sea causal. El grado de un polinomio A, se escribe como grd(A).
A partir de la ecuacion 5.7, se sabe que,
max(grd(A)+ grd(M ); grd(B )+ grd(G)+ d) = grd(B +)+ grd(Ao)+ grd(Pm) (5:8)
Ademas para que el regulador sea causal debe cumplirse que,
grd(G) < grd(M ) y grd(S ) < grd(M ) (5:9)
Por otro lado para una ecuacion de la forma,
AX + BY = C
donde X e Y son las incognitas, se tiene una solucion unica, (resultado conocido del
algebra),
si grd(X ) < grd(B ) o grd(Y ) < grd(A)
A partir de (5.8) pueden ocurrir dos casos:

1. grd(A) + grd(M ) = grd(B +) + grd(Ao) + grd(Pm)


o sea, grd(M ) = grd(B +) + grd(Ao) + grd(Pm) grd(A)
y para obtener una solucion unica,
grd(G) < grd(A) tomando grd(G) < grd(A) 1
El grado del polinomio del observador puede deducirse utilizando 5.9, que
sustituyendo se tiene,
grd(Ao) > 2grd(A) grd(Pm) grd(B +) 1
Reguladores autoajustables (STR) 79

2. grd(B ) + grd(G) + d = grd(B +) + grd(Ao) + grd(Pm)


o sea, grd(G) = grd(Ao) + grd(Pm) grd(B ) d
y para obtener una solucion unica,
grd(M ) < grd(B ) + d tomando grd(M ) < grd(B ) + d 1

Sustituyendo grd(M ) = grd(M1) + grd(B +), en los dos casos nos dan las condi-
ciones para los grados de M1 y G como:
grd(G) = grd(A) 1
grd(M1) = grd(Ao) + grd(Pm) grd(A) (5.10)
o bien,
grd(G) = grd(Ao) + grd(Pm) grd(B ) d
grd(M1) = grd(B ) + d 1 (5.11)

- Rm z d yr (k)
Pm

G e ? 
M 6 

s
w (k ) - Rm A 
? u y(k) - s
Pm
-
B -
- Bz d
A

Figura 5.3: Interpretacion como modelo de referencia


La estructura del regulador dise~nado puede interpretarse como seguimiento a un
modelo de referencia de la forma dada en 5.2. Operando con la ecuacion 5.4, para
obtener S=M y sustituyendo en la expresion del regulador,
u(k) = M1 (Sw(k) Gy(k)) (5:12)
80 Casos particulares

se tiene,
A y (k + d) + G (y (k) y(k))
u(k ) = B (5:13)
r
M r
que corresponde a la estructura de la gura 5.3.
En dicha estructura se puede observar que el regulador esta compuesto de dos
partes, un controlador en adelanto (feedforward) y un controlador en bucle cerrado.
Si la se~nal e es igual a cero, la accion del bloque G=M desaparece y la relacion que
liga la entrada con la salida es justamente el modelo de referencia 5.2. Por otro lado
es de notar que el bloque A=B no es realizable pero s lo es Rm A=PmB .

5.3 Casos particulares


Como se desprende de la deduccion anterior, para el dise~no del regulador propuesto
es necesario factorizar el polinomio B y resolver la ecuacion polinomial 5.6. Estos
pasos pueden consumir un tiempo de calculo apreciable y si se pretende que el
algoritmo funcione en lnea con el proceso (caso normal en control adaptativo), es de
gran interes considerar casos particulares en los que dichos calculos se simpli quen.

1. Cancelacion de todos los ceros del sistema.


En este caso se supone que el sistema es de fase mnima, pudiendose cancelar
todos los ceros del sistema en bucle abierto, por lo que se tiene,

B+ = B B =1
Rm = Rm1 = K M = M1 B
S = KAo
que sustituyendo en la ecuacion 5.6, se llega a,

AM1 + Gz d = PmAo (5:14)


Dicha ecuacion es mas simple de resolver, sobre todo si se toman las condiciones
5.11. Este caso tambien puede verse como el controlador de Clarke y Gawthrop
si se eligen,
M1 = zF C = z 1 Ao
Q = 0 w(k) = 0
Reguladores autoajustables (STR) 81

2. No se cancela ningun cero del sistema.


Si el sistema a controlar es de fase no mnima, se supone que todos los ceros
estan fuera del circulo unidad, y se eligen los ceros del sistema en bucle cerrado
como Rm = KB , siendo K una constante, o sea,
B+ = 1 B =B
Rm = BRm1 = KB M = M1
S = KAo

la ecuacion resultante es de la forma,

AM + BGz d = Pm Ao

5.4 Prediccion optima


El problema de control estocastico esta ntimamente ligado con el de prediccion. Por
ello vamos a desarrollar el predictor optimo (Astrom 1970, Wittenmark 1974), de d
pasos de la salida de un sistema, el cual sera necesario posterioremente.
Dado el proceso estocastico en tiempo discreto:

A(z 1 )y(k + d) = B (z 1 )u(k) + C (z 1 )v(k + d) (5:15)


donde,
A(z 1 ) = 1 + a1 z 1 + a2 z 2 + :::: + anz n
B (z 1 ) = b1 z 1 + b2 z 2 + :::: + bnz n
C (z 1 ) = 1 + c1 z 1 + c2z 2 + :::: + cnz n

consideramos el problema de encontrar la prediccion de la salida en el instante k + d


con la informacion disponible en el instante k, tal que la esperanza matematica de
y(k + d) y(k + d=k) al cuadrado sea mnima, siendo y(k) la secuencia de salida,
u(k) la se~nal de control del sistema y v(k) una se~nal aleatoria independiente con
distribucion gaussiana N (0; ).
82 Prediccion optima

Predictor optimo
La ecuacion del sistema 5.15 puede escribirse como :

y(k + d) = B (z 1 )
A(z 1 ) u (k ) +
C (z 1 ) v(k + d)
A(z 1 ) (5:16)

El ultimo termino de la expresion anterior es una funcion de v(k + d); v(k + d


1)    v(k); v(k 1)   , donde v(k + d);    v(k +1) no estan disponibles en el instante
k, por ello se va a descomponer este ultimo termino, mediante la utilizacion de la
identidad:
C (z 1 ) = A(z 1 )F (z 1 ) + z (d+1) G(z 1 ) (5.17)
con;
F (z 1 ) = 1 + f1z 1 + ::: + fd z d
G(z 1 ) = go + g1z 1 + ::: + gn 1z (n 1)

quedando el sistema 5.16 de la forma:

y(k + d) = B (z 1 ) u(k) + F (z 1 )v(k + d) + z 1 G(z 1 ) v(k)


A(z 1 ) A(z 1 ) (5:18)

resolviendo la ecuacion 5.16 para v(k).

v(k) = CA((zz 1)) y(k) B (z 1 ) d


1
C (z 1 ) z u(k) (5:19)

Sustituyendo 5.19 en 5.18 y operando con la ayuda de la identidad 5.17.

y(k +d) = B (z 1 ) 1 )v (k +d)+ z G(z ) y (k ) B (z ) G(z ) z


1 1 1 1
u ( k )+ F ( z (d+1) u(k )
A(z 1 ) C (z 1 ) C (z 1 ) A(z 1 )

y(k + d) = F (z 1 )v(k + d) + z CG
1 (z 1 ) B (z 1 )F (z 1 ) u(k)
(z 1 )
y ( k ) +
C (z 1 )
Reguladores autoajustables (STR) 83

Tomando la esperanza matematica del error de prediccion. (En lo que se sigue,


se omite z 1 en los polinomios para mayor claridad).
E (y(k + d) y^(k + d=k))2 =
= E (Fv(k + d) +
z 1 G y(k) + BF u(k) y^(k + d=k))2 =
C C
= E (Fv(k + d))2 + E (
z G y(k) + BF u(k) y^(k + d=k))2 +
1
C C
+ 2E (Fv(k + d)(
z 1G BF
C y(k) + C u(k) y^(k + d=k)))

El ultimo termino es cero puesto que v(k + d) es independiente, y sobre el primer


termino no podemos in uir, luego la mejor prediccion de la salida se obtiene igua-
lando a cero el segundo termino, con lo que resulta que:

y^(k + d=k) = z CG
1 (z 1 ) B (z 1 )F (z 1 ) u(k)
(z 1 )
y (k ) +
C (z 1 )
O bien :
y^(k + d + 1=k) = G (z 1 )
C (z 1 ) y ( k ) +
zB (z 1 )F (z 1 ) u(k)
C (z 1 )
siendo el error de prediccion,
y(k + d + 1) y^(k + d + 1=k) = F (z 1)v(k + d + 1)

5.5 Regulador de mnima varianza


Este regulador optimo pretende reducir el efecto de las perturbaciones sobre la sa-
lida. Para ello la estrategia de control consiste en calcular la se~nal de control u(k),
como una funcion de los valores disponibles en ese instante, o sea, u(k 1); u(k
2);    ; y(k); y(k 1);   , de tal forma que se minimice el criterio:
J = E (y2(k + d=k))
Se supone que sobre el sistema actuan perturbaciones estocasticas, por lo que el
proceso estara descrito por su modelo ARMA, de la siguiente forma:
A(z 1 )y(k + d) = B (z 1 )u(k) + C (z 1 )v(k + d) (5:20)
84 Regulador de mnima varianza

donde los distintos polinomios y variables tienen el signi cado dado en el apartado
anterior. Deduciendose que la se~nal de control u(k) afecta a la salida y(k + d) pero
no antes. Utilizando la identidad,
C (z 1 ) = A(z 1 )F (z 1) + z (d+1) G(z 1 ) (5:21)
El segundo miembro de la igualdad anterior puede descomponerse, quedando la
ecuacion:
y(k + d) = B (z 1 ) 1 )v (k + d) + z G(z ) v (k )
1 1
A(z 1 ) u ( k ) + F (z A(z 1 ) (5:22)

Los dos ultimos terminos del lado derecho de la igualdad tienen la siguiente
interpretacion:

1. F (z 1 )v(k + d), es una combinacion lineal de las perturbaciones producidas


entre el instante k y k + d, cuyo efecto sobre la salida y(k + d) no se puede
controlar con u(k), ya que v(k + d) para d > 0, es independiente de y(k
1); y(k 2)    ; u(k 1); u(k 2)   
2. z 1 G(z 1 )v(k)=A(z 1), es el efecto sobre la salida de las perturbaciones ante-
riores a k.

Resolviendo la ecuacion 5.20 para v(k) y sustituyendo su expresion en 5.22 se obtiene:


1 F (z 1 )B (z 1 ) z
y(k + d) = F (z )v(k + d) + C (z 1 ) u(k) + C (z 1 ) y(k)
1 G(z 1 )

Tomando la esperanza matematica en ambos miembros se tiene que:


E (y2(k + d)) = E (Fv(k + d))2 + E ( FB (k) + z G y(k))2 +
1
C u C
+ 2E (Fv(k + d)( z 1G FB
C y(k) + C u(k)))
El ultimo termino de la expresion anterior es cero, ya que v(k + d) es indepen-
diente de los valores anteriores de y(k) y u(k), y sobre el primer termino del segundo
miembro de la ecuacion no se puede in uir, luego el mnimo se obtendra igualando
a cero el termino que queda, resultando que :
u(k) = F (zz 1G)B
1 (z 1 )
(z 1 )
y(k)
Reguladores autoajustables (STR) 85

o bien,
u(k) = zB (zG(1z)F ()z 1 ) y(k)
1
(5:23)

A la vista de las expresiones obtenidas y comparandolas con la deduccion del pre-


dictor optimo en el apartado anterior, se puede interpretar el problema del regulador
de mnima varianza, como la determinacion del predictor y buscar la se~nal de control
tal que la prediccion coincida con la salida deseada. En este caso y^(k + d=k) = 0.

5.6 Control predictivo generalizado


El Control predictivo generalizado (gpc) fue propuesto por Clarke et al. (Clarke
1987a), y se ha convertido en uno de los metodos mas populares en el ambito del Con-
trol Predictivo tanto en el mundo industrial como en el academico. Se ha empleado
con exito en numerosas aplicaciones industriales (Clarke 1988), mostrando buenas
prestaciones, a la vez que un cierto grado de robustez respecto a sobreparametrizacion
o retardos mal conocidos. Puede resolver muchos problemas de control diferentes
para un amplio campo de procesos con un numero razonable de variables de dise~no,
que son especi cadas por el operario dependiendo del conocimiento previo del pro-
ceso y de los objetivos de control. Pero a pesar de este exito en la practica, este
metodo adolece de la ausencia de un analisis teorico completo que estudie la in-
uencia de los parametros de dise~no (horizontes, secuencias de ponderacion) sobre
la estabilidad del bucle cerrado as como de resultados de robustez.
La idea basica del gpc es calcular una secuencia de futuras acciones de control de
tal forma que minimice una funcion de coste multipaso. El ndice a minimizar es la
esperanza matematica de una funcion cuadratica que mide por un lado la distancia
entre la salida predicha del sistema y una cierta trayectoria de referencia hasta el
horizonte de prediccion, y por otro el esfuerzo de control necesario para obtener
dicha salida. Esta idea ha sido usada por Lelic y Zarrop (Lelic 1987a), y Lelic y
Wellstead (Lelic 1987b), para la obtencion de un controlador por asignacion de polos
generalizado que pertenece a la clase de los controladores de horizonte extendido y
es una extension de los bien conocidos controladores por asignacion de polos.
El Control Predictivo Generalizado tiene muchas ideas en comun con otros con-
troladores predictivos, ya que esta basado en las mismas ideas pero posee a su vez
algunas diferencias. Como se vera mas adelante, es capaz de proporcionar una
solucion explcita (en ausencia de restricciones), puede trabajar con procesos ines-
tables o de fase no mnima e incorpora el concepto de horizonte de control as como
86 Control predictivo generalizado

la consideracion en la funcion de coste de ponderacion de los incrementos en las ac-


ciones de control. Las diversas posibilidades disponibles para el gpc conducen a una
gran variedad de objetivos de control comparado con otras realizaciones, algunas de
las cuales pueden ser consideradas como subconjuntos o casos lmites del gpc.

5.6.1 Formulacion del control predictivo generalizado


La mayora de los procesos de una sola entrada y una sola salida (single-input single-
output, siso), al ser considerados en torno a un determinado punto de trabajo y tras
ser linealizados, pueden ser descritos de la siguiente forma:
A(z 1 )y(t) = z d B (z 1 )u(t 1) + C (z 1 )e(t)
donde u(t) y y(t) son respectivamente la se~nal de control y la salida del proceso y
e(t) es un ruido blanco de media cero. A, B y C son los siguientes polinomios en el
operador de desplazamiento hacia atras z 1 :
A(z 1 ) = 1 + a1 z 1 + a2 z 2 + ::: + ana z na
B (z 1 ) = b0 + b1 z 1 + b2 z 2 + ::: + bnb z nb
C (z 1 ) = 1 + c1z 1 + a2z 2 + ::: + cncz nc
donde d es el tiempo muerto del sistema.
Este modelo es conocido como Autorregresivo de Media Movil (Controller Auto-
Regressive Moving-Average carma). En muchas aplicaciones industriales en las
que las perturbaciones son no-estacionarias resulta mas conveniente (Clarke 1987a),
el uso de un modelo carma integrado, dando lugar al carima, que viene descrito
por:
A(z 1 )y(t) = B (z 1 )z d u(t 1) + C (z 1 ) e(t) 4 con 4 = 1 z 1 (5:24)

Por simplicidad, a partir de ahora el polinomio C se va a tomar igual a 1. Notese


que en el caso de que C pueda ser truncado se puede absorber en A y B . El caso
general de ruido coloreado (C distinto de 1), es tratado mas adelante.
El algoritmo del Control Predictivo Generalizado consiste en aplicar una secuen-
cia de se~nales de control que minimice una funcion de coste de la forma:
X
N2 X
Nu
J (N1 ; N2; Nu) = E f (j )[^y(t+j j t) w(t+j )] + (j )[4u(t+j
2 1)]2g (5:25)
j =N1 j =1
Reguladores autoajustables (STR) 87

donde E f.g es la esperanza matematica e y^(t + j j t) es la prediccion optima j pasos


hacia delante de la salida del proceso con datos conocidos hasta el instante t, N1
y N2 son los horizontes mnimo y maximo de coste, Nu es el horizonte de control
y (j ) y (j ) son las secuencias de ponderacion mientras que w(t + j ) es la futura
trayectoria de referencia, que se puede calcular segun se muestra en la gura 5.4.
En (Clarke 1987a) se considera (j ) igual a 1 y (j ) constante.

r(t+k)

w1(t+k)
w2 (t+k)

y(t)

t
Figura 5.4: Trajectoria de referencia
El objetivo es pues el calculo de la futura secuencia de control u(t), u(t +1),... de
tal manera que la salida futura del proceso y(t + j ) permanezca proxima a w(t + j ).
Esto se logra minimizando J (N1 ; N2; Nu).
Con la intencion de minimizar la funcion de coste, se obtendra previamente la
prediccion optima de y(t + j ) para j  N1 y j  N2. Considerese la siguiente
ecuacion diofantica:
1 = Ej (z 1 ) 4 A + z j Fj (z 1 ) (5.26)
1 = Ej (z 1 )A~ + z j Fj (z 1 )

Los polinomios Ej and Fj estan unicamente de nidos con grados j 1 y na


respectivamente. Se pueden obtener dividiendo 1 entre A~(z 1 ) hasta que el resto
88 Control predictivo generalizado

pueda ser factorizado como z j Fj (z 1 ) . El cociente de la division es entonces el


polinomio Ej (z 1 ).
Si se multiplica la ecuacion (5.24) por Ej (z 1 ) zj 4
A~(z 1 )Ej (z 1 )y(t + j ) = Ej (z 1 )B (z 1 ) 4 u(t + j d 1) + Ej (z 1 )e(t + j()5.27)

Teniendo en cuenta (5.26), la ecuacion (5.27) queda:


(1 z j Fj (z 1 ))y(t + j ) = Ej (z 1 )B (z 1 ) 4 u(t + j d 1) + Ej (z 1 )e(t + j )

La cual puede ser escrita como


y(t + j ) = Fj (z 1 )y(t) + Ej (z 1 )B (z 1 ) 4 u(t + j d 1) + Ej (z 1 )e(t + j ) (5:28)

Al ser el grado del polinomio Ej (z 1 ) igual a j 1 los terminos del ruido en la


ecuacion (5.28) estan todos en el futuro. La mejor prediccion de y(t + j ) sera por
consiguiente:
y^(t + j j t) = Gj (z 1 ) 4 u(t + j d 1) + Fj (z 1 )y(t)
donde Gj (z 1 ) = Ej (z 1 )B (z 1 )
Resulta simple demostrar que los polinomios Ej y Fj se pueden obtener recursi-
vamente, de forma que los nuevos valores en el paso j +1 (Ej+1 y Fj+1) sean funcion
de los del paso j . La recursividad de la ecuacion diofantica ha sido demostrada en
(Clarke 1987a). A continuacion se muestra una demostracion mas simple. Existen
otras formulaciones del gpc que no estan basadas en la recursividad de esta ecuacion
(Albertos 1989).
Considerese que los polinomios Ej y Fj se han obtenido dividiendo 1 entre A~(z 1 )
hasta que el resto haya sido factorizado como z j Fj (z 1 ) .
Con:
Fj (z 1 ) = fj;0 + fj;1z 1 +    + fj;naz na
Ej (z 1 ) = ej;0 + ej;1z 1 +    + ej;j 1z (j 1)

Supongase que se utiliza el mismo procedimiento para obtener Ej+1 y Fj+1, es de-
cir, dividir 1 entre A~(z 1 ) hasta que el resto se pueda factorizar como z (j+1) Fj+1(z 1 )
con
Fj+1(z 1 ) = fj+1;0 + fj+1;1z 1 +    + fj+1;naz na
Reguladores autoajustables (STR) 89

Esta claro que solamente es necesario dar un paso mas en la division para obtener
los polinomios Ej+1 y Fj+1. Donde Ej+1 vendra dado por:
Ej+1(z 1 ) = Ej (z 1 ) + ej+1;j z j con ej+1;j = fj;0

Los coe cientes del polinomio Fj+1 se pueden expresar como:


fj+1;i = fj;i+1 fj;0 a~i+1 i = 0    na 1

El polinomio Gj+1 puede ser obtenido recursivamente como sigue:


Gj+1 = Ej+1B = (Ej + fj;0z j )B = Gj + fj;0z j B

Es decir, los primeros j coe cientes de Gj+1 seran identicos a los de Gj mientras
que el resto viene dado por:
gj+1;j+i = gj;j+i + fj;0 bi para i = 0    nb

Para resolver el gpc es necesario obtener el conjunto de se~nales de control u(t),


u(t + 1), ...,u(t + N ) que minimizan la ecuacion (5.25). Al tener el proceso un
retardo de d perodos de muestreo, la salida solo se vera in uenciada por la se~nal
u(t) despues del instante d + 1. Los valores N1 , N2 y Nu que marcan los horizontes
pueden ser de nidos como N1 = d + 1, N2 = d + N y Nu = N . No tiene sentido
hacer N1 < d + 1 ya que los terminos de (5.25) solo dependeran de las se~nales de
control pasadas. Por otro lado, haciendo N1 > d + 1 los primeros puntos de la
secuencia de salida, que seran los mejor estimados, no se tendran en cuenta.
El conjunto de las j predicciones optimas:
y^(t + d + 1 j t) = Gd+1 4 u(t) + Fd+1y(t)
y^(t + d + 2 j t) = Gd+2 4 u(t + 1) + Fd+2 y(t)
...
y^(t + d + N j t) = Gd+N 4 u(t + N 1) + Fd+N y(t)

puede ser escrito en forma matricial como:


y = Gu + F(z 1 )y(t) + G0 (z 1 ) 4 u(t 1) (5:29)
90 Control predictivo generalizado

Donde
2 y^(t + d + 1 j t) 3 2 4 u(t) 3
66 y^(t + d + 2 j t) 77 66 4u(t + 1) 77
y = 66 ... 7
75 u = 66 ... 77
4 4 5
y^(t + d + N j t) 4u(t + N 1)
2 g 0 ::: 0
3
0
66 g1 g0 ::: 0 77
G = 66 .. ... ... ... 775
4 .
g g ::: g
2 N 1 N 2 z(G0 (z 1 ) g ) 3
d+1 0
66 z2 (Gd+2 (z 1 ) g0 g1 z 1 ) 77
G0(z 1 ) = 6 6 ... 77
4 5
z (G (z ) g0 g1z
N 1 1    gN 1z ( N 1) )
2 F (dz+N1 ) 3
66 Fdd+1 (z 1 ) 777
F(z 1 ) = 66 +2.. 75
4 .
Fd+N (z 1 )

Al depender los ultimos terminos de la ecuacion (5.29) solo del pasado, pueden
agruparse en f, dando lugar a:
y = Gu + f (5:30)
Entonces la ecuacion (5.25) puede escribirse como:
J = (Gu + f w)T (Gu + f w) + uT u (5:31)
donde:
h i
w = w(t + d + 1) w(t + d + 2)    w(t + d + N ) T (5.32)

La ecuacion (5.31) se puede poner como:


J = 12 uT Hu + bu + f0 (5:33)

donde:
H = 2(GT G + I)
b = 2(f w)T G
f0 = (f w)T (f w)
Reguladores autoajustables (STR) 91

El mnimo de J , siempre que no existan restricciones en la se~nal de control, puede


ser calculado igualando a cero el gradiente de J , lo cual conduce a:
u = H 1bT (5:34)
Debido al uso de la estrategia deslizante, solo el primer elemento del vector u es apli-
cado realmente, repitiendo de nuevo el mismo procedimiento al siguiente instante
de muestreo. La solucion propuesta involucra la inversion (o al menos la triangu-
larizacion) de una matriz de dimension N  N , lo cual conlleva una gran carga de
calculo. El concepto ya usado en otros metodos de horizonte de control es empleado
en (Clarke 1987a) con la nalidad de reducir la cantidad de calculo, asumiendo que
las se~nales de control permaneceran en un valor constante a partir del intervalo
Nu < N . Por tanto la dimension de la matriz que hay que invertir queda reducida
a Nu  Nu, quedando la carga de calculo reducida (en el caso lmite de Nu = 1, se
reduce al caso escalar, como en el epsac, (De Keyser 1985) aunque restringiendo la
optimalidad.
Para aumentar la rapidez del algoritmo, fundamental sobre todo en el caso adap-
tativo, en Camacho y Bordons (1994,1995), se presenta un metodo desarrollado para
la gran mayora de procesos industriales y con una carga de calculo mnima. Tambien
existen realizaciones usando redes neuronales de Hop eld para obtener algoritmos
rapidos (Quero 1990).

5.6.2 Consideracion de ruidos coloreados


Cuando el polinomio del ruido C (z 1) de la ecuacion (5.24) no es igual a 1 la
prediccion cambia ligeramente. Para calcular el predictor en esta situacion se debe
resolver la siguiente ecuacion diofantica:
C (z 1 ) = Ej (z 1 )A~(z 1 ) + z j Fj (z 1 ) (5:35)
con (Ej (z 1 )) = j 1 y (Fj (z 1 )) = (A~(z 1 )) 1, siendo () el grado del
polinomio.
Multiplicando la ecuacion (5.24) por 4Ej (z 1 ) y usando (5.35)
C (z 1 )(y(t + j ) Ej (z 1 )e(t + j )) = Ej (z 1 )B (z 1 ) 4 u(t + j 1) + Fj (z 1 )y(t)

Como los terminos de ruido estan todos en el futuro, el valor esperado para el
termino de la izquierda de la ecuacion anterior es:
92 Controladores para plantas con parametros desconocidos

E [C (z 1 )(y(t + j ) Ej (z 1 )e(t + j ))] = C (z 1 )^y(t + j jt)

El valor esperado de la salida puede ser generado por la ecuacion:


C (z 1 )^y(t + j jt) = Ej (z 1 )B (z 1 ) 4 u(t + j 1) + Fj (z 1 )y(t) (5:36)

Notese que esta ecuacion de prediccion podra ser usada para generar las predic-
ciones de forma recursiva. Se puede obtener una expresion explcita para la prediccion
optima de j pasos resolviendo la siguiente ecuacion diofantica:

1 = C (z 1 )Mj (z 1 ) + z j Nj (z 1 ) (5:37)
con (Mj (z 1 )) = j 1 y (Nj (z 1 )) = (C (z 1 )) 1.
Multiplicando la ecuacion (5.36) por Mj (z 1 ) y usando (5.37),
y^(t + j jt) = Mj Ej (z 1 )B (z 1 ) 4 u(t + j 1) + Mj (z 1 )Fj (z 1 )y( t) + Nj (z 1 )y(t)
que se puede expresar como:
y^(t+j jt) = G(z 1 )4u(t+j 1)+Gp(z 1 )4u(t+j 1)+(Mj (z 1 )Fj (z 1 )+Nj (z 1 ))y(t)
con (G(z 1 )) < j . Estas predicciones se pueden usar en la funcion de coste que se
minimiza de la misma forma que el caso de ruido blanco.

5.7 Controladores para plantas con parametros


desconocidos
En los apartados anteriores se han dise~nado reguladores y controladores para plantas
cuyos parametros se han supuesto conocidos. En este punto reemplazaremos esta
hipotesis por otra en que se supone que los parametros son desconocidos y constantes.
No obstante, como han demostrado experimentalmente algunos autores (Astrom
1973, Clarke et. al. 1979, Wellstead et al. 1979), estas tecnicas pueden ser aplicadas
cuando los parametros varan lentamente o bien bruscamente, pero sus valores se
mantienen constantes durante largos periodos de tiempo.
Reguladores autoajustables (STR) 93

Como se ha comentado anteriormente, la idea en que se basan los reguladores


autoajustables (STR), reside en la aplicacion del principio de equivalencia cierta.
Ello implica el utilizar un algoritmo de identi cacion de parametros, y calcular los
parametros del regulador en base a suponer que los parametros estimados coinciden
con los reales.

5.8 Algoritmos con estructura explcita e impl-


cita
Dentro de los controladores autoajustables, que aplican el principio de equivalencia
cierta, para realizar el mecanismo de adaptacion, existen basicamente dos tipos de
algoritmos, unos que identi can directamente los parametros de la planta (algoritmo
con identi cacion explcita), gura 5.1, y otros que mediante una reescritura del
modelo de la planta, simpli can los pasos, estimandose en este caso directamente
los parametros del controlador (algoritmo con identi cacion implcita), gura 5.5.

Identi cacion 
Actuacion
Deseada
- modelo
reparametrizado 
BB
 s s
-

6
- Controlador
Ajustable
- Planta -
BBN

Figura 5.5: Algoritmo con identi cacion implcita

Algoritmo con identi cacion explcita


1. Estimar los parametros del modelo 5.20 mediante un algoritmo de identi -
cacion de parametros, como el propuesto en el captulo 3.
94 Algoritmos con estructura explcita e implcita

2. Calcular los parametros del controlador, segun se ha visto en los apartados


anteriores, necesitandose en muchos casos resolver una ecuacion polinomial.
3. Calcular la se~nal de control con los parametros del controlador.
4. Repetir los pasos 1, 2 y 3 en cada periodo de muestreo.

Mediante este algoritmo se puede realizar un paquete de programas de control, donde


el paso 1 de identi cacion sera comun para todos los controladores, cambiando cada
uno de estos bajo demanda del usuario, segun el tipo de proceso a controlar.

Algoritmo con identi cacion implcita


1. Estimar los parametros del modelo reparametrizado mediante un algoritmo de
identi cacion de parametros.
2. Calcular la se~nal de control con los parametros del controlador.
3. Repetir los pasos 1 y 2 en cada periodo de muestreo.

La realizacion de este algoritmo no siempre es posible, ya que para el paso 1, se nece-


sita en cada caso particular reformular el modelo para que aparezcan directamente
los parametros del controlador.
Se ilustran estos dos tipos de algoritmos, para el caso de dise~no del controlador
con el criterio de asignacion de polos, poniendose de mani esto, que en el caso de la
identi cacion implcita, la reescritura del modelo conduce a un modelo bilineal en
los parametros que entra~na una mayor di cultad para su identi cacion. Tambien se
hace notar que la reescritura del modelo no siempre es posible y hay que realizarla
para cada caso en particular.

Algoritmo con identi cacion explcita


Dados: Rm, Ao, Pm, d

1. Estimar A y B en el modelo,
y (k ) = B d
A z u(k)
Reguladores autoajustables (STR) 95

2. Factorizar el polinomio B = B + B
3. Resolver la ecuacion siguiente para M1 y G,
AM1 + B Gz d = Ao Pm (5:38)
que corresponde a un sistema de ecuaciones lineales.
4. Calcular la se~nal de control mediante,
(
1 S = Ao Rm1
u(k) = M (Sw(k) Gy(k)) M = M1 B +
5. Ir al paso 1.

Algoritmo con identi cacion implcita


La ecuacion 5.38 puede reescribirse de la siguiente forma:

AM1 y(k) + B Gz d y(k) = AoPm y(k)


como por otro lado Ay(k) = Bz d u(k), lleva a,

M1 Bz d u(k) + B Gz d y(k) = AoPmy(k)


teniendo en cuenta que M = M1 B + y B = B +B , resulta:

AoPm y(k) = B z d [Mu(k) + Gy(k)]


Esta ecuacion puede verse como el modelo de un proceso, en el que los polinomios
del controlador M y G aparecen directamente. Teniendo en cuenta esto, puede
escribirse el algoritmo de control adaptativo con identi cacion implcita siguiente:
Dados: Rm1 , Ao, Pm, d

1. Estimar M , G y B en el modelo,
AoPm y(k) = B z d [Mu(k) + Gy(k)]
96 Propiedad de autosintona

2. Calcular la se~nal de control mediante,


u(k) = M1 (Sw(k) Gy(k)) S = AoRm1
3. Ir al paso 1.

Hay que hacer notar que el modelo a identi car en este caso es bilineal en los
parametros, por lo que la identi cacion no es trivial. Para el caso en que B = 1, o
sea que tengamos un sistema de fase mnima que tiene todos sus ceros estables, el
algoritmo se reduce notablemente, ya que la identi cacion del modelo resultante no
presenta ningun problema.

Ventajas e inconvenientes de uno y otro algoritmo


En el caso de la identi cacion explcita se necesitan mas calculos en cada paso.
Por otro lado se tienen directamente los parametros de la planta, lo que es par-
ticularmente interesante para poder realizar la supervision del control. As mismo,
como se ha mencionado anteriormente, permitir un unico algoritmo en el que puede
cambiarse el controlador en cada caso.
En el caso de la identi cacion implcita se necesitan menos calculos en cada paso,
pero la identi cacion es en general mas complicada. Se necesita reescribir el modelo
en cada caso particular, y ello no siempre es posible.

5.9 Propiedad de autosintona


Se ilustra aqu, la propiedad de autosintona de los controladores autoajustables
para el caso del regulador de mnima varianza. Este regulador que se estudio en un
apartado anterior, tiene como resultado que :
u(k) = zB (zG(1z)F ()z 1 ) y(k)
1

utilizandose la identidad :

C (z 1 ) = A(z 1 )F (z 1 ) + z (d+1) G(z 1 )


Reguladores autoajustables (STR) 97

con;
F (z 1) = 1 + f1 z 1 + ::: + fd z d
G(z 1) = go + g1 z 1 + ::: + gn 1z (n 1)

As mismo vimos que el modelo del sistema puede escribirse como:

y(k + d + 1) = G (z 1 ) y(k) + zF (z 1 )B (z 1 ) u(k) + F (z 1 )v(k + d + 1)


C (z 1 ) C (z 1 )

que para el caso en que C (z 1 ) = 1, o sea, no se consideran las perturbaciones, el


algoritmo de identi cacion se reduce notablemente, quedando el modelo:

y(k + d + 1) = A0 (z 1 )y(k) + B 0(z 1 )u(k) + v(k + d + 1)

donde A0 (z 1 ) es de orden n 1 y B 0(z 1 ) de orden n + d 1. Este ultimo modelo


puede utilizarse para estimar los parametros de A0 y B 0 por mnimos cuadrados y
de esta forma la ley de control de mnima varianza resulta simplemente:

A0(z 1 ) y(k)
u(k) = B 0 (z 1 )
donde
A0 (z 1 ) = a0o + a01 z 1 + ::: + a0n 1 z (n 1)
B 0 (z 1 ) = b0o + b01 z 1 + ::: + b0n+d 1 z (n+d 1)

que coincidira con el regulador calculado para el caso del conocimiento exacto de
los parametros de la planta.
Para el caso en que C (z 1 ) 6= 1, cabe esperar que los parametros sufran desvia-
ciones, sin embargo, como veremos a continuacion, el regulador converge al regulador
calculado con parametros conocidos.
Si utilizamos el regulador:
A0 y(k)
u(k) = B 0
98 Procedimiento de sntesis

Al sustituir dicho regulador en el modelo de la planta y operando se obtiene la


funcion de transferencia en bucle cerrado de la forma:
CB 0
y(k) = AB 0 + BA0 z d v(k)

As mismo, como el control es de mnima varianza, esta funcion debe ser de la
forma:
y(k) = F (z 1)v(k)

Luego igualando las dos expresiones anteriores y reordenando la ecuacion resul-


tante se obtiene, 0
d
C = AF + z B 0 FBA

que comparando con la identidad:

C = AF + z (d+1) G

se obtiene la expresion del regulador obtenida anteriormente (5.23),

A0 = G
B 0 zBF
Cuando utilizamos la propiedad de autosintona podemos utilizar un algoritmo
de identi cacion de mnimos cuadrados, mucho mas simple que el que sera necesario
para identi car los polinomios A,B y C del modelo original, y el regulador que se
obtiene converge al optimo.

5.10 Procedimiento de sntesis


A continuacion se dan resumidos los pasos del procedimiento a seguir para el calculo
del control, en el que se suponen conocidos los grados de los polinomios A, B y C ,
as como el retardo (d) del sistema.

 1er paso :
Reguladores autoajustables (STR) 99

Identi car usando mnimos cuadrados el siguiente modelo:


y(k) = A0(z 1 )z (d+1) y(k) + B 0(z 1 )z (d+1) u(k) + e(k)
donde A0 y B 0 estan de nidos por:
A0 (z 1 ) = a0o + a01 z 1 + ::: + a0n 1 z (n 1)
B 0 (z 1 ) = b0o + b01 z 1 + ::: + b0n+d 1 z (n+d 1)
e(k) es el residuo de la identi cacion y b0o se ja de antemano por condiciones
de identi cabilidad.
 2o paso :
Calcular la se~nal de control por la expresion,
u(k) = B A0 (z 1 ) y(k)
0 (z 1 )

Los pasos descritos anteriormente son efectuados en cada periodo de muestreo, cons-
tituyendo un procedimiento de sntesis de los controladores autoajustables.

5.11 Ejemplos ilustrativos


5.11.1 Ejemplo de mnima varianza
Dado el sistema,
y(k) + ay(k 1) = bu(k 1) + e(k) + ce(k 1)
donde a = 0:5, b = 3 y c = 0:7. El regulador de mnima varianza para este sistema
es:
u(k) = a b c y(k) = 0:4y(k)

Un regulador con esta estructura puede obtenerse empleando un algoritmo de


control adaptativo autoajustable, como el descrito en las secciones precedentes,
basado en el modelo:
y(k) + y(k 1) = u(k 1) + "(k 1)

La gura 5.6 muestra la evolucion del parametro cuando = 1. Puede verse


como este converge al valor de 0:4.
100 Ejemplos ilustrativos

-0.1

-0.2

-0.3

-0.4
parametro

-0.5

-0.6

-0.7

-0.8

-0.9

-1
0 50 100 150 200 250 300 350 400

tiempo

Figura 5.6: Parametro estimado

5.11.2 Control adaptativo PI


Vamos a ver un ejemplo de control adaptativo suponiendo que el sistema se modela
como un sistema de primer orden y el regulador que se va a emplear es un PI. A
partir de las entradas y salidas (u e y), se identi caran los parametros del modelo y
mediante un metodo de dise~no se actualizaran los parametros del regulador PI.
En un primer paso se utilizara como metodo de dise~no la regla de Ziegler-Nichols.
Dicha regla se basa en los parametros de la respuesta a un escalon de un sistema de
primer orden con retardo,
G(s) = 1 +Ks e d s (5:39)

Si se elige un tiempo de muestreo (Tm ) tal que d = Tm d, el equivalente discreto


viene dado por,
G(z 1 ) = 1 bzaz 1 z d
1
(5:40)
Reguladores autoajustables (STR) 101

siendo la correspondencia entre ambas representaciones,


a = e Tm = ;  = lnTma ; K = 1 b a

Luego con este sistema de control adaptativo, en primer lugar se estiman los
parametros a y b, a partir de estos se calculan  y K , y aplicando las reglas de
Ziegler-Nichols, se obtendrian los parametros del regulador PI. Como dichas reglas
son para el sistema continuo, la realizacion practica, conllevara la discretizacion del
regulador PI.
Veamos otro metodo de dise~no: el basado en la tecnica de asignacion de polos.
En este caso, al igual que en el anterior, se identi cara el sistema dado por 5.40
y suponiendo que estos parametros son los correctos se dise~nara un regulador PI
discreto, el cual viene dado por:
GR(z 1 ) = q01+ qz1 z1
1
(5:41)

Para el caso en que d = 0, la funcion de transferencia total del conjunto regulador


y planta en bucle cerrado viene dada por:

GT (z) = (z a)(zbq0 (1)


z + q1 =q0)
+ bq0 (z + q1 =q0)
(5:42)

Sistema de segundo orden, donde se pueden jar los dos polos (con q0 y q1 ),
aunque no se puede jar el cero.
Una forma de asignar los polos, puede ser cancelando el polo en a (puede hacerse
si el sistema es estable), con q1 =q0 = a. De esta forma solo habra que jar un
polo. La funcion de transferencia total quedara:

GT (z) = (z bq0
1) + bq0
(5:43)

Luego si el polo deseado es p quedaran como ecuaciones del regulador adaptativo:

q0 = 1 ^ p q1 = q0 a^ (5:44)
b
102 Ejemplos ilustrativos

A la vista de estas ecuaciones esta claro, que cuanto mayor se elija p mayor sera
el esfuerzo de control (u). Luego no puede ponerse el polo todo lo cerca del cero
que se quiera. Puede elegirse, por ejemplo como p = 0:9  a, con lo que estamos
especi cando que la respuesta del sistema controlado sea mas rapida que la del
sistema original.
Puede observarse que las ecuaciones del controlador adaptativo que se obtiene
en este caso son muy simples, as como los parametros a identi car que seran a^, ^b y
un termino para evitar las componentes de continua. La ecuacion del sistema para
identi car sera:
yk = ayk 1 + buk 1 + Constante (5:45)

5.11.3 Control de robot movil


Con este ejemplo se pretende estudiar el comportamiento de un controlador adap-
tativo aplicado al seguimiento de trayectorias de un robot movil. Como se vera,
el problema presenta algunas caractersticas que lo hacen adecuado para el control
adaptativo y los resultados que se obtienen parecen corroborar esta adecuacion.

Modelo del Sistema


Supongase un robot movil (vehculo) y un sistema de referencia asociado a el (ver
gura 5.7). El robot se desplaza a lo largo del eje vertical de este sistema.
Se tiene como referencia un punto objetivo que se desea alcanzar y que se supone
esta sobre la trayectoria que debe seguir el robot. Conforme el robot se desplaza a
lo largo del eje OY, debe anularse el error a lo largo del eje OX, desde la posicion
original hasta el objetivo. El desplazamiento a lo largo del eje OX se controla gracias
a las maniobras sobre la rueda de direccion del robot, que de niran la curvatura del
arco que describira en su desplazamiento.
El sistema que se desea analizar y controlar es el de la evolucion de la mencionada
distancia horizontal hasta el punto objetivo, usando como se~nal accionadora la cur-
vatura comandada por la direccion del vehculo.
La relacion basica entre arco y angulo establece que,
dS = r d ) d = dS
Reguladores autoajustables (STR) 103

OY

objetivo

ds
dy’
r


OX

dx’
vehiculo
centro giro r

Figura 5.7: Esquema de robot movil y trayectoria objetivo


donde es la curvatura ( = 1=r).
Observando la gura anterior, se pueden deducir las siguientes relaciones:
dx0 = r (1 cos d)
dy0 = r send

Como ya se ha indicado, se ha considerado un sistema de referencia ligado al


movil. Pasando a un sistema de referencia absoluto, respecto al cual, el sistema
local forma un angulo , se tiene,
dx = cos  dx0 sen dy0
dy = sen dx0 + cos  dy0

Si se hace la suposicion de que d es su cientemente peque~no:


send ! d; cos d ! 1;

De forma que,
dx0 = 0; dy0 = r d = dS ;
104 Ejemplos ilustrativos

Y, por tanto:
dx = sen dS ; dy = cos  dS ;

Introduciendo la velocidad en las ecuaciones:


dx = V sen
dt
dy = V cos 
dt
El sistema de interes es el que involucra el desplazamiento horizontal en funcion
de la curvatura.
dx = V sen
dt
d = V
dt
Por otro lado, se asume que la curvatura real del robot se obtiene a partir de
la curvatura comandada (a la que llamaremos se~nal de control u) a traves de una
cierta dinamica que se puede expresar como:
d = 1 (u )
dt 
Resumiendo, el sistema dinamico que se debera controlar es:
dx = V sen
dt
d = V (5.46)
dt
d = 1 (u )
dt 

Donde la se~nal de control es u(t) y la se~nal de salida es x(t).


Este sistema puede linealizarse tomando el sistema de referencia absoluto tal
que la orientacion del vehculo en todo instante () sea peque~na. Haciendo la
aproximacion del peque~no angulo, se obtiene el siguiente sistema linealizado:
dx = V 
dt
Reguladores autoajustables (STR) 105
d = V (5.47)
dt
d = 1 (u )
dt 

Algoritmo de control
El sistema descrito resulta adecuado para el control adaptativo debido principal-
mente a dos motivos. En primer lugar, se trata de un sistema no lineal, por lo que el
control adaptativo posibilitara la obtencion de aproximaciones lineales apropiadas
para cada punto de trabajo y por otro lado el sistema es variable en el tiempo.
Ademas en el caso de que se pudiera linealizar mediante la mencionada aproxi-
macion del peque~no angulo, se tratara de un sistema lineal variable, puesto que la
velocidad (V ) que aparece en las expresiones no permanece constante a lo largo del
desplazamiento del robot.
La tecnica de control que se va aplicar es Control Adaptativo Autoajustable me-
diante Asignacion de Polos.
El ciclo de control consta de tres pasos fundamentales:

1. Identi cacion de un sistema lineal aproximado al sistema real en el punto de


trabajo actual.
2. Calculo del regulador apropiado para el sistema identi cado.
3. Obtencion y aplicacion de la se~nal de control producida por el regulador, a
partir del error entre la referencia y la salida del sistema.

La identi cacion se realizara por Mnimos Cuadrados Recursivos, considerando


un modelo de tercer orden de la forma:
G(z 1 ) = YU ((zz 1 )) = 1 +b1az z +1 +b2az z +2 +b3 za z 3
1 1 2 3
1 2 3

Como se ha descrito en el captulo 3 el algoritmo basico de identi cacion, suele


ser insu ente en las aplicaciones practicas por lo que hay que incluir una serie de
mejoras. Po ello se ha incluido un factor de olvido variable, en el rango entre 0.96
y 1. Al mismo tiempo se ha incluido acotacion inferior y superior de la matriz
106 Ejemplos ilustrativos

de covarianza. Para acotar inferiormente esta matriz se le suma una matriz R1


constante y para acotarla superiormente se ha impuesto una cota superior a la traza
de dicha matriz.
En cada ciclo del algoritmo de control, se redise~na el controlador. Se ha optado
por dise~nar el controlador usando asignacion de polos y forzando a que el sistema
completo resultante en bucle cerrado posea error estacionario nulo. En la gura 5.8
se puede observar la disposicion de este controlador.

r e 1 u B
T x
S A

Figura 5.8: Estructura del controlador


En el metodo de asignacion de polos se pretende que el sistema en bucle cerrado,
incluyendo al controlador, posea una dinamica especi cada. Para ello se exige que
la funcion de transferencia posea un denominador igual a un polinomio deseado
P (z 1 ). La funcion de transferencia del bucle cerrado de la gura 5.8 es:

GBC (z 1 ) = A(z 1 ) ST(z(z 1) )+BB(z(z )1 ) R(z 1 )


1 1

y se desea que tenga la forma: P (1) B (z 1 )


GBCd(z 1 ) = B (1) P (z 1 )

En este caso el sistema resultante no incluye ceros adicionales a los de la planta


(como ocurre en otras variantes del metodo de asignacion de polos), y tampoco se
intenta cancelar ninguno de los ceros del sistema original (esto signi ca que el metodo
sera aplicable con independencia de que el sistema original posea ceros inestables).
Por ultimo, se exige que el sistema tenga ganancia estatica unitaria.
Los polinomios R(z 1 ); S (z 1 ) se obtienen resolviendo la ecuacion polinomica:
A(z 1 ) S (z 1 ) + B (z 1 ) R(z 1 ) = P (z 1)
Reguladores autoajustables (STR) 107

Ademas, como ya se ha indicado, se desea un integrador en el paso directo para


garantizar que el error estacionario sea cero. Para ello, se exige que S (z 1) sea de
la forma:
S (z 1 ) = (1 z 1 ) S 0 (z 1 ) (5:48)

T (z 1 ) debe cumplir:
P (1) = A(1) S (1) + B (1) R(1)
T (1) = B (1) B (1)

Aplicando (5.48), resulta que S (1) = 0, con lo cual, T (1) = R(1).


Para especi car el polinomio deseado P (z 1 ) se ha optado por indicar directa-
mente los polos deseados y asignarlos en funcion de los del sistema original. En
primer lugar, se ha realizado la identi cacion del sistema dinamico del robot movil,
resultando que los polos son:
p0 = 1:0012 + 0:0233i; p1 = 1:0012 0:0233i; p2 = 0:8163
Los polos deseados se especi can en:
p0 = 0:8 + 0:0233i; p1 = 0:8 0:0233i; p2 = 0:8163

Con estos valores se consiguen unos buenos margenes de estabilidad, que se


estiman en:
M  39:27 grados
MG  6:98 dB

Se ha supuesto que en el sistema existe una saturacion debida al actuador y/o


convertidores, por lo que esta debe tenerse en cuenta en el controlador. Es decir,
que a la se~nal uk obtenida a partir del regulador se le aplica: uk = satura(uk ). De
esta forma, el regulador usara los valores exactos que se aplicaron al sistema. En la
gura 5.9 se expone el esquema completo del sistema de control implementado.

Simulaciones Realizadas
Los parametros del modelo utilizado han sido:
108 Ejemplos ilustrativos

Actuacion Diseño B
Deseada Identificador
P Controlador A

r rAux e 1 u x
T Planta
S

1
1
xAux R

Figura 5.9: Bucle de control completo

 Periodo de muestreo: h = 0:3 s


 Velocidad inicial: V = 1:2 m=s. En el caso de las simulaciones que se hagan
con velocidad constante, este sera el valor que tenga la velocidad durante toda
la simulacion.
 Constante de tiempo del control de la curvatura:  = 5 h
 Saturacion de la se~nal de control: usat = 10

En la mayora de los casos, se ha utilizado como entrada de referencia una


sucesion de pulsos positivos o negativos, de amplitud y anchura aleatorias dentro de
unos rangos. Como estimacion inicial del sistema, se usa una identi cacion hecha
previamente para el sistema linealizado.
En la gura 5.10 se muestra el resultado para el caso de usar un controlador
jo, considerando que el sistema es lineal pero variable. La velocidad se vara en
escalones de amplitud 0.1. Se puede observar que cuando la velocidad se distancia
signi cativamente de la inicial, no se consigue un control aceptable.
Reguladores autoajustables (STR) 109

5
Referencia
4 Salida
Velocidad

−1

−2

−3

−4

−5
0 100 200 300 400 500 600 700 800 900 1000

Figura 5.10: Sistema lineal variable con controlador jo


En la gura 5.11 se muestra el resultado para el caso de control adaptativo con el
algoritmo de identi cacion completo comentado previamente. Puede observarse que
el comportamiento del sistema es bastante bueno. A ttulo ilustrativo, se muestra
en la gura 5.12 la evolucion de los coe cientes del numerador de la funcion de
transferencia identi cada.
Para forzar mas la variacion del sistema, se sometio a la velocidad a un creci-
miento continuo en forma de rampa de pendiente 0.01. En la gura 5.13, se puede
observar el resultado con el regulador adaptativo.
Por ultimo se comprueba el comportamiento del controlador frente a la presencia
tanto de la no-linealidad como de la variacion de la velocidad. En la gura 5.14,
se muestra la respuesta del sistema variando la velocidad, como ya se hizo anterior-
mente en forma de rampa con pendiente 0.01. Puede apreciarse que, el considerar
ambas caractersticas, no afecta signi cativamente al comportamiento del sistema.
En este caso la referencia son escalones con un ltro de primer orden para suavizar
la se~nal de referencia, ello tiene como consecuencia que el punto de trabajo cambie
mas suavemente.
110 Ejemplos ilustrativos

10
Referencia
Salida
Velocidad

−5
0 100 200 300 400 500 600 700 800 900 1000

Figura 5.11: Sistema lineal variable con control adaptativo

b1
0.3 b2
b3
0.25

0.2

0.15

0.1

0.05

−0.05

−0.1

−0.15

−0.2
0 100 200 300 400 500 600 700 800 900 1000

Figura 5.12: Evolucion de algunos de los parametros identi cados


Reguladores autoajustables (STR) 111

12
Referencia
Salida
10
Velocidad

−2

−4

0 100 200 300 400 500 600 700 800 900 1000

Figura 5.13: Sistema lineal variable con control adaptativo

10
Referencia
8 Salida
Velocidad

−2

−4

−6

−8

−10
0 100 200 300 400 500 600 700 800 900 1000

Figura 5.14: Sistema no lineal variable.


112 Ejemplos ilustrativos
Captulo 6
Autoajuste y ajuste por tabla de
controladores
6.1 Introduccion
Los esquemas de control adaptativos como mrac y str necesitan de informacion
a priori acerca de la dinamica del proceso. Es importante conocer las escalas de
tiempo, las cuales son crticas para determinar los intervalos de muestreo y ltros.
La importancia de la informacion a priori tambien aparecio en conexion con intentos
de desarrollar tecnicas para ajuste automatico de reguladores PID. Tales reguladores
son usados para sistemas de control con un amplio rango de constantes de tiempo.
Desde el punto de vista del usuario sera ideal disponer de una funcion mediante
la cual el regulador pudiera ser ajustado. Aunque los esquemas adaptativos con-
vencionales parecen ser herramientas ideales para el ajuste automatico, resultaron
inadecuadas porque requeran conocimiento previo de las escalas de tiempo.
Los reguladores simples (como PIDs), con dos o mas parametros pueden ser ajus-
tados manualmente si no hay demasiada interaccion entre los diferentes parametros,
pero el ajuste manual no es posible para reguladores mas complejos.
Tradicionalmente, el ajuste de tales reguladores ha tomado la via de la modeli-
zacion o identi cacion y dise~no del regulador. Esto requiere un consumo de tiempo
elevado, ademas de ser un procedimiento costoso, que solo puede ser aplicado a sis-
temas crticos en tama~no o en importancia o a sistemas que van a ser manufacturados
113
114 Introduccion

en grandes cantidades.
Algunos fabricantes estan incorporando funciones de autoajuste en sus regulado-
res, que obtienen la informacion a priori que requiere todo especialista para poder
ajustar un regulador manualmente, y con ello llegan a realizar un ajuste automatico
de los parametros del regulador.
Todas las tecnicas adaptativas pueden ser usadas para el ajuste automatico de
controladores. En tales aplicaciones, el bucle de adaptacion opera durante un tiempo
y puede conmutarse entre este y el controlador jo. Normalmente se a~naden se~nales
de perturbacion para mejorar la estimacion de los parametros. El regulador adap-
tativo esta operativo hasta que el funcionamiento es satisfactorio, entonces el bucle
de adaptacion es desconectado y el sistema se deja correr con los parametros jos
del regulador.
El autoajuste puede ser considerado como un camino conveniente para incorporar
modelado y dise~no automatico en un regulador. Simpli ca el uso del regulador y
ampla la clase de problemas en que los metodos de dise~no automatico pueden ser
usados con un coste razonable.
Como se comento en el captulo 2, otra alternativa a los sistemas de control
adaptativos son los controladores ajustables por tabla. En muchas situaciones se
sabe como cambia la dinamica de un proceso con las condiciones de operacion del
mismo. Una fuente de cambio en la dinamica pueden ser las no linealidades que se
presentan, es entonces posible cambiar los parametros del controlador observando
las condiciones de operacion del proceso.
Esta idea recibe el nombre de ajuste por tabla (en la terminologa inglesa, gain
sheduling), y consiste en una realimentacion no lineal que cambia los parametros en
funcion de las condiciones de operacion de una manera previamente programada.
La idea de relacionar los parametros del controlador a variables auxiliares no
es reciente, pero el hardware necesario para implementarlo facilmente no ha estado
disponible hasta hace poco tiempo. El ajuste por tabla es muy costoso llevarlo
a cabo con tecnicas analogicas, sin embargo es facil de implementar en sistemas
controlados por computadoras, con un software adecuado.
Esta tecnica es muy buena para compensar las variaciones de los parametros del
proceso o de no linealidades conocidas. Es controvertido si un sistema con ajuste
por tabla puede ser considerado como sistema adaptativo, porque los parametros se
cambian en bucle abierto. Es un metodo muy adecuado para manejar las variaciones
Autoajuste y ajuste por tabla de controladores 115

de parametros en sistemas de control de vuelo.


A continuacion se van a comentar algunas de las tecnicas de ajuste de contro-
ladores que pueden utilizarse para obtener aproximaciones de los procesos dinamicos.
Los metodos pueden utilizarse para ajuste automatico de reguladores del tipo PID o
como preajustes para algoritmos de control adaptativos mas so sticados. As mismo
se comentara la tecnica de ajuste por tabla y se ilustrara mediante algunos ejemplos.

6.2 Control PID


Muchos problemas de control pueden ser manejados muy bien mediante contro-
ladores PID. Este algoritmo es muy conocido y es un estandar para el control de
procesos. La version academica del algoritmo es:
Zt !
u(t) = Kc e(t) + T1 e( )d + Td de
dt (6:1)
i o

donde u es la variable de control, e el error de nido como e = r y, donde r es el


valor de referencia, e y la salida del proceso. Los algoritmos utilizados actualmente
contienen varias modi caciones. Es practica estandar dejar que la accion derivada
solo opere sobre la variable de salida. Puede ser ventajoso dejar la parte proporcional
actuar solo una fraccion del valor de referencia. La accion derivada es sustituda por
una aproximacion que reduce la ganancia en alta frecuencia. La accion integral
tambien se modi ca para que no mantenga la integracion cuando la variable de
control se sature (anti-windup). Se toman precauciones para que no se produzcan
transitorios cuando el regulador se conmuta de control manual a control automatico
o cuando los parametros se cambian. Una version razonable del regulador PID puede
ser descrita por:
u(t) = P (t) + I (t) + D(t) (6.2)
donde
P (t) = Kc(uc(t) by(t))
dI = Kc (u (t) y(t)) + 1 (v(t) u(t)) (6.3)
dt Ti c Tt
Td dD + D = K T dy
c d
N dt dt
116 Metodos de respuesta transitoria

El ultimo termino en la expresion dI=dt se introduce para mantener la integral


limitada cuando la variable de salida se satura. La variable v es una se~nal de
seguimiento, la cual es igual a la salida saturada del actuador, y el parametro Tt es
una constante de tiempo para la accion de seguimiento. Los parametros esenciales
para ser ajustados son Kc, Td y Ti. El parametro N puede ser jo; un valor tpico
es N = 10. La constante de tiempo de seguimiento es tpicamente una fraccion del
tiempo de integracion Ti.

6.3 Metodos de respuesta transitoria


Varios metodos sencillos de ajuste para controladores PID estan basados en experi-
mentos de respuesta transitoria. Muchos procesos industriales tienen una respuesta
ante entrada en escalon del tipo mostrado en la gura 6.1. En la cual, la respuesta

63.2 %

28.3 %

t1 t2

L T

Figura 6.1: Respuesta al escalon unitario de un proceso industrial tpico


escalon es monotona despues de un tiempo inicial. Un sistema con una respuesta
escalon de este tipo puede ser aproximado por la funcion de transferencia:
G(s) = 1 +kTs e sL (6:4)

donde k es la ganancia estatica, L el tiempo aparente de retraso, T la constante de


tiempo aparente y a es el punto de corte de la tangente con el eje de ordenadas.
Autoajuste y ajuste por tabla de controladores 117

Hay que hacer notar que la distancia desde el origen al corte de la prolongacion de
la recta tangente a la curva (a), cumple la relacion,

a = k TL (6:5)

6.3.1 Metodo de respuesta en escalon de Ziegler-Nichols


Una manera simple de determinar los parametros de un regulador PID basada en
los datos de respuesta en escalon fue desarrollada por Ziegler y Nichols y publicada
en 1942. El metodo usa solo dos de los parametros rese~nados anteriormente, a y L.
Los parametros del regulador se dan en la siguiente tabla.

Controlador Kc Ti Td
P 1/a
PI 0.9a 3L
PID 1.2/a 2L L/2

La regla de ajuste Ziegler-Nichols fue desarrollada a partir de simulaciones empricas


de muchos sistemas diferentes. La regla tiene el inconveniente de que se obtienen
sistemas en bucle cerrado que estan pobremente amortiguados. Sistemas con mejor
amortiguamiento pueden obtenerse por modi cacion de los valores numericos de la
tabla.
Mediante el uso de parametros adicionales es posible determinar si la regla de
Ziegler-Nichols es aplicable. Si la constante de tiempo T esta determinada, una regla
emprica es establecer que la regla de Ziegler-Nichols es aplicable si 0:1 < L=T < 1.
Para valores grandes de L=T es ventajoso usar leyes de control que compensan el
tiempo muerto. Para valores peque~nos de L=T , puede obtenerse un procedimiento
mejorado con compensadores de alto-orden. Es tambien posible usar reglas de ajuste
mas so sticadas basadas en los tres parametros.

6.3.2 Caracterizacion de la respuesta en escalon


Los parametros k, L y T pueden ser determinados a partir de una construccion
gra ca tal como la indicada en la gura 6.1. Tal metodo es difcil de automatizar.
El parametro k puede ser obtenido de la relacion de cambios estaticos de entrada
118 Metodos basados en realimentacion con rele

y salida en regimen permanente. Hay un metodo siemple, basado en mediciones de


area, para determinar L y T ( gura 6.2). Determinando el area A0 y A1 se tiene:

T + L = Ak0 (6.6)
y
T = eAk 1 (6.7)

donde e es la base del logaritmo natural. Los inconvenientes esenciales al metodo


son que puede ser difcil conocer el tama~no del escalon en la se~nal de control y
determinar si se ha alcanzado el regimen permanente. El escalon debera ser del
tama~no su ciente como para que la respuesta del sistema sufra variaciones, y no
demasiado grande como probocar perturbaciones.

k
1
||
A0 ||
||
0.5 ||
A1 ||
||
||
||
0 |
0 20 40 60 80 100 120 140 160
L+T t

Figura 6.2: Metodo del area para la determinacion de L y T


Re namiento en linea
Si se obtiene un ajuste razonable del regulador, el amortiguamiento y la frecuen-
cia natural del sistema en bucle cerrado pueden determinarse a partir de la respuesta
transitoria en bucle cerrado, pudiendose mejorar el ajuste del regulador.

6.4 Metodos basados en realimentacion con rele


Los principales inconvenientes de los metodos de respuesta transitoria es que son
sensibles a las perturbaciones, porque se basan en experimentos en bucle abierto. Los
metodos basados en reles evitan esta di cultad porque los experimentos necesarios
son ejecutados en bucle cerrado.
Autoajuste y ajuste por tabla de controladores 119

La idea basica es que muchos procesos tendran oscilaciones de ciclo lmite bajo
realimentacion con rele. Las propiedades esenciales del proceso pueden determinarse
de los parametros del ciclo lmite, y los parametros de un regulador PID pueden por
tanto calcularse. La gura 6.3 muestra un diagrama de bloque para la aplicacion de
este metodo. Cuando se requiere un ajuste, el conmutador se coloca en la posicion
T, lo cual signi ca que la realimentacion por rele es activada y el regulador PID se
desconecta. Cuando se alcanza un ciclo lmite, los parametros PID son calculados
y el controlador PID es entonces conectado al proceso. Debera usarse en primer
lugar un metodo aproximado para hacerse una idea de la informacion que puede
obtenerse de un experimento con realimentacion por rele.

- PID

r  A c u- y
-

6 T
!c !! Proceso -

- Rele

Figura 6.3: Diagrama de bloque de autoajuste por rele

6.4.1 El metodo del balance armonico


A continuacion se va a comentar un metodo aproximado llamado metodo de balance
armonico o el metodo de la funcion descriptiva. Considerando un sistema realimen-
tado simple, compuesto de una parte lineal con la funcion de transferencia G(s) y
la realimentacion con un rele ideal. El diagrama de bloques se muestra en la gura
6.4.
Se asume que r = 0. Una condicion de aproximacion para las oscilaciones puede
ser determinada como sigue: Asumiendo que hay un ciclo lmite con perodo Tu
y frecuencia wu = 2=Tu tal que la salida de rele es una onda simetrica periodica
cuadrada. Si la amplitud del rele es d, por expansion en serie de Fourier de la
salida de rele, se muestra que el primer armonico tiene la amplitud 4d=. Se asume
120 Metodos basados en realimentacion con rele

r e - u- y
-

6
Rele Proceso -

Figura 6.4: Sistema lineal con control por rele


ademas que los procesos dinamicos tienen caracter paso bajo y que la contribucion
del primer armonico domina la salida. La se~nal de error tiene entonces la amplitud:
a = 4d jG(jwu)j (6:8)
La condicion para la oscilacion es tal que:
4d 1
argG(jwu) =  y Ku = = (6:9)
a jG(jwu)j

donde Ku puede interpretarse como la ganancia equivalente del rele para transmision
de se~nales sinusoidales con amplitud a. La condicion es ademas que el sistema lineal
en la gura 6.4, tenga una curva Nyquist que intersecte el eje real negativo. La
amplitud a y la frecuencia de oscilacion wu son facilmente deducibles de la ecuacion
6.9. La frecuencia del ciclo lnmite es ademas automaticamente ajustada a la fre-
cuencia wu en la cual el proceso dinamico en bucle abierto tiene un retraso de fase de
180o. Fsicamente Ku es la ganancia que lleva el sistema al lmite de estabilidad bajo
control proporcional. Un experimento con realimentacion por rele dara ademas el
perodo y la amplitud de la funcion de transferencia en bucle abierto del proceso en
la frecuencia en la cual el retardo de fase es 180o. Hay que hacer notar tambien que
una se~nal de entrada cuyo contenido de energa esta concentrado en wu es generada
automaticamente en el experimento.
Se pueden utilizar varios re namientos o mejoras del metodo. La amplitud de
las oscilaciones del ciclo lmite pueden especi carse por introduccion de una reali-
mentacion que ajuste la amplitud del rele. Por otro lado, una histeresis en el rele
es util para hacer al sistema menos sensible al ruido. Se va a mostrar a contin-
uacion como determinar los parametros de un regulador PID. El metodo puede ser
insensible a las perturbaciones por comparacion y promediado de varios perodos de
oscilacion.
Autoajuste y ajuste por tabla de controladores 121

6.4.2 El metodo de Ziegler-Nichols en bucle cerrado


Una regla simple para escoger los parametros de los reguladores PID esta idealmente
emparejada a la determinacion de Ku y Tu por el metodo del rele. Los valores del
controlador estan dados en la tabla adjunta. Estos parametros dan un sistema
en bucle cerrado con amortiguamiento bajo. Sistemas con mejor amortiguamiento
pueden obtenerse por ligeras modi caciones de los valores de la tabla.

Controlador Kc Ti Td
P 0.5 Ku
PI 0.4 Ku 0.8 Tu
PID 0.6 Ku 0.5 Tu 0.12 Tu

Estimaciones mejoradas
A partir del experimento del rele se han obtenido solo dos parametros (Ku y
Tu). Cambiando el punto de trabajo durante el experimento es posible determinar
la ganancia estatica (k) del proceso. El producto kKu puede utilizarse para evaluar
si el ajuste del regulador PID mediante las reglas de Ziegler Nichols es adecuado.
Si 2 < kKu < 20 entonces puede utilizarse el metodo. Valores mas peque~nos
indican que se necesita una ley de control que admita compensacion del tiempo
muerto. Valores mas grandes indican que debe utilizarse un algoritmo de control
mas complejo.

6.4.3 Oscilaciones de rele


Dado que los ciclos lmites con realimentacion por rele es una idea clave de los
metodos de autoajuste por rele, es importante comprender por que un sistema lineal
oscila en estas condiciones y cuando la oscilacion es estable. Es importante tambien
tener metodos para la determinacion del perodo y la amplitud de las oscilaciones.
Considerando el sistema mostrado en la gura 6.4, e introduciendo la realizacion en
el espacio de estados de la funcion de transferencia G(s):
dx = A x + B u
dt
y = Cx (6.10)
122 Metodos basados en realimentacion con rele

El rele puede ser descrito por:


(
u= d; si e > 0 (6:11)
d; si e < 0
donde e = r - y.
A continuacion se va analizar el periodo del ciclo lmite. Para ello asumiendo
que el sistema de nido en la gura 6.4 y las ecuaciones 6.10 y 6.11 tiene un ciclo
lmite simetrico con perodo T . El perodo T es entonces el valor mas peque~no de
T > 0 que satisface la ecuacion,
C (I + ) 1 = 0 (6:12)
donde
 = eAT=2

y Z T=2
= eAsds B
0

Hay que hacer notar que la condicion de la ecuacion 6.12 puede escribirse tambien
como,
HT=2( 1) = 0 (6:13)

donde HT=2(z) es la funcion de transferencia impulsional obtenida cuando se muestrea


el sistema de ecuacion 6.10 con perodo T=2.
Habiendo obtenido la formula exacta de la ecuacion 6.12 para T , es posible
investigar la precision de la aproximacion de la funcion descriptiva. Considerando
el caso simetrico e introduciendo h = T=2. La funcion de transferencia impulsional
obtenida cuando se muestrea el sistema de ecuacion 6.10 con perodo h esta dada
por:
X
1
Hh(esh) = h1 1 (1 e h(s+jnws) )G(s + jnw )
s
n= 1 s + jhws

donde ws = 2=h. Haciendo sh = j


X
1 2   + 2n 
Hh( 1) = G j h
1 j ( + 2n )
X
1 4    + 2n 
= Im G j =0
0  (1 + 2n) h
Autoajuste y ajuste por tabla de controladores 123

El primer termino de la serie da,


4     4   2 
Hh( 1)   Im G j h =  Im G j T = 0

que es el mismo resultado para el calculo de T obtenido del analisis de la funcion


descriptiva. Esto implica que la aproximacion de la funcion descriptiva es correcta
solo si G(s) tiene un caracter de paso-bajo.

6.5 Ajuste por tabla


Algunas veces es posible encontrar variables auxiliares que correlacionan bien los
cambios en la dinamica de un proceso. Es entonces posible reducir los efectos de las
variaciones de los parametros simplemente cambiando los parametros del regulador
como funcion de las variables auxiliares.

Mecanismo Medida de Medio


de  la Variable 
Adaptacion auxiliar Ambiente
C
r e - Controlador u y
-

6
Ajustable
- Planta -
CCW

Figura 6.5: Controlador ajustable por tabla

Como se observa en la gura 6.5, el ajuste por tabla puede verser por tanto
como un sistema de control realimentado, en el que las ganancias de realimentacion
son ajustadas usando una compensacion de prealimentacion. Como ejemplo, en los
sistemas de vuelo se usan como variables auxiliares el numero de Mach y la presion
dinamica, que pueden medirse mediante sensores.
El problema principal en el dise~no de sistemas con ajuste por tabla es encon-
trar las variables auxiliares apropiadas. Esto se hace normalmente basandose en el
124 Dise~no de reguladores con ajuste por tabla

conocimiento fsico del sistema. En control de procesos, el caudal de produccion


puede escogerse frecuentemente como variable auxiliar, puesto que las constantes de
tiempo y tiempo de retardo son inversamente proporcional a dicho caudal.
Cuando se determinan las variables auxiliares, los parametros del regulador se
calculan para un determinado numero de condiciones de operacion, usando algun
metodo de dise~no adecuado. El regulador es por tanto sintonizado o calibrado para
cada condicion de operacion. La estabilidad y actuacion del sistema son evalua-
dos por simulacion; teniendo una atencion especial a la transicion entre diferentes
condiciones de operacion.
Algunas veces es posible obtener ajuste por tabla introduciendo las transforma-
ciones no lineales de tal manera que el sistema transformado no depende de las
condiciones de operacion. Las medidas auxiliares se usan junto con las medidas del
proceso para calcular las variables transformadas. La variable de control transfor-
mada se calcula y se retransforma antes de ser aplicada al proceso. El regulador
resultante puede considerarse compuesto de dos transformaciones no lineales con un
regulador lineal en medio. Otras veces la transformacion se basa en las variables
obtenidas indirectamente a traves de estimacion de estados.
El ajuste por tabla tiene la ventaja de que los parametros del regulador pueden
cambiarse muy rapidamente en respuestas a los cambios del proceso. Puesto que
no existe estimacion de los parametros, la limitacion depende de como de rapido
responden las medidas auxiliares a los cambios del proceso.

6.6 Dise~no de reguladores con ajuste por tabla


Es difcil dar reglas generales para dise~nar este tipo de reguladores. La cuestion clave
es determinar las variables que pueden usarse como variables de ajuste. Es claro
que estas se~nales auxiliares deben re ejar las condiciones de operacion de la planta.
Idealmente tendramos una expresion que relaciona los parametros del regulador con
las variables de ajuste. Es necesario por tanto tener una buena informacion de la
dinamica del proceso, si se utiliza el ajuste por tabla. Como ideas generales debemos
tener en cuenta:

 Linealizacion de actuadores no lineales.


 Ajuste por tabla basado en medida de variables auxiliares.
Autoajuste y ajuste por tabla de controladores 125

 Ajuste de tiempo basado en el caudal de produccion.


 Transformaciones no lineales.

6.6.1 Actuador no lineal


Considerando el sistema no lineal de la gura 2.6, comentado en el captulo 2, con
un regulador PI cuyo actuador es una valvula con la caracterstica,
v = f (u) = u4; u  0

Sea f^ 1 una aproximacion de la inversa de la caracterstica de la valvula. Para


compensar la no linealidad, la salida del regulador se lleva a traves de esta funcion
antes de ser aplicada a la valvula.

r -- PI c-
f^
u - f v-
Go
y
-

6
1

Figura 6.6: Compensacion no lineal del actuador


Esto da la relacion,
v = f (u) = f (f^ 1(c))

donde c es la salida del regulador PI. La funcion f (f^ 1(c)) debera tener menos
variacion en ganancia que f . Si f^ 1 es la inversa exacta, entonces v = c.
Si consideramos que f (u) = u4 puede ser aproximada por dos lineas: una
conectando los puntos (0,0) y (1.3,3), y otra conectando este punto y el (2,16),
entonces tenemos la gura 6.7. en donde
(
f 1 (c) = 0:433c 0c3
0:0538c + 1:139 3  c  16
126 Dise~no de reguladores con ajuste por tabla

20

15
v

10

0
0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 2
u

Figura 6.7: Caracterstica no lineal de la valvula

La gura 6.8 muestra los cambios en la se~nal de referencia en cuatro condiciones


de operacion diferentes cuando utilizamos la aproximacion de la inversa de la valvula.
Al comparar las respuestas con el sistema sin compensar de la gura 2.7, se
observa una considerable mejora en la respuesta del sistema. Con esta mejora es
posible hacer al proceso mas insensible a la nolinealidad de la valvula.
Este ejemplo nos muestra una idea muy util y simple para compensar no linea-
lidades conocidas. En la practica es a menudo su ciente aproximar la no linealidad
mediante unos poco segmentos lineales. Hay varios controladores comerciales que
pueden hacer esta clase de compensacion.

6.6.2 Tanque de seccion variable


Consideremos un tanque donde la seccion A varia con la altura h. El modelo es,
d (A(h)h) = q aq2gh
i
dt
donde qi es el ujo de entrada y a es la seccion de la tubera de salida. Si qi es la
entrada y h la salida del sistema, el modelo linealizado en un punto de operacion,
qin0 y h0 , viene dado por la funcion de transferencia,
G(s) = s +
donde
= A(1h0)
Autoajuste y ajuste por tabla de controladores 127

0.4

0.3

0.2

0.1

0
0 10 20 30 40 50 60 70 80 90 100

0.5

0
0 10 20 30 40 50 60 70 80 90 100

0
0 10 20 30 40 50 60 70 80 90 100

10

0
0 10 20 30 40 50 60 70 80 90 100

Figura 6.8: Respuesta a escalon del sistema compensado


128 Dise~no de reguladores con ajuste por tabla

Un controlador PI del tanque viene dado por,


 1 Z 
u(t) = K e(t) + T (e )d
i
donde
K = 2!
y
Ti = 2!!2

Esto nos da un sistema de bucle cerrado con una frecuencia natural ! y un


amortiguamiento relativo  .
Introduciendo las expresiones de y se tiene el siguiente controlador ajustable
por tabla,
K = 2!A(h0) 2qhin0
0

Ti = 2! = 2A(hq0in)h0 !2
0

Los valores numericos son frecuentemente tal que  2!, por lo que las
expresiones pueden simpli carse entonces a:
K = 2!A(h0)

Ti = 2!

En este caso, es por tanto su ciente hacer la ganancia proporcional a la seccion


del tanque. En la gura 6.9 se muestra la respuesta de este regulador para un tanque
piramidal con seccion variable igual a hl.
Este ejemplo pone de mani esto que algunas veces se pueden medir una o dos
variables en un proceso y usarlas como entradas para el ajuste de la ganancia. Fre-
cuentemente no es tan facil como aparece en este ejemplo, determinar los parametros
del controlador como funcion de las variables medidas. El dise~no del regulador debe
entonces rehacerse para diferentes puntos de trabajo del proceso. Tambien debe te-
nerse cuidado con las se~nales que se miden por si tienen ruidos, en este caso pueden
ltrarse antes de ser utilizadas como variables de ajuste.
Autoajuste y ajuste por tabla de controladores 129

0.9

0.8

0.7

0.6

0.5
0 10 20 30 40 50 60 70 80 90

0.7

0.6

0.5

0.4

0.3
0 10 20 30 40 50 60 70 80 90

Figura 6.9: Respuesta del sistema en diferentes puntos de trabajo


6.6.3 Transformacion no lineal
Es de gran interes encontrar las transformaciones que hacen al sistema transformado
lineal e independiente de las condiciones de operacion. En algunos procesos esto
puede hacerse mediante escalas de tiempos. Todos los procesos asociados con el
ujo de material tienen esta propiedad: molinos rodantes, bandas transportadoras,
ujo en tuberas, etc.
Un sistema de la forma
x(t) = f (x(t)) + g(x(t))u(t)

puede ser transformado en un sistema lineal, con tal de que todos los estados del
sistema puedan ser medidos y darse las condiciones de observabilidad generalizada.
El dise~no se hace en primer lugar transformando el sistema en un sistema lineal
jo. La transformacion es generalmente no lineal y depende de los estados del
proceso. Entonces se dise~na un regulador para el modelo transformado, y las se~nales
de control del modelo son retransformadas en las se~nales de control originales. El
resultado es un controlador no lineal de tipo especial, que puede ser interpretado
130 Dise~no de reguladores con ajuste por tabla

como un controlador de ajuste por tabla. El controlador se construye a partir del


conocimiento acerca de las no linealidades en el modelo.
Transformacion no lineal de segundo orden
Consideremos el sistema,
dx1 = f (x ; x )
1 1 2
dt
dx2 = f (x ; x ; u)
2 1 2
dt
Supongamos que las variables de estado pueden ser medidas y que queremos
encontrar una realimentacion tal que la respuesta de la variable x1 a al se~nal de
mando viene dada por la funcion de transferencia,
G(s) = s2 + 2&!s!2 (5) (6:14)
+ !2
Introduciendo nuevas coordenadas z1 y z2 de nidas como,
z1 = x1
z2 = dx 1
dt = f1 (x1 ; x2)
y la nueva se~nal de control v, de nida por
v = F (x1; x2 ; u) = @@((xf1 )) f1 + @@((xf1 )) f2 (6:15)
1 2
De estas transformaciones resulta un sistema lineal,
dz1 = z
2
dt
dz2 = v (6.16)
dt
Facilmente se observa que la realimentacion lineal
v = !2(uc z1 ) 2&!z2 (6:17)
da la funcion de transferencia en bucle cerrado (6.14) de uc a z1 = x1 para el sistema
lineal de la ecuacion (6.16), se continua para transformar a las variables originales.
De las ecuaciones (6.15) y (6.17) se tiene para las variables originales:
v = F (x1 ; x2; u) = !2(uc x1 ) 2&!f1(x1 ; x2)
Autoajuste y ajuste por tabla de controladores 131

Resolviendo esta ecuacion para u se obtiene la realimentacion deseada. Del teo-


rema de la funcion implcita, una condicion para la solucion local es que la derivada
parcial @F
@u sea diferente de cero. La generalizacion del ejemplo requiere una solucion
al problema general de transformar un sistema no lineal en uno lineal mediante rea-
limentacion no-lineal. Una version simple del problema tambien se da en el control
de robots industriales. En este caso la ecuacion basica puede escribirse como

J ddt'2 = Te
2

donde J es el momento de inercia, ' un angulo de una union, y Te un par que


depende de la corriente del motor, los angulos de par, y sus dos derivadas. Las
ecuaciones son por tanto de la forma considerada y la realimentacion no lineal se
obtiene determinando las corrientes que dan el par deseado. El problema se llama
transformacion de par.
132 Dise~no de reguladores con ajuste por tabla
Captulo 7
Aplicacion de control adaptativo
7.1 Introduccion
Desde la introduccion del regulador autoajustable (self-tuning) por Astrom y Wit-
tenmark (1973), han aparecido en la literatura muchos trabajos, poniendo de mani-
esto las propiedades del control adaptativo (Astrom, 1983 y Landau, 1974). Estos
trabajos son en su mayor parte teoricos y aunque se han realizado algunas apli-
caciones (Borisson 1976, Buchholt 1979, Kallstrom 1979, Narendra 1980, Dumont
1982, Rubio 1982, etc.), todava no esta bien aceptado a nivel industrial. En este
captulo se presenta una aplicacion de un controlador adaptativo al control de la tem-
peratura de salida en un campo de colectores distribuidos de una Central Electrica
Termosolar (CETS).
Desde hace algun tiempo y fundamentalmente tras la crisis energetica, se ha
puesto de mani esto un creciente interes por el aprovechamiento de fuentes ener-
geticas no exploradas hasta ahora, o que lo han sido insu cientemente. Tal es el
caso de la energa solar, siendo una de las mas prometedoras las plantas electricas
termosolares.
Las Centrales Electricas Termosolares, son sistemas empleados para obtener la
energa electrica a partir de la energa solar mediante la transformacion previa de
esta en energa termica. El dise~no de este tipo de centrales no comienza hasta 1977
(Ruz y Gomez 1982), y no es hasta 1981 cuando se ponen en marcha las primeras.

133
134 Descripcion de la planta

La diferencia fundamental entre una planta convencional y una planta solar, es


que la energa primaria no puede ser manipulada por el hombre, es intermitente y
cuando se tiene, resulta cara de transformar. Por todo ello, en una planta solar se
requiere un so sticado sistema de control capaz de mantener unas especi caciones
mas rigurosas que un control clasico.
Fundamentalmente existen dos tipos de CETS, segun el numero de componentes
que transforman la energa solar en termica, si es solo uno, se denominan sistemas
de receptor central (CRS) y si cada captador dispone de su propio dispositivo de
transformacion, se denominan sistemas de colectores distribuidos (DCS). Esta apli-
cacion se centrara en las CETS de colectores distribuidos y particularmente en el
sistema de control necesario para conseguir un aprovechamiento optimo de la energa
disponible.

7.2 Descripcion de la planta


La central en concreto a la que se ha aplicado el control adaptativo, es la planta
SSPS situada en el municipio de Tabernas (Almera). En dicha planta se dispone
de un campo de captadores cilindroparabolicos con seguimiento solar en elevacion
del tipo ACUREX. Una fotografa de este campo puede verse en la gura 7.1.
Los tubos receptores, situados en la lnea focal, emplean el ujo solar concen-
trado para calentar un aceite termico, proviniente de la parte inferior de un tanque
de almacenamiento por estrati cacion termica a cuya parte superior es devuelto el
aceite una vez aumentada su temperatura. El tanque esta conectado a varios sis-
temas para utilizar la energa almacenada en el. Tambien aprovechando el principio
de estrati cacion termica, para lo cual el aceite se toma caliente de la parte superior
y se devuelve fro a la inferior. Un diagrama simpli cado del campo de colectores
solares puede verse en la gura 7.2.
Como puede comprenderse, las condiciones ambientales a que esta sometida una
CETS son en general distintas de las condiciones de dise~no mencionadas. Por su
propia naturaleza, la disponibilidad de energa solar depende de la fecha y hora, de
las condiciones meteorologicas y demas perturbaciones existentes.
La planta esta sometida a perturbaciones en la energa de entrada, que pueden
ser lentas, debidas a variaciones de insolacion a la largo de un da claro, o bien
bruscas, causadas fundamentalmente por la aparicion de nubes y por variaciones de
la temperatura de entrada al campo en la puesta en marcha del sistema de conversion
Aplicacion de control adaptativo 135

Figura 7.1: Campo de colectores distribuidos ACUREX

Campo acurex Tanque Almacenamiento

-
Hacia
p p p p

6 Generador
Vapor


@ @ o
- H
H Planta


A
Bomba ? 6 Desalinizadora
XXX
6
  H
H 
Bu er

Figura 7.2: Diagrama esquematico del campo de colectores


136 Modelo dinamico del campo

de potencia. Todas estas perturbaciones nos obligan a variar continuamente el ujo


de control, lo que a su vez provoca que el tiempo de residencia del uido en el campo
sea variable.
De todo lo expuesto, se desprende que el proceso a controlar es un sistema
fuertemente no-lineal con retardo variable en el tiempo, y por tanto desde el punto
de vista de control, en el que se considera un modelo lineal, sera un proceso con
parametros variables y retardo tambien variable.

7.3 Modelo dinamico del campo


Con el objeto de poder evaluar mas facilmente y con mas rapidez los distintos con-
troladores posibles, es de interes disponer de un modelo dinamico de la planta, que
permita simular una gran variedad de comportamientos as como de perturbaciones.
En un primer paso se dise~no un modelo concentrado simpli cado del campo,
pasandose posteriormente a un modelo de parametros distribuido que permite tener
una mayor exactitud del comportamiento del campo.

7.3.1 Modelo concentrado


Supuesta una representacion concentrada de la planta, el cambio de energa interna
del campo puede ser dada por:
C dT _
dt = No RI V Pcp(T Ti ) Hl (Tm Ta) (7:1)

El producto Pcp es una funcion de la temperatura y puede ser aproximado a 1924


KJ/l o C . A partir de los datos experimentales el coe ciente de perdidas termicas es
de 1.05 Kw/ oC .
Para identi car el resto de los parametros pueden utilizarse varios metodos,
sometiendo al campo a varios tests. En este caso se ha sometido al campo a una
se~nal cuadrada y los datos tomados se han utilizado para ajustarlos al modelo dado
anteriormente, mediante un metodo de mnimos cuadrados conocido como el metodo
de Powell (Camacho 1977). Del resultado de la identi cacion, se estima el parametro
C=2267 Kw/ oC y NoR = 1322m2.
Aplicacion de control adaptativo 137

7.3.2 Modelo distribuido


El campo Acurex esta formado por colectores solares distribuidos del tipo Acurex,
modelo 3001. Estos colectores son parabolicos y con seguimiento del sol en un solo
eje (elevacion). El campo esta dispuesto en 20 las de colectores, las cuales forman
10 lazos paralelos. En total en el campo hay 480 modulos orientados de este a oeste
y la super cie total de espejos es 2674 m2 .
Los tubos receptores, situados en la lnea focal, emplean el ujo solar concen-
trado para calentar un aceite termico, proveniente de la parte inferior de un tanque
de almacenamiento por estrati cacion termica a cuya parte superior es devuelto
el aceite caliente. El tanque puede almacenar, en el punto de dise~no, 2.7 Mwth
de energa en aceite termico proveniente de los campos de colectores distribuidos.
El tanque esta conectado con un generador de vapor o una planta desalinizadora,
tambien aprovechando el principio de estrati cacion termica. El aceite se toma a
elevada temperatura de la parte superior del tanque, se enfra al ceder su calor, y
se devuelve frio a la parte inferior.
El colector Acurex posee una super cie parabolica para concentrar la radiacion
solar directa sobre el tubo receptor, que esta localizado en la zona focal de la
parabola. El aceite termico es bombeado a traves de la tubera receptora y recoge
el calor transferido a traves de las paredes del tubo.
El sistema esta provisto con un sistema de seguimiento del sol que mueve los es-
pejos alrededor de un eje paralelo a aquel en el que se situa la tuberia. El mecanismo
de seguimiento puede alcanzar tres posibles estados:

 Seguimiento ('track'): El mecanismo sigue el sol y los colectores enfocan sobre


la tuberia.
 Desenfocado ('desteer'): El mecanismo sigue el sol, pero desenfoca el colector
varios grados, de forma que el tubo receptor se situa fuera de la zona focal y
el uido no se calienta.
 Bocabajo ('stow'): El mecanismo lleva al colector a una posicion invertida, no
existiendo nigun tipo de seguimiento del sol. A este estado se llega al nal del
da o si una alarma grave se produce.

Un bucle ACUREX esta formado por cuatro colectores de doce modulos, conec-
tados en serie de forma apropiada. El bucle tiene 172 m. de longitud, siendo de 142
138 Modelo dinamico del campo

m. la parte activa del bucle y el resto 30 m. pasiva. Debido a la complejidad del


sistema y a la existencia de no-linealidades, se ha desarrollado un modelo numerico
para la simulacion de dicho sistema, habiendose hecho las siguientes hipotesis:

 Las propiedades del aceite son consideradas como funciones de la temperatura,


varian con el tiempo y el espacio.
 El ujo incidente de calor en cada seccion se supone que es circunferencialmente
uniforme e igual al valor medio.
 Las variaciones de temperatura radial en la pared del tubo son despreciadas.
Esta suposicion es razonable para una pared na que tiene una buena conduc-
tividad termica.
 El ujo de aceite y la irradiancia son consideradas como funciones del tiempo
y en cada instante son las mismas en cada momento. (Se supone uido incom-
prensible).
 Las perdidas por conduccion de calor axial en ambos lados de la pared y del
uido son despreciadas. La conduccion axial en el tubo debe ser peque~na ya
que la pared es na, teniendo una alta resistencia termica. En el uido la
conduccion axial es relativamente peque~na porque la conductividad del aceite
es pobre.

Con las hipotesis anteriores y aplicando la conservacion de la energa en el tubo


de metal de un volumen de control de longitud dx sobre un intervalo de tiempo dt,
se tiene:
m CmAm @T@tm = InoD HlG(Tm Ta ) LHt (Tm Tf ) (7:2)

Similarmente para un elemento de uido:


f Cf Af @T
@t
f
+ f Cf V_ @Tf = LHt (Tm Tf )
@x (7:3)

En la ecuaciones anteriores el subndice m se re ere al metal y el f al uido y:


 = densidad
c = calor espec co
A = area transversal
T = temperatura
Aplicacion de control adaptativo 139

I = irradiacion
no = coe ciente de re ectividad
H1 = funcion de las peerdidas metal-ambiente
D = anchura espejos
Ht = coe ciente de transmision metal uido
G = Diametro exterior del tubo
L = Diametro interior del tubo
V_ = caudal de aceite

Las ecuaciones que describen el comportamiento en un elemento pasivo son si-


milares, excepto que la entrada de energa solar es cero y el coe ciente de perdidas
es mucho menor.
Estas ecuaciones han sido resueltas utilizando un procedimiento iterativo en
diferencias nitas. Las temperaturas del uido y del tubo absorbedor son calculadas
para cada intervalo de tiempo y para cada elemento de longitud. La longitud de cada
segmento es de 1 m y el intervalo de integracion es de 0,5 segundos. Este intervalo de
integracion se ha elegido como un compromiso entre el tiempo de calculo necesario
y la precision obtenida.
Se ha elegido un algoritmo en dos etapas para resolver las ecuaciones de las
temperaturas. En la primera etapa se calculan las temperaturas del uido y del
metal suponiendo que el uido este en regimen estacionario. En la segunda etapa la
temperatura del uido es corregida en funcion de la energa neta transportada por
el uido.

 1a Etapa

Tm (n; k) = Tm (n; k 1) + R Ct A (InoD Hl G(Tm (n; k 1) Ta )


m m m
LHt1 (Tm (n; k 1) T1f (n; k 1))

Tf (n; k) = T1f (n; k 1) + RHtC1 At (Tm (n; k 1) T1f (n; k 1))
f f f
 2a Etapa
T1f (n; k) = Tf (n; k 1) AV  t (T (n; k) T (n 1; k))
f f
f x
140 Control en adelanto

En estas ecuaciones en diferencias, Tf (n; k) y Tm (n; k) son las temperaturas en


el segmento n durante el intervalo de tiempo k. T1f es la temperatura del uidos
antes de la correccion mientras que Tf es la temperatura del uido despues de la
correccion.
A partir de datos reales de la planta se han determinado las distintas constantes
y coe cientes que aparecen en las ecuaciones anteriores, siendo ajustados muchos de
ellos a funciones polinomiales de la temperatura, mediante un metodo de mnimos
cuadrados.

7.4 Control en adelanto


A partir de la representacion concentrada de la planta, ecuacion 7.1, se tiene en el
regimen permanente:
V_ = No RIPc (H l (Tm Ta )
p Tr Ti )

Esta ultima ecuacion puede ser aproximada por:

V_ = K1TRI TK2
r i

Esta expresion constituye el calculo del ujo como funcion de la temperatura


de referencia, temperatura de entrada, re ectancia y de la irradiancia, siendo uti-
lizada para el control en adelanto (feedforward). Las constantes K1 y K2 , han sido
determinadas experimentalmente, teniendo los valores de K1 = 0:93 y K2 = 155
(Carmona, 1983).

7.5 Control en bucle cerrado


Es necesario compensar el error que pueda producirse mediante un regulador en bucle
cerrado. Dado que el ujo calculado en bucle abierto, es una buena estimacion, el
valor de la se~nal de control del bucle cerrado se ha saturado a mas, menos un 20%
del valor de bucle abierto, con ello se consigue mejor estabilidad en los transitorios,
ya que se ha reducido la banda de regulacion.
Aplicacion de control adaptativo 141

temp. entrada (Tin) Radiacion

Tref-
 e- 
P.I.
3 ? ?
u - Compensacion us
? ?
- Planta To = y-
- 6   Serie
  ? ?
Mecanismo
Adaptacion  Identi cador

Figura 7.3: Estructura de control con compensacion serie


7.5.1 Controlador PI
La planta en consideracion presenta un retardo muy grande (del orden de 2 a 8
minutos), y variable con el ujo de entrada. Para este tipo de sistemas en que el
retardo es mucho mayor que el orden del sistema, puede considerarse (Isermann,
1981) un tipo particular de controlador.
Suponiendo que la planta se modela por la ecuacion y(k) = bu(k d), donde d
es el retardo en perodos de muestreo y b la ganancia del sistema, el controlador que
resulta por control en tiempo mnimo tiene por expresion:
u(k) = u(k d) + e(k)=b (7:4)

Si en vez de utilizar este controlador directamente, se aproxima un regulador P.I.


para que tenga la misma respuesta, se obtiene:
u(k) = u(k 1) + qoe(k) + qie(k 1) (7:5)
donde :
qo = 1=(2b)
qi = qo (d 2)=d (7.6)

Para este regulador, puede demostrarse (Isermann, 1981), que es menos sensible
al error en la exactitud del retardo, por ello resulta mas conveniente su utilizacon
142 Control en bucle cerrado

que el controlador 7.4, dada las caracteristicas del proceso. Por todo ello en el
bucle de realimentacion se ha utilizado un P.I. Tambien ha de tenerse en cuenta que
cuando exista un error en la determinacion del retardo, es mejor considerarlo mayor
del que se prevea, en orden a asegurar la estabilidad.

7.5.2 Controlador PI por asignacion de polos


Desde el punto de vista de dise~no del controlador adaptativo autoajustable, el pro-
ceso puede modelarse como un sistema de primer orden, que relaciona los cambios
en el ujo de aceite con la temperatura de salida. Observando la respuesta al escalon
obtenida de la planta, indica que en tiempo contnuo, puede aproximarse por una
funcion de transferencia de primer orden con un retardo:
g(s) = (1 +Ks) e sd (7:7)

El retardo d , constante de tiempo  y ganancia K del sistema varia con el ujo


de aceite y en el punto de operacion a bajo ujo el retardo es aproximadamente el
doble que el retardo a ujo maximo. Puede verse (Rubio 1989), que un camino para
adaptar esta variacion en el tiempo de retardo es usar un modelo de la forma,
bo + b1 z 1 ) z 2
g(z) = ((1 (7:8)
az 1 )
El perodo de muestreo se escoge igual al tiempo de retardo mnimo. De esta
forma el mnimo retardo esta representado por el modelo con el parametro b1 = 0.
Cuando b0 = 0, el modelo representa el maximo tiempo de retardo de dos perodos.
Para los valores del tiempo de retardo donde d no sea un multiplo entero del perodo
de muestreo, por ejemplo T < d < 2T , el factor (bo + b1 z 1 ) actua como una
aproximacion discreta de Pade de primer orden del retardo. Basado en este modelo
se dise~na el siguiente algoritmo autoajustable por asignacion de polos.
La funcion de transferencia de un controlador PI viene dada por:
k(z) = go(1 g1 z 1 )
(1 z 1 )
(7:9)

Escogiendo el cero del controlador que cancele el polo de la planta, o sea haciendo
a = g1, El polinomio caracterstico en bucle cerrado, P (z), es de la forma:
P (z) = z3 z2 + goboz + gob1
Aplicacion de control adaptativo 143

Si al sistema en bucle cerrado se le especi ca que tenga un polo en z = A,


entonces del polinomio caracterstico P (z) evaluado en A, se deduce que go hay que
elegirlo tal que:
go = A
2 (1 A)
(7:10)
(bo A + b1)
Entonces conociendo a; bo and b1 del modelo, los parametros del controlador go
y g1 pueden calcularse especi cando un polo dominante en bucle cerrado en z = A.
Analizando P(z) puede deducirse la localizacion de los otros dos polos del sistema.
P (z) = [z2 (1 A)z + gobo A(1 A)](z A)

A partir del lugar de las raices del sistema, se tiene que aparte del polo en z = A,
el sistema tendra otros dos polos reales, uno negativo y otro positivo. Resolviendo
P(z) se puede validar la localizacion de estos polos, comprobandose que efectiva-
mente corresponden a modos que decaen rapidamente y que el polo en z = A es el
polo dominante.
Algunos valores tpicos de simulaciones han sido:

A g0 g1
0:9 a 1:539 1:3851
0:95 a 1:2398 1:1778

Los coe cientes del regulador g0 y g1 se saturan para evitar sobreoscilaciones en


las ocasiones en que el identi cador no funcione correctamente, debido al paso de
nubes u otras perturbaciones.

7.5.3 Controlador autoajustable


Se ha desarrollado un algoritmo de control adaptativo autoajustable, version explcita
mediante el metodo de asignacion de polos desarrollado en la seccion anterior. Los
parametros del modelo del sistema se determinan en lnea mediante el metodo de
mnimos cuadrados recursivos. El algoritmo de estimacion de parametros incorpora
factorizacion UDU (Bierman 1977) y factor de olvido variable (Fortescue 1981). La
funcion de transferencia en z del modelo puede representarse mediante la ecuacion
en diferencias de la forma:
y(n) = a y(n 1) + bo u(n 2) + b1 u(n 3) + d
144 Control en bucle cerrado

El termino d es una constante introducida para tener en cuenta los valores medios
de las se~nales de entrada y salida. Las perturbaciones del sistema son tales que puede
emplearse un modelo determinista.
Desde el punto de vista de la identi cacion el sistema anterior tiene cuatro
parametros a determinar: [a bo b1 d].
Un rasgo particular del sistema es que se necesita incluir un termino de adelanto
en el bucle de control. El modelo de la planta descrito esta basado en la relacion
entre los cambios de la temperatura de salida y los cambios en el ujo de aceite.
Pero la temperatura de salida de la planta esta in uida por los cambios de otras
variables del sistema, tales como, la irradiancia solar y la temperatura de entrada
del aceite. Si cualquiera de estas variables cambia durante la fase de indenti cacion,
ello introduce un cambio en la salida del sistema que no esta motivado por cambios
en el ujo, por que las variaciones que se produciran en los parametros estimados
seran innecesarias y el modelo se desajustara.
Dado que la irradiacion solar y la temperatura de entrada pueden medirse, este
problema puede reducirse mediante la incorporacion de un termino de adelanto,
calculado para las condiciones de regimen permanente, el cual realiza un ajuste en
el ujo de entrada, encaminado a eliminar el cambio en la temperatura de salida
causado por la variacion en la irradiancia solar y la temperatura de entrada.
Si el termino en adelanto fuese perfecto los cambios en la temperatura de salida
solo serian debido a los cambios en la se~nal de entrada. Evidentemente la eliminacion
exacta de estos cambios es imposible, pero este termino reduce considerablemente
los mayores problemas inherentes en el modelo planteado y permite una mejor iden-
ti cacion de los parametros de este.
La se~nal del termino en adelanto tambien produce bene cios cuando hay per-
tubaciones en la irradiancia solar y en la temperatura de entrada, pero la principal
razon para incluir este termino es para preservar la validez del modelo del sistema
asumido en el algoritmo de control adaptativo autoajustable.

7.5.4 Controlador PID adaptativo


Se ha realizado un desarrollo teorico paralelo al del regulador P.I. por asignacion de
polos con el n de ensayar un regulador P.I.D. adaptativo.
La funcion de transferencia en el dominio del tiempo puede escribirse:
Aplicacion de control adaptativo 145

Gpid(s) = Kpid(1 + T1s + Td s)


i

Para pasar al dominio discreto se utiliza la aproximacion de Euler para el termino


integral y la rectangular hacia detras (Backward) para el derivativo (Astrom 1984).

uk = Kpid(1 + T (zTm 1) + ( Td Td )( z T1d ))


i Tm + N z (NTm +Td )

eik = z 1 1 ek

edk = z 1 ek
z Td
(NTm +Td )

Para calcular los parametros caractersticos (ganancia del controlador, tiempo


integral y derivativo) se han utilizado las reglas de Ziegler-Nichols (Z-N) en bucle
abierto. Los dos mecanismos de adaptacion usados han sido:

1. Usar tiempos integral y derivativo jos, adaptando solo la ganancia del contro-
lador (dado que no se puede con un modelo del sistema de primer orden esti-
mar el retardo puro), pero tomandola un cuarto (para evitar comportamiento
oscilatorio) de la usada por el metodo de Z-N en bucle abierto.
2. Se adapta la ganancia, tiempo integral y derivativo a~nadiendo un cero a la
funcion de transferencia para estimar un retardo variable, como se indica en
(Camacho 1992).
b0 + b1 z 1 )
g(z) = z 2 ((1 az 1 )
Dado que el perodo de muestreo se escoge igual al mnimo valor del retardo,
este se representa en el modelo con b1 = 0. Cuando b0 = 0 el modelo tiene
un retardo maximo de dos perodos de muestreo. Para valores del retardo
no multiplos enteros del perodo de muestreo, el numerador actua como una
aproximacion discreta de Pade a un retraso.
146 Control en bucle cerrado

7.5.5 Controlador predictivo generalizado


En esta seccion se expone un metodo sencillo para aplicar GPC adaptativo. Una
descripcion detallada del metodo puede encontrarse en (Camacho 1993, 1994, 1995).
Este metodo simpli cado disminuye la complejidad de calculos que hay que realizar
a la hora de aplicar un controlador predictivo adaptativo. El metodo hace uso del
hecho de que un controlador predictivo generalizado da lugar a una ley de control con
pocos parametros. Estos parametros pueden ser calculados en el rango de interes de
los parametros del proceso. Se usa una funcion que aproxima los parametros reales
del controlador y que implica menor esfuerzo computacional.
Como se vio en el apartado 5.6, este controlador minimiza una funcion de coste
de la forma:
X
N2 X
N3
J (N1 ; N2; N3) = E f (j )[^y(t + j j t) w(t + j )]2 + (j )[4u(t + j 1)]2g (7:11)
j =N1 j =1

De acuerdo con el metodo descrito en (Camacho 1993,1995) y los requerimientos


para control adaptativo se escoge un modelo CARIMA.
A(z 1 )y(t) = B (z 1 )u(t 1)z d + C (z 1 ) "(t) (7:12)
4
que para el caso concreto que nos ocupa, A; B y C son los polinomios:
A(z 1 ) = 1 az 1 ; B (z 1 ) = b ; C (z 1 ) = 1

Con d = 1. Este esquema permite accion integral para eliminar o sets en la


se~nal de salida.
(1 az 1 )y(t) = bz 1 u(t 1) +
"(t) (7:13)
4
Considerando el retardo d, se escogen N1 = d + 1, N2 = d + N y N3 = N . En
nuestro caso N1 = 2 y N2 = 16. El rango de posibles valores de  se ha obtenido
via simulacion (Camacho 1995) y es (3    7). Si  disminuye se obtienen
controladores mas rapidos.
Si y^(t + j j t) y y^(t + j 1 j t) son conocidas, como las componentes de los ruidos
estan todas en el futuro, el mejor valor esperado para y^(t + j + 1 j t) viene dado por:
y^(t + j + 1 j t) = (1 + a)^y(t + j j t) ay^(t + j 1 j t) + b 4 u(t + j 1) (7:14)
Aplicacion de control adaptativo 147

Como se deduce en (Camacho 1995), si la secuencia de referencias futuras, w(t +


j ), no se conoce y se considera igual a la referencia actual r(t), el incremento de
control 4u(t) puede escribirse como:
4 u(t) = l1 y^(t + 1 j t) + l2 y(t) + l3 r(t) (7:15)
Donde qP = [l1l2 ] y l3 = P qj P rij .
15 15
i=1 j =1

Si las referencias futuras fueran conocidas l3 = qR sera un vector de ganancias


que las multiplicaria. Los coe cientes l1 , l2, l3 ; son funciones de a; b, (i) y (i).
Si se dise~na el GPC considerando que la planta tiene ganancia estatica unidad, los
coe cientes en (7.15) dependeran solo de (i) y (i) (que se suponen jos) y del
polo de la planta que variara en el caso de control adaptativo. Haciendo esto, se usa
una secuencia de ponderacion normalizada que se corregira de forma adecuada en
sistemas con ganancia estatica distinta de la unidad.
El valor de y^(t + 1 j t) se obtiene usando el predictor descrito en (7.14). El
esquema de control propuesto puede verse en la gura 7.4. Los parametros estimados
de la planta se usan para calcular los parametros del controlador (l1; l2 ; l3) via un
mecanismo de adaptacion.
Solar radiation
Inlet oil temperature

r(t) + + 1 - a^ FEED y(t)


l3 b^
PLANT
+ + + FORWARD

-1
Z

IDENT
^a b^

ADAPT

l2 PREDICTOR

l1

Figura 7.4: Esquema de control adaptativo


La forma estandar de calcular los parametros del controlador sera calculando
una serie de matrices y resolviendo una ecuacion matricial seguido de la generacion
de la ley de control de la ecuacion (7.15). Esto trae consigo la triangularizacion de
una matriz N  N , que es prohibitivo en aplicaciones en tiempo real.
148 Control en bucle cerrado

Como se sugiere en (Camacho 1993, 1994), los coe cientes del controlador se
pueden calcular por interpolacion en un conjunto de valores conocidos previos.
En el libro (Camacho 1995), se calculan estos coe cientes para (i) = 1, (i) = 5
y N = 15. El polo del sistema se cambia en pasos de 0.0005 de 0.85 a 0.95, que
son los valores que garantizan la estabilidad del sistema si la identi cacion de los
mismos no es muy precisa. Es importante rese~nar que como la ganancia del bucle
cerrado debe ser igual a la unidad, la suma de los tres parametros debe ser cero, y
por tanto solo dos de ellos deben ser conocidos.
En el caso de (i) = 5, (i) = 1 y para un horizonte de control de 15 los
coe cientes del controlador vienen dados por:
l1 = 0:4338 0:6041^a=(1:11 a^)
l2 = 0:4063 + 0:4386^a=(1:082 a^) (7.16)
l3 = l1 l2

Estas expresiones dan una buena aproximacion de los parametros reales del con-
trolador (error inferior al 0.6 por ciento).
En cada perodo de muestreo el controlador adaptativo debe realizar los siguien-
tes pasos ( gura 7.4):

1. Estimar los parametros del modelo lineal a partir de entradas y salidas de la


planta.
2. Ajustar los parametros del controlador usando las expresiones obtenidas para
li (ecu. 7.16).
3. Calcular y^(t + d j t) usando el predictor (ecu. 7.14).
4. Calcular la se~nal de control usando (ecu. 7.15).
5. Supervisar el perfecto funcionamiento del control.

7.5.6 Supervision
Un requerimiento basico del algoritmo de control adaptativo es que el bucle cerrado
es estable si los parametros estimados convergen a ciertos valores. Para garantizar
Aplicacion de control adaptativo 149

dicha convergencia deben cumplirse ciertas condiciones, las cuales dependen del tipo
de perturbaciones y de si la entrada es lo su cientemente rica.
Como se ha comentado se pueden conseguir una serie de mejoras en el compor-
tamiento del sistema en bucle cerrado si paralelamente al algoritmo se mantiene un
cierto nivel de supervision que chequee los parametros fundamentales del proceso:

 los parametros estimados.


 La variable de control.
 La evolucion del identi cador.

En el caso concreto de la planta solar las medidas tomadas son las siguientes:

1. En cuanto a la identi cacion de la planta, sabemos que la ganancia del sis-


tema es negativa e inferior a un cierto valor. Por ello la ganancia identi cada
es ltrada antes de considerarla como valida, para evitar una identi cacion
erronea, que se puede producir en los casos en que la irradiancia (principal
parametro de la planta que vara), disminuye y por tanto la ganancia iden-
ti cada aparentemente sera positiva, dado que a una disminucion de ujo le
correspondera una disminucion de temperatura.
^b(k) < Co y ^bf (k + 1) = r^bf (k) + (1 r)^b(k + 1)
El identi cador trabaja con las variaciones de temperatura y ujo con res-
pecto a los valores de regimen permanente, estando dados estos valores por
la temperatura de referencia y por el ujo calculado por el controlador en
adelanto.
Mas concretamente, el polo estimado del sistema en bucle abierto debe variar
entre 0.85 y 0.95 y la ganancia estatica del sistema entre 0.9 y 1.2. Estos
margenes se han escogido analizando la respuesta dinamica del sistema, y son
necesarios pues si se produce una estimacion erronea de los parametros puede
llegar a hacerse inestable el proceso.
La temperatura de referencia para el control por adelanto se ltra antes de ser
usada por el identi cador para cancelar dinamicas no modeladas.
Este ltro es de la forma:
tfff = 0:5 tff + 0:5 tfff
150 Estudios de simulacion

donde tff es la temperatura de referencia para el controlador por adelanto


calculada por el regulador del sistema en bucle cerrado (predictivo, etc.) y
tfff es la temperatura de referencia al control por adelanto ltrada, que es la
que se da como entrada al identi cador.
2. La traza de la matriz de covarianza del identi cador es chequeada en cada
instante, acotandola de la forma,
Traza de P (k) < Po =) P (k) = P (k) + R
3. La variable de control esta saturada en mas o menos un 20% del valor de
ujo calculado en bucle abierto (feedforward). Ademas se utiliza un control PI
cauteloso al comienzo del control, modi cando la expresion 7.6 por:
1
qo = (2  b + traza (P (k))  b)
4. Como se ha comentado el mecanismo de estimacion de parametros solo fun-
ciona cuando la se~nal de entrada contiene su ciente informacion dinamica.
Estas consideraciones pueden tenerse en cuenta chequeando el cumplimiento
de las siguientes condiciones:
j 4u j A
kX
=0
j 4u(k) j B
k= N
Si una de estas condiciones es verdadera, se activa el identi cador. En otro
caso se usa el ultimo conjunto de parametros identi cados. Los valores tpicos
de A, B y N escogidos en simulacion son: A = 9, 7  B  9 y N = 5.
5. Respecto a los mecanismos de adaptacion, solo funcionan cuando los valores
estimados se encuentran contenidos en los rangos (0:85  a^  0:95 y 0:9 
k^est  1:2, donde k^est es la ganancia estimada de la planta ^b=(1 a^)) para evitar
inestabilidad en casos de no convergencia del estimador. Un controlador jo
se usa en situaciones en que no se cumplen estas condiciones (por ejemplo en
el comienzo de la operacion).

7.6 Estudios de simulacion


Se han realizado estudios de simulacion para evaluar la capacidad del modelo, la
identi cacion de los parametros y la actuacion del controlador autoajustable. El
controlador se ha evaluado mediante el modelo no lineal desarrollado.
Aplicacion de control adaptativo 151

950 295

<-- Radiacion grC


900

850 290
Radiacion (w/m^2)

800
Temperatura (grados C) -->
750 285

700

650 280

600 277
10 11 12 13 14 15 16 17

Tiempo (Horas)

Figura 7.5: Respuesta simulada a cambios de referencia con compensacion serie

La gura 7.5 corresponde a la simulacion de un perodo de 8 horas con radiacion


solar en forma senoidal con una se~nal de ruido sumada para simular peque~nas nubes
dispersas. La temperatura de referencia es una onda cuadrada con cambios entre
280 oC y 285 oC . En este caso el controlador utilizado es un PI adaptativo, como
el que se ha descrito en los apartados anteriores.
Como se ha comentado anteriormente la caracterstica dinamica del campo vara
con el ujo. Como puede verse en la gura 7.5, durante el perodo de test, el nivel de
irradiancia varia entre 600 y 900 watts=m2 . La variacion necesaria en el ujo nominal
para mantener la temperatura de salida en el rango de 280-285, se mostrara similar
a la de la irradiancia I , (un decremento en la irradiancia I , requiere un decremento
en el ujo de aceite para mantener una temperatura de salida ja y viceversa).
El tiempo de retardo se reduce y la velocidad de respuesta de la planta aumenta
con el incremento de ujo de aceite. Por lo tanto, comparando con valores bajos
de la irradiancia I , cuando la irradiancia I es alta, (correspondiendo un ujo alto),
el tiempo de retardo se reducira, as como la constante efectiva del modelo de la
planta. Esto ultimo se corresponde con un valor bajo del polo a. Puede verse como
la variacion en el polo a, en el perodo de test, sigue las variaciones en la irradiancia
I.
152 Resultados en planta

Referente a la funcion de transferencia del modelo de la planta, el valor mnimo


del retardo viene dado cuando b1 = 0, y el maximo retardo cuando b0 = 0. Por lo
tanto, el termino normalizado jb0=(b0 + b1 )j, se incrementara con un valor alto del
nivel de irradiancia, I , (incremento de ujo y decremento del tiempo de retardo).
La respuesta simulada muestra que jb0=(b0 + b1)j sigue la variacion en I , y da una
indicacion de como el modelo se acomoda a las variaciones en el tiempo de retardo.
Las variaciones de los parametros simulados muestra que para el caso de com-
pensacion serie, se ha obtenido la tendencia esperada en los valores. Sin embargo
en el caso de compensacion en paralelo, la variacion en escalones de la tempera-
tura de referencia provoca variaciones en el ujo que no son vistas por el estimador
y da valores erroneos de los parametros estimados. Los valores estimados de a y
jb0 =(b0 + b1 )j, varian sustancialmente, y cada cambio de referencia provoca saltos
considerables en los valores estimados y la tendencia hacia los valores correctos no
se sigue durante el perodo de test. Este efecto puede aliviarse si se introduce un
ltro al controlador en adelanto, para evitar estos cambios rapidos en la se~nal de
adelanto, correspondientes a los cambios de referencia.

7.7 Resultados en planta


Las estructuras de control mencionadas anteriormente han sido probadas en el
campo acurex de la planta solar de Tabernas (Almera), ello ha demostrado que
los controladores pueden operar en presencia de cambios en la dinamica del proceso
causados por cambios en las condiciones de operacion de la planta.
Como se ha mencionado anteriormente, el campo de colectores distribuidos puede
ser utilizado para diferentes propositos, en diferentes modos de operacion y con
condiciones de operacion variables (diferentes muestras de radiacion solar, tempe-
ratura de entrada de aceite, temperatura de referencia, etc). Todos estos factores
tienen, de esta forma, que ser tenidos en cuenta para evaluar las capacidades de las
posibles estrategias de control. Aunque los estudios de simulacion mencionados en
la seccion anterior ayudan considerablemente en esta tarea, se han realizado una
serie de tests en la planta real.
Como se ha inferido anteriormente, las caractersticas dinamicas de la planta
varian signi cativamente a lo largo del rango de operacion, lo cual hace difcil obtener
un buen control con un regulador PI jo. Esto puede verse en la gura 7.6 donde la
actuacion es buena a nivel bajo de ujo ( gura 7.7) de 8 litros/seg aproximadamente,
pero a alto nivel de ujo sobre 11 litros/seg la respuesta es signi cativamente mas
Aplicacion de control adaptativo 153

260

Fijo Adap.
255
Adap.
Fijo
Temperatura (grados C)

250 Fijo

245 Adap.

240

235

230
10 10.5 11 11.5 12 12.5 13 13.5 14

Tiempo (Horas)

Figura 7.6: Respuesta con regulador P.I. jo. Temperatura de salida

950 13.6

<-- Radiacion l/s

900 12.3
Radiacion (w/m^2)

850 11

800 9.6

750 8.3
flujo (l/s) -->

700 7.0
10 10.5 11 11.5 12 12.5 13 13.5 14

Tiempo (Horas)

Figura 7.7: Respuesta con regulador P.I. jo. Irradianza y ujo.


154 Resultados en planta

oscilante y tiene mayor tiempo de establecimiento.


Las guras 7.8, 7.9 y 7.10 muestran resultados de la planta utilizando el contro-
lador PI autoajustable con incorporacion del controlador en adelanto en serie. Los
resultados son signi cativos ya que se muestra la actuacion durante unas 3 horas de
operacion cuando el nivel de irradiancia esta cambiando sustancialmente, debido a
la presencia de nubes dispersas.
Las perturbaciones injectadas son en la forma de cambios en escalones en la
temperatura de referencia. Esto genera informacion dinamica para la estimacion, as
mismo el resultado en la respuesta de la temperatura de salida sirve para demostrar
la calidad de la actuacion del sistema de control.

800 310
grC
<-- Radiacion
700 295
Radiacion (w/m^2)

600 280

.. ...
... ................
500 ... 265
.. ..
..
... .. ........
... ....... ....... .....................
.. .. ..
-- PI fijo ..
400 .. .. 250
.. . ......................
.. Adaptativo .
.
.
.... ........ ........
.. . ......... ....
.
300 .... ..
Temperatura (grados C) --> 235
.. . ..
.... . ... ......... ..............................
. .. . . ........
. ..... ..
.. .. ..... .......... .. .
....... ..... ...
200 220
11.5 12 12.5 13 13.5 14 14.5

Tiempo (Horas)

Figura 7.8: Salida con control PI adaptativo


El perodo desde las 11:39 a las 12:46 corresponde a la fase de puesta en marcha
de la planta, cuando el aceite esta recirculando, y el controlador esta en perodo de
autoajuste. Despues de este perodo, se obtiene un buen seguimiento a la respuesta
en escalon, permaneciendo la temperatura de referencia muy proxima a la se~nal
de referencia, a pesar de los cambios signi cativos en el nivel de irradiancia de
esta experiencia. Esto ultimo demuestra los efectos bene ciosos del controlador por
adelanto en serie, el cual no solo sirve para reducir las variaciones no esperadas en
la temperatura de salida sino que tambien reduce las desviaciones erroneas en los
Aplicacion de control adaptativo 155

0.94 1.2

0.92 1.0
<-- a

0.9 0.8
Polo a

0.88 0.6
|b0/(b0+b1)| -->

0.86 0.4

0.84 0.2

0.82 0.0
11.5 12 12.5 13 13.5 14 14.5

Tiempo (Horas)

Figura 7.9: Evolucion de los parametros

0.05
b0

-0.05
11.5 12 12.5 13 13.5 14 14.5
Tiempo (Horas)

0.1

0.08

0.06
b1

0.04

0.02

0
11.5 12 12.5 13 13.5 14 14.5
Tiempo (Horas)

Figura 7.10: Evolucion de los parametros


156 Resultados en planta

parametros estimados.
Esto puede verse en la respuesta de los parametros estimados de la gura 7.9
en la que el parametro estimado (a), muestra cambios suaves durante el perodo
del experimento. Este sigue las variaciones experadas necesarias para igualar los
cambios en la respuesta caracterstica del sistema. Los niveles de irradiancia y la
temperatura de salida requerida determinan el ujo de aceite necesario, el cual a su
vez determina la velocidad de la respuesta del sistema y el tiempo de retardo.
Mediante los tests de control realizados en la planta, es difcil demostrar las
ventajas relativas de un controlador con respecto a otro. Dado que las condiciones
exactas de nivel de irradiancia y de temperatura de entrada nunca pueden ser re-
producidas. Sin embargo, en orden a dar una indicacion de la mejora producida por
el esquema de control PI adaptativo autoajustable sobre un controlador jo tipo
PI, las condiciones de irradiancia para el test correspondiente a la gura 7.7 (para
un controlador jo PI), son aplicadas en un estudio de simulacion al controlador
autoajustable. La respuesta de la temperatura de salida para el caso adaptativo se
superpone como se muestra en la gura 7.6.
Puede verse que el regulador de parametros jo PI trabaja bien para las condi-
ciones correspondientes al primer escalon, pero para los otros escalones, donde el
nivel de irradiacion es mayor, el comportamiento se deteriora. El controlador autoa-
justable por otro lado, una vez que los parametros se han ajustado, proporciona un
comportamiento mejor el cual se mantiene a pesar de los cambios en las condiciones
de operacion.
Tambien, para las condiciones del experimento de la gura 7.8, las condiciones
de irradiancia se han aplicado al modelo de simulacion incorporando el controlador
de parametros jos PI. Otra vez puede verse que el controlador jo PI, el cual
esta ajustado para las condiciones de ujo medio, tiende a oscilar cuando el nivel
de ujo es bajo, caso que se produce al nal del test cuando la temperatura de
referencia es alta (270 oC ) coincidiendo con nivel bajo de irradiancia (alrededor de
600 watts=m2 ). El esquema de control adaptativo autoajustable funciona mucho
mejor que el controlador jo, ante los cambios en la caracterstica dinamica de la
planta, que corresponden a un da de operacion con variaciones grandes del nivel de
irradiancia.
La gura 7.11 muestra la temperatura de salida del aceite y la referencia cuando
se aplica el GPC adaptativo. El valor de  escogido fue 5, y, como se aprecia se
obtiene una respuesta muy rapida ante cambios en la referencia (tiempo de subida
del orden de 7 minutos). Para tener menor sobreoscilacion el factor de ponderacion
Aplicacion de control adaptativo 157

190.0
set point/outlet temperatures ( C)

180.0

170.0

160.0
11.0 11.5 12.0 12.5 13.0 13.5 14.0 14.5
local time (hours)

Figura 7.11: GPC Adaptativo: Temperatura de salida del aceite

730.0

710.0
Radiacion solar (W/m2 )

690.0

670.0

650.0

630.0
11.0 11.5 12.0 12.5 13.0 13.5 14.0 14.5
tiempo local (horas)

7.0

6.5
flujo de aceite (l/s)

6.0

5.5

5.0

4.5
11.0 11.5 12.0 12.5 13.0 13.5 14.0 14.5
tiempo local (horas)

Figura 7.12: GPC Adaptativo: Radiacion solar y caudal de aceite


158 Resultados en planta

debe aumentarse. La evolucion de la radiacion en este test se puede comprobar en la


gura 7.12. Corresponde a un da con peque~nas nubes. El caudal de aceite, cambio
desde 4.5 l/s a 7 l/s, y el controlador pudo mantener un buen comportamiento ante
cambios en la dinamica del proceso.
Debido al hecho de que las condiciones de un ensayo no se pueden reproducir
de forma exacta, para comparar el comportamiento de los esquemas de control
propuestos, se utilizaron los datos de un da de operacion con un controlador PI jo
para simular el comportamiento de todos los esquemas de control comentados.
La gura 7.13 muestra los resultados obtenidos aplicando el controlador PI jo
a la planta y los resultados obtenidos aplicando los dos controladores adaptativos
PID y el GPC. El PI jo funciona bien para las condiciones en las que fue dise~nado,
pero no muy bien fuera de ellas.
260.0
temperatura de referencia
controllador PI fijo
controlador PID Z-N adaptativo
controlador Z-N PID adaptativo completo
controlador GPC adaptativo
referencia/temperatura de salida (C)

255.0

250.0

245.0

240.0
10.2 10.7 11.2 11.7 12.2 12.7 13.2 13.7 14.2
tiempo local (horas)

Figura 7.13: PI jo, PID adaptativo y GPC adaptativo


Captulo 8
El problema del control robusto
8.1 Introduccion
Las caractersticas del dise~no de un sistema de control van a depender en gran me-
dida, de la delidad con la que el modelo empleado describa el comportamiento del
sistema. Uno de los principios del modelado de sistemas es el de simpli cacion;
consistente en que de la forma mas simple posible el modelo capte los rasgos funda-
mentales bajo analisis del proceso.
Un proceso real puede ser extremadamente complejo para ser descrito de forma
absolutamente precisa por un modelo matematico, en cuyo caso se habla de errores
de modelado. Si se a~nade el hecho de que se trata de describir al sistema con
un modelo lineal e invariante en el tiempo, ello implica otro conjunto de hipotesis
simpli cadoras que incrementan los errores de modelado originales o residuales.
Se puede considerar por tanto, que cualquier modelo matematico de un proceso
real va a ser en mayor o menor grado impreciso, o dicho de otra forma va a contar
con incertidumbres o errores de modelado.
Si se desea controlar de manera e ciente un proceso real, se debera de tener
informacion sobre las posibles fuentes de incertidumbres, evaluando su efecto sobre
el comportamiento del sistema completo.
La necesidad de cumplir unas especi caciones de dise~no cada vez mas exigentes,
ha llevado a tener en consideracion aspectos de importancia practica en el desarrollo
159
160 Introduccion

de los sistemas de control. De forma que el comportamiento del sistema se mantenga


aceptable en un ambiente realista, en el que las incertidumbres van a estar siempre
presentes.
Entre los principales factores causantes de los errores de modelado pueden des-
tacarse:

1. Modi caciones en el punto de trabajo de la planta o con respecto al modelo


nominal.
2. Dinamica no lineal no considerada.
3. Dinamica de alta frecuencia no modelada.
4. Retardos de tiempo no contemplados.
5. Imprecisiones en los parametros, debidas al metodo de identi cacion y/o mo-
delado empleado.

Estos factores se pueden agrupar en dos grandes grupos: las incertidumbres


parametricas (1) y (5) y las estructurales (2), (3) y (4). Con respecto al conoci-
miento disponible sobre las causas de las incertidumbres puede distinguirse entre
incertidumbre estructurada y no estructurada.
En el caso de incertidumbre no estructurada solo se conoce que existen discre-
pancias entre el modelo y la planta real, y posiblemente puede conocerse tambien el
tama~no de las desviaciones de determinadas medidas entrada/salida (por ejemplo, la
discrepancia en la respuesta frecuencial causada por la dinamica de alta frecuencia
no modelada y/o diferencia en la respuesta temporal debido a la no consideracion
de un elemento no lineal).
Si se conoce de la incertidumbre que en cierta medida se debe a algunos elementos
diferenciados de la planta, en la forma de tolerancias de sus valores (por ejemplo,
la incertidumbre en el valor de un polo y/o un cero), en ese caso se trata de una
incertidumbre estructurada.
Es posible tambien, que se tenga un conocimiento parcial y separado de las
fuentes de incertidumbre, en cuyo caso tambien podra hablarse de incertidumbre
parcialmente estructurada (por ejemplo, el hecho practico de que las incertidumbres
existentes en distintos actuadores sean independientes entre s).
A la hora de plantearse el dise~no de un sistema de control robusto para un proceso
con incertidumbres, surgen una serie de cuestiones escalonadas:
El problema del control robusto 161

1. Como modelar tales procesos.


2. Como analizar el sistema de control.
3. Como dise~nar el controlador.

Para resolver los 3 puntos anteriores, se hace necesario la introduccion de nuevos


conceptos y herramientas de calculo para el analisis y dise~no de sistemas de control.
El campo de aplicacion de esta nueva disciplina denominada control robusto, abarca
todos aquellos problemas que se caractericen por considerar incertidumbres en el
modelo que sean tolerables por un controlador jo lineal e invariante en el tiempo;
limitando con aquellos que necesitan un controlador variable (control adaptativo,
control por plani cacion de la ganancia).
Los objetivos de control tratan en cualquier caso, de que el controlador dise~nado
funcione bien cuando se implante en el proceso real. Este objetivo, a su vez puede
considerarse compuesto en una serie de subobjetivos. De estos, el principal es que
el sistema sea estable en lazo cerrado, para unas condiciones de trabajo dadas o
nominales. Es lo que se denomina Estabilidad Nominal (NS).
Por otro lado, una vez conseguida la estabilidad es necesario que ciertas variables
del sistema presenten un comportamiento adecuado y en algunos casos optimo res-
pecto a una funcion de costes o ndice de comportamiento. Esto se tiene en cuenta
referenciandolo como Comportamiento Nominal (NP).
Es tambien muy importante, de cara a la aplicacion industrial, que se tenga en
cuenta en el dise~no el conocimiento que se posea de la incertidumbre en el modelo.
Otro requerimiento que se va pedir a un sistema de control es que sea estable en lazo
cerrado, para el conjunto de posibles plantas que se puedan dar como consecuencia
de la incertidumbre en el modelo de la planta. El objetivo perseguido se denomina
Estabilidad Robusta (RS).
Si ademas se considera que para todas las plantas posibles no basta con que
el sistema de control permanezca estable sino que han de cumplirse unas especi-
caciones de funcionamiento, se considerara que se esta aludiendo al concepto de
Comportamiento Robusto (RP).
En la gura 8.1 queda resumido el problema de dise~no y los diferentes niveles de
exigencia que se establecen sobre un sistema de control, tal y como se ha descrito
anteriormente.
El control de sistemas con incertidumbres entra dentro del campo de estudio de la
162 Introduccion

PROCESO - Complejo
REAL

?
Simpli caciones

? ?
Modelo Incertidumbres
matematico

-


?
Sistema
de Control

Comportamiento
?
? Robusto
Estabilidad (RP)
?
Comportamiento Robusta
? (RS)
Estabilidad Nominal
(NP)
Nominal
(NS)

Figura 8.1: Planteamiento del problema de control


El problema del control robusto 163

disciplina conocida como Control Robusto. La decada de los ochenta se considera el


perodo de desarrollo de dicha teora, pudiendose destacar entre otros los desarrollos
teoricos realizados durante este perodo: 1) Metodos H1 (Zames y Francis, 1983;
Doyle et al, 1989); 2) metodos LTR (Loop Transfer Recovery) (Doyle y Stein, 1981,
Stein y Athans, 1987); 3) metodo de dise~no IMC (Internal Model Control) (Morari
et al, 1989); 4) metodos de Kharatinov (Barmish, 1993); 5) metodo de Sntesis-
(Balas et al, 1991); 6) metodo GPC (Generalized Predictive Control) (Clarke et al,
1989); 7) metodo QFT (Quantitative Feedback Theory) (Horowitz, 1982).
Las principales aplicaciones de la teora de control robusto realizadas en los
ultimos a~nos se han llevado a cabo en las areas de control de procesos qumicos,
robotica, estructuras exibles y control de aeronaves (Dorato, 1993). Como con-
secuencia de los buenos resultados obtenidos, y del interes despertado en la comu-
nidad cient ca y tecnica por la nueva disciplina, han surgido diferentes paquetes de
CACSD (Dise~no de Sistemas de Control Asistido por Computador) para el dise~no
de sistemas de control robusto, como ejemplos signi cativos se pueden citar: Pro-
gram CC (Thompson, 1988), Robust-Control Toolbox (Chiang y Safonov, 1992)
y -Analysis and Synthesis Toolbox (Balas et al, 1991) ambos para Matlab. Este
captulo se centra en los metodos H2 , LTR y H1, habiendose empleado para el dise~no
y analisis de los controladores, los dos paquetes de CASCD citados anteriormente
en primer lugar.

8.2 Relaciones fundamentales


La calidad de un dise~no va a depender en gran manera, del grado de aproximacion
con el que se recojan, de forma matematica, los deseos de como se quiere que funcione
el sistema bajo ciertas condiciones. Y por tanto, del conocimiento que se tenga de
la planta, as como de lo que se le exija al sistema de control. Esto ultimo, quedara
re ejado como las especi caciones de dise~no a cumplir por el controlador.

Relaciones fundamentales de control


Un sistema de control generico puede verse representado en la gura 8.2, donde:
G representa la planta, K el controlador, di; do las perturbaciones que afectan al
proceso, r la referencia o consigna, y la respuesta del sistema y n el ruido ligado a
las medidas de los sensores.
164 Relaciones fundamentales

di o d
r- h e
K
u- ?
h G - h r y-
?
- 6
?hn

Figura 8.2: Sistema de control y se~nales signi cativas

Para caracterizar el comportamiento de un sistema de control resulta util de nir


una serie de operadores, o matrices (funciones en el caso escalar) de transferencia:

 Lazo Abierto o Razon de Retorno:


Li = KG ; Lo = GK

 Diferencia de Retorno:
Fi = I + Li ; Fo = I + Lo

 Sensibilidad:
Si = Fi 1 ; So = Fo 1
 Sensibilidad Complementaria:
Ti = I Si ; To = I So

 Sensibilidad del Control:


N = KSo

donde los subndices fi; og hacen referencia a que el operador se de na a la entrada


o a la salida de la planta respectivamente.
Del diagrama de bloques de la gura 8.2, pueden obtenerse las siguientes fun-
ciones (matrices en el caso de sistemas multivariables) de transferencia que van a
determinar las propiedades mas relevantes a tener en cuenta para el dise~no de un
sistema de control:
El problema del control robusto 165

1. Estabilidad interna: El sistema es internamente estable si son estables (ver


apendice B.1) cada uno de los elementos de la matriz R, que relaciona los
vectores r; di con y; u, siendo:
" # " #
y =R r
u di
donde: " 1G #
GK (I + GK ) 1 ( I + GK
R = K (I + GK ) 1 K (I + GK ) 1G )

2. Comportamiento entrada-salida:
y = To(r n) + Sodo + So Gdi (8:1)
e = r y
= So (r do n) SoGdi (8.2)
3. Sensibilidad del sistema a peque~nos cambios en los parametros de la planta:
Si la funcion (matriz) de transferencia en lazo abierto L0o (s) sufre una desviacion
con respecto a la nominal Lo(s) debido a peque~nas variaciones en los parame-
tros de la planta y/o del regulador, la correspondiente desviacion de la funcion
(matriz) de sensibilidad complementaria To(s) viene dada por (MacFarlane,
1970):
To 1(s)To(s) = So(s)Lo 1(s)Lo (s) (8:3)
que es la generalizacion matricial de la relacion escalar de Bode (Kwakernaak,
1972):
d ln T = dT=T = S
d ln L dL=L
4. Demanda de control:
u = KSo (r n do) + Sidi (8:4)

El conjunto de ecuaciones 8.1-8.4 resumen los bene cios fundamentales y ob-


jetivos de dise~no inherentes a los sistemas de control realimentados. De ellas se
desprende la existencia de una serie de objetivos contrapuestos:

1. De 8.2, se deriva que los errores de seguimiento del sistema e en presencia de


cambios de consigna r y el efecto de perturbaciones do actuando a la salida de la
planta pueden hacerse "peque~nos", procurando que el operador de sensibilidad
So sea\peque~no" tambien (o equivalentemente Lo lo bastante grande). Para
atenuar convenientemente las perturbaciones que actuen a la entrada de la
planta di sera necesario que el producto SoG se mantenga lo menor posible.
166 Relaciones fundamentales

2. De la ecuacion 8.3, se deriva la conveniencia de mantener So (s) lo menor


posible, ( Lo (s) lo mayor posible), a n de que el efecto de peque~nas variaciones
de parametros en la planta no afecten de manera sensible al comportamiento
del sistema en lazo cerrado.
3. Sin embargo, el aumentar excesivamente la ganancia en lazo abierto (Lo) o
equivalentemente disminuir So, hace que dada la relacion existente entre So y
To se provoque un aumento de la magnitud de To , produciendo dos consecuen-
cias negativas:
(a) Una posible ampli cacion del ruido de medida n y su transmision a la
salida del sistema.
(b) Una mayor sensibilidad del sistema a los efectos de la dinamica no mo-
delada de alta frecuencia.
4. El esfuerzo de control u requerido para rechazar las perturbaciones actuantes
sobre el sistema y conseguir una buena regulacion depende de las magnitudes
de Si; So; K . Por tanto si se pretende que u no sea excesivo sera necesario man-
tener So, y Si lo su cientemente bajas. Pero dado que a su vez estas dependen
inversamente de K , disminuir las primeras supone aumentar la ultima.

Se presentan pues objetivos contradictorios, debiendose llegar en cada problema


de dise~no a una solucion de compromiso. Habitualmente la dinamica inmodelada de
alta frecuencia es la que da lugar a los mayores niveles de incertidumbre. Teniendo
en cuenta que el ruido de medida suele ser tambien de alta frecuencia, y que las
caractersticas de los sistemas dinamicos pueden muy bien asemejarse a ltros pasa
bajo, una forma de resolver el problema planteado con los objetivos contrapuestos
anteriores, es procurando que cada uno se cumpla en un rango de frecuencias de
interes.
Se pueden establecer tres zonas de frecuencias, de forma que dentro de cada una
se trata de conseguir unos objetivos primordiales (ver gura 8.3):

 Zona de baja frecuencia: En la que se requiere alta ganancia para conseguir:


{ Buen seguimiento de la referencia.
{ Adecuado rechazo de perturbaciones.
{ Reduccion de la sensibilidad del sistema a peque~nos cambios en los para-
metros de la planta.
El problema del control robusto 167

kLk
ZONA FRECUENCIA DE CRUCE
(db) QQ - Estabilidad
QQ - Velocidad de respuesta
Q QQ
0 QQ
QQ
QQ
QQ ZONA DE ALTA FRECUENCIA
ZONA DE BAJA FRECUENCIA
BB - Rechazo ruido en sensores
- Seguimiento de consigna
- Rechazo de perturbaciones BB - Estabilidad Robusta
- Comportamiento Robusto BB
- Peque~nos cambios en parmetros
BB
! (rad/s)

Figura 8.3: Zonas de frecuencias de interes


 Zona de frecuencia intermedia: Va a ser determinante de propiedades tales
como:
{ Estabilidad y margenes de estabilidad.
{ Velocidad de respuesta y ancho de banda.
 Zona de alta frecuencia: Se va a requerir baja ganancia para:
{ Rechazo del ruido de los sensores.
{ Estabilidad robusta.
Las especi caciones de control pueden darse en el dominio frecuencial. Una
forma de hacerlo es empleando funciones dependientes de la frecuencia, o de pon-
deracion, para acotar las magnitudes de los operadores de sensibilidad y sensibilidad
complementaria. Para el caso de un sistema escalar pueden venir dados de la forma:
j S (j!) j wS (!) y j T (j!) j wT (!) 8 !
Se pueden obtener las siguientes aproximaciones:
( )
j S
j L j 1 () j T j 1j 1
168 Relaciones fundamentales
( )
j L j 1 () jj TS j
j 1
1
Para el rango de frecuencias donde j L j 1, las propiedades del sistema en lazo
cerrado dependen crticamente del valor de la fase del lazo abierto; as se tendra
que:
jLj1 j S j 1
()
arg L(j!)  180 j T j 1

Reglas practicas para el dise~no


Las aproximaciones anteriores llevan a una serie de reglas utiles a la hora de realizar
la sntesis de un sistema de control:

 Alta ganancia en lazo abierto lleva a baja sensibilidad y buenas propiedades


de rechazo de perturbaciones y seguimiento de la referencia (np).
 Peque~na ganancia en lazo abierto es adecuada para que la respuesta debida al
ruido en sensores sea considerablemente baja, y para mantener la estabilidad
del sistema frente a incertidumbres en la planta (rs).
 A frecuencias cercanas a la frecuencia de cruce de ganancia, la fase del sistema
debe permanecer acotada lo su cientemente alejada de 180, para propor-
cionar unos adecuados margenes de estabilidad y para prevenir la ampli cacion
de perturbaciones y ruidos.

El conjunto de reglas anteriores constituyen la base del dise~no clasico en el do-


minio frecuencial (Freudenberg et al, 1988, Maciejowski, 1989), consistente en que
a partir del ajuste de la ganancia en lazo abierto se consiguen unas especi caciones
de dise~no dadas en lazo abierto y/o cerrado. Otras tecnicas realizan tambien el
proceso de ajuste en frecuencia, pero empleando directamente las funciones (matri-
ces) de transferencia en lazo cerrado. En el captulo 9 se presentan algunas tecnicas
de ajuste de las ganancias en lazo abierto (ltr), mientras que en el captulo 10 se
describen algunos metodos para el ajuste de las ganancias en lazo cerrado (H2; H1)1 .
1La tecnica de ajustar las formas de las respuestas en frecuencia de ciertas funciones (matrices)
de transferencia se conoce en general como Loop Shaping, en terminologa inglesa.
El problema del control robusto 169

Extension de conceptos a sistemas multivariables


El concepto de ganancia de un sistema puede extenderse a sistemas multivariables
haciendo uso de las relaciones entre las normas (ver apendice B.2) de las se~nales
vectoriales de salida y entrada al sistema.
En general, si k x k representa a cualquier norma de un vector x, se de ne la
norma inducida de la matriz G por:
k G k= supx6=0 kkGx
xk
k

y en particular si se elige la norma Eucldea (de un vector complejo x):


p
k x k= xH x
(donde xH representa el vector traspuesto conjudado de x), la norma inducida de la
matriz es la norma espectral o de Hilbert:
k G ks= 
donde 2 es el autovalor maximo de la matriz GH G o de su traspuesta GGH , donde
GH es la matriz traspuesta conjugada de G (ver apendice B.3).
Si se tiene una matriz de transferencia G(s), con s = j!, y (0  !  1), entonces
su norma espectral va ser una funcion de !. Por tanto la norma k G(s)u(s) k va a
depender de la direccion del vector u(s) y de la frecuencia !. Para cada valor de
frecuencia es posible hallar unas cotas de la magnitud:
k G(s)u(s) k
k u(s) k
que reemplazan el concepto de ganancia simple por el de rango de ganancias, estando
este acotado (superior e inferiormente). Estas cotas son las denominadas ganancias
principales extremas:  [G(j!)],  [G(j!)], que pueden calcularse a partir de los
valores singulares maximo () y mnimo () de la matriz de transferencia G(j!)
(ver apendice B.3) para cada frecuencia !.
Para el caso de un sistema multivariable, las especi caciones de dise~no pueden
darse empleando las ganancias principales extremas:
 (j!)]  wS (!)
170 Relaciones fundamentales

 (j!)]  wT (!)


donde igual que para el caso escalar, las funciones de ponderacion (wS (!); wT (!))
se eligen de forma que se tengan en cuenta los objetivos a cumplir en cada intervalo
de frecuencias de interes:

1. Baja frecuencia:
(S )  1
i (T )  1
2. Frecuencia intermedia:
j i(j!) j i(j!)
con mg,mf satisfactorios (ver apendice B.4).
3. Alta frecuencia:
(T )  1

Teniendo en cuenta que para cualquier matriz arbitraria Q y su matriz unitaria I


se cumple:
maxf0; (Q)g  (Q + I )  (Q) + 1
maxf0; (Q)g  (Q + I )  (Q) + 1
se pueden transformar las especi caciones anteriores, empleando las ganancias prin-
cipales extremas en lazo abierto:

1. A baja frecuencia:
(L)  (1S ) si (L)  1
2. A alta frecuencia:
(L)  (T ) si (L)  1

Las aproximaciones anteriores proporcionan una forma de transformar las especi-


caciones sobre (T ) y (S ), en expresiones de la matriz de transferencia en lazo
abierto (ver gura 8.4):
1=(j!)]  wS (!)
(j!)]  wT (!)
El problema del control robusto 171

dB
(L)

RS
T
NP
0
S-1
(L)

Figura 8.4: Correspondencia especi caciones lazo cerrado-lazo abierto

8.3 Descripcion de las incertidumbres


Un diagrama de bloques general de un sistema de control de una planta con incer-
tidumbres queda representado en la gura 8.5, donde E representa los errores de
modelado existentes en la planta.
De las posibles formas de representar el conocimiento impreciso que se tiene en el
caso de un proceso escalar (incertidumbre tipo aditivo, multiplicativo etc.), cuando
se trata de un sistema multivariable hay que considerar algunos otros casos; pues
habra que tener en cuenta su situacion en el lazo de control. As por ejemplo, la
incertidumbre de tipo multiplicativo podra estar a la entrada o a la salida, o incluso
podran coexitir ambas simultaneamente. En cada caso habra que analizar el sistema
en concreto y tratar de plasmar los errores de modelado de la forma mas conveniente.
Las incertidumbres multiplicativas son las mas frecuentemente empleadas, debido
a que satisfacen las propiedades intuitivas de ser peque~nas a baja frecuencia (donde
el modelo de la planta nominal es generalmente bien conocido), y por otro lado son
elevadas para alta frecuencia (donde el modelo es siempre mas impreciso). Habitual-
mente el nivel de incertidumbre aumenta con la frecuencia, debido principalmente a
172 Descripcion de las incertidumbres

E
di do
6
?
- - -
r e u ? ? - y

- 6
K  G 

? n

Figura 8.5: Sistema de control con incertidumbres en la planta
la dinamica no modelada de alta frecuencia (sensores, actuadores, modelos de orden
reducido de la planta). Si bien, hay diversas formas de caracterizar la incertidumbre
que exista en un sistema de control, como se pasa a describir a continuacion.
La planta actual o real, G0 , puede expresarse de forma generica como:
G0 = G + G (8:5)
donde G es el modelo nominal de la planta, y G representa la incertidumbre o
errores de modelado presentes en el sistema.
El tratamiento que se hace es considerar que el conjunto de incertidumbres que
afectan al sistema puede ser representado por una incertidumbre equivalente, que se
mani esta de alguna forma espec ca en un lugar localizado. En ocasiones ello no
es posible, en cuyo caso se habla de incertidumbres simultaneas (dos o mas).
Los modelos de incertidumbres mas empleados son: aditiva (iA), multiplicativa
a la entrada/salida (iMi y iMo) de la planta, de realimentacion a la planta (iRp),
como bucle realimentado a la entrada/salida de la planta (iRi, iRo), (ver gura 8.3).

A continuacion se dan las expresiones correspondientes a cada una de ellas:

1. iA:
G0 = G + E
G = E
El problema del control robusto 173

-E -E
r- e K - ?e - G -y r- e K - G - e?-y
6 6

iMi iMo

r- e K - e -G y - r- e K-e G y -
6 6 6 6
E E

iRi iRp

-E
r- e K G -e y -
6 6 r- e K - G - ?e y-
E 6

iRo iA
Figura 8.6: Algunos tipos de incertidumbres
174 Descripcion de las incertidumbres

2. iMi:
G0 = G(I + E )
G = GE
3. iMo:
G0 = (I + E )G
G = EG
4. iRp:
G0 = (I + GE ) 1G
G = [(I + GE ) 1 I ]G
5. iRi:
G0 = G(I + E ) 1
G = G[(I + E ) 1 I ]
6. iRo:
G0 = (I + E ) 1G
G = [(I + E ) 1 I ]G

En general, a la hora de la descripcion analtica de las incertidumbres en la planta


estas pueden englobarse en dos grandes grupos: estructuradas y no estructuradas.

Incertidumbres no estructuradas
Para este tipo de incertidumbre, lo que se conoce de E (s) puede consistir en una
cota de su magnitud, generalmente dependiente de la frecuencia:
 (j!)]  (!) 8 ! (8:6)
Resulta interesante de cara a posteriores analisis el factorizar E (s) en la forma:
E (s) = e(s)(s) ; [(s)]  1 8! (8:7)

Todas estas descripciones albergan la posibilidad de acoplamiento entre distintas


fuentes de incertidumbres (por ejemplo, entre diferentes actuadores), considerando
el caso mas desfavorable (E (s) es una matriz con elementos no nulos fuera de la
diagonal principal). Pudiendo ocurrir, que se contemplen ciertas posibilidades que
El problema del control robusto 175

en la practica nunca se produzcan. Si eso ocurriera, el dise~no realizado se caracteri-


zara por ser excesivamente conservador.

Incertidumbre estructurada
Si de alguna manera se localizan las fuentes de las incertidumbres del sistema,
se tendra una descripcion mas ajustada o estructurada de los errores de modelado.
Esta puede estar constituida a su vez por multiples incertidumbres localizadas e in-
dependientes no estructuradas (Ei(s)). Las cuales pueden corresponder a dinamicas
no modeladas de los actuadores, de los sensores, o de la propia planta. As, para
cada uno de los bloques independientes Ei(s) se realiza la factorizacion:
Ei (s) = ei(s)i (s) ; [i (s)]  1 8! (8:8)
La incertidumbre completa E (s) del sistema queda de la forma:
E (s) = diag fEi (s)g i = 1; : : : ; p
siendo p el numero de bloques.
Los errores de modelado tambien podran consistir en imprecisiones en algunos
parametros del proceso, suponiendo en este caso una incertidumbre totalmente es-
tructurada o parametrica. Este ultimo caso se dara por ejemplo, si existe una
incertidumbre acotada en uno o varios polos y/o ceros de la planta, as como en la
cuanti cacion de los elementos de retardo.

Ejemplo: Incertidumbres aditiva y multiplicativa


Considerese un proceso en el que la dinamica de alta frecuencia no se ha consi-
derado en el modelo nominal G, de forma que el modelo completo o real de la planta
viene dado por

G0(s) = G(s)Es(s); con: Es(s) = 100( s2 + 2:4s + 144)


144(s2 + s + 100)

donde Es es la incertidumbre en el modelo nominal. Esta se puede interpretar a su


vez como una incertidumbre de tipo multiplicativo, aditivo, u otros. En el primer
caso se tendra:
G0 = G(1 + Em ); con Em = Es 1
176 Estabilidad robusta

10

0
Incertidumbre multiplicativa (dB)

-10

-20

-30

-40

-50

-60

-70
10 -1 10 0 10 1 10 2

rad/s

Figura 8.7: Magnitud de la incertidumbre multiplicativa


y para el caso de incertidumbre aditiva:
G = G + Ea; con Ea = G(Es 1)

En las guras 8.7 y 8.8 se muestran respectivamente las respuestas en frecuencia


(magnitudes) para cada tipo de incertidumbre. Puede verse como la incertidumbre
multiplicativa es peque~na a baja frecuencia, donde el modelo es bien conocido, y se
incrementa a medida que aumenta la frecuencia.

8.4 Estabilidad robusta


Si el sistema de control dise~nado con el modelo nominal es estable, interesa saber si
el sistema mantendra la estabilidad para cada uno de los elementos G0 del conjunto
G de plantas posibles:
G = fG0g
Para el analisis del problema anterior, es util obtener una representacion del
sistema como la de la gura 8.9.
El problema del control robusto 177

-10

-20

-30
Incertidumbre aditiva (dB)

-40

-50

-60

-70

-80
10 -1 10 0 10 1 10 2

rad/s

Figura 8.8: Magnitud de la incertidumbre aditiva

- E

a b
M 

Figura 8.9: Sistema de interconexion


178 Estabilidad robusta

Teorema de la Peque~na Ganancia


Este teorema ha jugado un importante papel en el desarrollo de la teora del con-
trol robusto (Dorato et al, 1987), y establece una condicion su ciente que garantiza
la robustez de la estabilidad de un sistema (Lunze, 1989):
Teorema: Dado el sistema representado en la gura 8.9, donde M y E repre-
sentan sistemas cuadrados (mismo numero de entradas que de salidas) y estables,
entonces el sistema en lazo cerrado sera estable si:
k EM k< 1
siendo k : k cualquier norma matricial compatible con el sistema (ver apendice B.2).
Tanto M como E pueden ser sistemas no lineales y/o invariables en el tiempo.
Sin embargo, el teorema establece solo una condicion su ciente para la estabilidad
del sistema en lazo cerrado.
Particularizando para el caso de sistemas lineales e invariantes en el tiempo (lti),
el sistema de la gura 8.9 sera estable si se cumple:
 (j!)M (j!)] < 1 8!

La idea de aplicar este teorema, para analizar la robustez de un sistema de


control con incertidumbres, se basa en el empleo de M (s) como el sistema visto por
la incertidumbre E (s). Al sistema M (s) se le denomina Sistema de Interconexion,
debido al hecho de que conecta la entrada "a" y la salida "b" de la incertidumbre
E (s).
En el caso de tratarse de sistemas lti, las se~nales externas, tales como pertur-
baciones y se~nales de referencia, no van a afectar a la estabilidad del sistema y de
cara al analisis de robustez solo interesa la forma de como es visto el sistema por la
incertidumbre.
Para llegar a la representacion anterior, se parte de la representacion convencional
de la planta y controlador, junto con los bloques de las incertidumbres que se tengan
localizadas, se realizan las transformaciones equivalentes necesarias de forma que el
resultado sea la separacion de la incertidumbre por un lado E (s) y del resto del
sistema M (s) (sistema de interconexion) por otro.
El problema del control robusto 179

Ejemplo: Analisis de robustez


Considerese un sistema de control con realimentacion unitaria, donde la planta nom-
inal G y el controlador K (regulador 1) estan dados por

G(s) = s12 ; K (s) = 10(ss++51)


El modelo real de la planta (incluida la incertidumbre) viene dado por,
G0(s) = G(s)[1 + Em(s)]
siendo,
Em (s) = s( 0s:30556 + 0:6667)
2 + s + 100

Para este caso (incertidumbre de tipo multiplicativo) el sistema de interconexion


coincide, salvo en signo, con la funcion de sensibilidad complementaria
M= T
y aplicando el teorema de la peque~na ganancia, la maxima incertidumbre admisible
o tolerable viene dada por:
j E j j M1 j = j T1 j

En la gura 8.10 se muestran tanto la incertidumbre j Em j (lnea a trazos),


as como la tolerancia del sistema de control a incertidumbres multiplicativas (lnea
continua). Como puede verse, el sistema veri ca la condicion exigida por el teorema
de la peque~na ganancia, y por tanto tendra una estabilidad robusta. En la gura 8.11
pueden verse las respuestas obtenidas para la planta nominal y la real, observandose
el efecto de la incertidumbre.
Si se modi ca el controlador (regulador 2), de modo que este sea ahora,

K (s) = 32(ss++21)
el test de la estabilidad robusta derivado del teorema de la peque~na ganancia no se
cumple, tal y como puede verse en la gura 8.12. Sin embargo, dicho teorema solo
aporta una condicion su ciente, y como se observa a partir de la respuesta temporal
del sistema con la incertidumbre dada en la gura 8.13, el sistema realmente s
180 Estabilidad robusta

60

40
Incertidumbre y tolerancia (dB)

20

-20

-40

-60

-80
10 -1 10 0 10 1 10 2

rad/s

Figura 8.10: Tolerancia e incertidumbre multiplicativa con el regulador 1

1.4

1.2

0.8
respuestas

0.6

0.4

0.2

0
0 1 2 3 4 5 6 7 8 9 10

tiempo (seg)

Figura 8.11: Respuestas con regulador 1 del sistema nominal y del real
El problema del control robusto 181

60

40
Incertidumbre y tolerancia (dB)

20

-20

-40

-60

-80
10 -1 10 0 10 1 10 2

rad/s

Figura 8.12: Tolerancia e incertidumbre multiplicativa con el regulador 2

2.5

1.5
respuestas

0.5

0
0 1 2 3 4 5 6 7 8 9 10

tiempo (seg)

Figura 8.13: Respuestas con regulador 2 del sistema nominal y del real
182 Estabilidad robusta

veri ca la condicion de estabilidad robusta, ya que aunque la respuesta temporal


sea poco amortiguada, s es estable.
Si se considera E (s) una incertidumbre no estructurada y el sistema es lineal e
invariante en el tiempo, se tiene el siguiente teorema que da condiciones necesarias
y su cientes para la robustez de la estabilidad (rs) del sistema de control en lazo
cerrado (Freudenberg et al, 1988; Morari et al, 1989)
Teorema: Supuesto el sistema de interconexion M (s) estable, y que la incer-
tidumbre E (s) es de tal clase que el sistema en lazo cerrado es estable si y solo si la
proyeccion del determinante det[I M (s)E (s)] a lo largo del contorno de Nyquist D
no envuelve al origen. Entonces, el sistema en lazo cerrado sera estable para todas
las incertidumbres E (s) tales que:  (j!)]  1 si y solamente si, se cumple alguna
de las siguientes condiciones equivalentes :
det[I M (j!)E (j!)] 6= 0 8 ! =  (j!)]  1
, [M (j!)E (j!)] < 1 8 ! =  (j!)]  1
,  (j!)] < 1 8!
, kM k1 < 1
En el caso de que la incertidumbre tenga una estructura diagonal de bloques,
de nida por el conjunto:
X = fE (s) = diag fEi(s)g = i (s)]   g (8:9)
el analisis de la robustez de la estabilidad (rs) con el resultado del teorema anterior
puede dar un resultado potencialmente conservativo, en el sentido de que suponga
solo una condicion su ciente. Se tiene sin embargo, el siguiente teorema de robustez
de la estabilidad (rs) menos conservador, al tener en cuenta la estructura de E (s)
(Morari et al, 1989; Freudenberg et al, 1988):
Teorema: Supuesto el sistema de interconexion M (s) estable, y que la in-
certidumbre E (s) es de tal clase que el sistema en lazo cerrado es estable si y solo
si la la proyeccion del determinante det[I M (s)E (s)] a lo largo del contorno de
Nyquist D no envuelve al origen. Entonces, el sistema sera estable en lazo cerrado
para todas las incertidumbres E (s) 2 X=1 si y solo si:
[M (j!)] < 1 8!

La de nicion de (M ) (valor singular estructurado ssv, apendice B.3) supone


una generalizacion del radio espectral (M ) y del maximo valor singular (M ).
El problema del control robusto 183

Analisis de robustez con los valores singulares


Como se ha presentado en apartados anteriores, hay diversas causas que originan la
existencia de incertidumbre en el modelo de la planta. Siendo de interes practico
el que, a la hora de plantear las especi caciones de dise~no, se tenga en cuenta el
conocimiento que se posea sobre la incertidumbre.
El planteamiento de un metodo, para el analisis de robustez de la estabilidad de
un sistema de control, puede establecerse de modo generico como sigue:

1. Supuesta un tipo de incertidumbre en el modelo del proceso, se situa en el


lugar del lazo donde se presuma que actue o pueda quedar re ejado su efecto.
2. El conocimiento que se tiene sobre la incertidumbre puede consistir en un cota
superior de la magnitud de la incertidumbre como funcion de la frecuencia (no
estructurada):
 (j!)] < e(!)
3. Se realizan las transformaciones adecuadas para llegar a la forma estandar de
analisis ( gura 8.9), con el sistema de interconexion y la incertidumbre en dos
bloques.
4. Por el teorema de la peque~na ganancia se tiene que una condicion su ciente (no
necesaria) para que el sistema sea estable para ciertos niveles de incertidumbres
es que:
(EM ) < 1 8!
o tambien:
 (E ) < (1M )

As por ejemplo, para una incertidumbre multiplicativa considerada a la salida


de la planta, el sistema de interconexion es: M = GK (I + GK ) 1 y el test para la
robustez se reduce a:
(E ) <  + (L) 1 ]

Se demuestra en la practica, que los tests para robustez de la estabilidad bajo


ciertas caractersticas de la incertidumbre dan condiciones excesivamente conser-
vadoras.
184 Estabilidad robusta

Para el caso de un sistema 2  2 el analisis con i (M ) supone implcitamente


que la incertidumbre actuante sobre el sistema sea en el caso mas desfavorable de la
forma:

caso a)
" #
e11 (s) e12(s)
e21 (s) e22(s)

Mientras que la incertidumbre podra darse de una forma mas estructurada,


donde las incertidumbres en cada canal sean independientes entre s, sin que se
afectaran con terminos de acoplamiento:

caso b)
" #
e1 (s) 0
0 e2(s)

O incluso que dichas incertidumbres fueran iguales en ambos canales:

caso c)
" #
e(s) 0
0 e(s)

Tambien, en algunos casos, puede ocurrir que el conocimiento que se tenga de la


incertidumbre consista en posibles intervalos donde se encuentren los parametros con
incertidumbres del modelo del sistema, en cuyo caso se tratara de una incertidumbre
muy estructurada o parametrica:

caso d)
2 3
66 k..1 .0. : : : 0 7
... 7
4 . . 5
0 0 ::: kn

En los sistemas reales puede darse en general una combinacion de los distintos
tipos de incertidumbre, pudiendo ser considerada parte como estructurada y parte
como no estructurada. Segun el conocimiento que se posea del tipo de incertidumbre
al que este sometido el sistema, se empleara unas determinadas herramientas de
calculo para el analisis de la robustez de la estabilidad. As para estimar los niveles
(o tolerancias) de incertidumbre permitidos, para los que el sistema mantiene su
estabilidad, se propone emplear en cada caso:
El problema del control robusto 185

caso a) El valor singular maximo del sistema de interconexion (M ):


1
(M )
caso b) El valor singular estructurado de M :
1
(M )
caso c) El radio espectral de M :
1
(M )
caso d) El valor singular estructurado real de M (Packard y Doyle, 1993):
1
R(M )

Se comprueba, que el conservadurismo decrece de a) hacia d), con lo que el co-


nocimiento (a priori) que se suministre sobre el tipo de incertidumbre existente en
el modelo del sistema va a ser de suma importancia.

Ejemplo: Robustez frente a incertidumbre parametrica


Considerese un sistema de control con realimentacion unitaria, cuya planta G y
su regulador proporcional K estan dados respectivamente por,

G(s) = s2s(s++ba) ; K (s) = k

Los valores de los parametros b; a; k se consideran constantes durante largos


perodos de tiempo, pero por otro lado son desconocidos. Estando caracterizada la
incertidumbre por los intervalos,
3  b  5; 0:5  a  0:5 5  k  15

Que puede a su vez ponerse de una forma conveniente para el calculo del sistema
de interconexion M , as como para que la incertidumbre este normalizada, es decir,
(E )  1; 8 !
186 Estabilidad robusta

Para ello, se hace:


b = bo + b1 1; j 1 j 1; bo = 4; b1 = 1
a = ao + a1 2; j 2 j 1; ao = 0; a1 = 0:5
k = ko + k1 3; j 3 j 1; ko = 10; k1 = 5

De esta forma, el bloque de incertidumbre E es una matriz diagonal constituida


por numeros reales con valor absoluto inferior o igual a la unidad,
E = diagf1; 2 ; 3g

1.2

1 sv(M)

0.8
sv(M), mu_real(M)

0.6

0.4
mu_real(M)

0.2

0
10 -1 10 0 10 1 10 2

rad/s

Figura 8.14: Analisis de robustez para incertidumbre parametrica


Los valores de bo ; b1 ; ao; a1; ko; k1 se han incluido en M , y dado que (E )  1, la
condicion su ciente para que el sistema tenga una estabilidad robusta es que,
 (M )  1; (caso mas conservador)

o si se tiene en cuenta el caracter parametrico de la incertidumbre, la condicion es


R(M )  1; (caso de incertidumbre parametrica)
El problema del control robusto 187

En la gura 8.14 se tienen ambos valores; observandose que mientras a partir


del analisis con (M ) no se cumple la condicion su ciente de estabilidad robusta,
esta s se veri ca si se emplea R(M ). En el primer caso se esta considerando una
situacion excesivamente conservadora e irreal, mientras que en el segundo caso se
esta explcitamente considerando que la incertidumbre es de tipo parametrica.

8.5 Comportamiento robusto


Dentro de las especi caciones de dise~no hay que considerar el comportamiento nomi-
nal (np) deseado del sistema en lazo cerrado. Este alude a aspectos relacionados con
el rechazo a perturbaciones externas actuantes sobre el sistema, a la reduccion de
los errores de seguimiento, al esfuerzo de control y a un comportamiento adecuado
aun en el caso de peque~nas variaciones en los parametros del modelo nominal de la
planta.
Como se ha visto anteriormente, una forma analtica de expresar los requerimien-
tos anteriores es mediante una relacion frecuencial basada en el modelo nominal de
la planta, de la forma:
S (j!)S (j!)]  1 (8:10)
donde WS (j!) es una funcion (matriz) de ponderacion que pone de mani esto los
per les deseados de la funcion de sensibilidad S (j!) en las distintas regiones de
frecuencia. Si el per l deseado es el mismo en todos los canales (especi cacion
homogenea) entonces: WS (s) = wS (s)I y queda:

 (j!)]  j w (1j!) j


S

El problema de analisis del comportamiento robusto (rp), consiste en determinar


si el sistema en lazo cerrado satisface las especi caciones de comportamiento para
todas las posibles plantas G0(s) 2 G . Sera determinar si se cumple:
S (j!)S 0(j!)]  1
supuesto que se veri ca 8.10 para la planta nominal G(s).
Dada la representacion del sistema de la gura 8.15, en la que se tienen carac-
terizadas las incertidumbres por ET (s); y donde se especi ca un np para el sistema
nominal expresado mediante una relacion entre dos se~nales (vectores) v y w, por
188 Comportamiento robusto

ET 

-
w - M v-

Figura 8.15: Analisis del comportamiento robusto

medio de: v = ES 1 w. Se tiene el siguiente teorema de robustez del comportamiento


(rp) (Freudenberg et al, 1989; Morari et al, 1989):
Teorema: Dado el sistema M(s) de la gura 8.15, supuesto estable y obtenido
con el modelo nominal de la planta, sujeto a la incertidumbre ET , con (ET )  1.
El sistema satisface la condicion de comportamiento robusto si y solo si:
(M ) < 1 8!
donde (M ) se calcula con respecto a la incertidumbre estructurada de forma diago-
nal E = diag fET ; ES g; siendo ES (s) una incertidumbre cticia con S (j!)]  1,
la cual esta relacionada con el comportamiento nominal deseado.
En el teorema anterior se realiza la transformacion del problema de rp en uno de
rs equivalente, con un bloque adicional de incertidumbre. Se hace al transformar la
especi cacion de np en lazo cerrado (expresada como una relacion entre dos se~nales
w y v), en una incertidumbre cticia representada por ES (ver gura 8.16) (Doyle
1983, Morari et al. 1989, Freudenberg 1989).
Con lo expuesto hasta ahora, los requerimientos para un sistema de control
pueden escalonarse en cuatro niveles de complejidad o exigencia:

1. El primero es el mas elemental e imprescindible: la estabilidad del sistema


nominal (ns).
2. A continuacion esta el conseguir un comportamiento nominal (np) deseado.
3. El tercer objetivo consiste en gozar de una estabilidad robusta (rs).
El problema del control robusto 189

ES 

ET 
E
-
w - M v

Figura 8.16: Equivalencia entre comportamiento robusto y estabilidad robusta

4. Y nalmente, que el comportamiento deseado se mantenga aun con la existen-


cia de incertidumbres, lo que supone un comportamiento robusto (rp).

Si se realiza una particion del sistema de interconexion (caso de rs para in-


certidumbres simultaneas, o rp para un tipo de incertidumbre actuando sobre la
planta): " #
M (s) = M MM 11 M 12
21 22

de forma que M (s) incluye el escalado apropiado para que la incertidumbre este
normalizada:  (s)] < 1, los objetivos anteriores pueden analizarse a partir de
M (s) empleando en cada caso (Skogestad et al, 1988; Freudenberg, 1989):

 ns: M es estable
 np: (M22 ) < 1 8 !
 rs: Segun sea estructurada o no estructurada la incertidumbre ET :
(M11 ) < 1 o (M11 ) < 1 8 !

 rp: (M ) < 1 8 !


190 Robustez de plantas con fuerte ganancia direccional

8.6 Robustez de plantas con fuerte ganancia di-


reccional
A diferencia de los sistemas escalares, un proceso multivariable se caracteriza porque
la ganancia que el sistema mani esta para una determinada perturbacion y/o consig-
na va a depender de la direccion espacial que esta tenga, dado su caracter vectorial.
Potencialmente puede haber una fuerte discrepancia entre las ganancias de la
planta para dos se~nales actuando en distintos canales o lazos. Una medida de la
direccionalidad de la planta se obtiene del numero de condicion de su matriz de
transferencia G(s), de nido como:

[G(j!)] = [[G (j!)]


G(j!)]
un valor elevado de (G) implica una fuerte dependencia direccional de G.
Las matrices con elevados numeros de condicion estan numericamente mal condi-
cionadas para el calculo de su inversa. Empleando este resultado, se dice que un
sistema esta mal condicionado para ciertas frecuencias si su matriz de transferencia,
a esas frecuencias, tiene un numero de condicion elevado. Si este es proximo a uno,
se dice que el sistema esta bien condicionado. Los valores singulares de las matrices
no son independientes de escalados, por lo que el numero de condicion de una planta
va a depender de las unidades empleadas a la entrada y a la salida de la planta.
Un controlador que compense la direccionalidad acusada de una planta, apli-
cando se~nales de control elevadas en la direccion donde la ganancia del sistema es
baja, puede dar buenos resultados si el modelo del proceso es muy preciso. Pero si
debido a las incertidumbres, la direccion del vector de control, de elevada magnitud,
generado no coincide exactamente con la direccion de baja ganancia de la planta,
entonces la ampli cacion de las se~nales de control pueden ser mucho mayores que
las esperadas con el modelo; resultando un comportamiento nada satisfactorio del
sistema de control.
Los problemas para el control de una planta con incertidumbres y una direcciona-
lidad acusada, se ponen especialmente de mani esto, cuando se analiza la robustez
de la estabilidad frente a incertidumbres simultaneas y/o la robustez del compor-
tamiento del sistema de control. Como se ha visto en el apartado anterior, en
ambos casos la herramienta de analisis es el valor singular estructurado del sistema
de interconexion M (s).
El problema del control robusto 191

Cuando se tienen dos fuentes de incertidumbre separadas, o cuando se especi ca


un comportamiento deseado para un proceso con una incertidumbre dada, el sistema
de interconexion queda de la forma:
" #
M 11 (
M (s) = M (s) M (s) s ) M 12 ( s )
21 22
y la incertidumbre equivalente:
" #
E 11 ( s
E (s) = E (s) E (s) ) E 12 ( s )
21 22
dado que si (E )  , la condicion de estabilidad robusta para el sistema es:
(M ) < 1 8 !
entonces como:
(M )  max i
f(Miig
ocurre que el margen de estabilidad frente a incertidumbres simultaneas no va a ser
mejor que los margenes frente a cada tipo de incertidumbre actuando sola.
Resulta interesante obtener cotas de (M ) expresadas en funcion de los valores
singulares de los elementos Mij , de forma que puedan emplearse para facilitar el
dise~no y analisis. Con este objetivo, se dan los siguientes resultados (Freudenber
1989):
(M )  [(M12 )(M21 )]1=2 max f(M11 ); (M22 )g
(M )  [(M12 )(M21 )]1=2 + max f(M11 ); (M22 )g
En las ecuaciones anteriores puede verse la dependencia de la robustez del sistema
de los elementos Mij ; i 6= j . Si ocurre que:
[ (M12 )(M21 )]1=2  1 (8:11)
maxf(M11 )(M22 )g

el sistema sera mucho mas sensible a incertidumbres simultaneas que a las mismas
actuando de forma individual. Por ello, aunque se tenga garantizada la robustez
frente a cada incertidumbre individual (elementos Mii , (Mii ) < 1) pueden exi-
stir un par de peque~nas incertidumbres que actuando simultaneamente causen la
inestabilidad del sistema, siempre que:
[ (M12 )(M21 )]1=2  1 (8:12)
192 Robustez de plantas con fuerte ganancia direccional

- EI ES 

r- h -
- 6 K -r - ?h- G - ?h r r y-

Figura 8.17: Incertidumbres para problema de comportamiento robusto.

y por tanto:
(M )  [(M12 )(M21 )]1=2  1

Los sistemas que, al menos potencialmente, pueden llevar con mas facilidad a
la condicion anterior, son aquellos que tengan plantas mal condicionadas; especial-
mente si no se toman algunas precauciones a la hora del dise~no.
El problema de analizar la robustez en la estabilidad de un sistema con incer-
tidumbres multiplicativas a la entrada y a la salida actuando simultaneamente, o
el de analisis del comportamiento robusto de un sistema con incertidumbre multi-
plicativa a la entrada, son especialmente crticos, y ponen de mani esto lo dicho
anteriormente.
Para el sistema de la gura 8.17 se trata de analizar la robustez en el compor-
tamiento del sistema. Se supone que los errores de modelado de la planta pueden
expresarse como una incertidumbre multiplicativa a su entrada:
EI (s) = wI (s)I (s) [I (j!)]  1 8!
y que la especi cacion de comportamiento nominal puede expresarse mediante una
incertidumbre ctcia equivalente (ver gura 8.18):
ES (s) = wS (s)S (s) [S (j!)]  1 8!
Se obtiene que: " # " #
a1 = M b1
a2 b2
El problema del control robusto 193

a1 - I (s) b1

a2 b2
- S (s)


M (s)


Figura 8.18: Problema de estabilidad robusta equivalente.

siendo el sistema de interconexion:


" #
M = S TGw
I wI KSo wS
SowS
o I

si G(s) es invertible, el termino M12 puede ponerse como: M12 = TI G 1. Si se


supone que los elementos M12 ; M21 cumplen las condiciones 8.11 y 8.12 se tendra
que (M )  1, y como:
[(M )]1=2  (So wI G)(TI wS G 1)  (SowI )(TI wS )(G)

se pone de mani esto el hecho de que si la planta tiene una acusada ganancia direc-
cional ((G) elevado), la estabilidad del sistema experimentara una mayor sensibi-
lidad a incertidumbres simultaneas.
Otras relaciones de interes, que ponen de relieve lo anterior, a la vez que tambien
incluyen el efecto de la ganancia direccional del controlador dise~nado, se dan a
continuacion (Freudenberg 1989, Morari et al. 1989):
(M )  (wS So) + (wI To )
(M )  (wI TI ) + (wS SI )
(M )  (wI TI ) + (1 + p )(wS So)
194 Robustez de plantas con fuerte ganancia direccional
q
(M )  maxf(wI TI ); (wS So)g + (wI TI )(wS So )
= min f(G); (K )g

Las expresiones anteriores pueden ayudar durante el dise~no, pero hay que tener
en cuenta que si se emplean para analizar directamente la robustez del sistema,
pueden llevar a dise~nos muy conservadores, debido a que para plantas con marcada
ganancia direccional la cota puede estar excesivamente sobre-estimada. Sera conve-
niente por tanto, de cara al dise~no nal, calcular el valor de (M ) de forma directa.

Ejemplo: Planta con fuerte ganancia direccional


Sea la siguiente matriz de transferencia G(s), correspondiente a un proceso mul-
tivariable compuesto de dos entradas y dos salidas
" #
G(s) = 75s1+ 1 01::878 0:864
082 1:096

Este sistema reune especialmente las caractersticas anteriormente citadas sobre


la fuerte ganancia direccional. Con la peculiaridad de que su numero de condicion
toma un valor elevado y constante, de 141.3, para todo el rango de frecuencias. Es
pues, un ejemplo de lo que se denomina una planta mal condicionada, o sea con
valores de
(G)  1
en el rango de frecuencias de interes. En la gura 8.19 pueden verse sus ganancias
extremas o valores singulares en funcion de la frecuencia. Tambien se muestran la
parte real (curva continua) y la parte imaginaria (curva de trazos) de los elementos
de la matriz de ganancia relativa (rga) (ver apendice B.5) en la gura 8.20.
El problema del control robusto 195

20

-20
Ganancias extremas de G

-40

-60

-80

-100

-120
10 -5 10 -4 10 -3 10 -2 10 -1 10 0 10 1 10 2

rad/s

Figura 8.19: Ganancias extremas para planta con fuerte ganancia direccional
40 40

20 RGA(G_11) 20

0 0

-20 -20 RGA(G_12)

-40 -40
10 -5 10 -2 10 1 10 4 10 -5 10 -2 10 1 10 4
rad/s rad/s

40 40

20 20 RGA(G_22)

0 0

-20 RGA(G_21) -20

-40 -40
10 -5 10 -2 10 1 10 4 10 -5 10 -2 10 1 10 4
rad/s rad/s

Figura 8.20: Parte real e imaginaria de los elementos de la matriz de ganancia


relativa (rga).
196 Robustez de plantas con fuerte ganancia direccional
Captulo 9
Metodos de dise~no LTR
9.1 Introduccion
El metodo de dise~no de sistemas de control denominado Recuperacion de la funcion
de Transferencia del Lazo abierto (ltr),1 surgio como consecuencia del objetivo
de mejorar la robustez de los controladores basados en el procedimiento Lineal
Cuadratico Gaussiano (lqg) (Doyle y Stein, 1979). Posteriormente, la teora en
torno a ltr ha transcendido de sus orgenes, constituyendo una metodologa de
dise~no sistematica y exible para sistemas de control tanto escalares como multiva-
riables. Durante la decada de los ochenta tuvo su epoca de desarrollo e implantacion
(Athans, 1986; Stein y Athans, 1987; Maciejowski, 1985), y sigue siendo un tema
de investigacion y estudio (Zhang y Freudenberg, 1993; Saberi et al, 1993; Saeki,
1992).
Como se ha presentado en el captulo anterior, las especi caciones de dise~no
pueden plantearse en el dominio de la frecuencia. En este captulo se trata el pro-
blema del ajuste de las ganancia del sistema en lazo abierto, a n que cumplan unas
especi caciones de dise~no dadas. El metodo de dise~no basado en la teora lqg, junto
con un procedimiento para recuperar cierta funcion de transferencia en lazo abierto
especi cada, constituye la tecnica conocida como lqg/ltr.
Un controlador basado en observador (cbo) cumple el Principio de Separacion,
proporcionando a la hora del dise~no la division de este en dos problemas indepen-
dientes:
1 Loop Transfer Recovery en terminologa inglesa

197
198 Propiedades del regulador LQR

1. Dise~no del controlador por realimentacion de estados.


2. Dise~no del observador para reconstruir el estado a partir de la medida de la
respuesta del sistema.

Por tanto, si el sistema de control con realimentacion de estados (lqsf)2 es


estable en lazo cerrado y tiene un comportamiento nominal adecuado, ello garan-
tiza las mismas propiedades para el sistema nominal con cbo. Sin embargo, con
la presencia de incertidumbres en el modelo, el regulador con el vector de esta-
dos estimado (lqsef)3 no lleva necesariamente al mismo comportamiento obtenido
por realimentacion de estados, as como tambien puede haber un deterioro de las
propiedades de robustez con respecto al regulador lqsf (Doyle y Stein, 1981).
Surge de esta forma, la motivacion de desarrollar estructuras de control basadas
en observador (cbo), u otras no basadas en observador (cnbo), que mantengan o
al menos conserven la parte esencial, de las propiedades que caracterizan al dise~no
basado en la realimentacion de estados (lqsf), o a su problema dual, el ltro de
Kalman (kbf).
En este captulo se presentan dos estructuras empleadas en el dise~no ltr. Una
basada en observador (cbo) y otra no basada en observador (cnbo).

9.2 Propiedades del regulador LQR


Como se ha visto en el captulo 8, para un proceso que pueda describirse por un
modelo lineal e invariante en el tiempo, el comportamiento del sistema en lazo
cerrado y su robustez van a depender de ciertas funciones (matrices) de transferencia
asociadas al sistema de control, tales como la funcion de sensibilidad S (s) y su
complementaria T (s). A la vez, como se ha descrito en el captulo anterior, estas
se pueden expresar a partir de la funcion (matriz) de transferencia en lazo abierto
L(s).
Basado en lo anterior, una manera de formular las especi caciones de dise~no con-
siste en de nir la funcion (matriz) de transferencia en lazo abierto deseada (ftlad)
Lt (s). El problema sera encontrar un controlador con una estructura determinada
que proporcione la ftlad.
2 linear quadratic state feedback en la terminologa inglesa.
3 linear quadratic state estimated feedback en la terminologa inglesa.
Metodos de dise~no LTR 199

En la literatura se han sugerido dos metodos para obtener Lt (s) que proporcio-
nan unas caractersticas muy aceptables. Una se basa en el empleo de la teora de
control optimo cuadratico (lqr), y la otra esta basada en la teora del ltro Kalman
(kbf). La ventaja esgrimida para el empleo de estos metodos es que el sistema
adquiere, de forma automatica, ciertas propiedades muy estimables desde el punto
de vista del comportamiento nominal y de la robustez de la estabilidad.
Obtencion de la ftlad a traves de lqr
Suponiendo que se conoce un modelo de la planta, expresado en el espacio de
estados por el conjunto de ecuaciones:
x_ = A x + B u
y = Cx (9.1)
donde se supone tambien, que las ecuaciones anteriores incluyen posibles escalados
y/o ampliaciones realizadas sobre el modelo de la planta, a fn de adecuarla para el
dise~no.
El comportamiento deseado del sistema puede especi carse de forma conveniente
mediante la optimizacion de una funcion de coste J . Si se de ne el vector:
z = Mx
en el que sus componentes son combinaciones lineales de las variables de estado (M
es una matriz constante de dimensiones adecuadas); y las matrices de ponderacion:
Q = QT  0 Rc = RcT > 0
se trata de minimizar:
Z1
J = (zT Qz + uT Rcu)dt
0
Z1
= (xT M T QMx + uT Rcu)dt (9.2)
0

El problema anterior es el llamado lqr, cuya solucion es de la forma:


u = Kcx
denominandose a Kc matriz de realimentacion de estados. A partir de la solucion
Pc de la ecuacion algebraica de Riccati de control (AREc) siguiente:
AT Pc + PcA PcBRc 1 B T Pc + Qc = 0 (9:3)
200 Propiedades del regulador LQR

G(s)
y
r - as - -

- 6
B (s) C

b s
Kc  x

Figura 9.1: Estructura regulador lqr (lqsf)


con
Qc = M T QM
se obtiene:
Kc = Rc 1B T Pc
siendo:
Pc = PcT  0
El problema tendra solucion Pc y sera unica, si el par (A; B ) es estabilizable
(todos los modos inestables son controlables).
Se de ne Hc(s), como la funcion (matriz) de transferencia en lazo abierto entre
la entrada a la planta y la se~nal de retorno. Es la relacion entre la se~nal que entra
por el punto\a" y la que retorna por el punto\b" de la gura 9.1. Se denomina
Funcion de Relacion del Retorno o de Lazo Abierto:
Hc(s) = Kc(s)B
donde: (s) = (sI A) 1 , y la correspondiente Funcion de Diferencia del Retorno:
Fc(s) = I + Hc(s)

A partir de la ecuacion AREc y de algunas manipulaciones algebraicas (MacFar-


lane 1979), se obtiene:
FcT ( s)RcFc(s) = Rc + GTc ( s)QGc(s) (9:4)
con:
Gc(s) = M (sI A) 1B
Metodos de dise~no LTR 201

En el caso de que:
Rc = I
se obtiene:
FcT ( s)Fc(s)  I (9:5)
mostrando Safonov y Athans (1977) que la desigualdad anterior garantiza para el
sistema un margen de fase (MF) mnimo de 60 (se admite un cambio de fase de
al menos 60 simultaneamente en cada canal sin que produzca la inestabilidad del
sistema), un margen de ganancia (MG) in nito (frente a variaciones en forma de
valor real  > 1, o modi cacion de la ganancia en continua, generados de forma
simultanea en todos los canales sin que el sistema pierda su estabilidad nominal)
y un margen de tolerancia para reduccion de la ganancia (TRG) de hasta 6db
(reduccion simultanea de la ganancia 0:5   < 1, o sea de hasta el 50% de su valor
nominal, en cada canal sin que desestabilice al sistema de control).
De 9.5 se desprende que:
i (FcH Fc)  1
y por tanto:
(FcH Fc)  1
como:
(FcH Fc)  (FcH )(Fc) = 2(Fc)
se tendra que:
2 (Fc)  1 ) (Fc)  1
dada la relacion Si = Fc 1, y teniendo en cuenta la propiedad de los valores singulares
de una matriz no singular P
(P 1) = (1P )
se obtiene:
(Si)  1 (9:6)
lo cual tiene la interpretacion fsica en el caso escalar, de que el sistema no ampli cara
las perturbaciones actuantes a la salida de la planta.
Por otro lado teniendo en cuenta que:
Ti(s) = I Si(s)
con lo que:
(Ti)  (I ) + (Fc 1)
 1 + (1F )
c
 1 + 1=1 = 2 (9.7)
202 Propiedades del regulador LQR

La desigualdad 9.7, puede interpretarse como una medida de la robustez de la


estabilidad para el caso de incertidumbre multiplicativa no estructurada existente a
la entrada de la planta. De forma que, a partir del teorema de peque~na ganancia
(ver captulo 8), una condicion su ciente para que el sistema permanezca estable
para una incertidumbre no estructurada E (s) es que:
(E )  (1T )
i
ya que en este caso, M (s) = Ti(s), y por tanto:
(E )  21

lo que fsicamente equivale a decir que el sistema de control puede aceptar hasta un
50% de incertidumbre relativa en la planta, manteniendo la estabilidad.
Otra caracterstica de Hc(s) es que para algun par de numeros reales f; !og se
cumple:
(Hc)  ! ; 8 ! > !o
lo que se traduce en la propiedad de una cada de la ganancia del sistema de
20 db=dec a alta frecuencia.
En resumen, puede decirse que el controlador lqr tiene las siguientes propiedades:

 Ley de control optima.


 Amplios margenes de fase (MF) y ganancia (MG), (TRG).
 Robustez de la estabilidad (rs) frente a incertidumbres de tipo multiplicativo
situadas a la entrada de la planta.
 Respuesta en frecuencia en lazo abierto con una pendiente de cada suave a
alta frecuencia.

Las propiedades anteriores son todas, salvo la ultima, muy atractivas para un
sistema de control. Sera deseable ademas, si ello fuera posible, que manteniendo las
tres primeras casi sin alteracion, se consiguiera un aumento de la pendiente de cada
a alta frecuencia. Es en esa zona donde se mani estan fundamentalmente los errores
de modelado, con lo que se reforzara la robustez frente a la dinamica inmodelada
de alta frecuencia.
Metodos de dise~no LTR 203

Ajuste de las ganancias principales


Como se ha visto para el problema lqr la matriz de transferencia de diferencia
de retorno Fc(s) cumple la igualdad 9.4; si se supone, sin perdida de generalidad
(bastara con escalar la entrada al sistema), que Rc = I , queda:
FcT ( s)Fc(s) = Rc + GTc ( s)QGc (s)=
de la cual se deduce que (Doyle et al. 1981, Maciejouski 1989):
" #1=2
i (Fc) = 1 + i (Q1=2 Gc)
2
(9:8)

y de esta se obtienen las siguientes expresiones para los valores singulares extremos:
" # 1=2
(Fc 1) =  1
1 + (Q Gc)=2

" # 1=2
1  1 =2
(Fc ) = 1 +  (Q Gc)

De las ecuaciones anteriores se deriva la posibilidad de modi car los valores


singulares o ganancias principales de Fc 1 = Si, actuando sobre la matriz Q y el
escalar . Si en el rango de frecuencias de interes ! 2 D! se cumple:
(Hc)  1
la expresion 9.8 se reduce a:

i (Hc)  i (Qp Gc)


1=2
(9:9)

la relacion 9.9 puede emplearse para realizar ajustes de Hc(s) en una doble vertiente:

a) El valor del parametro  modi ca de forma simultanea todas las ganancias


principales.
b) La matriz Q puede emplearse para modi car solo una de las ganancias prin-
cipales dejando el resto inalteradas, por medio del empleo de las propiedades
de los valores y vectores singulares (ver apendice B.3).
204 El controlador LQG

Ajuste de i (Hc) para un\i" dado


Dado el producto de matrices de orden m  p
Q1=2 Gc(j!)
para una frecuencia particular ! = !1 , es posible descomponerla en sus valores
singulares:
Xr
Q1=2 Gc(j!1) = U V H = uii viH ; r = minfm; pg
i=1
si se modi ca Q1=2 en la forma:
Q1=2 = Q1=2 (I + uj uHj )

teniendo en cuenta la propiedad de los vectores singulares


( )
uj uHi = 0 si i 6= j
1 si i = j
se obtiene:
Q1=2 Gc(j!1) = (PI + uj uHj ) Pri=1 uii viH
= ri6=j uiiviH + (1 + )uj j vjH

con lo que unicamente se modi ca la ganancia principal j que pasa de j a (1+ )j .
Por tanto, bajo la hipotesis 9.9 se tiene una forma explcita de manipular los i(Hc)
de forma independiente o unilateral para un\i" dado.

9.3 El controlador LQG


El regulador lineal cuadratico gausiano (lqg) es un procedimiento basicamente for-
mulado en el dominio temporal, y con tratamiento en lazo cerrado. Sin embargo,
puede tambien plantearse como un procedimiento de optimizacion en el dominio fre-
cuencial, tal y como se presenta en esta seccion, as como siguiendo el enfoque dado
en el apendice A.3. En este apartado se describe en primer lugar el procedimiento
de dise~no lqg, y a continuacion se pasa al principal interes de este captulo: los
metodos de dise~no de control robusto denominados en general ltr. Se realiza para
ello una formulacion en el espacio de estados, y un tratamiento en el dominio de la
frecuencia a la hora de formular los objetivos de dise~no.
Metodos de dise~no LTR 205

r- i us - Planta sy -
- 6

B 
u^

Kc s (s)  ?i Ko  i
6-
- C

Figura 9.2: Estructura regulador lqg/ltr-i


Si el sistema se encuentra sometido a perturbaciones estocasticas y/o el vector
de estado no es accesible, se emplea un observador para estimar los estados. Caso
de elegir como observador el ltro de Kalman (kbf), se denomina al metodo lqg.
Este tiene la ventaja de que minimiza la varianza del error de estimacion a partir
de la caracterizacion de los ruidos, de los que se suponen conocidas las matrices de
covarianza. En la gura 9.2 se muestra la estructura del controlador lqg.
Si el modelo de la planta junto con las perturbaciones estocasticas se puede
representar por el conjunto de ecuaciones:
x_ = A x + B u + v1
y = C x + v2 (9.10)
siendo v1 ; v2 realizaciones de ruido blanco gausiano caracterizados por:
E [v1 ; v1T ] = W  0 ; E [v2; v2T ] = Ro > 0 ; E [v1 ; v2T ] = 0
donde W; ; Ro son conocidos, estimados o elegidos de forma arbitraria de cara al
dise~no del observador.
La solucion del problema lqg se hace dividiendolo en dos subproblemas inde-
pendientes (Principio de Separacion) (Gopal, 1982):

1. El problema de control: resuelto como lqr. Suponiendo que el vector de


estados estimado coincide con el del proceso.
206 El controlador LQG

2. Y el problema del observador: resuelto como kbf.

Para un modelo exacto de la planta, la estabilidad del sistema controlado por rea-
limentacion de estados (lqr, o tambien nombrado como lqsf) garantizara tambien
la del sistema empleando el vector de estados estimado (lqsef).
Para resolver el subproblema del observador ( ltro Kalman):
x^_ = A x^ + B u + Ko (y y^)
y^ = C x^ (9.11)
se necesita encontrar la matriz de ganancia del observador Ko. Para ello se resuelve
la ecuacion algebraica de Riccati del observador (AREo):
APo + PoAT PoC T Ro 1CPo + Qo = 0 (9:12)
con: Qo = V1 T ; Ko = PoC T Ro 1
Para (A; C ) detectable (todos los modos inestables son observables) hay una
solucion Po unica de 9.12, con Po = PoT  0
De las ecuaciones del modelo de la planta 9.1, del observador 9.11, y la ley de
control:
u = Kcx^
se puede de nir el error de estimacion :
 = x x^
resultando " # " #" #
x_ = A BKc BKc x
_ 0 A Ko C 

lo que indica que los polos del sistema en lazo cerrado son la union de los polos
correspondientes a la ley de control (lqr) y los polos del observador (kbf).
El compensador lqg queda:
K (s) = Kc(sI A + BKc + KoC ) 1 Ko (9:13)
y la ftla de nida a la entrada de la planta:
L(s) = K (s)G(s)
Metodos de dise~no LTR 207

Es un hecho remarcado en la literatura, que el empleo de estimadores de estados


puede deteriorar la robustez del sistema, as como su comportamiento en lazo cerrado
si no se tienen modelos muy precisos de la planta.
La circunstancia de tratar de mejorar la robustez de un sistema lqg fue lo
que originalmente provoco el desarrollo de la metodologa lqg/ltr. Al incluir el
estimador de estados, potencialmente pueden deteriorarse las propiedades del control
lqr, o lo que es lo mismo de la ftla (L(s)) con respecto a la ftlad (Lt (s)).

9.4 Controlador LTR basado en observador


Como se describe en el captulo 8, las especi caciones de dise~no pueden realizarse
a traves de expresiones o cotas para ciertas funciones (matrices) de transferencia
en lazo abierto (ftla). Dependiendo de en que puntos se de nan tales ftla, nor-
malmente a la entrada o a la salida de la planta, se empleara una estrategia de
dise~no diferente. El metodo se denominara lqg/ltr-i, si se considera a la entrada
de la planta, y lqg/ltr-o si es a la salida, o tambien conocidos como metodos ltr
basados en observador, por derivarse tales metodos de la teora relacionada con los
reguladores lqg, la cual emplea un ltro de Kalman (observador de estado) para
estimar el vector de estado.

9.4.1 Metodo LQG/LTR-i


Existen diferentes metodos para realizar la llamada recuperacion de la funcion de
transferencia en lazo abierto (Saberi et al, 1993), en este apartado se emplea el
procedimiento introducido por Doyle y Stein (1979); y que consiste en modi car
los parametros libres de dise~no del observador, de forma que la ftla recupere las
caractersticas frecuenciales de la ftlad. Esto se consigue, en el caso de sistemas
de fase mnima (todos sus ceros se encuentran en el semiplano izquierdo), haciendo
depender la matriz de covarianza del ruido en el proceso de un parametro escalar\q",
llamado ganancia de recuperacion (gain recovery):
Qo = Qo + qZ
siendo Z = Z T  0 una matriz arbitraria. Para el caso de sistema de fase mnima
(ver apendice A.2), se demuestra (Stein y Athans, 1987) que:
1
!1 K (s)G(s) = Kc(sI A) B = Hc(s)
qlim
208 Controlador LTR basado en observador

El controlador lqg/ltr: K (s), sustituye la dinamica de la planta por la dinamica


deseada, y de nida por Hc(s). Los ceros de K (s) corresponden a los ceros de Hc(s),
y algunos de sus polos se emplean para cancelar los ceros de la planta G(s). Es
por esto, que el metodo solo garantiza una recuperacion asintotica para plantas
con modelos inversos estables. La presencia de ceros inestables tiene el efecto de
limitar las caractersticas del comportamiento obtenible, independientemente de la
metodologa de dise~no que se emplee. Sin embargo, si los ceros inestables de la
planta estan lo su cientemente alejados del ancho de banda del sistema de control,
entonces es posible una recuperacion parcial en el rango de frecuencias de interes,
y a efectos practicos la presencia de tales ceros no afectan de manera sensible a la
robustez y comportamiento del sistema a baja frecuencia.
Es posible, que para alcanzar un nivel de recuperacion deseado, las demandas
del controlador sean excesivamente elevadas. Para un sistema con peque~nos errores
de modelado ello no es crtico, sin embargo para sistemas donde las incertidumbres
juegan un importante papel, puede darse el caso extremo de que se provoque la
inestabilidad del sistema de control. Basado en esta idea, se han propuesto por
diferentes autores (Athans, 1986; Lopez y Rubio, 1994) controladores lqg con re-
cuperacion parcial (zonas de baja y media frecuencia) (ltr-i), el cual exhibira unas
caractersticas de comportamiento similares al lqg en el rango de frecuencias de
interes, y que adicionalmente presenta unas mejores propiedades de robustez frente
a la presencia de dinamica inmodelada de alta frecuencia.
Ejemplo: Dise~nos lqr, lqg, lqg/ltr
Sea el sistema dado por las siguientes ecuaciones:
x_ = Ax + Bu + w
y = Cx + v
donde las matrices A, B , C , y vienen dadas por:
! !   !
0 1
A= 3 4 ; B= 1 ; C= 2 1 ; 0 = 35
61

Dicho sistema corresponde a una funcion de transferencia de la forma:


G(s) = uy((ss)) = (s +s1)(
+2
s + 3)
Se considera en primer lugar el control lqr. Para ello se trata de encontrar el
regulador optimo que minimice el siguiente criterio cuadratico o funcion de coste:
Z1
J = (xT M T Mx + u2) dt
0
Metodos de dise~no LTR 209

donde se emplean:
 
M = 52:915 8:944 ; Rc = 1; Q = diagf1; 1g
Con estos datos puede ser calculado el regulador lineal cuadratico (lqr), bien a
partir de la descripcion por variables de estado, tal y como se detalla a lo largo de
este captulo, o mediante el uso de funciones de transferencia, como se describe en el
apendice A. Siguiendo el primer metodo, y resolviendo la correspondiente ecuacion
de Riccati de control se tendra que la matriz de realimentacion de estados es,
Kc = [ 50 10 ]

Las correspondientes funciones de transferencia implicadas en el desarrollo son


respectivamente:
Gc(s) = M (s)B = 8(:944 s + 52:915
s + 1)(s + 3)
50 + 10s
Hc(s) = (s + 1)(s + 3)
La funcion de transferencia correspondiente al bucle cerrado se obtiene de la
expresion general:
Gbc(s) = C (sI A + BKc) 1B
o en el caso de tratarse de un sistema de simple entrada-salida, tambien puede
obtenerse de,
Gbc(s) = 1 +GG(s)(s) = s2 +s14+s2+ 53 (9:14)
c

Con este regulador lqr se cumplen las especi caciones del sistema en bucle
cerrado (regulador optimo, que situa los polos del sistema en lazo cerrado en las
posiciones 7:0  2:0j ), y la funcion de transferencia del bucle abierto Hc(s), tiene
como era de esperar muy buenas caracteristicas de robustez: margen de fase de 86
y margen de ganancia in nito. Sin embargo, si el estado no es accesible es necesario
dise~nar un observador de estado o ltro de Kalman para estimarlo, con lo cual
se obtiene el correspondiente controlador lqg. Para ello se tendran las siguientes
matrices de covarianza:
Qo = T ; Ro = 1
que tras resolver la correspondiente ecuacion algebraica de Riccati se obtiene la
matriz de ganancia del ltro de Kalman Ko. Una vez conocidas Kc y Ko , el regulador
se puede obtener de forma general a partir de la expresion,
K (s) = Kc(sI A + BKc + Ko C ) 1Ko
210 Controlador LTR basado en observador

de donde se obtiene:
K (s) = (s 1000(s + 2:6)
18:66)(s + 42:7)
Si se calcula la funcion de transferencia en bucle cerrado con el regulador lqg,
se obtiene la misma obtenida anteriormente (ecuacion 9.14), dado que la inclusion
del observador no modi ca el lazo cerrado del sistema de control. Sin embargo, si se
analiza la funcion de transferencia en lazo abierto K (s)G(s), se obtiene un margen
de fase de 15 y un margen de ganancia de 1:9 db. Los cuales son sensiblemente
inferiores a los obtenidos con el regulador lqr. Por lo que la robustez del sistema
con el regulador lqg sufre un serio deterioro.
A n de mejorar la robustez, a continuacion se dise~na un regulador lqg/ltr.
Para ello, se modi ca la matriz de covarianza en la forma:
Qo = T + qBB T

Para dise~nar el regulador lqg/ltr se va incrementando q desde cero (regulador


lqg) hasta un valor razonable para tener un compromiso entre la estimacion y la
robustez. Este proceso se puede ver en la gura 9.3, donde se representa el diagrama
de Nyquist de la funcion de transferencia en bucle abierto para distintos valores del
parametro q; as mismo en la tabla adjunta se dan los valores de los margenes de
estabilidad obtenidos en cada caso.

Margen de Margen de
q ganancia (db) fase (grados)
0 -1.9 15.0
100 -2.6 20.0
500 -5.2 32.5
1000 -8.0 42.5
10000 1 74.5

9.4.2 Metodo LQG/LTR-o


La tecnica consiste en explotar la dualidad existente entre los problemas lqr y kbf.
Esta lleva a demostrar que si se establecen las equivalencias:
AT ! A ; C T ! B
BT ! C ; !M
V1 ! Q ; Ro ! Rc
Metodos de dise~no LTR 211

0.5
q=100

q=0
0
Imag G(jw)

q=500
-0.5

q=1000
-1

q=10000
-1.5
Glqr

-2
-3 -2.5 -2 -1.5 -1 -0.5 0

Real G(jw)

Figura 9.3: Diagrama de Nyquist para diferentes q

la funcion (matriz) de transferencia en lazo abierto del observador (kbf):


Ho (s) = C (sI A) 1Ko = C (s)Ko
goza de las mismas propiedades analizadas para el controlador lqr. Con la diferen-
cia, de que ahora se presentan para una ftlad de nida a la salida de la planta en
vez de la entrada (ver gura 9.4).
Para el caso de planta de fase mnima se conseguira la recuperacion asintotica

r- as - bs y-

- 6
Ko (s) C

Figura 9.4: Estructura de Ho (s) (kbf)


212 Controlador LTR no basado en observador

B 
r-
- m -
 -
?
Ko - m (s) -Kc Planta
y-
6 -6
C

Figura 9.5: Estructura regulador lqg/ltr-o


de la ftlad a la salida de la planta:
!1 G(s)K (s) = C (sI
qlim A) 1 Ko = Ho(s)
donde ahora el parametro\q" (ganancia de recuperacion) se emplea para modi car
la matriz de ponderacion del estado, Qc en 9.2, de la forma:
Qc = Qc + qZ
siendo Z = Z T  0 una matriz arbitraria. En la gura 9.5 se muestra la estructura
del regulador lqg/ltr-o.

9.5 Controlador LTR no basado en observador


El compensador obtenido con el metodo lqg/ltr-i tiene la forma 9.13, la ftla
tomada a la entrada es: L(s) = K (s)G(s), y la ftlad especi cada es: Lt (s) =
Hc(s). El error entre ambas (error de recuperacion):
E (s) = Lt (s) L(s) (9:15)
puede expresarse como:
E (s) = N (s)[I + N (s)] 1[I + Hc(s)] (9:16)
Se de ne el nivel de recuperacion como el tama~no de E (s):
 (s)] (9:17)
Metodos de dise~no LTR 213

El error de recuperacion se anula si y solo si:


N (s) = 0 ; 8 !
siendo:
N (s) = Kc(sI A + KoC ) 1 B (9:18)

En ese caso, se dice que se produce una recuperacion exacta de la ftlad a la


entrada de la planta (eLTRi). En otro caso, se dira que la recuperacion ha sido solo
aproximada (aLTRi), si el tama~no de N (s) se hace su cientemente peque~no para
cualquier !. Se tratara de encontrar una matriz Ko(q) que consiga:
N (s) = Kc(sI A + Ko(q)C ) 1B ! 0 (9:19)
Para mantener la independencia entre los dise~nos de la realimentacion de estados y
el observador, para una matriz Kc dada, se cumplira la relacion 9.19 si:
(sI A + Ko(q)C ) 1B ! 0
q ! 1
Se puede comprobar, que a medida que el parametro\q" aumenta, tambien lo hace
el tama~no de Ko(q), de forma que:
si q ! 1 entonces kKo(q)kF ! 1
donde se de ne: q
kKokF = traza(KoKoT )
La dependencia anterior ocasiona que para conseguir una recuperacion aprox-
imada con  (s)] lo su cientemente peque~no, tenga a veces que aumentar Ko
excesivamente, provocando un incremento del ancho de banda del compensador, lo
cual va a ser contraproducente en algunas situaciones practicas.
Si se considera u^ la se~nal a la salida del compensador, y u(s) la se~nal de control
de entrada a la planta, puede obtenerse:
u^(s) = N (s)u(s) Kc(sI A + KoC ) 1 y(s)

Motivado por la relacion anterior y dado que la condicion de eLTRi se consigue


anulando N (s), o equivalentemente haciendo que u^(s) no dependa explcitamente de
u(s), Chen y col. (Chen et al. 1991) desarrollan una estructura para controlador no
basada en observador (cnbo), donde la se~nal que genera el controlador no depende
214 Controlador LTR no basado en observador

r u y
-j - Planta -
- 6
u^
Kc  xc (s)  Ko j
6-

- C

Figura 9.6: Estructura del cnbo ltr-i

de manera explcita de la se~nal de control a la planta (ver gura 9.6). Se elimina


de esta forma la dependencia de la matriz de distribucion B de la se~nal de control,
caracterstica de las estructuras convencionales basadas en observador.
Las ecuaciones descriptivas del cnbo son:
x_ c = (A KoC )xc + Koy
yc = Kcxc
u^ = yc (9.20)
y equivalentemente la representacion entrada-salida:
K (s) = Kc(sI A + KoC ) 1Ko (9:21)

Si se compara su estructura con la cbo (ecuacion 9.13), se comprueba que


unicamente di eren en que no aparece el termino BKc.
Para obtener Ko y Kc se pueden resolver de forma similar a la realizada con el
controlador basado en observador convencional. El controlador se desea estable, de
forma que hay que examinar los autovalores i(A Ko C ) para cada Ko obtenido
Metodos de dise~no LTR 215

durante el proceso de dise~no. Para este regulador no se cumple el principio de


separacion, por lo que para garantizar la estabilidad del sistema nominal en lazo
cerrado se analiza si la matriz:
" #
Alc = A K o C K o C
BKc A
cumple:
Re[i(Alc)] < 0
Se demuestra (Chen et al. 1991), que existe un valor de la ganancia de recu-
peracion qo tal que 8q  qo , el sistema nominal en lazo cerrado y el controlador son
asintoticamente estables.
El error de recuperacion 9.15 obtenido con el cnbo es:
Ec(s) = N (s) (9:22)

Si se toma la misma matriz Ko para cnbo y cbo, y se comparan 9.16 y 9.22,


se obtiene que el nivel de recuperacion (9.17) obtenido para el primero es superior.
As, si se cumple:
t (s)]  1 8! 2 D!
y se supone un cierto nivel de recuperacion:
 (s)]  1
siendo Lt (s) = Hc(s) y D! la region de frecuencias de interes. La relacion entre el
error de recuperacion del cbo (E (s)) y del cnbo (Ec(s)) se obtiene de:
(E ) =  (I + M ) 1 (I + Hc)]
 (M ) [(I + M ) 1 ](I + Hc)
= (M ) (I + Hc) = (Ec)(I + Hc)
(I + M ) (I + M )
 (Ec)[(M()H+c)1 1]  (Ec)1(Hc)  (Ec)
concluyendo:
(E )  (Ec) 8 ! 2 D!
Se obtiene que un cnbo consigue mayor nivel de recuperacion que empleando un
cbo para el mismo valor de Ko (q ) (y por tanto para el mismo valor de la ganancia
216 Controlador LTR no basado en observador

r- -
? xc u y-
-  Ko  ( s ) -Kc Planta
6

Figura 9.7: Estructura ltr-o (cnbo)


de recuperacion\q"). Una consecuencia inmediata de gran utilidad practica, es que
para un mismo grado de recuperacion el cnbo necesita matrices Ko con tama~nos
(kKokF ) menores que los obtenidos con el cbo; y consecuentemente el regulador
tendra un ancho de banda menor, protegiendo de esa forma al sistema de demandas
de control excesivas, y en algunos casos de la posible saturacion de los actuadores.
Otra ventaja consiste en que de esa forma se evita la ampli cacion innecesaria del
ruido de medida; y nalmente una mayor robustez frente a la dinamica no modelada
de alta frecuencia.
En el desarrollo anterior se ha analizado la sntesis ltr-i con el cnbo. Tambien
es posible realizar un dise~no ltr-o especi cando una ftlad a la salida de la planta.
En este caso la estructura del regulador es la representada en la gura 9.7, con las
ecuaciones descriptivas del cnbo ltr-o dadas por:
x_ c = (A BKc)xc + Ko(y r)
yc = Kcxc
u = yc (9.23)
y la representacion entrada-salida del regulador:
K (s) = Kc(sI A + BKc)Ko

Si se compara con la estructura cbo (ecuacion 9.13), se comprueba que unicamente


di eren en que no aparece el termino KoC . Representa el caso dual del regulador
Metodos de dise~no LTR 217

ltr-i (cnbo), por lo que los resultados anteriores obtenidos para este, son igual-
mente validos (Saberi et al, 1993).
Como se comenta brevemente en la introduccion y se ha planteado a lo largo
de la exposicion de este captulo, el procedimiento ltr constituye una metodologa
de dise~no sistematica que ha transcendido de sus orgenes, y aunque por tradicion
sigue denominandose lqg/ltr, se ha independizado del problema lqg. Dado que,
el metodo ltr consiste en de nitiva en especi car una funcion (matriz) de trans-
ferencia en lazo abierto (que cumpla las especi caciones de dise~no deseadas), y a
traves del ajuste de uno de los parametros de dise~no se realiza la recuperacion o
aproximacion de la ftlad por medio de un regulador ltr.
Ejemplo: Dise~no ltr-i con estructura no basada en observador
A continuacion se comparan las recuperaciones obtenidas mediante un regula-
dor lqg/ltr-i convencional (cbo), y un regulador ltr-i no basado en observador
(cnbo), para el mismo ejemplo visto anteriormente. Para ello, se parte del mismo
sistema dado en el ejemplo anterior. El procedimiento de recuperacion, al igual
que antes se indicara, consiste en hacer depender la matriz de covarianza Qo del
parametro q, o tambien llamado ganancia de recuperacion, en la forma
Qo = T + qBB T

El regulador lqg/ltr-i convencional se obtiene de,


K (s) = Kc(sI A + BKc + Ko C ) 1Ko

mientras que el regulador ltr-i con estructura no basada en observador esta dado
por,
K (s) = Kc(sI A + KoC ) 1Ko

Los niveles de recuperacion, o grados de aproximacion a la funcion de transferen-


cia en lazo abierto obtenida con el regulador lqr, conseguidos por ambos reguladores
(cbo y cnbo) pueden verse en las guras 9.8 a 9.13, para diferentes valores de q
(las curvas continuas corresponden al control lqr, y las de trazos al ltr). Puede
verse como la recuperacion obtenida con el cnob es sensiblemente superior al cbo.
Ello genera una consecuencia positiva de cara a la robustez frente a la dinamica
inmodelada de alta frecuencia, as como la menor sensibilidad frente a las perturba-
ciones. Ya que a medida que aumenta q se incrementa la ganancia del observador
y consecuentemente el ancho de banda del regulador. De forma que para alcanzar
218 Controlador LTR no basado en observador

40 CBO q= 0 40 CNBO q= 0

20 20
mag(L) (db)

mag(L) (db)
0 0

-20 -20

-40 -40

-60 -60
10 -3 10 0 10 3 10 -3 10 0 10 3
w (rad/s) w (rad/s)

0 0

-50 -50
fase(L) (gr)

fase(L) (gr)

-100 -100

-150 -150

-200 -200
10 -3 10 0 10 3 10 -3 10 0 10 3
w (rad/s) w (rad/s)

Figura 9.8: Bodes para reguladores lqr, lqg/ltr, ltr (cnbo), q = q1

CBO q= 500 CNBO q= 500


50 50
mag(L) (db)

mag(L) (db)

0 0

-50 -50

-100 -100
10 -3 10 0 10 3 10 -3 10 0 10 3
w (rad/s) w (rad/s)

0 0

-50 -50
fase(L) (gr)

fase(L) (gr)

-100 -100

-150 -150

-200 -200
10 -3 10 0 10 3 10 -3 10 0 10 3
w (rad/s) w (rad/s)

Figura 9.9: Bodes para reguladores lqr, lqg/ltr, ltr (cnbo), q = q2


Metodos de dise~no LTR 219

CBO q= 2500 CNBO q= 2500


50 50
mag(L) (db)

mag(L) (db)
0 0

-50 -50

-100 -100
10 -3 10 0 10 3 10 -3 10 0 10 3
w (rad/s) w (rad/s)

0 0

-50 -50
fase(L) (gr)

fase(L) (gr)
-100 -100

-150 -150

-200 -200
10 -3 10 0 10 3 10 -3 10 0 10 3
w (rad/s) w (rad/s)

Figura 9.10: Bodes para reguladores lqr, lqg/ltr, ltr (cnbo), q = q3

CBO q= 3600 CNBO q= 3600


50 50
mag(L) (db)

mag(L) (db)

0 0

-50 -50

-100 -100
10 -3 10 0 10 3 10 -3 10 0 10 3
w (rad/s) w (rad/s)

0 0

-100 -100
fase(L) (gr)

fase(L) (gr)

-200 -200

-300 -300

-400 -400
10 -3 10 0 10 3 10 -3 10 0 10 3
w (rad/s) w (rad/s)

Figura 9.11: Bodes para reguladores lqr, lqg/ltr, ltr (cnbo), q = q4


220 Controlador LTR no basado en observador

40 CBO q= 25000 40 CNBO q= 25000

20 20
mag(L) (db)

mag(L) (db)
0 0

-20 -20

-40 -40

-60 -60
10 -3 10 0 10 3 10 -3 10 0 10 3
w (rad/s) w (rad/s)

0 0

-50 -50
fase(L) (gr)

fase(L) (gr)

-100 -100

-150 -150

-200 -200
10 -3 10 0 10 3 10 -3 10 0 10 3
w (rad/s) w (rad/s)

Figura 9.12: Bodes para reguladores lqr, lqg/ltr, ltr (cnbo), q = q5

CBO q= 1e+005 CNBO q= 1e+005


40 40

20 20
mag(L) (db)

mag(L) (db)

0 0

-20 -20

-40 -40

-60 -60
10 -3 10 0 10 3 10 -3 10 0 10 3
w (rad/s) w (rad/s)

0 0

-50 -50
fase(L) (gr)

fase(L) (gr)

-100 -100

-150 -150

-200 -200
10 -3 10 0 10 3 10 -3 10 0 10 3
w (rad/s) w (rad/s)

Figura 9.13: Bodes para reguladores lqr, lqg/ltr, ltr (cnbo), q = q6


Metodos de dise~no LTR 221

- E (s)

a
r - Lt (s) - ?j rb -
L(s)

Figura 9.14: El error de recuperacion como una incertidumbre aditiva

una recuperacion adecuada, sea necesario incrementar de forma excesiva el valor del
parametro q o ganancia de recuperacion.
Se extrae por tanto del analisis anterior, que la ventaja basica del regulador ltr
(cnbo) es que consigue una aproximacion o recuperacion mejor que un regulador
lqg/ltr (cbo) para un mismo valor de q . Lo cual tiene mucha relevancia de cara
a la implementacion fsica del regulador en un ambiente real.

9.6 Controlador LT R=H 1

En el captulo siguiente se trata ampliamente la teora relacionada con el control H1.


Sin embargo, a continuacion se plantea un problema particularmente interesante: se
trata de encontrar un regulador lqg/ltr-i, tal que una medida de la aproximacion
de la respuesta en frecuencia en lazo abierto conseguida por el regulador ltr al lqr
este acotada superiormente. Dicha medida se va a caracterizar mediante una cota
H1, tal y como se describe a continuacion.
En este apartado se presenta un procedimiento para obtener un controlador
lqg/ltr que consigue aproximar la respuesta en frecuencia en lazo abierto (ftla)
a una especi cada (ftlad), con un determinado grado de aproximacion o de re-
cuperacion. La solucion se obtiene resolviendo un problema de control suboptimo
H1. Como ya se ha descrito en este captulo, el procedimiento lqg/ltr-i consiste
en encontrar un controlador K (s) que consiga acercar a la ftla: L(s) = K (s)G(s)
a una ftlad: Lt (s) = Hc(s) dada.
222 Controlador LTR=H1

Para el analisis del problema de la recuperacion, puede interpretarse a L(s) como


si se tratara de Lt (s) con una incertidumbre aditiva (ver gura 9.14):
E (s) = L(s) Lt (s)

Se de ne el grado de recuperacion (Saeki 1992), como:


E = kE (s)[I + Lt (s)] 1k1 (9:24)

Si se emplea un cbo, se obtiene un error de recuperacion que puede expresarse:


E (s) = Kc(sI A + BKc + KoC ) 1B [I + Hc(s)] (9:25)
como se desea que E (s) sea lo menor posible (al menos en el rango de frecuencias de
interes), se puede plantear el problema de conseguir un grado de recuperacion por
debajo de un mnimo deseable E , y expresarlo como una cota H1.
Teniendo en cuenta la de nicion 9.24 y la expresion 9.25 queda:
E = kKc(sI A + BKc + Ko C ) 1B [I + Hc(s)][I + Hc(s)] 1k1 < E (9:26)
lo que equivale a encontrar una matriz Ko (q) que satisfaga:
kKc(sI A + BKc + KoC ) 1B k1 < E (9:27)

Para obtener la solucion del problema anterior, se tiene el siguiente teorema


(Saeki, 1992):
Teorema: Existe una matriz Ko, que satisface la ecuacion 9.27, si y solo si la
ecuacion algebraica de Riccati:
(A BKc)X + X (A BKc)T X ( 1 C T C 12 KcT Kc)X + Q + BB T = 0 (9:28)
 E
tiene una solucion X = X T > 0, para un numero real  > 0, lo su cientemente
peque~no y una matriz arbitraria Q = QT > 0. Obteniendose como solucion:
Ko = 21 XC T

El papel desempe~nado por  es similar al de 1=q2 en el procedimiento de recu-


peracion descrito en apartados anteriores. El resultado anterior es valido tanto para
plantas de fase mnima as como para plantas de fase no mnima. A continuacion se
da un procedimiento a seguir para el calculo del regulador LTR=H1:
Metodos de dise~no LTR 223

1. Se elige una matriz arbitraria simetrica de nida positiva Q, un valor de E


dentro del intervalo
0 < E < 1
y un valor lo su cientemente peque~no de  = 1 > 0
2. Se resuelve la ecuacion de Riccati 9.28.
3. Si su solucion X no es de nida positiva se incrementa el valor de E y se
vuelve al paso 2.
4. Si X es de nida positiva se resuelve la ecuacion 9.28 para distintos valores de
 2 (0; 1 ), para todos los cuales la ecuacion de Riccati tiene solucion de nida
positiva.
5. Se elige la matriz Ko para un valor de  del intervalo anterior, para el cual se
obtiene el valor inferior de la norma de Frobenius de la matriz Ko ,
q
kK kF = traza (KoT Ko)

Con el procedimiento anterior, se consigue el grado de recuperacion deseado, a


la vez que se evita incrementar el tama~no de Ko , y con ello el que el ancho de banda
aumente en exceso, protegiendo por tanto al sistema frente a la dinamica inmode-
lada de alta frecuencia, de las perturbaciones y ruidos de medida de los sensores.
Ejemplo: Controlador LTR=H1
Se van a considerar dos casos, el primero correspondiente a una planta de fase
mnima (caso 1), y el segundo (caso 2) que trata con una planta de fase no mnima;
a n de ver la validez del procedimiento para ambos tipos de plantas.
Para ambos casos se emplea,
" # " #
A= 0 1 ; B= 0
3 4 1

la matriz de realimentacion de estados es Kc = [ 50 10 ], y la matriz Q se elige de


la forma, " #
Q= 0 1 1 0
224 Controlador LTR=H1

Para caso 1 (fase mmina):


h i
C = 2 1 ; y se elige E = 0:1
Para caso2 (fase no mnima):
h i
C= 2 0:1 ; y se elige E = 0:35

En las guras 9.15 y 9.16 se muestra la dependencia de la norma de Frobenius


de la matriz de ganancia del observador Ko en funcion del parametro . Para todos
los valores de  mostrados en dichas guras se consiguen respectivamente
E < 0:1 (fase mnima)
E < 0:35 (fase no mnima)

Sin embargo, se elige el valor de  para el que se obtiene el valor de kKokF inferior.
Y por tanto, el regulador consigue el objetivo pre jado, pero con un ancho de banda
inferior; protegiendo as al sistema frente a las incertidumbres, perturbaciones y
ruidos que afectan a la planta.
Metodos de dise~no LTR 225

1600

1400

1200
Norma de Frobenius de Ko

1000

800

600

400

200

0
0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6

epsilon x10 -5

Figura 9.15: Norma de Frobenius en funcion de  para sistema de fase mnima

x10 5
4.4

4.2

4
Norma de Frobenius de Ko

3.8

3.6

3.4

3.2

3
1 2 3 4 5 6 7 8 9

epsilon x10 -9

Figura 9.16: Norma de Frobenius en funcion de  para sistema de fase no mnima


226 Controlador LTR=H1
Captulo 10
Controladores H1
10.1 Introduccion
Como se ha descrito en el captulo 8, una forma de establecer las especi caciones de
dise~no, consiste en la minimizacion de determinada funcion de coste formulada en el
dominio frecuencial. Dos medidas de comportamiento, ampliamente empleadas en
los problemas de control optimo y robusto, son las normas H2 y H1. La solucion
al problema de control de optimizacion H2 (tambien denominado de Wiener-Hopf)
fue desarrollada durante las decadas de los 60 y 70; mientras que el dise~no con H1
se inicio en el decenio de los 80 y continua aun su desarrollo.
La formulacion del problema de control optimo H1 fue realizada por Zames en
1981 para el caso escalar y basada en una representacion entrada-salida, obteniendo
la solucion del problema en 1984 (Zames y Francis, 1984). Posteriormente los mismos
autores obtienen la solucion para el caso multivariable.
Los primeros algoritmos para la resolucion de los problemas H1, desarrollados
desde 1984 a 1988, tenan el inconveniente de que el controlador obtenido era, en
general, de un orden elevado (Francis, 1987) comparado con el de la planta, por
lo que como paso previo a la implementacion fsica del regulador era conveniente
realizar un intenso trabajo para obtener reguladores de menor dimension.
Es a partir del trabajo de Doyle y colaboradores (1989), cuando se da un fuerte
impulso para la solucion algortmica de los problemas de control H1, obteniendose
un controlador de la misma dimension que la planta ampliada, o tambien deno-
227
228 Justi cacion del control H1

minada planta generalizada, (constituida por el modelo del proceso junto con las
matrices de ponderacion que constituyen las especi caciones de dise~no). Con ello,
da comienzo la llamada segunda generacion de algoritmos en el espacio de estados
de la teora H1. Caracterizada por el planteamiento del problema de optimizacion
formulado en el espacio de estados y resuelto, de forma mas simple, a partir de
dos ecuaciones algebraicas de Riccati desacopladas. En este captulo se tratan en
primer lugar las tecnicas inicialmente desarrolladas para la solucion de los problemas
de control H1, pasando a continuacion a describir las tecnicas basadas en el espacio
de estados.

10.2 Justi cacion del control H 1

En este apartado se trata de justi car la utilidad del control H1 en la teora de


control. Para ello, se ha elegido el planteamiento de dos problemas de control
esenciales: el problema del comportamiento nominal optimo, y el problema de la
estabilidad robusta. En ambos casos, y a n de simpli car la exposicion, as como
para que el lector familiarizado con la teora clasica de control lo encuentre mas
ameno, se trata en ambos casos el problema escalar. Tambien se presenta la conexion
entre la teora de juegos diferencial y el control H1.

10.2.1 Interpretacion H1 del comportamiento nominal


El metodo de optimizacion de sistemas de control H1 esta relacionado con la mini-
mizacion del valor de pico de la respuesta en frecuencia de cierta funcion en bucle
cerrado. Para aclarar y profundizar en el signi cado de la aseveracion anterior,
considerese el ejemplo del sistema basico de control de la gura 10.1; donde la planta
tiene la funcion de transferencia G(s) y el controlador K (s), la se~nal d representa
las perturbaciones actuando sobre el sistema y la se~nal y la salida del sistema.
A partir de la gura 10.1, puede obtenerse la dependencia de la respuesta del
sistema y la variable de control, con el resto de variables que actuan sobre el sistema.
Queda:
y(s) = T (s) r(s) + S (s) d(s) T (s) n(s) (10.1)
u(s) = K (s) S (s) [r(s) n(s) d(s)] (10.2)

Como puede verse en la ecuacion 10.1, la funcion de sensibilidad S caracteriza


Controladores H1 229

d
r - 
 - K (s)
u-
G(s)

- ?

y
-
6


6

n

Figura 10.1: Estructura de un sistema de control convencional


el comportamiento del sistema de control con respecto a las perturbaciones (d). Un
problema de dise~no puede consistir en obtener un controlador K que consiga un
rechazo o atenuacion considerable de las perturbaciones,
S0
al menos en la zona de frecuencias de actuacion de la perturbacion.
El problema original considerado por Zames (1981) consiste en encontrar un
compensador K que haga al sistema de control estable y minimice el valor de pico
de nido como,
k S k1= max
! jS (j! )j (10:3)

Dado que para algunas funciones el valor de pico puede no existir, se reemplaza
este por el supremo o menor de las cotas superiores, as que,
jjS jj1 = sup
!
jS (j!)j (10:4)

En general, para el caso multivariable, signi ca minimizar el supremo del valor


singular maximo.
k S k1= sup  (j!)]
!

La justi cacion de este problema reside en que si el valor de pico de la funcion de


sensibilidad es peque~no, entonces la magnitud de S necesariamente es peque~na para
230 Justi cacion del control H1

todas las frecuencias, y por tanto las perturbaciones seran atenuadas para todas
las frecuencias. La minimizacion de jjS jj1 es la optimizacion del peor caso, porque
ello equivale a la minimizacion del efecto sobre la salida de la peor perturbacion (es
decir, una perturbacion armonica a la frecuencia donde jS j tiene el valor de pico).
El problema del peor caso tiene una interpretacion matematica muy signi cativa,
tal y como se expone a continuacion. Supuesto que la pertubacion d es desconocida
para las frecuencias de interes, pero tiene energa nita, el valor,
sZ 1
jjdjj2 = 1
jd(t)j2dt (10:5)
se conoce como la norma-2 de la perturbacion d. La energa de d es el cuadrado de
la norma-2. Entonces, la norma jjS jj del sistema S con entrada d y salida y inducida
por la norma-2, se de ne como,
jjS jj = sup jjjjdyjjjj2 (10:6)
d:jjdjj2<1 2

De aqu, se deriva que la norma esta directamente relacionada con la ganancia


de energa para la entrada con la distribucion frecuencial peor posible. Utilizando
el teorema de Parseval se llega a que,
jjS jj = jjS jj1 (10:7)

Por ello, el valor de pico es precisamente la norma del sistema inducida por las
normas-2 sobre las se~nales de entrada y salida. La norma es conocida como norma-1
del sistema.
La optimizacion del peor caso sugiere un paradigma de la teora de juegos: el
dise~nador desea determinar el compensador K que ofrece la mejor proteccion contra
la peor pertubacion que se puede dar u ocurrir sobre el sistema. Esto explica porque
en algunos trabajos teoricos la optimizacion H1 es tratada desde el punto de vista
de la teora de juegos diferencial.
Si se realiza una breve re exion, se observa que la minimizacion de jjS jj1 como
tal no es una herramienta util de dise~no. La respuesta en frecuencia de cada planta
y compensador fsico decrece a alta frecuencia. Esto signi ca que a menudo la
sensibilidad S puede hacerse peque~na a baja frecuencia pero eventualmente tiende
a un valor asintotico a alta frecuencia. Por ello, un valor peque~no de S a baja
frecuencia no se re eja en el valor de pico, pero es de considerable importancia para
Controladores H1 231

las especi caciones del sistema de control. Por esta razon, es habitual introducir
una funcion de peso dependiente de la frecuencia W y considerar la minimizacion
de,
jjWS jj1 = sup jW (j!)S (j!)j
!
(10:8)

La forma habitual de elegir W es que sea grande a baja frecuencia, y vaya


decreciendo a medida que aumente la frecuencia. El problema de minimizacion
de la sensibilidad ponderada as de nido, tiene ciertos aspectos interesantes. Sin
embargo, no tiene en cuenta las limitaciones fsicas en la variable de control del
sistema. Por lo que habra que modi car la funcion de coste a minimizar, de forma
que ello se tuviera en consideracion.

10.2.2 Interpretacion H1 de la estabilidad robusta


A continuacion se ilustra la conexion entre la minimizacion del valor de pico y el
dise~no para obtener una estabilidad robusta. Para ello se va a considerar el diagrama
de Nyquist mostrado en la gura 10.2, que corresponde a la funcion en lazo abierto
L = GK de un sistema de control escalar generico como el de la gura 10.1. En
particular, se analiza si el sistema realimentado permanece estable bajo la existencia
de una incertidumbre que modi ca la funcion de transferencia desde su valor nominal
Lo al valor actual o real L.
En el desarrollo siguiente se supone que el sistema es estable en bucle abierto (o
sea, L representa a un sistema estable). Tambien se asume que el sistema nominal
en lazo cerrado esta bien dise~nado, en el sentido de que es estable. Por lo que el
diagrama de Nyquist del sistema nominal, Lo, no rodea al punto crtico ( 1; 0j ) del
plano complejo. El sistema real sera tambien estable en lazo cerrado si el corres-
pondiente diagrama de Nyquist de L tampoco rodea a dicho punto. Se demuestra
que el diagrama de Nyquist no rodea al punto -1 si,
jL(j!) Lo(j!)j < jLo (j!) + 1j 8 ! 2 < : (10:9)
Esto es equivalente a,
jL(j!) Lo(j!)j : jLo(j!)j < 1 8 ! 2 < : (10:10)
Lo(j!) jLo (j!) + 1j
De niendo la funcion de sensibilidad complementaria To del sistema nominal en
bucle cerrado como,
To = 1 So = 1 1 +1 L = 1 +LoL (10:11)
o o
232 Justi cacion del control H1

Im

(-1,0j)
Re
(0,0)

Lo (jw)

L(jw)

Figura 10.2: Interpretacion de la estabilidad robusta con el diagrama de Nyquist

siendo So la funcion de sensibilidad nominal. Entonces, a partir de la ecuacion


(10.10) se tendra que si,
jL(j!) Lo(j!)j :jT (j!)j < 1; 8 ! (10:12)
o
L (j!)
o

el sistema con incertidumbre (o sistema real) sera estable en bucle cerrado.


El factor jL(j!) Lo (j!)j=jLo(j!)j en esta expresion, representa el tama~no rela-
tivo de la incertidumbre frente al valor nominal Lo . Supuesto que este valor relativo
es una funcion de la frecuencia y que al menos se conoce una cota de la misma dada
por,
jL(j!) Lo(j!)j  jW (j!)j; 8 ! (10:13)
T
jLo(j!)j
Entonces,
jL(j!) Lo(j!)j  jT (j!)j =
o
Lo (j!)
=
jL(j!) Lo (j!)j=jLo(j!)j  jW (j!)T (j!)j < jW (j!)T (j!)j (10:14)
T o T o
jWT (j!)j
Controladores H1 233

de aqu, si se cumple,
jWT (j!)To(j!)j < 1; 8 ! 2 < : (10:15)
por (10.12) el sistema en bucle cerrado es estable para toda incertidumbre limitada
por (10.13). Se puede demostrar que la condicion (10.13) es una condicion necesaria
y su ciente para la estabilidad robusta del sistema (Morari et al. 1989).
Se ha obtenido la condicion (10.15) bajo la hipotesis de que el sistema en bucle
abierto es estable. Puede probarse que tambien es valida para sistemas inestables
en bucle abierto, con tal de que el sistema nominal y el pertubado en bucle abierto
tengan el mismo numero de polos en la parte derecha del plano complejo.
Utilizando la notacion de normas introducida anteriormente la condicion para
estabilidad robusta puede reescribirse como,
jjWT (j!)To(j!)jj1 < 1; (10:16)

Esto demuestra explicitamente la relevancia de la norma-1, o sea el valor del


pico de la respuesta en frecuencia para caracterizar la robustez. Como se ha visto en
el procedimiento seguido, el criterio del valor de pico surge en este caso del criterio
de estabilidad de Nyquist, el cual restringe el diagrama de Nyquist de la funcion de
bucle abierto a no cortar el punto -1 del plano complejo.
Por tanto, para que un sistema tenga garantizada la estabilidad robusta sera
su ciente que se dise~ne de forma que jjWT To jj1 sea menor que uno. Un posible
problema que se puede plantear es el de minimizacion de la norma jjWT Tojj1 con
respecto a todos los compensadores que estabilizan al sistema en bucle cerrado como
un problema de optimizacion de la estabilidad robusta. Sin embargo, la estabilidad
raramente es el unico objetivo de dise~no, por lo que en la funcion de coste a minimizar
aparecen otros elementos que hacen alusion a otros subobjetivos, como por ejemplo
al comportamiento nominal deseado.

10.2.3 Control H1 y la teora de juegos diferencial


Como se ha mencionado anteriormente, el problema de control H1 esta estrecha-
mente relacionado con la teora de juegos diferencial. Para verlo, debemos pensar en
el dise~nador por un lado, y en el medio ambiente por otro, como si de dos jugadores
se trataran. El objetivo del dise~nador es elegir un controlador que estabilice al sis-
tema y sea optimo con respecto a un criterio dado; mientras que el medio exterior
234 Planteamiento del problema general de control

tiene como objetivo el desbaratar o hacer fracasar la estrategia del dise~nador, por
medio de la eleccion de la perturbacion peor posible que actue sobre la planta a
controlar. As, se de ne un ndice de comportamiento
Z1
J (K; w) = (zT z 2wT w)dt
0
siendo K el regulador, w la perturbacion actuante sobre el sistema tal que w 2 H2
(ver apendice C.1), z una medida para evaluar el comportamiento en lazo cerrado
del sistema, y un parametro arbitrario. La solucion, si existe, dara un controlador
optimo K  que estabiliza al sistema de control para la peor perturbacion w 2 H2
actuante sobre el sistema.

10.3 Planteamiento del problema general de con-


trol
En el captulo 8 se ha planteado la necesidad de que a la hora de dar las especi ca-
ciones de dise~no, se hagan de forma que se planteen unos requerimientos fsicamente
realizables. Determinadas exigencias de dise~no se pueden plantear como un pro-
blema de optimizacion en el dominio frecuencial, a traves del empleo de unas fun-
ciones (matrices) de ponderacion, que suponga una solucion de compromiso para el
conjunto de objetivos contrapuestos que aparecen en todo problema de control.
Considerese el diagrama de bloques de la gura 10.3, donde el conjunto de se~nales
actuantes sobre el sistema: r; di; do; n, quedan caracterizadas o ponderadas en fre-
cuencia respectivamente por:
Wr (j!); Wdi (j!); Wdo (j!); Wn(j!)

En dicho diagrama ademas se incluyen las medidas ponderadas de las se~nales de


error (e), control (u) y se~nal a controlar (y), empleando respectivamente,
WS (j!); WU (j!); WT (j!)

El conjunto de funciones (matrices) de ponderacion junto con la planta y regu-


lador puede transformarse en un diagrama de bloques equivalente mas compacto,
como el de la gura 10.4.
Controladores H1 235

?di ?do
Wdi Wdo

r- e u- ? - ?m r y-
Wr - mr K mt G WT z-
3
-6
?m W n
n

? z2
WU -
? z
WS 1-

Figura 10.3: Ponderaciones en frecuencia de vectores de entrada y salida

r-
Wr -h e r - WS -z1
6
n- ?
Wn -h
6 - WU -z2
do - W
do

di - W
di -h - G - ?h yr- WT -z3
6 - P
u - e

 K

Figura 10.4: Estructura general para problemas de control H1; H2.


236 Planteamiento del problema general de control

A partir del sistema dado en la gura 10.5, se plantea el siguiente problema de


dise~no: obtener un regulador ( K ) que minimice algun tipo de medida 1 de la
funcion (matriz) de transferencia Tzw ,
z = Tzw w
que relaciona el vector de salida z (vector de se~nales requeridas para caracterizar el
comportamiento del sistema en lazo cerrado),
z = [z1 z2 z3 ]T
z1 = WS e z2 = WU u z3 = WT y
con el vector de entrada w
w = [r n do di]T

A partir de las expresiones dadas en el captulo 8, que relacionan: e; u; y con


r; n; do; di, y del diagrama de bloques de la gura 10.4 se obtiene:
2 3 2 32 r 3
64 zz12 75 = 64 W
WS SoWr
U KS W
o r
WS SoWn
W K S
U o o nW
WS SoWdo
W U KS W
o do
WS SoGWdi 6 n 7
WU Si Wdi 75 664 d 775
z3 WT To Wr WT To Wn WT SoWdo WT So GWdi o
di
Si solo se considera r, con Wr = I y WU = 0, queda:
" # " #
z1 = WS So r
z3 WT To
de forma similar, si se considera unicamente do, queda:
" # " #
z1 = WS So d
z3 WT To o
y en estos casos, el problema de optimizacion es conocido como: problema de sensi-
bilidad mixta (Green y Limebeer, 1995).
Se puede obtener una particion de la planta generalizada P de la siguiente forma
" #
P = PP11 PP12
21 22
1 Las normas mas empleadas en control son las normas H2 , y H1 , ver apendice B.2
Controladores H1 237

w- z-
- P (s)
u e

K (s) 

Figura 10.5: Planta generalizada y regulador

donde se tiene que


z = P11w + P12u
e = P21w + P22u (10.17)
u = Ke
y al sustituir queda:
z = [P11 + P12K (I P22 K ) 1P21 ]w
Por tanto, se tiene la funcion (matriz) de transferencia que relaciona z con w:
z = Tzw w
donde la funcion (matriz) de transferencia
Tzw = P11 + P12K (I P22 K ) 1P21
se conoce como transformacion lineal fraccionaria (lft)2. A partir de esta relacion
se plantea el problema estandar: encontrar un regulador K (que sea propio) que
minimice la norma H1 de la funcion (matriz) de transferencia que relaciona w con
z, bajo la restriccion de que K estabilice a P (en el sentido de que consiga un
sistema de control con estabilidad interna). A continuacion se dan dos ejemplos de
problemas de control tpicos, y como estos pueden transformarse en el problema de
control estandar de la gura 10.5.

10.3.1 Problema de seguimiento


En primer lugar se describe el problema de seguimiento de la se~nal de referencia.
Sea el sistema de la gura 10.6, en el que se presenta el problema de minimizar la
: Linear Fractional Transformation, en terminologa inglesa.
2 lft
238 Planteamiento del problema general de control

w- W r - K1 -j u - G y -
6
K2 

Figura 10.6: Planta generalizada para problema de seguimiento


siguiente funcion de costes:
(kr yk22 + kuk22)1=2
donde  es un parametro de ajuste, que pondera la magnitud de control, de manera
que al disminuirlo aumenta el ancho de banda del sistema de control.
La equivalencia con el problema estandar se puede establecer a partir de las
siguientes relaciones: " # h i
e = yr ; K = K1 K2
" # " #
r
z = u =y Ww Gu
u
" # " # " #
e = WwGu = W w+ 0 u
0 G

que al identi car terminos con la expresion general de P (s) dada en la ecuacion
10.17 queda:
"# " # " # " #
W G W
P11 = 0 ; P12 =  ; P21 = 0 ; P22 = G0

10.3.2 Problema de estabilidad robusta


Otro problema tpico es el que plantea una estabilidad robusta del sistema de control.
Sea el sistema de la gura 10.7, para el que la incertidumbre en la planta esta
caracterizada de la forma:
G0 = G + G; kG(j!)k <j E (j!) j; 8!
Controladores H1 239

r- j - G y -
6

K 

Figura 10.7: Planta generalizada para problema de estabilidad robusta


Si se aplica el teorema de la peque~na ganancia, la condicion para que el sistema
sea estable para todo el conjunto de plantas es:
kEK (I + GK ) 1 k1  1
comparando esta condicion con la forma del problema estandar,
Tzw= = P11 + P12 K (I P22 K ) 1P21
e identi cando terminos, queda que en este caso la planta generalizada es,
" #
P = OI EIG

10.4 Parametrizacion de los controladores


En primer lugar se va a introducir el concepto de factorizacion coprima. Para el
caso de dos polinomios f (s); g(s), se dice que son coprimos entre s, si su maximo
comun divisor es 1. A su vez esto ocurre si existen sendos polinomios x(s); y(s) tales
que se veri ca la condicion de Bezout o ecuacion diofantica:
f (s)x(s) + g(s)y(s) = 1

Extendiendo este concepto a matrices F (s); G(s) 2 RH1 (ver apendice C), se
dice que son coprimas por la derecha, si tienen el mismo numero de columnas y
existen las matrices X (s); Y (s) 2 RH1 tales que:
"#
F
[X Y ] G = XF + Y G = I
240 Parametrizacion de los controladores

lo que equivale a decir que la matriz [F G]T es invertible por la izquierda en RH1.
De forma similar se de ne coprima por la izquierda: Las matrices F; G tienen el
mismo numero de las, y existen X; Y 2 RH1, tales que:
" #
X
[F G] Y = FX + GY = I

se dice entonces que la matriz [F G] es invertible por la derecha en RH1.


Si G(s) es una matriz de transferencia propia, una factorizacion coprima por la
derecha de G es una factorizacion de la forma:
G(s) = N (s)M 1 (s)
donde N y M son matrices coprimas entre s en RH1. Igualmente, se obtiene la
factorizacion coprima por la izquierda:
G(s) = M^ 1 (s)N^ (s)

Se demuestra que para cada matriz de transferencia G(s) se cumple:


" ^ #" #
G = NM = M^ 1 N;
1 ^ X Y^ M Y = I
N^ M^ N X

lo que constituye una doble factorizacion coprima de G. A continuacion se dan


sendos algoritmos para obtener las factorizaciones coprimas anteriores.

Factorizacion coprima por la derecha.

1. Se tiene una realizacion en el espacio de estados de G:


G(s)  (A; B; C; D); con: (A; B ) estabilizable y (C; A) detectable
2. Se calcula una matriz Kc que haga que A + BKc sea estable.
3. Se calculan las matrices
Ac = A + BKc; Cc = C + DKc
Controladores H1 241

4. Se obtienen la siguientes realizaciones de M; N :


M (s)  [Ac; B; Kc; I ]; N (s)  [Ac; B; Cc; D]
5. Finalmente,
G(s) = N (s)M 1 (s)

Factorizacion coprima por la izquierda.

1. Se tiene una realizacion en el espacio de estados de G:


G(s)  (A; B; C; D); con: (A; B ) estabilizable y (C; A) detectable
2. Se calcula Ko tal que A + KoC sea estable.
3. Se calculan las matrices
Ao = A + Ko C; Bo = B + Ko D
4. Se obtienen las siguientes realizaciones de M;^ N^ :
M^ (s)  [Ao; Ko; C; I ]; N^ (s)  [Ao ; Bo; C; D]
5. Finalmente,
G(s) = M^ 1 (s)N^ (s)

El resto de matrices de la doble factorizacion coprima de G estan dadas por:


X (s)  [Ac; Ko ; Co; I ]; Y (s)  [Ac; Ko ; Kc; O]
X^ (s)  [Ao ; Bo; Kc; I ]; Y^ (s)  [Ao; Ko ; Kc; O]

Dada la planta generalizada P del problema estandar, la cual se supone propia:


" ^ ^ #" M Y #
1
P = NM = M N; ^ 1 ^ X Y
N^ M^ N X =I
y un regulador K , cuya factorizacion coprima esta dada por
K = UV 1 = V^ 1 U^
242 Parametrizacion de los controladores

una forma de determinar si K estabiliza a la planta P es veri cando si se cumple:


" #
M U 2 RH
N V 1

o equivalentemente, " ^ ^#
M U 2 RH
N^ V^ 1

El conjunto de reguladores K que estabilizan a la planta P se pueden parametrizar


en funcion de una funcion (matriz) de transferencia Q 2 RH1, de la forma:
K = (Y MQ)(X NQ) 1 = (X^ QN^ ) 1(Y^ QM^ )

Para el caso especial, P 2 RH1, se tendra que:


N = N^ = P; X^ = M = I; X = M^ = I; Y = O; Y^ = O
y por tanto,
K = Q(I PQ) 1 = (I QP ) 1Q
Se puede demostrar (Francis 1987), que K estabiliza a P si y solo si K estabiliza
a P22 (siendo esta estrictamente propia). Por ello, a continuacion se emplea dicho
resultado. Si se realiza la doble factorizacion coprima de P22 ,
" ^ ^ #" #
P22 = N2 M2 = M^ 2 N^2 ;
1 1 X 2 Y 2 M 2 Y 2
N^2 M^ 2 N2 X2 = I
se tendra que el conjunto de reguladores que estabilizan a P22 vendra dado por:
K = (Y2 M2 Q)(X2 N2 Q) 1 = (X^2 QN^2 ) 1 (Y^2 QM^ 2 ) (10:18)

10.4.1 El problema de ajuste del modelo


Si se de nen las siguientes funciones (matrices) de transferencia:
T1 = P11 + P12M2 Y^2P21 ; T2 = P12 M2; T3 = M^ 2 P21
se demuestra que T1; T2 ; T3 2 RH1, y para K dado por la expresion 10.18, la
funcion (matriz) de transferencia que relaciona z con w en el problema estandar
sera:
Tzw = T1 T2 QT3
Controladores H1 243

- T1
w ?j z-
6
- T3 - Q - T2

Figura 10.8: Interpretacion del problema de ajuste del modelo (M-M).


y el objetivo de minimizar kTzw k1 corresponde a un problema de ajuste o aproxi-
macion de modelos (M-M)3 .
En la gura 10.8 se hace una interpretacion del problema M-M, donde T1 es el
modelo a ajustar, T2 y T3 estan dados, o son conocidos, y Q 2 RH1 hay que
encontrarlo, de forma que se realice el mejor ajuste a partir de la minimizacion de
la norma H1 del error de ajuste:
kT1 T2 QT3 k1
Si se comparan las expresiones del problema estandar,
z = [P11 + P12K (I P22 K ) 1P21 ]w
y del ajuste del modelo (ver gura 10.8),
z = [T1 T2QT3 ]w
se tienen las siguientes equivalencias:
P11 = T1; P12 = T2 ; P22 = O; T3 = P21 ; K = Q

Por tanto, dado un problema de dise~no, lo primero sera transformarlo a la forma


del problema estandar, y a continuacion identi car las funciones (matrices) de trans-
ferencia T1 ; T2; T3 que corresponden al problema M-M. A continuacion se da el al-
goritmo cT1T2T3P para obtener T1 ; T2; T3 a partir del problema estandar:
1. Se obtiene una realizacion mnima de la planta generalizada.
P (s)  (Ap; Bp; Cp; Dp)
3 Model Matching en terminologa inglesa (M-M).
244 Parametrizacion de los controladores

2. Segun las dimensiones de w; u; z; e se particiona en la forma


" #
Bp = [B1 B2 ]; CpT = [C1 C2]; Dp = D 11 D12
D21 D22
con D22 = 0, dado que P22 es estrictamente propia.
3. Se calculan T1; T2 ; T3:
T1(s)  (A0; B 0 ; C 0; D11 ); T2 (s)  (Ac; B2; C1 + D12 Kc; D12)
T3 (s)  (Ao; B1 + Ko D21; C2; D21 )
con
Ac = Ap + B2Kc; Ao = Ap + KoC2; C 0 = [C1 + D12 Kc D12 Kc]
" # " #
0
A= O AAc B 2 K c 0 B
; B = B +K D 1
o 1 o 21

10.4.2 Aplicabilidad del teorema de Nehari


En esta seccion se presenta el teorema de Nehari, el cual juega un importante papel
en la solucion de los problemas H1. Como se vera a continuacion, este teorema
establece un resultado empleando para ello la norma de Hankel. La norma de Hankel
de un sistema F (s)  (A; B; C; D) , la cual se representa mediante kF kH o tambien
por medio de k F k, se puede obtener a partir de los grammianos de controlabilidad
Wc y observabilidad Wo del sistema F (s). Para dicho calculo se siguen los siguientes
pasos:

1. Para calcular Wc se resuelve la ecuacion de Lyapunov,


AWc + WcAT = BB T
2. Con la siguiente ecuacion de Lyapunov se obtiene Wo.
AT Wo + WoA = C T C
3. Finalmente se calcula
q
k F k = j max (WcWo ) j
Controladores H1 245

El teorema de Nehari es de gran utilidad para resolver los problemas de opti-


mizacion H1. Este teorema determina el grado de aproximacion entre dos funciones
o matrices de transferencia; donde una de ellas R 2 L1 (es propia y sin polos en
el eje imaginario), y la otra X 2 H1 (es propia y estable). Para una funcion o
matriz de transferencia R 2 L1 se de ne la distancia en H1 como:
dist(R; H1) = inf fkR X k1 : X 2 H1; R 2 L1g

En terminos de sistemas, se trata de aproximar un sistema inestable R(s) por


otro estable X (s). El teorema de Nehari establece que existe una matriz de
transferencia X 2 H1, para una matriz de transferencia dada R 2 L1 , que satisface:
kR X k1 = k Rk

Se deriva que si para una R 2 RL1 dada, se obtiene una factorizacion de la


forma,
R(s) = R1 (s) + R2(s)
donde R1 es estrictamente propia y analtica en Re s  0, y R2 es propia y analtica
en Re s  0, entonces se cumple que,
R = R1

O sea, se hace una expansion en fracciones parciales donde R1 contiene la parte


inestable y R2 la parte estable de R; y posteriormente se emplea R1 para calcular,
dist(R; H1) = k Rk = k R1 k

As por ejemplo, si se tiene,


2 1 3
66 s2 1 4 77
R(s) = 4 1 s+1 5
s s+1 s 1
2

y se realiza una expansion en fracciones parciales, quedan:


2 0:5 3 2 0:5 3
66 s 1 0 7 4
R1 (s) = 4 1 2 75 ; R2(s) = 4 s +0 1 1 5
s2 s + 1 s 1
246 Soluciones al problema de ajuste del modelo

Una realizacion de R1(s)  (A; B; C; D) es:


22 2 1 03 21 03
66 1 0 0 0 77 66 0 0 77 " #
A = 64 0 1 0 0 75 ; B = 64 0 0 75 ; C = 00:5 0:5 0:5 0
1 1 1
0 0 0 1 0 2

Para obtener los grammianos, Wc y Wo; de R1 se resuelven las ecuaciones de


Lyapunov correspondientes, obteniendose nalmente que
q
dist(R; H1) = k Rk = k R1 k1 = j max (WcWo) j = 1:2695

Hasta ahora, se ha obtenido la aproximacion alcanzable, por el teorema de Ne-


hari, pero no se ha tratado el problema de calcular X .

10.5 Soluciones al problema de ajuste del mo-


delo
En este apartado se tratan las soluciones al problema de encontrar una Q 2 RH1
que minimice el error de ajuste kT1 T2 QT3 k1 para unas T1 ; T2; T3 jadas. O sea,
se aborda el problema de encontrar:
= inf fkT1 T2QT3 k1 : Q 2 RH1g

10.5.1 El problema escalar


Se considera a continuacion el planteamiento realizado para el caso escalar; para el
que s es conmutativo el producto de funciones de transferencia, por lo que se puede
poner T1 T2 T3 Q, y por tanto, sin perdida de generalidad, basta con considerar el
caso T3 = 1 (pues en otro caso se llama al producto T2 T3 como T2 ):
inf fkT1 T2 Qk1g

El caso trivial corresponde a la solucion Q = T1=T2 , solo valida si T1 es estable,


y T2 es de fase mnima. Si T2 tiene un unico cero inestable z1 , la solucion tambien
Controladores H1 247

es sencilla, obteniendose en ese caso:


Q(s) = T1 (s)T (sT)1 (z1 ) ; kT1 T2 Qk1 =j T1 (z1 ) j
2

Una funcion de transferencia T (s) 2 RH1, se dice que es interior (inner) si


T ( s)T (s) = 1
Por ejemplo,
1 s 1 s + s2
1;
s + 1 ; 1 + s + s2
son funciones de transferencia interiores. Los ceros de una funcion de transferencia
interior caen todos dentro del semiplano complejo de la derecha, Re s > 0, de ah
que se le de el adjetivo de interior. Se dice que una funcion de transferencia es
exterior (outer) si no tiene ceros en Re s > 0 (o sea que quedan en el exterior de
dicho semiplano complejo de la derecha). Desde el punto de vista de sistemas, una
funcion de transferencia interior es un sistema estable de fase no mnima y pasa-todo
con ganancia unidad; y una exterior es estable y de fase mnima.
Toda funcion (matriz) de transferencia T 2 RH1 tiene una factorizacion
T = TiTo
siendo Ti interior y To exterior. Para obtenerlas se pueden emplear por ejemplo
las funciones\iofr.m y iofc.m" para Matlab de Robust Control Toolbox (Chiang y
Safonov, 1992), o las funciones\inner y outer" del Program CC (Thompson, 1988).
Para resolver el caso general, se transforma el problema de la siguiente forma:
kT1 T2Qk1 = kR X k1
con
R = T2i 1T1 2 RL1 ; X = T2o Q 2 RH1

donde se ha obtenido la factorizacion T2 = T2i T2o , siendo T2i una funcion de trans-
ferencia interior y T2o una exterior (conviene tener en cuenta que T2i fsicamente
equivale a un ltro pasa-todo de ganancia unidad).
Aplicando el teorema de Nehari, se obtiene que,
= inf fkR X k1 : R 2 RL1; X 2 RH1g = k Rk
248 Soluciones al problema de ajuste del modelo

A continuacion se da un algoritmo (alfaQ) para calcular y el optimo Q(s),


para el caso escalar:
kT1 T2 Qk1; con: T2 T2T3 ; o tambien si: T3 = 1

1. Realizar la factorizacion interior-exterior de T2,


T2 = T2i T2o
2. Calcular,
R = T2i 1T1
se obtiene una realizacion mnima,
R(s)  (A; B; C; D)
3. Se resuelven las ecuaciones de Lyapunov,
AWc + WcAT = BB T
AT Wo + WoA = C T C
4. Se obtiene el valor propio maximo,  del producto de grammianos WcWo , y su
correspondiente vector propio v.
5. Calcular,
f (s)  (A; v; C; 0); g(s) = ( AT ;  1Wov; B T ; 0); X = R f=g
6. Se obtienen,
=j  j; Q = T2o1X

Una vez calculado Q, se puede obtener el regulador optimo K a partir de la


ecuacion 10.18.

10.5.2 Optimizacion del comportamiento nominal


A n de ver la aplicabilidad de los resultados y metodos anteriores se plantea el
problema de conseguir una especi cacion de comportamiento nominal (np) dada.
Controladores H1 249

w- j z K - G -
6

Figura 10.9: Problema de comportamiento nominal.


Sea el sistema de la gura 10.9, en la que se emplea una nomenclatura para las
se~nales de acuerdo con la empleada en el problema estandar. As, se tiene que,
z = Sw; S = =1 1 + GK

Se plantea el problema de conseguir un seguimiento adecuado, al menos en el


rango de frecuencias [0; !1]. Para ello se propone la siguiente especi cacion:
j S (j!) j< ; 8 ! 2 [0; !1]
as por ejemplo, con  = 0:01 se requiere un error de seguimiento inferior al 1%
en dicho rango de frecuencias. Esto mismo se puede realizar de forma aproximada
empleando una funcion de ponderacion W y la condicion
kWS k1 <  (10:19)

Una posible eleccion para W es la siguiente:


1
W (s) = (0:01w11 s + 1)k
k
(0:1w1 s + 1)

Teniendo en cuenta la forma general del problema estandar, se tiene que P22 =
G, ya que:
z = w y = Gu
e = w Gu
u = Ke
y por tanto, " #
P= 1 G 1 G
250 Soluciones al problema de ajuste del modelo

Si se realiza una factorizacion coprima de P22 ,


P22 = N=M; MX NY = 1
los reguladores que estabilizan al sistema vendran dados por,
K = YX MQ NQ ; Q 2 RH1
al sustituir en S se obtiene,
S = MX MNQ
con lo que el problema de comportamiento nominal 10.19 equivale a
kT1 T2Qk1 < 
con: T1 = WMX; T2 = WMN . Se tratara de obtener un valor de
= inf fkT1 T2Qk1 : Q 2 RH1
tal que < , dependiendo el valor de del exponente k de W (s); por lo que se
indicara por k .

Algoritmo (KNP)
A continuacion se da un para resolver este problema de np.

1. Realizar la factorizacion coprima de G:


G = N=M; MX NY = 1
2. Se de ne la funcion de ponderacion,
(0 : 01w 1 s + 1)k
W (s) = 1
(0:1w1 1s + 1)k
se toma inicialmente el valor k = 1.
3. Se obtiene
T1 = WMX; T2 = WMN; V (s) = (s + 1)l
donde el exponente l es el grado relativo de G.
Controladores H1 251

4. Se sustituye T2 T2V , y por medio del algoritmo alfaQ, ya descrito, calcula


k ,
k = minfkT1 T2 Q1k1 : Q1 2 RH1
Si k  , se incrementa k en uno, y se vuelve al paso 3. En otro caso,
continuar.
5. Por medio del algoritmo alfaQ, calcular Q1 2 RH1, tal que,
k = kT1 T2Q1 k1
6. Se calcula nalmente el regulador,
K = YX MQ a
NQa
con Qa(s) = V (s)Q1 (s)=(0:1w1 1s + 1)l.

Ejemplo:
Con el siguiente ejemplo, se ilustra el procedimiento anterior para una planta de
fase no mnima
G(s) = (s (+s 1)(1)( s 2)
s2 + s + 1)
Para las especi caciones de comportamiento nominal se emplean w1 = 0:01;  =
0:1 ( 20 db). Por tanto, se desea conseguir un error de seguimiento inferior al 10%
para se~nales de referencia con ancho de banda inferior a 0:01 rad/s.

1. Como la planta es estable, se toman:


N = G; M = 1; X = 1; Y = 1
2. Se elige  s + 1 k
W (s) = 10s + 1
3. Se calculan  s + 1 k
T1(s) = 10s + 1 ; V (s) = s + 1
 k
T2 (s) = 10ss++11 (s (+s 1)(1)( s 2)
s2 + s + 1)
252 Soluciones al problema de ajuste del modelo

4. Se obtienen: 1 = 0:2299; 2 = 0:0511, y por tanto 2 < ; k = 2.


5. Se calcula
Q1(s) = 6:114 (s + 0:3613)(s2 + s + 1)
(s + 4:656)(s + 1)2
6. Y nalmente

Qa (s) = 6:114 (s(s++4:0656)(


:3613)(s2 + s + 1)
s + 1)(10s + 1)
(s + 0:3613)(s + 1)(s2 + s + 1)
K (s) = 0:6114 (s + 0:004698)( s + 0:5280)(s2 + 5:612s + 9:599)

En la gura 10.10 pueden verse las magnitudes de las funciones de sensibilidad


j S (j!) j y sensibilidad complementaria j T (j!) j obtenidas; la respuesta temporal
para consigna escalon unidad se tiene en la gura 10.11, puede comprobarse el
comportamiento de fase no mnima que presenta el sistema.

0
Sensibilidad
-5

-10
magnitud (dB)

-15

-20

-25

-30
Sensibilidad complementaria
-35

-40

-45
10 -4 10 -3 10 -2 10 -1 10 0 10 1 10 2

rad/s

Figura 10.10: Magnitudes de j S (j!) j; j T (j!) j, problema de np


Controladores H1 253

0.8

0.6
respuesta lazo cerrado

0.4

0.2

-0.2
0 10 20 30 40 50 60 70 80

segundos

Figura 10.11: Respuesta temporal a escalon unidad, problema de np

10.6 Problemas de control H ;H 2 1 en el espacio


de estados
En la primera parte de este captulo se ha presentado una forma de resolver el pro-
blema de control H1 para el caso de sistemas de una entrada y una salida (planta es-
calar), el cual sigue el tratamiento original realizado por Francis (1987). Igualmente,
siguiendo un procedimiento similar, aunque bastante mas elaborado y complejo, es
posible obtener los correspondientes algoritmos para resolver el problema multiva-
riable. Si bien, para ello resulta mas ventajoso emplear el tratamiento en el espacio
de estados que se presenta a continuacion; el cual es general y valido independien-
temente del caracter escalar o vectorial de la planta a controlar, consituyendo un
metodo mas compacto.
A pesar de ello, se ha comenzado este captulo con el procedimiento entrada-
salida descrito en los apartados anteriores; a n de presentar los orgenes del pro-
blema, as como el planteamiento seguido para su resolucion. Se trata con ello que
el lector se situe ante el problema de control H1 con una perspectiva que va desde
su enfoque clasico al planteamiento actual.
254 Problemas de control H2; H1 en el espacio de estados

Los algoritmos desarrollados en el espacio de estado se caracterizan en general por


estar basados en la solucion de dos ecuaciones algebraicas de Riccati desacopladas,
partiendo de las matrices de estado de la planta ampliada o generalizada. A partir
del trabajo de Doyle et al.(1989) se inicia la etapa actual del desarrollo de algoritmos
para la resolucion de los problemas de control H1.
Considerese una realizacion en el espacio de estados de la planta ampliada P (s)
(ver gura 10.5) expresada como:
x_p = Apxp + B1 w + B2u
z = C1 x + D11 w + D12u (10.20)
e = C2 x + D21 w + D22u
o en forma abreviada como,
P (s)  (Ap; Bp; Cp; Dp)
con,
Bp = [B1 B2 ] ; CpT = [C1 C2]
" #
Dp = D DD11 D 12
21 22

De forma general, el problema de dise~no se puede expresar de la siguiente forma:


dado el sistema de la gura 10.5, se tratara de encontrar un regulador K (s) 4 ,
asintoticamente estable que haga al sistema en lazo cerrado Tzw internamente estable
y que minimice la norma H2 (problema H2) o la norma H1 (problema H1) de Tzw .
En el tratamiento que hacen Doyle et al.(1989) de ambos problemas (H2; H1),
en el espacio de estados se tienen en cuenta algunas suposiciones, que sirven para
simpli car la formulacion, y van a constituir las hipotesis de trabajo del problema
de control optimo H1 que a continuacion se desarrolla.
Las condiciones supuestas para las matrices de estado de la planta ampliada P (s)
son las siguientes:

1. Los pares (Ap; B1) y (Ap; B2 ) son estabilizables.


2. Los pares (C1; Ap) y (C2 ; Ap) son detectables.
4Los controladores racionales propios, detectables y estabilizables que dotan al sistema en lazo
cerrado de estabilidad interna son denominados controladores admisibles.
Controladores H1 255

3. D12T C1 = 0 y D12T D12 = I


4. B1D21T = 0 y D21D21T = I
5. D11 = 0 y D22 = 0

Las suposiciones (1) y (2) garantizan la existencia de la solucion de las ecuaciones


de Riccati de control y del observador. La suposicion (3) implica la ortogonalidad
entre C1 x y D12 u, lo cual en la formulacion de un problema lqg implica que la
funcion de costes no tendra ponderacion cruzada entre el estado x y la entrada
de control u, a la vez que la matriz de ponderacion del vector de control sera la
matriz unidad. La (4) equivale a la (3) para las matrices de covarianza de los ruidos
actuantes sobre el proceso y sobre la medida (ruido en sensores). La suposicion
(5) se hace para simpli car la formulacion, y no supone perdida de generalidad, ya
que un problema determinado puede transformarse en uno equivalente que satisfaga
tales requerimientos (Green y Limebeer, 1995, Safonov et al.1989).

10.6.1 Controlador optimo H2


Como se ha descrito en el apartado anterior, una forma de expresar algunas de las
especi caciones de dise~no es mediante la minimizacion de la norma H2 de la funcion
(matriz) de transferencia Tzw . O expresado en terminos de se~nales: se trata de
encontrar un controlador K (s) asintoticamente estable que estabilice al sistema en
lazo cerrado y que minimice la norma H2 de la se~nal de respuesta del sistema a una
se~nal de entrada caracterizada por ser ruido blanco con intensidad unidad. Esto
expresado en forma analtica supone la minimizacion de la funcion de coste:
Z1
JH2 = 21 traza[Tzw T ( j! )T (j! )]d! = kT k2
zw zw 2 (10:21)
0

Una forma de calcular la norma H2 es mediante:


kTzw k22 = traza(CT WcCTT ) = traza(BTT WoBT ) (10:22)

donde las matrices (AT ; BT ; CT ; DT ) determinan una realizacion en el espacio de


estados del sistema Tzw ; y las matrices Wc y Wo son sus respectivos grammianos
de controlabilidad y observabilidad. Estos se pueden obtener resolviendo las corres-
pondientes ecuaciones de Lyapunov:
AT Wc + WcATT + BT BTT = 0
256 Problemas de control H2; H1 en el espacio de estados

ATT Wo + WoAT + CTT CT = 0

El controlador optimo K (s) que minimiza kTzw k2 se calcula resolviendo el par


de ecuaciones algebraicas de Riccati independientes:
ATp X2 + X2 Ap X2 B2B2T X2 C1T C1 = 0 (10:23)
ApY2 + Y2ATp Y2C2T C2Y2 B1 B1T = 0 (10:24)

que teniendo en cuenta la de nicion del operador de Riccati (ver apendice C.2)
puede ponerse de forma equivalente como:
X2 = Ric(HX 2)
Y2 = Ric(HY 2 )

siendo las matrices Hamiltonianas asociadas:


" T #
A
HX 2 = C T C p B 2 B 2
1 1 ATp
" #
HY 2 = ATp C2T C2T
B1 B1T Ap

A partir de las soluciones X2; Y2 respectivas de 10.23 y 10.24 se tiene el compen-


sador optimo:
K (s) = Kc(sI Ap + B2Kc + KoC2) 1 Ko (10:25)
donde:
Kc = B2T X2 ; Ko = Y2C2T

son las matrices de realimentacion de estados y de ganancia del observador, en la


estructura convencional del controlador lqg.
El mnimo de JH2 se obtiene de :
min kTzw k22 = kGcB1k22 + kKcGok22 = kGcKo k22 + kC1Gok22 (10:26)
con:
Gc(s) = (C1 + D12 Kc)(sI Ap B2Kc) 1
Go(s) = (sI Ap KoC2 ) 1(B1 + Ko D21)
Controladores H1 257

10.6.2 Relacion entre LQG/LTR y H2


Los problemas de dise~nos lqg/ltr-i y lqg/ltr-o pueden interpretarse como dos
casos particulares del problema de optimizacion H2 de sensibilidad mixta (Stein et
al. 1987). A continuacion de pone de mani esto dicha correspondencia.
Considerese la planta a controlar G(s) representada por las ecuaciones de estado
x_ = Ax + Bu + v1
y = Cx + Iv2
z = Mx
donde: G(s) = C (s)B; (s) = (sI A) 1 y los ruidos sobre el proceso
(v1) y sobre los sensores (v2) se consideran ruidos gausianos con intensidad unidad
e incorrelados entre s. Un regulador optimo lqg minimiza la funcion de coste
( ZT )
1 T 2
JLQG = E T (z z +  u u)dt T (10:27)
0
Teniendo en cuenta que se tienen las siguientes relaciones
" # " # 2 u(s) 3
y(s) = G(s) C (s) I 64 v (s) 75
z(s) M (s)B M (s) 0 1
v (s)
2
u(s) = K (s)y(s)
se obtiene: " # " #
z = T v1
u zw v
2
donde, " #
Tzw = T TT 11 T 12 (10:28)
21 22
con,
T11 = M (s) M (s)K (s)[I + G(s)K (s)] 1C (s)
T12 = M (s)BK (s)[I + G(s)K (s)] 1
T21 = K (s)[I + G(s)K (s)] 1C (s)
T22 = K (s)[IG(s)K (s)] 1

Sustituyendo la ecuacion 10.28 en la 10.27 y teniendo en cuenta el teorema de


Parseval (Stein y Athans, 1987) se obtiene que la funcion de coste dada en 10.27 se
258 Problemas de control H2; H1 en el espacio de estados

puede expresar en el dominio de la frecuencia como


1 Z1 H ]d!
JLQG = 2 tr [Tzw Tzw
0

Lo cual establece la relacion entre los problemas de optimizacion H2 y lqg. A


continuacion se avanza mas en dicha relacion, estableciendose las condiciones bajo
las cuales el problema de dise~no lqg/ltr se puede transformar en un problema de
control optimo H2 de sensibilidad mixta.

 Caso lqg/ltr-i. Si se consideran las siguientes condiciones:


W (s) = M (s)B (1=)
= B
 0
queda:
" # " #
Tzw (s)  W (s)[I + K (s)G(s)] 1 0 =  W (s)Si(s) 0
[I + K (s)G(s)]1K (s)G(s) 0 Ti (s) 0

A partir de lo cual se concluye que el problema lqg/ltr-i equivale a un


problema de sensibilidad mixta H2 .
 Caso lqg/ltr-o. Si se consideran las siguentes condiciones:
W (s) = C (s) (1=)
M = C
 0
queda:
" # " #
T (s)
Tzw  [I + G(s)K (s)] 1W (s) 0 =  So(s)W (s) 0
G(s)K (s)[I + G(s)K (s)]1 0 To (s) 0

Y por tanto, al igual que para el caso anterior, tambien se obtiene que el
problema lqg/ltr-o equivale a un problema de sensibilidad mixta H2 .
Controladores H1 259

10.6.3 Controlador H1
En un determinado problema de control, puede que se este interesado en minimizar
el maximo alcanzable por la respuesta frecuencial de Tzw , en vez de minimizar algun
tipo de promedio, como se hace en la optimizacion H2 . En ese caso, se plantea un
problema de optimizacion H1, en el que se trata de obtener el mnimo de:
kTzw k1 = sup
!
(Tzw ) (10:29)

Para contrastar los problemas H1 y H2 , considerese el caso monovariable (es-


calar) en el que se tenga:
kTzw k1 
esto equivale a que para una se~nal w con kwkrms  1, el sistema dara una respuesta
z = Tzw w tal que kTzw wkrms  ; mientras que si:
kTzuk2 

ello equivale a que para una se~nal particular w de ruido blanco de intensidad unidad,
el sistema dara una respuesta z = Tzw w con kTzw wkrms  . Por lo tanto un
problema de minimizacion H1 es mas general que uno H2, al abarcar el primero la
posibilidad de una gama mas amplia de se~nales de entrada.
Otra distincion la supone el hecho de que H2 minimiza el valor cuadratico medio
de la magnitud sobre todas las frecuencias, no haciendo alusion directa alguna a
la existencia de posibles picos de peque~na anchura (resonancias pronunciadas pero
muy estrechas), pues su efecto sobre el calculo del promedio sera poco apreciable.
Sin embargo, la optimizacion H1 es el maximo de esos posibles picos el que tiene
en cuenta (Stoorvogel, 1992).
Para remarcar el aspecto distintivo entre los reguladores H2 y H1, a continuacion
se va a utilizar el problema de sensibilidad mixta anteriormente de nido. Como se
describe en el captulo 8, a partir de la relacion:
(WS So )  1
se especi ca un comportamiento nominal deseado (np) y con:
(WT To)  1
260 Problemas de control H2; H1 en el espacio de estados

se especi ca una robustez de la estabilidad (rs) del sistema de control frente a


incertidumbres multiplicativas situadas a la salida de la planta. 5
Una forma de que se veri quen simultaneamente las desigualdades anteriores es
haciendo que se cumpla:

kTzw k1 = WWS So  1 (10:30)
T To 1

El regulador optimo H1 minimizara dicho valor, mientras que el regulador


optimo H2 minimizara la norma kTzw k2 ; por lo que el primero trata directamente
con el problema de maximizar la robustez del sistema de control, y de ah su atractivo
y utilidad en los problemas de control robusto.
El calculo de la norma H1 se puede hacer directamente a partir de su de nicion
(10.29), o de forma indirecta. As, si se tiene una realizacion de Tzw dada por las
matrices (AT ; BT ; CT ; DT ), se de ne la matriz Hamiltoniana asociada H como:
" #
H= AT BT BTT = 2
CTT CT ATT

y se establecen las siguientes equivalencias (Doyle et al. 1989):

1. Tzw cumple: kTzw k1 < (10:31)


2. H no tiene autovalores en el eje imaginario.
3. H 2 dom (Ric) (ver apendice C.2)
4. H 2 dom (Ric) y Ric(Tzw ) > 0 si (C; A) es observable.

Teniendo en cuenta (1) y (2) se puede derivar un metodo para calcular kTzw k1:

1. Se selecciona un escalar > 0.


2. Se forma la matriz H y se testea si tiene autovalores en el eje imaginario.
3. Se aumenta o disminuye de acuerdo con el resultado del paso 2.
5 En ese caso el sistema de interconexion coincide con la funcion de sensibilidad complementaria:
M (s) = To (s) (ver captulo 8).
Controladores H1 261

4. Se repite el proceso, iterando con hasta encontrar un valor crtico o que con
cierta precision cumpla la condicion del paso 2, en ese caso se consigue una
cota ajustada kTzw k1 < o.

Para encontrar un controlador asintoticamente estable K (s), que consiga kTzw k1 <
, se resuelven el par de ecuaciones algebraicas de Riccati siguientes (Doyle et al,
1989):
ATp X1 + X1Ap X1[(1= 2)B1B1T B2 B2T ]X1 + C1T C1 = 0 (10:32)
ApY1 + Y1ATp Y1[(1= )2C1T C1 C2T C2]Y1 + B1 B1T = 0 (10:33)

o teniendo en cuenta la de nicion del operador de Riccati (ver apendice C.2):


X1 = Ric(HX 1)
Y1 = Ric(HY 1)

con las matrices Hamiltonianas asociadas:


" 2 )B B T B B T #
HX 1 = C T C A p (1 = 1 1 2 2
1 1 ATp
" #
HY 1 = ATp (1= 2)C1T C1 C2T C2
B1 C1T Ap

El controlador resultante es:


K (s) = Kc[sI Ap (1= 2)B1B1T X1 B2Kc ZKoC2] 1 Ko (10:34)
donde:
Kc = B2T X1; Ko = Y1C2T ; Z = [I (1= 2)Y1X1] 1; K1 = B1 B1T X1(1= 2)
El compensador 10.34 consigue kTzw k1 < , sin embargo la solucion no sera valida
(es decir: el sistema en lazo cerrado no sera asintoticamente estable) a menos que
se cumplan las condiciones siguientes:
X1  0
Y1  0 (10.35)
j max (X1Y1) j < 2
262 Problemas de control H2; H1 en el espacio de estados

Aunque no sea tan evidente como en el caso H2 , el controlador H1 tiene una


estructura constituida por una realimentacion de estados y un observador (ver gura
10.12). La dinamica del compensador queda descrita por el conjunto de ecuaciones:
x^_ = Apx^ + B2 u + ZKo (^y y) + B1w^
y^ = C2x^
u = Kcx^ (10.36)
2 T
w^ = (1= )B1 X1x^

donde Kc representa la matriz de realimentacion de estados, ZKo la matriz de


ganancia del observador y w^ supone un estimado de la peor perturbacion que pudiera
darse sobre el sistema, en el sentido de que maximizara la magnitud (Doyle et al,
1989):
kzk22 2kwk22
El calculo para obtener la solucion de un problema de optimizacion H1 requiere
un proceso iterativo, iniciandose con un valor inicial para el parametro , probando
si se cumplen todas las condiciones necesarias (10.31,10.35) y modi candolo hasta
encontrar una solucion adecuada. El proceso de busqueda puede terminar con el
valor mnimo min, o en una solucion suboptima ( o > min).

10.6.4 Algoritmo de calculo del regulador H1


A la hora de aplicar el algoritmo de calculo del regulador H1 anteriormente descrito,
pueden aparecer algunos problemas numericos que di culten o hagan imposible su
resolucion. Por ello, se han desarrollado, y aun se siguen desarrollando en la actua-
lidad, diferentes algoritmos de calculo que tratan de mejorar y facilitar la resolucion
numerica de las ecuaciones. En la bibiliografa especializada pueden encontrarse
diferentes opciones para dicho calculo (Green y Limebeer, 1995). A continuacion se
da un algoritmo alternativo al descrito anteriormente, que mejora las propiedades
numericas para el calculo del controlador H1.
La ley de control se obtiene de
u = Kcx^
y el estimador del estado se calcula a partir de las ecuaciones
x^_ = Apx^ + B2 u + B1w^ + Z1Ko (y y^)
Controladores H1 263

B2 

-  - ZK -
? -
r x^ u y
 -  o   p (s ) Kc - G(s) -
- 6 6 6
K1 

C2 

Figura 10.12: Estructura del controlador H1

w^ = B1T X1x^(1= 2)
y^ = C2 x^ + D21 B1T X1x^(1= 2)

Las matrices Kc; Ko; Z1 se obtienen respectivamente de,


Kc = D120 (B2T X1 + D12T C1 ); D120 = (D12T D12 ) 1

Ko = (Y1C2T + B1 D21T )D210 ; D210 = (D21 D21T ) 1

Z1 = (I 2 Y1X1) 1

Las matrices X1; Y1 son soluciones de las correspondientes ecuaciones de Ric-


cati, o de forma equivalente (ver apendice C.2):
" 0 DT C1 2 B1 B T B2 D0 B T #
X1 = Ric A p B 2 D 12 12 1 12 2
C10T C10 (Ap B2 D120 D12T C1 )T
" T D0 C2 )T 2 C T C1 C T D0 C2 #
Y1 = Ric ( A p B 1 D 21 21 1 2 21
B10 D10T (Ap B1 D21T D210 C2)
donde,
C10 = (I D12 D120 D12T )C1; B10 = B1(I D21T D210 D21 )
264 Problemas de control H2; H1 en el espacio de estados

Finalmente, se dan las matrices del regulador K ,


K (s)  [Ar ; Br ; Cr ; Dr ]
con,
Ar = Ap B2Kc Z1Ko C2 + 2(B1 B1T Z1Ko D21B1T )X1
Br = Z1Ko; Cr = Kc; Dr = 0

as como la realizacion de Tzw :


" # " #" # " #
x_ = Ap B2 Kc x + B1
x^_ Z1Ko C2 T22 x^ Z1KoD21 w
" # " # " #
z = C1 D12 Kc + 0 w
y C2 0 D21
donde se tiene que,
T22 = Ap B2Kc + 2B1 B1T X1 Z1Ko(C2 + 2 D21 B1T X1)

10.6.5 Ejemplos ilustrativos


Ejemplo: Dise~no H1 de sistema doble integrador
Sea el sistema compuesto por la planta nominal a controlar ( gura 10.13),

G(s) = s12 = uy((ss))


la perturbacion d, y el ruido de medida n actuantes sobre el sistema, cuyo conjunto
queda descrito por las ecuaciones siguientes:
x_ 1 = d + u
x_ 2 = x1
y = x2 + n

Se desea dise~nar un regulador H1 que consiga atenuar el efecto de d y n sobre el


sistema, a la vez que la se~nal de control no tome valores excesivos a n de evitar en lo
posible la saturacion de los actuadores. Para lo cual, se incluira la se~nal de control,
junto con la propia variable de estado x2 , en las variables empleadas para evaluar
Controladores H1 265


? x1 - 1 x2
u -
 - 1
s s
-


?
y 
  n

Figura 10.13: Diagrama de bloques

- s 
w z
x1 - 1 x2- ?

6
- 1
s s  -

s
u y
K (s) 

Figura 10.14: Diagrama de bloques para H1


266 Problemas de control H2; H1 en el espacio de estados

el comportamiento del sistema en lazo cerrado; o sea, como elementos de z. Por lo


que los respectivos vectores w; z implicados en los desarrollos teoricos comentados
anteriormente ( gura 10.14), son en este caso:
" # " #
w = n ; z = xu2
d

Para la eleccion realizada, queda que las matrices que componen la realizacion
de la planta generalizada son de la forma:

2 3
66 01 0
0
1
0
0
0
1
0 77
6 77
P (s) = 66 0 1 0 0 0 77
64 0 0 0 0 1 5
0 1 0 1 0

O sea,
" #
Ap = 0 0
1 0
" # 2 3
1 0 ; 1
B1 = 0 0 B2 = 4 75
6
0
" # h i
C1 = 0 1 ; C2 = 0 1
0 0
" # " #
D11 = 0 0 ; D12 = 01
0 0
h i h i
D21 = 0 1 ; D22 = 0

Siguiento los pasos dados en este apartado, y tras un proceso iterativo de busqueda
para el valor de , se obtiene que el algoritmo da una solucion factible para = 2:62,
el cual esta proximo pero no coincide con el valor optimo. Para obtener el optimo
se pueden emplear algoritmos mas so sticados; tales y como se dan en el Robust
Control Toolbox (funcion\hinfsyn"), o en el -Synthesis Toolbox (funcion\hinfopt"),
para Matlab. Para = 2:62 se obtiene el siguiente regulador H1:
Controladores H1 267

K (s) = (s +578:3(s + 0:39)


2:33)(s + 220:72)

que equivale basicamente a un compensador de adelanto con un polo situado a alta


frecuencia, incluido para mejorar la robustez del sistema. Para este regulador se
obtienen: un margen de fase de 44.6 grados, un margen de ganancia de 44.3 db, y
un porcentaje de incertidumbre multiplicativa tolerable (1/max(T )) del 70%.
Para analizar el comportamiento del controlador dise~nado frente a la dinamica
inmodelada, se considera que la planta real viene dada por
G0 = G(1 + Em)
con,
Em (s) = s( 0:s30556 s + 0:6667)
2 + s + 100

80

60

40
Tolerancia e incertidumbre (dB)

Tolerancia
20

-20

-40
Incertidumbre multiplicativa

-60

-80
10 -1 10 0 10 1 10 2

rad/s

Figura 10.15: Incertidumbre tolerable e incertidumbre existente

En la gura 10.15 se muestran el nivel de tolerancia a incertidumbre multiplica-


tiva del sistema de control, as como la magnitud de Em (j!). La respuesta temporal
268 Problemas de control H2; H1 en el espacio de estados

1.4

1.2

0.8
respuesta

0.6

0.4

0.2

0
0 2 4 6 8 10 12 14

tiempo (seg)

Figura 10.16: Comportamientos con planta nominal y planta real

puede verse en la gura 10.16, en la que se muestra el comportamiento para el mo-


delo nominal de la planta G, y para el modelo real G0. Como puede verse, en este
caso el efecto de la dinamica inmodelada es muy poco apreciable, cosa que pone
de mani esto la robustez del comportamiento del sistema de control, al menos para
este tipo de incertidumbre.

Ejemplo: Dise~no de controladores H2; H1 de tiempo discreto


En este ejemplo se plantea el problema de controlar una planta, cuyo modelo
matematico es de tiempo continuo G(s), por medio de un regulador de tiempo
discreto K (z), empleando un perodo de muestreo de Tm = 0:01 segundos. En la
gura 10.17 se muestra el diagrama de bloques del sistema de control.
El procedimiento de dise~no empleado sigue los pasos siguientes:

1. Se obtiene un modelo discreto de la planta G(z), empleando para ello la aprox-


imacion del mantenedor de orden cero (ZOH).
Controladores H1 269

r -i K (z) ZHO G(s) y -


6 Tm Tm

Figura 10.17: Controlador H1 de tiempo discreto

2. Se realiza la transformacion bilineal inversa, obteniendose un sistema continuo


en el plano-w G(w).
3. Se dise~na el controlador H2; H1, obteniendo K (w)
4. Se emplea la transformacion bilineal para obtener el regulador equivalente de
tiempo discreto K (z).

En forma sintetica, dicho proceso de dise~no consiste en:


1
! G(z) bilin! G(w) H2;H!1 K (w) bilin
G(s) ZOH ! K (z )

donde el operador bilin empleado realiza una trasformacion del plano w al plano z
consistente en:
w = T2(z(z +1)1)
m

La transformacion inversa bilin 1 se emplea para dise~nar un regulador de tiempo


discreto con tecnicas de tiempo continuo en el plano-w.
La funcion de transferencia de la planta a controlar es,

G(s) = s3 + 30s2 +900


700s + 1000

En la gura 10.18 pueden verse las respuestas en frecuencia de G(s) y G(w) para
un perodo de muestreo de Tm = 0:01 seg:
Las especi caciones de dise~no para el sistema de control son:
270 Problemas de control H2; H1 en el espacio de estados

50

|G(w)|
-50
|G(s)|, |G(w)| (db)

-100

-150 |G(s)|

-200

-250
10 -3 10 -2 10 -1 10 0 10 1 10 2 10 3 10 4 10 5

rad/s

Figura 10.18: Respuestas en frecuencia de G(s)yG(w)


 Especi cacion de comportamiento nominal (NP): reduccion de la sensibilidad
de al menos 1=100 hasta una frecuencia de aproximadamente 1 rad=seg. Lo
anterior puede conseguirse mediante una funcion de ponderacion WS de la
forma,
WS 1 = 0(:01( s + 1)2
s=30 + 1)2
 Especi cacion de estabilidad robusta (RS): un ancho de banda de unos 30 rad=s,
una tolerancia a incertidumbre multiplicativa superior al 32 %, y una cada de
j T j inferior a 20 db para frecuencias superiores a 2000 rad=s. Estas especi-
caciones se pueden tener en cuenta eligiendo una funcion de ponderacion WT
de la forma,
WT 1(s) = 3:16( s=300 + 1)
(s=10 + 1)

El parametro  empleado en WS tiene el sentido fsico de que al aumentarlo se


impone al sistema de control una especi cacion de np mas exigente (un valor inferior
de j S j a baja frecuencia). El proceso de dise~no consiste en jar WT y variar , de
forma que se cumpla la condicion de estabilidad robusta, as como que se optimice
el comportamiento nominal simultaneamente para el valor mayor de  posible. En
la gura 10.19 se muestran las formas de WT 1 y WS 1 para  = 1:5.
Controladores H1 271

20

10

0
|1/W_S|, |1/W_T| (db)

-10
|1/W_T|

-20

-30
|1/W_S|

-40

-50
10 -3 10 -2 10 -1 10 0 10 1 10 2 10 3 10 4 10 5

rad/s

Figura 10.19: Respuesta en frecuencia de funciones de ponderacion inversas


WS 1; WT 1
Se plantea por tanto un problema de control H1 de sensibilidad mixta (np +
rs):
W S S
kTzw k1 = W T < 1 (10:37)
T 1

Se inicia el proceso de dise~no con  = 1, obteniendose un regulador H1 para el


que se cumplen las especi caciones de dise~no. A n de mejorar las prestaciones del
regulador, se inicia un proceso iterativo dando valores al parametro . Se concluye
nalmente, que el objetivo de dise~no 10.37 se veri ca con un regulador H1 para un
valor de hasta  = 1:5, no cumpliendose para un regulador H2. En la gura 10.20
pueden compararse las respuestas en frecuencia de Tzw para ambos reguladores.
Como puede comprobarse, el regulador H2 no consigue el objetivo kTzw k1 < 1,
mientras s se alcanza con el regulador H1.
En las guras 10.21, 10.22, 10.23 y 10.24 se muestran respectivamente las res-
puestas en frecuencia de WS 1 con S , WT 1 con T , para el regulador H2 y el H1.
Finalmente en la gura 10.25 se muestra la curva de Nichols (de la funcion de trans-
ferencia en lazo abierto L = GK ) obtenida con el regulador H1. A partir de ella,
puede obtenerse que el controlador dise~nado proporciona un margen de ganancia de
272 Problemas de control H2; H1 en el espacio de estados

2 H_2

-2

-4
|T_zw| (db)

H_inf
-6

-8

-10

-12

-14

-16
10 -3 10 -2 10 -1 10 0 10 1 10 2 10 3 10 4 10 5

rad/s

Figura 10.20: Respuesta en frecuencia de Tzw para reguladores H2 y H1


12 decibelios, y un margen de fase de 43 grados. Por otro lado, a partir de 1= j T j
se obtiene una tolerancia a incertidumbre multiplicativa superior al 60 % en el peor
de los casos. El regulador H1 obtenido, K (z), es de orden 6, el mismo de la planta
generalizada. Ya que la planta a controlar es de orden 3, la funcion de ponderacion
WS es de orden 2, y WT es de primer orden.
K (z) = 16:7016 z6 40:2747z5 + 13:4628z4 + 35:544z3 31:404z2 + 3:7234z + 2:2497
z6 1:5311z5 + 0:1799z4 + 0:2894z3 + 0:0413z2 + 0:0169z + 0:0037

En las guras 10.26 y 10.27 se muestran respectivamente la se~nal de control y la


respuesta obtenida con el regulador H1.
Controladores H1 273

20

|1/W_S|
10

0
|S|
|S|, |1/W_S| (db)

-10

-20

-30

-40

-50
10 -3 10 -2 10 -1 10 0 10 1 10 2 10 3 10 4 10 5

rad/s

Figura 10.21: Magnitudes de WS 1 y S para regulador H2

20

10

|T|
-10
|T|, |1/W_T| (db)

|1/W_T|

-20

-30

-40

-50

-60
10 -3 10 -2 10 -1 10 0 10 1 10 2 10 3 10 4 10 5

rad/s

Figura 10.22: Magnitudes de WT 1 y T para regulador H2


274 Problemas de control H2; H1 en el espacio de estados

20

|1/W_S|
10

0
|S|
|S|, |1/W_S| (db)

-10

-20

-30

-40

-50
10 -3 10 -2 10 -1 10 0 10 1 10 2 10 3 10 4 10 5

rad/s

Figura 10.23: Magnitudes de WS 1 y S para regulador H1

20

10

0
|T|
-10
|T|, |1/W_T| (db)

|1/W_T|

-20

-30

-40

-50

-60
10 -3 10 -2 10 -1 10 0 10 1 10 2 10 3 10 4 10 5

rad/s

Figura 10.24: Magnitudes de WT 1 y T para regulador H1


Controladores H1 275

60

40

20

0
|L| (db)

-20

-40

-60

-80
-450 -400 -350 -300 -250 -200 -150 -100 -50 0

arg(L) (gra)

Figura 10.25: Curva de Nichols para regulador H1

20

15

10

5
control

-5

-10

-15

-20
5 10 15 20 25 30 35 40 45 50

muestras (Tm=0.01 seg.)

Figura 10.26: Se~nal de control para cambio en escalon unidad, con regulador H1
276 Problemas de control H2; H1 en el espacio de estados

1.4

1.2

1
respuesta

0.8

0.6

0.4

0.2

0
5 10 15 20 25 30 35 40 45 50

muestras (Tm=0.01 seg.)

Figura 10.27: Respuesta a escalon unidad, con regulador H1


Captulo 11
Aplicacion de control robusto
11.1 Introduccion
Hasta la decada de los ochenta las aplicaciones de las tecnicas de control moderno en
los buques haba sido algo bastante inusual. A pesar de la amplia aceptacion y exitos
conseguidos en otras ramas de la ingeniera (probablemente el contrapunto sea la in-
dustria aeronautica), donde los avances de la teora de control han sido rapidamente
incorporados en la busqueda de la mejora del funcionamiento y seguridad.
Las razones de la inercia presentada por la industria naval hay que buscarlas en
diversos factores, tales como: la mayor duracion de los barcos comparados con los
aviones, la resistencia a intentar nuevas tecnicas cuando los metodos tradicionales
han demostrado tener un funcionamiento valido, as como la cada en la industria
de construccion naval, entre otros.
En muchos casos, la innovacion ha consistido en la sustitucion directa de los
antiguos sistemas de control analogicos por otros equivalentes digitales, y el aprove-
chamiento de la potencia de computacion del ordenador empleado, para incorporar
o mejorar tareas de monitorizacion y alarma; mas que para explotar los bene cios
que podra reportar el empleo de algoritmos de control avanzado.
Los primeros autopilotos para el guiado automatico de barcos eran simples dis-
positivos en los que el error de rumbo se utilizaba para producir una orden al ser-
vosistema del timon proporcional al error del rumbo. Posteriormente se modi co
incluyendo el efecto derivativo para mejorar la respuesta transitoria y el efecto inte-
277
278 Introduccion

gral para corregir los errores estacionarios debidos a las perturbaciones ambientales.
Debido a su simplicidad, abilidad y bajo coste, los autopilotos pid aun se
mantienen en la mayora de barcos. Uno de los principales inconvenientes es la
necesidad de sintonizacion por parte del operador, para adaptarse al cambio de
condiciones de navegacion.
Ha sido el perodo de nales de los setenta y durante la decada de los ochenta,
cuando la mejora del sistema de control de los buques ha experimentado un notable
incremento en investigacion y desarrollo. La justi cacion se debe primordialmente
a razones tales como:

1. Las elevadas subidas del precio del petroleo y la busqueda de la reduccion del
coste en los transportes.
2. La exigencia de mejora en la seguridad del transporte martimo.
3. La transferencia tecnologica acelerada por los recientes avances de la micro-
electronica, informatica y telecomunicaciones.
4. El exito obtenido en otras ramas de la industria, en la aplicacion de los ultimos
desarrollos de la teora de control.

El impulso proporcionado en la ultima decada se pone de mani esto, en el hecho


de que todos los buques de nueva construccion incorporan un sistema automatico
mas o menos so sticado para el control del rumbo.
Por otro lado, ha demostrado ser de gran utilidad, tanto para buques de la
Marina Mercante como para los de la Armada, el que adicionalmente al problema
del control del rumbo de un buque (escalar o monovariable), se considere el empleo
de sistemas activos de estabilizacion para la regulacion del movimiento de balance;
lo cual da lugar a un problema de control multivariable (sistema con dos entradas
y dos salidas). Si bien en la mayora de sistemas instalados a bordo se tratan como
dos problemas de control independientes, en el sentido de que los reguladores se
dise~nan de forma independiente entre s, sin tener en cuenta el caracter vectorial de
la planta.
El problema del control de un buque puede interpretarse segun la losofa del
control robusto, dado la gran cantidad de factores que van a in uir en la incertidum-
bre del modelo de la planta. La dinamica de un buque va a depender de una serie
de factores, entre los que cabe destacar (Lopez et al, 1995):
Aplicacion de control robusto 279

Velocidad Condiciones
de crucero de carga

? ?

Dinamica
del buque

6 6
Perturbaciones Otros
ambientales factores
Figura 11.1: Factores que afectan a un buque

1. Velocidad de crucero.

2. Estado de carga.

3. Estado del mar, vientos y corrientes.

4. Profundidad.

5. Densidad del agua del mar.

Un sistema de control e caz ha de tener en cuenta los errores de modelado que


se pueden acumular debido al efecto de diferentes factores. Por lo que el analisis de
robustez del sistema es esencial, dadas las diversas circunstancias que van a in uir
sobre la dinamica de la planta y por tanto sobre el comportamiento del sistema de
control. En este captulo se describen los dise~nos de controladores LTR, H2 y H1
multivariables para el control del rumbo y balance de un buque, proponiendose un
conjunto de indicadores de robustez para su evaluacion.
280 Descripcion de la planta

11.2 Descripcion de la planta


La complejidad de la dinamica de un buque, as como el alto coste economico y de
tiempo para la realizacion de pruebas de mar experimentales, puso de mani esto
la necesidad del empleo de modelos que captaran el comportamiento de un barco
en diversas condiciones de navegacion. A partir de nales de los setenta el empleo
de modelos matematicos hizo que se avanzara en el dise~no y aplicacion de nuevos
sistemas de control en la industria naval, gracias a los avances conseguidos en los
computadores digitales empleados para realizar las simulaciones.
A partir de las leyes de la mecanica, para un solido rgido con seis grados de liber-
tad (3 rotaciones y 3 traslaciones), se pueden obtener las ecuaciones que gobiernan
el movimiento de un buque, referidas a un sistema de referencia jado en el propio
barco:
Para la traslacion (fuerzas):
X = m[u_ + qw rv xG (q2 + r2) + yG(pq r_) + zG (pr + q_)]
Y = m[v_ + ru pw yG(r2 + p2) + zG (qr p_) + xG (qp + r_)] (11.1)
Z = m[w_ + pv qu zG(p2 + q2) + xG (rp q_) + yG(rq + p_)]
y para el giro (pares o momentos de fuerza):
K = Ixp_ + (Iz Iy )qr + m[yG(w_ + pv qu) zG (u_ + ru pw)]
M = Iy q_ + (Ix Iz )rp + m[zG (u_ + qw rv) xG(w_ + pv qu)] (11.2)
N = Iz r_ + (Iy Ix)pq + m[xG (v_ + ru pw) yG(u_ + qw rv)]

El sistema de referencia esta situado en el buque y no tiene por que coincidir


con el centro de gravedad del mismo (a veces se emplea el centro de simetra). Las
magnitudes que aparecen en las ecuaciones anteriores son:

 m: masa del barco.


 Ix; Iy ; Iz : momentos de inercia respecto a cada eje coordenado.
 xG ; yG; zG: posicion del centro de masas.
 ; ; : angulos de giro respecto a los ejes coordenados (x; y; z).
 r = _ ; p = ;_ q = _: velocidades angulares respecto a los tres ejes.
Aplicacion de control robusto 281

 u; v; w: componentes del vector velocidad referidos a los ejes coordenados


(x; y; z). Tambien se emplean como: Vx = u; Vy = v; Vz = w.
 X; Y; Z : componentes en cada eje de las fuerzas actuantes sobre el barco.
 K; M; N : componentes en cada eje de los pares o momentos actuantes sobre
el buque.

En las guras (11.2),(11.3) y (11.4) se muestra el signi cado fsico de las variables
mas signi cativas del modelo.

Figura 11.2: Sistema con 6 grados de libertad


Si solo se consideran el desplazamiento en el plano horizontal y los giros respecto
a los ejes (x; z), el sistema se reduce a un problema de cuatro grados de libertad.
Las ecuaciones del movimiento quedan en ese caso:
2 (1 X 00 ) 0 0 0 3 2 u_ 3 2 X 3
tot
66 0 G (1 Yv_00 ) L(zG00 + Yp_00 ) L(x00G Yr_00 ) 777 666 v_ 777 = 666 Ytot 77
64 0 (zG00 + Kvv00_ ) 00 K 00 )
L(kxx L(zG00 x00G + Kr00_ ) 5 4 p_ 5 4 Ktot 75
p_
0 (x00G Nv00_ ) L(zG x00G + Np00_ )
00 L(kzz002 Nr00_ ) r_ Ntot
(11:3)
282 Descripcion de la planta

V
Vx

Vy

Figura 11.3: Variables: ; ; u = Vx; v = Vy ; V

Figura 11.4: Variables: ; 


Aplicacion de control robusto 283

Donde el subndice \tot" indica las fuerzas y pares totales actuando sobre el casco,
debidos a los efectos: hidrodinamicos, viento, olas y corriente; y el resto de variables
son las magnitudes fsicas del buque as como sus coe cientes hidrodinamicos.
Para buques de grandes dimensiones, la consideracion anterior es razonable, ya
que los movimientos mas signi cativos son los que afectan al gobierno del barco
(rumbo y movimiento en el plano), y al movimiento de balance (giro con respecto
a un eje axial al buque); despreciandose el desplazamiento vertical y el giro con
respecto a un eje transversal conocido como movimiento de cabeceo. En ese caso, el
modelo, desde el punto de vista del control, se caracteriza por una o dos entradas de
control (angulos de timon y aletas estabilizadoras) y dos salidas (angulos de rumbo
y balance); tratandose por tanto de un sistema multivariable. Si unicamente se esta
interesado en el control del rumbo (por ejemplo, para el caso de grandes petroleros,
en los que el movimiento de balance es menos apreciable), el modelo matematico se
reduce a un sistema escalar de una entrada y una salida (ver ejemplo del control del
rumbo dado en el captulo 4, apartado 4.4).
Entre las razones que justi can el empleo de sistemas de control del movimiento
de balance pueden destacarse:

1. Medida de seguridad en navegacion; ya que un corrimiento o desplazamiento


de la carga, causado por un angulo de escora excesivo, puede poner en serio
peligro la estabilidad del buque.
2. No tener que desviarse en exceso de una ruta dada debido a unas condiciones
ambientales adversas.
3. Mejora en las condiciones de trabajo de la tripulacion.
4. Aumento de la comodidad del pasaje, en su caso.
5. Conseguir una plataforma estable adecuada, para el disparo y aterrizaje a
bordo, en los buques de la Armada.

Para ello, se pueden emplear diferentes tecnicas: 1) sistemas de depositos o


tanques de agua; 2) utilizacion del timon como sistema de estabilizacion del balance
(rrs); y 3) la que ha resultado ser mas e caz, al menos para velocidades superiores
a 12 nudos, que utiliza super cies de control o aletas estabilizadoras.
Al considerar el problema de control de los angulos de rumbo ( ) y balance (),
empleando como variables de control los angulos de timon () y de las aletas ( ),
se plantea un problema de control de un sistema multivariable. En determinados
284 Descripcion de la planta

angulo de angulo de
estabilizadores ( ) balance ()
- -
BUQUE
- -
angulo de angulo de
timon () rumbo ( )

Figura 11.5: Componentes de entrada-salida del problema multivariable

buques, existe una fuerte interaccion entre las distintas variables de entrada y salida,
por lo que el empleo de dos controladores independientes puede no dar buenos
resultados. En ese caso, si se quiere conseguir un buen comportamiento, se hace
aconsejable el empleo de tecnicas de control de sistemas multivariables.
Desde el punto de vista del control de un buque se puede decir que hay dos condi-
ciones de navegacion bien diferenciadas (Lopez et al, 1995). La primera, se trata del
caso en que el problema es el realizar una determinada maniobra que conlleve esfuer-
zos grandes y prolongados de las variables de control (timon y aletas estabilizado-
ras), en cuyo caso los efectos no lineales dominan el comportamiento del sistema.
La otra, se da en situaciones de mantenimiento del rumbo, o cuando el proceso de
regulacion para un cambio de consigna requiere unas desviaciones de las super cies
de control (pala de timon y aletas estabilizadoras) que no sean excesivas en tiempo
y magnitud. Bajo dichas condiciones el sistema se puede aproximar por un mo-
delo lineal. Ello puede hacerse linealizando las ecuaciones del movimiento en torno
a una solucion estacionaria, para unas condiciones nominales de funcionamiento.
Otra posible forma es realizando una identi cacion de la planta por algunos de los
metodos dados en el captulo 3; o una identi cacion en el dominio de la frecuencia,
como se hizo para obtener el modelo matematico lineal mlmv19 que se describe a
continuacion.
Para ilustrar el dise~no de controladores multivariables, se emplean los modelos
lineales o linealizados multivariables (dos entradas y dos salidas) para unas condi-
ciones de operacion de dos buques. Se emplean por un lado el modelo matematico
que denominaremos mlmv19 (modelo lineal de orden elevado obtenido por identi -
cacion); y por otro modelo no lineal y variable en el tiempo que llamaremos modnl.
En el primer caso, (mlmv19) el modelo matematico corresponde a un buque
Aplicacion de control robusto 285

(s) s - G11 (s) - m(s-)


6
- G12 (s)
(s) s - G22(s) - m(s-)
6
- G21 (s)

Figura 11.6: Diagrama de bloque del sistema multivariable

tipo fragata para unas condiciones nominales de funcionamiento y una velocidad de


18 nudos1 . Fue obtenido por (Freeman et al, 1982) empleando tecnicas de respuesta
en frecuencia, a partir de las cuales se obtuvieron las cuatro funciones de transfe-
rencia (G11 ; G12; G21 ; G22) que caracterizan la matriz de transferencia del sistema
multivariable.
Las ecuaciones descriptivas de la planta vienen dadas por:
" # " #" #
(s) = G11 (s) G12(s) (s) (11:4)
(s) G21 (s) G22(s) (s)

G11(s) = (19:84s4 + 24:34s19 :92(1:54s2 + 0:976s + 0:0077)


3 + 7:69s2 + 5:34s + 0:234)(s2 + 3:645s + 13:28)

G12(s) = (15:66s4 + 21:32s13 :916(0:965s2 + 0:61s 0:176)


3 + 6:87s2 + 3:81s + 0:193)(s2 + 9:402s + 7:952)
0:1
G21(s) = (s2 + 3:645s + 13 :28)(21:5s2 + s)
G22(s) = (s2 + 9:402s +0:74266
:952)(18:1s2 + s)

La variable a controlar y1 corresponde al angulo de balance , la variable a


controlar y2 es el angulo de rumbo , la variable de control u1 corresponde al angulo
1 Navegacion: 1 Nudo = 1852 metros/hora.
286 Descripcion de la planta

de aletas estabilizadoras , y la variable de control u2 corresponde al angulo de


timon .
Dado que una realizacion mnima en el espacio de estados de este modelo es de
dimension elevada (diecinueve), se va a emplear un modelo de orden reducido de la
planta, a n de obtener un controlador de menor dimension y para hacer un analisis
posterior de la robustez del sistema de control frente a la dinamica inmodelada de
alta frecuencia (debida en este caso a la diferencia entre el modelo de orden completo
y el modelo de orden reducido). Si se calculan los valores singulares de Hankel del
modelo completo de la planta:
Hi para: i = 1; 2; : : : ; 19
se obtiene que:
H 7 < 0:1H 6
y dado que Hi+1  Hi , se elige un modelo reducido de sexto orden. En la gura 11.7
se muestran las ganancias principales del modelo completo y del modelo reducido,
como puede verse se consigue una buena aproximacion hasta una frecuencia de 3
radianes/segundo. Dado que esta frecuencia va a ser muy superior al ancho de banda
del sistema en lazo cerrado, puede considerarse una aproximacion aceptable en el
rango de frecuencias de interes.
Las matrices de estado obtenidas para el modelo reducido de la planta son:
0 0:049 0:015 0:255 0:442 0:986 0:094 1
B
B 0:012 0:279 0:211 0:632 0:112 0:357 C CC
B
B 0 : 010 0 : 151 0: 228 0:443 0 : 182 0 : 555 CC
A = B B 0:092 0:482 0:213 0:118 0:896 0:017 C
B
B C
@ 0:053 0:179 0:080 0:067 0:569 0:117 CA
0:001 0:203 0:307 0:010 0:034 0:178
!
T
B = 0 : 001 0 : 001 0 : 013 0: 004 0: 039 0 : 017
0:025 0:035 0:031 0:102 0:106 0:033
!
C = 0:011 0:796 0:478 1:149 0:113 0:480
0:023 0:001 0:001 0:001 0:000 0:000

Para la sntesis del regulador se emplea el modelo reducido, sin embargo la eva-
luacion de la respuesta temporal se realiza con el modelo de orden completo. En la
gura 11.8 se muestra el numero de condicion, (G), de la planta, a partir del cual
puede comprobarse que la planta tiene una fuerte direccionalidad en la ganancia,
puesto que (G)  1 para todas las frecuencias (ver captulo 8).
Aplicacion de control robusto 287

100

50

G
sv (db)

-50

-100 Gp

-150 Gp
G

-200
10 -4 10 -3 10 -2 10 -1 10 0 10 1 10 2

w (rad/s)

Figura 11.7: Respuestas en frecuencia de modelos completo (Gp) y reducido (G)

100

90

80

70

60
k(G)

50

40

30

20

10

0
10 -3 10 -2 10 -1 10 0

w (rad/s)

Figura 11.8: Numero de condicion de la planta


288 Descripcion de la planta

En el segundo caso (modnl), el modelo matematico corresponde al desarrollado


por (Kallstrom et al, 1982), y corresponde a un buque mercante del tipo ro/ro-
pasajeros. Este modelo es multivariable, no lineal y variable en el tiempo, sirviendo
para caracterizar el comportamiento del buque tanto en operacion de mantenimiento
de rumbo, como en grandes maniobras. La validacion experimental de este modelo
fue realizada de forma exhaustiva por sus autores, ajustando sus parametros hasta
conseguir una excelente correspondencia entre los resultados experimentales y las
simulaciones.
Por ello, se puede considerar el modnl como un buen banco de pruebas para
evaluar los dise~nos de sistemas de control desarrollados tanto escalares como multiva-
riables (Lopez y Rubio, 1995a; Messer y Grimble, 1992; Kallstrom et al, 1982). Las
expresiones correspondientes a cada uno de los terminos que aparecen en la ecuacion
11.3, correspondientes a los pares y fuerzas debidos a los factores hidrodinamicos y
las perturbaciones ambientales, pueden encontrarse en (Kallstrom et al, 1982; Lopez,
1994).
Los angulos de timon  y aletas que se generan como magnitudes de mando
a traves de un controlador, ya sea automatico o manual, han de ser ejecutados por
las respectivas maquinas del timon y de las aletas estabilizadoras. Las dinamicas de
estos dispositivos se modelan como sistemas de primer orden, dados por:
_ = (c )=R ; j _ j _max ; j  j max
_ = ( c )=F ; j _ j _ max ; j j max
siendo c y c los angulos de mando de consigna que se remiten como orden a la
sala de maquinas (con las constantes de tiempo R y F ).
Para mostrar la naturaleza no lineal del modnl, se presentan a continuacion
algunas pruebas de simulacion. En las guras 11.9 y 11.10 puede verse la perdida
sustancial de velocidad que experimenta el sistema si se somete a una prolongada
activacion de la variable de control  (angulo de timon). En dichas guras se mues-
tran la derivada del rumbo (o velocidad angular) r, y la velocidad V , para angulos
de timon de 20 y 10 grados respectivamente. Se representan as mismo el angulo de
balance , y su derivada p. La velocidad nominal o de crucero inicial es en ambos
casos de 15 nudos. Se observa, que a mayor angulo de timon mayor es la perdida de
velocidad. Y dado que la dinamica del buque depende fuertemente y de forma no
lineal de dicha velocidad, as como tambien de otras magnitudes,
_ ; ; ;_ ;
se tendra que durante dicha operacion el sistema tendra un comportamiento no
lineal y variable en el tiempo.
Aplicacion de control robusto 289

0 8

-0.2
r (grad/seg)

V (m/s)
-0.4

-0.6
6
-0.8

-1 5
0 500 0 500
t (seg) t (seg)

8 0.6

6 0.4
p (grad/s)
fi (grad)

4 0.2

2 0

0 -0.2

-2 -0.4
0 500 0 500
t (seg) t (seg)

Figura 11.9: r(t); V (t); (t); p(t) para  = 20; V = 15 nudos

0 8

7
r (grad/seg)

-0.5
V (m/s)

5
-1
4

-1.5 3
0 500 0 500
t (seg) t (seg)

15 1

10
0.5
p (grad/s)
fi (grad)

5
0
0

-5 -0.5
0 500 0 500
t (seg) t (seg)

Figura 11.10: r(t); V (t); (t); p(t) para  = 10; V = 7:72 m=s
290 Descripcion de la planta

polos  (seg)
0
-0.02825  0.30494j 3.27
-0.0081 123.17
-0.1403 7.12

Tabla 11.1: Polos y constantes de tiempo de modnl linealizado para V = 7:72m=s

Para realizar el dise~no de los reguladores es necesario que se disponga de un


modelo lineal de la planta. Para ello, el modnl se linealiza en torno a la solucion
estacionaria
u = V; v = r =  = p =  = = 0
donde V es la velocidad de crucero.
A continuacion se dan las matrices de una representacion de estado del modelo
(modnl) linealizado para una velocidad V = 15 nudos, as como la tabla 11.1
con los polos y constantes de tiempo ( ) asociados (no se considera la dinamica
de los actuadores). Como puede verse el sistema tiene un par de polos complejos
conjugados muy poco amortiguados.

0 1
0:02720 0:15048 0:00443 0:26255 0
B
B CC
B 0:00250 0:04043 0:39268 0:09381 0 CC
A=B
B 0:00128 0:00129 0:13732 0:00204 0 CC
B
@ 0 1 0 0 0 A
0 0 1 0 0

0 1 0 1
B 0:06466 0:1747 CC BB 000 CC
B
B 0:01426 0:01319 CC B 0 CC
B
B = B 0:0007 0:00554 CC ; CT = BBB 00 CC
B
@ 0 0 A @1 0 A
0 0 0 1
Aplicacion de control robusto 291

11.3 Evaluacion de los controladores


Cuando se realiza el dise~no de un regulador utilizando para ello algun criterio de opti-
mizacion, o siguiendo una determinada tecnica, conviene evaluar las caractersticas
de dicho regulador frente a diferentes indicadores de comportamiento y robustez,
que proporcionen una vision mas global de las prestaciones del regulador. A con-
tinuacion se proponen un conjunto de indicadores para evaluar los dise~nos que se
realicen.

 Analisis de la respuesta temporal y se~nales de control.


 Caracterizacion del rechazo de las perturbaciones actuantes a la salida (do) y
a la entrada (di) de la planta, por medio de:
Ido = o (j!)]; Idi = oG(j!)]
 Indicador de Comportamiento Nominal (una medida del grado de recuperacion
a una frecuencia ! = !o dada):
( )
INP = min [[LL((j!o )]  [L(j!o )]
;
t j!o )]  [Lt (j!o )]

 Margenes de Estabilidad (extension al caso multivariable de los margenes de


fase y ganancia clasicos, se emplean para ello los valores propios, i de la
matriz de transferencia en lazo abierto):
MG = min
i
fMG(i )g ; MF = min
i
fMF (i )g
En el caso de un sistema multivariable, los margenes de fase y ganancia as
obtenidos no proporcionan la utilidad que tienen en el caso de los sistemas
escalares para caracterizar la robustez del sistema. Pero s pueden utilizarse
como indicadores de robustez cualitativos (Lunze, 1989; Doyle y Stein, 1981),
en el sentido de que si se obtienen valores poco satisfactorios de MG y MF,
ello sera indicativo de la falta de robustez.
 Indicadores de Estabilidad Robusta (estimacion del tanto por ciento de incer-
tidumbre tolerable para la que el sistema mantiene su estabilidad): 2
2 El subndice\i" indica que se trata de un indicador con respecto a incertidumbre de tipo
multiplicativo que se considera re ejada a la entrada de la planta, mientras que con el subndice\o"
se indica que se considera a la salida.
292 Dise~no de controladores LTR multivariables

{ Incertidumbre multiplicativa no estructurada: 3


I11i : M = Ti ; I11o : M = To
! f1= [M (j! )]g 100%
min
{ Incertidumbre multiplicativa con estructura diagonal:
I12i : M = Ti ; I12o : M = To
! f1=[M (j! )]g 100%
min
{ Incertidumbres multiplicativas simultaneas con estructuras diagonales:
I1s : min
! f1=[M (j! )]g 100%
" #
M= SG T T i S i K
o o
 Indicadores de Comportamiento Robusto (estima el tanto por ciento de in-
certidumbre de tipo multiplicativo con estructura diagonal tolerable para la
que el sistema cumple una especi cacion de comportamiento dada de la forma
(So WS )  1):
" #
T
I3i : M = SoG SoWS
i KS o W S

" #
T
I3o : M = So To WSo T o W S

! f1=[M (j! )]g 100%


min

11.4 Dise~no de controladores LTR multivaria-


bles
En este apartado se realiza el dise~no de controladores LTR (LTR-o y LTR-i) con
la estructura convencional, as como para la estructura no basada en observador,
ambas descritas en el captulo 9.
3 ; representan los valores singulares extremos, y  el valor singular estructurado. M repre-
senta el sistema de interconexion correspondiente a cada caso.
Aplicacion de control robusto 293

11.4.1 Dise~no LTR-o


Para el dise~no del regulador se sigue el procedimiento descrito en el captulo 9.
El parametro\q" (ganancia de recuperacion) se incrementa solo lo necesario para
realizar una recuperacion aceptable en el rango de frecuencias de interes del sistema
(zonas de baja y media frecuencia). As se evita incrementar la sensibilidad del
sistema a la dinamica no modelada de alta frecuencia (rs), y se aproximan las
especi caciones de dise~no (np). Se desea que el sistema consiga un buen rechazo
de las perturbaciones y unos errores de seguimiento lo su cientemente peque~nos
(aproximacion de la accion integral). Para ello, se toman los siguientes parametros
de dise~no:
" # " #
10 0 T
Ro = 0 1 ; Qo = a W a ; W = 0:1342 0:0184 0 : 9817 0 : 1342

Rc = I2; Qc = CaT Ca ; Ca = [C O2]; BaT = [B O2]


" # " #
Aa = O A B ; O n  2 ; q = q1 = 103
I a= I
2n 22 22
donde Aa ; Ba y Ca son las matrices de la planta ampliada.
En la gura 11.11 se muestran las ganancias principales de L(s) para el con-
trolador lqg/ltr-o (cbo); como puede verse, el controlador no consigue una re-
cuperacion adecuada. Si se incrementa q hasta 1000q1, se obtiene el nivel de recu-
peracion deseado a baja frecuencia, pero a costa de un incremento en el ancho de
banda del regulador. Esto produce como consecuencia que las ordenes generadas
por el controlador sean de magnitudes mayores, con lo que se puede provocar la sat-
uracion de los actuadores de una forma mas frecuente, una mayor sensibilidad a las
incertidumbres y a las perturbaciones ambientales, as como la posible generacion
de ordenes de control irrealizables fsicamente por el sistema.
Si se emplea un controlador ltr-o (cnbo) con los mismos parametros de dise~no
dados arriba, se observa la mejora en el grado de recuperacion conseguida a baja
frecuencia con respecto al cbo ( gura 11.12); puede comprobarse que es el mismo
que el obtenido con la estructura estandar (cbo) para q = 1000q1. El efecto de
incrementar el valor de q puede verse al comparar las guras 11.13 y 11.14, donde
se muestran las respuestas temporales y demandas de control para ambos contro-
ladores: cbo, q = 1000q1 y cnbo, q = q1.
En la gura 11.15 se puede observar como el regulador dise~nado cumple las
especi caciones deseadas para el rechazo de las perturbaciones actuantes tanto a la
salida (i (So)), como a la entrada (i (SoG)) de la planta. En la misma gura se
294 Dise~no de controladores LTR multivariables

150

KBF

100 LTR

KBF
50
sv(L) (db)

LTR
0
KBF

-50

q=1000 (cbo)
-100 LTR

-150
10 -5 10 -4 10 -3 10 -2 10 -1 10 0 10 1 10 2

w (rad/s)

Figura 11.11: Valores singulares de Ho(s) y L(s), para q = q1 = 103, cbo

150

100

50
sv(L) (db)

0
KBF

-50
q=1000 (cnbo)

-100 LTR

-150
10 -5 10 -4 10 -3 10 -2 10 -1 10 0 10 1 10 2

w (rad/s)

Figura 11.12: Valores singulares de Ho(s) y L(s), para q = q1 = 103, cnbo


Aplicacion de control robusto 295

8
y2
6

4
y (gra)

2 y1

-2
0 50 100 150 200 250 300
t (seg)

60
q=1e6, (cbo)
40 u1
20
u (gra)

0
u2
-20

-40
0 10 20 30 40 50 60 70 80 90 100
t (seg)

Figura 11.13: Respuesta temporal para cbo, q = 103q1

8
y2
6

4
y (gra)

2
y1
0

-2
0 50 100 150 200 250 300
t (seg)

60

40 q=1e3, (cnbo)
u1
20
u (gra)

0
u2
-20

-40
0 10 20 30 40 50 60 70 80 90 100
t (seg)

Figura 11.14: Respuesta temporal para cnbo, q = q1


296 Dise~no de controladores LTR multivariables

20 20

0 0

sv(SoG) (db)
sv(So) (db)

-20 -20

-40 -40

-60 -60

-80 -80
10 -5 10 -2 10 1 10 -5 10 -2 10 1
rad/s rad/s

60 60
1/[sv(M),ssv(M)] (db)

1/[sv(M),ssv(M)] (db)
40 40

20 20 iMoes
iMies
0 0 iMo
iMi
-20 -20
10 -5 10 -2 10 1 10 -5 10 -2 10 1
rad/s rad/s

Figura 11.15: Caracterstica rechazo perturbaciones y niveles de incertidumbre tol-


erables
representan tambien unas estimaciones de las tolerancias del sistema de control a
incertidumbres de tipo multiplicativo, que se den a la entrada (iMi) o a la salida de
la planta (iMo) respectivamente. Para incertidumbre no estructurada se representa:
1= (j!)]
y para el caso de incertidumbres con estructura diagonal (a la entrada de la planta
puede corresponder a la dinamica no modelada de los actuadores: iMies, y si se
considera a la salida de la planta se podra representar la dinamica de los sensores
(iMoes), se representa:
1=[M (j!)]
donde M (j!) es el sistema de interconexion. Con 1=[M (j!)] se obtienen unas
estimaciones de las tolerancias a las incertidumbres mayores que con 1= (j!)],
o lo que es lo mismo: se obtiene una estimacion de la robustez de la estabilidad
superior. Esto es logico, al suponer la primera una condicion menos conservativa
que la ultima. Puede comprobarse tambien, que el sistema es mas robusto frente a
incertidumbres situadas a la salida de la planta que frente a incertidumbres situadas
a la entrada; ello es consecuencia de que el dise~no realizado es ltr-o.
En la tabla 11.2 se resumen los valores de los indicadores de robustez consegui-
Aplicacion de control robusto 297

Controlador I11i I12i I11o I12o I1s MG MF I3o I3i


% % % % % db gra % %
cbo: q = 1000q1 23.0 27.5 76.1 76.1 22.0 26.9 59.8 38.3 24.5
cnbo: q = q1 25.3 62.1 74.9 74.9 34.3 18.9 51.8 53.5 40.9

Tabla 11.2: Indicadores de robustez de los controladores LTR-o (mlmv19)


dos por ambos controladores ltr-o para el mismo grado de recuperacion (inp) 4.
Finalmente, se puede realizar una implementacion del regulador en tiempo discreto,
empleando un perodo de muestreo de hasta 1 segundo, con el cual el regulador de
tiempo discreto proporciona un comportamiento en lazo cerrado equivalente al de
tiempo continuo.

11.4.2 Dise~no LTR-i


En este apartado se presentan los resultados de simulacion obtenidos con el modelo
no lineal multivariable; a n de evaluar los controladores que se dise~nan a partir de
modelos linealizados para distintas condiciones de trabajo. En la seccion anterior se
ha realizado un dise~no ltr-o, en esta se hace uno ltr-i, para as ilustrar aplicaciones
de ambas metodologas. Una discusion mas amplia sobre el dise~no y analisis de
reguladores ltr-i para distintas condiciones de funcionamiento puede encontrarse
en (Lopez, 1994; Lopez y Rubio, 1995a).
Con el modelo linealizado de la planta (modnl) para una velocidad de V =
15 nudos y los parametros de dise~no:
" # " #
0 : 1 0 T
Rc = 0 1 Qc = C QC Q = 0 1 10 0

Ro = I2 Qo = BB T q = 106
se obtiene un regulador lqg/ltr-i. En la gura 11.16 se tiene la respuesta obtenida
con el modelo lineal, que puede compararse con la obtenida para el modelo no lineal
dada en la gura 11.17.
El controlador se ha calculado para una condicion de trabajo dada, por lo que
interesa ver el comportamiento del sistema en otras condiciones diferentes. Esto se
4Los valores de la tabla 11.2 estan expresados: MF en grados, MG en decibelios y el resto de
indicadores en tanto por ciento de incertidumbre tolerable.
298 Dise~no de controladores LTR multivariables

8
y2
6

4
y (gra)

2 y1
0

-2
0 20 40 60 80 100 120 140 160 180 200
t (seg)

10

5 u2
u (gra)

-5 u1

-10
0 20 40 60 80 100 120 140 160 180 200
t (seg)

Figura 11.16: Respuesta con modelo linealizado de modnl

6 y2

4
y (gra)

2 y1
0

-2
0 20 40 60 80 100 120 140 160 180 200
t (seg)

10

5 u2
u (gra)

0
u1
-5

-10
0 20 40 60 80 100 120 140 160 180 200
t (seg)

Figura 11.17: Respuesta con modelo no lineal (modnl)


Aplicacion de control robusto 299

hace analizando las respuestas temporales del sistema a cambio de consigna tipo
escalon de 5 grados, para velocidades de crucero de V1 = 10 nudos y V2 = 21 nudos
respectivamente, que se muestran en la gura 11.18. Como puede verse, ambas
respuestas son satisfactorias.

6 0.4

0.2
heading (deg)

4 V2

roll (deg)
V1 0 V2

2 V1
-0.2

0 -0.4
0 50 100 150 200 0 50 100 150 200
t (sec) t (sec)

2 2

0
V2
rudder (deg)

0 V2
fin (deg)

-2
V1 V1
-2
-4

-6 -4
0 50 100 150 200 0 50 100 150 200
t (sec) t (sec)

Figura 11.18: Respuestas temporales para diferentes condiciones de navegacion

Se ha visto que, para excursiones moderadas del vector de control, el sistema no


lineal (modnl) responde adecuadamente con el regulador lineal dise~nado. Sin em-
bargo, el modelo es fuertemente no lineal, por ello se trata de evaluar al controlador
en una situacion en la que los efectos no lineales dominen el comportamiento del
sistema. Esta circunstancia se da en el caso de grandes cambios de consigna, en los
que el vector de control puede llegar a saturarse o tomar valores elevados, durante
perodos de tiempo relativamente largos; con las consiguientes perdidas de velocidad
y cambios en la planta que ello produce.
En la gura 11.19 se muestra la respuesta del sistema para un cambio de consigna
de 180 grados; como puede verse, el comportamiento es excelente: no produce una
sobreoscilacion apreciable y la interaccion con la otra variable a controlar es muy
baja, si se compara con los resultados obtenidos para la misma maniobra empleando
un controlador monovariable (ver gura 11.20). La importancia de este controlador
estriba en que al reducir el angulo de inclinacion o balance (tambien denominado de
300 Dise~no de controladores LTR multivariables

escora) durante la maniobra, se mejora la robustez del sistema frente a un angulo de


escora excesivo, que circunstancialmente puede a su vez provocar un desplazamiento
de la carga y por tanto un fuerte cambio en las caractersticas que determinan la
estabilidad del buque, aumentando el peligro de vuelco.

200 40

150 20
y2 (gra)

u2 (gra)
100 0
50
-20
0
-40
0 500 1000 0 500 1000
t (seg) t (seg)

40
10
20
y1 (gra)

u1 (gra)

0 0

-20
-10
-40
0 500 1000 0 500 1000
t (seg) t (seg)

Figura 11.19: Respuesta modnl controlador multivariable, ltr-i

El regulador anterior se ha desarrollado para conseguir un funcionamiento ade-


cuado para cambios en la referencia. Como ya se ha dicho, otra importante condicion
de funcionamiento se re ere a la situacion de mantenimiento del rumbo y reduccion
del movimiento de balance. La exigencia anterior no esta garantizada en presencia
de perturbaciones para el controlador LTR-i anterior (ver gura 11.21). En dicha
gura se muestran las tolerancias a incertidumbres y la caracterstica en frecuencia
para el rechazo de las perturbaciones que se den tanto a la entrada como a la salida
de la planta.
El comportamiento esperado del sistema frente a perturbaciones, se puede de-
terminar a partir de las respuestas en frecuencia de So(s)G(s) y So(s), dadas en
la gura 11.21; de la que se deduce que las perturbaciones no van a ser atenuadas
independientemente de la direccion en que estas se den. Para ello se propone modi-
car las matrices de ponderacion y ampliar el modelo de la planta para el dise~no del
controlador ltr-i; incorporando una caracterstica de alta ganancia en lazo abierto
Aplicacion de control robusto 301

200 40

150 20
y2 (gra)

u2 (gra)
100 0
50
-20
0
-40
0 500 1000 0 500 1000
t (seg) t (seg)

40
10
20
y1 (gra)

u1 (gra)
0 0

-20
-10
-40
0 500 1000 0 500 1000
t (seg) t (seg)

Figura 11.20: Respuesta modnl controlador monovariable


a baja frecuencia (aproximacion de la accion integral).
Para ello se emplea un modelo linealizado de la planta para una velocidad de
crucero de 21 nudos. Los parametros de dise~no tomados para el regulador ltr-i 5
son los siguientes:
! ! !
Aa = A On2 ; Ba = O B T
; Ca = O C
C O22 22 22
" #
1 0
Rc = 5 0 1 Qc = MaT QMa
" # " #
100 0
Q = 0 1 Ma = C 0 0:1 0 : 1 0 = Ba
Ro = I2 Qo = T ; q = 106
donde las matrices Aa ; Ba y Ca corresponden al modelo de la planta ampliada uti-
lizado para el calculo del regulador.
5Se emplea la version no basada en observador, dado que a baja frecuencia se produce una
recuperacion del lazo abierto sensiblemente superior que con un regulador lqg/ltr-i estandar.
302 Dise~no de controladores LTR multivariables

80 80
1/sv_max(M) (db)

1/sv_max(M) (db)
60 60
iMi iMo
40 40

20 20

0 0

-20 -20
10 -4 10 -1 10 2 10 -4 10 -1 10 2
w (rad/s) w (rad/s)

20 20

0 sv(SoG) (db) 0
sv(So) (db)

-20 -20

-40 -40

-60 -60

-80 -80
10 -4 10 -1 10 2 10 -4 10 -1 10 2
w (rad/s) w (rad/s)

Figura 11.21: Caractersticas de la tolerancia a incertidumbres y rechazo de las


perturbaciones

En la gura 11.22 se muestran los valores singulares extremos de So(j!) y


So (j!)G(j!). Como puede verse, o (j!)G(j!)] < 1 ( 4:96db) para toda !;
as mismo, o (j!)G(j!)] y o(j!)] son ambos lo su cientemente peque~nos en
la zona de baja frecuencia, como es deseable. Con este controlador se obtienen
los siguientes indicadores de robustez: I11i = 62%; I12i = 70%; I11o = 61%; I12o =
63%; I1s = 38%.
La gura 11.23 muestra las respuestas temporales del sistema para el controla-
dor LTR-i (NOBC) multivariable, y para un controlador que no tiene en cuenta el
caracter vectorial de la planta. En las simulaciones se emplea una altura signi cativa
de olas de 4m y un angulo de incidencia de 45 relativo al curso de referencia del
buque. Puede verse que hay una mejora notable en la reduccion del movimiento del
balance si se emplea el controlador LTR-i multivariable.
La gura 11.24 muestra el rumbo (heading) y el balance (roll) para condiciones de
velocidad no nominales (18 nudos y 16:5 nudos); se observa que el comportamiento
es adecuado, lo cual representa otra prueba de la robustez del controlador dise~nado.
Debido a las dinamicas asociadas a la planta y a los reguladores, estos se pueden
implementar directamente en un computador digital con un perodo de muestreo de
Aplicacion de control robusto 303

80 80
1/sv_max(M) (db)

1/sv_max(M) (db)
60 60
iMi iMo
40 40

20 20

0 0

-20 -20
10 -4 10 -1 10 2 10 -4 10 -1 10 2
w (rad/s) w (rad/s)

20 20

0 0

sv(SoG) (db)
sv(So) (db)

-20 -20

-40 -40

-60 -60

-80 -80
10 -4 10 -1 10 2 10 -4 10 -1 10 2
w (rad/s) w (rad/s)

Figura 11.22: Caractersticas de la tolerancia a incertidumbres y rechazo de las


perturbaciones
10 10
SISO controller SISO controller
5 5
heading (deg)
roll (deg)

0 0

-5 -5

-10 -10
0 500 0 500
t (sec) t (sec)

10 10
MIMO controller MIMO controller
5 5
heading (deg)
roll (deg)

0 0

-5 -5

-10 -10
0 500 0 500
t (sec) t (sec)

Figura 11.23: Operacion con rumbo constante bajo accion de las olas
304 Dise~no de controladores H2 y H1 multivariables

10 10

5 5

heading (deg)
roll (deg)

0 0

-5 -5

-10 -10
0 500 0 500
t (sec), V=9.5m/s t (sec), V=9.5m/s

10 10

5 5
heading (deg)
roll (deg)

0 0

-5 -5

-10 -10
0 500 0 500
t (sec), V=8m/s t (sec), V=8m/s

Figura 11.24: Comportamiento para condiciones de trabajo no nominales

0:1 segundos, sin tener en cuenta de una manera explcita el caracter muestreado del
sistema de control. Todas las implementaciones de los algoritmos LTR-i empleados
en las simulaciones con el modelo no lineal (modnl) se realizan de esta forma (Lopez
y Rubio, 1995a). Otra posibilidad sera utilizar un regulador de tiempo discreto
equivalente, empleando por ejemplo un perodo de muestreo de 0.5 segundos.

11.5 Dise~no de controladores H 2 y H 1 multiva-


riables
Para obtener un conjunto (WH ) de matrices de ponderacion implicadas en los pro-
blemas de dise~no H2 y H1 (ver captulo 10):
WH = fWS (s); WU (s); WT (s); Wr (s); Wn(s); Wdo (s); Wdi (s)g (11:5)
que den una solucion fsicamente realizable y satisfactoria, se pueden emplear dos
procedimientos:
Aplicacion de control robusto 305

1. Empezar sin informacion previa sobre la di cultad del problema de dise~no a


tratar, e interpretar las especi caciones de dise~no en el dominio frecuencial
como elementos de WH . Ensayar distintas combinaciones, hasta conseguir
unos resultados adecuados.
2. Comenzar a partir de unos resultados previos, obtenidos con alguna tecnica
de dise~no, que pongan de mani esto la di cultad del problema de control, den
una interpretacion en frecuencia de los resultados y sirvan para sugerir posibles
mejoras, a partir de una adecuada seleccion de los elementos de WH .

En este captulo se emplea el segundo procedimiento, de forma que se aprovechan


los resultados de una primera fase de dise~no de un controlador ltr, a partir de
los cuales se sugieren los elementos de WH , comparando nalmente los resultados
obtenidos por los reguladores ltr, H2 y H1.
La metodologa de dise~no propuesta tiene dos etapas o fases. La primera fase es
opcional y consiste en el dise~no de un controlador H2. En la segunda fase se obtiene
un regulador H1 basado en los resultados de la primera etapa. Si as se considera,
solo se realiza la segunda etapa (Lopez y Rubio, 1995c; Lopez 1994). El algoritmo
propuesto sigue los siguientes pasos:

1. Seleccionar los elementos de WH .


2. Resolver el problema del regulador optimo H2 (captulo 10).
3. Ver si las respuestas temporal y frecuencial son adecuadas (analizar los indi-
cadores de comportamiento y robustez); si no es as, se vuelve al paso 1.
4. Calcular el valor 2:
kTzw k1 = 2
5. Hacer: = 2
6. Resolver el problema del regulador H1 para el valor de (ver captulo 10).
7. Si no se encuentra solucion para el valor de empleado, se toma uno mayor
y se vuelve al paso 6. Para encontrar el valor de para el que se consigue el
regulador optimo H1, se puede emplear, por ejemplo, el metodo de la biseccion
como procedimiento iterativo de busqueda del optimo.
8. Calcular el valor 1:
kTzw k1 = 1
306 Dise~no de controladores H2 y H1 multivariables

9. Ver si las respuestas temporal y frecuencial son adecuadas; si no es as, se


aumenta el valor de y se vuelve al paso 6.
10. Disminuir el valor de y volver al paso 6.

El proceso iterativo anterior, se interrumpe cuando se llega al valor optimo


= opt, o a un valor de > opt, para el que al disminuir su valor el regulador H1
obtenido no da una respuesta temporal adecuada (por ejemplo: un excesivo aumento
de la magnitud de control comparado con el regulador H2 previo); o si ocurre que aun
a pesar de disminuir el valor de kTzw k1, el controlador obtenido tiene globalmente
unos indicadores de robustez menos satisfactorios. Puede igualmente darse el caso,
de que al calcular el regulador H1 optimo directamente empleando algunas de las
funciones que tienen incorporadas los paquetes de programas de Dise~no de Sistemas
de Control por Computador (cacsd), tales como Program CC, y Robust Control
Toolbox, sea necesario el empleo de un regulador suboptimo que de mejores carac-
tersticas de robustez globales. De ah la importancia del conjunto de indicadores
de robustez propuesto (Lopez, 1994).

11.5.1 Controladores H1 para sistema de orden elevado


Se plantea el problema de obtener el dise~no de controladores H2 y H1, a n de
realizar un analisis comparativo entre ellos y con los resultados anteriores obtenidos
con los reguladores LTR-o. Para realizar los dise~nos se emplea el modelo de orden
reducido (sexto orden) obtenido para el modelo mlmv19 descrito anteriormente, el
cual es de orden diecinueve. Una vez obtenidos los reguladores se evaluan con el
modelo de orden completo del buque.
En primer lugar se plantea el problema de optimizacion de sensibilidad mixta
descrito en el captulo 10. Para seleccionar las funciones de ponderacion: WS (s) y
WT (s), se utilizan como ayuda los per les (respuestas en frecuencia) de la ftlad
empleados para el dise~no ltr. O en otro caso, se parte simplemente de las especi -
caciones de dise~no sin disponer de dise~nos anteriores. Tras algunos ensayos, se toma
para la especi cacion del comportamiento nominal (np):
2 3
3:1623s + 9:0 10 6
6 0 77
WS 1(s) = 664 s + 0:09
3:1623s + 4:510 6 75
0
s + 0:045
Aplicacion de control robusto 307

y como funcion de ponderacion de la funcion de sensibilidad complementaria To(s):


2 3:1623s + 1500 3
6 0 7
WT 1(s) = 64 3162:3s + 474:34 3:1623s + 750 75
0
3162:3s + 237:17
en la gura 11.25 se muestran ambas funciones (matrices) de ponderacion, las cuales
re ejan las especi caciones de dise~no en el dominio de la frecuencia.

80

70

60 W_S

50
sv(W_S),sv(W_T) (db)

40
W_T
30

20

10

-10

-20
10 -6 10 -5 10 -4 10 -3 10 -2 10 -1 10 0 10 1 10 2 10 3 10 4

rad/s

Figura 11.25: Respuestas en frecuencia de WS y WT

Se calcula el regulador optimo H2 (sensibilidad mixta) de la forma descrita en el


captulo 10. Este regulador consigue:
kTzw (j!)k1  2 = 0:566
El valor = 2 se utiliza como valor de partida para resolver el problema de opti-
mizacion H1. Empleando un proceso iterativo para el calculo del regulador H1, se
obtiene:
kTzw (j!)k1 = o = 0:480
Dado que o < 2, se consigue una mejora con respecto al regulador H2 anterior, en
el sentido de que se veri ca la desigualdad
kTzw k1  1
308 Dise~no de controladores H2 y H1 multivariables

con mas holgura. Las respuestas temporales de ambos reguladores, para un cambio
tipo escalon de [0; 5]T grados en la referencia, son muy similares; en la gura 11.26
se muestran para el regulador H1.

4 y2
y (gra)

0
y1
-2
0 20 40 60 80 100 120 140 160 180 200
t (seg)

60

40 u1
20
u (gra)

0
u2
-20

-40
0 10 20 30 40 50 60 70 80 90 100
t (seg)

Figura 11.26: Respuesta temporal controlador H1 (sensibilidad mixta)

Como se describe en el captulo 8, la responsabilidad de la atenuacion de las


perturbaciones que actuen sobre la planta, y de conseguir un seguimiento adecuado
a cambios de referencia, recae sobre las matrices de transferencia So(s) y So(s)G(s).
En la gura 11.27 se tienen los valores singulares de ambas para el controlador H1
(sensibilidad mixta). El comportamiento de So es totalmente satisfactorio,
o(j!)]  1; a baja frecuencia
como era de esperar del planteamiento hecho con el problema de sensibilidad mixta.
Sin embargo, no ocurre lo mismo con SoG; dado que segun se deduce de la gura
11.27, se pueden dar perturbaciones vectoriales, actuantes a la entrada de la planta,
que no sean atenuadas por el sistema.
Para conseguir una caracterstica similar a la del controlador ltr-o dise~nado
en la seccion anterior, se modi ca la funcion de coste de modo que Tzw incluya un
termino que pondere tambien al factor SoG, puesto que de lo visto en el captulo 8
Aplicacion de control robusto 309

20

0
sv(So) (db)

-20

-40

-60
10 -5 10 -4 10 -3 10 -2 10 -1 10 0 10 1 10 2
w (rad/s)

50

0
sv(SoG) (db)

-50

-100

-150
10 -5 10 -4 10 -3 10 -2 10 -1 10 0 10 1 10 2
w (rad/s)

Figura 11.27: So y So G para controlador H1 (sensibilidad mixta)

se obtiene que el vector de error entre la referencia y la respuesta del sistema viene
dado por,
e = r y
= So (r do n) SoGdi

En el planteamiento general del problema de optimizacion realizado en el captulo


10, se considera el caso particular:
" # " #" #
z1(s) = WS (s)So(s) WS (s)So(s)G(s)Wdi (s) r(s)
z3(s) WT (s)To (s) WT (s)So(s)G(s)Wdi (s) di(s)

donde Wdi (s) se elige de forma que se especi que, con los elementos (1,2) y (2,2) de
Tzw , el objetivo de conseguir como resultado un controlador que a baja frecuencia
satisfaga:
o (j!)G(j!)]  1 (11:6)

Este objetivo puede alcanzarse (ver gura 11.30) tomando las siguientes matrices
310 Dise~no de controladores H2 y H1 multivariables

de ponderacion:
Wdi (s) = s +1 1 I
2 3
66 3:1623ss++72:210
2
:2768 10 5 0 77
WS (s) = 64 s + 3:6 10 2 75
0
2 3162:3s + 379:47 3:1623s + 1:1384
3 10
5

6 0 7
WT (s) = 64 3:1623s + 1200 3162:3s + 189:74 75
0
3:1623s + 600
En las guras 11.28 y 11.29 se muestran respectivamente las funciones de pon-
deracion WS , WT , as como WS Wdi y WT Wdi , para el caso del problema de rechazo
a las perturbaciones.

80

70

60 W_S

50
sv(W_S),sv(W_T) (db)

40

30
W_T
20

10

-10

-20
10 -6 10 -5 10 -4 10 -3 10 -2 10 -1 10 0 10 1 10 2 10 3 10 4

rad/s

Figura 11.28: Respuestas en frecuencia de WS y WT


Con el regulador H2 se obtiene kTzw k1 = 1:533; mientras que el regulador H1,
consigue kTzw k1 = 1:195. En la gura 11.31 se muestra la respuesta temporal del
sistema con el controlador H1 para un cambio de consigna [0; 5]T grados.
Si se calculan los indicadores de robustez propuestos para los controladores
Aplicacion de control robusto 311

60

40 W_S W_di
sv(W_S W_di),sv(W_T W_di) (db)

20
W_T W_di
0

-20

-40

-60

-80
10 -6 10 -5 10 -4 10 -3 10 -2 10 -1 10 0 10 1 10 2 10 3 10 4

rad/s

Figura 11.29: Respuestas en frecuencia de WS Wdi y WT Wdi

50
sv(So) (db)

-50

-100
10 -5 10 -4 10 -3 10 -2 10 -1 10 0 10 1 10 2
w (rad/s)

50

0
sv(SoG) (db)

-50

-100

-150
10 -5 10 -4 10 -3 10 -2 10 -1 10 0 10 1 10 2
w (rad/s)

Figura 11.30: So y SoG controlador H1


312 Dise~no de controladores H2 y H1 multivariables

6 y2

4
y (gra)

2
y1
0

-2
0 50 100 150 200 250 300
t (seg)

60

40 u1
20
u (gra)

0
u2
-20

-40
0 50 100 150 200 250 300
t (seg)

Figura 11.31: Respuesta temporal controlador H1

dise~nados, se obtienen los resultados que se resumen en la tabla 11.3. Los valo-
res de la tabla estan expresados: MF en grados, MG en decibelios y el resto en
tanto por ciento de incertidumbre tolerable.

Controlador I11i I12i I11o I12o I1s MG MF I3o I3i


% % % % % db gra % %
H2 (s. mixta) 37 82.4 100 100 42.5 37.6 74.9 68.1 51.0
H1 (s. mixta) 45.2 86.3 100 100 44.5 72.1 80.6 73.5 55.6
H2 42.1 45.8 72.9 74.1 34.8 12.3 58.7 51.8 37.9
H1 31.7 39.8 74.4 74.4 28.8 9.1 58.2 52.3 33.2

Tabla 11.3: Indicadores de robustez de los controladores H2 y H1 (mlmv19)


Aplicacion de control robusto 313

11.5.2 Regulador H1 para una planta no lineal


En este apartado se va a dise~nar un controlador H1 para el modnl, cuyos objetivos
son: 1) obtener un rechazo adecuado de las perturbaciones ambientales (las cuales se
mani estan a la entrada y a la salida de la planta), y 2) una estabilidad robusta para
ciertos niveles de incertidumbre. Para ello, como se ha justi cado en el apartado
anterior, se toma la siguiente matriz de transferencia:
" #
WS (s)So(s) WS (s)So(s)G(s)Wdi (s)
Tzw = W
T (s)To (s) WT (s)So (s)G(s)Wdi (s)

y por tanto, en la funcion de coste,


kTzw k1
aparecen de manera explcita las matrices de transferencia So y SoG; las cuales son
como ya se ha indicado, las responsables directas que determinan la atenuacion de las
perturbaciones que actuen sobre la planta. Las respectivas matrices de ponderacion
(dependientes de la frecuencia) WS ; Wdi se eligen para conseguir tales objetivos. El
termino WT To se emplea para tener en cuenta la incertidumbre en el modelo de la
planta, y se elige de forma que se consiga una tolerancia a incertidumbres de tipo
multiplicativo de un 50% en el peor caso.
El modelo de la planta es no lineal, sin embargo para hacer el dise~no se emplea
un modelo linealizado, y posteriormente el controlador se prueba con el modelo
matematico no lineal. El regulador obtenido es suboptimo para las condiciones de
operacion para las que se ha realizado la linealizacion, por ello no esta garantizado
para el conjunto de puntos en su vecindad debido a la dinamica no lineal del sistema.
Sin embargo, el controlador se dise~na con unas buenas propiedades de robustez,
siendo los resultados obtenidos por simulacion satisfactorios.
Para una velocidad de crucero de 21 nudos se eligen (tras algunos ensayos, y
ayudado de los resultados obtenidos con el regulador ltr-i dise~nado en la seccion
anterior) las siguientes matrices de transferencia de ponderacion:
2 s + 0:072 3
66 3:1623s + 2:2768 10 5 0 77
WS (s) = 4 s + 3:6 10 2 5
0
3:1623s + 1:1384 10 5

Wdi (s) = s +1 1 I
314 Dise~no de controladores H2 y H1 multivariables
2 3162:3s + 379:47 3
6 0 77
WT (s) = 64 3:1623s + 1200 3162:3s + 189:74 5
0
3:1623s + 600

Con las cuales, el regulador H2 obtiene kTzw k1 = 1:046, y el H1 reduce dicho


valor a kTzw k1 = 0:91. En la gura 11.32 se muestran las respuestas en frecuencia
de o(j!)] y o (j!)G(j!)]; como puede comprobarse, ambas magnitudes son lo
su cientemente peque~nas en el rango de baja frecuencia. La gura 11.33 muestra
los niveles estimados de incertidumbre multiplicativa no estructurada tolerables por
el sistema a la entrada de la planta (iMi), y a la salida (iMo). Esta gura repre-
senta 1=(M ), donde M es el sistema de interconexcion para cada tipo particular
de incertidumbre. Si se trata de incertidumbre no estructurada, de la gura 11.33
se desprende que para el caso de incertidumbre multiplicativa situada a la entrada
de la planta Ei (donde G0 = G(I + Ei)), esta no causara la inestabilidad del sis-
tema, siempre que kEik1 < 0:56 (o sea, que el sistema permite hasta un 56% de
incertidumbre relativa).
Igualmente, para el caso en que la incertidumbre este a la salida Eo (tal que
G0 = (I + Eo )G) se obtiene que kEok1 < 0:66 (lo cual supone un 66% de incer-
tidumbre tolerable en el caso mas desfavorable). Si se analiza la robustez del sistema
con respecto a incertidumbres estructuradas (estructura diagonal), se obtienen res-
pectivamente unas tolerancias del 62% y 67% respectivamente, lo cual implica una
estimacion menos conservativa, ya que en estos casos se emplea 1=(M ), donde
(M ) es el valor singular estructurado de M .
Para evaluar el comportamiento del controlador dise~nado frente a las perturba-
ciones ambientales, el sistema se somete a unas condiciones de navegacion carac-
terizadas por una altura signi cativa de olas de 4m, corriente de 2m=s, y viento
con velocidad de 20m=s, actuando las perturbaciones en una direccion de 45 grados
relativa al curso de referencia del buque. Las respuestas temporales obtenidas se
muestran en las guras 11.34 y 11.35, en las que se puede comparar el compor-
tamiento obtenido con el regulador H1 multivariable, y un controlador escalar que
no considera la naturaleza multivariable de la planta. Puede comprobarse que con
el regulador H1 se obtiene una mejora considerable en la reduccion del movimiento
de balance, as como en el mantenimiento del rumbo.
En la gura 11.36 se muestra el comportamiento obtenido con el mismo contro-
lador para una velocidad de crucero de 18 nudos, diferente a la nominal empleada
para el dise~no. Para la implementacion del regulador en un computador digital se
emplea un controlador de tiempo discreto equivalente con un perodo de muestreo
Aplicacion de control robusto 315

50

0
sv(So) (db)

-50

-100

-150
10 -5 10 -4 10 -3 10 -2 10 -1 10 0 10 1 10 2
w (rad/s)

50

0
sv(SoG) (db)

-50

-100

-150
10 -5 10 -4 10 -3 10 -2 10 -1 10 0 10 1 10 2
w (rad/s)

Figura 11.32: o(j!)] y o(j!)G(j!)]

40
1/sv(M) (db)

20 Multiplicativa a la entrada (iMi)

10 -5 10 -4 10 -3 10 -2 10 -1 10 0 10 1
w (rad/s)

40
1/sv(M) (db)

Multiplicativa a la salida (iMo)


20

10 -5 10 -4 10 -3 10 -2 10 -1 10 0 10 1
w (rad/s)

Figura 11.33: Tolerancias a incertidumbres (1= (j!)])


316 Dise~no de controladores H2 y H1 multivariables

5
Controlador SISO
heading (deg)

-5
0 50 100 150 200 250 300 350 400 450 500
t (sec)

5
Controlador MIMO
heading (deg)

-5
0 50 100 150 200 250 300 350 400 450 500
t (sec)

Figura 11.34: Rumbo para controladores SISO y MIMO

15
Controlador SISO
10
roll (deg)

-5
0 50 100 150 200 250 300 350 400 450 500
t (sec)

15
Controlador MIMO
10
roll (deg)

-5
0 50 100 150 200 250 300 350 400 450 500
t (sec)

Figura 11.35: Movimiento de balance para controladores SISO y MIMO


Aplicacion de control robusto 317

ContrlI11i I12i I11o I12o I1s MG MF I3o I3i


% % % % % db gra % %
1: LTR-i 68.5 78.7 60.7 71.7 44.4 25.8 66.7 - -
2: LTR-i 62.3 69.8 60.5 63.1 37.6 27.6 59.5 52.1 53.1
3: H2 52.3 58.3 63.7 63.7 31.3 17.8 46 49.7 39.7
4: H1 56.2 61.9 67.3 67.3 33.5 11.5 50.3 53.2 42.6

Tabla 11.4: Indicadores de robustez de los controladores para modnl

de 0:1 segundos (se utiliza para ello la transformacion bilineal, ver captulo 10). Se
emplea este perodo con el criterio de obtener unas respuestas temporales del sistema
en lazo cerrado equivalentes para el regulador de tiempo continuo y el de tiempo
discreto. En la tabla 11.4 se resumen los indicadores de robustez de los controladores
dise~nados para el modelo no lineal (modnl).

5
heading (deg)

-5
0 50 100 150 200 250 300 350 400 450 500
t (sec)

15

10
roll (deg)

-5
0 50 100 150 200 250 300 350 400 450 500
t (sec)

Figura 11.36: Comportamiento para condicion no nominal


318 Sntesis de los resultados obtenidos

11.6 Sntesis de los resultados obtenidos


En este apartado se trata de resumir y remarcar los principales resultados obtenidos
en los estudios llevados a cabo. De ello cabe destacar:

1. Se han realizado diversos dise~nos para el control de un sistema multivariable,


como es el control del rumbo y balance de un buque.
2. Para evaluar los diferentes dise~nos LTR, H2 y H1 se ha propuesto un conjunto
de indicadores de comportamiento y robustez.
3. El problema de dise~no de un sistema de control multivariable es sensiblemente
mas complejo que el de un sistema escalar. Sin embargo, los algoritmos em-
pleados para resolver tales problemas se realizan en el espacio de estados y son
independientes de la dimension y caracter vectorial o escalar de la planta. Sin
embargo puede ser necesario emplear un metodo de calculo alternativo en al-
gunos de los pasos intermedios del algoritmo, debido a los problemas numericos
que aparecen con mayor frecuencia en el caso de sistemas multivariables y/o
en sistemas de dimension elevada.
4. Se han empleado las metodologas LTR-i y LTR-o, en sus versiones de estruc-
tura basada en observador (cbo), o convencional, y no basada en observador
(cnbo). Mostrandose que para un mismo nivel de recuperacion es aconsejable,
en general, el empleo de la ultima, siempre que el sistema en lazo abierto pre-
sente elevada ganancia a baja frecuencia.
Ya que, para un nivel de recuperacion dado, proporciona unos reguladores mas
robustos y mas realizables desde un punto de vista de la aplicacion industrial.
En otro caso (para controladores que no aproximen la accion integral, como los
empleados para obtener respuestas sin sobre-oscilacion apreciable a cambios de
consigna tipo escalon), la estructura cbo se caracteriza por conseguir mejores
propiedades de robustez.
5. La eleccion de la sntesis LTR-i o de la LTR-o, va a depender de las especi ca-
ciones de dise~no y de que en cada caso concreto la eleccion de una de ellas sea
mas propicia para satisfacer tales especi caciones. As, si se conoce a priori
que los efectos de las incertidumbres del sistema pueden quedar re ejados a la
salida de la planta, o si esta tiene mas salidas que entradas, sera mas ventajoso
emplear la metodologa LTR-o. Mientras que si la planta tiene mas entradas
que salidas y/o la incertidumbre puede considerarse que queda re ejada a la
entrada de la planta, resulta mas aconsejable utilizar el metodo LTR-i.
Aplicacion de control robusto 319

6. El metodo de dise~no seguido para los reguladores H2 y H1, calcula en primera


fase un regulador H2, a partir del cual se obtiene el H1, con el que se consigue
disminuir el valor de la funcion de coste kTzw k1 obtenido con el dise~no H2.
La robustez del sistema, en general, mejora para el controlador H1, pero en
cada caso hay que examinarla, antes de decidir entre los reguladores H2 y H1.
7. Un regulador H1 suboptimo puede proporcionar unas propiedades de robustez
y comportamiento globalmente mas satisfactorias que el regulador H1 optimo.
8. Los resultados del empleo de una u otra metodologa de dise~no, van a depender
en gran manera de diversos factores:
(a) De los requerimientos de control que se precisen.
(b) Del modo en que estos se expresen de forma matematica.
(c) De la experiencia que se tenga a la hora de seleccionar los parametros de
dise~no.
(d) De seguir un procedimiento iterativo sistematico que simpli que el dise~no
y reduzca el numero de iteraciones.
Se han obtenido buenos resultados con cada una de las metodologas analiza-
das: LTR, H2 y H1.
9. Se ha comprobado, al menos para los casos analizados, que un controla-
dor H1 con prestaciones similares a un controlador LTR, requiere una di-
mension mayor, necesita perodos de muestreo sensiblemente inferiores y posee
propiedades numericas menos favorables; por lo que desde un punto de vista
practico, y en determinados casos concretos, podra ser mas recomendable el
empleo de controladores ltr (Lopez y Rubio, 1995b).
La metodologa H1 aborda de una forma explcita las especi caciones del sis-
tema en lazo cerrado y los niveles de incertidumbre que el sistema de control
debe soportar, por lo que resulta mas simple la formulacion de ciertos pro-
blemas de control robusto. La metodologa LTR consiste sin embargo, en un
procedimiento indirecto, ya que trata con las funciones (matrices) de trans-
ferencia en lazo abierto, no pudiendose expresar de manera directa (a partir
de las matrices de ponderacion empleadas para el dise~no) los niveles de in-
certidumbre tolerables, teniendo que calcularse estos a posteriori. Por otro
lado, la metodologa H1 junto con el procedimiento de dise~no conocido como
sntesis- (Balas et al, 1991) puede proporcionar de forma directa reguladores
con un comportamiento robusto.
320 Sntesis de los resultados obtenidos

En general, se puede decir que ningun metodo proporciona la solucion total al


problema de dise~no; ya que con tecnicas diferentes, y con distintos grados de so sti-
cacion, pueden obtenerse resultados similares. En cada caso particular habra que
determinar a partir de las caractersticas del sistema a controlar y de las exigencias
de dise~no, cual es la metodologa que proporciona los mejores resultados. Resulta
por tanto de interes el desarrollo de metodos iterativos informatizados para el ajuste
y seleccion automatizada de los parametros de dise~no, en funcion de unas especi -
caciones realizadas por el operador (cosa que no siempre es sencilla, especialmente
en el caso de sistemas multivariables). Integrando diferentes tecnicas de control ro-
busto en un sistema que ofrezca al usuario la posibilidad de comparar y decidir la
estrategia de control que pueda conseguir mejores resultados, o que mejor se adapte
al problema concreto de dise~no.
Hay que remarcar que la teora de control en torno a los metodos H1 esta en
continua evolucion, as como el desarrollo de tecnicas de dise~no de controladores
multi-objetivos, tales como la conocida por H2=H1; existiendo la en actualidad
grandes esfuerzos de investigacion en torno a tales metodos (Doyle et al. 1994,
Haddad et al, 1994; Rotea et al, 1991; Stoorvogel, 1992; Khargonekar et al, 1991;
Green y Limebeer, 1995; Grimble, 1994).
Apendice A
Analisis de los sistemas de control
basados en observador
A.1 Analisis de robustez con y sin observador
Sea un sistema de control por realimentacion del vector de estado, y el correspon-
diente sistema que emplea un observador para estimar el estado del proceso, tal como
muestran las guras A.1 y A.2 respectivamente. Entre los esquemas correspondientes
de estas guras (Doyle y Stein, 1979), se cumplen las siguientes propiedades:

1. La funcion de transferencia de los bucles cerrados es la misma en ambos casos.


2. La funcion de transferencia en bucle abierto abriendo en el esquema de la

G(s)
y
r - as - -

- 6
B (s) C

b s
Kc  x

Figura A.1: Realimentacion del vector de estado

321
322 Analisis de robustez con y sin observador

r y
- j u (1)t (2)t u -
0
Planta -
- 6

u^
- B

Kc  (s)  ?j Ko  j
6 -

- C

Figura A.2: Diagrama del controlador LQG

gura A.2 por el punto (1) es la misma. En efecto:

 en la gura A.1, u = Kc x = KcB u0


 en la gura A.2, u = Kc x^ = KcB u0

ya que x^ = Bu0, al tener los dos sistemas (planta y observador) la misma


se~nal de entrada.

3. Las funciones de transferencia abriendo en el esquema completo (A.2) por (2)


son diferentes. Se puede demostrar que solo son iguales si se modi ca Ko ,
pasando a depender de un parametro q y tendiendo este a in nito. Ello se
demostrara en la proxima seccion.
El hecho de que sean distintos en este caso, se debe a que la dinamica del
error del observador (y y^) es tenida en cuenta, si se rompe el bucle (o si
se introducen perturbaciones) por (2), cosa que no ocurre si se abre por (1)
(A.2).
Analisis de los sistemas de control basados en observador 323

A.2 Condicion su ciente para la recuperacion


A continuacion se va a desarrollar la condicion su ciente para que el bucle abierto
lqg tienda al lqr. A partir de la gura A.1 se tiene que la funcion de transferencia
en lazo abierto (que relaciona la se~nal que entra por el punto a y sale por el punto
b) del regulador lqr viene dada por,
Hc(s) = LLQR (s) = Kc(sI A) 1B (A:1)

Para ello, se hacen depender las ganancias del ltro de Kalman de un determinado
parametro q. Si se cumple que:
lim Ko(q) = BW (A:2)
q!1 q
siendo W cualquier matriz no singular entonces; el bucle abierto lqg se aproxima
asintoticamente al lqr.
En efecto, la funcion de transferencia de bucle abierto con observador viene dada
por,
LLQG = Kc(sI A + BKc + KoC ) 1Ko C B (A:3)

Si se hace = (sI A + BKc) 1 y teniendo en cuenta el lema de inversion de


matrices,
(A + BCD) 1 = A 1 A 1 B (C 1 + DA 1 B ) 1DA 1 (A:4)

dicha expresion, puede ser escrita como:


LLQG = Kc[ Ko(1 + C Ko) 1 C ]Ko C B =
= [Kc Ko Kc Ko(1 + C Ko) 1 C Ko] C B =
= [Kc Ko(1 (1 + C Ko) 1 )C Ko] C B =
= Kc Ko(1 + C Ko) 1 C B (A.5)

Si en esta ultima expresion se aplica la condicion de recuperacion dada por la


expresion (A.2), se tiene,
LLQG = Kc qBW (1 + C qBW ) 1 C B
que cuando se hace tender q a in nito se reduce a:
LLQG = Kc BW (C BW ) 1 C B
324 Condicion su ciente para la recuperacion

Aplicando a esta ultima expresion, nuevamente el lema de inversion de matrices


(A.4) y sustituyendo por su valor se llega a,
LLQG = Kc BW (C BW ) 1 C B =
= KcBW (1 + KcB ) 1 [C BW (1 + KcB ) 1 ] 1 C B =
= KcBW (C BW ) 1 C B =
= KcB

Luego la expresion nal que se obtiene es,


LLQG(s) = KcB
la cual es identica a la expresion (A.1) correspondiente a LLQR (s). Con esto queda
demostrada la convergencia al tender el parametro q a in nito, de las funciones de
transferencia en bucle abierto, cuando se tiene una estructura de realimentacion
directa del estado o con un observador ( ltro de Kalman).
Para que Ko cumpla la condicion de recuperacion se tendra que introducir alguna
modi cacion en el ltro de Kalman. Para ello, se dise~na el ltro de Kalman con unas
matrices de covarianzas cticias. Se tomaran:
Q = Qo + q2 BV B T (A.6)
R = Ro (A.7)
siendo V cualquier matriz no singular y donde Qo y Ro son las matrices de cova-
rianzas nominales de w y v; y q es un parametro escalar conocido como ganancia de
recuperacion.

Con estas modi caciones se calcula el ltro de Kalman:

Ko = PC T R 1 (A:8)
AP + PAT + Q PC T R 1CP = 0 (A:9)

Introduciendo las anteriores matrices de covarianzas en la ecuacion (A.9), resulta:

AP + PAT + Qo + q2BV B T PC T R 1CP = 0 (A:10)


Analisis de los sistemas de control basados en observador 325

y dividiendo la expresion por q2 se llega a,


A qP2 + qP2 AT + Qq2o + BV B T q2( qP2 )C T R 1C ( qP2 ) = 0 (A:11)

Hay que destacar el hecho de que en la anterior ecuacion (A.11), existen dos tipos
de variables: q, que es el parametro cuyo valor se modi ca para recuperar la funcion
de transferencia, y la matriz P , de la cual dependen los valores de las ganancias
del ltro de Kalman y que solo puede ser encontrada una vez asignado a q un valor
determinado.
Por tanto, si se hace tender q a in nito se tendra:

q2( qP2 )C T R 1 C ( qP2 ) q!1


! BV B T
y teniendo en cuenta el valor de Ko (ecuacion A.8), se tiene:

Ko(q)RKoT (q) q!1! BV B T


q2
que descomponiendo lo anterior se llega a:

Ko(q) q!1
! B V 1 1 1
| (R{z ) } = BW
2 2
q
W
Se cumple, por tanto, la condicion de recuperacion (ecuacion A.2).
Se calculara, por tanto, el ltro de Kalman a partir de la matriz de covarianza
modi cada, de este modo, a medida que se aumente el valor del parametro q mas
cerca se estara de la funcion de transferencia en bucle abierto del lqr. Al hacer
esto, se pierde precision en la estimacion del estado, ya que se esta calculando el
ltro de Kalman con unas covarianzas cticias, sin embargo, se gana en robustez.

A.3 Planteamiento del Metodo LQG en el Do-


minio de la Frecuencia
La ecuacion de Riccati se puede interpretar en el dominio de la frecuencia, de forma
que proporcione expresiones en terminos de funciones de transferencia. Sea el sis-
326 Planteamiento del Metodo LQG en el Dominio de la Frecuencia

tema,
x_ = Ax + Bu (A:12)

donde u es de dimension 1 por simplicidad, y sometido al criterio de funcionamiento:


Z1
J= 0
(xT Qcx + u2) dt (A:13)

Se supone r = 1 sin perdida de generalidad, ya que puede ser englobado en los


elementos de la matriz Qc. La ecuacion de Riccati correspondiente viene dada por:
AT Pc + PcA PcBR 1B T Pc + Qc = 0

que a su vez puede ser reordenada de la forma:

Pc A AT Pc = Qc PcBB T Pc

Sumando y restando sPc al primer miembro se tiene:

Pc(sI A) + ( sI AT )Pc = Qc PcBB T Pc

que llamando (s) = (sI A) 1 conduce a:

Pc 1 (s) + T 1 ( s)Pc = Qc KcT Kc

Premultiplicando por B T T ( s) y postmultiplicando por (s)B se llega a:

s)(s}) B + B T | T ( s){zT 1 ( s)} Pc(s)B =


B T T ( s)Pc | 1 ({z
I I

B T T ( s)[Qc KcT Kc](s)BB T T ( s) P|{z}


cB + B
T
| {zP}c (s)B =
KcT Kc
B T T ( s)Qc(s)B B T T ( s)KcT Kc(s)B
Analisis de los sistemas de control basados en observador 327

La funcion de transferencia en bucle abierto cuando se aplica la ley de control


lqr es Hc = Kc (s)B = B T T (s)KcT , luego la anterior expresion se puede escribir:
HcT ( s) + Hc(s) = B T T ( s)Qc(s)B HcT ( s)Hc(s) (A:14)
que a su vez se puede reescribir de la forma:
[1 + HcT ( s)][1 + Hc(s)] = 1 + B T T ( s)Qc (s)B (A:15)

Se de ne: Fc(s)  1 + Hc(s), y Fc(s) se conoce como la funcion de diferencias


del retorno.
Ahora supongase el segundo miembro de (A.15) factorizado de la forma (factor-
izacion espectral):
1 + B T T ( s)Qc(s)B = c(s)c( s) (A:16)
se tiene entonces que (A.15) se puede reescribir:

Fc(s)Fc( s) = c(s)c( s)
y por tanto:
Fc(s) = c(s)
con lo que se llega a la expresion que da la funcion de transferencia del sistema en
bucle abierto, con la realimentacion de las variables de estado:
Hc(s) = c(s) 1

Observese que mediante la factorizacion espectral anterior se ha resuelto la


ecuacion de Riccati al determinar c(s). En efecto se ha obtenido Hc (s), lo cual
es equivalente a determinar Kc, ya que ambas vienen relacionadas por la expresion
Hc(s) = KcB . Es decir, manipulando exclusivamente funciones de transferencia
se llega a determinar la solucion al problema lqr.
Una vez demostrado lo anterior se puede comprobar lo que se haba a rmado
sobre la robustez de los reguladores lqr.
Si se factoriza Qc de la forma Qc = M T M y se hace s = j! en la ecuacion de
Riccati (A.15) se obtiene:
328 Planteamiento del Metodo LQG en el Dominio de la Frecuencia

j 1 + Hc(j!) j2= 1+ j M (j!)B j2


de donde:
k1 + Hc(j!)k > 1 (A:17)

Si se interpreta esta condicion en el plano polar, la curva de Hc(j!) no puede


entrar dentro de un crculo de centro ( 1; 0) y radio 1, por lo que se asegura un
margen de fase mayor de 60 grados y un margen de ganancia in nito.
Un desarrollo analogo para el problema de la observacion llevara a un resultado
del mismo tipo. Para el ltro de Kalman se tiene que la matriz de ganancia del
observador esta dada por,
Ko = PoC T
obteniendose esta de la ecuacion de Riccati:
APo + PoAT + Qo PoC T CPo = 0

Si se de ne la funcion de transferencia en bucle abierto del observador como la


que resulta de cortar el bucle del ltro de Kalman por el punto (1) en la gura A.2,
se tendra:
Ho = C Ko (A:18)
Y efectuando un desarrollo similar al realizado para el control se llegara a:
Ho(s) = o (s) 1
con:
o (s)o( s) = 1 + C (s)QoT ( s)C T (A:19)

Lo que se obtiene no es Ko, sino Ho(s), pero ambos resultados, como se ha visto,
son equivalentes.

Procedimiento de calculo
De lo desarrollado en esta seccion se puede resumir que mediante la manipulacion
de funciones de transferencias, se llega a resolver el problema lqg. El procedimiento
sera especi car la matriz Qc en forma factorizada como Qc = M T M , lo cual es
equivalente a especi car la funcion de transferencia Gc(s) = M (s)B . A partir de
Analisis de los sistemas de control basados en observador 329

esta funcion de transferencia y mediante la factorizacion de la ecuacion de diferencias


del retorno:
[1 + HcT ( s)][1 + Hc(s)] = 1 + GTc ( s)Gc(s) (A:20)
se puede llegar a deducir Hc(s), funcion de transferencia de bucle abierto del lqr.
De forma analoga, especi cando la matriz Qo en forma factorizada como Qo =
T o bien especi car la funcion de transferencia Go(s) = C (s) , y mediante la
factorizacion de la ecuacion de diferencias del retorno:
[1 + Ho(s)][1 + HoT ( s)] = 1 + Go (s)GTo ( s) (A:21)
se puede calcular Ho(s).
Con estas dos funciones de transferencia: Hc(s); Ho(s), se pueden calcular las
ganancias de la ley de control y del ltro de Kalman Kc y Ko, ya que estan directa-
mente relacionadas por las expresiones (A.1) y (A.18) rese~nadas anteriormente.

A.4 Regulador LQG obtenido mediante ecuacion


diofantica
A continuacion se deduce una ecuacion diofantica, que puede ser utilizada como
alternativa para obtener la expresion del regulador lqg. Este regulador a partir de
la (ecuacion A.3) viene dado por,
GR (s) = Kc(sI A + BKc + KoC ) 1Ko (A:22)
que operando como se ha visto en la seccion (A.2), se llega a la expresion (A.5) de
la funcion de transferencia en bucle abierto, y por tanto para el regulador sera,
GR(s) = Kc Ko(1 + C Ko) 1 (A:23)
Utilizando nuevamente el lema de inversion de matrices (A.4) se obtiene la expresion:
GR (s) = [KcKo KcB (1 + C B ) 1 KcKo ](1 + C Ko) 1 (A:24)
que llamando kk(s) = KcKo , y teniendo en cuenta las expresiones de Gc (A.1) y
Go (A.18), puede escribirse,
GR (s) = [kk Gc(1 + Gc) 1 kk](1 + C Ko) 1 =
= [kk(1 Gc(1 + Gc) 1)][1 + C Ko C B (1 + Gc) 1kcKo] 1 =
= kk(1 + Gc) 1[1 + Go Gp(1 + Gc) 1 kk] 1 (A.25)
330 Regulador LQG obtenido mediante ecuacion diofantica

GR(s) = 1 + G + G +kkG G G kk (A:26)


c o c o p

GR(s) = (1 + G )(1 +kkG ) G kk (A:27)


c o p

Esta expresion da una relacion en terminos de funciones de transferencia para


el regulador lqg. Si se expresan las funciones de transferencia deseadas Gdc y Gdo
como cociente de dos polinomios en s, y sustituyendo en la expresion (A.27) se tiene:

Gdc(s) = nd1((ss)) y Gdo (s) = nd((ss)) (A:28)


1

GR (s) =  (s) kk (s)


=
kk(s)d1(s) =
nr (s) (A:29)
c o (s) n(s)kk(s) c(s)o (s) n(s)kk(s)d1(s) dr (s)
d1(s)d(s) d ( s ) d(s)
donde c(s) es el factor positivo procedente de la factorizacion del termino derecho
de la ecuacion (A.20) y o(s) el correspondiente a la ecuacion (A.21).
A partir de la ecuacion (A.29), se puede llegar a la ecuacion diofantica que
permite obtener la expresion del regulador mediante la manipulacion de polinomios
en s, donde nr (s) y dr (s) son las incognitas. En efecto, haciendo nr (s) = kk(s)d1(s),
se tiene:
c(s)o(s) = dr (s) d(s) + n(s) nr (s) (A:30)
Apendice B
Elementos matematicos utiles en
la teora de control
B.1 Polos y ceros de un sistema multivariable
Sea un sistema lineal e invariante en el tiempo (slit) descrito por el conjunto de
ecuaciones:
x_ (t) = Ax(t) + Bu(t)
y(t) = Cx(t) + Du(t) (B.1)
donde x 2 <n es el vector de estados, y 2 <p es el vector de medidas y u 2
<m es el vector de control. Siendo A; B; C; D matrices constantes de dimensiones
compatibles.
Se de nen los polos del sistema como los autovalores o valores propios de la
matriz A.
Supuesto que:

 El conjunto de matrices (A; B; C; D) constituyen una realizacion mnima de


la matriz de transferencia de la planta G(s).
 El numero de salidas no es inferior al de entradas: p  m.
se de nen los ceros de transmision del sistema B.1 como el conjunto de numeros
331
332 Polos y ceros de un sistema multivariable

complejos z, los cuales satisfacen la siguiente desigualdad (Zhang y Freudenberg,


1990):
" #
rango zI A B
C D <n+m
siendo la multiplicidad de z igual a su multiplicidad algebraica.
Si el sistema G(s) tiene algun cero en el semiplano complejo derecho se dice que
es de fase no mnima; en caso contrario de fase mnima.
El sistema B.1 es estable si y solamente si todos sus polos estan en el semiplano
complejo de la izquierda.
Criterio de Nyquist generalizado
A traves de los autovalores del sistema en lazo cerrado se determina si un sistema
de control es estable. Igualmente, esto se podra inferir a partir de la aplicacion
del teorema de Nyquist. Para sistemas multivariables tiene la siguiente expresion
(MacFarlane, 1977):
X
r
N ( 1; i[L(s)]; D) = Pol
i=1

donde:

L(s) matriz de transferencia en lazo abierto de dimensiones r  r.

D contorno semicircular de Nyquist, de radio in nito que envuelve al semiplano


complejo derecho, y que evita los polos de L(s) en el eje imaginario rodeandolos
con semicrculos de radio in nitesimal.

Pol numero de polos inestables de L(s).

N numero de vueltas en sentido horario del lugar de Nyquist en torno al punto


( 1; 0).

i autovalores o valores propios.


Elementos matematicos utiles en la teora de control 333

B.2 Normas
Se de ne una norma k : k en un espacio vectorial V (de nido sobre un conjunto con
estructura de cuerpo C ), como una operacion con las propiedades:
kvk > 0 8v 2 V; v 6= 0
kvk = 0,v=0
k v k = j jk v k 8 2 C; v 2 V
kv+w k  k v k + k w k 8v; w 2 V

Sea C el conjunto de los numeros complejos. Para V = C n, se de ne la norma-p


para el vector v = (v1; : : : ; vn) 2 V como:
k v kp= (j v1 jp + : : : + j vn jp)1=p

Las tres normas mas utilizadas son para p = 1; 2; 1, con:


k v k1= max
i
j vi j

Si se trata de V = C nn los elementos de V seran las matrices complejas M de


orden n. Algunas normas usuales son:
sX X
1. Norma de Frobenius: k M kF = j mij j2
i j
X
2. Norma 1: k M k1= max
j
j mij j
i
3. Norma 1:
X
k M k1= max
i
j mij j
j

4. Norma espectral:
r
k M k2 = max
i i
 (M H M )

Algunas relaciones utiles son:


k M k22  k M k2F = traza(M H M )  n k M k22
334 Los Valores Singulares

Una norma matricial que satisfaga la condicion:


k MN k  k M kk N k
se denomina compatible. Se tiene una cota inferior para cualquier norma matricial
compatible:
(M )  k M k
donde (M ) es el radio espectral de M :
(M ) = max
i
j i(M ) j

Se de ne la norma inducida de la matriz M como:


k M k= sup kkMvvk
k
v6=0

La norma inducida tiene las siguientes propiedades:

1. k Mv k  k M k k v k
2. k M k = j j k M k
3. k M + N k  k M k k N k
4. k MN k  k M k k N k

B.3 Los Valores Singulares


Los valores singulares (sv) de una matriz G se de nen como :
q
i (G) = i(GH G) i = 1; 2; : : : ; k
donde i representa un autovalor y k = min(r; m); siendo m el numero de columnas
de G y r su numero de las.
Si los valores singulares se ordenan de forma que i  i+1 , los valores singulares
extremos seran:
 = 1  = k
Elementos matematicos utiles en la teora de control 335

La descomposicion en valores singulares (svd) de una matriz G queda de la


forma: !
 0
G = (U1 U2) 0 0 (V1 V2)H
X
n
G = USV h = uiviH i
i=1
Gvi = iui
uHi G = vihi
con:
S = diag[1 ; 2; : : : ; n]
V = [v1 ; v2; : : : ; vn]
U = [u1; u2; : : : ; un]
UU H = I; V V H = I

Los valores singulares son los elementos de la diagonal principal de S , las colum-
nas de la matriz U son los denominados vectores singulares por la izquierda (o
tambien direcciones principales de salida) y las de V son conocidos como vectores
singulares por la derecha (o direcciones principales de entrada).
Algunas propiedades utiles de los valores singulares son:
1.
(G) = max k Gx k
x6=0 k x k
2.
(G) = min k Gx k
x6=0 k x k
3.
(G) j i (G) j (G)
4. Si G es no singular:
(G) = (G1 1)
5. Si G es no singular:
(G) = (G1 1)
6.
( G) =j j (G)
7.
(G + H )  (G) + (H )
8.
(GH )  (G)(H )
336 Los Valores Singulares

9.
(G) (H )  (G + H )  (G) + (H )
10. p
maxf(G); (H )g  (GH )  2 maxf(G); (H )g
11.
X n
i2 = Traza(GhG)
12. i=1
max
i;j
j gi;j j (G)  n max
i;j
j gi;j j

Valor Singular Estructurado


Se de ne el valor singular estructurado (ssv) (Doyle, 1982) de una matriz M ,
como la inversa del valor singular maximo de una matriz E que anule el determinante
det (I ME ), y cero en otro caso. O sea:
 f = det (I ME ) = 0 para algun E 2 X g
(M ) = min 1

Donde X es el conjunto de matrices caracterizado por una determinada estruc-


tura diagonal de bloques Ei estables:
X = fE = diag fEig = i ]   g (B:2)

La de nicion de (M ) supone una generalizacion del radio espectral (M ) =


max (M ), y del maximo valor singular (M ). En el caso particular donde se de ne
X de la forma:
X=1 = fE = I = j  j 1g
se tiene que (M ) = (M ) . Y si ocurre que E es una matriz que no tiene estructura
diagonal de bloques, entonces (M ) = (M ).
Algunas propiedades utiles del valor singular estructurado son:

1. Para la matriz unidad I :


(I ) = 1
2. Para todo escalar :
( M ) =j j (M )
3. Acotamiento:
(M )  (M )  (M )
Elementos matematicos utiles en la teora de control 337

4. Para A; B matrices cuadradas:


(AB )  (A)(B )
5. Para cualquier E 2 X :
(E ) = (E )
6. Sea D el conjunto de matrices reales diagonales positivas: D = diag fdiIig,
donde el tama~no de cada bloque (diIi) coincide con el de los bloques Ei . Si
D 2 D y E 2 X , entonces DED 1 2 X , cumpliendose que:
(DMD 1) = (M )
de lo anterior, y teniendo en cuenta la propiedad 3 se obtiene:
(M )  (DMD 1) 8D 2 D
7. A partir de la propiedad anterior se deriva un metodo para el calculo de una
cota de (M ):
(M )  Dinf2D
(DMD 1)
Se demuestra, que la igualdad se alcanza hasta un maximo de tres bloques.
Para un numero mayor de bloques se consigue una cota ajustada (Morari et
al, 1989; Thompson, 1988).

B.4 Los Valores Propios


Los valores singulares de matrices de funciones racionales (Matrices de Transferen-
cia) no son funciones analticas, por lo que a diferencia del caso escalar no se tiene
una expresion analtica que relacione la ganancia y la fase del sistema (Freudenberg
et al, 1988).
Para el caso de sistema escalar de fase mnima se tiene que cuando j KG j 1
(zona proxima a frecuencia de cruce de ganancia !c) se tiene que:
j 1 + KG jj 1 + (KG) 1 j 2 j sen(( + )=2) j
siendo  +  el margen de fase (mf) del sistema.
Los autovalores de un sistema multivariable s satisfacen las propiedades mate-
maticas requeridas, pero no se relacionan directamente con la calidad del dise~no en
lazo cerrado y no estan de nidos para matrices de transferencias no cuadradas.
338 Los Valores Propios

A pesar de ello, para el caso de sistema multivariable se desarrollan unas rela-


ciones similares a las anteriores, empleando los valores propios de las matrices de
transferencia I + GK y I + (GK ) 1. Teniendo en cuenta que para cualquier matriz
cuadrada Q:
(Q) j (Q) j (Q)
se pueden acotar superiormente al valor singular mnimo e inferiormente al valor
singular maximo.
Para un sistema con matriz de transferencia G cuadrada se realiza la factorizacion
o descomposicion en valores caractersticos (cvd) dada por:
G = W W 1
donde las columnas de W son los autovectores (o vectores propios) de G y  es una
matriz diagonal formada por los autovalores (o valores propios) de G:
 = diag fig

Se obtienen unas propiedades muy utiles y sencillas de manejar:


i[I + GK ] = 1 + i(GK )
i [I + (GK ) 1] = 1 + 1=i(GK )
As, cuando j i (GK ) j= 1 para algun i y ! = !c se tiene:
j i(I + GK ) j=j i[I + (GK ) 1] j= 2 j sen[( + i )=2] j
que es analoga, para cada i, a la obtenida en el caso escalar.
Por tanto, como j i j acota a , se puede emplear el valor de ( + i ) como
argumento para evaluar un dise~no, ya que si  + i es peque~no en la zona de cruce,
el sistema exhibira una robustez pobre (Doyle y Stein, 1981).

Generalizacion de los conceptos de Margenes de Estabilidad


El analisis con los i(j!) da un conocimiento sobre la estabilidad del sistema.
Pueden extenderse los conceptos escalares de margen de ganancia (MG) y margen
de fase (MF) para el caso vectorial de niendo:
MG = min i
fMG(i )g ; MF = min i
fMF (i )g
Elementos matematicos utiles en la teora de control 339

donde para cada i[L(j!)] se obtiene un diagrama de Nyquist (escalar) as como
unos margenes de estabilidad (MGi ; MFi ) asociados.
Hay que tener en cuenta que en el caso multivariable la existencia de unos
margenes de fase y ganancia (tal y como se de nen arriba) excelentes, no va a
indicar necesariamente (a diferencia de lo que ocurre en el caso escalar) que el sis-
tema tenga una robustez tambien excelente. Sin embargo, s se puede a rmar lo
contrario: si se obtienen unos margenes de estabilidad (MF; MG) inaceptables, ello
sera indicativo de que la robustez del sistema no es satisfactoria (Doyle y Stein,
1981). Es por ello que algunos autores los cali quen como indicadores de robustez
cualitativos (Lunze, 1989).

B.5 La Matriz de Ganancia Relativa


En algunos casos la incertidumbre o errores de modelado de un sistema pueden
describirse en terminos de las incertidumbres de los elementos de la matriz de trans-
ferencia, por ejemplo como producto de una identi cacion experimental.
Si G(j!) es la matriz de transferencia de un sistema, esta se hara singular a una
frecuencia ! si se produce un cambio relativo de 1=ij (j!) en su elemento gij (j!)
(Postlethwaite et al, 1993), y no se hara singular mientras se cumpla:
1
j gij0 (j!) gij (j!) j<  (j! )
ij
Los valores ij (j!) son los elementos de la matriz [G(j!)] llamada Matriz de
Ganancia Relativa (rga), obteniendose de:
[G(j!)] = G(j!):  (G(j!) 1)T
donde : indica producto elemento a elemento (o de Schur) de dos matrices.
Por tanto, los elementos de rga dan una medida directa de la sensibilidad a
la incertidumbre en el sistema elemento a elemento. Matrices con valores elevados
de los elementos de rga se haran singulares para peque~nos errores relativos en sus
elementos.
Se veri can las propiedades siguientes:
1.
X X
ij = ij = 1
i j
340 La Matriz de Ganancia Relativa

2. Independencia de escalados. Para dos matrices reales y diagonales D1 ; D2 se


cumple:
(D1 GD2) = (G)
3. Al menos para sistemas con dos entradas y dos salidas se veri ca:
k (G) km  (1G) k (G) km
donde (G) es el numero de condicion de G o relacion entre sus valores singu-
lares extremos para cada frecuencia !:
[G(j!)] = [[G (j!)]
G(j!)]
Se cumple que:
k (G) km = 2 maxfk (G) k1; k (G) k1g
Dado que  va a depender de las unidades que se empleen para representar al
sistema, existen unas para las que toma su valor mnimo  . Se consigue si se
escala la planta de forma adecuada por un par de matrices reales diagonales
D1 ; D2:
(G) = Dmin
;D
1 2
(D1GD2)

Se tendra por tanto que un sistema con un  elevado tendra tambien un valor
grande de los elementos de RGA. E igualmente sistemas con altos elementos de
RGA tendran tambien elevados valores de  . En este caso se dice que la planta
esta mal condicionada, lo que implicara en general algunos problemas adicionales
para realizar su control (Morari et al. 1989), as como una mayor sensibilidad a las
incertidumbres relativas en sus elementos de la matriz de transferencia del sistema.
Otro aspecto importante a tener en cuenta en el analisis de robustez consiste en
que la rga tambien sirve como indicador de la robustez del sistema a incertidumbres
multiplicativas diagonales que se presenten a la entrada de la planta. Como es el
caso de las incertidumbres independientes debidas a la dinamica no modelada de los
actuadores. En ese caso, la incertidumbre E (s) se representa:
E (s) = diagfei(s)g
y la planta real G0 estara relacionada con la nominal G por:
G0(s) = G(s)[I + E (s)]
Elementos matematicos utiles en la teora de control 341

La matriz de transferencia en lazo abierto real queda:


G0K = G(I + E )K = GK (I + K 1EK )
o de forma equivalente:
G0K = G(I + E )K = (I + GEG 1)GK
Las matrices de error correspondientes a cada expresion anterior a su vez pueden
ponerse como: X
(K 1EK )ii = ji(K )ej
j
X
(GEG 1 )ii = ij (G)ej
j

Si tanto la planta G, como el controlador K tienen valores elevados en los ele-


mentos de RGA, el sistema de control sera especialmente sensible a incertidumbres
tipo multiplicativo situadas a la entrada de la planta. Lo anterior se dara por ejem-
plo para una planta mal condicionada en caso de emplear un controlador que realice
una inversion de la planta en determinadas frecuencias para conseguir reducir la
interaccion entre los diferentes canales o lazos de control del sistema.
342 La Matriz de Ganancia Relativa
Apendice C
De niciones y algoritmos
relacionados con la teora H1
C.1 Algunas de niciones
A continuacion se de nen los espacios de Hardy H2 y H1, los cuales son amplia-
mente tratados en los temas relacionados con las teoras de control optimo y robusto
H2; H1, as como en problemas mixtos H2=H1. En primer lugar se de nen para el
caso del problema escalar.
El espacio de Hardy H1 consiste en el conjunto de funciones F (s) de la variable
compleja s =  + j!, las cuales son analticas y estan acotadas en el semiplano
complejo de la derecha, Re s > 0. Se de ne la norma H1 de F como:
kF k1 = supfj F (s) j: Re s > 0g
Dado que en la teora de control se trabaja con funciones y matrices de transferencia
con coe cientes reales, se de ne el subconjunto,
RH1  H1
En este caso, y empleando el teorema del modulo maximo (Churchill et al, 1978;
Spiegel, 1971), basta con emplear s = j!, y por tanto:
kF k1 = supfj F (j!) j: ! 2 <g

El espacio de Hardy H2 consiste en el conjunto de funciones F (s) de la variable


343
344 Algunas de niciones

compleja s =  + j!, las cuales son analticas en el semiplano complejo de la derecha


(Re s > 0), y que satisfacen la condicion,

1 Z1
kF k22 = sup
>0 2 1
j F ( + j!) j2 d! < 1

Y limitandose al caso de coe cientes reales (espacio RH2), se tiene que para
calcular la norma H2 , basta con integrar a lo largo del eje imaginario s = j!:

1 Z1
kF k22 =
2 1
j F (j!) j2 d!

Para el caso vectorial, se de nen de forma similar empleando las de niciones


para sistemas multivariables de norma H2 y norma H1:
Z1
kF k22 = 21 0
traza[F T ( j!)F (j!)]d!

kF k1 = sup
!
 (j!)]

En la bibliografa relacionada con la teora de control H1 se emplea una de-


terminada nomenclatura para indicar los diferentes conjuntos que se utilizan. A
continuacion se presenta un resumen de esta, a n de identi car de forma sencilla y
directa cada uno de dichos conjuntos (Francis, 1987):

L2 : Conjunto de funciones (matrices) de transferencias estrictamente propias y sin


polos en el eje imaginario.
H2 : Conjunto de funciones (matrices) de transferencias estrictamente propias y
estables.
L1 : Conjunto de funciones (matrices) de transferencias propias y sin polos en el
eje imaginario.
H1 : Conjunto de funciones (matrices) de transferencias propias y estables.
De niciones y algoritmos relacionados con la teora H1 345

RL2 : Conjunto de funciones (matrices) de transferencias con coe cientes reales,


estrictamente propias y sin polos en el eje imaginario.
RH2 : Conjunto de funciones (matrices) de transferencias con coe cientes reales,
estrictamente propias y estables.
RL1 : Conjunto de funciones (matrices) de transferencias con coe cientes reales,
propias y sin polos en el eje imaginario.
RH1 : Conjunto de funciones (matrices) de transferencias con coe cientes reales,
propias y estables.

C.2 El operador de Riccati


Sean A; Q; R matrices cuadradas de dimension n, con R y Q simetricas. Se de ne
la matriz Hamiltoniana asociada como:
" #
H = Q ATA R

Si se supone que H no tiene autovalores en el eje imaginario, y que existe una


matriz T que hace la siguiente particion:
" #
T 1HT = A11 A12 (C:1)
0 A22
con la propiedad de que la matriz A11 tiene todos sus autovalores con parte real
negativa; y que a su vez T puede ponerse como:
" #
T = T11 T12 (C:2)
T21 T22
entonces la matriz
X = T21 T111

estara determinada de forma unica por H . O dicho de otra forma, se puede es-
tablecer una correspondencia o funcion (denominada tambien operador de Riccati),
representada por Ric, entre el conjunto de matrices Hamiltonianas fH g y el conjunto
de matrices fX g:
X = Ric (H )
346 El problema de aproximacion de Hankel

el dominio de esta funcion se representa por dom (Ric), y consta del conjunto de
matrices Hamiltonianas H que no tienen autovalores en el eje imaginario, y para las
que existe una matriz de transformacion T que particiona a H en la forma dada por
la ecuacion C.1, con todos los autovalores de A11 con parte real negativa.
Se tiene ademas que la matriz X es simetrica, y resulta ser la solucion de la
ecuacion algebraica de Riccati (Doyle et al. 1989):
AT X + XA + XRX Q = 0
por lo que se suele decir que H es la matriz Hamiltoniana asociada a la ecuacion
algebraica de Riccati anterior.

C.3 El problema de aproximacion de Hankel


A continuacion se describe otro planteamiento del problema de ajuste del modelo
(M-M), basado en el problema de aproximacion de Hankel; y que es la base del
algoritmo de Doyle y Glover para resolver el problema H1 en el espacio de estados,
as como otros algoritmos relacionados con problemas H1.
Se plantea el problema de minimizar,
kT1 + T2QT3 k1
Segun las dimensiones relativas de T1; T2 ; T3 se pueden dar varias situaciones cono-
cidas como problemas de uno, dos y cuatro bloques respectivamente. En primer
lugar se va a considerar el caso en que se supone que T1 ; T2 son matrices cuadradas,
o que T1 tiene mas columnas que las, y T2 mas las que columnas. En cuyo caso
se denomina problema de un bloque. En ese caso, se supone que se cumple,
T1T1 = I; T2T2 = I (C:3)
Teniendo en cuenta las propiedades de una matriz A,
(A) = (A); (XAY ) = (A) (C:4)
para X; Y funciones (matrices) de transferencia pasa-todo, se obtiene que (problema
de un bloque)
kT1 + T2 QT3 k1 = kT3T1T2 + Q k1 = kN + Q k1
De niciones y algoritmos relacionados con la teora H1 347

Dado que Q es estable, Q sera inestable, y se demuestra que


N = T3T1T2
es tambien estable. El problema de aproximar una funcion (matriz) de transferencia
conocida estable ,N , por una inestable, Q , es similar al problema de Nehari descrito
en el captulo 10, y se conoce como problema de aproximacion de Hankel.
Puede darse el caso que T1 tenga mas las que columnas, o que T2 tenga mas
columnas que las, en cuyo caso el problema se complica, ya que no es posible hacer
que se cumplan las igualdades dadas en C.3. Sin embargo, es posible encontrar
sendas matrices T1? ; T2? tales que cumplan:
" # " # " # " #
T1 = T1 = I; T2 = T2 = I
T1? T1? T2? T2?
teniendo en cuenta las propiedades dadas en C.4, se llega a,
" #
kT1 + T2 QT3 k1 = N11N+21 Q N 12
N22

1
que corresponde a la forma general del denominado problema de cuatro bloques que
aparece en la literatura sobre la teora de control H1. Se tiene que,
N11 = T2T1T3 ; N12 = T2T1 T3?
N21 = T2? T1T3 ; N22 = T2? T1T3?

En el caso especial en que T21 es cuadrada, o tiene mas las que columnas, el
problema se simpli ca quedando:
" #
N
kT1 + T2 QT3 k1 = N21
11 + Q
1
de igual forma, si T2 es cuadrada, o tiene mas columnas que las, queda el problema
reducido a h i
kT1 + T2 QT3 k1 = N11 + Q N12 1
Los dos problemas anteriores se conocen como problemas de dos bloques. Por
tanto, a la hora de resolver el problema de aproximacion de Hankel, se pueden dar
cuatro situaciones: dos correspondientes a los problemas de dos bloques, una al
problema de cuatro bloques, y otra al problema de un bloque (Maciejowski, 1989).
348 El algoritmo de Glover

C.4 El algoritmo de Glover


A continuacion se da el algoritmo desarrollado por Glover (Glover, 1984) para re-
solver el problema de aproximacion de Hankel. De forma generica este se puede
expresar de la siguiente forma:
min kN + Y k1; Y; N 2 RH1
Q2RH1

En lo que sigue, se supone que N es una matriz de transferencia cuadrada, y


caso de no serlo se ampliara esta con las o columnas de ceros hasta que as fuera.

Paso 1. Se obtiene una realizacion de N (s)  (Ab ; Bb; Cb; Db), tal que las ecua-
ciones de Lyapunov
Ab + ATb = Bb BbT
ATb  + Ab = CbT Cb
tengan la misma solucion
" #
 I 0
 = 0  ; 1 = diag f2 ;    ; ng; 1  2      n > 0
i
1

Para obtener dicha realizacion (denominada realizacion balanceada), se puede


emplear el siguiente algoritmo:
1. Se parte de una realizacion de N (s)  (A; B; C; D).
2. Se resuelven las ecuaciones de Lyapunov para (A; B; C; D), obteniendo
las soluciones respectivas P y Q.
3. Se obtiene una factorizacion Q = RT R, empleando por ejemplo el metodo
de Cholesky (Press et al, 1990).
4. Se realiza la descomposicion en valores singulares siguiente,
RPRT = U 2 U T
5. Se obtiene nalmente la realizacion deseada
(Ab; Bb; Cb; Db) = (TAT 1; TB; CT 1; D)
donde T =  1=2 U T R.
De niciones y algoritmos relacionados con la teora H1 349

Paso 2. Se obtiene una particion de A; B; C conforme con la forma obtenida de 


en el paso 1.
" # " #
Ab = A A ; Bb = B
A 11 A 12 1 ; C =h C C i
B2 b 1 2
21 22

y se toman:
= 21 12I1 ; UU T = I
tal que B1 = C1T U .
Paso 3. Se calcula la solucion optima al problema de aproximacion de Hankel, que
viene dada por la realizacion,
Yopt = ( A^T ; C^ T ; B^ T ; D^ T )
donde sus matrices se obtienen de:
A^ = 1 ( 2 AT +  A 
1 22 1 22 1 1 C2T UB2T ); B^ = 1 ( B +  C T U )
1 2 1 2

C^ = C2 1 1 UB2T ; D^ = D + 1 U

La teora y resultados de la aproximacion de Hankel tiene un gran numero de


aplicaciones, ademas de para la resolucion de los problemas de control H1. La
principal es la aproximacion de modelos de gran dimension en el espacio de estados
por otros mas simples o modelos reducidos.
Frecuentemente, en muchos problemas H1, se plantea el encontrar una funcion
(matriz) de transferencia Y que satisfaga
kN + Y  k1 
y no siempre se trata de obtener la solucion optima Yopt; en ese caso se habla de
solucion suboptima. Sin embargo, existira una Y que satisfaga dicho requerimiento
si y solo si  1 . Una forma de obtener dicha solucion suboptima es por medio de
la realizacion:
Ysubopt(s)  (A ; B ; C ; D )
con
A = 1( 2 ATb + Ab )
B = 1 B
b; C = Cb ; D = Db
350 El algoritmo de Glover

donde = 2 2 I . Se demuestra (Safonov et al, 1987) que en este caso no es


necesario obtener previamente la realizacion (Ab; Bb; Cb; Db), sino que directamente
a partir de (A; B; C; D) se resuelven las ecuaciones de Lyapunov
AP + PAT = BB T ; AT Q + QA = C T C
y se obtiene
= QP 2I

quedando nalmente la realizacion de Ysubopt con las matrices,


A = 1 ( 2 AT + QAP )

B = 1 QB ; C = CP; D = D

Referencias
[1] J. Ackermann (1984), Robustness Against Sensor Failures, Automatica, Vol.
20, No. 2, pp 211-215.
[2] J. Ackermann (1993), Robust Control: Systems with Uncertain Physical
Parameters. Springer Verlag.
[3] P. Albertos and R. Ortega. On Generalized Predictive Control: Two Alter-
native Formulations. Automatica, Vol. 25-5, pp 753-755, 1989.
[4] F. Alix, J.M. Dion, L. Dugard and I.D. Landau (1982), Adaptive Control
of Nonminimun Phase Systems - Comparison of Several Algorithms and
Improvements. IFAC Workshop on Adaptive Control ISIS Florencia.
[5] A.C. Allison and N.J. Young (1983), Numerical Algoritms for the Nevalina-
Pick Problem, IEEE Press, pp. 412-422.
[6] B. Anderson and J.B. Moore (1990), Optimal Control: Linear Quadratic
Methods, Prentice Hall.
[7] J. Aracil (1974), A Note on the Design of S.I.S.O. Systems. Revue
R.A.I.R.O. num. April pp 119-125.
[8] K.J. Astrom (1970) Introduction to Stochastic Control Theory, Academic
Press.
[9] K.J. Astrom and P. Eykho (1971), System Identi cation: A survey. Auto-
matica Vol. 7 pp 123-162.
[10] K.J. Astrom and P.D. Wittenmark (1973), On Self-tuning Regulators. Auto-
matica Vol. 9 pp 185-199.
[11] K.J. Astrom (1980a), Self-tuning Regulation - Design Principles and Appli-
cations. Departament of Aut. Control, Lund Institud of technology. Lund,
Sweden.
351
352 REFERENCIAS

[12] K.J. Astrom and P.D. Wittenmark (1980b), Self-tuning Controllers Based
on Pole-zero Placement. Proc. IEE Vol 127-3 pp 120-130.
[13] K.J. Astrom and B. Wittenmark (1984), Computed Controlled Systems,
Prentice-Hall.
[14] K.J. Astrom and B. Wittenmark (1989), Adaptive Control, Addison-
Whesley.
[15] M. Athans (1974), Modern Control Theory, Center for Advanced Engineer-
ing Study M.I.T.
[16] M. Athans (1986), A Tutorial on the LQG/LTR Method, ACC., pp 1289-
1296.
[17] M. Bala (1995), Finite Horizon H1 and Related Control Problems,
Birkhauser.
[18] G.J Balas, J.C. Doyle, K. Glover, A. Packard, and R. Smith (1991), 
Analysis and Synthesis Toolbox, Musyn Inc. and The MathWorks, Inc.
[19] E. Baeyens, J.R. Peran y E. Vidal (1994), Analisis y dise~no de sistemas de
control mediante optimizacion convexa, Informatica y Automatica, Vol. 27,
Num. 2, pp 5-21.
[20] B.R. Barmish and H.I. Kang (1993), Automatica, Vol. 29, No. 1, pp 13-35.
A Survey of Extreme Point Results for Robustness of Control Systems.
[21] R. Bitmead, M. Gevers and V. Wertz (1990), Adaptive Optimal Control.
Prentice Hall.
[22] U. Borisson and R. Syding (1976), Self-tuning Control of an Ore Crusher.
Automatica Vol. 12 pp 1-7.
[23] S.P. Boyd and C.H. Barrat (1991), Linear Controller Design, Prentice Hall.
[24] F. Buchholt and M. Kummel (1979), Self-tuning Control of a PH-
Neutralization Process. Automatica Vol. 15 pp 665-671.
[25] E.F. Camacho, F.R. Rubio and J.A. Gutierrez (1988), Modelling and Sim-
ulation of a Solar Power Plant with a Distributed Collectors System. Power
Systems, Modelling and Control Applications. pp 11.3.1-11.3.5, Federation
IBRA-BIRA, Septiembre, Bruselas (Belgica).
REFERENCIAS 353

[26] E.F. Camacho, F.R. Rubio and F.M. Hughes (1992), Self-tuning Control
of a Solar Power Plant with a Distributed Collector Field. IEEE Control
Systems Magazine. Vol 12, num. 2, pp 72-78.
[27] E.F. Camacho, M. Berenguel and F.R. Rubio (1994), Application of a Gain
Scheduling Generalized Predictive Controller to a Solar Power Plant, Con-
trol Engineering Practice. A Journal of IFAC, Vol 2 num. 2, pp 227-238.
[28] E.F. Camacho and C. Bordons (1995), Model Predictive Control in the Pro-
cess Industry. Advances in Industrial Control Series. Springer-Verlag.
[29] R.G. Cameron (1985), The Design of Multivariable Systems, V Curso de
Automtica en la Industria, La Rabida (Huelva).
[30] R. Carmona, F.R. Rubio and E.F. Camacho (1985), Automatic Control
for Large Solar Thermal Arrays. Symposium International of Solar Energy
Society. Tokyo.
[31] J.M. Carrasco, F. Gordillo, L.G. Franquelo and F.R. Rubio (1992), Control
of Resonant Converters Using the LQG/LTR Method. Power Electronics
Specialists Conference (PESC'92), Junio, Toledo, Espa~na.
[32] R.Y. Chiang and M.G. Safonov (1992), Robust Control Toolbox. The Math
Works Inc.
[33] R.Y. Chiang and M.G. Safonov (1993), A Fixed H1 Controller for a Super-
maneuverable Figther Parforming the Herbst Maneuver, Automatica, Vol.
29, No. 1, pp 111-127.
[34] B.M. Chen, A. Saberi and P. Sannuti (1991), A New Stable Compensator
Design form Exact and Approximate Loop Transfer Recovery, Automatica,
Vol. 27, No. 2, pp 257-280.
[35] B.M. Chen, A. Saberi and P. Sannuti (1992), Necessary and Sucient Con-
ditions for a Nonminimum Phase Plant to have a Recoverable Target Loop-
A Stable Compensator Design form LTR, Automatica, Vol.28, No.3, pp
493-507.
[36] T. Chen and B. Francis (1995), Optimal Sampled-Data Control System ,
Springer Verlag.
[37] R.V. Churchill, J.W. Brown and R.F. Verhey (1978), Variables Complejas
y sus Aplicaciones, McGraw Hill.
[38] D.W. Clarke and P.J. Gawthrop (1975), Self-tuning Controller. Proc. IEE
Vol 122-9 pp 929-935.
354 REFERENCIAS

[39] D.W. Clarke and P.J. Gawthrop (1979), Self-tuning Control. Proc. IEE Vol
126-6 pp 633-640.
[40] D.W. Clarke, P.P. Kanjila and C. Mohtadi (1985), A Generalized LQG
Aproach to Self-Tuning Control, Part I and Part II, Int J. Control, pp
1509-1523, pp 1525-1544.
[41] D.W. Clarke, C. Mothadi and P.S. Tu s (1987), Generalized Predictive Con-
trol. Parts I and II, Automatica, Vol. 23, No. 2 pp 137-160
[42] D.W. Clarke (1988), Application of Generalized Predictive Control to In-
dustrial Processes, IEEE Control Systems Magazine, Vol. 122, pp 49-55.
[43] A.O. Cordero and D.Q. Mayne (1981), Deterministic convergence of a Re-
gulator with Variable Forgetting Factor. Proc. IEE Vol 128-1 pp 19-23.
[44] S. Dormido y J.M. Cruz (1993), Fundamentos de Control Robusto, Curso
AEIA, Isla Cristina (Huelva).
[45] R.M.C. De Keyser and A.R. Van Cuawenberghe (1985), Extended Prediction
Self-adaptive Control, IFAC Symp. on Identi cation and System Parameter
Estimation, York, pp. 1317-1322.
[46] J.C. Doyle and G. Stein (1979), Robustness with Observers, IEEE Trans.
on Automatic Control, Vol AC-24, num. 4, pp 607-611.
[47] J.C. Doyle and G. Stein (1981), Multivariable Feedback Design: Concepts
for a Classical/Modern Synthesis, IEEE Trans. on Automatic Control, Vol
AC-26, num. 1, pp 4-16.
[48] J.C. Doyle (1982), Analysis of Feedback Systems with Structured Uncertain-
ties, IEE Proc., Vol. 129, No. 6, pp 242-250
[49] J.C. Doyle (1983), Synthesis of Robust Controllers and Filters, IEEE Proc.
22nd Conf. Decision Control, pp 109-114.
[50] J.C. Doyle, K. Glover, P.P. Khargonekar, and B.A. Francis (1989), State-
Space Solutions to Standard H2 and H1 Control Problems, Transactions on
Automatic Control, Vol. 34, No. 8, pp 831-846.
[51] J.C. Doyle, B.A. Francis, and A.R. Tannenbaum (1992), Feedback Control
Theory, Macmillan Publishing Company.
[52] J.C. Doyle, K. Zhou, K. Glover and B. Bodenheimer (1994), Mixed H2
and H1 Performance Objetives II: Optimal Control; I: Robust Performance
Analysis, IEEE Trans. on Automatic Control, Vol 39, num. 8, pp 1564-1587.
REFERENCIAS 355

[53] P. Dorato (1987), Robust Control. IEEE Press.


[54] P. Dorato, R. Tempo, and G. Muscato (1993), Bibliography on Robust Con-
trol, Automatica, Vol, 29, No.1, pp 201-213.
[55] G.A. Dumont (1982), Self-tuning Control of a Chip Re ner Motor Load.
Automatica Vol. 18-3 pp 307-314.
[56] P. Eykho (1974), System Identi cation, Parameter and State Estimation.
J. Wiley and Sons: London.
[57] D.F. Enns (1984), Model Reduction with Balanced Realizations: An Error
Bound and a Frequency Weighted Generalization, Proc. Conf. on Decision
and Control.
[58] M.P. Ford, J.M. Maciejowski and J.M. Boyle (1988), Multivariable Fre-
quency Domain Toolbox. Cambridge Control Ltd.
[59] T.R. Fortescue, L.S. Kershenbaum and B.E. Ydstie (1981), Implementation
of Regulators with Variable Forgetting Factors. Automatica Vol. 17-6 pp
831-835.
[60] B.A. Francis, and G. Zames (1984), On H1-Optimal Sensitivity Theory
form SISO Feedback Systems, IEEE Transactions on Automatic Control,
Vol. AC-29, No.1, pp 888-899.
[61] B.A. Francis (1987), A course in H1 Control Theory. Lecture Notes in
Control and Information Sciencies, Vol. 88, Springer Verlag.
[62] D.J. Freeman, R. Whalley and M.G. Waugh (1982), Ship Motion and Com-
puter Control, Fourth International Symposium on Ship Operation Automa-
tion, Genova (Italy).
[63] J.S. Freudenberg (1989), Analysis and Design for Ill-conditioned plants.
Part 1: Lower Bounds on the Sturctured Singular Value; Part 2: Direction-
ally Uniform Weightings and an Example, Int. J. Control, Vol. 49, No. 3,
pp 851-903.
[64] J.S. Freudenberg (1993), Algebraic Versus Analytic Design limitations Im-
posed by Ill-Conditioned Plants, IEEE Trans. Automat. Contr., Vol. 38, No.
4.
[65] J.S. Freudenberg and D.P. Looze (1986), An Analysis of H1 Optimization
Design Methods, IEEE Trans. Automat. Contr., Vol. AC-31, No. 3, pp 194-
200.
356 REFERENCIAS

[66] J.S. Freudenberg, D.P. Looze (1988), Frequency Domain Properties of


Scalar and Multivariable Feedback Systems. Springer-Verlag.
[67] K. Glover (1984), All Optimal Hankel-Norm Approximations of Linear Mul-
tivariable Systems and their L1 Errors Bounds, Int. J. Control, Vol.39, No.
6, pp 1115-1193
[68] K. Glover and D. Mcfarlane (1989), Robust Stabilization of Normalized Co-
prime Factor Plant Descriptions with H1-Bounded Uncertainty, Transac-
tions on Automatic Control, Vol. 34, No. 8.
[69] M. Gopal (1982), Modern Control System Theory, Whiley.
[70] F. Gordillo y F.R. Rubio (1991), Aplicacion de las Tecnicas lqg/ltr en
Control Adaptativo. Jornadas de Control Inteligente, Sevilla, Enero.
[71] F. Gordillo and F.R. Rubio (1991), Self-tuning Controller with LQG/LTR
Structure. European Control Conference (ECC 91). pp 2159-2163, Julio,
Grenoble, Francia.
[72] M. Green and D.J.N. Limebeer (1994), Linear Robust Control. Prentice
Hall.
[73] M.J. Grimble (1994), Robust Industrial Control: Optimal Design Aproach
for Polynomial Systems. Prentice Hall.
[74] J.A. Gutierrez, E.F. Camacho, F.R. Rubio and R. Carmona (1986), Fully
Automation of a Distributed Collectors Field of a Solar Power Plant. Com-
ponents, Instruments and Techniques for Low Cost Automation and Ap-
plications. (LCA'86), pp 381-386, Ed. P. Albertos y J.A. de la Puente,
Pergamon Press.
[75] W.H. Haddad, D.S. Bernstein and Y.W. Wang (1994), Disipative H2=H1
Controller Synthesis, IEEE Trans. on Automatic Control, Vol. 39, No. 4,
pp. 827-831.
[76] C.C. Hang and P.C. Parks (1973), Comparative Studies of Model Reference
Adaptive Control Systems. IEEE T.A.C. Vol AC 18-5 pp 419-428.
[77] I. Horowitz (1982), Quantitative Feedback Theory, Proceedings of the Insti-
tution of Electrical Engineers, Part D, 129, pp 215-226.
[78] The Institue of Measurement and Control (1991), Robust Control System
Design using H1 and Related Methods. March, 1991, Cambridge University,
U.K.
REFERENCIAS 357

[79] R. Isermann (1980), Practical Aspects of Process Identi cation, Automatica


Vol. 16 pp 575-587.
[80] R. Isermann (1981), Digital Control Systems. Springer-Verlag New York.
[81] R. Isermann (1982), Parameter Adaptive Control Algorithms. A Tutorial.
Automatica Vol. 18-5 pp 513-528.
[82] R. Isermann, K.H. Lachmann and D. Matko (1992), Adaptive Control Sys-
tems, Prentice Hall.
[83] R.E. Kalman (1964), When Is a Linear Control System Optimal?, Journal
of Basic Engineering. Trans. of the ASME, pp 51-60.
[84] C.G. Kallstrom, K.J. Astrom, N.E. Thorell, J. Eriksson and L. Sten (1979),
Adaptive Autopilots for Tankers. Automatica Vol. 15 pp 241-254.
[85] C.G. Kallstrom and P. Ottosson (1982), The Generation and Control of
Roll Motion of Ships in Close Turns, Fourth International Symposium on
Ship Operation Automation, Genova (Italy).
[86] H. Kaufman, I. Bar-Kana and K. Sobel (1994), Direct Adaptive Control
Algorithms: Theory and Applications, Springer-Verlag.
[87] P.P. Khargonekar and M. Rotea (1991), Mixed H2=H1 control: A convex
optimization approach, IEEE Trans. Automat. Control, 36 (7), pp 824-837.
[88] H. Kwakernaak (1993), Robust Control and H1 -Optimization-Tutorial Pa-
per Automatica, Vol. 29, No. 2, pp 255-273.
[89] H. Kwakernaak and R. Sivan (1972), Linear Optimal Control Systems,
Wiley-Interscience.
[90] H. Kwakernaak and R. Sivan (1991), Signal and Systems, Prentice Hall.
[91] I.D. Landau (1974), A Survey of Model Reference Adaptive Techniques -
Theory and Applications. Automatica, Vol. 10 pp 353-379.
[92] I.D. Landau (1979), Adaptive Control - The Model Reference Approach.
Control and Systems Theory Vol 8. Marcel Dekker, Inc.
[93] I.D. Landau (1981a), Model Reference Adaptive Control and Stochastic Re-
gulators : A Uni ed Approach. Trans. of ASME Vol 103 pp 404-416.
[94] I.D. Landau and Lozano, R. (1981b), Uni cation of Discrete Time Explicit
Model Reference Adaptive Control Designs. Automatica Vol. 17-4 pp 593-
611.
358 REFERENCIAS

[95] I.D. Landau (1982), Combining Model Reference Adaptive Controllers and
Stochastic Regulators. Automatica Vol. 18-1 pp 77-84.
[96] I.D. Landau (1990), System Identi cacion and Control Design, Prentice
Hall.
[97] K. Latawiec and M. Chyra (1983), On Low Frecuency and Long-run E ects
in Control. Automatica Vol. 19 pp 419-424.
[98] J.R. Layne and K.M. Passino (1993), Fuzzy Model Reference Learning Con-
trol for Cargo Ship Steering, IEEE Control Systems Magazine, pp 23-34.
[99] A.J. Laub and J.N. Little (1986), Control System ToolBox, The MathWorks,
Inc.
[100] N.A. Lehtomaki, N.R. Sandell and M. Athans (1981), Robustness Results
in Linear-Quadratic Gaussian Based Multivariable Control Designs. IEEE
Transactions on Automatic Control, Vol. AC-26, No.1, pp 75-92.
[101] N.A. Lehtomaki and D.A. Castanon (1984), Robustness and Modeling Error
Characterization, IEEE Transactions on Automatic Control, Vol. AC-29,
No. 3, pp 212-220.
[102] D.J. N. Limebeer, E.M. Kasenally and J.D. Perkins (1993), On the Design
of Robust Two Degree of Freedom Controllers, Automatica, Vol. 29, No. 1,
pp 157-168.
[103] L. Ljung (1985), On the Estimation of Transfer Functions, Automatica,
Vol. 21, No. 6.
[104] L. Ljung (1986), System Identi cation ToolBox, The MathWorks, Inc.
[105] L. Ljung (1987), System Identi cation: Theory for the User, Prentice Hall.
[106] M.A. Lelic and P.E. Wellstead (1987a), Generalized Pole Placement Self
Tuning Controller. Part I. Basic Algorithm, Int. J. Control, Vol. 46-2, pp
547-568.
[107] M.A. Lelic and P.E. Wellstead (1987b), Generalized Polo Placement Self
Tuning Controller. Part II. Application to Robot Manipulator Control, Int.
J. Control, Vol. 46-2, pp 569-601.
[108] M.J. Lopez and F.R. Rubio (1992), LQG/LTR Control of Ship Steering
Autopilots, IEEE International Symposium on Intelligent Control (ISIC-
92), pp 447-450, August, Glasgow, Scotland, U.K.
REFERENCIAS 359

[109] M.J. Lopez y F.R. Rubio (1994), Metodologas de Dise~no ltr. Jornadas de
Automatica, Malaga, Octubre.
[110] M.J. Lopez and F.R. Rubio (1994), Design Multivariable Control for a Ship
Based on Robust Methodology, IEEE International Conference on Control
Applications (CCA-94), pp 833-838, August, Glasgow, Scotland, U.K.
[111] M.J. Lopez (1994), Analisis y Dise~no de Controladores Robustos. Aplicacion
al control de un buque. Tesis Doctoral. Universidad de Sevilla.
[112] M.J. Lopez and F.R. Rubio (1995a), Comparison between Multivariable H1
and LTR Controllers for a Ship, CAMS '95, Control Aplications in Marine
Systems, (IFAC). Tronhein, Norway
[113] M.J. Lopez and F.R. Rubio (1995b), Multivariable Robust LTR-i Controller
for a Ship, CAMS '95, Control Aplications in Marine Systems, (IFAC).
Tronhein, Norway
[114] M.J. Lopez and F.R. Rubio (1995c), H1 Multivariable Design Methodology
for a Ship, European Control Conference ECC 95. Roma (Italy).
[115] M.J. Lopez and F.R. Rubio (1995d), Gain Scheduling LQG/LTR Controller
of Ship Steering Autopilots, European Control Conference ECC 95. Roma
(Italy).
[116] M.J. Lopez y F.R. Rubio (1995f), Mejora de la robustez de controladores
LQG/LTR. Aplicacion a un sistema multivariable. Aceptado para publi-
cacion en Revista de Informatica y Automatica.
[117] M.J. Lopez, A.P. Consegliere y J. Terron (1995), Tecnicas de modelado,
simulacion e identi cacion de la dinamica de un buque por computador. A
publicar por el servicio de publicaciones de la Universidad de Cadiz.
[118] J. Lunze (1989), Robust Multivariable Feedback Control. Prentice Hall.
[119] A.G.J. MacFarlane (1970), Return-di erence and return-ratio matrices and
their use in analysis and design of multivariable feedback control systems.
Proc. IEE, vol. 117, No. 10, pp 2037-2049.
[120] A.G.J. MacFarlane and N. Karcanias (1976), Poles and Zeros of Linear
Multivariable Systems: a Survey of the Algebraic, Geometric and Complex-
Variable Theory, Int. J. Control, Vol. 24, No. 1, pp 33-74.
[121] A.G.J. MacFarlane and I. Postlethwaite (1977), The Generalized Nyquist
Stability Criterion and Multivariable Root Loci, Int. J. Control, Vol. 24, No.
1, pp 81-127.
360 REFERENCIAS

[122] J.M. Maciejowski (1985), Asymptotic Recovery for Discrete-Time Systems,


IEEE Trans. Automat. Contr., Vol AC-30, No. 6, pp 602-605.
[123] J.M. Maciejowski (1989), Multivariable Feedback Design. Adison Wesley.
[124] R.J. Martin, L. Valavani and M. Athans (1986), Multivariable Control of a
Submersible Using the LQG/LTR Methodology, ACC., pp 1313-1324.
[125] The MathWorks, Inc. (1990), Matlab for MS-DOS Personal Computers.
User's Guide.
[126] J.M. Mendel (1987), Lessons in Digital Estimation Theory, Prentice Hall.
[127] A.C. Messer and M.J. Grimble (1992), Robust Track Keeping Control,
CAMS'92 ,IFAC, Genova (Italy).
[128] B.C. Moore (1981), Principal Component Analysis in Linear Systems, IEEE
Trans. Automat. Contr., Vol. AC-26.
[129] M. Morari and E. Za riou (1989), Robust Process Control, Prentice Hall.
[130] A.N. Moser (1993), Designing Controllers for Flexible Structures with H1=
Synthesis, IEEE Control Systems, Vol. 13, No. 2, pp 79-89.
[131] D. Mustafa and K. Glover (1991), Controller Reduction by H1 Balanced
Truncation, IEEE Trans. on Automatic Control, Vol. 36, No. 6, pp 668-682.
[132] K.S. Narendra and R.V. Monopoli (1980), Applications of Adaptive Control.
Academic Press.
[133] K.S. Narendra and A.M. Annaswamy (1989), Stable Adaptive Systems,
Prentice Hall.
[134] G.C. Newton, L.A. Gould, J.F. Kaiser (1957), Analytical Design of Linear
Feedback Controls, Wile & Sons.
[135] R. Ortega (1982), On PID Self-tuning. Proc. of the IFAC Software for Com-
puter Control (SOCOCO), Madrid.
[136] A. Packard and J. Doyle (1993), The Complex Structured Singular Value,
Automatica, Vol. 29, No. 1
[137] G.K.H. Pang and A.G.J. MacFarlane (1987), An Expert Systems Approach
to Computer-Aided Design of Multivariable Systems, Springer-Verlag.
REFERENCIAS 361

[138] I. Postlethwaite and S. Skogestad (1993), Robust multivariable Control Us-


ing H1 Methods: Analysis, Design and Industrial Applications, Essays on
Control, ECC-93, pp 271-330.
[139] W.H. Press, B.P. Flannery, S.A. Teukolsky and W.T. Vetterling (1990),
Numerical Recipes: The Art of Scienti c Computing.
[140] J.M. Quero and E.F. Camacho (1990), Neural Generalized Predictive Con-
trollers. Proc. of the IEEE International Conference on System Engineering,
Pittsburg, pp 160-163.
[141] L.R. Ray (1993), Stability Robustness of Uncertain LQG/LTR Systems,
IEEE Trans. on Automatic Control, Vol. 38, No. 2, pp 304-308.
[142] A.J. Robins and P.E. Wellstead (1981), Recursive Systems Identi cation
Using Fast Algorithms. I.J. of Control Vol 33-3 pp 455-480.
[143] H.H. Rosenbrock (1974), Computer- Aided Control System Design.
[144] M.A. Rotea and P.P. Khargonekar (1991), H2 -Optimal Control with an H1
-constraint:The State Feedback Case, Automatica, Vol.27, No.2, pp 307-316.
[145] M.A. Rotea (1993), The Generalized H2 Control Problem, Automatica, Vol.
29, No. 2, pp 373-385.
[146] F.R. Rubio, E.F. Camacho, J. Aracil, L.G. Franquelo and J.M.G. Provost
(1982), Studies for the Application of an Adaptive Controller to Hydrotur-
bine Generators. Software for Computer Control (SOCOCO), pp 425-430,
Ed. G. Ferrate y E.A. Puente, Pergamon Press.
[147] F.R. Rubio y E.F. Camacho (1984), Control Adaptativo del Campo de Colec-
tores Distribuidos de una Planta Solar. Automatica en la Industria. pp 131-
135, Ed. M. Silva, Publicacion IFAC, Zaragoza, Nov.
[148] F.R. Rubio, E.F. Camacho y R. Carmona (1985), Control Adaptativo del
Campo de Colectores Distribuidos (ACUREX) de la Planta Solar SSPS de
Almera. Regulacion y Mando Automatico Vol XIX, num. 145 pp 139-143.
[149] F.R. Rubio, J. Aracil and E.F. Camacho (1985), Chaotic Motion in an
Adaptive Control System. International Journal of Control, Ed. A.G.J. Mac-
farlane, Taylor and Francis, Vol 42-2, pp 353-360.
[150] F.R. Rubio y E.F. Camacho (1985), Identi cacion Reducida de Sistemas
Lineales. Actas de las VI Jornadas de Automatica, pp 27-49, Valladolid.
362 REFERENCIAS

[151] F.R. Rubio (1985), Control Adaptativo de Procesos Industriales. Aplicacion


a una Central Solar. Tesis Doctoral.
[152] F.R. Rubio, E.F. Camacho and R. Carmona (1985), Application of a Self-
tuning Regulator to a Solar Power Plant. 7th Conference on Digital Com-
puter Applications to Process Control, pp 263-269, Sept. Viena (Austria).
[153] F.R. Rubio, R. Carmona and E.F. Camacho (1986), Adaptive Control of
The ACUREX Field. The IEA/SSPS Solar Thermal Power Plants, Vol 2,
pp 5.2.1-5.2.18, Ed. P. Kesserlring and C.S. Selvage, Springer-Verlag.
[154] F.R. Rubio (1987), Programa de Ayuda al Dise~no de Controladores Adap-
tativos. Automatica e Instrumentacion. Revista de Control Industrial. num.
174, pp 299-305.
[155] F.R. Rubio, R. Sanz, E.F. Camacho and A. Ollero (1987), Studies on Expert
Self-tuning Control of Distributed Collector Fields. AI, Expert Systems and
Languages in Modelling and Simulation. pp 231-236, Ed. R. Huber y C.
Kulikowski, IMACS Publication, Junio, Barcelona (Espa~na).
[156] F.R. Rubio, F.M. Hughes and E.F. Camacho (1989), Self-tuning PI Control
of a Solar Power Plant. Adaptive Systems in Control and Signal Processing.
pp 335-340, Ed. M.J. Grimble, IFAC Publication, Abril, Glasgow.
[157] F.R. Rubio and J. Aracil (1990), Classiccal/Modern Design of a Tracking
Control System. IEEE International Conference on Systems Engineering.
pp 156-159, Agosto, Pittsburgh, PA.
[158] F.R. Rubio y J. Aracil (1992), De vuelta al Diagrama de Bode pasando por
el Control Optimo. Revista de Informatica y Automatica, Vol 25 num. 2,
pp 5-16.
[159] F.R. Rubio and M.J. Lopez (1993), Adaptive Optimal Control of Ship Steer-
ing Autopilots, 12th World Congress International Federation of Automatic
Control (IFAC-93), Vol. 5, pp 413-416, 18-23 July, Sydney, Australia.
[160] V. Ruiz y C. Gomez (1982), Centrales Electricas Termosolares. Energas
Renovables y Medio Ambiente. Editado por el Centro de Ordenacion del
Territorio y Medio Ambiente del Ministerio de Obras Publicas y Urbanismo.
Madrid.
[161] A. Saberi, and P. Sannuti (1990), Observer Design for Loop Transfer Recov-
ery for Uncertain Dynamical Systems. IEEE Trans. On Automatic Control,
Vol. 35, No. 8, pp 878-896.
REFERENCIAS 363

[162] A. Saberi, B.M. Chen, and P. Sannuti (1993), Loop Transfer Recovery:
Analysis and Design. Springer-Verlag.
[163] M. Saeki (1992), H1=LTR Procedure with Speci ed Degree of Recovery,
Automatica, Vol. 28, No. 3, pp 509-517.
[164] M.G. Safonov, and M. Athans (1977), Gain and Phase Margin for Multiloop
LQG Regulators, IEEE Transaction on Automatic Control, Vol. AC-22, No.
2, pp 415-422.
[165] M.G. Safonov, A.J. Laub and G.L. Hartmann (1981), Feedback Properties of
Multivariable Systems: The Role and Use of the Return Di erence Matrix,
IEEE Trans. Automat. Contr., Vol AC-26, No. 1, pp 47-65.
[166] M.G. Safonov and R.Y. Chiang (1987), A Schur Method for Balanced model
Reduction, Proc. Conf. on Decision and Control.
[167] M.G. Safonov, D.J.N. Limebeer and R.Y. Chiang (1989), Simplifying the
H1 Theory via Loop Shifting, Matrix Pencil and Descriptor Concepts, Int.
J. Control, 50, 6, pp 2467-2488.
[168] S. Sastry and M. Bodson (1989), Adaptive Control. Stability, Convergence,
and Robustness, Prentice Hall.
[169] B. Shahian and M. Hassul (1992), Computer-Aided Control Systems Design
Using Matlab, Prentice-Hall.
[170] D.E. Seborg, T.F. Edgar and D.M. Mellichamp (1989), Process Dynamics
and Control. John Wiley and Sons.
[171] U. Shaked (1986), Guaranteed stability margin for the discrete-time linear
quadratic optimal regulator, IEEE Trans. Automat. Contr., Vol. AC-31.
[172] S. Skogestad, M. Morari, and J.C. Doyle (1988), Robust Control of Ill-
Conditioned Plants: High-Purity Distillation, IEEE Transactions on Auto-
matic Control, vol. 33, No 12., pp 1092-1105.
[173] M.R. Spiegel (1971), Variable Compleja, McGraw Hill.
[174] G. Stein and M. Athans (1987), The LQR/LTR Procedure for Multivariable
Feedback Control Design, IEEE Transactions on Automatic Control, Vol.
AC-32, No.2, pp 105-113.
[175] G. Stein and J.D. Doyle (1991), Beyond Singular Values and Loop Shapes,
J. Guidance, Vol. 14, No. 1, pp 5-16.
364 REFERENCIAS

[176] A. Stoorvogel (1992), The H1 Control Problem, Prentice Hall.


[177] P.M. Thompson (1988a), Program CC's Implementation of the Wiener-Hopf
LQG optimal control problem, Optimal Control Applications and Methods,
Vol. 8, 63-89.
[178] P.M. Thompson (1988b), Program CC, Tutorial and User's Guide, Control
Systems Technology, Inc.
[179] P.E. Wellstead and P. Zanker (1978), The Techniquest of Self-tuning. Con-
trol Systems Centre, Report 432.
[180] P.E. Wellstead, J.M. Edmunds, D. Prager and P. Zanker (1979a), Self-
tuning Pole-cero Assignment Regulators. Control Systems Centre Report
404. (Also in I.J. of Control Vol 30-1 pp 1-26).
[181] P.E. Wellstead and P. Zanker (1979b), Servo Self-tuning. Control System
Centre, Report 419. (Also in I.J. of Control Vol 30-1 pp 27-36).
[182] H.P. Whitaker, J. Yamron and A. Kezer (1958), Design of Model-Reference
Adaptive Control Systems for Aircraft. Report R-164 Intrumentation Lab-
oratory, M.I.T., Cambridge. (Referenciado en Astrom 1983).
[183] B. Wittenmark and K.J. Astrom (1984), Practical Issues on the Implemen-
tation of Self-tuning Control. Automatica Vol. 20-5 pp 595-605.
[184] D.C. Youla, J.J. Bongiorno and H.A. Jabr (1976), Modern Wiener-Hopf
Design of Optimal Controllers. Part I: The Single-Input-Output Case. Part
II: The Multivariable Case. IEEE Trans. Automat. Contr., Vol. AC-21, No.
1, pp 3-13, No. 3, pp 319-338.
[185] S.D. O'Young, and B.A. Francis (1986), Optimal Performance and Robust
Stabilization, Automatica, Vol. 22 No. 2., pp 171-183.
[186] G. Zames (1963), Functional Analysis Applied to Non-linear Feedback Sys-
tems, IEEE Trans. Circuit Theory, pp 392-404.
[187] G. Zames (1981), Feedback and Optimal Sensitivity: Model Reference Trans-
formations, Multiplicative Seminorms, and Approximate Inverses, IEEE
Trans. Automat. Control, Vol. AC-26, No. 2, pp 301-320.
[188] G. Zames and B.A. Francis (1983), Feedback, Minimax Sensitivity, and Op-
timal Robustness, IEEE Trans. Automat. Contr., Vol.AC-28, No. 5, pp 585-
601.
REFERENCIAS 365

[189] Z. Zhang and J.S. Freudenberg (1990), Loop Transfer Recovery for Non-
minimum Phase Plants, IEEE Trans. Automat. Contr., Vol. 35, No. 5, pp
547-553.
[190] Z. Zhang and J.S. Freudenberg (1993), Discrete-time Loop Transfer Recov-
ery for Systems whith Nonminimum Phase Zeros and Time Delays, Auto-
matica, Vol. 35, No. 2, pp 351-363.
[191] K. Zhou (1992), Comparision Between H2 and H1 Controllers, IEEE Trans.
on Automatic Control, Vol. 37, No. 8, pp. 1261-1265.